Google presentó Gemini Omni, su nuevo modelo de inteligencia artificial enfocado en la creación y edición de videos mediante instrucciones en lenguaje natural, una herramienta que busca combinar las capacidades de razonamiento de Gemini con funciones avanzadas de generación multimedia.
El anuncio fue revelado este martes durante el evento anual Google I/O, realizado en Mountain View, California (Estados Unidos), donde la compañía detalló que Omni permitirá crear videos a partir de texto, imágenes, audio y clips ya existentes, además de modificar escenas mediante conversaciones con la IA.
By now, you’ve probably heard about Gemini Omni, our new model designed to create anything from any input, starting with video.
But… what’s the big deal?
Let’s break it down 🧵👇 pic.twitter.com/QbxMNZa2Wx
— Google AI (@GoogleAI) May 19, 2026
De acuerdo con lo que explicó la empresa, el sistema fue diseñado para que “la capacidad de razonamiento de Gemini se una a la capacidad de creación”. En esa línea, Google aseguró que Omni puede “crear cualquier cosa a partir de cualquier entrada, incluso con video”.
El primer modelo de esta nueva familia será Gemini Omni Flash, que desde este hoy comenzó a implementarse para usuarios de los planes Google AI Plus, Pro y Ultra a través de la aplicación Gemini y Google Flow. Además, esta semana también estará disponible gratis para usuarios de YouTube Shorts y YouTube Create.
Edición conversacional y videos más realistas
Uno de los principales focos de Gemini Omni es la edición de videos mediante lenguaje natural. De acuerdo con Google, cada instrucción entregada al sistema “se basa en la anterior”, permitiendo mantener coherencia en personajes, escenarios y movimientos.
Detallaron que además el modelo puede modificar acciones dentro de un video, agregar nuevos objetos o personajes e incluso transformar escenas completas sin perder la esencia del material original.
Otro de los aspectos destacados por Google apunta al realismo de las creaciones. Según detalló la empresa, Omni incorpora una comprensión “más precisa” de fenómenos físicos como la gravedad, la energía cinética o la dinámica de fluidos, lo que permitiría generar escenas más naturales y convincentes.
Gemini Omni is a major leap in world understanding & multimodal editing! It can take photos, video & audio and build entirely new scenes. Over time it’ll be able to handle any input & any output – starting w/ video
You can even give it your own videos & iterate on your ideas: pic.twitter.com/VrHPJKRJXH
— Demis Hassabis (@demishassabis) May 19, 2026
La tecnológica también señaló que el modelo utiliza el conocimiento contextual de Gemini para construir contenidos con referencias históricas, científicas y culturales, buscando ir más allá de la simple generación automática de imágenes.
Entre las funciones anunciadas aparece además la posibilidad de crear videos utilizando avatares digitales propios, capaces de replicar la voz y apariencia de una persona. Sobre este punto, Google afirmó que continúa realizando pruebas para desarrollar estas capacidades “de forma responsable”.
En materia de seguridad y transparencia, la empresa informó que todos los videos creados con Omni incorporarán SynthID, una marca de agua digital imperceptible desarrollada por Google para identificar contenido generado mediante inteligencia artificial.
La compañía añadió que en las próximas semanas Gemini Omni Flash también comenzará a estar disponible para desarrolladores y clientes empresariales a través de API.
Lo más leído
- Tan solo 70 días: José Antonio Kast realiza el cambio de gabinete más temprano de un gobierno tras asumir el poder
- No solo Steinert: Ministra Mara Sedini también dejaría el gobierno
- Rendimiento del bono del Tesoro a 30 años de EE.UU. alcanza su nivel más alto en 19 años por la guerra con Irán
- Presidente Kast toma la decisión de sacar a la ministra de Seguridad, Trinidad Steinert, del gobierno
- Sernac oficia a empresas de telecomunicaciones por traspaso de usuarios sin autorización a Tuves HD: Acusan cobros fantasmas