Google anuncia Gemini Omni, su nueva IA capaz de crear y editar videos hiperrealistas con solo hablarle

Por Daniela Pérez
Google anuncia Gemini Omni, su nueva IA capaz de crear y editar videos hiperrealistas con solo hablarle

Google presentó Gemini Omni, su nuevo modelo de inteligencia artificial enfocado en la creación y edición de videos mediante instrucciones en lenguaje natural, una herramienta que busca combinar las capacidades de razonamiento de Gemini con funciones avanzadas de generación multimedia.

El anuncio fue revelado este martes durante el evento anual Google I/O, realizado en Mountain View, California (Estados Unidos), donde la compañía detalló que Omni permitirá crear videos a partir de texto, imágenes, audio y clips ya existentes, además de modificar escenas mediante conversaciones con la IA.


De acuerdo con lo que explicó la empresa, el sistema fue diseñado para que “la capacidad de razonamiento de Gemini se una a la capacidad de creación”. En esa línea, Google aseguró que Omni puede “crear cualquier cosa a partir de cualquier entrada, incluso con video”.

El primer modelo de esta nueva familia será Gemini Omni Flash, que desde este hoy comenzó a implementarse para usuarios de los planes Google AI Plus, Pro y Ultra a través de la aplicación Gemini y Google Flow. Además, esta semana también estará disponible gratis para usuarios de YouTube Shorts y YouTube Create.

Edición conversacional y videos más realistas

Uno de los principales focos de Gemini Omni es la edición de videos mediante lenguaje natural. De acuerdo con Google, cada instrucción entregada al sistema “se basa en la anterior”, permitiendo mantener coherencia en personajes, escenarios y movimientos.

Detallaron que además el modelo puede modificar acciones dentro de un video, agregar nuevos objetos o personajes e incluso transformar escenas completas sin perder la esencia del material original.

Otro de los aspectos destacados por Google apunta al realismo de las creaciones. Según detalló la empresa, Omni incorpora una comprensión “más precisa” de fenómenos físicos como la gravedad, la energía cinética o la dinámica de fluidos, lo que permitiría generar escenas más naturales y convincentes.


La tecnológica también señaló que el modelo utiliza el conocimiento contextual de Gemini para construir contenidos con referencias históricas, científicas y culturales, buscando ir más allá de la simple generación automática de imágenes.

Entre las funciones anunciadas aparece además la posibilidad de crear videos utilizando avatares digitales propios, capaces de replicar la voz y apariencia de una persona. Sobre este punto, Google afirmó que continúa realizando pruebas para desarrollar estas capacidades “de forma responsable”.

En materia de seguridad y transparencia, la empresa informó que todos los videos creados con Omni incorporarán SynthID, una marca de agua digital imperceptible desarrollada por Google para identificar contenido generado mediante inteligencia artificial.

La compañía añadió que en las próximas semanas Gemini Omni Flash también comenzará a estar disponible para desarrolladores y clientes empresariales a través de API.

Lee también