Gemini Omni de Google puede generar ‘cualquier cosa a partir de cualquier entrada’, comenzando con video

Google no se olvidó de los creadores de la IA en su último anuncio Gemini como parte de Google I/O. La compañía acaba de lanzar oficialmente Gemini Omni, un nuevo modelo que puede «crear cualquier cosa a partir de cualquier entrada, empezando por vídeo», según Google. El primer modelo llamado Gemini Omni Flash se lanza hoy en las aplicaciones Gemini, Google Flow y YouTube Shorts.

Google llama a Gemini Omni el «siguiente paso» de Nano Banana y, posiblemente, de su actual generador de vídeo, Veo 3.1. Te permite «combinar imágenes, audio, vídeo y texto como entrada y producir vídeos de alta calidad basados ​​en el conocimiento del mundo real de Gemini», según el gigante tecnológico. Luego puede editar el video a través de una conversación natural, con cada instrucción basada en la anterior para mantener la coherencia de los personajes y otros elementos.

Si bien Veo 3.1 se limitaba a crear videos mediante comandos e imágenes, Gemini Omni aceptará una gama más amplia de entradas y hará más. Por ejemplo, puedes grabar un vídeo y luego pedirle a Omni que cambie lo que sucede. «Tus vídeos se convierten en el punto de partida de algo que nunca podrías haber grabado tú mismo», explica Google. «Edita la acción, añade nuevos personajes u objetos, o transforma un momento en algo inesperado. Cambia el entorno, el ángulo, el estilo o incluso detalles específicos».

Omni también comprende mejor las fuerzas físicas como la gravedad, la energía cinética y la dinámica de fluidos, por lo que las escenas se vuelven más realistas. Esto, combinado con el «conocimiento de la historia, la ciencia y el contexto cultural» de Gemini, cierra la brecha entre el fotorrealismo y la narración significativa. La aplicación debería poder crear explicaciones atractivas a partir de instrucciones breves para producir imágenes que describan ideas más complejas. Sin embargo, sólo admitirá referencias de sonido para iniciar la salida de audio.

Si quieres crear un vídeo en el que eres la estrella, Omni te permite usar tu propia voz para crear un avatar digital que se parece y suena como tú. Si esto suena como una potencial pesadilla de privacidad, Google dice que tiene «políticas claras para proteger a los usuarios de daños y regular el uso de nuestras herramientas de inteligencia artificial». En cuanto a la edición de vídeos para cambiar el audio y la voz, la empresa todavía está probando la funcionalidad para ofrecérsela a los usuarios de forma «responsable». Todos los videos también utilizarán la marca de agua digital SynthID invisible de Google para verificar que el video fue creado con Gemini Omni.

Eso suena genial, pero el principal problema con Veo 3.1 y otras aplicaciones de creación de videos es que los videos tienen una apariencia de «valle inquietante» y, a menudo, son odiados por los usuarios finales. Con ese fin, será interesante ver si la calidad del resultado está a la altura de las afirmaciones de Google. Lo sabremos pronto, ya que Gemini Omni Flash ahora está disponible para todos los clientes de Google AI Plus, Pro y Ultra a nivel mundial y se implementará para los usuarios de YouTube Shorts y YouTube Create App a partir de esta semana.



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here