Este martes, la gran empresa tecnológica estadounidense presentó sus recientes modelos de inteligencia artificial (IA): Gemini 3.5 Flash y Gemini Omni.
Gemini Omni es un modelo que acepta múltiples tipos de entrada, incluyendo texto, audio, imágenes y video, y que inicialmente produce salidas en video, con planes de incluir audio e imagen en el futuro.
Demis Hassabis, director general y cofundador de Google DeepMind, enfatizó en el evento que este nuevo modelo tiene la capacidad de ‘lograr un nuevo nivel de comprensión del mundo, multimodalidad y edición’.
Hassabis explicó que ‘modelos como Leo, Nano, Banana y Genie (todos de Google) pueden generar videos, imágenes y simulaciones interactivas muy realistas. Aunque no son infalibles, ya muestran una notable capacidad intuitiva. Con Omni hemos hecho un progreso aún mayor, marcando un cambio significativo en la simulación de fenómenos como la energía cinética y la gravedad’.
Gemini Omni sustituirá a Veo en la aplicación de Gemini. Este modelo combina la inteligencia principal de Gemini con avanzadas capacidades de medios generativos, permitiendo transformar imágenes en videos y editar videos mediante IA.
Qué puedes hacer con Gemini Omni
- Combinar texto, fotos y video en un solo video
- Crear videos a partir de fotos de referencia (hasta cinco)
- Editar videos fácilmente
La página oficial indica que Gemini Omni está disponible para usuarios mayores de 18 años que cuenten con un plan Google AI Plus, Pro o Ultra, en todos los idiomas y mercados donde la app de Gemini esté accesible.
Es posible que algunas características, como la edición de video a video mediante IA, estén limitadas en ciertos países. También se podrá crear un avatar.
Con información de EFE
Gracias por acompañarnos hasta el final de esta historia.
Desde Referente Guatemala Creemos que la información también nos ayuda a comprendernos mejor como sociedad y a observar con mayor atención lo que ocurre a nuestro alrededor.








