Google lanza Veo, su nuevo modelo de IA para vídeos en alta definición

Google presentó este martes Veo, su nuevo modelo de inteligencia artificial (IA) que es capaz de generar vídeos de un minuto en "alta definición" en una amplia gama de estilos visuales y cinematográficos.

Desde hoy, la herramienta está disponible sólo "para creadores seleccionados como vista previa privada dentro de VideoFX", pero Google planea incorporar en el "futuro" algunas capacidades de Veo a YouTube Shorts y otros productos, según anunció en el marco de su conferencia de desarrolladores, Google I/O.

Veo es un modelo de inteligencia artificial capaz de generar vídeos de alta definición en una amplia gama de estilos visuales y cinematográficos

Veo será el principal competidor de Sora, una herramienta similar de OpenAI que ha dejado boquiabiertos a los expertos con la nitidez y similitud a la realidad que alcanzan sus vídeos, y que también está disponible sólo para un grupo selecto de creadores.

Según anunció Google desde su sede en Mountain View (California), la nueva herramienta es capaz de generar vídeos con resolución de 1080p y "crea imágenes consistentes y coherentes: personas, animales y objetos se mueven de manera realista a lo largo de las tomas".

En versiones de sus competidores se han podido ver errores, como humanos con más de dos brazos, por ejemplo.

Hoy Google mostró varias creaciones cortas de sus vídeos de IA: un coche circulando por una ciudad; un velero navegando el océano, y un plano corto de una mujer pestañeando, pero la empresa no detalló cuántas veces o cuánto tiempo tuvo que interactuar con la máquina para conseguir ese resultado final.

Con la integración de la IA de Google en el sistema operativo Android, los usuarios ahora pueden interactuar con sus dispositivos de formas nuevas

Asimismo, mostró un vídeo con la reacción del cineasta Donald Glover y su estudio creativo, Gilga, usando esta tecnología en una granja de California.

"El modelo también comprende términos cinematográficos como 'timelapse' o 'tomas aéreas de un paisaje', lo que proporciona un nivel de control creativo sin precedentes", anota la empresa en un comunicado.

Nuevo modelo de IA para generar imágenes

El gigante tecnológico también presentó Imagen 3, su nuevo modelo de conversión de texto a imagen capaz de generar productos "fotorrealistas", aunque la mayor crítica hacia su modelo anterior no fue la falta de calidad, sino las respuestas inexactas y sesgadas.

Por ejemplo, la herramienta generó imágenes de una mujer asiática o un hombre negro tras ser preguntado por ilustrar un "soldado alemán de 1943", cuando el nazismo estaba en auge en el país y la diversidad racial era prácticamente imposible.

Una de las cualidades de Imagen 3 que se resaltó durante el evento fue su capacidad de representar texto, "lo que ha sido un desafío para los modelos de generación de imágenes" hasta el momento.

La 6ª generación de TPU, denominada Trillium, multiplica por 4,7 el rendimiento de cálculo por chip respecto a la generación anterior

"Esta capacidad abre posibilidades para generar mensajes de cumpleaños personalizados, diapositivas de títulos en presentaciones y más", destaca la compañía en un comunicado.

A partir de hoy, esta tecnología está disponible para creadores seleccionados como una vista previa privada dentro de ImageFX.

Demis Hassabis, CEO de DeepMind Technologies, a la izquierda, estrecha la mano del CEO de Alphabet, Sundar Pichai, en un evento de Google I/O en Mountain View, California, el martes 14 de mayo de 2024

Jeff Chiu

Las principales novedades del Google I/O 2024

Google ha revelado en su evento Google I/O 2024 las últimas actualizaciones y desarrollos dentro de la era Gemini, un compendio de modelos de inteligencia artificial (IA) capaces de interactuar con texto, imágenes, vídeo y más. Este avance sigue a la introducción de Gemini en diciembre de 2023, marcando un hito significativo en la evolución tecnológica de Google.

Entre las principales innovaciones presentadas destacan:

Gemini 1.5 Pro: Una versión avanzada del modelo Gemini, que ofrece opciones personalizadas de colaboración y mejora la interacción inteligente.

Nuevos modelos en la serie Gemini: Se introdujo Gemini 1.5 Flash, el modelo más rápido y eficiente hasta la fecha, junto con el Proyecto Astra, que representa la visión futura de los asistentes de IA.

IA generativa para creadores: Google ha lanzado Veo, un modelo para la creación de vídeos en alta definición, e Imagen 3 para la generación de imágenes. Además, se han mostrado nuevas demos en el Music IA Sandbox.

Integración de Gemini con Android: La implementación de Gemini en el sistema operativo Android permite nuevas formas de interacción para los usuarios de dispositivos Android.

Búsqueda y Google Fotos: La búsqueda de Google ha sido mejorada con tecnologías de IA generativa, y Gemini ha sido integrado en Google Fotos, incluyendo una función experimental que facilitará la búsqueda y recuperación de información en la galería de fotos.

Novedades en Google Cloud y Google Workspace: Gemini ampliará su presencia en Google Workspace, integrándose en aplicaciones como Gmail, Docs, Drive, Slides y Sheets, y también en la versión móvil de Gmail.

Desarrollo de Trillium, la 6ª generación de TPU: Google ha anunciado Trillium, una nueva generación de su unidad de procesamiento de tensor que promete un aumento significativo en el rendimiento de cálculo, disponible para clientes de Cloud a finales de este año.

Conforme a los criterios de

¿Por qué confiar en nosotros?

Consulta aquí la portada de HERALDO de este martes, 16 de julio de 2024

Google lanza Veo, su nuevo modelo de IA para vídeos en alta definición

Nuevo modelo de IA para generar imágenes

Las principales novedades del Google I/O 2024