Un equipo de investigadores de inteligencia artificial de Google Research desarrolló un generador de texto a video basado en inteligencia artificial de próxima generación llamado Lumiere. El grupo publicó un artículo que describe sus esfuerzos en el servidor de preimpresión arXiv.
Lumiere, que probablemente lleva el nombre de los hermanos Lumière, quienes fueron pioneros en los primeros equipos de fotografía, permite a los usuarios escribir una oración simple como "dos mapaches leyendo libros juntos" y obtener un video completamente terminado que muestra a dos mapaches haciendo precisamente eso, y lo hace en resolución sorprendentemente alta. El nuevo generador representa un siguiente paso en el desarrollo de generadores de texto a vídeo al crear resultados mucho más atractivos.
Google describe la tecnología detrás del nuevo generador como una "arquitectura innovadora de espacio-tiempo U-Net". Fue diseñado para generar video animado en una sola pasada de modelo.
El video de demostración muestra que Google agregó funciones adicionales, como permitir a los usuarios editar un video existente resaltando una parte del mismo y escribiendo instrucciones, como "cambiar el color del vestido a rojo". El generador también produce diferentes tipos de resultados, como estilizaciones, donde se crea el estilo de un tema en lugar de una representación a todo color. También permite subestilos, como diferentes referencias de estilo. También realiza imágenes cinematográficas, en las que un usuario puede resaltar parte o la totalidad de una imagen fija y animarla.
En su anuncio, Google no especificó si planea lanzar o distribuir Lumiere al público, probablemente debido a las obvias ramificaciones legales que podrían surgir debido a la posible creación de videos que violen las leyes de derechos de autor.
Impacto potencial
Si Lumiere se lanzara al público, tendría un impacto significativo en una variedad de campos, incluidos el entretenimiento, la educación y la publicidad.
En el entretenimiento, Lumiere podría usarse para crear nuevos programas de televisión, películas y videojuegos. También podría usarse para crear efectos especiales más realistas.
En la educación, Lumiere podría usarse para crear videos educativos personalizados que se adapten a las necesidades de cada estudiante. También podría usarse para crear simulaciones que ayuden a los estudiantes a comprender conceptos complejos.
En la publicidad, Lumiere podría usarse para crear anuncios más atractivos e impactantes. También podría usarse para crear campañas publicitarias personalizadas que se adapten a los intereses de cada individuo.
Implicaciones éticas
La capacidad de crear videos realistas a partir de texto tiene implicaciones éticas que deben considerarse cuidadosamente. Por ejemplo, Lumiere podría usarse para crear noticias falsas o propaganda. También podría usarse para crear imágenes de personas o lugares sin su consentimiento.
Es importante que los desarrolladores de Lumiere y los usuarios del mismo sean conscientes de estas implicaciones y tomen medidas para mitigar los riesgos. Por ejemplo, Lumiere podría incluir funciones que permitan a los usuarios verificar la autenticidad de los videos generados. También podría incluir funciones que permitan a los usuarios solicitar el consentimiento de las personas o lugares que aparecen en los videos generados.
Lumiere es una tecnología innovadora con un gran potencial para impactar positivamente en el mundo. Sin embargo, es importante ser consciente de las implicaciones éticas de esta tecnología y tomar medidas para mitigar los riesgos.
[email protected]
FUENTE: Techxplore.com, Video de demostración de Lumiere publicado en el canal de YouTube de Google AI