Red neuronal de Google Imagen Video enseñada a crear video HD a partir de texto sin formato

Octubre 24, 2022Octubre 13, 2022 Mario Silva

El desarrollo de la industria de los sistemas de IA para la creación de obras de arte a partir de descripciones abstractas ha adquirido un ritmo que sorprende incluso a sus creadores. Aparecen nuevas aplicaciones cada pocos meses, que brindan un rendimiento cada vez mayor, pero se vuelven cada vez menos manejables. Como ejemplo, el difícil destino del proyecto Imagen Video es adecuado.

Google ha presentado los primeros trabajos de una nueva IA de ” Imagen Video ” que es capaz de sintetizar video HD a una resolución de 1280×768 a 24 cuadros por segundo en función de descripciones de texto simples. Este sistema es capaz de construir modelos 3D completos de objetos arbitrarios para crear escenas complejas y demostrarlas desde diferentes ángulos. Sabe imitar los estilos de pintura de artistas famosos, entiende conceptos abstractos y puede armar videos a partir de objetos inexistentes. Por ejemplo, el vuelo de una sonda a través de los campos de batalla de piratas espaciales con extraterrestres desconocidos.

El principio de funcionamiento de Imagen Video se basa en una cascada de siete niveles, donde en el primer nivel se crea el modelo de visualización más simple de una tarea de texto. Luego, dependiendo de la tarea, se mejora la imagen paso a paso, obteniendo los efectos necesarios, animación, etc. AI fue entrenada en la base de datos LAION-400M, que contiene alrededor de 14 millones de pares de combinaciones de descripción + video y 60 millones de pares de texto + imagen, pero esta es precisamente su principal vulnerabilidad.

Para completar la cobertura de la base de datos cultural acumulada por la humanidad, LAION-400M se convirtió en una base de datos abierta, por lo que contenía mucho contenido que no debería mostrarse por razones de censura. Por desgracia, tampoco se puede excluir, de lo contrario, AI perderá la capacidad de reconocer adecuadamente las solicitudes. Por ejemplo, para mostrar compasión, debes ser capaz de comprender qué es el dolor y el sufrimiento. Google aún no ha podido encontrar una solución para esta difícil tarea, por lo que ha pospuesto la publicación del código de Imagen Video y la apertura de acceso a esta IA por tiempo indefinido.

¿Te gusto la noticia? compártela en tus redes sociales.