La red neuronal GauGAN 2.0 de Nvidia aprendió a hacer dibujos a partir de una descripción verbal
Nvidia desarrolló y demostró inteligencia artificial para crear imágenes fotorrealistas llamadas GauGAN en 2019.
Pero la red neuronal tomó la forma de una herramienta completa disponible para el público en general solo recientemente en forma de una aplicación Canvas. Y ahora se ha lanzado la versión de GauGAN 2.0, que ahora puede reconocer descripciones verbales de lo que quieres dibujar.
La característica principal de GauGAN no es solo reconocer la esencia de las solicitudes de los usuarios, sino también la atención a los detalles que les gustaría reflejar. Idealmente, basándose en instrucciones textuales y gráficas, puede cambiar la forma, el tamaño y la textura de cualquier objeto de la imagen de forma arbitraria. Y al mismo tiempo preserva la armonía y la integridad generales del lienzo, que en última instancia parece una fotografía o una pintura hábil.
Para que la inteligencia artificial comprenda las necesidades humanas de manera tan sutil, el modelo generativo-adversario se entrenó en ejemplos de 10 millones de paisajes diferentes. Por lo tanto, entiende la diferencia entre una “roca embarrada en la orilla” y “piedras rodantes en el oleaje”, y puede dibujar ambas en un cuadro. Aún más interesante, los cambios se muestran en tiempo real a medida que se realiza la solicitud. ¡Vaya al sitio web de la red neuronal y siéntase como un creador!