Si existe en tu mente, lo puede dibujar: lo nuevo de OpenAI crea imágenes a partir de palabras

A principios del pasado año te hablábamos de DALL-E, la inteligencia artificial de OpenAI capaz de generar imágenes de cualquier texto que escribiéramos. La nueva versión de este sistema, bajo el nombre de DALL-E 2, ya es oficial, y las mejoras respecto a la anterior son notables.

DALL-E 2 se está probando en un entorno privado de desarrollo, por lo que aún no podemos pedirle que dibuje lo que queramos. No obstante, desde OpenAI han compartido múltiples imágenes sobre su funcionamiento, y los resultados son espectaculares.

"Crea una imagen de un astronauta cabalgando un unicornio"

DALL-E 2 es la revisión del modelo de inteligencia artificial que vimos el año pasado, y es más espectacular que nunca. OpenAI lo define como "un nuevo sistema de IA que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural". Actualmente está en una fase cerrada de pruebas, pero hay numerosos ejemplos sobre su funcionamiento.

Al igual que el modelo anterior, esta IA aprovecha el potencial de GPT-3 para generar sus diseños, mediante un complejo sistema en el que primero se genera una imagen dada una leyenda de texto y, posteriormente, se genera una segunda imagen condicionada a la primera.

Además de crear imágenes desde cero, es capaz de hacer ediciones de imágenes, así como recreaciones de las mismas desde su propio modelo. Los resultados están mucho más afinados que los vistos la generación pasada.

"Pintura de un zorro sentado en un campo al amanecer al estilo de Claude Monet".

En Xataka

Hemos entrevistado a GPT-3 sobre cómo será la vida en 2030 y esto es lo que nos ha dicho de Marte y el futuro (y dice que se llama Luis)

Explican desde OpenAI que DALL-E 2 ha aprendido mejor las relaciones entre imágenes y el texto utilizado para describirlas, siendo capaz ahora de generar imágenes con una resolución cuatro veces mayor.

Para evitar el mal uso de la IA, DALL-E 2 no puede generar imágenes consideradas como violentas o explícitas. Se limita asimismo la generación de imágenes fotorrealistas para evitar la recreación de rostros de personas reales.

Más información | OpenAI