Por Alejandro González
“Crea una fotografía de un busto de Homero”, “una silla con forma de aguacate”, “una marquesina con la palabra OpenAI”. Éstas son sólo algunas descripciones con las que el sistema de Inteligencia Artificial de OpenAI, DALL-E, creó en imagen solamente a partir de dichas frases.
La compañía dedicada al desarrollo de soluciones de Inteligencia Artificial (IA) ha creado herramientas como la mencionada y también otra de nombre CLIP, que hace un relacionamiento entre una descripción en texto con imágenes.
Ambas soluciones reconocen los comandos de manera instantánea gracias a que están desarrolladas sobre el modelo de lenguaje GPT-3, que es capaz de diseñar y tener conversaciones sobre el tema que se le indique. Este lenguaje fue presentado el año pasado y podría ser adaptado en un sin fin de aplicaciones.
OpenAI explicó que para poder lograr imágenes a partir de una descripción, el sistema analiza más de 12 mil millones de parámetros, lo que le permite generar diversas versiones de imágenes que se le piden a partir de un texto.
“Presentamos una red neuronal que está entrenada en una amplia variedad de imágenes con una amplia variedad de supervisión del lenguaje natural que está disponible en abundancia en Internet. Por diseño, la red puede recibir instrucciones en lenguaje natural para realizar una gran variedad de evaluaciones comparativas.
“CLIP se basa en una gran cantidad de trabajo sobre transferencia cero, supervisión del lenguaje natural y aprendizaje multimodal. La idea del aprendizaje de datos cero se remonta a más de una década, pero hasta hace poco se estudiaba principalmente en la visión por computadora como una forma de generalizar a categorías de objetos invisibles. Una idea fundamental fue aprovechar el lenguaje natural como un espacio de predicción flexible para permitir la generalización y la transferencia”, explicó OpenAI.
La compañía dijo que herramientas como DALL-E pueden ser utilizadas por diversas industrias, como la de diseño de modas para crear prendas, o bien en la de diseño de interiores, pues es capaz de crear ambientes en una casa u oficina.
En el caso de DALL-E, tiene la capacidad de generar imágenes que existen, pero también puede generar objetos que no existen. OpenAI ejemplificó que si se le pide que genere una imagen de un reloj verde con forma de caracol, es algo muy específico que no es común, pero sí puede realizarlo.