Facebooktwitterlinkedin

Son muchos los avances que se han ido experimentando en el campo de la IA (inteligencia artificial) en los últimos años. No obstante, parece que estos mantienen la capacidad de sorprender intacta, tal y como ha demostrado Dalle-2. Este sistema, heredero de Dalle-1, ha generado una auténtica revolución en redes. Y, ¿a qué se debe tal revuelo? Pues bien, Dalle-2 es un sistema capaz de generar imágenes realistas o ilustraciones a partir de descripciones escritas por parte de sus usuarios.

Ejemplo de una imagen generada con Dalle-2

Imagen generada a partir de «A potato wearing a trench coat in a heroic pose, 3d digital art»

Esta es la funcionalidad principal y que más protagonismo ha acaparado, siendo muchas las imágenes compartidas por aquellos que han podido probar este nuevo sistema, pero no es la única.

Dalle-2 permite crear imágenes, editarlas y versionarlas

Las posibilidades artísticas se multiplican gracias a Dalle-2. Podrás obtener diseños que respondan a tus ideas con solo escribirlos pero, también editar imágenes ya existentes. La capacidad de agregar nuevos objetos o elementos, así como sustituir unos por otros fácilmente, entra dentro del abanico de oportunidades. Todo esto, mientras el programa tiene en cuenta las luces y sombras, las texturas y los reflejos de la imagen original, generando una experiencia de edición muy completa.

La tercera, y última, prestación de esta IA es la creación de nuevos diseños que reinterpreten otros ya existentes, pudiendo variar aspectos como los ángulos y perspectivas, entre otros.

reinterpretación de la joven de la perla creada con Dalle-2

Reinterpretación de «la joven de la perla» creada con Dalle-2

Dalle-2, las segundas partes sí son buenas

Antes de Dalle-2, como no, estaba Dalle-1. Este sistema fue lanzado en enero de 2021 por la compañía de investigación y desarrollo de inteligencia artificial OpenAI, y sus pretensiones eran muy similares a las de la versión actual: generar imágenes de forma automática a partir de textos descriptivos. Como se puede apreciar en la imagen, la IA conseguía su propósito, aunque el resultado final no podía considerarse una obra de arte.

Imagen generada con Dalle-1

«Avocado armchair» – Imagen creada con Dalle-1

Un año más tarde, en enero de 2022, tras diversas actualizaciones se presenta Dalle-2. Entre sus mejoras destaca la consecución de una mayor resolución y calidad de imagen, además de una mejor comprensión y capacidad de ejecución. A esto debemos sumarle las dos funcionalidades mencionadas anteriormente: la edición y el versionado.

Al alcance de unos pocos

Por el momento, el acceso a esta IA solamente se encuentra en manos de algunos elegidos, los cuales están compartiendo con el resto de los mortales las creaciones de Dalle-2 en sus redes. Para poder formar parte de tan selecto grupo se puede acceder a un formulario a través de la web de OpenAi. Una vez hecho esto, se pasa a la lista de espera hasta que se concede o no el acceso.

¿Cómo funciona Dalle-2?

Esta IA funciona como un complejo sistema neuronal, en la cual diversas imágenes y sus correspondientes textos descriptivos se entrelazan. Pero la intrincada tecnología de Dalle-2 (a la que a partir de ahora conoceremos como nuestras amigas las neuronas) ha evolucionado más allá de las conexiones simples.

Estas neuronas han evolucionado de tal manera que, actualmente, son capaces de relacionar no solo el sujeto (por ejemplo «teddy bears»), sino también la acción («mixing sparkling chemicals as mad scientist») y el estilo artístico («as digital art»). Pero estas neuronas no nos ofrecen una única opción, sino que son capaces de generar múltiples propuestas que den respuesta a la descripción realizada.

Imágenes creadas a partir de la misma descripción con Dalle-2

«Teddy bears mixing sparkling chemicals as mad scientist as digital art» – Imágenes creadas con Dalle-2

A pesar de que este sistema aún se encuentra en desarrollo, el salto cualitativo ha sido de lo más notable, lo cual nos lleva a imaginar todo un mundo de posibilidades. Actualmente, Dalle-2 solo puede crear reproducciones fieles atendiendo a parámetros conocidos. Es decir, sus neuronas aún se están empapando de conocimiento, y aquello que no conoce, lo interpreta.

Cuál será el impacto de Dalle-2

Como todo avance tecnológico, o de cualquier índole, este presenta ventajas y desventajas. ¿Cómo puede afectar en un futuro cada vez más próximo el uso de este tipo de sistemas a la gente común? y, sobre todo ¿cómo afectará a los profesionales del diseño y las artes gráficas? La disruptiva que Dalle-2 plantea es compleja, engloba múltiples cuestiones, desde el eterno debate entre las capacidades humanas frente a las de la máquina, hasta temas como el copyright y los derechos de autor.

Antecesores

No es la primera vez que OpenAI desarrolla una API capaz de realizar tareas que son consideradas exclusivas del ser humano, el GPT es un claro ejemplo de esto. Al igual que el Dalle, cuenta con varias versiones, siendo el GPT-3 la más reciente. Este sistema fue lanzado en 2020 y su función es completar las tareas de texto que el usuario le solicite. Las posibilidades que esta IA plantea van desde la creación de códigos html hasta la creación de artículos a partir de frases ya empezadas.

Todo esto se debe a que, al igual que las neuronas de Dalle-2, GPT-3 se ha empapado de una cantidad de información monumental. Más de 400.000 millones de textos conforman el gran mapa conceptual que GPT-3 posee en su sistema, lo cual puede llevar a plantearse los peligros de una herramienta capaz de generar ingentes cantidades e texto en muy poco tiempo. Textos con un sentido y una coherencia mayormente garantizados, no pasando lo mismo con su veracidad. De hecho, sus propios creadores llegaron a retirar su segunda versión por considerarla una potencial amenaza, capaz de generar desinformación, de llegar a usarse de forma inadecuada.

A pesar de que, al igual que GPT-3, Dalle- 2 no es un sistema perfecto. Y aún así podría convertirse en una oportunidad para aquellos que no tengan tan desarrolladas sus habilidades artísticas, permitiéndoles obtener representaciones gráficas de sus ideas. También puede resultar de utilidad para la creación de bocetos previos al desarrollo de diseños más complejos o como atajo para probar cómo encaja una idea en diferentes estilos o vanguardias. Así mismo, podría llegar a ser una gran fuente de inspiración para los profesionales del diseño, enriqueciendo su bagaje artístico. Por el momento solo podemos esperar con expectación los resultados de este avance y seguir dejándonos sorprender por el curso que están tomando las nuevas tecnologías.

Imagen: Dalle-2

Mantente informado de las noticias más relevantes en nuestro canal de Telegram

Escribir comentario

¡Mantente al día!