Creación de imágenes mediante IA: una visión cínica (publicado en LinkedIn)

En abril de 2024 publiqué en LinkedIn un artículo sobre las herramientas de creación de imágenes con inteligencia artificial generativa. En concreto, comparaba Imagen 2, de Google, con DALL-E de OpenAI.
Ha llovido mucho desde entonces, y los modelos de generación de imágenes han mejorado bastante (aunque, desde mi punto de vista, todavía tienen terreno por recorrer).
Con un tono desenfadado, analizaba los resultados de los prompts, demostrando que, a pesar de la euforia, los resultados eran bastante pobres.
La imagen que ilustra esta entrada, sin ir más lejos, es un fragmento de esta otra:

Imagen 2 me devolvió este resultado, en respuesta a este prompt: «Grupo de personas reunidas, sentadas en una mesa, revisando un gráfico de distribución«. Si nos fijamos en las caras, las manos, y en el fondo de la imagen, podemos decir que se parece más la escena de un apocalipsis zombie, que a una imagen representativa de una sesión de trabajo.
El mismo prompt, hoy, en Gemini (que le envía la instrucción a Imagen 3), me ha devuelto esta imagen:

El resultado es menos malo, pero no es bueno. Entre una buena foto de estudio y esto, me atrevo a decir que hay una distancia similar a la que existe entre una rosa silvestre y una de plástico.
Enlace al artículo publicado en LinkedIn
Descubre más desde Consultor en Ciencia de Datos
Suscríbete y recibe las últimas entradas en tu correo electrónico.