No es ningún secreto que la IA se utiliza cada vez más para crear arte e imágenes. Pero, ¿cómo les va a las principales plataformas de inteligencia artificial (Google Gemini, ChatGPT de OpenAI y Meta AI) cuando se les pide que generen una deliciosa comida de tres platos?
Para descubrirlo, los puse a prueba con una serie de indicaciones. El objetivo era desafiarlos a diseñar un aperitivo, plato principal y postre creativos y apetitosos.
Exploré la capacidad de cada modelo de IA en función del contexto de las imágenes de alimentos y comparé cómo cada plataforma interpreta las indicaciones para cada plato en particular. Desde aperitivos hasta postres, veamos qué IA sirve la comida virtual más apetitosa.
Creando las indicaciones
Para que la comparación fuera justa, comencé diciéndole a cada modelo de IA que quería crear una comida coherente con tres platos. A partir de ahí, elaboré tres indicaciones específicas para cada plato de la comida: aperitivo, plato principal y postre.
El desafío para cada modelo de IA era generar imágenes de alimentos realistas y visualmente atractivas, y al mismo tiempo probar su capacidad para capturar textura, composición y creatividad en un solo cuadro.
Cada mensaje fue elegido para alentar al modelo de IA a mantenerse creativo y al mismo tiempo mantener el grado de realismo que uno podría esperar de un menú gourmet. Mi objetivo era ver qué tan bien cada IA podía ofrecer no solo una imagen hermosa, sino también algo que pareciera delicioso y apetitoso.
Flujo de trabajo
Para esta comparación, utilicé las funciones de generación de imágenes de cada plataforma con su configuración predeterminada. No utilicé ningún modelo premium, aunque Google Gemini y ChatGPT los ofrecen. Cada generador de imágenes de IA se probó mediante indicaciones conversacionales.
Las imágenes se evaluaron en función del realismo y de qué tan bien capturaron creativamente la esencia de una experiencia gastronómica gourmet. Profundicemos y veamos qué tan bien se desempeñaron las plataformas de IA.
1. Aperitivo
Inmediato: Estoy creando un menú gourmet de tres platos. Crea una imagen del aperitivo.
Géminis: Si alguien me ofreciera este aperitivo, podría decir cortésmente que estaba guardando el apetito para el plato principal. Esto simplemente no es atractivo. Es difícil saber si lo que hay en el medio es hummus o si las verduras están marchitas o asadas. En general, esto le da una sensación central, no es algo en lo que valga la pena hincarle el diente. Incluso la presentación fracasa; como una tabla de embutidos preparada por un niño pequeño.
Meta IA: ¡El cóctel de camarones se veía increíble! La ensalada tenía un fuerte contraste de color, textura y la imagen en general era muy atractiva. Con sus finos detalles y su revestimiento realista, parecía una foto de una revista.
ChatGPT: Esta ensalada caprese era visualmente atractiva pero tenía una cualidad artística y ligeramente surrealista. Los colores eran atrevidos y se enfatizaban las texturas, aunque el realismo era mucho mejor en comparación con el aperitivo de Google. La presentación estuvo bien hecha, elegante pero no demasiado. El pan añadió atractivo y dimensión, lo cual aprecié después de la falta de profundidad y estilo de Google.
Ganador: Meta IA: La verdadera competencia aquí fue entre ChatGPT y Meta AI, ya que ambos ofrecieron aperitivos con atractivo creativo, realismo y atención al detalle. Pero fue Meta AI la que entregó un primer curso sólido que capturó la complejidad del siguiente nivel.
2. Plato principal
Inmediato: Estoy creando un menú gourmet de tres platos. Gracias por el aperitivo. Por favor cree una imagen del plato principal.
Géminis: El filet mignon sobre puré de papas parecía listo para un restaurante, delicadamente acentuado con una deliciosa salsa que golpeaba el plato. Este plato estaba bellamente servido y la textura se destaca con detalles que casi se pueden saborear.
Meta IA: El plato principal tenía un aspecto estilizado y apetitoso, con un plato claramente reconocible. Todo desprendía un atractivo delicioso, hasta los delicados detalles del condimento. La imagen no sólo era agradable sino que tenía un intenso fotorrealismo que hacía que esta comida pareciera extremadamente deliciosa.
ChatGPT: Este entrante era similar al plato principal de Gemini pero los espárragos y las zanahorias dan una imagen exagerada y poco apetecible. La salsa o gravy que rodeaba el plato tenía un color y una textura extraños que se inclinaban más hacia el arte que hacia el realismo. La textura aquí no era tan nítida ni detallada como la generación de modelos de IA de Google o Meta.
Ganador: Meta IA: La imagen de Meta AI una vez más destacó por su realismo y presentación. ChatGPT y Gemini ofrecieron interpretaciones creativas, pero la falta de detalles finos en la versión de Gemini la hizo menos convincente y el plato de ChatGPT simplemente no emitió tanto atractivo como Meta AI.
3. Postre
Inmediato: Estoy creando un menú gourmet de tres platos. Gracias por el aperitivo y el plato principal. Por favor crea una imagen del postre.
Géminis: El pastel de fresas perfectamente redondo estaba magníficamente presentado, con una delicada salsa rociada alrededor del plato. Las capas agregaron un toque de color que contrastaba maravillosamente con el fondo y las fresas encima del pastel tenían una textura perfecta con detalles extraordinarios.
ChatGPT: El pastel de lava fundida tenía una cualidad caprichosa, casi caricaturesca, con detalles exagerados como el chocolate que fluye y una gran bola de helado. Si bien visualmente era divertido, no tenía el realismo de la imagen de Google.
Meta IA: El helado emitía una vibra de restaurante estadounidense de los años 50 que fracasó: una sorpresa después de dos rondas de comida apetitosa. Las bolas de helado encima del plátano casi parecen demasiado perfectas y en la última bola faltaba una última cucharada de crema batida. La llovizna de jarabe de chocolate carecía del fino detalle que haría que el postre realmente se destacara incluso si encajara en el menú.
Ganador: Géminis: Simplista y discreta, Gemini Imagen presentó una versión atractiva de un postre gourmet. ChatGPT se inclinó demasiado hacia su lado artístico con una interpretación lúdica y la versión de Meta AI era atractiva pero carecía de cohesión y refinamiento.
Fila 0 – Celda 0 | Géminis | Meta IA | ChatGPT |
Aperitivo | Fila 1 – Celda 1 | 🍲 | Fila 1 – Celda 3 |
Plato principal | Fila 2 – Celda 1 | 🍝 | Fila 2 – Celda 3 |
Postre | 🍰 | Fila 3 – Celda 2 | Fila 3 – Celda 3 |
Total | 1 | 2 | 0 |
Después de comparar las tres IA, está claro que Meta AI entregó consistentemente las imágenes más realistas, detalladas y apetitosas. A pesar de ahogarse en la última ronda, Meta AI generó las imágenes de comida más fotorrealistas.
ChatGPT produjo imágenes más creativas, ligeramente surrealistas, que se inclinaban hacia la interpretación artística, lo que podría atraer a los usuarios que buscaban representaciones más abstractas.
Gemini, aunque fuerte en el diseño general, no alcanzó el nivel de realismo o detalle proporcionado por Meta AI.
Cuando se trata de generar las imágenes más realistas, Meta AI se destaca, pero en creatividad y talento artístico, ChatGPT es un sólido contendiente. Géminis ofrece buenos resultados, pero puede quedarse corto cuando se trata de detalles complejos.