Noticias

Di de Chatgpt y Gemini 5 Image Solts, aquí está quién ganó

Published

on

Tanto Chatgpt como Gemini se consideran entre los mejores generadores de imágenes de IA. Con ambos modelos, puedes describir una escena y verla cobrar vida en segundos. Pero no todos los generadores de imágenes son creados iguales.

Para ver cómo se comparan, le di a ambas plataformas exactamente las mismas cinco indicaciones, desde la fantasía hasta el fotorrealismo, y evalué cómo cada IA ​​respondió en términos de creatividad, detalle y qué tan bien interpretaron el informe.

Los resultados no siempre fueron lo que esperaba. En algunos casos, una herramienta eclipsó claramente a la otra. En otros, se redujo al estilo versus el realismo.

Así es como se realizó cada IA ​​cuando se le dio el mismo desafío, y cuál podría ser la mejor opción para su próximo mensaje de imagen.

Cómo ver las comparaciones de imágenes

Para que sea fácil de seguir, el diseño es consistente en toda esta pieza. La salida de imagen de Chatgpt siempre aparecerá a la izquierday Géminis está a la derecha.

De esa manera, puede comparar fácilmente los dos uno al lado del otro y ver exactamente cómo cada IA ​​interpretó el informe.

Esto se aplica a todas las indicaciones, excepto el número dos, en el que la imagen de la salida de Gemini está debajo de ChatGPT.

1. Un tazón fotorrealista de ramen en una mesa de madera

(Imagen: © Guía de Tom)

Para este aviso, quería probar hiperrealismo. La fotografía de alimentos es notoriamente difícil de fingir, por lo que un tazón humeante de ramen con ingredientes detallados, iluminación cálida y texturas visibles sería un fuerte indicador de qué tan bien cada IA ​​hace realidad.

Si alguna imagen pudiera pasar para una foto de restaurante real de un vistazo, lo llamaría una victoria. Usé el siguiente mensaje: “Cree una imagen de un tazón fotorrealista de ramen con vapor que se eleva, colocado en una mesa rústica de madera en un restaurante suavemente iluminado”.

Ambos modelos lo hicieron bien aquí, pero Chatgpt se llevó la victoria. La imagen se veía genuinamente fotorrealista, hasta los detalles finos, como el ascensor de vapor y el caldo brillante. Si lo viera en mi feed, probablemente no lo cuestionaría.

La versión de Géminis, por otro lado, no aterrizó de la misma manera. El huevo parecía plano y carecía de una dimensión, y la composición general se sintió menos convincente. No estaba mal, pero no pasó el “¿Es esto real?” Prueba como lo hicieron los chatgpt.

2. Un par futurista de zapatillas para correr en un fondo de estudio blanco

(Imagen: © Guía de Tom)

Aquí estaba buscando un representación de productos limpios. Piense en el comercio electrónico listo: bordes afilados, iluminación de estudio y texturas de materiales realistas.

Es una prueba de qué tan bien cada IA ​​puede producir imágenes de estilo comercial con un ruido de fondo mínimo. El aviso puede parecer simple, pero eso es exactamente por qué importa: la precisión y la presentación lo son todo.

Para este usé: “Cree una imagen de un par de zapatos futuristas, fotografiados en un fondo de estudio blanco, con sombras suaves y detalles reflectantes”.

No pude encajar ambas imágenes en la misma diapositiva, Entonces el Géminis está debajo.

….

(Imagen: © Guía de Tom)

Ambos AIS hicieron un trabajo decente interpretando el aviso, pero Gemini salió adelante en este caso.

El trabajo de sombreado y textura fue excelente, dando a los zapatos una dimensión y peso reales. Incluso hubo un efecto de brillo suave que se sumó al ambiente futurista.

Curiosamente, ambos modelos de IA produjeron diseños que se parecían mucho a los entrenadores de Nike existentes, pero la versión de Chatgpt se veía más plana en comparación, casi como una representación 2D en lugar de una foto de producto pulido.

3. Un castillo medieval flotando en el cielo al atardecer

(Imagen: © Guía de Tom)

Este aviso se inclina hacia construcción del mundo de fantasía – El tipo de cosas que esperarías en una portada de libro o en un mazo de arte conceptual de juego.

Prueba la composición, la iluminación y la atmósfera, además de cuán imaginativo puede ser cada IA ​​con la estructura y la configuración. No se trata solo de seguir instrucciones, sino crear algo con estado de ánimo.

Para el mensaje de construcción del mundo de fantasía, fui con: “Cree una imagen de un gran castillo medieval hecho de piedra, flotando sobre las nubes al atardecer, con iluminación dramática y profundidad atmosférica”.

Chatgpt realmente clavó este. La iluminación era dramática, con la mitad del castillo lanzado en sombra y el resto brillando en luz dorada, exactamente el tipo de profundidad atmosférica que tenía en mente.

Géminis, mientras tanto, fue demasiado literal. El castillo estaba flotando, pero la sección inferior parecía confundida, como si no estuviera seguro de reflexionar en las nubes o estar enraizada en algo.

Dio una ligera vibra “Laputa: Castle in the Sky”, que fue un buen toque, pero no pegó el aterrizaje.

4. Un póster de viaje de estilo vintage para Marte

(Imagen: © Guía de Tom)

Este se trata de diseño gráfico y estética estilística. Quería ver si cada IA ​​podía capturar la apariencia de los carteles de viajes de mediados de siglo: la tipografía audaz, las formas gráficas planas, las paletas de colores limitadas y las opciones de diseño intencional.

Se trata menos del realismo y más del control artístico y el lenguaje visual. Probé ambos modelos con el siguiente mensaje: “Cree un póster de viaje de estilo retro de la década de 1950 para Marte, con letras en negrita, panorama de planeta rojo estilizado y una paleta de colores vintage”.

Esta fue una llamada cercana, pero Chatgpt lo superó. Su versión tenía un acabado granulado y texturizado que realmente vendía el aspecto vintage, junto con una tipografía variada que le dio una sensación auténtica y apropiada para la ARA. Realmente podrías imaginarlo colgando en una exposición de ciencia ficción retro.

La versión de Gemini no estaba muy por detrás, utilizaba una paleta de colores adecuada y letras en negrita, pero carecía de ese personaje de diseño auténtico. Se sintió más como un póster inspirado por la época, en lugar de algo hecho en él.

5. Un retrato editorial

(Imagen: © Guía de Tom)

Para completar las cosas, quería algo estilizado pero enraizado en el realismo, el tipo de retrato que verías en una extensión editorial.

Esta pronta prueba la capacidad de cada IA ​​para representar las características humanas con precisión, al tiempo que gestiona elementos visuales en capas como reflejos, iluminación y movimiento en un entorno urbano ocupado.

Para el último aviso que usé: “Cree un retrato estilizado de una mujer en Times Square por la noche, con gafas de sol reflectantes que muestran letreros de neón, iluminación cinematográfica”.

No hay absolutamente ninguna duda de que Géminis rompió este. El retrato era de alta resolución, perfectamente iluminado y lleno de detalles. Desde la textura de la piel hasta la sutil superposición de los labios, cada elemento era perfecto.

Examiné la imagen, buscando algo – cualquier cosa – Fuera, y salió vacío. El realismo fue excepcional, fácilmente a la par con lo que esperarías de MidJourney.

ChatGPT tomó “estilizado” en una dirección más artística, no está mal de ninguna manera, pero en términos de calidad y precisión fotográfica, la producción de Gemini estaba en una liga diferente.

Pensamientos finales ….

(Imagen: © Shutterstock)

En las cinco indicaciones, ChatGPT toma la corona. Sus salidas de imagen fueron consistentemente creativas, bien compuestas y estrechamente alineadas con la intención de cada informe, particularmente cuando se trataba de fantasía, textura y imágenes estilizadas.

Manejó las indicaciones artísticas con confianza y entregó imágenes que se sentían cuidadosamente compuestas, no solo generadas.

Dicho esto, Gemini se mantuvo en sí, y en algunas áreas, superó a ChatGPT. Su retrato hiperrealista era impecable, y clavó el disparo al estilo del producto con mejor textura y profundidad.

También tiene una ventaja principal: Gemini generó imágenes notablemente más rápidas que ChatGPT a lo largo de la prueba. Si la velocidad y el realismo son sus prioridades, vale la pena usar Gemini.

Pero para la versatilidad general, la interpretación creativa y el polaco visual: ChatGPT fue el generador de imágenes más fuerte esta vez.


Ahora que has aprendido cómo Chatgpt y Gemini abordan la creación de imágenes de IA, ¿por qué no echar un vistazo a algunos de nuestros otros artículos de IA?

Echa un vistazo a 5 indicaciones de chatgpt alucinantes, desearía saber antes y 11 consejos para obtener mejores resultados. E incluso puede reemplazar a Alexa con Chatgpt en su Amazon Echo.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version