Tanto MidJourney como ChatGPT han lanzado recientemente nuevas versiones de sus generadores de imágenes AI. Históricamente, estas han sido dos de las mejores opciones que existen, pioneras en el espacio para lo que ha llegado.
Pero, cuando se colocan uno contra el otro, ¿cuál es mejor? Midjourney v7 o chatgpt 4o generación de imágenes?
Puse a la prueba ChatGpt vs Midjourney usando siete indicaciones diferentes para ver cuál es el mejor generador de imágenes AI. Estos prueban todo, desde la capacidad del modelo para comprender el contexto, recrear formas complejas y pensar creativamente para hacer imágenes.
Chatgpt vs midJourney v7: las reglas
Si bien ambos modelos crean imágenes, puede ser difícil hacer de este un enfrentamiento justo, principalmente debido a la cantidad de configuraciones que MidJourney le permite cambiar. Con eso en mente, estos fueron los pasos que tomé primero.
Para MidJourney, utilicé la versión 7. Esta es la última versión, pero todavía está en una fase experimental. También probé el aviso con la personalización de encendido y apagado (la configuración que agrega sus estilos de arte preferidos a las imágenes).
Midjourney produce cuatro versiones de cada imagen en comparación con el intento de Chatgpt. En todos los casos, elegí la mejor imagen de MidJourney y la aproveché (pedí una versión de mayor calidad).
1. Fotorrealismo
Inmediato: Cree una imagen fotorrealista de un frailecillo que vuela sobre un acantilado con agua debajo. En el fondo hay una cordillera. Es un día soleado y debajo del frailecillo hay dos personas que lo miran a través de binoculares
Chatgpt
Esto llega a casi todas las marcas. La imagen, aunque potencialmente saturada, es fotorrealista. Hay un frailecillo que vuela sobre un acantilado, hay agua debajo y hay una cordillera en el fondo.
Además de esos puntos, incluía a las dos personas que miraban a través de los binoculares. Claro, no están mirando el frailecillo, pero de lo contrario, esto es bastante bueno.
Intermediario
Hay muchas cosas que están sucediendo aquí. No puedo estar en desacuerdo con que todo haya sido incluido. Montañas en el fondo, un frailecillo, dos personas con binoculares e incluso agua y montañas en el fondo.
Sin embargo, abordemos al elefante (o un frailecillo en este caso) en la habitación. El frailecillo es gigante y podría enfrentarse a Godzilla si es necesario. La imagen tampoco es realmente fotorrealista, se parece un poco más a una pintura al óleo que a nada.
Incluso con los problemas de dimensionamiento de frailecillo, sigo pensando que ChatGPT entendió las señales con mayor precisión. Ambos modelos crearon agua debajo de una cara de acantilado, pero ChatGPT entendió el contexto de la solicitud con mayor precisión.
Ganador: chatgpt Gana este en casi todas las formas. Si bien me encantaría que los frailecillos sean criaturas míticas gigantes, MidJourney simplemente no entendió demasiado contexto aquí. Chatgpt, por otro lado, clavó el informe.
2. Iniciados complicados
Inmediato: Un gran mercado con un puesto que vende fruta, uno vendiendo vestidos y una cerámica de venta. En el fondo hay un río, y en la distancia es un bosque. Un hombre le entrega dinero a una mujer frente a uno de los puestos, y dos niños corren por el medio. En el cielo hay un globo de aire caliente
Chatgpt
Estaba sucediendo mucho en este aviso, y podría ser fácil para un modelo de IA ignorar algo de eso. Sin embargo, todos los detalles clave están aquí. El globo de aire caliente, los dos niños corriendo por el medio y el hombre entregó dinero a una mujer. También es, claramente, un día caluroso, y puedes ver el mercado vendiendo frutas, cerámicas y vestidos.
A pesar de todos los detalles requeridos, ChatGPT produjo una imagen de alta calidad y muy detallada.
Intermediario
Mientras que MidJourney logró la misma imagen, fueron los detalles más pequeños los que estaban apagados. Cuando se acerca, las caras no están completas, las manos de las dos personas se transforman juntas, y la mayor parte del fondo es un borrón.
Ganador: chatgpt Toma este. Si bien ambos miran correctamente una mirada, y en su mayoría obtienen todas las características solicitadas, a MidJourney le falta muchos de los detalles más finos.
3. Adaptando imágenes reales
Inmediato: Convierta esta imagen en un retrato renacentista
Chatgpt
Con este aviso, Chatgpt esencialmente convirtió mi imagen en los estilos de la Mona Lisa. De nuevo, realmente no puedo culpar el trabajo del modelo aquí. Puso la foto exacta que suministré en los estilos de la era del Renacimiento.
También hace un buen trabajo al mantener todas las características como auriculares, el fondo y la ropa que llevo, mientras mantiene el tema.
Intermediario
Sí, este fue el mejor de los cuatro intentos que me dio a MidJourney. Veo a dónde intentaba ir el modelo aquí. Simplemente no pudo hacerlo.
Incluso intenté alterar el aviso ligeramente para dejarlo en claro que lo quería al estilo de una pintura y eso empeoró las cosas. Supongo que el borde marrón también se supone que se ajusta al tema. Es difícil decirlo.
Ganador: chatgpt ha demostrado que este nuevo modelo prospera cuando se trata de poner un giro creativo en sus propias imágenes, y esto es más prueba de eso. Hizo exactamente lo que pedí. Parece que MidJourney llegó a mitad de camino y se rindió.
4. Carteles de películas
Inmediato: Cree un póster emocionante para esta película: una película cyberpunk ambientada en el año 2250. Está ambientada en una gran ciudad bulliciosa. La película trata sobre un detective retrocedido en el tiempo para evitar que ocurra una próxima guerra.
Chatgpt
No es el póster más emocionante de la historia, pero ChatGPT definitivamente clavó el informe aquí. Nuestro detective toma el centro del escenario, con una bulliciosa ciudad (y bastante futurista) ubicada en el fondo. Tomó el aviso bastante literalmente para el texto, agregando los datos solicitados con un eslogan.
En general, es impresionante. El detective se detalla con una sombra de neón en la espalda, hay un auto volador en el cielo y, aunque un poco crudamente dibujado, muchos rascacielos futuristas.
Intermediario
Lo que Midjourney carece de detalle aquí, lo compensa con estilo. Podría decirse que los rascacielos se ven mejor aquí, y hay mucho más que ver en esta imagen.
Lamentablemente, MidJourney se queda atrás con sus detalles borrosos. Las imágenes en el suelo se han transformado, el automóvil y la moto han fallado, y hay muchos detalles extraños en el fondo.
Si bien es más interesante, hay demasiado mal aquí.
Ganador: chatgpt Hice todo lo que pedí e hice un póster que pudiera poner en el mundo y nadie se pastería un párpado (aparte del título de película increíblemente aburrido).
MidJourney, por otro lado, solo tengo demasiadas cosas mal aquí. Sin embargo, me gusta la dirección en la que iba.
5. Generación de texto
Inmediato: Haga una imagen de un póster, en el póster dice: “El generador de imágenes de la banda ai – tocando aquí esta noche a las 8 p.m.
Chatgpt
Hay un poco de tema con la generación de imágenes de Chatgpt. El detalle a menudo triunfa sobre el estilo. Este póster hizo todo lo que pedí y, lo que es más importante, obtuvo todo el texto exactamente correcto.
Chatgpt, hace solo unos meses habría luchado con esto, por lo que es emocionante ver qué tan lejos ha llegado.
Si bien el póster es aburrido, ha alcanzado el breve y ha logrado un desafío difícil para los modelos de IA.
Intermediario
Aprecio que MidJourney hizo esto más un póster en un lugar, colocándolo en la pared afuera. También me gusta la energía que buscaba con la imagen de la banda en el medio.
Sin embargo, aparte de las palabras “la banda”, no es legible un solo bit del texto. En comparación con la capacidad de Chatgpt para obtener todo el texto en su totalidad, esto se siente como una decepción.
Ganador: chatgpt Puede que no haya sido increíblemente interesante aquí, pero completó la tarea perfectamente. Como mostró MidJourney, no siempre es fácil para los modelos de AI lidiar con el texto en las imágenes.
6. Manos
Inmediato: Haga una imagen de las manos de una persona, la izquierda sostiene una naranja y la otra sostiene un vaso de agua
Chatgpt
Ah, qué tan lejos ha llegado la IA. Cuando la generación de imágenes de IA surgió por primera vez, una de las formas más fáciles de identificarla era las manos. Tendrían dedos increíblemente largos, o dedos que sobresalen de los lugares equivocados.
Ahora, aunque las manos aquí no se ven completamente humanas, la precisión es realmente impresionante. Ambas manos tienen el número correcto de dedos (buen comienzo), el agua en el vidrio se transforma adecuadamente en la mano de la mano y puedes ver venas y uñas.
Intermediario
MidJourney hizo un trabajo fantástico aquí. Lo que creo que es especialmente impresionante sobre esta imagen es el detalle. Los brazos en el cabello, las venas, los moretones en los nudillos y las estrías en las manos.
Si bien la imagen de ChatGPT es reconocible al instante como AI, esto podría pasar por las manos de alguien. El único problema notable es que el dedo detrás del vidrio no se ve bien. También es una forma muy extraña de sostener una naranja, pero cada uno por su cuenta.
Ganador: Midjourney robó una victoria en posiblemente uno de los defectos más conocidos de la IA. Esto demuestra cuán lejos ha llegado. Esto no quiere decir que ChatGPT lo hizo mal, simplemente no coincidió.
7. Comida
Inmediato: Haga una foto de un tazón de pasta de mariscos que se usaría en un Instagram de comida
Chatgpt
Este es el tipo de imagen de comida que vería en un libro de cocina y no cuestionaría por un segundo. Aunque esto no existe, quiero comerlo. Realmente no puedo culpar al modelo AI aquí; Hizo todo lo que se le pidió, incluso si la hierba aleatoria en la parte inferior está muy fuera de lugar.
Intermediario
Al igual que ChatGPT, MidJourney hizo un excelente trabajo aquí. Esto parece un verdadero tazón de pasta que obtendrías en un buen restaurante. Incluso hay algunos tomates aleatorios y ajo dispersos, supongo que para la decoración.
Ganador: chatgpt Toma la victoria aquí gracias a una calidad de imagen cada vez más mejor, pero como las manos, esto estaba cerca.
Veredicto: Chatgpt gana
Lamentablemente para MidJourney, esto ni siquiera estaba cerca. Por supuesto, es importante tener en cuenta que MidJourney acaba de lanzar esta versión y todavía está en una etapa experimental. Sin embargo, esta última versión de GPT Image Generation es solo una semana o dos más antiguas.
Si bien los modelos se emparejaban de manera uniforme, ChatGPT se destacaba tan a menudo donde Midjourney no lo hizo.
Espero que MidJourney vea mejoras a través de las fases de prueba de la versión 7, ya que podría ser un gran generador de imágenes de IA.