Noticias

¿Qué es la mitad del viaje? Todo lo que debe saber sobre el generador de imágenes de IA

Published

on

Midjourney es un bot de conversión de texto a imagen en Discord, la popular plataforma social para jugadores. A muchos diseñadores gráficos y artistas les encanta, pero también es útil para cualquiera que tenga curiosidad sobre el arte generado por IA, ya sea que esté pensando en conceptos para un proyecto, necesite ideas visuales rápidas o simplemente quiera jugar. Además, es divertido ver lo que se le ocurre a la herramienta de inteligencia artificial en función de la idea que tienes en mente.

Probablemente haya oído hablar o haya probado sus competidores, como Dall-E, Adobe Firefly, Stable Diffusion y Leonardo. Probamos Midjourney antes de su última actualización hace unos meses y puedes leer nuestra reseña aquí. Veredicto de CNET: “Aunque no siempre son del todo correctas, las imágenes de Midjourney son divertidas, detalladas y vívidas”.

También comparamos Midjourney con otras herramientas de generación de imágenes de IA que probamos en 2024. Si bien esta herramienta tiene muchas características excelentes, hay algunas cosas a considerar: está disponible solo en Discord, requiere una suscripción paga y, a veces, no se alinea bien con indicaciones.

Dicho esto, es una gran herramienta, especialmente para personas con gran imaginación pero sin muchos conocimientos prácticos. Según los 20,77 millones de miembros de Midjourney en agosto de 2024, ciertamente hay muchas personas que lo prueban.

Versiones de Midjorney

Desde refrigeradores parlantes hasta iPhones, nuestros expertos están aquí para ayudar a que el mundo sea un poco menos complicado.

Desde su lanzamiento en julio de 2022, Midjourney ha tenido varias actualizaciones de versión, incluida la 6.1, que es el modelo predeterminado actual. Cada nueva versión mejora la calidad de las imágenes generadas, agregando más detalles, mejor iluminación y más flexibilidad de estilo. La versión 6.1 parece haber solucionado finalmente el problema de las “manos y dedos extraños” que aparece con la mayoría de los generadores de imágenes de IA.

Una característica interesante de Midjourney es que puede cambiar a uno de sus modelos heredados (1, 2, 3, 4, 5, 5.0, 5.1, 5.2 o 6) usando el comando –version o –v parámetro para cambiar el modelo.

Captura de pantalla de Barbara Pazur/CNET

Las diferentes versiones generan diferentes estilos de imágenes. Después de la versión 5, Midjourney produce más imágenes fotográficas y de la vida real con mayor precisión de detalle y textura, mientras que las versiones anteriores son mejores para imágenes artísticas y estilizadas.

A mitad del viaje/Captura de pantalla de Barbara Pazur/CNET

A mitad del viaje Niji Modelo 6 Es tu momento de brillar si te gusta el anime. Fue desarrollado en colaboración con Spellbrush y ajustado específicamente para la estética del anime, tomas de acción y composiciones centradas en los personajes. Para activar este modo, simplemente agregue –niji 6 a su mensaje, o selecciónelo de la configuración usando el /ajustes comando.

Desde refrigeradores parlantes hasta iPhones, nuestros expertos están aquí para ayudar a que el mundo sea un poco menos complicado.

Cómo utilizar Midjourney: configuración

Midjourney no se ejecuta en una aplicación como otros generadores de imágenes de IA, por lo que primero deberás tener una cuenta en Discord. Luego deberás suscribirte a un plan Midjourney y unirte al servidor Midjourney en Discord. Después de eso, tendrás que unirte a un canal. Se recomiendan #General y #Novato si recién estás comenzando.

En cuanto a cómo ocurre la magia, como ocurre con cualquier otra herramienta de inteligencia artificial que existe, se trata de escribir el mejor mensaje. Describes la imagen que quieres ver y la IA se pone a trabajar.

Midjourney utiliza modelos de aprendizaje automático entrenados con una gran cantidad de datos para descubrir lo que estás pidiendo. Luego crea imágenes basadas en eso. Es importante tener en cuenta que todas las imágenes que cree pasan a ser de dominio público y son visibles para los usuarios en el servidor Midjourney a menos que se creen en modo oculto, pero hablaremos de eso más adelante.

Los resultados pueden ser salvajes, desde paisajes o rostros realistas hasta cosas más abstractas y artísticas.

A mitad del viaje/Captura de pantalla de Barbara Pazur/CNET

Cada acción que envías a un bot de Midjoruney se denomina “trabajo”. Esto incluye solicitudes de imágenes, ampliación y creación de variaciones de imágenes basadas en la entrada de un usuario después de /imagine.

Midjourney te da control sobre los resultados con dos características clave: U para exclusivo y V para variaciones. Después de crear un conjunto de imágenes, puedes elegir una y usar la opción “U” para mejorarla, como mejorar la resolución para hacerla más limpia y detallada.

Si no está totalmente satisfecho con los resultados pero le gusta su dirección, puede presionar “V” para Variaciones. Esto hace que la herramienta cree nuevas imágenes basadas en las seleccionadas, manteniendo el estilo o la vibra pero cambiando algunos detalles. Es una excelente manera de modificar su producción sin comenzar desde cero porque puede resultar molesto.

Estas opciones le brindan flexibilidad y le permiten ajustar las imágenes a su gusto. Otras opciones para mejorar o modificar su imagen incluyen reglas y métodos de solicitud específicos para obtener resultados óptimos. Algunos de estos parámetros son –no, –shorten, –remix, –remaster y –stop. Puede parecer demasiado complicado al principio, pero es fácil dominarlo después de un poco de prueba y error.

Impulsando la mitad del viaje

La recomendación general para indicaciones básicas es mantener las indicaciones breves y concisas con instrucciones simples en lugar de descriptivas.

Por ejemplo, no dé instrucciones con algo como: “Crea una imagen de una acogedora cabaña en las montañas rodeada de pinos, con nieve cayendo suavemente y humo saliendo de la chimenea. Haz que se sienta cálido y tranquilo”. En su lugar, escriba: “Acogedora cabaña de montaña con nieve, pinos y un ambiente cálido y tranquilo”.

Indicaciones avanzadaspor otro lado, puede incluir una o más URL de imágenes, varias frases de texto y uno o más parámetros. Los parámetros ajustan cómo se genera una imagen modificando cosas como relaciones de aspecto, modelos y escaladores. Van al final del mensaje.

A mitad del viaje/Captura de pantalla de Barbara Pazur/CNET

Precios a mitad de viaje

A diferencia de algunos generadores de imágenes de IA de generación gratuita, al menos para pruebas de modelos o capacidad parcial, necesitará una suscripción para acceder a Midjourney. Aquí hay un desglose rápido de los precios actuales:

  • Plan Básico: $10 por mes (incluye 3,3 horas de tiempo rápido de GPU).
  • Plan estándar: $30 por mes (incluye 15 horas de GPU rápida, modo Relajado ilimitado).
  • Plan profesional: $60 por mes (incluye 30 horas de GPU rápida, modo Relajado ilimitado y modo Sigiloso).
  • Mega Plan: $120 por mes (incluye 60 horas de GPU rápida, modo relajado ilimitado y modo sigiloso).

Los planes anuales también están disponibles con un 20 % de descuento en todos los niveles.

Pero aquí es donde las cosas se vuelven más complejas: si una empresa genera más de $1 millón en ingresos brutos por año, deberá optar por el plan Pro o Mega para acceder a todos los derechos de uso comercial de Midjourney.

Midjourney también tiene otras opciones de pago extrañas, como aceptar solo métodos de pago compatibles con Stripe.

Funciones, modos y más

Midjourney se basa en potentes unidades de procesamiento de gráficos para procesar y crear imágenes según sus indicaciones. Cuando te suscribes a Midjourney, básicamente estás pagando por el acceso a estas GPU para generar tus imágenes.

Elegir uno de estos modos para gestionar la rapidez con la que se generan las imágenes dependerá de tu nivel de paciencia:

  • Modo rápido: Las imágenes se generan rápidamente, pero consumen las horas de GPU asignadas.
  • Modo Relajarse: Genera imágenes más lentamente pero no utiliza el tiempo de su GPU, ofreciendo generación ilimitada.
  • Modo turbo: La opción más rápida, pero consume el doble de tiempo de GPU que el modo rápido.
  • Modo sigiloso: una característica adicional disponible en los planes Pro y Mega de Midjourney. Te permite generar imágenes de forma privada, lo que significa que tus creaciones no serán visibles para otros usuarios en la galería pública.

Vale la pena mencionar que los suscriptores pueden incluso ganar una hora de GPU rápida gratuita diariamente al clasificar imágenes. Los 2000 mejores participantes cada día reciben una hora rápida adicional como recompensa.

Referencias de estilo

En enero de 2024, se lanzó Midjourney Referencia de estilo (–sref). Esta función te permite tomar el estilo visual de cualquier imagen y aplicarlo a tus propias creaciones. Cada estilo tiene un código único, que puede reutilizar para obtener resultados consistentes.

Si te sientes aventurero, puedes usar el comando aleatorio –sref y Midjourney elegirá un estilo aleatorio entre miles de millones de posibilidades.

Incluso hay sitios web dedicados con miles de códigos SERF que puedes utilizar. Como el mensaje /imagine: Surreal Neon Dreamscapes –sref 698401885

A medida que crezca el arte generado por IA, plataformas como esta serán aún más útiles para artistas, diseñadores y cualquiera que busque superar los límites de la creatividad. Pero todavía les queda un largo camino por recorrer antes de reemplazar a los artistas reales.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version