Connect with us

Noticias

8 Of The Best Midjourney Alternatives To Create AI-Generated Images

Published

on






Midjourney is a popular tool for creating AI-generated images. If you’re familiar with it, you know that it works well, generating multiple images at once, allowing you to adjust aspect ratios, upscale, and refine results. However, it’s not without limitations.

Advertisement

The biggest drawback of Midjourney is that there’s no free option. It doesn’t offer a free trial either, so if you want to get started with Midjourney, you’ll need to pay out $10 before you can do anything. This $10 Basic Plan allows you around 200 prompt generations per month. If you want unlimited image generation, you’ll need to sign up for the pricier plans. Some advanced editing features are only accessible to yearly subscribers, which requires a sizeable upfront payment.

If you want to produce a lot of AI-generated images, then it’s likely that you’re going to need to commit to regular payments, whichever model you go for. Although most AI generation tools have free options, you’ll be limited to how many images you can produce and what features you can access. If you’re new to AI image generation and just want to dip your toe in the water, then a free tool might be all you need to play with some image generation prompts and find out what all the fuss is about.

Advertisement

Methodology

For this article, I tested eight different AI generation tools. I asked each one to produce an image using this prompt: “Photo-realistic image of a shiny silver robot wearing a felt beret, holding an easel and painting on a canvas in a light and airy artist’s studio.” The pictures produced by Midjourney were mostly pretty good, but it did struggle sometimes to depict a robot hand holding a paintbrush. Sometimes, the paintbrushes were the wrong way round, held in an unrealistic way, or missing altogether. This was something that many of the models also had problems with.

Advertisement

As well as assessing the quality of each image, I looked at how well each of them followed the prompt, which says the robot should be ‘holding an easel.’ None of the image generation tools took it literally. Instead, the robots were depicted standing by easels and sometimes holding a paint palette, demonstrating that, on the whole, AI will generate what makes more logical sense and what it thinks you want rather than what was precisely written in the prompt.

Where possible, I have used each service’s free plan. Although you would expect slower run times than with paid models, all the tools produced images in around 30 seconds or less. Midjourney only took a few seconds, but I was using its paid-for model since it doesn’t have a free version. I compared the quality of images generated by different AI tools, but your results will vary depending on the type of image you want and the prompt you provide. To make it as fair as possible, I’ve used the best example to illustrate each section.

Advertisement

DALL-E is best for conversation-based prompts

DALL-E is produced by OpenAI and is the visual partner to ChatGPT. The best thing about DALL-E is that you can have a conversation with it and follow previous prompts with simple instructions like “Please give the robot more humanoid features,” and it will remember your previous prompt. You can also edit your prompt by clicking the edit icon, updating the text, and resending.

Advertisement

Signing up for a free ChatGPT account gets you access to DALL-E along with other GPTs. However, this will only grant a limited number of image generations before you’re told you have reached your image creation limit for the day. Unlike other free accounts, it is not clear how many credits you have remaining. I was able to generate 12 images from six prompts before I was told to try again tomorrow. For better access, you can upgrade to a Plus account for $20 per month.

DALL-E will produce one or two images compared to the four generated by Midjourney. There’s no “regenerate” button like there is with ChatGPT text prompt answers, so if you want to create more images for the same prompt, you will need to copy and paste the prompt again. The pictures are generally very good. DALL-E provided plenty of detail and followed the prompt. Unfortunately, even with the paid version, there’s no upscale option to produce higher-res images like in Midjourney.

Advertisement

Copilot is best for beginners

Copilot image generation is easy to get started with. If you already have a Microsoft account — and if you’re a Windows user — then you don’t even need to sign up. It’s free to use and works like DALL-E, so you can give prompts to the chatbot and then follow up with any adjustments. There are no features or style presets with Copilot, but the quality of images is good. It understood the prompts and successfully managed to produce convincing-looking robot hands. It only produces one image at a time, so it can be quite slow if you want to create a lot of images. A big drawback is that it doesn’t do aspect ratios other than 1:1. Even when I asked for 16:9 and landscape in the prompt instructions, it still produced a square picture.

Advertisement

There is a paid version called Copilot Pro that costs $20 per month, but this doesn’t necessarily offer any advantages in terms of image generation except for quicker image generation. The main selling point of Copilot Pro is its ability to integrate AI into other Microsoft apps like Word, Excel, and Outlook. Copilot’s free version is a good choice for those with existing Microsoft logins who want to create an AI image without setting up an account with a third party or starting a free trial. If you’re new to AI images and just want a quick play, this is a good place to start.

Leonardo AI is best for comprehensive style settings

Leonardo AI offers an impressive array of styles and settings. There’s a free plan available that gives you 150 tokens per day. However, you may use these up quite quickly as generating a set of images uses 24 tokens. Some editing features, like removing the background, cost additional credits. Subscribing to one of the paid plans, which start at $12 per month, will ensure faster image generation and extra features like upscaling. It is easy to see what is available on the free plan and what you need an upgrade to use. A diamond icon marks the paid plan features on the dashboard.

Advertisement

Leonardo has many features, settings, and editing options, and you may want to invest some time exploring them all if you want to use Leonardo to its full potential. You can turn on the Prompt Enhancer feature to have Leonardo rewrite your prompt, which is intended to improve the quality of your results. I found that it contained a lot of unnecessarily specific information that didn’t reflect what I was looking for. For example, “felt beret” in the original was rewritten as “emerald green felt beret adorned with a delicate, golden brooch.” However, it does provide an interesting exercise in learning how to write more detailed prompts.

The images it produced were excellent, with fewer mistakes than some other AI generation tools. The first four images it produced all followed the prompt (apart from the ‘holding an easel’ bit, which everyone ignored) and were all usable results. This is important when you’re using the credit-based free model and don’t want to keep regenerating images until you get one with decent robot fingers.

Advertisement

Stability AI’s Stable Assistant is best for easy editing

Stable Assistant is a chat interface created by Stability AI to easily access its stable diffusion model. There’s no free version of Stable Assistant, although at the moment you can access a free 3-day trial. Plans start at $9 per month. Given that I was using a paid version of the product, the results were not particularly impressive compared to some of its free competitors. It took longer to generate images, often ignored aspects of the prompt, and struggled to produce realistic depictions of a hand holding a paintbrush. It also didn’t seem to know what a beret was.

Advertisement

The area where Stable Assistant shines is the ease with which you can edit images. “Inpaint” and “Search & Replace” offer different ways to replace part of the image with something else. You can also expand your image and remove the background, along with many other options, including basics like selecting ratios and uploading images into prompts. I found the editing options less reliable than their Midjourney equivalents. When I tried ‘Zoom out,’ the expanded image ignored the original prompt. It looked more like a surreal robot manufacturing plant than an artist’s studio. I do recommend its “Sketch to image” option, though, as a fun way to turn a scrappy doodle into a piece of AI art.

One odd omission in Stable Assistant is the lack of a download button. It’s not a big deal as you can right-click and select “Save image” to keep a copy of your artwork, but having to do so doesn’t really mesh with Stable Assistant’s otherwise user-friendly interface.

Advertisement

Canva Dream Lab is best for incorporating into other artwork

Canva is best known as a graphic design platform. Its AI image generation tool, Dream Lab, is worth considering, especially if you want to incorporate AI images into designs like posters, flyers, and social media prompts. Canva Free users can use Dream Lab for up to 20 prompts per month, but if you subscribe to Canva Pro for $13 per month, you can generate up to 500 prompts monthly. It works similarly to Midjourney in that each prompt is standalone — so you can’t just type in a follow-up suggestion like you can in conversational models like DALL-E, Gemini, and Copilot.

Advertisement

The tool is easy to use. It offers six different ratio options and creates four results in one go, which you can then finesse using Canva’s editing tools. This enables you to adjust brightness and contrast, add filters, and apply effects like autofocus and blur. However, many of the cleverer editing options like removing the background, replacing parts of an image with something else, or removing items from a picture, are only available with the paid plans.

It is an excellent tool for anyone familiar with Canva editing software, as you can incorporate AI images into your designs. Its pictures were well-executed, with the usual missteps, like one of the robots having its hand on backward and others not holding paintbrushes while painting. Its biggest drawback is that you cannot upload existing images for it to use as part of a prompt.

Advertisement

Google’s Gemini AI is best for existing Google One users

You can generate images using Gemini, Google’s AI assistant, in a similar way to DALL-E or Copilot. The images are created using Google’s Imagen 3 model in response to conversation-based prompts, and if you have an existing Google login, you don’t need to sign up again. There is another way to produce images using Imagen 3 which is through Google’s ImageFX product. This is still in the test phase and is available at The AI Test Kitchen.

Advertisement

Using Gemini is free, but you can upgrade to Gemini Advanced as part of a Google One subscription for $19.99 per month. The images produced in the free version were good, but a frustrating restriction is that Gemini will not create pictures of people unless you subscribe to Gemini Advanced. Like Copilot, it ignores any instruction to change the ratio to a wider format. There are no edit buttons, but you can create new prompts with further instructions or go back and edit your original prompt by clicking on the ‘edit’ icon, making changes, and selecting the ‘update’ button.

Signing up for Gemini Advanced is more expensive than other image generation models on this list, but it does give you access to all Google One features, including 2TB of data. If you already have a Google One account, it is probably worth checking out, but if all you’re after is image generation, it might be best to give this one a miss.

Advertisement

Kling is best for converting into videos

Kling AI is better known for its video creation capabilities than as a static image generator. Although we’re not focusing on video in this article, it’s worth mentioning that Kling gives you the option to turn your images into videos with just one button click, although if you are using the free version, this is painfully slow. In fact, the free version of Kling is a bit of a non-starter all around, as any images it produces come with a Kling watermark. The cheapest paid plan is $10 per month.

Advertisement

It does give you multiple ratio choices and the option to upload your own image or easily reuse one of your images as part of the next prompt. However, I found the quality of the image generation is unreliable. For the first four images I produced, only one was usable. The other three had issues with missing arms and physics-defying paintbrush holding. There is an option to enhance images and upscale them, but this is only for paid plans.

You can generate between one and nine images but the more images you create, the more credits are used. It costs 0.2 credits per image generated, so generating nine images requires 1.8 credits. The free plan doesn’t specify a set number of credits, but I got 360 credits for signing up. Even the paid plans give you a finite number of credits. For example, the cheapest paid plan gives you 660 credits per month, and the most expensive Premium plan at $92 gives you a monthly allowance of 8,000 credits.

Advertisement

Tengrai is best for connecting with AI on an emotional level

Tengrai was the least impressive image generator that I used. The one thing it has that sets it apart from the rest is a feature called EmotionFlow, a bunch of swirly graphics you can play with while you’re waiting and which, according to the website, will be used to “interpret and reflect” your emotional state. I tried interacting with EmotionFlow for one set of images, and Tengrai produced disappointing results that ignored half the prompt. It produced equally poor images when I didn’t interact, so I don’t think my emotions are to blame. Most of the robots in the images were hatless, and few managed to hold their paintbrushes convincingly.

Advertisement

Tengrai has a free plan, and its paid plans start at $12 per month, which allows you to create 36,000 images each month. Free accounts are limited to 32 images every eight hours. It offers twelve ratio options, and you can upload images alongside your prompt. Upscaling is only available on the paid model, and there are no editing options, like zoom out or background remover, even for pro plans. It does, however, offer a lot of options alongside the prompt, including different color tones and camera angles. In my tests, Tengrai completely ignored whatever was selected.

Tengrai’s paid option is not any cheaper than other AI generation models, and it offers fewer features and produces poorer results. Unless you’re a strong believer in its EmotionFlow “intuitive and empathic” abilities, there isn’t much to recommend this one.

Advertisement



Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Vista previa de Google I/O 2025: Gemini AI, Android XR y todo lo demás para esperar

Published

on

Cuando el CEO de Google, Sundar Pichai, suba al escenario en la Conferencia de desarrolladores de Google I/O 2025 la próxima semana para entregar sus comentarios de apertura, espere que dos cartas dominen la discusión: la IA.

La inteligencia artificial se ocupa de gran parte del enfoque en Google en estos días, con características de IA que llegan a través de múltiples productos, proyectos centrados en la IA que capturan gran parte de la atención y predicciones del público sobre el futuro de la IA que asume muchos de los pronunciamientos públicos de la compañía.

Continue Reading

Noticias

AI generativa: todo para saber sobre la tecnología detrás de chatbots como chatgpt

Published

on

Ya sea que se dé cuenta o no, la inteligencia artificial está en todas partes. Se encuentra detrás de los chatbots con los que hablas en línea, las listas de reproducción que transmites y los anuncios personalizados que aparecen en tu desplazamiento. Y ahora está tomando una personalidad más pública. Piense en Meta AI, que ahora está integrado en aplicaciones como Facebook, Messenger y WhatsApp; o Géminis de Google, trabajando en segundo plano en las plataformas de la compañía; o Apple Intelligence, lanzando a través de iPhones ahora.

AI tiene una larga historia, volviendo a una conferencia en Dartmouth en 1956 que primero discutió la inteligencia artificial como una cosa. Los hitos en el camino incluyen Eliza, esencialmente el primer chatbot, desarrollado en 1964 por el informático del MIT Joseph Weizenbaum y, saltando 40 años, cuando la función de autocompleta de Google apareció por primera vez en 2004.

Luego llegó 2022 y el ascenso de Chatgpt a la fama. Los desarrollos generativos de IA y los lanzamientos de productos se han acelerado rápidamente desde entonces, incluidos Google Bard (ahora Gemini), Microsoft Copilot, IBM Watsonx.ai y los modelos de LLAMA de código abierto de Meta.

Desglosemos qué es la IA generativa, cómo difiere de la inteligencia artificial “regular” y si la Generación AI puede estar a la altura de las expectativas.

IA generativa en pocas palabras

En esencia, la IA generativa se refiere a sistemas de inteligencia artificial que están diseñados para producir un nuevo contenido basado en patrones y datos que han aprendido. En lugar de solo analizar números o predecir tendencias, estos sistemas generan salidas creativas como texto, música de imágenes, videos y código de software.

Algunas de las herramientas de IA generativas más populares en el mercado incluyen:

El principal entre sus habilidades, ChatGPT puede crear conversaciones o ensayos similares a los humanos basados ​​en algunas indicaciones simples. Dall-E y MidJourney crean obras de arte detalladas a partir de una breve descripción, mientras que Adobe Firefly se centra en la edición y el diseño de imágenes.

Imagen generada por chatgpt de una ardilla con ojos grandes sosteniendo una bellota

Chatgpt / captura de pantalla por cnet

Ai eso no es generativo

No toda la IA es generativa. Si bien Gen AI se enfoca en crear contenido nuevo, la IA tradicional se destaca por analizar datos y hacer predicciones. Esto incluye tecnologías como el reconocimiento de imágenes y el texto predictivo. También se usa para soluciones novedosas en:

  • Ciencia
  • Diagnóstico médico
  • Pronóstico del tiempo
  • Detección de fraude
  • Análisis financiero para pronósticos e informes

La IA que venció a los grandes campeones humanos en el ajedrez y el juego de mesa no fue una IA generativa.

Es posible que estos sistemas no sean tan llamativos como la Generación AI, pero la inteligencia artificial clásica es una gran parte de la tecnología en la que confiamos todos los días.

¿Cómo funciona Gen AI?

Detrás de la magia de la IA generativa hay modelos de idiomas grandes y técnicas avanzadas de aprendizaje automático. Estos sistemas están capacitados en grandes cantidades de datos, como bibliotecas completas de libros, millones de imágenes, años de música grabada y datos raspados de Internet.

Los desarrolladores de IA, desde gigantes tecnológicos hasta nuevas empresas, son conscientes de que la IA es tan buena como los datos que lo alimenta. Si se alimenta de datos de baja calidad, la IA puede producir resultados sesgados. Es algo con lo que incluso los jugadores más grandes en el campo, como Google, no han sido inmunes.

La IA aprende patrones, relaciones y estructuras dentro de estos datos durante el entrenamiento. Luego, cuando se le solicita, aplica ese conocimiento para generar algo nuevo. Por ejemplo, si le pide a una herramienta Gen AI que escriba un poema sobre el océano, no solo extrae versos preescritos de una base de datos. En cambio, está usando lo que aprendió sobre la poesía, los océanos y la estructura del lenguaje para crear una pieza completamente original.

Un poema de 12 líneas llamado The Ocean's Whisper

Chatgpt / captura de pantalla por cnet

Es impresionante, pero no es perfecto. A veces los resultados pueden sentirse un poco apagados. Tal vez la IA malinterpreta su solicitud, o se vuelve demasiado creativo de una manera que no esperaba. Puede proporcionar con confianza información completamente falsa, y depende de usted verificarla. Esas peculiaridades, a menudo llamadas alucinaciones, son parte de lo que hace que la IA generativa sea fascinante y frustrante.

Las capacidades generativas de IA están creciendo. Ahora puede comprender múltiples tipos de datos combinando tecnologías como el aprendizaje automático, el procesamiento del lenguaje natural y la visión por computadora. El resultado se llama IA multimodal que puede integrar alguna combinación de texto, imágenes, video y habla dentro de un solo marco, ofreciendo respuestas más contextualmente relevantes y precisas. El modo de voz avanzado de ChatGPT es un ejemplo, al igual que el proyecto Astra de Google.

Desafíos con IA generativa

No hay escasez de herramientas de IA generativas, cada una con su talento único. Estas herramientas han provocado la creatividad, pero también han planteado muchas preguntas además del sesgo y las alucinaciones, como, ¿quién posee los derechos del contenido generado por IA? O qué material es un juego justo o fuera de los límites para que las compañías de IA los usen para capacitar a sus modelos de idiomas; vea, por ejemplo, la demanda del New York Times contra Openai y Microsoft.

Otras preocupaciones, no son asuntos pequeños, implican privacidad, responsabilidad en la IA, los profundos profundos generados por IA y el desplazamiento laboral.

“Escribir, animación, fotografía, ilustración, diseño gráfico: las herramientas de IA ahora pueden manejar todo eso con una facilidad sorprendente. Pero eso no significa que estos roles desaparezcan. Simplemente puede significar que los creativos deberán mejorar y usar estas herramientas para amplificar su propio trabajo”, Fang Liu, profesor de la Universidad de Notre Dame Dame y Coeditor-Chief de las transacciones de ACM en las transacciones de Probabilista, contó el aprendizaje en el poderoso de la máquina probabilística, le dijo a Cetnet.

“También ofrece una forma para las personas que tal vez carecen de la habilidad, como alguien con una visión clara que no puede dibujar, pero que puede describirlo a través de un aviso. Así que no, no creo que interrumpa a la industria creativa. Con suerte, será una co-creación o un aumento, no un reemplazo”.

Otro problema es el impacto en el medio ambiente porque la capacitación de grandes modelos de IA utiliza mucha energía, lo que lleva a grandes huellas de carbono. El rápido ascenso de la Generación AI en los últimos años ha acelerado las preocupaciones sobre los riesgos de la IA en general. Los gobiernos están aumentando las regulaciones de IA para garantizar el desarrollo responsable y ético, especialmente la Ley de IA de la Unión Europea.

Recepción de IA generativa

Muchas personas han interactuado con los chatbots en el servicio al cliente o han utilizado asistentes virtuales como Siri, Alexa y Google Assistant, que ahora están en la cúspide de convertirse en Gen AI Power Tools. Todo eso, junto con las aplicaciones para ChatGPT, Claude y otras herramientas nuevas, es poner ai en sus manos. Y la reacción pública a la IA generativa se ha mezclado. Muchos usuarios disfrutan de la conveniencia y la creatividad que ofrece, especialmente para cosas como escribir ayuda, creación de imágenes, soporte de tareas y productividad.

Mientras tanto, en la encuesta global de IA 2024 de McKinsey, el 65% de los encuestados dijo que sus organizaciones usan regularmente IA generativa, casi el doble de la cifra reportada solo 10 meses antes. Industrias como la atención médica y las finanzas están utilizando Gen AI para racionalizar las operaciones comerciales y automatizar tareas mundanas.

Como se mencionó, existen preocupaciones obvias sobre la ética, la transparencia, la pérdida de empleos y el potencial del mal uso de los datos personales. Esas son las principales críticas detrás de la resistencia a aceptar la IA generativa.

Y las personas que usan herramientas de IA generativas también encontrarán que los resultados aún no son lo suficientemente buenos para el tiempo. A pesar de los avances tecnológicos, la mayoría de las personas pueden reconocer si el contenido se ha creado utilizando Gen AI, ya sean artículos, imágenes o música.

AI ha secuestrado ciertas frases que siempre he usado, por lo que debo autocorrectar mi escritura a menudo porque puede parecer una IA. Muchos artículos escritos por AI contienen frases como “en la era de”, o todo es un “testimonio de” o un “tapiz de”. La IA carece de la emoción y la experiencia que viene, bueno, ser una vida humana y viviente. Como explicó un artista en Quora, “lo que AI hace no es lo mismo que el arte que evoluciona de un pensamiento en un cerebro humano” y “no se crea a partir de la pasión que se encuentra en un corazón humano”.

AI generativa: vida cotidiana

La IA generativa no es solo para técnicos o personas creativas. Una vez que obtienes la habilidad de darle indicaciones, tiene el potencial de hacer gran parte del trabajo preliminar por ti en una variedad de tareas diarias.

Digamos que está planeando un viaje. En lugar de desplazarse por páginas de resultados de búsqueda, le pide a un chatbot que planifique su itinerario. En cuestión de segundos, tiene un plan detallado adaptado a sus preferencias. (Ese es el ideal. Por favor, verifique siempre sus recomendaciones).

Un propietario de una pequeña empresa que necesita una campaña de marketing pero que no tiene un equipo de diseño puede usar una IA generativa para crear imágenes llamativas e incluso pedirle que sugiera copia publicitaria.

Un itinerario de viaje para Nueva Orleans, creado por chatgpt

Chatgpt / captura de pantalla por cnet

Gen Ai está aquí para quedarse

No ha habido un avance tecnológico que haya causado tal boom desde Internet y, más tarde, el iPhone. A pesar de sus desafíos, la IA generativa es innegablemente transformadora. Está haciendo que la creatividad sea más accesible, ayudando a las empresas a racionalizar los flujos de trabajo e incluso inspirar formas completamente nuevas de pensar y resolver problemas.

Pero quizás lo más emocionante es su potencial, y estamos rascando la superficie de lo que estas herramientas pueden hacer.

Preguntas frecuentes

¿Cuál es un ejemplo de IA generativa?

ChatGPT es probablemente el ejemplo más popular de IA generativa. Le das un aviso y puede generar texto e imágenes; Código de escritura; Responder preguntas; resumir el texto; borrador de correos electrónicos; y mucho más.

¿Cuál es la diferencia entre la IA y la IA generativa?

La IA generativa crea contenido nuevo como texto, imágenes o música, mientras que la IA tradicional analiza los datos, reconoce patrones o imágenes y hace predicciones (por ejemplo, en medicina, ciencia y finanzas).

Continue Reading

Noticias

Probé 5 sitios gratuitos de ‘chatgpt clon’ – no intentes esto en casa

Published

on

Si busca “CHATGPT” en su navegador, es probable que se tope en sitios web que parecen estar alimentados por OpenAI, pero no lo son. Uno de esos sitios, chat.chatbotapp.ai, ofrece acceso a “GPT-3.5” de forma gratuita y utiliza marca familiar.

Pero aquí está la cosa: no está dirigida por OpenAi. Y, francamente, ¿por qué usar un GPT-3.5 potencialmente falso cuando puedes usar GPT-4O de forma gratuita en el actual ¿Sitio de chatgpt?

Continue Reading

Trending