Connect with us

Noticias

8 Of The Best Midjourney Alternatives To Create AI-Generated Images

Published

on






Midjourney is a popular tool for creating AI-generated images. If you’re familiar with it, you know that it works well, generating multiple images at once, allowing you to adjust aspect ratios, upscale, and refine results. However, it’s not without limitations.

Advertisement

The biggest drawback of Midjourney is that there’s no free option. It doesn’t offer a free trial either, so if you want to get started with Midjourney, you’ll need to pay out $10 before you can do anything. This $10 Basic Plan allows you around 200 prompt generations per month. If you want unlimited image generation, you’ll need to sign up for the pricier plans. Some advanced editing features are only accessible to yearly subscribers, which requires a sizeable upfront payment.

If you want to produce a lot of AI-generated images, then it’s likely that you’re going to need to commit to regular payments, whichever model you go for. Although most AI generation tools have free options, you’ll be limited to how many images you can produce and what features you can access. If you’re new to AI image generation and just want to dip your toe in the water, then a free tool might be all you need to play with some image generation prompts and find out what all the fuss is about.

Advertisement

Methodology

For this article, I tested eight different AI generation tools. I asked each one to produce an image using this prompt: “Photo-realistic image of a shiny silver robot wearing a felt beret, holding an easel and painting on a canvas in a light and airy artist’s studio.” The pictures produced by Midjourney were mostly pretty good, but it did struggle sometimes to depict a robot hand holding a paintbrush. Sometimes, the paintbrushes were the wrong way round, held in an unrealistic way, or missing altogether. This was something that many of the models also had problems with.

Advertisement

As well as assessing the quality of each image, I looked at how well each of them followed the prompt, which says the robot should be ‘holding an easel.’ None of the image generation tools took it literally. Instead, the robots were depicted standing by easels and sometimes holding a paint palette, demonstrating that, on the whole, AI will generate what makes more logical sense and what it thinks you want rather than what was precisely written in the prompt.

Where possible, I have used each service’s free plan. Although you would expect slower run times than with paid models, all the tools produced images in around 30 seconds or less. Midjourney only took a few seconds, but I was using its paid-for model since it doesn’t have a free version. I compared the quality of images generated by different AI tools, but your results will vary depending on the type of image you want and the prompt you provide. To make it as fair as possible, I’ve used the best example to illustrate each section.

Advertisement

DALL-E is best for conversation-based prompts

DALL-E is produced by OpenAI and is the visual partner to ChatGPT. The best thing about DALL-E is that you can have a conversation with it and follow previous prompts with simple instructions like “Please give the robot more humanoid features,” and it will remember your previous prompt. You can also edit your prompt by clicking the edit icon, updating the text, and resending.

Advertisement

Signing up for a free ChatGPT account gets you access to DALL-E along with other GPTs. However, this will only grant a limited number of image generations before you’re told you have reached your image creation limit for the day. Unlike other free accounts, it is not clear how many credits you have remaining. I was able to generate 12 images from six prompts before I was told to try again tomorrow. For better access, you can upgrade to a Plus account for $20 per month.

DALL-E will produce one or two images compared to the four generated by Midjourney. There’s no “regenerate” button like there is with ChatGPT text prompt answers, so if you want to create more images for the same prompt, you will need to copy and paste the prompt again. The pictures are generally very good. DALL-E provided plenty of detail and followed the prompt. Unfortunately, even with the paid version, there’s no upscale option to produce higher-res images like in Midjourney.

Advertisement

Copilot is best for beginners

Copilot image generation is easy to get started with. If you already have a Microsoft account — and if you’re a Windows user — then you don’t even need to sign up. It’s free to use and works like DALL-E, so you can give prompts to the chatbot and then follow up with any adjustments. There are no features or style presets with Copilot, but the quality of images is good. It understood the prompts and successfully managed to produce convincing-looking robot hands. It only produces one image at a time, so it can be quite slow if you want to create a lot of images. A big drawback is that it doesn’t do aspect ratios other than 1:1. Even when I asked for 16:9 and landscape in the prompt instructions, it still produced a square picture.

Advertisement

There is a paid version called Copilot Pro that costs $20 per month, but this doesn’t necessarily offer any advantages in terms of image generation except for quicker image generation. The main selling point of Copilot Pro is its ability to integrate AI into other Microsoft apps like Word, Excel, and Outlook. Copilot’s free version is a good choice for those with existing Microsoft logins who want to create an AI image without setting up an account with a third party or starting a free trial. If you’re new to AI images and just want a quick play, this is a good place to start.

Leonardo AI is best for comprehensive style settings

Leonardo AI offers an impressive array of styles and settings. There’s a free plan available that gives you 150 tokens per day. However, you may use these up quite quickly as generating a set of images uses 24 tokens. Some editing features, like removing the background, cost additional credits. Subscribing to one of the paid plans, which start at $12 per month, will ensure faster image generation and extra features like upscaling. It is easy to see what is available on the free plan and what you need an upgrade to use. A diamond icon marks the paid plan features on the dashboard.

Advertisement

Leonardo has many features, settings, and editing options, and you may want to invest some time exploring them all if you want to use Leonardo to its full potential. You can turn on the Prompt Enhancer feature to have Leonardo rewrite your prompt, which is intended to improve the quality of your results. I found that it contained a lot of unnecessarily specific information that didn’t reflect what I was looking for. For example, “felt beret” in the original was rewritten as “emerald green felt beret adorned with a delicate, golden brooch.” However, it does provide an interesting exercise in learning how to write more detailed prompts.

The images it produced were excellent, with fewer mistakes than some other AI generation tools. The first four images it produced all followed the prompt (apart from the ‘holding an easel’ bit, which everyone ignored) and were all usable results. This is important when you’re using the credit-based free model and don’t want to keep regenerating images until you get one with decent robot fingers.

Advertisement

Stability AI’s Stable Assistant is best for easy editing

Stable Assistant is a chat interface created by Stability AI to easily access its stable diffusion model. There’s no free version of Stable Assistant, although at the moment you can access a free 3-day trial. Plans start at $9 per month. Given that I was using a paid version of the product, the results were not particularly impressive compared to some of its free competitors. It took longer to generate images, often ignored aspects of the prompt, and struggled to produce realistic depictions of a hand holding a paintbrush. It also didn’t seem to know what a beret was.

Advertisement

The area where Stable Assistant shines is the ease with which you can edit images. “Inpaint” and “Search & Replace” offer different ways to replace part of the image with something else. You can also expand your image and remove the background, along with many other options, including basics like selecting ratios and uploading images into prompts. I found the editing options less reliable than their Midjourney equivalents. When I tried ‘Zoom out,’ the expanded image ignored the original prompt. It looked more like a surreal robot manufacturing plant than an artist’s studio. I do recommend its “Sketch to image” option, though, as a fun way to turn a scrappy doodle into a piece of AI art.

One odd omission in Stable Assistant is the lack of a download button. It’s not a big deal as you can right-click and select “Save image” to keep a copy of your artwork, but having to do so doesn’t really mesh with Stable Assistant’s otherwise user-friendly interface.

Advertisement

Canva Dream Lab is best for incorporating into other artwork

Canva is best known as a graphic design platform. Its AI image generation tool, Dream Lab, is worth considering, especially if you want to incorporate AI images into designs like posters, flyers, and social media prompts. Canva Free users can use Dream Lab for up to 20 prompts per month, but if you subscribe to Canva Pro for $13 per month, you can generate up to 500 prompts monthly. It works similarly to Midjourney in that each prompt is standalone — so you can’t just type in a follow-up suggestion like you can in conversational models like DALL-E, Gemini, and Copilot.

Advertisement

The tool is easy to use. It offers six different ratio options and creates four results in one go, which you can then finesse using Canva’s editing tools. This enables you to adjust brightness and contrast, add filters, and apply effects like autofocus and blur. However, many of the cleverer editing options like removing the background, replacing parts of an image with something else, or removing items from a picture, are only available with the paid plans.

It is an excellent tool for anyone familiar with Canva editing software, as you can incorporate AI images into your designs. Its pictures were well-executed, with the usual missteps, like one of the robots having its hand on backward and others not holding paintbrushes while painting. Its biggest drawback is that you cannot upload existing images for it to use as part of a prompt.

Advertisement

Google’s Gemini AI is best for existing Google One users

You can generate images using Gemini, Google’s AI assistant, in a similar way to DALL-E or Copilot. The images are created using Google’s Imagen 3 model in response to conversation-based prompts, and if you have an existing Google login, you don’t need to sign up again. There is another way to produce images using Imagen 3 which is through Google’s ImageFX product. This is still in the test phase and is available at The AI Test Kitchen.

Advertisement

Using Gemini is free, but you can upgrade to Gemini Advanced as part of a Google One subscription for $19.99 per month. The images produced in the free version were good, but a frustrating restriction is that Gemini will not create pictures of people unless you subscribe to Gemini Advanced. Like Copilot, it ignores any instruction to change the ratio to a wider format. There are no edit buttons, but you can create new prompts with further instructions or go back and edit your original prompt by clicking on the ‘edit’ icon, making changes, and selecting the ‘update’ button.

Signing up for Gemini Advanced is more expensive than other image generation models on this list, but it does give you access to all Google One features, including 2TB of data. If you already have a Google One account, it is probably worth checking out, but if all you’re after is image generation, it might be best to give this one a miss.

Advertisement

Kling is best for converting into videos

Kling AI is better known for its video creation capabilities than as a static image generator. Although we’re not focusing on video in this article, it’s worth mentioning that Kling gives you the option to turn your images into videos with just one button click, although if you are using the free version, this is painfully slow. In fact, the free version of Kling is a bit of a non-starter all around, as any images it produces come with a Kling watermark. The cheapest paid plan is $10 per month.

Advertisement

It does give you multiple ratio choices and the option to upload your own image or easily reuse one of your images as part of the next prompt. However, I found the quality of the image generation is unreliable. For the first four images I produced, only one was usable. The other three had issues with missing arms and physics-defying paintbrush holding. There is an option to enhance images and upscale them, but this is only for paid plans.

You can generate between one and nine images but the more images you create, the more credits are used. It costs 0.2 credits per image generated, so generating nine images requires 1.8 credits. The free plan doesn’t specify a set number of credits, but I got 360 credits for signing up. Even the paid plans give you a finite number of credits. For example, the cheapest paid plan gives you 660 credits per month, and the most expensive Premium plan at $92 gives you a monthly allowance of 8,000 credits.

Advertisement

Tengrai is best for connecting with AI on an emotional level

Tengrai was the least impressive image generator that I used. The one thing it has that sets it apart from the rest is a feature called EmotionFlow, a bunch of swirly graphics you can play with while you’re waiting and which, according to the website, will be used to “interpret and reflect” your emotional state. I tried interacting with EmotionFlow for one set of images, and Tengrai produced disappointing results that ignored half the prompt. It produced equally poor images when I didn’t interact, so I don’t think my emotions are to blame. Most of the robots in the images were hatless, and few managed to hold their paintbrushes convincingly.

Advertisement

Tengrai has a free plan, and its paid plans start at $12 per month, which allows you to create 36,000 images each month. Free accounts are limited to 32 images every eight hours. It offers twelve ratio options, and you can upload images alongside your prompt. Upscaling is only available on the paid model, and there are no editing options, like zoom out or background remover, even for pro plans. It does, however, offer a lot of options alongside the prompt, including different color tones and camera angles. In my tests, Tengrai completely ignored whatever was selected.

Tengrai’s paid option is not any cheaper than other AI generation models, and it offers fewer features and produces poorer results. Unless you’re a strong believer in its EmotionFlow “intuitive and empathic” abilities, there isn’t much to recommend this one.

Advertisement



Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Google cita a OpenAI, Perplexity y Microsoft sobre herramientas de IA de generación

Published

on

Para la fase de remedios en el juicio antimonopolio de búsqueda de Google, el gigante ha citado a tres de sus mayores rivales: OpenAI, Perplexity AI y Microsoft.

Las citaciones, enviadas en octubre, se hicieron públicas el lunes a través de presentaciones legales de las cuatro empresas. Las revelaciones se produjeron pocas horas después de que el juicio antimonopolio sobre tecnología publicitaria de Google concluyera los argumentos finales de los abogados que representan a Google y el Departamento de Justicia.

Cuando se les pidió comentarios, Google y Microsoft no respondieron de inmediato a Digiday y los portavoces de OpenAI y Perplexity declinaron hacer comentarios. (Las tres empresas también se enfrentan a una serie de otras demandas relacionadas con cuestiones como la infracción de derechos de autor de la IA).

Los nuevos documentos legales también arrojan luz sobre lo que Google espera descubrir y por qué está reuniendo argumentos de sus rivales para convencer al tribunal de que su monopolio de búsqueda no incluye el sector emergente de búsqueda impulsada por IA. Muchos de los materiales que Google solicita se relacionan con los esfuerzos de sus rivales en materia de búsqueda y publicidad.

Aquí hay un breve resumen con algunos ejemplos de lo que las citaciones de Google le piden a cada empresa que proporcione:

  • Abierta AI: Datos de uso de ChatGPT, acuerdos de distribución con terceros, acuerdos con Microsoft relacionados con Bing Search API, cualquier acuerdo con Perplexity y tipos de datos utilizados para entrenar modelos de IA. Google también solicita acuerdos de licencia de contenido y actas de la junta directiva relacionadas con los planes de OpenAI para la distribución de búsquedas y cualquier estrategia publicitaria.
  • Perplejidad: Descargue totales, datos de usuarios activos, desempeño financiero, acuerdos de licencia de contenido, información sobre datos de entrenamiento del modelo de IA e información sobre la estrategia de monetización de Perplexity, incluidas presentaciones de anunciantes y planes para integrar anuncios en torno a las consultas de los usuarios. Google también solicita cualquier comunicación entre Perplexity y los demandantes en el caso (el Departamento de Justicia y el fiscal general de Colorado) y documentos sobre la visión de Perplexity sobre el panorama de búsqueda competitivo. Google también solicitó acuerdos y comunicaciones relacionados con acuerdos de distribución, incluidos contratos de marketing, preinstalaciones, sindicación y negociación.
  • Microsoft: Acuerdos entre Microsoft y otras empresas como OpenAI y Perplexity, documentos sobre los tipos y cantidades de datos utilizados para ayudar a entrenar los modelos de OpenAI y documentos relacionados con el uso de herramientas de IA generativa para impulsar los resultados de búsqueda y los servicios publicitarios. Google también solicitó información sobre acuerdos de licencia de contenido, incluidas “ofertas de contenido exclusivo”, y materiales sobre las formas en que Microsoft proporciona resultados de búsqueda a herramientas de inteligencia artificial de terceros y herramientas de búsqueda como ChatGPT y ChatGPT Search. “Si las nuevas herramientas y tecnologías de inteligencia artificial han proporcionado a Bing un modo novedoso de distribución -y todo indica que así es- Google tiene derecho a presentar esa evidencia”, escribió Google.

Las empresas citadas difieren en sus respuestas legales a las solicitudes. Después de afirmar inicialmente que Perplexity nunca recibió una citación, los abogados de esa compañía dijeron que ahora planean enviar objeciones el próximo mes y comenzar a producir documentos a principios de enero. OpenAI aceptó algunas de las solicitudes, incluidos acuerdos para Bing Search API, uso de ChatGPT y actas de la junta. Sin embargo, los abogados objetaron otras solicitudes, como el desempeño financiero y los datos de capacitación, por ser “extremadamente onerosas” debido a “secretos comerciales fundamentales e información confidencial”. Los abogados de Microsoft dijeron que la compañía proporcionará documentos para todas menos cuatro de las 41 solicitudes, con objeciones relacionadas con acuerdos confidenciales con OpenAI, Perplexity, Inflection y la empresa de inteligencia artificial G42, con sede en los Emiratos Árabes Unidos.

“Microsoft acordó realizar una búsqueda razonable y producir documentos con respecto a cinco de las seis solicitudes identificadas en la Declaración de Google”, escribieron los abogados de Microsoft. “Cuando Microsoft ha indicado que no producirá documentos, lo ha hecho basándose en objeciones de buena fe a la relevancia, la carga y la falta de proporcionalidad. Por mucho que Google quiera incluir a Microsoft como parte de esta Acción, no lo es”.

Incluso si Google se ve obligado a vender Chrome, podrían pasar meses o años de lucha legal antes de que eso suceda. El prolongado proceso podría darle tiempo a Google para crear un nuevo usuario para su última aplicación independiente para Gemini, que compite directamente con empresas como ChatGPT y Perplexity. Sin embargo, algunos ejecutivos de tecnología publicitaria creen que las nuevas empresas deberían tener la oportunidad de competir en la era de la búsqueda de inteligencia artificial.

“Si [Google] es capaz de aferrarse a este estrangulamiento de distribución que tienen sobre la búsqueda, eso les dará tiempo para continuar mejorando Gemini y, con suerte, al menos desde [Google’s] perspectiva: sacar a otros competidores del negocio”, dijo Adam Epstein, director ejecutivo de AdMarketplace.

Podrían pasar años hasta que nuevas empresas como Perplexity y OpenAI ganen participación de mercado, dijo Evelyn Mitchell-Wolf, analista senior de eMarketer. También señaló que a plataformas como Perplexity les tomará un tiempo escalar su negocio publicitario. Por ahora, cree que será demasiado difícil destronar a Google mientras la búsqueda tradicional sea omnipresente y demasiado sencilla. Sin embargo, cree que Google tendría un “escenario de pesadilla” si se viera obligado a vender Chrome.

“Si hablamos de dinámica de mercado y anuncios de búsqueda, no espero que Perplexity gane una escala significativa en el corto plazo, ya que los anunciantes tardarán tiempo en ver resultados”, dijo Mitchell-Wolf. “Tener más opciones para buscar es bueno para los consumidores, pero todavía estamos en un período en el que los efectos subyacentes de la IA en el comportamiento del consumidor aún están por verse porque todavía estamos en el gran impulso de estos importantes actores de la IA”.

La propuesta del Departamento de Justicia para que Google venda Chrome se produjo apenas una semana antes de los argumentos finales en el juicio antimonopolio de la tecnología publicitaria, que tuvo lugar el lunes en un tribunal federal antes de un fallo en los próximos meses.

Si bien la prueba de búsqueda de Google y la prueba de tecnología publicitaria son independientes, sus resultados potenciales siguen siendo objeto de conjeturas en lugar de visiones claras. Sin embargo, los expertos han dicho que el motor de búsqueda dominante de Google ha proporcionado un volante para gran parte de los datos utilizados para la orientación de los anuncios, mientras que su enorme base de usuarios ofrece a los anunciantes una manera de llegar a un gran número de clientes potenciales.

Algunos piensan que la industria está prestando más atención al juicio sobre remedios de búsqueda programado para marzo. Entre los expertos que siguieron ambos juicios se encuentra Ari Paparo, ejecutivo de tecnología publicitaria desde hace mucho tiempo y cofundador de Marketetecture Media, quien dijo que la propuesta del Departamento de Justicia para Chrome iba “mucho más allá de la línea roja en cosas y [Google] No querré que eso suceda”.

“Le he preguntado a varios abogados y ninguno entiende cuál es la fase de reparación de este caso. [ad-tech] cómo será el juicio”, dijo Paparo. “¿Va a ser una audiencia separada? ¿Va a ser una solicitud de documentos? ¿O simplemente se van a largar y escribir un remedio? Nadie sabe cuál será el remedio”.

Continue Reading

Noticias

La herramienta Sora de OpenAI filtrada por un grupo de primeros evaluadores agraviados

Published

on

La fuga de Sora de OpenAI: las implicaciones de la tecnología, la ética y la promoción

Se ha estado gestando una tormenta en el panorama de la IA luego de la filtración no autorizada del innovador modelo Sora de OpenAI, un generador de texto a video que ha estado causando sensación por su capacidad para crear videos cortos y de alta fidelidad con una estabilidad temporal notable. En el centro de la controversia hay un conflicto multifacético que involucra avances tecnológicos, preocupaciones éticas y defensa artística. La filtración se publicó en Hugging Face y supuestamente fue realizada por personas involucradas en la fase de prueba (usando el nombre de usuario “PR-Puppets”) y plantea preguntas apremiantes sobre la relación entre innovación, trabajo y responsabilidad corporativa. El modelo filtrado, publicado junto con una carta abierta dirigida a los “Señores Supremos de la IA Corporativa”, supuestamente puede producir videoclips de 10 segundos con una resolución de hasta 1080p.

¿Qué es Sora?

Sora representa un salto significativo en las capacidades de IA generativa, funcionando como un modelo de difusión para transformar indicaciones de texto en videos de hasta un minuto. Aprovechando técnicas de varios modelos, Sora ofrece una alineación precisa del texto al visual y una coherencia temporal mejorada. La visión de OpenAI para Sora es ambiciosa y la posiciona como un paso fundamental hacia el logro de la Inteligencia General Artificial (AGI). A pesar de estas aspiraciones, la tecnología no está exenta de limitaciones; Los desafíos para replicar la física compleja y garantizar la seguridad del contenido siguen siendo áreas de mejora.

Como se describe en la plataforma de discusión Hugging Face, Sora es “una muestra fascinante de destreza técnica”. La capacidad del modelo para producir “narrativas visualmente coherentes” en forma de vídeo ha sido elogiada como un logro histórico en la IA generativa.

La filtración y sus supuestas motivaciones

La filtración del modelo de Sora parece deberse a la insatisfacción entre los evaluadores y contribuyentes, particularmente aquellos en las industrias creativas. Los críticos alegan que OpenAI (actualmente valorada en más de 150 mil millones de dólares) explotó su trabajo al depender de contribuciones no remuneradas o mal compensadas para perfeccionar el modelo. Estos evaluadores, incluidos artistas visuales y cineastas, brindaron valiosos comentarios y aportes creativos, solo para supuestamente verse excluidos del reconocimiento o compensación equitativa.

“No se trataba sólo de trabajo no remunerado: se trataba de respeto”, señaló un colaborador anónimo citado en el comentario de Hugging Face. “OpenAI trató nuestros aportes como materia prima, no como experiencia creativa. No es colaboración; es extracción”.

Este acto de rebelión sirve como protesta contra la mercantilización más amplia de la experiencia creativa en el desarrollo de la IA. La filtración se enmarcó estratégicamente para resaltar el supuesto desprecio de OpenAI por el valor económico del trabajo artístico, haciéndose eco de sentimientos de descontento que ya prevalecen en el discurso ético de la IA.

El grupo declaró que, después de tres horas, “OpenAI cerró temporalmente el acceso temprano de Sora para todos los artistas”.

Complicaciones éticas y legales

La controversia de Sora también reaviva los debates sobre derechos de autor y propiedad intelectual. OpenAI se ha enfrentado anteriormente a un escrutinio por su uso de material protegido por derechos de autor con fines de formación, alegando el uso legítimo como defensa. Aunque OpenAI ha declarado que los datos de entrenamiento de Sora incluyen conjuntos de datos públicos y con licencia, la compañía se ha mostrado reticente a dar detalles específicos, dejando espacio para el escepticismo. Esta opacidad, combinada con demandas en curso de creadores y editores, subraya las tensiones entre el avance tecnológico y los derechos de propiedad intelectual.

Las preocupaciones de seguridad con respecto a los modelos de IA generativa como Sora han llevado a OpenAI a implementar salvaguardas, incluidos clasificadores de detección y mecanismos de aplicación de políticas de contenido. Sin embargo, es posible que tales medidas no sean suficientes para abordar el posible uso indebido del modelo filtrado. Los comentaristas de Hugging Face señalaron que “una filtración de esta magnitud socava los esfuerzos de OpenAI para hacer cumplir las salvaguardias éticas. Pone el poder sin control en manos de cualquiera que tenga acceso”.

Implicaciones más amplias para la IA y las industrias creativas

La filtración de Sora es emblemática de una lucha de poder más amplia en la era de la IA. Por un lado, OpenAI se posiciona como pionero en la intersección de innovación y utilidad, y Sora representa una herramienta para democratizar la creación de videos. Por otro lado, la filtración ha puesto de relieve cuestiones sistémicas, como la infravaloración del trabajo creativo y los dilemas éticos que rodean la dependencia de la IA de la creatividad humana.

Como afirmó otro colaborador de Hugging Face: “La IA no existe en el vacío. Se construye sobre los hombros de creativos que a menudo no quedan acreditados. La filtración de Sora es una llamada de atención: la innovación sin ética es explotación”.

Para los profesionales creativos, la filtración es un arma de doble filo. Si bien saca a la luz las desigualdades del sistema actual, también corre el riesgo de socavar la confianza en las colaboraciones entre artistas y desarrolladores de tecnología. En el futuro, el incidente exige repensar la forma en que las corporaciones se relacionan con las comunidades creativas, enfatizando la transparencia, la compensación justa y el respeto por la propiedad intelectual.

Un ajuste de cuentas para la IA

Las consecuencias de la filtración de Sora ofrecen lecciones críticas para el futuro de la IA generativa. A medida que la tecnología continúa desdibujando los límites entre la creatividad y la computación, la necesidad de marcos éticos se vuelve cada vez más apremiante. El manejo de la situación por parte de OpenAI probablemente sentará un precedente sobre cómo las organizaciones navegan por la compleja interacción de innovación, ética y promoción.

En última instancia, la controversia de Sora es un microcosmos de los desafíos más amplios que enfrenta la industria de la IA: cómo equilibrar la búsqueda del progreso con el imperativo de honrar y proteger el trabajo humano que lo sustenta. Como concluyó sucintamente un observador en Hugging Face: “Esto es más que una filtración; es un ajuste de cuentas”.

Continue Reading

Noticias

Cómo GenAI cambió el trabajo tecnológico

Published

on

Hace dos años, el 30 de noviembre, ChatGPT irrumpió en escena, generando una fascinación global por la IA generativa y transformándola en una innovación que deben observar tanto los consumidores como los profesionales de la tecnología. Desde entonces, ChatGPT se ha expandido y las ruedas de la regulación de la IA han comenzado a girar.

TechRepublic preguntó a los profesionales de la tecnología cómo ha evolucionado su trabajo con ChatGPT, tanto personalmente como dentro de la industria tecnológica en general.

Nuevas funciones introducidas en 2024

Durante el último año, OpenAI ha:

  • Se amplió ChatGPT a nuevos formatos como la búsqueda de ChatGPT y Canvas, el último de los cuales está diseñado, en parte, para ubicarse junto a una aplicación de codificación.
  • Presentados GPT-4o y OpenAI o1, nuevos modelos insignia.
  • Se asoció con Apple para admitir algunas funciones de la IA integrada de Apple.
  • Anunciado ChatGPT recordará conversaciones anteriores.
  • Se lanzó la búsqueda ChatGPT, lo que marca la apuesta de OpenAI para reemplazar la Búsqueda de Google como el portal de facto al resto de Internet.
  • Implementó el modo de voz avanzado para usuarios seleccionados en octubre, permitiéndoles hablar con la IA en voz alta.

El 3 de octubre, OpenAI lanzó Canvas, lo que marcó un experimento importante en el uso de ChatGPT.

“Hacer que la IA sea más útil y accesible requiere repensar cómo interactuamos con ella”, escribió el equipo de OpenAI en octubre con motivo del anuncio de Canvas. “Canvas es un nuevo enfoque y la primera actualización importante de la interfaz visual de ChatGPT desde su lanzamiento hace dos años”.

Cómo ha mejorado ChatGPT en 2024

Graham Glass, director ejecutivo de la plataforma de creación de cursos de inteligencia artificial Cypher Learning, señaló cómo ChatGPT ofrece acceso a modelos más sofisticados ahora que en 2023.

“En primer lugar, ChatGPT sigue mejorando”, dijo en una entrevista con TechRepublic. “Y se ha vuelto más sofisticado, lo que abre oportunidades adicionales para aprovechar esa tecnología”.

El año pasado, Glass aprovechó ChatGPT para generar ideas sobre diseños y arquitecturas de software. Preguntar a la tecnología sobre las mejores prácticas o compensaciones de diseño le brinda “el corpus de todos los diseños que todos han hecho sobre ese tema en particular”, dijo.

“Se ha vuelto más inteligente”, añadió Curt Raffi, director de productos de Acrolinx, una empresa que utiliza IA para probar contenido para documentos técnicos y otros trabajos de redacción intensa. Señaló el rendimiento mejorado de GPT-4o, así como de OpenAI o1.

Raffi también explicó que la gente se siente más cómoda usando ChatGPT. Trabaja con ingenieros que han mejorado en la activación de ChatGPT de maneras que expresan una lógica empresarial específica.

VER: La primera reunión de la Red Internacional de Institutos de Seguridad de IA, celebrada esta semana, tiene como objetivo gestionar los riesgos de la IA avanzada.

A Glass le gusta que la búsqueda ChatGPT proporcione información actual y la considera un ahorro de tiempo para tareas como comparaciones de productos. También utiliza el modo de voz avanzado para charlar con la IA en voz alta.

En general, las incorporaciones de ChatGPT durante el último año han brindado más opciones para las personas que desean utilizar la IA generativa para trabajos técnicos.

“La forma más significativa en que los asistentes de IA generativa han cambiado la programación y el desarrollo durante el último año es permitir que personas con diferentes niveles de programación participen en el desarrollo de software para ofrecer soluciones a problemas del mundo real”, dijo Houbing Herbert Song, miembro del Instituto. de Ingenieros Eléctricos y Electrónicos, dijo en un correo electrónico a TechRepublic.

¿Qué no puede hacer ChatGPT en 2024?

La IA no es inmune a los errores. Para Glass, codificar con ChatGPT a menudo implica un diálogo de ida y vuelta, incluido “recordarle” a la IA detalles que pudo haber pasado por alto.

“Aunque creo que es mucho más fiable en lo que respecta al diseño [in 2024]todavía comete muchos errores de codificación”, dijo Glass.

Por ejemplo, Glass dijo sobre una tarea reciente que ChatGPT necesitó 10 indicaciones para crear una función en JavaScript correctamente. Esto aún le ahorró tiempo, pero demuestra que ChatGPT aún es limitado. Atribuyó esto en parte a que ChatGPT fue entrenado en un corpus de código finito, aunque enorme.

Filev señaló que ChatGPT se ha vuelto tan confiable que las personas no se dan cuenta fácilmente cuando comete errores.

“Se está volviendo tan bueno que comencé a bajar la guardia, y no sé si eso es algo bueno o malo”, dijo Filev.

Para muchas tareas, comenzó a buscar fuentes físicas en la Búsqueda de Google o Perplexity AI antes de usar ChatGPT. Estos podrían ser mejores lugares para encontrar fuentes confiables, dijo, mientras que ChatGPT es mejor para intercambiar ideas.

Las regulaciones podrían afectar ChatGPT

El año pasado también reveló las limitaciones y la posible regulación de ChatGPT. Raffi dijo que su equipo está abordando cuidadosamente el código generado por IA después de un caso judicial entre los desarrolladores y GitHub Copilot. Los desarrolladores alegaron que GitHub Copilot violó los derechos de propiedad intelectual al utilizar código fuente abierto.

Raffi señaló que el uso comercial de dicho código en los mercados sigue siendo algo incierto, lo que hace que las aplicaciones de IA en la codificación sean un proceso cauteloso y exploratorio.

“Nuestra propiedad intelectual está en nuestro código, y si de repente estuviéramos abiertos o expuestos a demandas, podríamos erosionar el valor de nuestra empresa”, dijo Raffi.

Cómo ChatGPT ha afectado a los desarrolladores que inician su carrera

Durante el año pasado, otro avance clave fue el impacto de ChatGPT en los desarrolladores que inician su carrera.

“Debido a que esto mejora en gran medida la eficiencia para que los desarrolladores se concentren en el diseño y la innovación de orden superior, quizás lo más importante es que el papel de un desarrollador cambia drásticamente de creadores a supervisores de código generado por IA”, dijo Dheerendra Panwar, miembro senior de IEEE, en un correo electrónico a TechRepublic. “Lo que nos lleva a una pregunta muy importante: ¿estamos simplificando el arte de la codificación?”

En algunos casos, es posible que los desarrolladores junior no sean contratados en absoluto, ya que algunas tareas que normalmente se les asignan ahora están a cargo de la IA.

“Estos cambios parecen ser beneficiosos para los programadores senior, ya que amplían su función e importancia”, escribió en un correo electrónico Jen Stave, directora ejecutiva del Instituto de Diseño de Datos Digitales de la Universidad de Harvard. “Debido a que los desarrolladores junior a menudo carecen de la experiencia para detectar problemas como alucinaciones de IA o resultados inexactos, este papel increíblemente importante recae en los programadores senior que ahora necesitan ampliar su responsabilidad para mitigar riesgos como los errores de código inducidos por la IA”.

En otros casos, los desarrolladores junior pueden ser más competentes en ingeniería rápida que los senior.

“Para los programadores jóvenes, la historia es más compleja”, escribió Stave. “La IA generativa reduce su dependencia de la resolución colaborativa de problemas, fomentando un trabajo más autónomo. Si bien esta independencia puede acelerar la productividad, eso puede no ser algo bueno para los humanos que tienden a obtener beneficios para la salud mental de la interacción y colaboración humana”.

Andrew Filev, fundador y director ejecutivo de Zencoder, una startup de herramientas de desarrollo de software de inteligencia artificial, explicó que impulsar ChatGPT puede parecer un conjunto de habilidades distinto. Sin embargo, le recordó cómo el uso de la Búsqueda de Google alguna vez fue una habilidad incluida en los currículums. Quizás 2024 fue el año en que ChatGPT comenzó a afectar la forma en que los profesionales de la tecnología piensan sobre el portal al resto de Internet.

“Se está convirtiendo cada vez más en una parte integral de mi día a día”, dijo Filev sobre ChatGPT. “Me da un impulso de productividad, pero no me define de una forma u otra, ¿verdad?”

La búsqueda ChatGPT y Canvas ofrecen nuevos factores de forma

Los esfuerzos de OpenAI por convertirse en un nuevo portal para el resto de Internet se pueden ver más claramente en la búsqueda de ChatGPT y en Canvas.

Raffi dijo que la búsqueda ChatGPT no se mantuvo muy bien frente a la Búsqueda de Google, carecía de contexto y proporcionaba “resultados bastante malos”. Sin embargo, utiliza Canvas con frecuencia.

“Está cambiando la forma en que pensamos sobre la IA y ChatGPT”, dijo. “Se trata de introducir una capa de aplicación y hacerte pensar en las API de IA como el back-end y más en la lógica empresarial detrás de todo. Resume muchas de las complejidades confusas de muchos editores”.

Dado que Canvas almacena recuerdos, puede hacer referencia a cambios anteriores en el código. Raffi lo llamó una combinación de capa de aplicación, back-end y capa de lógica empresarial.

Habrá muchos cambios en los próximos años.

2024 demostró que la IA no puede hacerlo todo y que la tasa de casos de uso transformadores podría estar desacelerando. Por otro lado, las empresas de inteligencia artificial están entrenando modelos para digerir cada vez más datos, incluida la mejora de los modelos subyacentes a ChatGPT. La forma en que los profesionales interactúan con ChatGPT ha cambiado desde 2023 y probablemente será diferente dentro de un año.

“Sí, habrá cambios”, dijo Filev. Comparó el auge de la IA con el paso de las tarjetas perforadas a la programación de software. “Pero creo que los desarrolladores están acostumbrados a los cambios”.

“La tecnología avanza y nosotros nos mantenemos al día, y creo que nos permite hacer mucho más y mejor”, añadió. “Y ChatGPT es uno de los buenos ejemplos de tecnologías que nos ayudan”.

Continue Reading

Trending