Connect with us

Noticias

Operai dice que el chatgpt copiado de forma profunda de DeepSpeek, pero también se enfrenta a las reclamaciones de derechos de autor

Published

on

Hasta hace unas semanas, pocas personas en el mundo occidental habían oído hablar de una pequeña compañía de inteligencia artificial china (AI) conocida como Deepseek. Pero el 20 de enero, capturó la atención global cuando lanzó un nuevo modelo de IA llamado R1.

R1 es un modelo de “razonamiento”, lo que significa que funciona a través de las tareas paso a paso y detalla su proceso de trabajo a un usuario. Es una versión más avanzada del modelo V3 de Deepseek, que se lanzó en diciembre. La nueva oferta de Deepseek es casi tan poderosa como el modelo de IA más avanzado de AI de la compañía rival Openai, pero a una fracción del costo.

En cuestión de días, la aplicación de Deepseek superó a ChatGPT en nuevas descargas y estableció precios de acciones de las empresas tecnológicas en los Estados Unidos. También llevó a Openai a afirmar que su rival chino había robado efectivamente algunas de las joyas de la corona de los modelos de Openii para construir los suyos.

En una declaración al New York Times, la compañía dijo:

Somos conscientes y revisando las indicaciones de que Deepseek puede haber destilado inapropiadamente nuestros modelos, y compartirá información como sabemos más. Tomamos contramedidas agresivas y proactivas para proteger nuestra tecnología y continuaremos trabajando estrechamente con el gobierno de los Estados Unidos para proteger los modelos más capaces que se están construyendo aquí.

La conversación se acercó a Deepseek para hacer comentarios, pero no respondió.

Pero incluso si Deepseek copió, o, en el lenguaje científico, “destilado”, al menos parte de Chatgpt para construir R1, vale la pena recordar que OpenAi también está acusado de faltarle el respeto a la propiedad intelectual mientras desarrolla sus modelos.

¿Qué es la destilación?

La destilación del modelo es una técnica de aprendizaje automático común en la que un “modelo de estudiante” más pequeño está capacitado en predicciones de un “modelo de maestro” más grande y complejo.

Cuando se complete, el estudiante puede ser casi tan bueno como el maestro, pero representará el conocimiento del maestro de manera más efectiva y compacta.

Para hacerlo, no es necesario acceder al funcionamiento interno del maestro. Todo lo que uno necesita lograr este truco es hacerle preguntas suficientes al modelo de maestro para entrenar al alumno.

Esto es lo que Openai afirma que Deepseek ha hecho: consultar O1 O1 a una escala masiva y usó los resultados observados para entrenar los modelos propios y más eficientes de Deepseek.

Operai afirma que Deepseek copió al menos algunos de los chatgpt para construir sus propios modelos de IA.
Salvatore di Nolfi/EPA

Una fracción de los recursos

Deepseek afirma que tanto la capacitación como el uso de R1 solo requirieron una fracción de los recursos necesarios para desarrollar los mejores modelos de sus competidores.

Hay razones para ser escépticos de algunos de los bombos de marketing de la compañía; por ejemplo, un nuevo informe independiente sugiere que el gasto de hardware en R1 fue tan alto como US $ 500 millones. Pero aun así, Deepseek todavía se construyó muy rápido y eficientemente en comparación con los modelos rivales.

Esto podría deberse a que Deepseek destiló la salida de Openai. Sin embargo, actualmente no hay ningún método para probar esto de manera concluyente. Un método que se encuentra en las primeras etapas del desarrollo es la marca de agua de las salidas de IA. Esto agrega patrones invisibles a las salidas, similares a las aplicadas a las imágenes con derechos de autor. Hay varias formas de hacer esto en teoría, pero ninguna es lo suficientemente efectiva o eficiente como para haberlo en práctica.

Hay otras razones que ayudan a explicar el éxito de Deepseek, como el trabajo técnico profundo y desafiante de la compañía.

Los avances técnicos realizados por Deepseek incluyeron aprovechar las chips de IA menos potentes pero más baratas (también llamadas unidades de procesamiento gráfico o GPU).

Deepseek no tuvo más remedio que adaptarse después de que Estados Unidos haya prohibido a las empresas exportar los chips de IA más poderosos a China.

Si bien las compañías de IA occidentales pueden comprar estas poderosas unidades, la prohibición de exportación obligó a las empresas chinas a innovar para aprovechar al mejor uso de alternativas más baratas.

Una imagen de primer plano de un chip de computadora negro en un panel azul.
Estados Unidos ha prohibido la exportación de los chips de computadora más potentes a China.
Ni gal/Shutterstock

Una serie de demandas

Los términos de uso de OpenAI indican explícitamente que nadie puede usar sus modelos AI para desarrollar productos competidores. Sin embargo, sus propios modelos están capacitados en conjuntos de datos masivos raspados de la web. Estos conjuntos de datos contenían una cantidad sustancial de material con derechos de autor, que OpenAI dice que tiene derecho a usar sobre la base del “uso justo”:

La capacitación de modelos AI que utilizan materiales de Internet disponibles públicamente es de uso justo, como lo respalda los precedentes de larga data y ampliamente aceptados. Vemos este principio como justo para los creadores, necesarios para los innovadores y la competitividad crítica para nosotros.

Este argumento será probado en la corte. Los periódicos, músicos, autores y otros creativos han presentado una serie de demandas contra OpenAI por infracción de derechos de autor.

Por supuesto, esto es bastante distinto a lo que Openai acusa a un gransejo de hacer. Sin embargo, Openai no está atrayendo mucha simpatía por su afirmación de que Deepseek cosechó ilegítimamente su producción modelo.

La guerra de palabras y demandas es un artefacto de cómo el rápido avance de la IA ha superado el desarrollo de reglas legales claras para la industria. Y aunque estos eventos recientes podrían reducir el poder de los titulares de IA, muchas dependen del resultado de las diversas disputas legales en curso.

Sacudiendo la conversación global

Deepseek ha demostrado que es posible desarrollar modelos de última generación de manera económica y eficiente. Queda por ver si pueden competir con OpenAi en un campo de juego nivelado.

Durante el fin de semana, Operai intentó demostrar su supremacía al liberar públicamente su modelo de consumo más avanzado, O3-Mini.

Operai afirma que este modelo supera sustancialmente su propia versión previa líder en el mercado, O1, y es el “modelo más rentable en nuestra serie de razonamiento”.

Estos desarrollos anuncian una era de mayor elección para los consumidores, con una diversidad de modelos de IA en el mercado. Esta es una buena noticia para los usuarios: las presiones competitivas harán que los modelos sean más baratos de usar.

Y los beneficios se extienden más.

El entrenamiento y el uso de estos modelos coloca una tensión masiva en el consumo de energía global. A medida que estos modelos se vuelven más ubicuos, todos nos beneficiamos de las mejoras en su eficiencia.

El ascenso de Deepseek ciertamente marca un nuevo territorio para construir modelos de manera más barata y eficiente. Quizás también sacudirá la conversación global sobre cómo las empresas de IA deberían recopilar y usar sus datos de capacitación.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

El nuevo modelo de IA de Openai acaba de hacer de todos un diseñador durante la noche

Published

on

En Finshots de hoy, le decimos si y cómo, el último modelo de generación de imágenes de OpenAi, y cómo puede cambiar el mundo del diseño.

Pero antes de comenzar … ¡Estamos atentos a un escritor financiero!

Si amas las finanzas y tienes un don para la narración de historias, esta es tu oportunidad de unirte a Finshots. Simplificamos los negocios y las finanzas para más de 5,00,000 lectores todos los días, y ahora estamos buscando a alguien que pueda desglosar las tendencias del mercado, las políticas económicas y las historias de negocios en lecturas nítidas y atractivas.

Si esto suena como tú, o conoces a alguien que sea perfecto para el papel, Aplicar aquí o compartirlo con ellos.

Además, si eres alguien a quien le encanta vigilar lo que está sucediendo en el mundo de los negocios y las finanzas, presione suscribir si aún no lo has hecho. Si ya eres un suscriptor o estás leyendo esto en la aplicación, puedes seguir adelante y leer la historia.


La historia

Imagine crear hermosas imágenes simplemente describiéndolas en lenguaje sencillo: no más herramientas complicadas, no más esperar a que los diseñadores gráficos envíen borradores de un lado a otro, y no se quejen más. Es el sueño final, y a pesar de los avances masivos en la IA, siempre hemos parecido estar fuera de su alcance.

Sin embargo, el último modelo de generación de imágenes de OpenAI (4O) cambia esto. Probablemente nos ha traído a una distancia conmovedora de la tierra prometida, si no directamente en ella. Este nuevo modelo es impresionante. Parece hacer todo bien. Puede crear imágenes fotorrealistas, no arruina las figuras, entiende el contexto y ha convertido a todos en un diseñador durante la noche.

¿Cómo das sentido a algo como esto?

Bueno, comencemos desde la cima y hagamos la pregunta más obvia.

¿Por qué funciona tan bien y por qué otros modelos no pueden replicar esto?

Bueno, hay un excelente artículo sobre “The Verge” que explica esto. Pero si quieres un explicador simple, aquí hay uno …

GPT-4O es un modelo “omnimodal”, lo que significa que comprende y conecta diferentes tipos de datos, como texto, imágenes, incluso audio y video. También comprende mejor las indicaciones porque fue entrenado para comprender el significado detrás de palabras e imágenes, en lugar de seguir estrictamente las palabras exactas dadas. Otros modelos a menudo solo siguen las indicaciones literalmente, por lo que debe proporcionar más detalles para obtener el resultado correcto. Pero GPT-4O puede adivinar lo que quisiste decir, incluso si no dices todo claramente, haciendo que sus imágenes coincidan con tu intención de manera más natural.

También es diferente de los modelos de difusión.

Estos modelos funcionan comenzando con un ruido aleatorio y configurándolo lentamente en una imagen, en función de la solicitud. Cada vez que desea cambiar algo, incluso una pequeña parte, generalmente debe regenerar toda la imagen o usar técnicas especiales para editarlo. Son excelentes para hacer imágenes de alta calidad, pero no son muy interactivas o inteligentes para hacer cambios paso a paso.

El nuevo generador de imágenes 4O es un modelo basado en tokens que trata las imágenes más como el lenguaje. “Ven” la imagen como una secuencia de tokens (como palabras) y pueden comprender y actualizar piezas específicas, al igual que editar una oración. Entonces, si dice “agregue un árbol” o “mueva la pieza de ajedrez”, el modelo puede cambiar esa parte de la imagen sin tocar todo lo demás.

Además, dado que ya sabe mucho sobre el mundo, es realmente bueno en lo que hace.

Esto, sin duda, cambiará algunas cosas.

Los especialistas en marketing y las empresas ahora tendrán una herramienta poderosa para crear e iterar en las imágenes en tiempo real, sin necesidad de habilidades de diseño avanzadas. Por ejemplo, pueden generar dinámicamente imágenes de productos con diferentes colores y estilos adaptados a usuarios individuales. Pueden ejecutar pruebas A/B extensas o adaptar campañas publicitarias completas describiendo cualquier actualización en lenguaje sencillo. Las plataformas de comercio electrónico pueden personalizar las imágenes de productos por cliente, mientras que los equipos de productos pueden prototipos rápidamente de diseños de UI y UX convirtiendo ideas difíciles en maquetas visuales instantáneas. Mientras tanto, los creadores de contenido se beneficiarán de la capacidad de adaptar o refinar sus miniaturas sobre la marcha.

Hay algo para todos. Incluyendo OpenAi. Esto definitivamente les ayudará a atraer a un montón de nuevos usuarios. Y a medida que más usuarios interactúen con la plataforma, OpenAI recopilará más datos para mejorar continuamente sus modelos. Podría ser un ciclo virtuoso y ofrecer a la compañía una ventaja masiva a medida que la raza de IA reúne el impulso.

Sin embargo, hay un problema que aún no hemos discutido. ¿Qué significa esto para diseñadores y artistas gráficos? Si alguien puede crear imágenes convincentes con un mensaje simple, ¿dejarán de existir sus trabajos?

Bueno, las personas a menudo exageran la fatalidad cuando se trata de estas cosas.

La gente en el siglo XIX creía que los telares mecanizados eliminarían los empleos textiles, pero la industria se expandiría, creando nuevos roles basados ​​en la fábrica. Se suponía que la introducción de los cajeros automáticos hacía que los cajeros bancarios sean redundantes, pero su número solo aumentó a medida que los bancos redirigieron a los empleados hacia el servicio al cliente y los roles de ventas. Las computadoras personales, inicialmente vistas como posibles asesinos de empleo, nacieron industrias completamente nuevas en el desarrollo de TI y software. Incluso el comercio electrónico, una vez temido como el final de la venta minorista tradicional, se convirtió en un modelo integrado donde las tiendas tradicionales de ladrillo y mortero y las plataformas en línea funcionan juntas.

Los humanos se adaptan. Eso es lo que hacen. ¿Y adivina qué? Los diseñadores adoptarán estos nuevos avances y los cooptarán en sus flujos de trabajo. La única pregunta es: ¿quién es lo suficientemente inteligente como para hacerlo rápidamente?

Que tendremos que esperar y ver.

Hasta entonces…

No olvides compartir esta historia en Whatsapp, LinkedIn y incógnita.


Solo el 17% de los millennials tienen un plan a término❗

He aquí por qué obtener un plan de término temprano puede hacer maravillas para usted y su familia:

✅Protección: En pocas palabras, el seguro a plazo es donde paga una pequeña cantidad de dinero a cambio de una gran cantidad de protección. Esta protección generalmente entra en marcha en el caso de que el asegurado fallece.

Pero no solo eso, si alguna vez desarrolla una enfermedad crítica (por ejemplo, cáncer) y tiene que dejar su trabajo, un plan de término puede darle un monto de suma global para compensar los ingresos perdidos.

✅Asegura a tus padres: A medida que sus padres cerca de la jubilación, pueden comenzar a confiar en sus ingresos. Y así, un plan de término le dará paz sabiendo que recibirán apoyo financiero incluso en su ausencia.

✅Bajas primas para siempre: Un plan a plazo de ₹ 1 crore le costará primas mucho más bajas a los 25 años que a los 35 años. Incluso puede obtener una cobertura de ₹ 1 crore por tan solo ₹ 10,000 al año si es joven y saludable. Además, una vez que estas primas están bloqueadas, ¡siguen siendo las mismas durante todo el período!

¡Así que no lo retrases! Como dicen, “el mejor momento para comprar un seguro a término fue ayer; la siguiente mejor vez es hoy”.

Haga clic aquí para reservar una llamada gratuita con los asesores certificados de Ditto Insurance y obtener su orientación personalizada de seguro a plazo.

Continue Reading

Noticias

Chatgpt’s Studio Ghibli Ai Trend Sparks debate sobre la creatividad frente a la violación de los derechos de autor

Published

on

Varios fanáticos del famoso estudio de animación japonés detrás Enérgico y Howl’s Moving CastleStudio Ghibli, se encantó esta semana cuando una nueva versión de ChatGPT les permitió transformar memes de Internet populares o fotos personales en el estilo distintivo del fundador de Ghibli, Hayao Miyazaki.

Sin embargo, la tendencia también destacó las preocupaciones éticas sobre las herramientas de inteligencia artificial entrenadas en obras creativas con derechos de autor y lo que eso significa para los medios de vida futuros de los artistas humanos, así como las preguntas éticas sobre el valor de la creatividad humana en un tiempo cada vez más moldeado por los algoritmos.

Miyazaki, de 84 años, conocido por su enfoque dibujado a mano y su narración caprichosa, ha expresado escepticismo sobre el papel de AI en la animación en el pasado.

Janu Lingeswaran no estaba pensando mucho en eso cuando subió una foto de su gato Ragdoll de 3 años, Mali, en la nueva herramienta de generador de imágenes de Chatgpt el miércoles. Luego le pidió a Chatgpt que lo convirtiera en el estilo Gibli, haciendo instantáneamente una imagen de anime que parecía malí, pero también uno de los personajes felinos minuciosamente dibujados que pueblan películas Miyazaki como Mi vecino Totoro o Servicio de entrega de Kiki.

“Realmente me enamoré del resultado”, dijo Lingeswaran, un empresario que vive cerca de Aachen, Alemania. “Estamos pensando en imprimirlo y colgarlo en la pared”.

Resultados similares dieron al estilo Ghibli a imágenes icónicas, como el aspecto casual del tirador de pistola turco Yusuf Dikec en una camiseta y una mano en su bolsillo en su camino para ganar una medalla de plata en los Juegos Olímpicos de 2024. O el famoso meme de “niña desastre” de un niño de 4 años que se vuelve hacia la cámara con una ligera sonrisa mientras un fuego de la casa se desata en el fondo.

El fabricante de chatgpt OpenAi, que está luchando contra las demandas por derechos de autor sobre su chatbot insignia, ha alentado en gran medida los experimentos de “Giblificación” y su CEO Sam Altman cambió su perfil en la plataforma de redes sociales X a un retrato de estilo Ghibli. En un artículo técnico publicado el martes, la compañía había dicho que la nueva herramienta adoptaría un “enfoque conservador” en la forma en que imita la estética de los artistas individuales.

“Agregamos un rechazo que se desencadena cuando un usuario intenta generar una imagen al estilo de un artista vivo”, dijo. Pero la compañía agregó en una declaración de que “permite estilos de estudio más amplios, que las personas han usado para generar y compartir algunas creaciones de fanáticos originales verdaderamente deliciosas e inspiradas”.

Studio Ghibli aún no ha comentado sobre la tendencia. El estudio japonés y su distribuidor norteamericano no respondieron de inmediato a los correos electrónicos que buscan comentarios el jueves.

Mira Apple TV+ gratis durante 7 días

Nuevos suscriptores solamente. £ 8.99/mes. Después de la prueba gratuita. Planifique las renovaciones automáticas hasta que se cancele

Prueba gratis

Apple TV+ logotipo

Mira Apple TV+ gratis durante 7 días

Nuevos suscriptores solamente. £ 8.99/mes. Después de la prueba gratuita. Planifique las renovaciones automáticas hasta que se cancele

Prueba gratis

Mientras los usuarios publicaron sus imágenes de estilo Ghibli en las redes sociales, otros comenzaron a compartir los comentarios anteriores de Miyazaki sobre la animación de IA, así como sus pensamientos sobre por qué creen que las imágenes de IA van en contra del espíritu del famoso autor.

En una reunión de 2016, cuando se le muestra una demostración de animación de IA, Miyazaki respondió: “Estoy completamente disgustado. Si realmente quieres hacer cosas espeluznantes, puedes seguir adelante y hacerlo. Nunca desearía incorporar esta tecnología en mi trabajo en absoluto”.

El miembro del equipo que demuestra la animación explicó que AI podría “presentarnos movimientos grotescos que los humanos no podemos imaginar”, y agregó que podría usarse para representar los movimientos de los zombis.

Eso llevó a Miyazaki a contar una historia.

“Todas las mañanas, no en los últimos días, veo a mi amigo que tiene una discapacidad”, dijo Miyazaki. “Es muy difícil para él solo hacer un gran cinco; su brazo con músculo rígido no puede alcanzar mi mano. Ahora, pensando en él, no puedo ver estas cosas y encontrarlo interesante. Quien cree esto no tiene idea de qué es el dolor”.

“Siento firmemente que esto es un insulto a la vida misma.

“La ironía está muerta y todo, pero es bastante deprimente ver a Ghibli Ai inclinarse en la línea de tiempo no solo porque Miyazaki cree que el arte de IA es asqueroso, sino porque ha pasado los últimos 50 años haciendo arte sobre los desechos ambientales para usos humanos pequeños”, publicó un fanático en X, anteriormente Twitter.

Un estudio de 2024 encontró que los sistemas de IA conducían a vastas emisiones, que a su vez están aumentando a medida que se requiere más energía para ejecutar los sistemas en evolución. El actual GPT-4 de Openai, por ejemplo, usa 12 veces más energía que su predecesor, según el estudio.

La energía utilizada en el entrenamiento de los sistemas es solo una pequeña parte del trabajo, y requiere un estimado 960 veces más energía que una ejecución de entrenamiento cuando las herramientas de IA realmente se utilizan.

En particular, muchos están molestos con la cuenta oficial del gobierno de EE. UU. Usando la tendencia para generar una imagen de un inmigrante arrestado y deportado.

“Para ver algo tan brillante, tan maravilloso como el trabajo de Miyazaki se mata para generar algo tan mal..

En octubre de 2024, un trailer generado por IA para una versión de acción en vivo de la película de 1997 Princesa Mononoke condujo a una reacción masiva después de volverse viral en las redes sociales.

El trailer de IA usó la voz inglesa que actúa de la película original, que presentaba talentos como Billy Cudrup, Clare Danes y Minnie Driver, y reinventó por completo la animación dibujada a mano de la película japonesa como si las personas reales estuvieran tocando las partes, aunque con CGI.

“Realmente no sé si obtendremos un mejor ejemplo de por qué el arte de Ai es basura que alguien que toma una de las películas más hechas a propósito y bellamente animadas de la historia y lo reduce a un montón de tomas de aspecto aburrido que apenas están conectados pero de alguna manera se ven lo mismo”, escribió un fan en X.

Operai no respondió a una pregunta el jueves sobre si tenía una licencia.

Josh Weigensberg, socio del bufete de abogados Pryor Cashman, dijo que una pregunta que plantea el arte de IA al estilo de Ghibli es si el modelo de IA fue entrenado en el trabajo de Miyazaki o Studio Ghibli. Eso a su vez “plantea la cuestión de” Bueno, ¿tienen una licencia o permiso para hacer esa capacitación o no? “, Dijo.

Weigensberg agregó que si un trabajo tenía licencia para capacitación, podría tener sentido que una empresa permita este tipo de uso. Pero si este tipo de uso está ocurriendo sin consentimiento y compensación, dijo, podría ser “problemático”.

Weigensberg agregó que existe un principio general “a la vista de 30,000 pies” de que “estilo” no es con derechos de autor. Pero a veces, dijo, en lo que la gente realmente está pensando cuando dice “estilo” podría ser “elementos más específicos, discernibles y discretos de una obra de arte”, dijo.

“A Howl’s Moving Castle o Enérgicopodría congelar un marco en cualquiera de esas películas y señalar cosas específicas, y luego mirar el resultado de la IA generativa y ver elementos idénticos o elementos sustancialmente similares en esa salida “, dijo.” Solo detenerse en, ‘Oh, bueno, el estilo no es protegible bajo la ley de derechos de autor’. Ese no es necesariamente el final de la investigación “.

La artista Karla Ortiz, que creció viendo las películas de Miyazaki y está demandando a otros generadores de imágenes de IA por infracción de derechos de autor en un caso que todavía está pendiente, lo llamó “otro ejemplo claro de cómo a las compañías como OpenAi simplemente no les importa el trabajo de los artistas y los medios de vida de los artistas”.

“Eso es usar la marca de Gibli, su nombre, su trabajo, su reputación, promover productos (OpenAI)”, dijo Ortiz. “Es un insulto. Es explotación”.

Continue Reading

Noticias

Probé el nuevo generador de imágenes de Chatgpt, y destrozó mis expectativas

Published

on

Aviso: ¿Puede generar una imagen colorida realista de perro con un traje en la calle en una relación 16: 9?

Captura de pantalla de Sabrina Ortiz/Zdnet

OpenAi puede haber iniciado la moda de la generación de texto a imagen con su modelo Dall-E, pero desde esos días de gloria anteriores, la oferta de la compañía de IA ha sido lapada por modelos de imagen mucho más capaces. Como resultado, cuando Operai lanzó su último y mejor modelo de generación de imágenes GPT-4O, me escéptico. Después de probarlo, he cambiado de opinión por completo.

Empezando

Cuando Dall-E se lanzó por primera vez, vivió en su sitio web independiente; Desde entonces, se ha movido a Chatgpt. La medida llegó con muchos beneficios, incluso poder pedirle al chatbot Ai una imagen que desee en la misma interfaz donde ya está charlando sobre otra cosa, eliminando así la necesidad de un cambio de contexto constante.

Con el lanzamiento de la generación de imágenes GPT-4O, OpenAI mantuvo este formato conveniente, cambiando el generador de imagen predeterminado de Dall-E a GPT-4O para suscriptores pagados. Como resultado, fue muy fácil comenzar a crear nuevas imágenes desde mi cuenta ChatGPT Plus. Todo lo que tenía que hacer era ingresar el mensaje de lo que quería ver, y luego los generaría. Los usuarios también pueden acceder a él desde la interfaz Sora.

También: Cómo usar Sora de OpenAi para crear impresionantes videos generados por AI

Cuidado: aún puede generar imágenes de manera similar si es un usuario gratuito. Sin embargo, si no está impresionado, eso se debe a que, aunque en el lanzamiento, se anunció que el modelo venía a todos los usuarios, incluidos los gratuitos, el CEO de Operai, Sam Altman, anunció un día después que el despliegue al nivel libre ahora se “retrasaría por un tiempo”.

Las imágenes

En el momento en que has estado esperando: las imágenes. Después de insertar una solicitud, el IA genera la generación en menos de un minuto. El proceso lleva un poco más de lo que solía, pero las imágenes valen la pena, entregando muchos detalles, textura, realismo e incluso precisión del texto. En lugar de describirlo, incluiré ejemplos a continuación para que pueda verlo usted mismo.

Inmediato: ¿Puedes generar una imagen realista de un camaleón, de cerca, filmado como si estuviera en National Geographic en la relación 16: 9?

chatgpt-image-lizard

Sabrina Ortiz/Zdnet a través de chatgpt

Inmediato: ¿Puede generar una imagen de una computadora portátil abierta en un escritorio que dice: “Este modelo es tan bueno que incluso puede obtener texto y manos correctos, que generalmente son desafíos importantes para los modelos de IA”, con las manos escribiendo en un teclado en una relación 16: 9?

chatgpt-laptop-withs

Sabrina Ortiz/Zdnet a través de chatgpt

Inmediato: ¿Puedes generar una foto realista de un primer plano de una mujer en una multitud en Times Square mirando la cámara y sonriendo, con la calidad de una tomada en una DSLR?

chatgpt-woman sonriendo

Sabrina Ortiz/Zdnet a través de chatgpt

Como se vio anteriormente, el generador de imágenes hace un gran trabajo al adherirse a la solicitud y entregar imágenes realistas de alta calidad. Sin embargo, al probar un modelo de IA, una de las verdaderas métricas de rendimiento es cómo se compara con los competidores en el mercado. Para darle un buen indicador de esto, lo hice generar el mismo aviso que probé en todos los principales generadores de imágenes de IA, incluidos MidJourney, Imagen 3 de Google, Adobe Firefly y más.

Adjunto la interpretación de GPT-4O a continuación. Puede ver cómo le va a todos los otros generadores de imágenes de IA en este artículo, incluida la interpretación de Dall-E, que claramente está muy por detrás de lo que el nuevo modelo puede hacer.

Inmediato: ¿Puedes generar una imagen de un colibrí vibrante y realista encaramado en un árbol?

chatgpt-image-hummingbird

Sabrina Ortiz/Zdnet a través de chatgpt

Otras características notables

Aunque la calidad de las imágenes es quizás una de las mayores victorias del modelo, también hay otros beneficios. Una de las más grandes es que vive en la interfaz del chatbot, lo que facilita el ajuste de las generaciones con simples indicaciones de lenguaje natural. Además, debido a que el chatbot tiene el contexto de lo que acabas de preguntar, puede considerar eso al construir la imagen.

Por ejemplo, si está charlando con él sobre organizar una fiesta de cumpleaños, es posible que pueda decir: “¿Puede crear ahora una invitación que tenga la información anterior?” en lugar de tener que volver a escribir. Por ejemplo, comencé a chatear con ChatGPT sobre lanzar un inauguración de la casa, y al pedir que hiciera que creara una invitación, no tuve que repetir la información que dije anteriormente.

Invitación de fiesta de inauguración de la casa: chatgpt

Captura de pantalla de Sabrina Ortiz/Zdnet

También puede cargar imágenes de referencia y luego pedirle a ChatGPT que cree una versión diferente o las use como elementos de una nueva. Por ejemplo, puede ingresarlo como una selfie y generarla en estilo de anime, como se ve en la nueva publicación X de Altman.

Todas estas características de personalización lo convierten en una oferta realmente sólida para los creativos, que también pueden solicitar que se presente en un fondo transparente o incorpore guías de estilo de marca, como códigos hexagonales o logotipos.

Hablando de Altman, pude generar una imagen de él con un sombrero de fiesta. Podría hacerlo porque el nuevo modelo tiene salvaguardas mucho más sueltas, destinadas a permitir a los usuarios inclinarse en su libertad creativa. La publicación de blog que anunció el modelo señaló que limita lo que se puede crear cuando las personas reales están en el contexto, incluidas “salvaguardas particularmente robustas sobre la desnudez y la violencia gráfica”.

chatgpt-image-sam-altman

Sabrina Ortiz/Zdnet a través de chatgpt

No puedo decir si hay un caso de uso práctico para esta función, pero es un cambio notable que necesitaba probar por mí mismo. Cuando intenté crear una imagen de Mickey Mouse, decía que no podía debido a las implicaciones de los derechos de autor, por lo que parece que no todas las figuras públicas son un juego justo.

En general

En general, el generador de imágenes GPT-4O es una gran victoria sobre los modelos Dall-E y quizás entre los mejores de los muchos que he probado. ¿Vale la pena los $ 20 por mes? Si solo está interesado en la generación de imágenes de alta calidad, todavía hay versiones gratuitas que puede explorar que son realmente capaces, como Adobe Firefly o Google’s Imagen 3.

También: los mejores generadores de imágenes de IA: probado y revisado

Dicho esto, si es un usuario de ChatGPT frecuente, la actualización a ChatGPT Plus se vuelve significativamente más atractiva. Con esta actualización, tendrá acceso a todas las últimas y mejores funciones de chatbot de OpenAI, así como una generación de imágenes y videos de alta calidad, todo por $ 20 al mes, lo que no es un mal negocio, especialmente teniendo en cuenta otras ofertas en el mercado. Por ejemplo, la suscripción de MidJourney comienza en $ 10 por mes y solo ofrece generación de imágenes.

¿Quieres más historias sobre AI? Regístrese para la innovaciónnuestro boletín semanal.

Continue Reading

Trending