Connect with us

Noticias

Cómo utilizar Midjourney para crear imágenes generadas por IA de alta calidad

Published

on

¿Necesita un logotipo para su negocio o una obra de arte para una presentación? Una opción es utilizar un generador de imágenes de IA como Midjourney. Con este creador de imágenes, usted describe el tipo de imagen que necesita y el sitio muestra cuatro representaciones de alta calidad, que puede ajustar y editar.

Necesita una suscripción paga para utilizar Midjourney. La empresa ha ofrecido pruebas gratuitas en el pasado, pero no de forma constante. Los planes cuestan entre $ 10 y $ 60 por mes y entre $ 96 y $ 576 por año. Cada nivel aumenta la velocidad de las respuestas y ofrece ventajas adicionales. Para probar Midjourney, querrás comenzar con el plan básico para ver qué tan bien funciona para ti.

En el pasado, Midjourney requería que usaras Discord para crear imágenes de IA. Eso requirió mucho juego con indicaciones basadas en texto, un proceso que podría resultar torpe y frustrante, especialmente para los principiantes. Para atraer a una audiencia más amplia, Midjourney lanzó desde entonces un sitio web dedicado que es mucho más fácil y amigable de usar.


Regístrate para mitad de viaje

Para comenzar, diríjase al sitio web de Midjourney y haga clic en el Inscribirse botón en la parte inferior de la página de inicio. Para registrarse se requiere una cuenta de Google o Discord. Si anteriormente creó imágenes a través de Discord, puede usar esa cuenta para recuperar su historial y luego fusionar sus cuentas de Discord y Google para iniciar sesión con cualquiera de ellas.

(Crédito: PCMag/Midjourney)

Después de iniciar sesión en el sitio, una barra lateral a la izquierda muestra pestañas para diferentes secciones. Seleccionar Explorar para ver imágenes que otras personas han creado. Filtre las imágenes eligiendo diferentes categorías en la parte superior, como Aleatorio, Caliente, Día principal (así como Semana principal o Mes principal) y Me gusta.

Explora la biblioteca de imágenes

(Crédito: PCMag/Midjourney)

Haga clic en una imagen que le interese para verla en pantalla completa. También encontrará el mensaje utilizado para generar la imagen, que puede copiar y utilizar como base para su propia imagen. Haga clic en la X para regresar a la galería de imágenes.

Haz clic en una imagen que te interese

(Crédito: PCMag/Midjourney)

Cuando esté listo para crear sus propias imágenes, haga clic en el Crear pestaña de la izquierda. En este punto, se le pedirá que se registre para obtener una de las suscripciones pagas. Haga clic en Únete ahora elija el nivel de suscripción que desee y siga los pasos para pagar y activar su suscripción.

Regístrese para obtener una suscripción

(Crédito: PCMag/Midjourney)


Generar una imagen

En la pantalla Crear, genere una imagen escribiendo un mensaje en el ¿Qué te imaginarás? campo en la parte superior de la página. Añade los detalles necesarios para describir la imagen. También querrás indicar el estilo que deseas, como acuarela, dibujo, anime o fotorrealista. Presione la tecla Enter para enviar su mensaje. En respuesta, se generan cuatro imágenes que, con suerte, coinciden con su descripción.

Crea tu primera imagen

(Crédito: PCMag/Midjourney)


Ajustar una imagen

¿No te gustan los resultados? Modifique la imagen haciendo clic en el icono de configuración de tres líneas a la derecha del mensaje. Aquí puede cambiar opciones como el tamaño, el modelo y la estética de la imagen. Por ejemplo, puedes cambiar la relación de aspecto entre cuadrado, vertical y horizontal. También puedes mover el control deslizante para modificar la estilización, la rareza y la variedad. Pase el cursor sobre una de las opciones en Estética para saber cómo cambiará su imagen.

Modificar la imagen

(Crédito: PCMag/Midjourney)

Una vez que haya realizado los ajustes, copie y pegue el mensaje anterior en el ¿Qué te imaginarás? campo y presione Entrar. Al igual que Copilot de Microsoft y Gemini de Google, Midjourney creará un nuevo conjunto de cuatro imágenes basándose en el mismo mensaje pero utilizando las opciones que hayas ajustado.

Generar una nueva imagen

(Crédito: PCMag/Midjourney)

Pase el cursor sobre una imagen para mostrar opciones para Variar sutil y Variar fuerte. Haga clic en una y Midjourney creará un nuevo lote de cuatro imágenes con variaciones sutiles o fuertes según la que seleccionó y las opciones que eligió.

Crédito: Lance Whitney / Mitad del viaje

(Crédito: PCMag/Midjourney)


Modificar imágenes con acciones de creación

Haga clic en una imagen que le guste y desee modificar más. Luego, esa imagen se abre en una vista más grande. En el lado derecho de la pantalla, aparecen diferentes acciones debajo Acciones de creación. Al pasar el cursor sobre una acción específica se explica lo que hace. El Variar La acción te permite cambiar la imagen de forma sutil o fuerte. En respuesta, Midjourney crea una nueva imagen con cambios sutiles o dramáticos. Para probar este, haga clic Sutil o Fuerte.

Con el Exclusivo acción, puede generar una imagen más grande y más adecuada para descargar o imprimir. Para este, haga clic Sutil o Creativo. Usando el Más acción, puede ejecutar el mismo mensaje nuevamente o ir directamente al editor. También puedes utilizar la imagen, un estilo o un mensaje para revisarlo. Hacer clic Repetición o Editor. Con el Usar acción, puede utilizar la imagen, el estilo o el mensaje original para generar una nueva imagen.

Modifica tu imagen con diferentes acciones

(Crédito: PCMag/Midjourney)

Pruebe algunas de las diferentes acciones. Cada vez que seleccionas una, se genera una nueva serie de cuatro imágenes. Querrá limitar la cantidad de acciones que elija; de lo contrario, terminarás con muchas imágenes nuevas. Cuando haya terminado, regrese a la pantalla Crear para ver los nuevos conjuntos de imágenes.

Recomendado por nuestros editores

Regrese a la pantalla Crear para ver los nuevos conjuntos de imágenes.

(Crédito: PCMag/Midjourney)


Editar una imagen

Elija una imagen en la pantalla Crear. Midjourney tiene un editor incorporado a través del cual puedes realizar más cambios en una imagen. Hacer clic Editor A la derecha. En la pantalla de edición, acerque o aleje la imagen moviendo el Escala control deslizante en la parte superior. Aquí también puede cambiar la relación de aspecto seleccionando uno de los ajustes preestablecidos.

Luego podrá mover la imagen por el lienzo arrastrando el ícono de cuatro flechas en el medio. Por ejemplo, puedes reducir la imagen para agregar más contenido a la izquierda, derecha, arriba o abajo. Cuando termine, haga clic en Entregar y regrese a la pantalla Crear para ver las imágenes recién generadas.

Edita tu imagen

(Crédito: PCMag/Midjourney)

Nuevamente, seleccione la imagen que desea usar para seguir adelante. A continuación, podrá cambiar partes de la imagen según las revisiones de su mensaje. Por ejemplo, puede agregar un nuevo elemento a su imagen borrando la parte que desea cambiar y luego agregando la nueva información al mensaje.

Borra la parte de la imagen que deseas cambiar.

(Crédito: PCMag/Midjourney)

Después de enviar el nuevo mensaje, Midjourney genera un nuevo conjunto de imágenes a la derecha del actual. Haga clic en una de las nuevas imágenes para verla.

Midjourney genera un nuevo conjunto de imágenes.

(Crédito: PCMag/Midjourney)


Descargar y organizar imágenes

Una vez que hayas elegido la imagen que más te guste, ábrela en su propia ventana. Haga clic en Descargar imagen a la derecha y seleccione una ubicación en la que guardar el archivo. Luego, su imagen se descarga como un archivo PNG.

Descargar una imagen

(Crédito: PCMag/Midjourney)

Puede ver y organizar todas las imágenes que ha generado haciendo clic en el Organizar categoría de la izquierda. Haga clic derecho en una imagen específica para acceder a un menú donde puede darle me gusta, ocultar, modificar, copiar o guardar la imagen. Haga clic en Organizar a la derecha para mostrar una barra lateral. Aquí puedes crear carpetas para guardar tus imágenes, filtrar la lista de imágenes según diferentes criterios y jugar con el diseño y el tamaño de la imagen.

Organiza tus imágenes

(Crédito: PCMag/Midjourney)

¿Te gusta lo que estás leyendo?

Matricularse en Consejos y trucos boletín informativo para obtener asesoramiento de expertos para aprovechar al máximo su tecnología.

Este boletín puede contener publicidad, ofertas o enlaces de afiliados. La suscripción a un boletín indica su consentimiento a nuestros Términos de uso y Política de privacidad. Puede darse de baja de los boletines en cualquier momento.

Puntero del boletín

Acerca de Lance Whitney

Contribuyente

Lance Whitney

He estado trabajando para PCMag desde principios de 2016 escribiendo tutoriales, artículos instructivos y otros artículos sobre tecnología de consumo. Más allá de PCMag, he escrito noticias y tutoriales para una variedad de otros sitios web y publicaciones, incluidos CNET, ZDNet, TechRepublic, Macworld, PC World, Time, US News & World Report y AARP Magazine. Pasé siete años escribiendo noticias de última hora para CNET como uno de los reporteros del sitio de la costa este. También escribí dos libros para Wiley & Sons:Windows 8: cinco minutos a la vez y Enséñese usted mismo visualmente LinkedIn.

Lea la biografía completa de Lance.

Lea lo último de Lance Whitney

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

El nuevo modelo de IA de Openai acaba de hacer de todos un diseñador durante la noche

Published

on

En Finshots de hoy, le decimos si y cómo, el último modelo de generación de imágenes de OpenAi, y cómo puede cambiar el mundo del diseño.

Pero antes de comenzar … ¡Estamos atentos a un escritor financiero!

Si amas las finanzas y tienes un don para la narración de historias, esta es tu oportunidad de unirte a Finshots. Simplificamos los negocios y las finanzas para más de 5,00,000 lectores todos los días, y ahora estamos buscando a alguien que pueda desglosar las tendencias del mercado, las políticas económicas y las historias de negocios en lecturas nítidas y atractivas.

Si esto suena como tú, o conoces a alguien que sea perfecto para el papel, Aplicar aquí o compartirlo con ellos.

Además, si eres alguien a quien le encanta vigilar lo que está sucediendo en el mundo de los negocios y las finanzas, presione suscribir si aún no lo has hecho. Si ya eres un suscriptor o estás leyendo esto en la aplicación, puedes seguir adelante y leer la historia.


La historia

Imagine crear hermosas imágenes simplemente describiéndolas en lenguaje sencillo: no más herramientas complicadas, no más esperar a que los diseñadores gráficos envíen borradores de un lado a otro, y no se quejen más. Es el sueño final, y a pesar de los avances masivos en la IA, siempre hemos parecido estar fuera de su alcance.

Sin embargo, el último modelo de generación de imágenes de OpenAI (4O) cambia esto. Probablemente nos ha traído a una distancia conmovedora de la tierra prometida, si no directamente en ella. Este nuevo modelo es impresionante. Parece hacer todo bien. Puede crear imágenes fotorrealistas, no arruina las figuras, entiende el contexto y ha convertido a todos en un diseñador durante la noche.

¿Cómo das sentido a algo como esto?

Bueno, comencemos desde la cima y hagamos la pregunta más obvia.

¿Por qué funciona tan bien y por qué otros modelos no pueden replicar esto?

Bueno, hay un excelente artículo sobre “The Verge” que explica esto. Pero si quieres un explicador simple, aquí hay uno …

GPT-4O es un modelo “omnimodal”, lo que significa que comprende y conecta diferentes tipos de datos, como texto, imágenes, incluso audio y video. También comprende mejor las indicaciones porque fue entrenado para comprender el significado detrás de palabras e imágenes, en lugar de seguir estrictamente las palabras exactas dadas. Otros modelos a menudo solo siguen las indicaciones literalmente, por lo que debe proporcionar más detalles para obtener el resultado correcto. Pero GPT-4O puede adivinar lo que quisiste decir, incluso si no dices todo claramente, haciendo que sus imágenes coincidan con tu intención de manera más natural.

También es diferente de los modelos de difusión.

Estos modelos funcionan comenzando con un ruido aleatorio y configurándolo lentamente en una imagen, en función de la solicitud. Cada vez que desea cambiar algo, incluso una pequeña parte, generalmente debe regenerar toda la imagen o usar técnicas especiales para editarlo. Son excelentes para hacer imágenes de alta calidad, pero no son muy interactivas o inteligentes para hacer cambios paso a paso.

El nuevo generador de imágenes 4O es un modelo basado en tokens que trata las imágenes más como el lenguaje. “Ven” la imagen como una secuencia de tokens (como palabras) y pueden comprender y actualizar piezas específicas, al igual que editar una oración. Entonces, si dice “agregue un árbol” o “mueva la pieza de ajedrez”, el modelo puede cambiar esa parte de la imagen sin tocar todo lo demás.

Además, dado que ya sabe mucho sobre el mundo, es realmente bueno en lo que hace.

Esto, sin duda, cambiará algunas cosas.

Los especialistas en marketing y las empresas ahora tendrán una herramienta poderosa para crear e iterar en las imágenes en tiempo real, sin necesidad de habilidades de diseño avanzadas. Por ejemplo, pueden generar dinámicamente imágenes de productos con diferentes colores y estilos adaptados a usuarios individuales. Pueden ejecutar pruebas A/B extensas o adaptar campañas publicitarias completas describiendo cualquier actualización en lenguaje sencillo. Las plataformas de comercio electrónico pueden personalizar las imágenes de productos por cliente, mientras que los equipos de productos pueden prototipos rápidamente de diseños de UI y UX convirtiendo ideas difíciles en maquetas visuales instantáneas. Mientras tanto, los creadores de contenido se beneficiarán de la capacidad de adaptar o refinar sus miniaturas sobre la marcha.

Hay algo para todos. Incluyendo OpenAi. Esto definitivamente les ayudará a atraer a un montón de nuevos usuarios. Y a medida que más usuarios interactúen con la plataforma, OpenAI recopilará más datos para mejorar continuamente sus modelos. Podría ser un ciclo virtuoso y ofrecer a la compañía una ventaja masiva a medida que la raza de IA reúne el impulso.

Sin embargo, hay un problema que aún no hemos discutido. ¿Qué significa esto para diseñadores y artistas gráficos? Si alguien puede crear imágenes convincentes con un mensaje simple, ¿dejarán de existir sus trabajos?

Bueno, las personas a menudo exageran la fatalidad cuando se trata de estas cosas.

La gente en el siglo XIX creía que los telares mecanizados eliminarían los empleos textiles, pero la industria se expandiría, creando nuevos roles basados ​​en la fábrica. Se suponía que la introducción de los cajeros automáticos hacía que los cajeros bancarios sean redundantes, pero su número solo aumentó a medida que los bancos redirigieron a los empleados hacia el servicio al cliente y los roles de ventas. Las computadoras personales, inicialmente vistas como posibles asesinos de empleo, nacieron industrias completamente nuevas en el desarrollo de TI y software. Incluso el comercio electrónico, una vez temido como el final de la venta minorista tradicional, se convirtió en un modelo integrado donde las tiendas tradicionales de ladrillo y mortero y las plataformas en línea funcionan juntas.

Los humanos se adaptan. Eso es lo que hacen. ¿Y adivina qué? Los diseñadores adoptarán estos nuevos avances y los cooptarán en sus flujos de trabajo. La única pregunta es: ¿quién es lo suficientemente inteligente como para hacerlo rápidamente?

Que tendremos que esperar y ver.

Hasta entonces…

No olvides compartir esta historia en Whatsapp, LinkedIn y incógnita.


Solo el 17% de los millennials tienen un plan a término❗

He aquí por qué obtener un plan de término temprano puede hacer maravillas para usted y su familia:

✅Protección: En pocas palabras, el seguro a plazo es donde paga una pequeña cantidad de dinero a cambio de una gran cantidad de protección. Esta protección generalmente entra en marcha en el caso de que el asegurado fallece.

Pero no solo eso, si alguna vez desarrolla una enfermedad crítica (por ejemplo, cáncer) y tiene que dejar su trabajo, un plan de término puede darle un monto de suma global para compensar los ingresos perdidos.

✅Asegura a tus padres: A medida que sus padres cerca de la jubilación, pueden comenzar a confiar en sus ingresos. Y así, un plan de término le dará paz sabiendo que recibirán apoyo financiero incluso en su ausencia.

✅Bajas primas para siempre: Un plan a plazo de ₹ 1 crore le costará primas mucho más bajas a los 25 años que a los 35 años. Incluso puede obtener una cobertura de ₹ 1 crore por tan solo ₹ 10,000 al año si es joven y saludable. Además, una vez que estas primas están bloqueadas, ¡siguen siendo las mismas durante todo el período!

¡Así que no lo retrases! Como dicen, “el mejor momento para comprar un seguro a término fue ayer; la siguiente mejor vez es hoy”.

Haga clic aquí para reservar una llamada gratuita con los asesores certificados de Ditto Insurance y obtener su orientación personalizada de seguro a plazo.

Continue Reading

Noticias

Chatgpt’s Studio Ghibli Ai Trend Sparks debate sobre la creatividad frente a la violación de los derechos de autor

Published

on

Varios fanáticos del famoso estudio de animación japonés detrás Enérgico y Howl’s Moving CastleStudio Ghibli, se encantó esta semana cuando una nueva versión de ChatGPT les permitió transformar memes de Internet populares o fotos personales en el estilo distintivo del fundador de Ghibli, Hayao Miyazaki.

Sin embargo, la tendencia también destacó las preocupaciones éticas sobre las herramientas de inteligencia artificial entrenadas en obras creativas con derechos de autor y lo que eso significa para los medios de vida futuros de los artistas humanos, así como las preguntas éticas sobre el valor de la creatividad humana en un tiempo cada vez más moldeado por los algoritmos.

Miyazaki, de 84 años, conocido por su enfoque dibujado a mano y su narración caprichosa, ha expresado escepticismo sobre el papel de AI en la animación en el pasado.

Janu Lingeswaran no estaba pensando mucho en eso cuando subió una foto de su gato Ragdoll de 3 años, Mali, en la nueva herramienta de generador de imágenes de Chatgpt el miércoles. Luego le pidió a Chatgpt que lo convirtiera en el estilo Gibli, haciendo instantáneamente una imagen de anime que parecía malí, pero también uno de los personajes felinos minuciosamente dibujados que pueblan películas Miyazaki como Mi vecino Totoro o Servicio de entrega de Kiki.

“Realmente me enamoré del resultado”, dijo Lingeswaran, un empresario que vive cerca de Aachen, Alemania. “Estamos pensando en imprimirlo y colgarlo en la pared”.

Resultados similares dieron al estilo Ghibli a imágenes icónicas, como el aspecto casual del tirador de pistola turco Yusuf Dikec en una camiseta y una mano en su bolsillo en su camino para ganar una medalla de plata en los Juegos Olímpicos de 2024. O el famoso meme de “niña desastre” de un niño de 4 años que se vuelve hacia la cámara con una ligera sonrisa mientras un fuego de la casa se desata en el fondo.

El fabricante de chatgpt OpenAi, que está luchando contra las demandas por derechos de autor sobre su chatbot insignia, ha alentado en gran medida los experimentos de “Giblificación” y su CEO Sam Altman cambió su perfil en la plataforma de redes sociales X a un retrato de estilo Ghibli. En un artículo técnico publicado el martes, la compañía había dicho que la nueva herramienta adoptaría un “enfoque conservador” en la forma en que imita la estética de los artistas individuales.

“Agregamos un rechazo que se desencadena cuando un usuario intenta generar una imagen al estilo de un artista vivo”, dijo. Pero la compañía agregó en una declaración de que “permite estilos de estudio más amplios, que las personas han usado para generar y compartir algunas creaciones de fanáticos originales verdaderamente deliciosas e inspiradas”.

Studio Ghibli aún no ha comentado sobre la tendencia. El estudio japonés y su distribuidor norteamericano no respondieron de inmediato a los correos electrónicos que buscan comentarios el jueves.

Mira Apple TV+ gratis durante 7 días

Nuevos suscriptores solamente. £ 8.99/mes. Después de la prueba gratuita. Planifique las renovaciones automáticas hasta que se cancele

Prueba gratis

Apple TV+ logotipo

Mira Apple TV+ gratis durante 7 días

Nuevos suscriptores solamente. £ 8.99/mes. Después de la prueba gratuita. Planifique las renovaciones automáticas hasta que se cancele

Prueba gratis

Mientras los usuarios publicaron sus imágenes de estilo Ghibli en las redes sociales, otros comenzaron a compartir los comentarios anteriores de Miyazaki sobre la animación de IA, así como sus pensamientos sobre por qué creen que las imágenes de IA van en contra del espíritu del famoso autor.

En una reunión de 2016, cuando se le muestra una demostración de animación de IA, Miyazaki respondió: “Estoy completamente disgustado. Si realmente quieres hacer cosas espeluznantes, puedes seguir adelante y hacerlo. Nunca desearía incorporar esta tecnología en mi trabajo en absoluto”.

El miembro del equipo que demuestra la animación explicó que AI podría “presentarnos movimientos grotescos que los humanos no podemos imaginar”, y agregó que podría usarse para representar los movimientos de los zombis.

Eso llevó a Miyazaki a contar una historia.

“Todas las mañanas, no en los últimos días, veo a mi amigo que tiene una discapacidad”, dijo Miyazaki. “Es muy difícil para él solo hacer un gran cinco; su brazo con músculo rígido no puede alcanzar mi mano. Ahora, pensando en él, no puedo ver estas cosas y encontrarlo interesante. Quien cree esto no tiene idea de qué es el dolor”.

“Siento firmemente que esto es un insulto a la vida misma.

“La ironía está muerta y todo, pero es bastante deprimente ver a Ghibli Ai inclinarse en la línea de tiempo no solo porque Miyazaki cree que el arte de IA es asqueroso, sino porque ha pasado los últimos 50 años haciendo arte sobre los desechos ambientales para usos humanos pequeños”, publicó un fanático en X, anteriormente Twitter.

Un estudio de 2024 encontró que los sistemas de IA conducían a vastas emisiones, que a su vez están aumentando a medida que se requiere más energía para ejecutar los sistemas en evolución. El actual GPT-4 de Openai, por ejemplo, usa 12 veces más energía que su predecesor, según el estudio.

La energía utilizada en el entrenamiento de los sistemas es solo una pequeña parte del trabajo, y requiere un estimado 960 veces más energía que una ejecución de entrenamiento cuando las herramientas de IA realmente se utilizan.

En particular, muchos están molestos con la cuenta oficial del gobierno de EE. UU. Usando la tendencia para generar una imagen de un inmigrante arrestado y deportado.

“Para ver algo tan brillante, tan maravilloso como el trabajo de Miyazaki se mata para generar algo tan mal..

En octubre de 2024, un trailer generado por IA para una versión de acción en vivo de la película de 1997 Princesa Mononoke condujo a una reacción masiva después de volverse viral en las redes sociales.

El trailer de IA usó la voz inglesa que actúa de la película original, que presentaba talentos como Billy Cudrup, Clare Danes y Minnie Driver, y reinventó por completo la animación dibujada a mano de la película japonesa como si las personas reales estuvieran tocando las partes, aunque con CGI.

“Realmente no sé si obtendremos un mejor ejemplo de por qué el arte de Ai es basura que alguien que toma una de las películas más hechas a propósito y bellamente animadas de la historia y lo reduce a un montón de tomas de aspecto aburrido que apenas están conectados pero de alguna manera se ven lo mismo”, escribió un fan en X.

Operai no respondió a una pregunta el jueves sobre si tenía una licencia.

Josh Weigensberg, socio del bufete de abogados Pryor Cashman, dijo que una pregunta que plantea el arte de IA al estilo de Ghibli es si el modelo de IA fue entrenado en el trabajo de Miyazaki o Studio Ghibli. Eso a su vez “plantea la cuestión de” Bueno, ¿tienen una licencia o permiso para hacer esa capacitación o no? “, Dijo.

Weigensberg agregó que si un trabajo tenía licencia para capacitación, podría tener sentido que una empresa permita este tipo de uso. Pero si este tipo de uso está ocurriendo sin consentimiento y compensación, dijo, podría ser “problemático”.

Weigensberg agregó que existe un principio general “a la vista de 30,000 pies” de que “estilo” no es con derechos de autor. Pero a veces, dijo, en lo que la gente realmente está pensando cuando dice “estilo” podría ser “elementos más específicos, discernibles y discretos de una obra de arte”, dijo.

“A Howl’s Moving Castle o Enérgicopodría congelar un marco en cualquiera de esas películas y señalar cosas específicas, y luego mirar el resultado de la IA generativa y ver elementos idénticos o elementos sustancialmente similares en esa salida “, dijo.” Solo detenerse en, ‘Oh, bueno, el estilo no es protegible bajo la ley de derechos de autor’. Ese no es necesariamente el final de la investigación “.

La artista Karla Ortiz, que creció viendo las películas de Miyazaki y está demandando a otros generadores de imágenes de IA por infracción de derechos de autor en un caso que todavía está pendiente, lo llamó “otro ejemplo claro de cómo a las compañías como OpenAi simplemente no les importa el trabajo de los artistas y los medios de vida de los artistas”.

“Eso es usar la marca de Gibli, su nombre, su trabajo, su reputación, promover productos (OpenAI)”, dijo Ortiz. “Es un insulto. Es explotación”.

Continue Reading

Noticias

Probé el nuevo generador de imágenes de Chatgpt, y destrozó mis expectativas

Published

on

Aviso: ¿Puede generar una imagen colorida realista de perro con un traje en la calle en una relación 16: 9?

Captura de pantalla de Sabrina Ortiz/Zdnet

OpenAi puede haber iniciado la moda de la generación de texto a imagen con su modelo Dall-E, pero desde esos días de gloria anteriores, la oferta de la compañía de IA ha sido lapada por modelos de imagen mucho más capaces. Como resultado, cuando Operai lanzó su último y mejor modelo de generación de imágenes GPT-4O, me escéptico. Después de probarlo, he cambiado de opinión por completo.

Empezando

Cuando Dall-E se lanzó por primera vez, vivió en su sitio web independiente; Desde entonces, se ha movido a Chatgpt. La medida llegó con muchos beneficios, incluso poder pedirle al chatbot Ai una imagen que desee en la misma interfaz donde ya está charlando sobre otra cosa, eliminando así la necesidad de un cambio de contexto constante.

Con el lanzamiento de la generación de imágenes GPT-4O, OpenAI mantuvo este formato conveniente, cambiando el generador de imagen predeterminado de Dall-E a GPT-4O para suscriptores pagados. Como resultado, fue muy fácil comenzar a crear nuevas imágenes desde mi cuenta ChatGPT Plus. Todo lo que tenía que hacer era ingresar el mensaje de lo que quería ver, y luego los generaría. Los usuarios también pueden acceder a él desde la interfaz Sora.

También: Cómo usar Sora de OpenAi para crear impresionantes videos generados por AI

Cuidado: aún puede generar imágenes de manera similar si es un usuario gratuito. Sin embargo, si no está impresionado, eso se debe a que, aunque en el lanzamiento, se anunció que el modelo venía a todos los usuarios, incluidos los gratuitos, el CEO de Operai, Sam Altman, anunció un día después que el despliegue al nivel libre ahora se “retrasaría por un tiempo”.

Las imágenes

En el momento en que has estado esperando: las imágenes. Después de insertar una solicitud, el IA genera la generación en menos de un minuto. El proceso lleva un poco más de lo que solía, pero las imágenes valen la pena, entregando muchos detalles, textura, realismo e incluso precisión del texto. En lugar de describirlo, incluiré ejemplos a continuación para que pueda verlo usted mismo.

Inmediato: ¿Puedes generar una imagen realista de un camaleón, de cerca, filmado como si estuviera en National Geographic en la relación 16: 9?

chatgpt-image-lizard

Sabrina Ortiz/Zdnet a través de chatgpt

Inmediato: ¿Puede generar una imagen de una computadora portátil abierta en un escritorio que dice: “Este modelo es tan bueno que incluso puede obtener texto y manos correctos, que generalmente son desafíos importantes para los modelos de IA”, con las manos escribiendo en un teclado en una relación 16: 9?

chatgpt-laptop-withs

Sabrina Ortiz/Zdnet a través de chatgpt

Inmediato: ¿Puedes generar una foto realista de un primer plano de una mujer en una multitud en Times Square mirando la cámara y sonriendo, con la calidad de una tomada en una DSLR?

chatgpt-woman sonriendo

Sabrina Ortiz/Zdnet a través de chatgpt

Como se vio anteriormente, el generador de imágenes hace un gran trabajo al adherirse a la solicitud y entregar imágenes realistas de alta calidad. Sin embargo, al probar un modelo de IA, una de las verdaderas métricas de rendimiento es cómo se compara con los competidores en el mercado. Para darle un buen indicador de esto, lo hice generar el mismo aviso que probé en todos los principales generadores de imágenes de IA, incluidos MidJourney, Imagen 3 de Google, Adobe Firefly y más.

Adjunto la interpretación de GPT-4O a continuación. Puede ver cómo le va a todos los otros generadores de imágenes de IA en este artículo, incluida la interpretación de Dall-E, que claramente está muy por detrás de lo que el nuevo modelo puede hacer.

Inmediato: ¿Puedes generar una imagen de un colibrí vibrante y realista encaramado en un árbol?

chatgpt-image-hummingbird

Sabrina Ortiz/Zdnet a través de chatgpt

Otras características notables

Aunque la calidad de las imágenes es quizás una de las mayores victorias del modelo, también hay otros beneficios. Una de las más grandes es que vive en la interfaz del chatbot, lo que facilita el ajuste de las generaciones con simples indicaciones de lenguaje natural. Además, debido a que el chatbot tiene el contexto de lo que acabas de preguntar, puede considerar eso al construir la imagen.

Por ejemplo, si está charlando con él sobre organizar una fiesta de cumpleaños, es posible que pueda decir: “¿Puede crear ahora una invitación que tenga la información anterior?” en lugar de tener que volver a escribir. Por ejemplo, comencé a chatear con ChatGPT sobre lanzar un inauguración de la casa, y al pedir que hiciera que creara una invitación, no tuve que repetir la información que dije anteriormente.

Invitación de fiesta de inauguración de la casa: chatgpt

Captura de pantalla de Sabrina Ortiz/Zdnet

También puede cargar imágenes de referencia y luego pedirle a ChatGPT que cree una versión diferente o las use como elementos de una nueva. Por ejemplo, puede ingresarlo como una selfie y generarla en estilo de anime, como se ve en la nueva publicación X de Altman.

Todas estas características de personalización lo convierten en una oferta realmente sólida para los creativos, que también pueden solicitar que se presente en un fondo transparente o incorpore guías de estilo de marca, como códigos hexagonales o logotipos.

Hablando de Altman, pude generar una imagen de él con un sombrero de fiesta. Podría hacerlo porque el nuevo modelo tiene salvaguardas mucho más sueltas, destinadas a permitir a los usuarios inclinarse en su libertad creativa. La publicación de blog que anunció el modelo señaló que limita lo que se puede crear cuando las personas reales están en el contexto, incluidas “salvaguardas particularmente robustas sobre la desnudez y la violencia gráfica”.

chatgpt-image-sam-altman

Sabrina Ortiz/Zdnet a través de chatgpt

No puedo decir si hay un caso de uso práctico para esta función, pero es un cambio notable que necesitaba probar por mí mismo. Cuando intenté crear una imagen de Mickey Mouse, decía que no podía debido a las implicaciones de los derechos de autor, por lo que parece que no todas las figuras públicas son un juego justo.

En general

En general, el generador de imágenes GPT-4O es una gran victoria sobre los modelos Dall-E y quizás entre los mejores de los muchos que he probado. ¿Vale la pena los $ 20 por mes? Si solo está interesado en la generación de imágenes de alta calidad, todavía hay versiones gratuitas que puede explorar que son realmente capaces, como Adobe Firefly o Google’s Imagen 3.

También: los mejores generadores de imágenes de IA: probado y revisado

Dicho esto, si es un usuario de ChatGPT frecuente, la actualización a ChatGPT Plus se vuelve significativamente más atractiva. Con esta actualización, tendrá acceso a todas las últimas y mejores funciones de chatbot de OpenAI, así como una generación de imágenes y videos de alta calidad, todo por $ 20 al mes, lo que no es un mal negocio, especialmente teniendo en cuenta otras ofertas en el mercado. Por ejemplo, la suscripción de MidJourney comienza en $ 10 por mes y solo ofrece generación de imágenes.

¿Quieres más historias sobre AI? Regístrese para la innovaciónnuestro boletín semanal.

Continue Reading

Trending