Noticias
ChatGPT acaba de obtener una gran actualización de generación de imágenes
Published
7 días agoon

Sí, esto es AI.
Crédito: OpenAI
Operai ha aumentado significativamente las capacidades de generación de imágenes de ChatGPT, agregando la actualización como parte del modelo GPT-4O introducido en mayo pasado. El nuevo y mejorado generador de IA se está implementando ahora para todos los usuarios de ChatGPT, en todos los planes pagos y el nivel gratuito (aunque los usuarios gratuitos están más restringidos en cuánto pueden usarlo).
Ha sido posible generar imágenes a través de la interfaz CHATGPT durante un tiempo, aunque detrás de escena el trabajo fue cultivado en el modelo de imagen Dall-E 3. Ahora, todo será manejado por GPT-4O, para una experiencia más consistente y nativa.
Aquí hay muchas mejoras, que cubren algunas de las áreas con las que las herramientas de creador de imágenes de IA generalmente han luchado: representar texto, mantener a los personajes consistentes en las imágenes y los diagramas de dibujo. Operai dice que ahora puede esperar “más preciso, preciso, [and] Resultados fotorrealistas “de sus indicaciones.
Imágenes más realistas y precisas
Las imágenes generadas no son perfectas cada vez, pero se están acercando mucho.
Crédito: Lifehacker a través de chatgpt
Las imágenes hechas con IA a menudo vienen con un brillo artificial que te dice que han sido soñados por algoritmos, y eso debería ser menos obvio con las imágenes GPT-4O. Una de las imágenes de demostración mostradas por OpenAi tiene una mujer escribiendo en una pizarra, con una vista reflejada en ella, todo bien como por vida, aunque tenga en cuenta el pequeño subtítulo en la parte inferior que le dice que este fue el mejor de los ocho intentos que Chatgpt tenía en el aviso.
Los usuarios de arte de IA crean también deberían mantenerse más estrechamente a las indicaciones dadas, dice Openai. Entonces, si desea objetos específicos en lugares específicos, o necesita personas en ciertas posiciones, entonces estas instrucciones aparentemente se llevarán a cabo de manera más fiel. Una de las imágenes de ejemplo más impresionantes muestra una tira cómica de cuatro paneles representada por ChatGPT, sin errores o inconsistencias obvias.
Traté de hacer que Chatgpt convirtiera una novela de Austen en una tira cómica y produzca una imagen fotorrealista de una casa majestuosa con un jardín, y los resultados fueron impresionantes, si no es perfecto. Ciertamente son significativamente mejores de lo que el chatgpt de imágenes estaba produciendo anteriormente, aunque la representación lleva más tiempo completarse (generalmente minutos en lugar de segundos).
El texto y los diagramas se mejoran enormemente

El texto ya no es un problema importante, por lo que se pueden hacer portadas de libros falsos con facilidad.
Crédito: Lifehacker a través de chatgpt
Tratar de lograr que la IA represente el texto y los diagramas con precisión ha sido un desafío durante mucho tiempo: la forma en que se construyen estas herramientas significa que son mucho mejores para inventar y remezclar las imágenes en las que han sido entrenadas, en lugar de reproducir una copia exacta del alfabeto o una serie de rectángulos y flechas.
El nuevo modelo GPT-4O puede hacer que el texto y los diagramas a un alto nivel de detalle y precisión, por lo que no debe ver tantos errores e inconsistencias extrañas. El showreel de OpenAI incluyó un menú, una invitación, un pase de embarque y un diagrama que explica el experimento de prisma de Newton, todo generado a partir de un solo mensaje de texto.
Cuando le pedí a ChatGPT que produjera una infografía que explicara el ADN en términos simples, y una portada del libro con un título y autor especificados, siguió el resumen exactamente: el gráfico era básico pero preciso (según el mensaje), y la portada del libro parecía algo que podría ver en una tienda. Igual de importante, no había artefactos extraños o inconsistencias en las imágenes.
Consistencia y edición

Profesor, ¿eres tú? La consistencia de carácter e imagen todavía necesita algo de trabajo.
Crédito: Lifehacker a través de chatgpt
He escrito antes sobre las limitaciones de la edición de imágenes de ChatGPT, y esta es otra área que se ha actualizado. Ahora es más fácil mantener a los personajes y escenas consistentes entre las imágenes, solo ajustar partes de una imagen y dejar el resto intacta, y construir diferentes capas de una imagen. Incluso puede crear fondos transparentes, si es necesario, o especificar colores utilizando códigos hexadecimales.
¿Qué piensas hasta ahora?
Otras mejoras entran en la forma en que ChatGPT puede aceptar y remezcar sus propias imágenes, e incorporar otra información (de la web y sus datos de capacitación): por lo tanto, una de las imágenes de demostración Operai se construyó a partir de la pronta. “Haga una infografía visual que describa por qué SF está tan nebulosa” y ChatGPT hizo exactamente eso (bueno, mejor tres).
En mis propias pruebas, encontré chatgpt mucho mejor en la edición de imágenes y bastante competente en la remezcla de imágenes en diferentes estilos. Todavía lucha hasta cierto punto manteniendo la consistencia entre las imágenes, especialmente con objetos y caracteres complejos. Definitivamente es mejor de lo que fue en esto, pero todavía hay una tendencia a exagerar las ediciones, haciendo que la IA sea menos útil para ajustar imágenes o hacer una serie de varias imágenes que necesitan coincidir.
Problemas de derechos de autor y seguridad

Los diagramas ahora son mucho menos sin sentido y más precisos.
Crédito: OpenAI
Al igual que con cualquier anuncio generativo de IA, los problemas sobre los derechos de autor, el mal uso y las demandas de energía se me recuerdan una vez más. Operai está registrado diciendo que es imposible construir estas herramientas sin capacitar en imágenes con derechos de autor, aunque recientemente ha comenzado a firmar ofertas de contenido con proveedores como Shutterstock. Brad Lightcap, director de operaciones de OpenAi, le dijo al Wall Street Journal que el generador de imágenes GPT-4O rechazará las solicitudes para imitar el trabajo de cualquier artista vivo.
Cuando se trata de seguridad, Operai dice que las imágenes generadas vienen con metadatos C2PA para identificarlas como generadas por IA, aunque estos metadatos se pueden eliminar fácilmente con algo tan simple como una captura de pantalla. El generador de IA también está construido para rechazar cualquier intento de crear “materiales de abuso sexual infantil y defectos sexuales”, dice OpenAi, así como otras indicaciones que violan sus políticas de contenido.
Este es claramente un gran paso adelante para las imágenes de IA: la tecnología actualizada es realmente asombrosa a veces, y muchos de los signos reveladores de IA y los errores cometidos por la tecnología están desapareciendo. Sin embargo, plantea algunas preguntas importantes sobre el futuro, todos corremos, uno en el que las falsificaciones se realizan tan fácilmente, donde los robots realizan el trabajo creativo en lugar de las personas, y donde perdemos colectivamente nuestra capacidad de dibujar una imagen, crear una oración o escribir una línea de código. Y luego, ¿cómo encontrará la IA generativa más datos de entrenamiento?
You may like

Bienvenido de nuevo al aviso,
El gigante de análisis de datos Palantir está demandando a los fundadores de una startup incipiente llamada Guardian AI por presuntamente robar sus secretos comerciales para comenzar una compañía de IA que ayuda a los hospitales a combatir las negaciones de reclamos de seguros, Forbes reportado. La demanda alega que los cofundadores de la compañía Mayank Jain y Pranav Pillai incorporaron sus startups respaldadas por el combinador días después de salir de Palantir. “No hay trabajo de confusión de acusados para nada más que una estafa de Palantir”, según la demanda.
Ahora vamos a entrar en los titulares.
Grandes jugadas
Compañía de inteligencia artificial de Elon Musk Xai adquirió la plataforma de redes sociales x (anteriormente conocido como Twitter) en una transacción de todo el stock que valorado x a $ 33 mil millonesdijo Musk. Ambas compañías son propiedad de Musk, el hombre más rico del mundo. Xai ya estaba entrenando a sus modelos en los datos de la plataforma. El trato significa que Los modelos de X, el cómputo y el talento se fusionarán en Xai, que ahora está valorado en $ 80 mil millones. X ha estado luchando con un éxodo de usuarios y anunciantes después de que Musk compró la compañía en 2022, y se enfrenta a una competencia creciente gracias a la aparición de plataformas alternativas como Bluesky y Threads.
Muéstrame el dinero
Proveedor de cómputo en la nube Coreweave se hizo público el viernesmarcando la primera IPO del año. La compañía, que alquila el acceso a sus GPU a compañías de IA como Microsoft, Mistral, Meta y Cohere, Terminó fijando fijación de sus acciones en $ 40, por debajo de su objetivo de $ 47 a $ 55, lo que le valió una valoración más baja de lo que había dirigido: $ 23 mil millones. El precio de su acción cerró a $ 52.27 hoy. Fundada por tres comerciantes de productos básicos que compraron cientos de chips de Nvidia para Bitcoin Mining, CoreWeave giró a IA en 2019, una decisión profética que ha tomado todos sus fundadores multimillonarios por Forbes Estimaciones.
Esfuerzos empresariales
Antrópico es emparejamiento con Databricks Vender su conjunto de modelos de IA a los miles de clientes de esa plataforma de análisis de datos que incluye Conde Nast, Comcast y Block. El Deal, que vale $ 100 millones, voluntad Permitir que las empresas construyan agentes de IA —Systems que pueden llevar a cabo tareas específicas en departamentos como el soporte al cliente e ingeniería, utilizando la tecnología de Anthrope.
AI Deal de la semana
Operai cerró un $ 40 mil millones Financiación Ronda, que se dice que es el Acuerdo de tecnología privada más grande en la historia. Pero viene con una trampa: $ 30 mil millones de esa cantidad se lanzarán a finales de año, pero solo si el fabricante de chatgpt se reestructura en una entidad con fines de lucro, según The Wall Street Journal. La inversión, que está dirigida por SoftBank, valora OpenAi en $ 300 mil millones.
Buceo
Miles de personas han usado CHATGPT para crear fotos de estilo ghibli generadas por AI de sí mismas. Los expertos dicen que podría ser la privacidad de los datos de cesta.
getty
Después de que Operai se disparó Nuevas capacidades de generación de imágenes en chatgpt La semana pasada, las plataformas de redes sociales como Instagram, Reddit y X fueron inundado de imágenes generadas por IA que imitó el estilo de popular animador japonés Studio Ghibli, cuyo cofundador Hayao Miyazaki ha llamado arte generado por IA “Un insulto a la vida misma” y se ha opuesto públicamente al uso de inteligencia artificial en el arte.
El CEO de Operai, Sam Altman, y varios otros ejecutivos de Operai han creado y compartido sus propias imágenes “Ghiblified” después de que la compañía ha relajado sus políticas sobre la creación de imágenes en estilos artísticos distintos. Estas imágenes generadas por AI de estilo ghibli tienen rápidamente se volvió viral Como la gente ha creado miles de retratos de ellos mismos y sus familias. Otros han usado ChatGPT para representar escenas de películas y momentos históricamente significativos como los ataques terroristas del 11 de septiembre y el asesinato de John F. Kennedy. Incluso la Casa Blanca publicó una versión de Ai Ghibli de una foto de una mujer que llora siendo arrestada por un oficial de hielo.
La viralidad ha atraído a más personas a chatgpt, que OpenAi ahora afirma que tiene más que 500 millones de usuarios activos semanales. Altman publicó en X que la tendencia ha agregado 1 millón de usuarios, lo que resulta en problemas de capacidad de GPU. “Nuestras GPU se están derritiendo”, dijo.
Muchos miembros de la comunidad Creator han expresado sus preocupaciones con las compañías de IA como OpenAI capacitando sus modelos en trabajos con derechos de autor, incluidos los de Studio Ghibli. “Autores y Los artistas se están enojando cada vez más con el robo a gran escala que está sucediendo“, Dijo Ed Newton Rex, CEO de bastante entrenado.
Pero también hay Riesgos de privacidad significativos con cargar imágenes personales y otros datos confidenciales para chatgpt. Rachel Tobac, una investigadora de privacidad y directora ejecutiva de Socialproof Securies entrenar modelos futuros, a menos que hayan optado activamente por no ser entrenamiento. También existe la posibilidad de que una violación de datos pueda exponer las imágenes al público. “Si quieres retener la propiedad de una foto, no es el camino a seguir”, dijo.
“Algunas personas podrían pensar ‘Oh, espera un minuto. No me di cuenta de que iban a entrenar el algoritmo en la imagen de mi recién nacido. Eso me incomoda'”.
Demostración semanal
Startup de IA Pistacuyo software se usa popularmente para la edición de campo, ha lanzado un nuevo sistema de IA que afirma que puede generar videos de personas específicas, lugares y cosas que son consistente en diferentes marcos— Algo que los modelos de IA han luchado durante mucho tiempo por hacer. Los modelos subyacentes también están mejor capaces de Comprender la física del mundo real y representarlos.
Comportamiento modelo
Investigadores de Dartmouth College publicaron los resultados de los primeros ensayos clínicos sobre generativo Terapia basada en IA Chatbot llamado Therabot. El estudio, que encuestó a unas 100 personas diagnosticadas con depresión, ansiedad o un trastorno alimentario, encontró que las personas Diagnosticado con depresión experimentó una reducción promedio del 51% en los síntomas y mejora general en el bienestar. Ese estudio se produce a medida que las personas recurren cada vez más y conversan con, Chatbots ai y aplicaciones virtuales complementarias.

Google ha lanzado su último modelo de IA, Gemini 2.5 Pro, promocionándolo como el más avanzado hasta ahora. Lanzado en marzo de 2025, Gemini 2.5 Pro es un modelo de razonamiento, lo que significa que está diseñado para “pensar” sobre y verificar su respuesta antes de generarlos. Google dice que el modelo supera a muchos de los principales actores de la industria, especialmente en los puntos de referencia de codificación, matemáticas y ciencias.
¿Qué es Gemini 2.5 Pro?
Gemini 2.5 Pro es un modelo de IA desarrollado por Google que tiene capacidades de razonamiento multimodal y avanzada nativas. También conocido como Gemini 2.5 Pro Experimental, es el modelo inaugural en la serie Gemini 2.5 más grande de la compañía.
Gemini 2.5 Pro está llegando al mercado en un momento particularmente intenso en la carrera armamentista de IA, con compañías como OpenAi, Anthrope, XAI, Deepseek y Baidu compitiendo para desarrollar modelos con capacidades de razonamiento cada vez más sofisticadas. De hecho, este es el segundo lanzamiento centrado en el razonamiento de Google en solo unas pocas semanas, siguiendo de cerca el pensamiento Flash Gemini 2.0. El movimiento es un precursor importante de su objetivo más amplio de desarrollar sistemas de IA agente que no solo puedan pensar como humanos, sino también en tareas completas como ellos, una ambición compartida por muchos de sus compañeros.
“Hemos logrado un nuevo nivel de rendimiento”, dijo Google en una publicación de blog. “En el futuro, estamos construyendo estas capacidades de pensamiento directamente en todos nuestros modelos, para que puedan manejar problemas más complejos y respaldar a los agentes aún más capaces y conscientes del contexto”.
Gemini 2.5 Pro ahora está disponible en Google AI Studio y en la aplicación Gemini. Google también dice que el modelo estará disponible en su plataforma de desarrollo de IA, Vertex AI, “pronto”.
Lectura relacionadaLos nuevos modelos Ernie X1 y 4.5 de Baidu están escalando la carrera armamentista de AI US-China
¿Qué es Gemini 2.5 Pro?
Gemini 2.5 Pro (también llamado Gemini 2.5 Pro Experimental) es el modelo inaugural en la serie Gemini 2.5 de Google. Con capacidades multimodales nativas, Gemini 2.5 Pro puede procesar e interpretar datos de texto, imagen, audio y video dentro de un solo marco. También está diseñado para un razonamiento avanzado, donde descompone metódicamente las tareas y aumenta gradualmente una respuesta en lugar de saltar directamente a una respuesta como un modelo de idioma típico. Como tal, el modelo puede “analizar información, sacar conclusiones lógicas, incorporar contexto y matices y tomar decisiones informadas”, según Google, lo que lo hace especialmente fuerte en áreas como la codificación, las matemáticas, la ciencia y la lógica.
¿Qué puede hacer Gemini 2.5 Pro?
Google dice que Gemini 2.5 Pro tiene una amplia gama de capacidades avanzadas, que incluyen:
- Multimodalidad nativa: El modelo puede comprender e integrar varios tipos de datos diferentes, a saber, texto, imágenes, audio y video, simultáneamente, luego proporcionar respuestas de texto. Por ejemplo, puede analizar un video y generar un resumen de texto relevante.
- Asistencia de codificación: El modelo se puede utilizar para construir todo tipo de productos, incluidas aplicaciones web y videojuegos “visualmente convincentes”, y todas a partir de indicaciones de una sola línea.
- Codificación de agente: Con sus capacidades de razonamiento avanzado, el modelo puede escribir, modificar, depurar y refinar el código independientemente con poca o ninguna supervisión humana.
- Utilización de la herramienta: Gemini 2.5 Pro puede interactuar con otras herramientas y servicios, lo que le permite ejecutar funciones externas, ejecutar código, estructurar datos en formatos específicos (como JSON) e incluso realizar búsquedas. Esta capacidad ayuda al modelo a completar tareas que involucran múltiples pasos, comunicarse con otro software a través de API y formatear sus respuestas para ajustar sistemas específicos.
- Resolución de problemas matemáticos y científicos: El modelo es especialmente bueno en las tareas relacionadas con la ciencia y las matemáticas, lo que demuestra la capacidad de abordar problemas analíticos complejos.
- Ventana de contexto grande: Con una ventana de contexto de hasta 2 millones, el modelo está diseñado para procesar grandes cantidades de datos, lo que le permite analizar largos documentos, manejar bases de código extensas y sintetizar información de múltiples fuentes dentro de una sola consulta.
Lectura relacionada¿Qué es la destilación del modelo?
¿Cómo se compara Gemini 2.5 Pro con otros modelos?
Google probó Gemini 2.5 Pro con otros modelos de tamaños y capacidades similares, incluidos O3-Mini de OpenAI y GPT-4.5, el soneto Claude 3.7 de Anthrope, Xai’s Grok 3 y Deepseek’s R1. Estas comparaciones se centraron en áreas como el razonamiento científico, las matemáticas, la resolución de problemas multimodales, la codificación y las tareas de contexto largo. En general, Gemini 2.5 Pro superó (o llegó en segundo lugar a la mayoría de sus competidores.
Conocimiento y razonamiento
Uno de los logros más significativos de Gemini 2.5 Pro, según Google, fue su desempeño de “estado del arte” en la última evaluación de exámenes de la humanidad, un conjunto de datos creado por cientos de diferentes expertos en temas para probar la amplitud de las habilidades de conocimiento y razonamiento de un modelo. Con el 18.8 por ciento de las respuestas correctas, Gemini 2.5 Pro pareció superar los puntajes de sus competidores aquí por un margen considerable.
Contextos largos y tareas multimodales
Gemini 2.5 Pro obtuvo 91.5 en la prueba de comprensión de lectura de contexto largo, millas por delante de ambos modelos Operai (los únicos otros probados en esto). También lideró el paquete en comprensión multimodal.
Matemáticas y ciencias
Las capacidades de razonamiento de Gemini 2.5 Pro llegaron en las pruebas relacionadas con la ciencia y las matemáticas, anotando en lo alto de los puntos de referencia de IA como GPQA Diamond, AIME 2024 y AIME 2025. Sin embargo, Claude 3.7 Sonnet y Grok 3 se desempeñaron marginalmente mejor en un par de pruebas.
Codificación
En los puntos de referencia que probaron el desinfectación, el razonamiento de múltiples archivos y la codificación de agente, Gemini 2.5 Pro funcionó bien, pero no dominó, detrás de Claude 3.7 Sonnet y Grok 3. Sin embargo, el modelo salió adelante en la edición de código.
Géminis 2.5 PROMITACIONES
Al igual que cualquier otro modelo de idioma, Gemini 2.5 Pro tiene la capacidad de producir respuestas inexactas, y puede reflejar los sesgos presentes en sus datos de capacitación. Tampoco funcionó tan bien en áreas como la generación de códigos y la precisión objetiva, donde los modelos de OpenAI eran más fuertes.
Más contenido de IAFinger de alineación: cuando los modelos de IA engañan a sus creadores
Cómo acceder a Gemini 2.5 Pro
Hay varias formas de acceder a Gemini 2.5 Pro, dependiendo de sus necesidades.
- Aplicación Géminis: Esta es probablemente la forma más fácil de probar Gemini 2.5 Pro en dispositivos móviles y web. Ahora está disponible de forma gratuita, así como para usuarios avanzados de Gemini.
- Google AI Studio: Esto le dará más control sobre las entradas, el uso de la herramienta y las indicaciones multimodales. Es gratis (por ahora) y admite entradas de texto, imagen, video y audio. Después de crear una cuenta, simplemente seleccione Gemini 2.5 Pro en el menú desplegable del modelo.
- Géminis 2.5 Pro API: Para obtener más flexibilidad, puede usar la API de Gemini para integrar el modelo en sus propias aplicaciones y flujos de trabajo. Puede llamar al modelo directamente al habilitar el uso de la herramienta, obtener respuestas estructuradas y procesar documentos largos automáticamente. Hay más detalles técnicos disponibles aquí.
¿Qué puede hacer Gemini 2.5 Pro?
Gemini 2.5 Pro puede procesar y comprender múltiples tipos de datos a la vez, incluidos texto, imágenes, audio y video. También se destaca en las tareas que implican un razonamiento avanzado, que muestra una fortaleza particular en áreas como las matemáticas, la ciencia y la codificación.
¿Gemini 2.5 Pro es gratis?
Sí, Gemini 2.5 Pro está disponible de forma gratuita en la aplicación Gemini.
¿Está disponible Gemini 2.5 Pro?
Sí, Gemini 2.5 Pro está disponible en la aplicación Gemini y Google AI Studio. Google también dice que el modelo estará disponible en su plataforma de desarrollo de IA, Vertex AI, “pronto”.
Noticias
Miyazaki de OpenAi’s Miyazaki se acomoda en una nueva era preocupante para Hollywood
Published
10 horas agoon
1 abril, 2025
Al comienzo del clásico moderno de Hayao Miyazaki Enérgicola joven heroína Chihiro y sus padres están explorando un parque temático aparentemente abandonado cuando un niño llamado Haku la saluda con una advertencia: Chihiro debe cruzarse sobre un lecho seco y regresar a casa antes del atardecer mientras aún puede. Ella no lo hace, y pronto encuentra el río hinchado y sus padres se convierten en cerdos, varados en un mundo nuevo que no entiende.
Los fanáticos del gigante de la animación encontrarán la parábola un poco más relevante en estos días. Como probablemente escuchó, OpenAi el 25 de marzo lanzó una herramienta que permite que cualquier foto se reúna al estilo de (entre otros) Miyazaki y su famoso estudio Ghibli. Pronto millones de personas estaban haciendo exactamente eso, impulsado por el descarado líder de Openi, Sam Altman, quien convirtió su propia foto de perfil de Gainy X en un niño soñador y ligeramente perdido que podría haber deambulado por el castillo conmovedor de Howl.
Operai había presentado una actualización de 4O, uno de los “GPT” que lanzó el año pasado, para habilitar la generación de imágenes de alta gama. Pagar suscriptores se lo comió, inundando las redes sociales con los extraños resultados. Cuando Altman cayó el lunes, “El lanzamiento de ChatGPT hace 26 meses fue uno de los momentos virales más locos que había visto, y agregamos un millón de usuarios en cinco días. [With this] Agregamos un millón de usuarios en la última hora “.
¿Y por qué no? Las creaciones de Miyazaki reflejan una estética a medida, única, llegada a partir de miles de horas de trabajo humano y un buen sueño anticuado. La idea de fusionar eso con las fotos de nuestro último viaje familiar a Disneyland, que usa nada más que unas pocas teclas, puede resultar demasiado agradable para resistir.
Por supuesto, una cierta ironía cumplió en una máquina que generó imágenes para honrar a alguien que los dibujó tan meticulosamente con sus propios dedos. El propio Miyazaki ha denunciado el uso de la IA en el arte: “Siento firmemente que esto es un insulto a la vida misma”, dijo en 2016, no atentamente, un punto que cuando se yuxtapone con tantas personas que desatan la herramienta en homenaje a su trabajo se convirtió en su acto hilarante y un poco creciente. Si Altman ha observado esta asimetría, no ha dicho.
Todo esto está sucediendo incluso cuando un juez federal tiene luz verde The New York Times‘demanda contra OpenAI para capacitar a ChatGPT en decenas de sus artículos sin permiso, subrayando los problemas de derechos de autor en juego. Técnicamente Openai, consciente al menos ópticamente de problemas de infracción, programó la herramienta de imagen para no permitir la imitación de un artista específico. Pero no promulgó tal regla para un estudio, por lo que nuestros feeds pronto fueron invadidos por una estética de Ghibli.
Esto también está sucediendo a medida que los estudios han comenzado a hablar con OpenAi, ya sea ver los ingresos adicionales ahora como superando las ganancias perdidas más tarde, o, lo más probable, ver que en ausencia de cualquier capacidad real para defenderse, también podrían embolsar algunos centavos adicionales que gastarlos en una demanda (aparte de Lionsgate, ningún estudio importante aún tiene un acuerdo oficialmente que sea un acuerdo que sea un acuerdo que permita que los modelos de Openi se entrenen en su IP, pero que puede ser un tiempo de anuncio oficialmente, pero puede ser un IP de IP, pero es posible que sea un tiempo de antemano, pero puede ser un tiempo de antemano. El sustantivo apto: Dotdash Meredith, editor de Behemoths como Gente y Viajes + ocioreveló que su acuerdo de OpenAI anotó un total de $ 16 millones el año pasado, apenas un salvador para una compañía con casi medio mil millones de dólares en ingresos de publicación.
La conquista Ghibli de Openai se encontró con resistencia de algunos creativos de Hollywood. Alex Hirsch, el creador del éxito de Disney Channel de la era de 2010 Caída de la gravedadsarcásticamente respondió a Altman “¡Guau, felicidades! ¡Usando el trabajo de Gibli para entrenar a su modelo y el nombre de Gibli para promoverlo realmente te ayudó a generar grandes ingresos! ¡Y el hecho de que estás planeando pagar un gran cheque de regalías a Gibli demuestra que también eres un gran tipo!”
Gkids, el distribuidor estadounidense de Gibli, ofreció una sombra ligeramente más baja cuando, al anunciar una nueva restauración IMAX de la fantasía histórica de Miyazaki de 1997 Princesa Mononoke, El vicepresidente de distribución de la compañía, Chance Huskey, señaló secamente que “en un momento en que la tecnología intenta replicar a la humanidad, estamos encantados de que el público valore una experiencia teatral que respeta y celebra Hayao Miyazaki y el estudio maestro de Studio Ghibli en toda su gloria cinematográfica de drava a mano”.
Y Reid Southen, el ilustrador conceptual que se ha convertido en uno de los mayores críticos de Hollywood de la ola de generación de imágenes de IA, replicada a Altman: “Sigue publicando cuántos usuarios estás ganando después del truco de Ghibli, solo fortalece el [NYT’s] caso en tu contra, genio “.
Esta línea de argumentos tiene muchos adherentes: a unas 25,000 personas les gustó la publicación de Hirsch. Desafortunadamente, probablemente ninguno de ellos dirige los estudios de Hollywood.
En el corazón de la moda de Ghibli hay algo bueno: el deseo de las personas de conectarse con un artista ferozmente querido, las imágenes son un testimonio de la profundidad y el alcance de la influencia de Miyazaki. Pero en la raíz también hay algo muy tenso, una voluntad de ver todo el arte como intercambiable y compra. La frenética apresurada para convertir nuestros recuerdos en una tarjeta de felicitación personalizada de Miyazaki es, a través de una lente, un testimonio de nuestro amor por el artista, pero es aún más un testimonio de nuestro amor por nosotros mismos, y aparentemente ninguna preocupación por derechos de autor ni santidad de arte de arte puede evitar que lo cumplamos.
En cierto modo, Ghiblai es el punto final, o al menos el último punto distante, de una tendencia que ha estado emergiendo por un tiempo. Si el cine durante más de 100 años fue sobre el portal de un mundo lejano (¿quién lo representa mejor que Miyazaki?) Y las redes sociales durante las últimas dos décadas sobre colocarnos en el centro del drama, la nueva herramienta de OpenAi los lleva a una convergencia perfecta. Ya no tenemos que ver la relación de Ponyo con su Salvador Sosuke, o el viaje principesco de Ashitaka para enfrentar el espíritu del bosque, o la búsqueda de Mahito con una Heron que habla para encontrar a su madre durante la guerra del Pacífico, como cosas de la historia antigua y las tierras mágicas. Está justo aquí, ahora mismo, desarrollándose en la fiesta de Navidad de la oficina del sexto piso del pasado diciembre.
Donde esto va desde aquí, nadie lo sabe. Pero, por supuesto, lo sabemos, el movimiento de Myspace a Facebook a Instagram a Tiktok, y sus muchos filtros y mejoras en el camino, proporcionan todos los carteles que necesitamos. El siguiente paso en nuestra cultura de auto-posesión no es solo dejarnos caer en la historia, sino pintarla en los tonos de los grandes artistas que vinieron antes. Está convirtiendo una vasta historia cinematográfica en otra pulsera que usamos al pasar el rato en el centro comercial digital.
Podríamos ver este camino por delante incluso si no sintiéramos la amplia desesperación de Hollywood Studios, quien después de años tratando de saquear recuerdos a través de reinicios y secuelas ahora están encontrando sus esfuerzos produciendo rendimientos decrecientes. En las compañías que una vez crearon y protegieron, estos recuerdos, muchos ejecutivos piensan que la única ruta comercial es convertir imágenes y eventualmente en audio y video en el tipo de personalización sugerido por este movimiento de OpenAI, para digitalizar el Miyazaki sin importar las disonancias cognitivas, para aprovechar una máquina inconsciente de una máquina colectiva sin importar sus trabajos como fábricas de la fábrica de ensueño.
Claro, algunos estudios pueden permanecer en espera, y algunos incluso pueden ganar algunas victorias legales. Pero la marea aparece con lo personalizado y el automatizado, hacia las máquinas que saldrán y se alejarán de las mentes creativas que solo se mueven, en el proceso que permite a OpenAi interrumpir masivamente la industria del entretenimiento. Después de todo, la compañía acaba de recaudar $ 40 mil millones a una valoración de $ 300 mil millones. Ya se está convirtiendo en una entidad más grande que algunos de los estudios que alguna vez fueron muy cómodos que dirigieron Hollywood.
Como Enérgico Se despliega, un maestro de tareas todopoderoso atormenta a sus trabajadores en este nuevo mundo extraño, cambiando sus nombres para que olviden quiénes son. Haku llega con otra advertencia: no olvides tu nombre o dejarás de existir, le dice a Chihiro. Ella se mira a sí misma, apenas recordando a su apodo de toda la vida, tratando de recordar su identidad antes de que desaparezca para siempre.
Related posts
















































































































































































































































Trending
-
Startups10 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Startups9 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Tutoriales11 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Recursos11 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups11 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos11 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Recursos10 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Noticias9 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo