Noticias
Chips personalizados Operai: Breaking Nvidia’s Ai Grip
Published
1 mes agoon

Si bien la investigación temprana de IA se benefició de los procesadores de uso general, la creciente complejidad de los modelos modernos de IA ha requerido la búsqueda de hardware más especializado. Recientemente, Operai ha anunciado un movimiento significativo para desarrollar su primer chip IA interno, una innovación que promete superar los límites del rendimiento y la eficiencia de la IA.
Cosas clave para saber:
- Operai está desarrollando su primer chip AI interno: La compañía tiene como objetivo finalizar su diseño personalizado de silicio de IA en los próximos meses, con la fabricación manejada por TSMC utilizando tecnología avanzada de 3 nanómetros.
- Reducción de la dependencia de Nvidia: Con Nvidia que actualmente dominaba el mercado de hardware de IA, el movimiento de OpenAI se alinea con una tendencia más amplia de la industria de las empresas, incluidas Google y Microsoft, invirtiendo en chips de IA personalizados para diversificar su ecosistema de hardware.
- Costo significativo y factores de riesgo: Diseñar y fabricar chips de IA es un proceso costoso, con una sola iteración potencialmente superior a £ 500 millones. El éxito de OpenAI dependerá de la eficiencia de su primera optimización de software de cinta adhesiva y a largo plazo.
- Panorama competitivo e implicaciones futuras: Se espera que el chip de OpenAI se centre inicialmente en la inferencia de IA, con iteraciones futuras que mejoran las capacidades de capacitación. Este movimiento podría mejorar la eficiencia de la IA, reducir los costos operativos y remodelar la dinámica competitiva del desarrollo de hardware de IA.
¿Qué desafíos enfrentan los sistemas de IA de hoy, qué ha desarrollado exactamente Openai (y otros) y cuáles podrían ser las implicaciones más amplias de estos chips de IA personalizados para el futuro de la investigación y la industria de la IA?
Las primeras raíces de los aceleradores de IA
El desarrollo de la inteligencia artificial ha sido un viaje largo y arduo, con numerosos contratiempos y desafíos en el camino. A pesar de La promesa temprana de AIlos primeros experimentos estuvieron severamente limitados por el hardware con poco potencia que era Disponible en ese momento. Las demandas computacionales de los modelos de IA continuaron creciendo, pero las arquitecturas de procesadores existentes lucharon para mantenerse al día, obstáculos Eso afectó significativamente la tasa de progreso de la investigación.
Como el campo de La IA continuó evolucionando, la necesidad de un hardware más potente se hizo cada vez más evidente. Sin embargo, las opciones existentes no solo eran inadecuadas sino también ineficientes. Procesadores de uso general, que eran la norma al comienzo de la revolución de la IA, no pudieron Manee las demandas en rápido crecimiento de los modelos de IA complejos. La necesidad de hardware especializado se hizo claro, pero encontrar una solución demostró ser una tarea desalentadora.
Una de las primeras soluciones para el Limitaciones de los procesadores de uso general fue el uso de GPU. Mientras que las GPU no fueron diseñado específicamente Para las tareas de IA, su arquitectura masivamente paralela las hizo muy adecuadas para cierto Aplicaciones AI. Sin embargo, el uso de GPU llegó con la suya de desafíos, ya que su arquitectura no se optimizó para la IA y, por lo tanto, desperdició recursos significativos en las tareas que fueron no relevante a ai. Esta ineficiencia no solo limitado el rendimiento de las GPU en aplicaciones de IA pero también aumentó el costo general de usarlos.
El siguiente paso en el desarrollo del hardware de IA fue la introducción de silicio personalizado. Por Diseñando un chip específicamente para AIlos investigadores esperaban superar las limitaciones e ineficiencias del hardware existente. Sin embargo, el silicio personalizado también vino con una variedad de desafíos que dificultaron la implementación. El alto costo de diseño y fabricación de silicio personalizado lo hizo inaccesible para la mayoría de los investigadores, y los largos plazos de entrega para el desarrollo de chips personalizados hicieron difícil mantener el ritmo del campo de IA en rápida evolución.
OpenAi para desarrollar chip de IA interno para fin de año
En un movimiento hacia Reducir su dependencia únicamente de Nvidia para el hardware de inteligencia artificial, Abierta ai está desarrollando su primer chip de IA interno. Según los informes de Reuters, la compañía planea finalizar su diseño en unos pocos meses, con la fabricación llevar a cabo por Taiwan Semiconductor Company (TSCM) utilizando su tecnología de proceso de 3NM.
El desarrollo del chip, que se espera en el cuarto trimestre de 2022, verá a OpenAI utilizar el proceso TSMCS 3N, que tiene un tamaño de nodo de 3 nanómetros. El chip se utilizará principalmente para ejecutar AI algoritmos, e inicialmente se integrará en Infraestructura de Openai sobre una base experimental. Se espera que las versiones futuras del dispositivo tengan capacidades mejoradas a medida que continúa OpenAI continúa para desarrollar ambos sus capacidades de software y hardware.
El papel de TSMC en la fabricación de chips de IA
La tecnología de proceso de 3 nanómetros de TSMC se encuentra entre los métodos de fabricación de chips más avanzados actualmente disponibles. La transición a la fabricación de 3NM permite una mayor densidad de transistores, mejorando la eficiencia energética y el rendimiento al tiempo que reduce la disipación de calor. Con OpenAI aprovechando esta tecnología de vanguardia, sus chips de IA personalizados podrían ofrecer optimizaciones específicas para las cargas de trabajo de aprendizaje automático.
Si bien la dependencia de OpenAI en TSMC marca una asociación estratégica, también refleja tendencias de la industria más amplias. Los competidores como Apple y Nvidia también están invirtiendo en gran medida en los procesos de fabricación de TSMC, lo que refuerza el dominio de la fundición en la informática de alto rendimiento. Sin embargo, las limitaciones de la cadena de suministro y los factores geopolíticos que rodean la fabricación de semiconductores podrían plantear desafíos para OpenAi a medida que escala su producción de chips de IA.
El movimiento de OpenAi viene como resultado de Los crecientes costos que enfrentan las empresas en la industria de la IAasí como el dependencia de productos nvidia. Como tal, muchos empresas están buscando diversificar sus capacidades de hardware, Y esto también está siendo visto en el desarrollo de hardware de IA personalizado por otras compañías.
Cambio estratégico hacia la independencia de hardware de IA
La creciente dependencia de la industria de la IA de NVIDIA ha llevado a las empresas a explorar el desarrollo de chips personalizados, no solo para la reducción de costos sino también para el apalancamiento estratégico. Nvidia actualmente posee aproximadamente el 80% del mercado de chips de IA, lo que lo convierte en el proveedor dominante. Sin embargo, los gigantes de la computación en la nube como Microsoft, Google y Amazon han iniciado esfuerzos para reducir la dependencia de los proveedores de terceros invirtiendo en chips de IA patentados.
Para OpenAI, el desarrollo de un chip AI interno permite una integración más profunda entre hardware y software, potencialmente desbloqueando la eficiencia que no se puede lograr con GPU listas para usar. Las unidades de procesamiento de tensor de Google (TPU) y los chips de entrenamiento de Amazon ilustran cómo el silicio personalizado puede mejorar el rendimiento de la IA al tiempo que reduce los gastos operativos en los centros de datos a gran escala.
Sin embargo, la transición lejos de los proveedores de chips establecidos presenta desafíos. A diferencia de Nvidia, que tiene décadas de experiencia en la optimización del hardware de IA, el programa de desarrollo de chips de OpenAI todavía está en su infancia. La ejecución exitosa requerirá no solo la experiencia de fabricación, sino también la optimización de software a largo plazo para aprovechar completamente las ventajas de hardware personalizadas.
Uno de esos ejemplos es Google, que han desarrollado su propia gama de chips de IA. Estos dispositivos están acostumbrados a Modelos de IA de Google de Google, y han sido críticos en El éxito de los servicios de IA basados en la nube de Google.
Comparación de la estrategia de chip de IA de OpenAI con los competidores
Las chips MTIA de Google y MTIA sirven como puntos de referencia para cómo se puede integrar el silicio de IA personalizado en operaciones a gran escala. La arquitectura TPU de Google está optimizada específicamente para tareas de aprendizaje profundo, lo que le permite superar las GPU tradicionales en ciertas cargas de trabajo al tiempo que reduce el consumo de energía. Del mismo modo, los chips de IA internos de Meta tienen como objetivo mejorar la eficiencia en los procesos de capacitación e inferencia para modelos de idiomas grandes.
El enfoque de OpenAI difiere en que se espera que su chip de primera generación se despliegue en una escala más limitada, centrándose inicialmente en la inferencia en lugar de la capacitación a gran escala. Esto sugiere una entrada cautelosa pero estratégica en el espacio de hardware, reflejando cómo otras compañías de IA expandieron gradualmente sus iniciativas de chips antes de lograr la independencia a gran escala de NVIDIA.
Dada la inversión sustancial requerida para el desarrollo de chips de IA, estimado en más de £ 500 millones para una sola iteración, Openai necesitará navegar cuidadosamente los riesgos financieros y técnicos asociados con su hoja de ruta de hardware.
Sin embargo, desarrollar un chip AI no es una hazaña pequeña, y puede ser un proceso costoso. Un solo tapón de un chip puede costar millones de libras, y el tiempo necesario para diseñar y probar un chip es significativo. Además, no hay garantía de éxito, y una sola falla de diseño puede ver un proyecto abandonado.
Los desafíos de la fabricación de chips ai
La fabricación de un chip AI es un proceso complejo de varias etapas que requiere ingeniería precisa y una validación extensa. La fase de diseño inicial implica una rigurosa simulación y creación de prototipos para garantizar que la arquitectura satisfaga las demandas de las cargas de trabajo de IA. Una vez grabado, el chip debe someterse a una validación de silicio para identificar y rectificar posibles defectos de diseño.
Dados los altos costos asociados con un solo tapón, el éxito de OpenAI dependerá de si su primera iteración funciona según lo previsto. Si el diseño inicial requiere revisiones sustanciales, la Compañía puede enfrentar retrasos extendidos y tensión financiera adicional. Esta es una razón clave por la cual los gigantes tecnológicos como Apple y Microsoft iteran en múltiples generaciones de chips antes de lograr la viabilidad de producción completa.
Además, Operai también debe considerar el ecosistema de software que rodea su hardware. El dominio de Nvidia no es solo el resultado de sus chips, sino también la robustez de su pila de software CUDA. Para que Operai compite de manera efectiva, deberá asegurarse de que su chip de IA personalizado se integre sin problemas con los marcos de aprendizaje automático existentes, minimizando las brechas de compatibilidad para los desarrolladores.
El futuro de los ICS personalizados en la IA
El empuje hacia el desarrollo de chips internos para la IA, como la ser Desarrollado por Open AI, señala una nueva era en la evolución del hardware especializado. Como se discutió anteriormente, los chips de uso general han demostrado ser inadecuado para manejar los complejos cálculos requeridos por los modelos de IA modernos (las primeras raíces de la aceleración de IA). Si bien las GPU han sido una solución valiosa para acelerar los cálculos de IA, no son optimizado específicamente Para estas tareas, lo que lleva a recursos desperdiciados y un rendimiento reducido. El desarrollo de silicio personalizado, específicamente diseñado para acelerar los cálculos de IA complejos de manera eficiente, representa un paso significativo en el avance de el campo.
Creando sus propias chips de IA, Empresas como Open AI puede adaptar el hardware para satisfacer sus necesidades específicasasegurando la máxima eficiencia y rendimiento. Este enfoque hiperpecializado permite la reducción de Recursos desperdiciados, que permiten el desarrollo de modelos de IA más sofisticados que pueden abordar tareas complejas. La capacidad de adaptarse Rápidamente al panorama en evolución del campo AI también se vuelve más factible con el hardware personalizado, ya que las actualizaciones y modificaciones se pueden hacer más fácil y rápidamente con el enfoque tradicional de confiar en el hardware de uso general.
Mientras el desarrollo de Chips de IA internos presenta numerosos beneficiostambién presenta nuevos desafíos que deben abordarse. Uno del Las principales preocupaciones son el potencial para la creación de cuellos de botella en el ciclo de desarrollo. A medida que la demanda de modelos IA más complejos y potentes continúa creciendo la necesidad de hardware aún más avanzado se hace evidente. Si el desarrollo y la fabricación de dicho hardware no pueden mantener el ritmo de la rápida evolución del paisaje de IA, puede surgir un nuevo cuello de botella, obstaculizando el progreso del campo.
Independientemente de tales desafíos, la introducción de Los chips personalizados de Open AI es un excelente ejemplo de cómo las empresas se están moviendo hacia soluciones de silicio personalizadas para IA. Al desarrollar su propio hardware, las empresas pueden adaptar sus diseños para cumplir las necesidades específicas de sus sistemas de IA, reduciendo la cantidad de desperdiciado recursos, y mejorar el rendimiento general. Además el desarrollo por OpenAi de es First AI Chip demuestra cómo la industria está cambiando hacia un enfoque más personalizado para el hardware de IA.
You may like
Noticias
Operai golpea a Elon Musk con contador • El registro
Published
58 minutos agoon
10 abril, 2025
Operai ha contrarrestado al cofundador Elon Musk, acusándolo de tácticas ilegales e injustas para descarrilar sus planes de reestructuración y exigir que un juez lo responsabilice por el daño presuntamente infligido en la AI Super-Lab.
El contador considerable [PDF] y la respuesta a las afirmaciones de Musk se presentó ayer en el Tribunal Federal de California. Si bien acusa al magnate de Tesla de una amplia gama de comportamientos destinados a socavar las operaciones de OpenAI, incluido “acoso, interferencia y información errónea”, las dos reclamaciones de alivio de la Contadora se concentran en el intento de febrero de Musk para comprar el fabricante de ChatGPT por $ 97.375 mil millones. Si bien el equipo de Musk ha retratado la oferta como genuina, los abogados de OpenAi lo llaman algo completamente diferente.
En lugar de una oferta de adquisición seria, OpenAI afirma que la medida de Musk fue una “simulada” diseñada “para interferir con la reestructuración corporativa contemplada de OpenAI”. Musk ya no está involucrado en OpenAi y dirige un atuendo de inteligencia artificial rival, Xai, entre otros negocios.
“La carta no incluía evidencia de financiamiento para pagar el precio de compra de casi $ 100 mil millones”, dijo Openai en su presentación de contadores, y agregó que ninguno de los inversores enumerados en la carta de intención de Musk había hecho ninguna diligencia debida. Más tarde, un inversor admitió, según los registros de la corte, que la intención de Musk era obtener acceso a los materiales internos de Openi a través de los procedimientos legales y “detrás de la pared” en el Super Lab de respaldo de Microsoft.
“Aunque OpenAi reconoció la oferta como una finta, su mera existencia, y la tormenta de fuego de los medios que lo rodean, requirió OpenAi para gastar recursos significativos en la respuesta”, dijo el gigante de la IA.
Es ese esfuerzo, y la llamada “oferta simulada”, lo que llevó a OpenAi a acusar a Musk de prácticas comerciales injustas y fraudulentas, así como una interferencia tortuosa con prospectivo ventaja económica (es decir, cuando un tercero interrumpe un posible acuerdo en detrimento del demandante).
Operai está buscando un alivio cautelar para detener la supuesta interferencia y restitución de Musk por los recursos que, según los que afirma, respondieron a su oferta.
Le preguntamos a OpenAi qué esperaba lograr, y nos dirigió a la presentación de la corte y a sus comentarios realizados en la X de Musk, donde el negocio AI dijo que el contador estaba destinado a detener sus “tácticas de mala fe para reducir la velocidad de OpenAi y aprovechar el control de las innovaciones principales de la IA para su beneficio personal”.
[Musk] Intenté confiscar el control de OpenAi y fusionarlo con Tesla como un fin de lucro: sus propios correos electrónicos lo demuestran. Cuando no se salió con la suya, se quedó
“Elon nunca ha sido sobre la misión. Siempre ha tenido su propia agenda”, continuó Openai. “Trató de confiscar el control de OpenAi y fusionarlo con Tesla como una con fines de lucro: sus propios correos electrónicos lo demuestran. Cuando no se salió con la suya, se fue”.
La muy breve historia de una disputa multimillonaria
Para aquellos que han hecho todo lo posible para ignorar la disputa del jefe de Musk y Operai, Sam Altman, puede ser necesaria un poco de historia.
Musk fue uno de los cofundadores de OpenAi, pero se asaltó en 2018 luego de desacuerdos internos sobre el control y la dirección estratégica. Operai alega que el Oligarch SpaceX propuso fusionarse OpenAi con Tesla (que tiene objetivos autónomos impulsados por IA) o buscó un control total, que el equipo de Altman rechazó, lo que llevó a su salida.
En un momento, el liderazgo de Openi temía que Musk se convertiría en un “dictador” de AGI, o poderosa inteligencia general artificial, si se le permitiera un control completo sobre el laboratorio, a juzgar por correos electrónicos surgió durante esta batalla legal.
“Usted declaró que no desea controlar el AGI final, pero durante esta negociación, nos ha demostrado que el control absoluto es extremadamente importante para usted”, escribió Musk, cofundador y mega-boffin Ilya Sutskever. “El objetivo de OpenAi es hacer el futuro el futuro y evitar una dictadura AGI”.
En marzo de 2024, Musk demandó a Openai y Altman alegando incumplimiento de contrato, prácticas comerciales injustas y fallas fiduciarias relacionadas con la estrecha asociación de OpenAI con Microsoft y el establecimiento de una subsidiaria con fines de lucro. (Openai comenzó como una organización sin fines de lucro).
Musk retiró esta demanda en junio del año pasado sin proporcionar una razón pública, pero presentó una casi idéntica un par de meses después. Afirmó el cambio de OpenAi hacia un modelo con fines de lucro contradecía su misión original de desarrollar IA en beneficio de la humanidad.
El equipo legal de Openai describió la queja de Musk como “Lurch[ing] De la teoría a la teoría, distorsione[ing] sus propias exhibiciones y comercio[ing] De principio a fin en conclusiones sin hechos y a menudo ad hominem “.
Operai niega que se esté convirtiendo en una empresa única con fines de lucro, afirmando en su contratación que su plan de reestructuración solo vería que su subsidiaria con fines de lucro se convirtió en una corporación de beneficios público. Ese movimiento es necesario, afirmado Openai, para permitir que el equipo compita mejor por el capital “al servicio de la misión de desarrollar AGI en beneficio de la humanidad”. Dicho esto, Operai continúa recaudando decenas de miles de millones de dólares en fondos, $ 40 mil millones tan recientemente como finales de marzo.
Un portavoz de Operai le dijo además El registro No tenía intención de abandonar su núcleo sin fines de lucro.
“Nuestra junta ha sido muy clara de que tenemos la intención de fortalecer la organización sin fines de lucro para que pueda cumplir su misión a largo plazo”, nos dijo Openai. “No lo estamos vendiendo, estamos duplicando su trabajo”.
Operai también nos señaló el anuncio de la semana pasada de una comisión que comprende expertos en salud, ciencia, educación y servicios públicos para guiar la evolución planificada de las ORG.
“Esperamos los aportes y los consejos de los líderes que tienen experiencia en organizaciones comunitarias sobre cómo podemos ayudarlos a lograr sus misiones”, dijo Openai en un comunicado enviado por correo electrónico.
Sin embargo, OpenAi tiene que completar su transición a una entidad con fines de lucro a fines de 2025 para asegurar que los $ 40 mil millones mencionados anteriormente en fondos dirigidos por SoftBank.
Es probable que la demanda de Musk solo desacelere, especialmente porque el juicio, según una orden previa al juicio esta semana, no se debe comenzar hasta marzo de 2026.
Ni Musk, famoso ahora, la grasa Eminence del presidente Trump, ni su equipo legal respondieron a preguntas para esta historia. ®
Noticias
La generación de imágenes en chatgpt se ha mejorado mucho
Published
1 hora agoon
10 abril, 2025
Resumen
-
La generación de imágenes 4O en ChatGPT ofrece imágenes fotorrealistas con una consistencia mejorada y sigue con precisión las instrucciones.
-
Los usuarios pueden convertir imágenes en diferentes estilos y refinarlas a través de indicaciones.
-
Las imágenes cargadas se pueden emplear como referencias, o ChatGPT puede utilizar su propia base de conocimiento.
Cuando Operai deja una nueva característica, a menudo hay una pequeña cantidad de zumbido entre las personas interesadas, pero rara vez rompe Internet. Sin embargo, con el lanzamiento de un modelo actualizado de generación de imágenes, ChatGPT hizo exactamente eso.
La generación de imágenes 4O ha reemplazado a Dall-E como la herramienta de generación de imágenes predeterminada en ChatGPT, y los resultados son muy impresionantes. Ha llevado a que las personas inundan Internet con imágenes que han generado utilizando la herramienta, y su popularidad parece haber tomado por sorpresa por sorpresa.
La generación de imágenes 4O está integrada en GPT-4O
Como su nombre indica, 4O Generación de imágenes está integrada en el modelo GPT-4O. Mientras esté utilizando ese modelo, no necesita hacer nada más que pedirle a ChatGPT que cree una imagen, y la generación de imágenes 4O llegará a funcionar. Algunos modelos, como O1, no le permiten crear imágenes, pero parece que 4O Generation de imágenes no se limita a GPT-4O. Intenté crear una imagen en GPT-4, y todavía usaba la generación de imágenes 4O en lugar del modelo Dall-E que se usaba anteriormente.
Si prefiere usar Dall-E por algún motivo, todavía hay un Dall-E GPT dedicado disponible en la tienda pública GPT. Puede usar esto para generar imágenes utilizando el modelo más antiguo y menos capaz. Hay poco uso para eso ahora, aparte de ver cuán mejor se ha vuelto la generación de imágenes.
Crear excelentes imágenes fotorrealistas
Una de las mejoras más obvias sobre Dall-E es que la generación de imágenes 4O puede producir algunas imágenes fotorrealistas excelentes, sin que tenga que preocuparse demasiado por la elaboración rápida. Mientras que las imágenes tardan un poco en generarse y revelan lentamente de arriba hacia abajo de una manera que recuerda cómo las imágenes se solucionan lentamente sobre el acceso telefónico, los resultados son muy superiores a lo que Dall-E podría producir.

Relacionado
La nueva generación de imágenes de Chatgpt se siente como un acceso telefónico de nuevo
Ver mis imágenes aparecer lentamente de arriba hacia abajo me lleva de regreso a los viejos tiempos.
Le pedí a Dall-E una imagen fotorrealista de un mono con un sombrero de copa, y esto es lo que me dio:

Esta es una imagen generada por la generación de imágenes 4O utilizando el mismo aviso:

La diferencia es asombrosa y, francamente, un poco aterradora. Hasta ahora, generalmente es posible saber si una imagen era generada por AI si parecía lo suficientemente fuerte para dedos adicionales o texto destrozado. Sin embargo, las imágenes que genera ChatGPT son muy difíciles de distinguir de lo real, y como se dice comúnmente sobre los nuevos desarrollos de IA, este es lo peor que jamás sean.
Puedes convertir imágenes en diferentes estilos
Una de las cosas que ha incorporado Internet desde el lanzamiento de 4O Generation de imágenes es la capacidad de pedirle a ChatGPT que convierta sus imágenes en diferentes estilos. Por ejemplo, puede subir una foto tuya y pedirle a ChatGPT que la cambie al estilo de Van Gogh. Esto no es algo nuevo, pero la calidad de los resultados es un gran paso adelante de Dall-E.

Esto hizo que muchas personas comenzaran a subir imágenes de sí mismas o de la cultura popular que se habían transformado en el estilo de Studio Ghibli, el popular estudio de animación detrás de películas clásicas como Enérgico y Mi vecino Totoro. Los resultados suelen ser impresionantes, pero provocó un debate en línea sobre cuán ético es usar AI para robar esencialmente el estilo de un artista sin su permiso. En el momento de escribir, sin embargo, todavía podía hacer imágenes al estilo de Studio Ghibli sin problemas.
Es fácil refinar imágenes a través de indicaciones
Otra mejora importante es que la generación de imágenes 4O tiene una excelente consistencia. Esto significa que si hay una pequeña cosa mal con su imagen, puede pedirle a ChatGPT que lo arregle, y dejará solo el resto de la imagen. Dall-E a menudo hará cambios importantes en el resto de la imagen cuando intente arreglar una parte de ella.
Esto hace que sea mucho más fácil obtener la imagen exacta que desea, que a menudo es una gran fuente de frustración con Dall-E. Tendría que probar varias veces incluso para acercarse a la imagen que quería, y a veces fallaría por completo. Ahora, por ejemplo, puede pedir tener el sombrero de copa del mono en un ángulo diferente, y el sombrero cambiará, pero el resto de la imagen permanecerá igual.

Esta consistencia también lo hace excelente para producir múltiples imágenes de la misma persona o carácter. Puede pedir que el mismo personaje aparezca en una configuración diferente, y ChatGPT preservará la apariencia del personaje en su nueva imagen.
Chatgpt finalmente puede manejar el texto
Este es uno de los mayores cambios en la generación de imágenes 4O. Dall-E podría agregar texto a las imágenes, pero realmente, realmente luchó por hacerlo. Por lo general, recibirías un mensaje de texto que se parecía principalmente a las palabras que querías, pero que estaban muy ligeramente apagados. Suficiente para arruinar sus imágenes, al menos. Usando la generación de imágenes 4O, puede crear el texto exacto que desea, y genera sin problemas.

Esto, combinado con la consistencia mejorada, significa que puede crear cosas usando la generación de imágenes 4O que simplemente no eran posibles antes. Bosquejé un terrible dibujo de un alienígena de dibujos animados y pude crear una caricatura de cuatro paneles que usó ese personaje, completo con burbujas de habla con texto perfecto. Tomó más tiempo escribir el aviso que para generar mi dibujos animados completos.
4O La generación de imágenes seguirá las instrucciones
Esto es enorme. Uno de los mayores problemas que tuve con Dall-E es que a menudo se negaría a seguir una instrucción, especialmente si esa instrucción involucraba un negativo. Pasé horas tratando de generar una imagen de Santa con bigote pero sin barba (solo para ver cómo se vería, obviamente), y no importa lo que intentara, obtendría una barba completa cada vez.
La única forma en que logré acercarme al éxito fue pedirle que generara una imagen de Hercule Poirot disfrazada de Santa, e incluso entonces, tomó múltiples intentos antes de obtener una imagen sin la barba y un bigote blanco. Ahora, sin embargo, puedo obtener una imagen de Santa sin barba en el primer intento.

Sin embargo, la adhesión de instrucciones es aún más impresionante. Puede definir hasta 20 objetos diferentes, describiendo cada uno, y la generación de imágenes 4O seguirá las instrucciones para cada objeto. El ejemplo que ofrece OpenAI es para una cuadrícula 4×4 de emoji con formas y colores específicos, y ChatGPT puede crear una imagen con los 16 emoji exactamente como se describe.
Puede usar imágenes cargadas como referencias
Una desventaja de generar imágenes a partir de indicaciones es que describir lo que desea en una imagen puede ser difícil, pero describir el estilo de la imagen puede ser aún más difícil. Decirle a ChatGPT que produzca el aspecto exacto que tiene en la cabeza no siempre es tan fácil.
Afortunadamente, no solo necesitas usar texto. Puede cargar imágenes para indicar el tipo de estilo que desea para sus imágenes. CHATGPT usará estas imágenes para informar la imagen final que genera a partir de su mensaje.

Si desea un elemento específico en su imagen, por ejemplo, puede cargar una imagen de él en ChatGPT. Si desea que las personas se encuentren en una pose específica, puede subir una imagen de personas que se encuentran en esa pose. Si encuentra una ilustración que desea que fuera una imagen fotorrealista, puede cargarla y pedirle a ChatGPT que lo convierta en una fotografía.
Incluso puede dibujar un bosquejo aproximado de cómo quiere que se vea la imagen, tomar una foto y subirlo a Chatgpt. Luego puede generar una imagen fotorrealista basada en su terrible boceto. Hace que sea mucho más fácil generar la imagen exacta que desea.
Las imágenes pueden llamar al conocimiento de Chatgpt.
La generación de imágenes 4O no se limita a la información en su mensaje o los archivos que carga. GPT-4O tiene su propia base de conocimiento a la que puede recurrir, para ayudarlo a crear las imágenes que desea. Las imágenes Studio Ghibli son un excelente ejemplo; No necesitas explicar cómo se ve Studio Ghibli Animation; Chatgpt ya lo sabe.

Sin embargo, esto va mucho más allá de conocer diferentes estilos artísticos. Cualquier conocimiento que ChatGPT tenga se puede aplicar a sus imágenes. Por ejemplo, puede solicitar un diagrama que explique el ciclo del agua, y no necesita explicar cuál es el ciclo del agua; ChatGPT extraerá la información clave de su propio conocimiento.
4O La generación de imágenes no es perfecta (todavía)
4O La generación de imágenes es increíblemente buena. De hecho, es tan bueno que Sam Altman, el CEO de OpenAI, tuviera que agregar límites de tarifa porque las GPU de la compañía comenzaban a derretirse.
Inicialmente, puede crear tantas imágenes como quisiera, pero ahora a menudo verá un mensaje que le dice que debe esperar unos minutos antes de crear otra imagen. No es el único problema que puede encontrar con la generación de imágenes 4O.

También hay limitaciones en la creación de ciertos tipos de contenido. En teoría, al menos, no debería poder generar nada ofensivo o inapropiado. Si intenta crear imágenes con caracteres con derechos de autor, ChatGPT también puede rechazar. Las líneas están un poco borrosas aquí. Por lo general, puede crear personajes de un estilo similar, si no los personajes en sí, o evitar las restricciones utilizando indicaciones ligeramente vagas.
El seguimiento de las instrucciones no siempre funciona perfectamente, y todavía ocasionalmente también tengo problemas con el texto. Ahora es muy raro, pero ocasionalmente, arrojará una letra adicional, especialmente si agregar esa letra todavía hace que el texto sea una palabra válida. Sin embargo, generalmente puede corregir fácilmente estos errores con la próxima generación.
La generación de imágenes 4O es un salto considerable en la generación de imágenes de IA, con un fotorrealismo mejorado, una mejor consistencia y una instrucción significativamente mejor. Ahora es increíblemente fácil crear imágenes fotorrealistas que se ven exactamente como quieres.
Sin embargo, hay muchas preguntas éticas que esto plantea. Si eres un diseñador gráfico o un fotógrafo, esta actualización enviará escalofríos por la columna vertebral. Lo que no se puede negar es que esta actualización ha hecho que sea mucho más fácil para los usuarios de ChatGPT crear imágenes muy impresionantes, sean cuales sean los dilemas éticos.
Noticias
‘Genere un ejercicio indicador para el niño neurodivergente’
Published
1 hora agoon
10 abril, 2025
Capturas de pantalla de cada uno de los videos en la Unidad 1, que conducen a gatos rectos (una versión escalada de Jumping Jacks). La última imagen muestra el ejercicio fundamental básico de la Unidad 1, saltando con gatos, sirviendo como el calentamiento para los videos de la Unidad 2. Crédito: Fronteras en fisiología (2025). Doi: 10.3389/fphys.2024.1496114
Un equipo de investigación de la Universidad de Michigan ha utilizado la IA para ayudar a entregar “bocadillos” de ejercicio a los niños con autismo.
El equipo de investigación, dirigido por la fisióloga del ejercicio UM Rebecca Hasson, revisó un programa que tenía como objetivo ayudar a los niños a hacer ejercicio cuando las familias tuvieron que pivotar al aprendizaje en línea durante la pandemia Covid-19. Ahora, un equipo de investigadores de la Escuela de Kinesiología utilizó ChatGPT para revisar las instrucciones para los 132 videos de ejercicios del programa, adaptándolos para satisfacer mejor las necesidades de los niños neurodivergentes. Sus resultados se publican en la revista Fronteras en fisiología.
En 2012, durante “¡Movernos” de Michelle Obama! Campaña para combatir la obesidad infantil, Hasson comenzó a trabajar en formas de incorporar la actividad física en la vida cotidiana de los niños. Ella y otros investigadores desarrollaron formas de integrar la actividad física en los días escolares de los niños sin interrupciones importantes, y utilizaron la idea de “ejercicios de bocadillos”, períodos de ejercicio de aproximadamente tres a cuatro minutos.
Llamaron al programa Inpact, o interrumpieron la sesión prolongada con actividad. El programa se ha implementado en 25 escuelas de Michigan hasta la fecha.
“Tuvimos estas grandes oportunidades de capacitación, los maestros se sentían apoyados, los niños se movían más, y luego teníamos la pandemia”, dijo Hasson. “La casa se convirtió en el aula, y la actividad física de los niños cayó significativamente. Así que tuvimos que descubrir cómo adaptar lo que estábamos haciendo en el aula al entorno local”.
Los investigadores se pusieron inmediatamente a trabajar adaptando Inpact para el entorno doméstico. Para llegar a los niños que podrían no tener acceso a Internet, los investigadores trabajaron con el canal de aprendizaje de Michigan de PBS y el Departamento de Educación para transmitir el programa de actividades físicas en la televisión. En seis meses, el programa de televisión tenía 15,000-20,000 espectadores todos los días.
Si bien el programa fue un éxito, el investigador Haylie Miller, psicólogo del desarrollo y profesor asistente de ciencia del movimiento, notó que los niños neurodivergentes podrían tener dificultades para seguir las instrucciones en los videos del ejercicio, ya que fueron diseñados para la forma en que los niños neurotípicos aprendieron. Miller estudia cómo las personas neurodivergentes usan información visual para planificar, ejecutar y modificar el movimiento.
El equipo decidió adaptar en colaboración el programa INPACT para satisfacer mejor las necesidades de acceso de los niños neurodivergentes.
“Las personas neurodivergentes procesan información sensorial de manera diferente a las personas neurotípicas, lo que puede hacer que la actividad física sea incómoda, difícil o intimidante”, dijo Miller. “Las personas neurodivergentes también tienen diferencias en la conciencia corporal y el procesamiento del lenguaje, y pueden necesitar más o diferentes indicaciones para sentirse cómodos realizando una actividad”.
Por ejemplo, dice que si una persona tiene dificultades para el equilibrio, la coordinación de sus extremidades y realiza una tarea de varios pasos, es probable que necesite más apoyo físico o instructivo para tener éxito en un movimiento complejo como un gato de salto.
El equipo comenzó a examinar los 132 videos de ejercicios desarrollados para el programa INPACT, cada uno de los cuales incluía múltiples ejercicios. La estudiante de pregrado Tania Sapre tuvo la tarea de comenzar a adaptar las instrucciones de ejercicio de los videos para ser más inclusivos a las personas neurodivergentes.
“Comencé a jugar con ChatGPT para inspirarme sobre cómo debería formatear mis instrucciones cuando de repente me di cuenta de que ChatGPT podría ayudar a llenar el vacío de conocimiento y la sobrecarga de datos que estaba experimentando”, dijo Sapre.
“Pensé que si pudiera perfeccionar el uso de ChatGPT para mis instrucciones, podría crear un proceso simple que podría ser replicado por otros investigadores, maestros y familias en el hogar para abordar ejercicios novedosos que nuestro programa no cubrió, ayudando a los niños a mantenerse activos en todas partes”.

El árbol de decisión utilizado para generar inicialmente las indicaciones de ChatGPT que devuelven instrucciones de ejercicio satisfactorias. Crédito: Fronteras en fisiología (2025). Doi: 10.3389/fphys.2024.1496114
Primero, el equipo organizó su contenido de video para poder formar consultas para enviar a ChatGPT. Desde los 132 videos Inpact en Home, los investigadores identificaron más de 500 actividades. Luego categorizaron estas actividades en grupos de habilidades principales: saltos, núcleo, lateral, deporte, parte superior del cuerpo, parte inferior del cuerpo y movimientos compuestos.
Luego desarrollaron un aviso para obtener un conjunto de instrucciones para un ejercicio particular de ChatGPT. Por ejemplo, los investigadores le pidieron a ChatGPT que “proporcionara instrucciones simplificadas paso a paso para un gato de salto, adecuado para un niño neurodivergente”. Según la respuesta de ChatGPT a esa pregunta, los investigadores le pidieron a la herramienta AI que “condensara las instrucciones paso a paso para un gato de salto, adecuado para un niño neurodivergente”.
El equipo revisó cada conjunto de instrucciones para garantizar que las instrucciones generadas por IA fueran elaboradas correctamente. Los investigadores también aseguraron que las instrucciones siguieron a un principio central de su programa de ejercicios, las “tres C”: consistencia, concisión y claridad.
“El equipo de Inpact ya estaba en el camino correcto hacia el diseño universal mediante el uso de modelado de video y indicaciones verbales. Tener múltiples medios de representación realmente puede ayudar a una persona neurodivergente a comprender la actividad sin tener que adivinar”, dijo Miller.
“Nos hemos basado en esta sólida base al simplificar el lenguaje utilizado para describir cada movimiento, dividir los movimientos en sus componentes de manera más explícita y usar una redacción constante en todas las actividades para reducir la ambigüedad”.
Alanna Price es coordinadora de salud regional para su distrito de Michigan. Supervisa la educación en la salud y la educación del conductor, y ayudó a revisar las instrucciones para los estudiantes neurodivergentes.
“La educación física adaptativa es necesaria porque asegura que todos los niños puedan participar en actividades físicas modificadas a sus habilidades. Esto promueve la salud física, las habilidades sociales y el bienestar emocional”, dijo Price. “Los programas APE modifican la educación física tradicional para satisfacer las necesidades únicas de todos los estudiantes, ayudándoles a desarrollar habilidades motoras, fuerza y coordinación.
“Las direcciones de ejercicio modificadas para niños neurodivergentes, como aquellos con autismo o TDAH, pueden mejorar su desarrollo físico y cognitivo. Estas modificaciones a menudo incluyen movimientos simplificadores y palabras de indicación, utilizando ayudas visuales e incorporando actividades sensoriales”.
El equipo también ha comenzado a desarrollar un “paquete de inicio” de tarjetas de juego de actividades para personas con mayores necesidades de apoyo que puedan necesitar desarrollar más habilidades fundamentales antes de sumergirse en la experiencia completa de Inpact, dijo Miller.
“Durante la pandemia, hubo menos recursos para los padres que tuvieron hijos que aprenden de manera diferente. En el futuro, esperamos ser más proactivos en lugar de reactivos, pero esta ha sido una gran experiencia de aprendizaje para todos nosotros, y creo que habla del valor de estar abierto a las críticas”, dijo Hasson.
“Si su misión realmente es avanzar en las oportunidades para que todos los niños estén activos, entonces estar dispuesto a asociarse con otros para que eso suceda es realmente importante”.
Además del paquete de inicio, los investigadores esperan tener sus videos traducidos al español y el árabe, los dos idiomas hablados con mayor frecuencia en Michigan después del inglés.
Más información:
Tania Sapre et al, mejorando la actividad física en el hogar para niños neurodivergentes: adaptando el programa Inpact at Home con IA y diseño universal, Fronteras en fisiología (2025). Doi: 10.3389/fphys.2024.1496114
Proporcionado por la Universidad de Michigan
Citación: Hola, Chatgpt: ‘Genere un mensaje de ejercicio para el niño neurodivergente’ (2025, 10 de abril) Consultado el 10 de abril de 2025 de https://medicalxpress.com/news/2025-04-chatgpt-generate-prompt-neurodivergent-child.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.
Related posts




































































































































































































































































Trending
-
Startups11 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales11 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups9 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos11 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups11 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos11 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Recursos11 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Noticias9 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo