Noticias
Funciones clave de ChatGPT lanzadas en 2024
Published
5 meses agoon

El año está llegando a su fin, por lo que es el momento perfecto para realizar una revisión anual. Muchos creadores siguen de cerca productos como ChatGPT, Claude y Perplexity, generando resúmenes anuales interesantes. Me complace compartir estas reseñas en nuestro sitio web, junto con enlaces relevantes para brindar más contexto.
Comenzando con ChatGPT, podemos explorar una infografía preparada por Tibor que destaca las características clave desarrolladas a lo largo del año. Curiosamente, junio resultó ser el mes con menos lanzamientos de funciones, después de los anuncios importantes en mayo. Por el contrario, en diciembre se produjo la mayor cantidad de actualizaciones, muchas de las cuales se dieron a conocer durante la iniciativa “12 días de OpenAI” de OpenAI.
Profundicemos en cada característica y sus detalles.
Enero
El año comenzó con el lanzamiento de GPT-Store, donde había muchas esperanzas, promesas y expectativas de que OpenAI se convirtiera en una plataforma donde los usuarios podrán crear agentes de IA. Muchos constructores empezaron a experimentar con lo que era posible. Algunos de los GPT realmente recibieron muy buena atención y una base de usuarios como Grimoire, por ejemplo, y otros.
Creo que muchos de ellos todavía se utilizan hasta ese día, aunque a la larga, quedó claro que la mayoría de la gente usa sus propios GPT con sus indicaciones personalizadas para sus propios casos de uso, en lugar de depender de los GPT creados por otras personas. GPT-Store siguió obteniendo nuevas funciones durante la primera mitad del año, mientras que el desarrollo en torno a GPT-Store se estancó posteriormente. En realidad, no obtuvimos muchas características nuevas en la segunda mitad.
- Tienda GPT
- Herramienta “guardián” (elecciones)
- Etiquetado en línea de GPT
- Opción “Leer en voz alta” para respuestas (aplicaciones móviles)
- Proceso de apelación de autoservicio para GPT
- plan de equipo

Febrero
En febrero, además de pulir la tienda GPT, recibimos un anuncio de Sora que no se lanzó hasta diciembre. Curiosamente, este anuncio elevó el precio de WorldCoinlo cual fue una correlación interesante de observar. Además de eso, también recibimos un anuncio de la función Memoria que tardó algún tiempo en lanzarse, especialmente en la UE.
- La versión beta de los complementos ChatGPT está descontinuada
- Anuncio de memoria (“Sunshine”)
- Nueva apariencia (“Hedgehog”)
- Reseñas y comentarios sobre GPT
- Verificación social para perfiles de constructor GPT
- anuncio de sora
- charla temporal
- Modo oscuro y claro actualizado
- Historial de versiones de GPT

Marzo
En marzo, OpenAI introdujo nuevas herramientas para la creación y edición de imágenes, incluido el lanzamiento de un editor de imágenes integrado. Además, OpenAI anunció un programa de reparto de ingresos para los creadores de GPT. Sin embargo, esta fue probablemente la última vez que escuchamos sobre un programa de este tipo, ya que parece que la iniciativa nunca despegó ni ganó fuerza.
- Instrucciones personalizadas
- Capacidades GPT-4
- Controles DALL-E 3 (estilo y relación de aspecto), edición y pintura
- Opción “Leer en voz alta” para respuestas (web)
- Ganancias GPT basadas en el uso
- Atribuciones web
- Inédito/Trabajo en progreso:
- GPT personalizados
- Herramienta de intención V2
- Bloques de instrucciones y estado guardado

Abril
En abril, OpenAI lanzó la versión 2 de análisis de datos, que permite a los usuarios crear gráficos y trabajar con datos de una manera más eficiente y fácil de usar. La función Memoria finalmente también se implementó ampliamente durante este tiempo. Además, Se detectaron los primeros signos de capacidades de visión en la aplicación de iOS.incluso antes del anuncio oficial, que se produjo en mayo.
- Fuga de ChatGPT Vision
- Acceder sin cuenta
- Controles de datos v2
- Migración de dominio a chatgpt.com
- Huevo de Pascua “DvdPlayer”
- GPT-4 Turbo
- Memoria para usuarios Plus
- Compartir chats actualizado

Puede
En mayo, OpenAI organizó su famoso Demo Day, que tuvo lugar justo un día antes del Google I/O. Durante el evento, mostraron capacidades de visión, modo de voz avanzado tanto para dispositivos móviles como de escritorio, y presentaron la muy esperada aplicación de escritorio. La aplicación de escritorio estuvo disponible inmediatamente después de la conferencia.
Poco después, Los ingenieros inversos descubrieron y accedieron a la versión alfa. de la aplicación macOS al detectar un enlace de descarga para una compilación alfa separada. Esta versión filtrada incluía herramientas de desarrollador, lo que permitía a los usuarios alternar varios indicadores de funciones y obtener una vista previa de la interfaz de usuario del modo de voz avanzado. Si bien aún no estaba en funcionamiento, proporcionó una visión emocionante de lo que estaba por venir.
Desafortunadamente, Mayo también marcó la pérdida de Sky Voice.una voz favorita de muchos usuarios. En una nota más brillante, GPT-4o fue lanzado oficialmenteconsolidándose como uno de los modelos de mayor rendimiento en LM Arena.
- Selección de modelo automática (dinámica) para usuarios gratuitos
- Aplicaciones conectadas (Google Drive y Microsoft OneDrive)
- Análisis de datos V2 (“grafito”: gpt-4-da-v2)
- Aplicación de escritorio para macOS (Sidekick)
- GPT-4o (“Netptune”/“Cebolleta”)
- Nueva apariencia (“Jugo de frutas”)
- Regenerar la respuesta usando un modelo diferente
- Se eliminó la voz “Cielo”
- Cambiar de modelo en la misma conversación
- Herramientas y GPT para usuarios gratuitos

Junio
En junio, Apple anunció una asociación con OpenAI, presentando “Apple Intelligence”. Casi al mismo tiempo, OpenAI envió varias actualizaciones a su aplicación de escritorio macOS, poniéndola a disposición de todos los usuarios. En ese momento, había grandes expectativas de que OpenAI lanzara pronto el modo de voz avanzado, ya que numerosos indicios apuntaban en esa dirección.
Sin embargo, OpenAI anunció más tarde que el lanzamiento del modo de voz avanzado se retrasaría, probablemente debido a requisitos de cumplimiento normativo. Además, es posible que la estabilidad de la función no haya estado en un nivel adecuado para su lanzamiento público.
Como resultado, el modo de voz avanzado no se lanzó hasta septiembre, y las capacidades de visión para dispositivos móviles le siguieron en diciembre. Mientras tanto, la funcionalidad de visión para usuarios de escritorio sigue sin estar disponible hasta el día de hoy.
- Anuncio de integración de Apple Intelligence
- Aplicación de escritorio para macOS (“Sidekick”) para todos los usuarios

Julio
En julio, la interfaz de usuario de ChatGPT experimentó una renovación completa. Además, OpenAI anunció su prototipo SearchGPTlo que marcó su entrada en el espacio de los motores de búsqueda y los posicionó como un competidor potencial de herramientas como Google Search o Perplexity. Este prototipo fue inicialmente muy limitado, disponible sólo para un pequeño grupo de usuarios, y la lista de espera se cerró poco después.
Posteriormente, este prototipo se integró directamente en el producto principal ChatGPT, ampliando su funcionalidad y accesibilidad.
- Desuso de GPT-3.5
- GPT-4o mini (“cebollino”)
- Nueva apariencia (“Jugo de fruta”) predeterminada para todos
- Prototipo de SearchGPT

Agosto
En agosto, el tan esperado modo de voz avanzado comenzó a implementarse para un grupo limitado de usuarios, y en septiembre se lanzó un lanzamiento más amplio. Durante el mismo período, la página de inicio de ChatGPT fue rediseñada para adoptar una apariencia más alineada con un producto de búsqueda, lo que refleja la dirección cambiante de OpenAI.
- Se inició el lanzamiento de voz avanzada (gpt-4o-s2s)
- DALL-E 3 para usuarios gratuitos
- Los tokens de memoria máxima aumentaron a 8k
- Nueva apariencia (página de inicio v2, mensajes de inicio v2, nuevo compositor de mensajes)
- GPT-4o actualizado
- Inédito/Trabajo en progreso:
- Conectores de sincronización (Google Drive (nuevo) y Slack)

Septiembre
En septiembre, el modo de voz avanzado finalmente estuvo disponible para una audiencia más amplia. OpenAI también presentó O1 Preview y O1 Minipresentando nuevos modelos que respaldaban el razonamiento de la Cadena de Pensamiento. Junto con estos lanzamientos, OpenAI lanzó evaluaciones que evaluaron el desempeño de todos los modelos y planes existentes.
Inicialmente, estas nuevas ofertas venían con límites de uso estrictos, que se incrementaron ligeramente poco después para adaptarse a los comentarios y la demanda de los usuarios.
- Voz avanzada (gpt-4o-s2s) con nuevas voces, memoria e instrucciones personalizadas
- Memoria disponible para todos
- Migración de Next.js a Remix
- o1-preview y o1-mini (y herramienta CoT “A8KM123”)
- Sugerencias del sistema (Imagen, Búsqueda)
- GPT-4o actualizado

Octubre
En octubre, Los usuarios de Windows obtuvieron acceso a la aplicación de escritorio basada en Electron de OpenAI. Además, OpenAI presentó Canvassu versión de Artifacts, que permite a ChatGPT mostrar código o texto específico en una hoja lateral separada para una mejor organización. También se integró la funcionalidad de búsqueda en tiempo real. directamente en el producto principal ChatGPT, mejorando su usabilidad.
- Voz avanzada para aplicaciones de escritorio de macOS y Windows
- Lienzo (“CanMore”)
- Aplicación de escritorio para Windows (“Sidetron”)
- GPT-4o con lona (gpt-4o-canmore)
- Buscar (“Sonic”)
- Buscar en el historial de chat (“Fanny Pack”)

Noviembre
En noviembre, muchas funciones existentes se pusieron a disposición de una base de usuarios más amplia. Además, el rendimiento de ChatGPT recibió una actualización que culminó con el lanzamiento de la última versión de GPT-4o. La aplicación de escritorio macOS introdujo el Función Trabajar con aplicaciones en versión betalo que permite una integración mejorada con aplicaciones externas. Además, finalmente se lanzó el modo de voz avanzado para su uso en la web, ampliando su accesibilidad.
- Voz avanzada en la web
- Aplicación de escritorio para Windows (“Sidetron”) para todos los usuarios
- Nueva apariencia (barra lateral, experiencia web/móvil renovada)
- GPT-4o actualizado
- GPT-4o mini actualizado
- Trabajar con aplicaciones en macOS
- Inédito/Trabajo en progreso:
- Lienzo – zona de pruebas de código
- Aplicaciones conectadas: Jira y Confluence

Diciembre
Diciembre fue uno de los meses más emocionantes para OpenAI, gracias a su 12 días de OpenAI evento, donde tenían como objetivo lanzar o anunciar nuevas funciones, grandes y pequeñas, cada día durante el evento. Curiosamente, a finales de noviembre, justo antes de que comenzara el evento, algunos usuarios descubrieron accidentalmente una forma de acceder a la versión sin vista previa de 01que estuvo disponible brevemente durante unas horas.
El primer día de diciembre, los usuarios también detectaron rastros de GPT-4.5aunque nunca fue anunciado oficialmente. Además, el Plan profesional Hizo su primera aparición el mismo día. El evento trajo una serie de anuncios importantes, incluido el lanzamiento del sorafunción AVM Vision, la introducción de Proyectosel anuncio de 03y muchas otras mejoras.
Una característica muy esperada, Tareastambién fue visto en desarrollo. Esta característica permitiría a los usuarios programar avisos o crear automatizaciones. Se esperaba que fuera lanzado durante el 12 días de OpenAIpero por razones desconocidas su lanzamiento fue pospuesto. Ahora es probable que veamos esta función lanzada en algún momento de 2025.
- 1-800-CHATGPT y WhatsApp
- Modo avanzado con vídeo, capturas de pantalla y modo Santa
- Integración de inteligencia de Apple
- Mejoras en el lienzo (GPT personalizados, ejecución de código Python, accesos directos, caja de herramientas)
- Vista previa de o3 y o3-mini, convocatoria de investigadores de seguridad
- plan profesional
- Proyectos (“Snorlax”)
- Mejoras en la búsqueda y acceso gratuito
- Sora Turbo
- Mejoras en Trabajar con aplicaciones en macOS (más aplicaciones, vínculo con aplicaciones)
- Inédito/Trabajo en progreso:
- Canvas – Acciones rápidas “Transformar”
- Aplicaciones conectadas – Noción
- “Jawbone”: Tareas (automatización)
- Memoria en búsqueda
- “Moonshine”: la memoria en la configuración es más inteligente, recuerda más conversaciones pasadas (Beta)
- “Nimbus”: configuración de notificaciones
- Plan de quórum
¿Olvidaste algunos de estos? Puede encontrar un registro de cambios detallado para ChatGPT en TestingCatalog. ¿Qué característica ha sido tu favorita?
Deja tus pensamientos a continuación en los comentarios
You may like
Noticias
El Proyecto Stargate de Openai tiene como objetivo construir infraestructura de IA en países asociados de todo el mundo
Published
2 horas agoon
19 mayo, 2025
Operai ha anunciado una nueva iniciativa llamada “OpenAi para países” como parte de su proyecto Stargate, con el objetivo de ayudar a las naciones a desarrollar infraestructura de IA basada en principios democráticos. Esta expansión sigue al plan de inversión inicial de $ 500 millones de la compañía para la infraestructura de IA en los Estados Unidos.
“Introducción a OpenAi para países, una nueva iniciativa para apoyar a países de todo el mundo que desean construir sobre los rieles demócratas de IA”, declaró Openai en su anuncio. La compañía informa que su proyecto Stargate, reveló por primera vez en enero con el presidente Trump y los socios Oracle y Softbank, ha comenzado la construcción de su primer campus de supercomputación en Abilene, Texas.
Según OpenAI, la iniciativa responde al interés internacional en un desarrollo similar de infraestructura. “Hemos escuchado de muchos países pidiendo ayuda para construir una infraestructura de IA similar: que quieren sus propios Stargates y proyectos similares”, explicó la compañía, señalando que dicha infraestructura será “la columna vertebral del futuro crecimiento económico y el desarrollo nacional”.
La compañía enfatizó su visión de la IA democrática como tecnología que incorpora principios que protegen las libertades individuales y evitan la concentración de control del gobierno. Operai cree que este enfoque “contribuye a una amplia distribución de los beneficios de la IA, desalienta la concentración de poder y ayuda a avanzar en nuestra misión”.
El proyecto Stargate opera a través de un consorcio de principales compañías de tecnología que se desempeñan como inversores y socios técnicos. SoftBank, Openai, Oracle y MGX proporcionan la financiación inicial de capital, con las responsabilidades financieras de manejo de SoftBank, mientras que OpenAI administra las operaciones.
En el lado técnico, cinco compañías tecnológicas importantes forman la base de la implementación del proyecto. “Arm, Microsoft, Nvidia, Oracle y OpenAI son los socios de tecnología iniciales clave”, según OpenAI. El desarrollo de infraestructura aprovecha las relaciones establecidas entre estas compañías, particularmente basándose en la colaboración de larga data de OpenAI con Nvidia que se remonta a 2016 y su asociación más reciente con Oracle.
La compañía describe un marco integral de asociación para colaborar con naciones extranjeras.
“Openai está ofreciendo un nuevo tipo de asociación para la era de la inteligencia. A través de colaboraciones de infraestructura formal y en coordinación con el gobierno de los Estados Unidos”, explica el anuncio, destacando la alineación de la compañía con los intereses de política exterior estadounidense en el desarrollo tecnológico.
El modelo de asociación incluye múltiples componentes que abordan la infraestructura, el acceso y el desarrollo económico. Operai planea “asociarse con países para ayudar a construir capacidad de centro de datos en el país” para respaldar la soberanía de los datos al tiempo que permite la personalización de la IA para las necesidades locales.
Los ciudadanos de los países participantes recibirían servicios de “CHATGPT personalizados” adaptados a idiomas y culturas locales, destinados a mejorar la prestación de atención médica, educación y servicios públicos. Operai describe esto como “ai de, por y para las necesidades de cada país en particular”.
La compañía también enfatiza las inversiones de seguridad y el desarrollo económico a través de un enfoque de financiación de inicio donde “los países asociados también invertirían en la expansión del proyecto global de Stargate, y por lo tanto en el liderazgo continuo de IA liderado por Estados Unidos”, reforzando la conexión de la iniciativa con el liderazgo tecnológico estadounidense.
Las asociaciones internacionales de OpenAI incorporan amplios protocolos de seguridad diseñados para proteger los modelos de IA y la propiedad intelectual. La compañía ha desarrollado un enfoque de seguridad para abordar las posibles vulnerabilidades.
“Salvaguardar nuestros modelos es un compromiso continuo y un pilar central de nuestra postura de seguridad”, Estados Openai, que describe su marco de seguridad como “riguroso” y “evolucionando continuamente”. Este marco abarca la seguridad de la información, la gobernanza y la protección de la infraestructura física.
La arquitectura de seguridad se adapta a las capacidades del modelo de coincidencia, con OpenAi señalando que “nuestras medidas de seguridad no son estáticas; escaman con las capacidades de nuestros modelos e incorporan protecciones de vanguardia”. Estas protecciones incluyen seguridad respaldada por hardware, arquitectura de mudanza cero y salvaguardas criptográficas.
El acceso al personal representa otra dimensión de seguridad crítica. “Operai mantendrá una supervisión explícita y continua sobre todo el personal con acceso a nuestros sistemas de información, propiedad intelectual y modelos”, enfatiza la compañía, y agrega que “ninguna persona o entidad obtendrá dicho acceso sin nuestra aprobación directa”.
Antes de implementar modelos internacionalmente, OpenAI realiza evaluaciones de riesgos a través de su marco de preparación. “Cada implementación de nuevos modelos se someterá a una evaluación de riesgos antes de la implementación”, reconociendo que algunos modelos avanzados pueden presentar riesgos incompatibles con ciertos entornos.
El CEO de Operai, Sam Altman, expresó entusiasmo por el progreso en el sitio de Texas, tuiteando:
Genial ver el progreso en el primer Stargate en Abilene con nuestros socios en Oracle Today. Será la instalación de entrenamiento de IA más grande del mundo. La escala, la velocidad y la habilidad de las personas que construyen esto es increíble.
Sin embargo, el desarrollo masivo de infraestructura ha planteado preocupaciones ambientales. Greg Osuri, fundador de Akash Network, cuestionó el enfoque de sostenibilidad del proyecto:
Este centro de datos está generando 360 MW quemando gas natural, causando una fuerte contaminación y emitiendo hasta 1 millón de toneladas métricas de carbono cada año. Entiendo que las opciones son limitadas, pero me gustaría comprender sus planes futuros para cambiar a fuentes más limpias o sostenibles.
Zach DeWitt, socio de Wing VC, comentó las implicaciones más amplias de este movimiento:
Operai parece estar construyendo y vendiendo productos en cada capa de la pila de IA: chips, centros de datos, API y la capa de aplicación. No está claro qué capa (s) se comercializarán y no se comercializarán y OpenAi está cubriendo sus apuestas de arriba a abajo por la pila de IA. Muy inteligente.
La compañía ha especificado limitaciones geográficas para su estrategia de expansión internacional, manteniendo restricciones sobre las cuales las naciones pueden acceder a su tecnología a través de su documentación de “países y territorios respaldados”.
Noticias
¿Qué es Codex, el último agente de codificación de IA de OpenAI capaz de multitarea? | Noticias tecnológicas
Published
7 horas agoon
18 mayo, 2025
Operai el viernes 16 de mayo, introdujo una nueva herramienta de IA llamada Codex que está diseñada para manejar múltiples tareas relacionadas con la ingeniería de software al mismo tiempo, desde la generación del código para nuevas funciones hasta responder preguntas sobre la base de código de un usuario, solucionar errores y sugerir solicitudes de revisión del código
La herramienta de codificación basada en la nube y el agente de IA ejecuta estas tareas en su propio entorno de Sandbox en la nube que se ha precargado con el repositorio de código de un usuario.
Codex ha sido publicado bajo Vista previa de investigación. Sin embargo, todos los usuarios de ChatGPT Pro, Enterprise y Team tienen acceso a la herramienta de codificación AI. “Los usuarios tendrán acceso generoso sin costo adicional durante las próximas semanas para que pueda explorar qué puede hacer Codex, después de lo cual lanzaremos el acceso limitado a la tarifa y las opciones de precios flexibles que le permiten comprar un uso adicional a pedido”, dijo Openii en una publicación de blog.
La historia continúa debajo de este anuncio
Los clientes de ChatGPT Plus y EDU recibirán acceso en una fecha posterior, agregó la inicio de IA respaldada por Microsoft.
Hoy estamos presentando Codex.
Es un agente de ingeniería de software que se ejecuta en la nube y hace tareas por usted, como escribir una nueva característica de arreglar un error.
Puede ejecutar muchas tareas en paralelo.
– Sam Altman (@sama) 16 de mayo de 2025
https://platform.twitter.com/widgets.js
La última oferta de Openai llega en un momento en que AI está listo para interrumpir el sector de ingeniería de software, lo que aumenta los temores generalizados del desplazamiento laboral. La CEO de Microsoft, Satya Nadella, dijo recientemente que el 30 por ciento del código de la compañía ahora está generado por IA. Unas semanas más tarde, el gigante de la tecnología anunció que está despidiendo a los 6,000 empleados o al 3 por ciento de su fuerza laboral, y los programadores se han impactado más.
“Todavía sigue siendo esencial que los usuarios revisen y validen manualmente todo el código generado por el agente antes de la integración y la ejecución”, señaló Openai en su publicación de blog de anuncios de Codex.
¿Qué es Codex?
Con Codex, los desarrolladores pueden delegar tareas de programación simples a un agente de IA. Tiene su propia interfaz única a la que se puede acceder desde la barra lateral en la aplicación Web CHATGPT.
La historia continúa debajo de este anuncio
Codex funciona con Codex-1, un modelo AI que es una variación del modelo de razonamiento O3 de OpenAI. Excepto que Codex-1 se ha entrenado específicamente en una amplia gama de tareas de codificación del mundo real para analizar y generar código “que refleja estrechamente el estilo humano y las preferencias de relaciones públicas, se adhiere precisamente a las instrucciones”.
https://www.youtube.com/watch?v=hhhdpnbfh6nu
Sus resultados se han ajustado más bien utilizando el aprendizaje de refuerzo para que Codex-1 pueda “ejecutar las pruebas hasta que reciba un resultado de aprobación”. En términos de rendimiento y precisión, OpenAi dijo que Codex-1 le fue mejor que su modelo O3 AI cuando se evaluó en su punto de referencia SWE interno, así como en el La versión de la empresa validada (Bench SWE verificado).
¿Cómo funciona Codex?
Codex puede leer y editar archivos, así como ejecutar comandos, incluidos arneses de prueba, revestimientos y comprobantes de tipo. Por lo general, lleva entre un minuto a 30 minutos completar una tarea dependiendo del nivel de dificultad, según OpenAI.
El agente de codificación de IA realiza cada tarea en un entorno aislado distinto y aislado que se precarga con la base de código del usuario que sirve como contexto. “Al igual que los desarrolladores humanos, los agentes de Codex funcionan mejor cuando se les proporciona entornos de desarrollo configurados, configuraciones de pruebas confiables y documentación clara”, dijo Openii.
La historia continúa debajo de este anuncio
Los usuarios pueden hacer que el Codex funcione de manera más efectiva para ellos al incluir archivos de agentes.md colocados dentro de su repositorio. “Estos son archivos de texto, similares a ReadMe.md, donde puede informar a Codex cómo navegar por su base de código, que comandan ejecutarse para las pruebas y la mejor manera de cumplir con las prácticas estándar de su proyecto”, dijo Openii.
Otra característica única de Codex es que Muestra su pensamiento y trabajo con cada paso a medida que completa la (s) tarea (s). En el pasado, varios desarrolladores han señalado que los agentes de codificación de IA producen scripts de codificación que no siguen los estándares y son difíciles de depurar.
“Codex proporciona evidencia verificable de sus acciones a través de citas de registros de terminales y salidas de prueba, lo que le permite rastrear cada paso tomado durante la finalización de la tarea”, dijo Openii.
Una vez que Codex completa una tarea, comete sus cambios en su entorno. Sin embargo, los usuarios también pueden revisar los resultados, solicitar más revisiones, abrir una solicitud de extracción de GitHub o realizar directamente cambios en el entorno de desarrollo local.
La historia continúa debajo de este anuncio
¿Cómo usar Codex? ¿Cuáles son sus casos de uso?
Para que Codex comience a generar código, los usuarios deben ingresar un mensaje y hacer clic en ‘Código’. Si desean que los agentes de codificación de IA respondan preguntas o proporcionen sugerencias, entonces los usuarios deben seleccionar la opción ‘Preguntar’ antes de enviar el mensaje.
Cuando OpenAI abrió el acceso temprano a Codex para socios externos, utilizaron la herramienta AI Coding Agent para acelerar el desarrollo de características, los problemas de depuración, escribir y ejecutar pruebas, y refactorizar grandes bases de código. Otro probador temprano utilizó códigos para acelerar las tareas pequeñas pero repetitivas, como mejorar la cobertura de la prueba y la reparación de fallas de integración “.
También se puede utilizar para escribir herramientas de depuración y ayudar a los desarrolladores a comprender partes desconocidas de la base de código al aparecer en el contexto relevante y los cambios pasados.
Los desarrolladores de OpenAI también están utilizando Codex internamente para refactorizar, renombrar y escribir pruebas, así como andamios nuevas características, componentes de cableado, corrección de errores y documentación de redacción.
La historia continúa debajo de este anuncio
“Según los aprendizajes de los primeros evaluadores, recomendamos asignar tareas bien escoltas a múltiples agentes simultáneamente, y experimentar con diferentes tipos de tareas y indicaciones para explorar las capacidades del modelo de manera efectiva”, dijo la compañía.
¿Cuál es la diferencia entre Codex y Codex CLI?
En abril de este año, Openai lanzó otra herramienta de agente de codificación de IA llamada Codex CLI. Se dice que es una herramienta de línea de comandos de código abierto capaz de leer, modificar y ejecutar código localmente en el terminal de un usuario.
El agente de codificación integra los modelos de OpenAI con la interfaz de línea de comandos (CLI) del cliente utilizada para ejecutar programas, administrar archivos y más.
Codex CLI funciona con el último modelo O4-Mini de OpenAI de forma predeterminada. Sin embargo, los usuarios pueden elegir su modelo OperaI preferido a través de la opción API de respuestas. Codex CLI solo puede ejecutarse en sistemas MacOS y Linux por ahora, con soporte para Windows todavía en la etapa experimental.
La historia continúa debajo de este anuncio
https://www.youtube.com/watch?v=o-zfxbfamku
En la publicación del blog del viernes, OpenAI también anunció actualizaciones a Codex CLI. Una versión más pequeña de Codex-1 está llegando a Codex CLI. “Está disponible ahora como el modelo predeterminado en Codex CLI y en la API como Codex-Mini-Latest”, dijo Openii.
La compañía también ha simplificado el proceso de inicio de sesión de desarrolladores para Codex CLI. En lugar de tener que generar y configurar manualmente un token API, los desarrolladores ahora pueden usar su cuenta ChatGPT para iniciar sesión en Codex CLI y seleccionar la organización API que desean usar. “Los usuarios de Plus y Pro que inician sesión en Codex CLI con CHATGPT también pueden comenzar a canjear $ 5 y $ 50 en créditos API gratuitos, respectivamente, más tarde hoy durante los próximos 30 días”, dijo Openii.
Noticias
Cómo los modelos O3 y O4-Mini de OpenAI están revolucionando el análisis visual y la codificación
Published
12 horas agoon
18 mayo, 2025
En abril de 2025, Openai presentó sus modelos más avanzados hasta la fecha, O3 y O4-Mini. Estos modelos representan un gran paso adelante en el campo de la inteligencia artificial (IA), ofreciendo nuevas capacidades en análisis visual y soporte de codificación. Con sus fuertes habilidades de razonamiento y su capacidad para trabajar con texto y imágenes, O3 y O4-Mini pueden manejar una variedad de tareas de manera más eficiente.
El lanzamiento de estos modelos también destaca su impresionante rendimiento. Por ejemplo, O3 y O4-Mini lograron una notable precisión del 92.7% en la resolución de problemas matemáticos en el punto de referencia de AIME, superando el rendimiento de sus predecesores. Este nivel de precisión, combinado con su capacidad para procesar diversos tipos de datos, como código, imágenes, diagramas y más, abre nuevas posibilidades para desarrolladores, científicos de datos y diseñadores de UX.
Al automatizar tareas que tradicionalmente requieren un esfuerzo manual, como la depuración, la generación de documentación e interpretación de datos visuales, estos modelos están transformando la forma en que se construyen aplicaciones impulsadas por la IA. Ya sea en desarrollo, ciencia de datos u otros sectores, O3 y O4-Mini son herramientas poderosas que respaldan la creación de sistemas más inteligentes y soluciones más efectivas, lo que permite a las industrias abordar los desafíos complejos con mayor facilidad.
Avances técnicos clave en modelos O3 y O4-Mini
Los modelos O3 y O4-Mini de OpenAI traen mejoras importantes en la IA que ayudan a los desarrolladores a trabajar de manera más eficiente. Estos modelos combinan una mejor comprensión del contexto con la capacidad de manejar el texto y las imágenes juntos, haciendo que el desarrollo sea más rápido y preciso.
Manejo de contexto avanzado e integración multimodal
Una de las características distintivas de los modelos O3 y O4-Mini es su capacidad para manejar hasta 200,000 tokens en un solo contexto. Esta mejora permite a los desarrolladores ingresar archivos de código fuente completos o grandes bases de código, lo que hace que el proceso sea más rápido y eficiente. Anteriormente, los desarrolladores tenían que dividir grandes proyectos en partes más pequeñas para el análisis, lo que podría conducir a ideas o errores perdidos.
Con la nueva ventana de contexto, los modelos pueden analizar el alcance completo del código a la vez, proporcionando sugerencias, correcciones de error y optimizaciones más precisas y confiables. Esto es particularmente beneficioso para los proyectos a gran escala, donde comprender todo el contexto es importante para garantizar una funcionalidad fluida y evitar errores costosos.
Además, los modelos O3 y O4-Mini aportan el poder de las capacidades multimodales nativas. Ahora pueden procesar las entradas de texto y visuales, eliminando la necesidad de sistemas separados para la interpretación de imágenes. Esta integración permite nuevas posibilidades, como la depuración en tiempo real a través de capturas de pantalla o escaneos de interfaz de usuario, generación de documentación automática que incluye elementos visuales y una comprensión directa de los diagramas de diseño. Al combinar texto y imágenes en un flujo de trabajo, los desarrolladores pueden moverse de manera más eficiente a través de tareas con menos distracciones y retrasos.
Precisión, seguridad y eficiencia a escala
La seguridad y la precisión son fundamentales para el diseño de O3 y O4-Mini. El marco de alineación deliberativa de OpenAI asegura que los modelos actúen en línea con las intenciones del usuario. Antes de ejecutar cualquier tarea, el sistema verifica si la acción se alinea con los objetivos del usuario. Esto es especialmente importante en entornos de alto riesgo como la atención médica o las finanzas, donde incluso pequeños errores pueden tener consecuencias significativas. Al agregar esta capa de seguridad, Operai asegura que la IA funcione con precisión y reduce los riesgos de resultados no deseados.
Para mejorar aún más la eficiencia, estos modelos admiten el encadenamiento de herramientas y las llamadas API paralelas. Esto significa que la IA puede ejecutar múltiples tareas al mismo tiempo, como generar código, ejecutar pruebas y analizar datos visuales, sin tener que esperar a que una tarea finalice antes de comenzar otra. Los desarrolladores pueden ingresar una maqueta de diseño, recibir comentarios inmediatos sobre el código correspondiente y ejecutar pruebas automatizadas mientras la IA procesa el diseño visual y genera documentación. Este procesamiento paralelo acelera los flujos de trabajo, lo que hace que el proceso de desarrollo sea más suave y productivo.
Transformación de flujos de trabajo de codificación con características con IA
Los modelos O3 y O4-Mini introducen varias características que mejoran significativamente la eficiencia del desarrollo. Una característica clave es el análisis de código en tiempo real, donde los modelos pueden analizar instantáneamente capturas de pantalla o escaneos de interfaz de usuario para detectar errores, problemas de rendimiento y vulnerabilidades de seguridad. Esto permite a los desarrolladores identificar y resolver problemas rápidamente.
Además, los modelos ofrecen depuración automatizada. Cuando los desarrolladores encuentran errores, pueden cargar una captura de pantalla del problema, y los modelos identificarán la causa y sugerirán soluciones. Esto reduce el tiempo dedicado a la resolución de problemas y permite a los desarrolladores avanzar con su trabajo de manera más eficiente.
Otra característica importante es la generación de documentación con el contexto. O3 y O4-Mini pueden generar automáticamente documentación detallada que permanece actualizada con los últimos cambios en el código. Esto elimina la necesidad de que los desarrolladores actualicen manualmente la documentación, asegurando que permanezca preciso y actualizado.
Un ejemplo práctico de las capacidades de los modelos está en la integración de API. O3 y O4-Mini pueden analizar las colecciones Postman a través de capturas de pantalla y generar automáticamente asignaciones de punto final API. Esto reduce significativamente el tiempo de integración en comparación con los modelos más antiguos, acelerando el proceso de vinculación de servicios.
Avances en el análisis visual
Los modelos O3 y O4-Mini de OpenAI traen avances significativos en el procesamiento de datos visuales, ofreciendo capacidades mejoradas para analizar imágenes. Una de las características clave es su OCR avanzado (reconocimiento de caracteres ópticos), que permite que los modelos extraen e interpreten el texto de las imágenes. Esto es especialmente útil en áreas como ingeniería de software, arquitectura y diseño, donde los diagramas técnicos, los diagramas de flujo y los planes arquitectónicos son parte integral de la comunicación y la toma de decisiones.
Además de la extracción de texto, O3 y O4-Mini pueden mejorar automáticamente la calidad de las imágenes borrosas o de baja resolución. Utilizando algoritmos avanzados, estos modelos mejoran la claridad de la imagen, asegurando una interpretación más precisa del contenido visual, incluso cuando la calidad de imagen original es subóptima.
Otra característica poderosa es su capacidad para realizar un razonamiento espacial 3D de los planos 2D. Esto permite a los modelos analizar diseños 2D e inferir relaciones 3D, lo que los hace muy valiosos para industrias como la construcción y la fabricación, donde es esencial visualizar espacios físicos y objetos de planes 2D.
Análisis de costo-beneficio: cuándo elegir qué modelo
Al elegir entre los modelos O3 y O4-Mini de OpenAI, la decisión depende principalmente del equilibrio entre el costo y el nivel de rendimiento requerido para la tarea en cuestión.
El modelo O3 es el más adecuado para tareas que exigen alta precisión y precisión. Se destaca en campos como la investigación y el desarrollo complejos (I + D) o aplicaciones científicas, donde son necesarias capacidades de razonamiento avanzado y una ventana de contexto más amplia. La gran ventana de contexto y las poderosas habilidades de razonamiento de O3 son especialmente beneficiosas para tareas como el entrenamiento del modelo de IA, el análisis de datos científicos y las aplicaciones de alto riesgo donde incluso pequeños errores pueden tener consecuencias significativas. Si bien tiene un costo más alto, su precisión mejorada justifica la inversión para las tareas que exigen este nivel de detalle y profundidad.
En contraste, el modelo O4-Mini proporciona una solución más rentable y sigue ofreciendo un rendimiento fuerte. Ofrece velocidades de procesamiento adecuadas para tareas de desarrollo de software a mayor escala, automatización e integraciones de API donde la eficiencia y la velocidad son más críticas que la precisión extrema. El modelo O4-Mini es significativamente más rentable que el O3, que ofrece una opción más asequible para los desarrolladores que trabajan en proyectos cotidianos que no requieren las capacidades avanzadas y la precisión del O3. Esto hace que el O4-Mini sea ideal para aplicaciones que priorizan la velocidad y la rentabilidad sin necesidad de la gama completa de características proporcionadas por el O3.
Para los equipos o proyectos centrados en el análisis visual, la codificación y la automatización, O4-Mini proporciona una alternativa más asequible sin comprometer el rendimiento. Sin embargo, para proyectos que requieren análisis en profundidad o donde la precisión es crítica, el modelo O3 es la mejor opción. Ambos modelos tienen sus fortalezas, y la decisión depende de las demandas específicas del proyecto, asegurando el equilibrio adecuado de costo, velocidad y rendimiento.
El resultado final
En conclusión, los modelos O3 y O4-Mini de OpenAI representan un cambio transformador en la IA, particularmente en la forma en que los desarrolladores abordan la codificación y el análisis visual. Al ofrecer un manejo de contexto mejorado, capacidades multimodales y un razonamiento potente, estos modelos permiten a los desarrolladores a optimizar los flujos de trabajo y mejorar la productividad.
Ya sea para una investigación impulsada por la precisión o tareas rentables de alta velocidad, estos modelos proporcionan soluciones adaptables para satisfacer diversas necesidades. Son herramientas esenciales para impulsar la innovación y resolver desafíos complejos en todas las industrias.
Related posts
























































































































































































































































































































Trending
-
Startups12 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales1 año ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups10 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos1 año ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups1 año ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos12 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Recursos1 año ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Noticias10 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo