Noticias

Por qué las nuevas herramientas de agente de IA de OpenAI podrían cambiar la forma en que codifica

Published

on

Monsitj/Getty Images

Si ha sido un desarrollador de producción durante algún tiempo, sabe que las interfaces de programación de aplicaciones (API) están sujetas a cambios al capricho del proveedor.

Es posible que se vaya a la cama una noche sabiendo que su aplicación es sólida y tiene un futuro brillante. Luego se despierta por la mañana para descubrir que uno de sus proveedores de API ha anunciado un cambio que requiere que pase los próximos seis meses recodificando su aplicación para trabajar con la API revisada. Pregúntame cómo sé.

También: la mejor IA para codificar en 2025 (y qué no usar)

Las aplicaciones basadas en IA no son inmunes a esta ley inmutable de la vida de API. OpenAi ha anunciado la introducción de la API de respuestas, que desencadenará el sol de su API de asistentes en algún momento de 2026.

Como con la mayoría de los cambios de API, la nueva API hace más, funciona mejor y tiene menos calorías. Sin embargo, a pesar de estas capacidades, la nueva API aún agrega grandes elementos de tareas pendientes a los primeros usuarios de API anteriores.

Operai ha anunciado una serie de nuevas características a nivel de programador para construir agentes de IA, incluida la API. Antes de profundizar en lo nuevo, pongamos este cambio en contexto.

Probablemente haya notado que, dado que Generative AI (Gen AI) irrumpió en la escena hace unos años, casi todos los productos y servicios parecen haber agregado repentinamente una función de ventana lateral de IA a su oferta base. Es una gran extensión de la línea de muchos productos y servicios, pero no es como si cada proveedor tuviera equipos de investigación de IA que construyen grandes modelos de idiomas.

En cambio, estas compañías tienen API autorizadas que brindan servicios de IA a una tarifa bastante predecible por transacción. Diferentes modelos cuestan diferentes cantidades, pero en una estimación aproximada, un desarrollador podría hacer 67 consultas de chat típicas GPT-4.5, 1,176 consultas GPT-4O o 20,000 consultas GPT-4O por un solo dólar.

También: cómo usar chatgpt para escribir código, y mi truco favorito para depurar lo que genera

Con las API de OpenAI (y las API de otras compañías de IA), la funcionalidad de IA se puede agregar al código con llamadas de funciones simples y una tarjeta de crédito, reduciendo cortos años de desarrollo y millones de dólares de infraestructura y costos de investigación.

Las nuevas respuestas API

Hasta ahora, Openai ofrecía una API, la API de finalización de chat, para enviar consultas de inmediato a ChatGPT y obtener una respuesta. Operai también ofreció una API, la API de asistentes, que permite a los agentes realizar archivos de razonamiento y acceso de varios pasos.

La nueva API de respuestas combina las características de ambas API anteriores. Si bien se espera que la API de finalización del chat permanezca, la compañía ha anunciado planes para atacar la API de asistentes tan pronto como el próximo año a favor de la API de respuestas más capaces.

También: cómo convertir chatgpt en su herramienta de alimentación de codificación de IA y duplicar su salida

Las tarifas para usar respuestas API se encuentran en la página de precios de OpenAI y varían según el modelo y el uso.

La API de respuestas tiene tres herramientas incorporadas que los programadores pueden llamar: búsqueda web, búsqueda de archivos y uso de la computadora.

La herramienta de búsqueda web

Si alguna vez usó ChatGPT para buscar en la web y agregar una respuesta, sabe lo que hace la herramienta de búsqueda web. En el caso de la API de respuestas, permite a los programadores iniciar tales consultas desde sus programas.

Cuando se usa, la API proporciona texto como respuesta y enlaces a fuentes y citas en línea. Muchas de estas respuestas deben ser correctas. La compañía cita un cuadro que muestra que las pruebas de búsquedas web con GPT-4O fueron solo un 38% correctas (tenga en cuenta eso la próxima vez que use ChatGPT para buscar), pero las búsquedas utilizando la vista previa de búsqueda GPT-4O y la vista previa de búsqueda GPT-4O fueron correctas nueve de cada diez veces.

La mayoría de las cosas buenas es bastante buena, ¿verdad?

La herramienta de búsqueda de archivos

La siguiente es la herramienta de búsqueda de archivos, que buscará en una biblioteca de sus documentos corporativos. Y sí, sé lo que estás pensando. Operai dice que no capacita a su AIS en los datos comerciales. Por lo tanto, debe estar bastante seguro de que cargar todos sus datos será seguro y no aparecerá en la respuesta de otra persona a un aviso.

También: cómo pruebo la capacidad de codificación de un chatbot de ai, y tú también puedes

Sin embargo, hay problemas. Por un lado, a $ 0.10 por concierto, por mes, el almacenamiento de archivos no es barato. La base de datos de documentos corporativos de mi pequeña empresa es de 57TB. Si esa base de datos se cargó a OpenAI para la búsqueda de IA específica de contexto, el almacenamiento costaría casi $ 6,000 por mes, y mi compañía solo tiene dos empleados.

Los beneficios de tener una herramienta de búsqueda de IA es la capacidad de romper los silos. Pero si los silos son lo que hace que el almacenamiento de los datos sea más asequible al cargar solo datos seleccionados, este precio podría limitar la utilidad de esta característica.

Herramienta de uso de la computadora

Finalmente, OpenAI incluye su herramienta de uso de computadora, la herramienta de vista de pantalla y clic en el corazón de su oferta de agente de operador.

Se supone que esta cosa puede leer pantallas y, según el contenido de la pantalla, realizar el procesamiento o hacer clic para causar acciones. De las demos, especialmente en la vista previa del anuncio actual, parece que la herramienta tiene un largo camino por recorrer antes de que sea universalmente útil.

Estén atentos en esta función.

Agentes SDK

Una API es un conjunto de puntos finales o llamadas de función para interactuar con un sistema externo. Un SDK (Kit de desarrollo de software) es una colección más amplia, que a menudo incluye herramientas de software, algunas API, bibliotecas y servicios públicos, que todo funcionan juntos.

Operai anunció a los agentes SDK, un conjunto de herramientas para la construcción, depuración y monitoreo de agentes en acción. El kit incluye la API de respuestas y agrega orquestación de flujo de trabajo, lo que permite a los codificadores realizar un razonamiento y ejecución de tareas de varios pasos.

También: este nuevo punto de referencia de IA mide la cantidad de modelos que se encuentran

El kit también permite a los codificadores crear equipos de agentes, cada uno encargado de responsabilidades específicas. Una funcionalidad de “transmitir” permite a un agente hacer algo de trabajo, luego el procesamiento de transferencia a otro agente, y así sucesivamente.

Además, y creo que esta es una de las características más importantes, un tablero de monitoreo permite a los desarrolladores ver cada interacción con la IA, identificar qué agentes se usaron para qué y cómo se les encargó. Con la prevalencia de alucinaciones de IA, es importante poder realizar un seguimiento de lo que están haciendo todas esas tareas independientes.

¿Qué piensas de las últimas actualizaciones de Openai?

¿Está planeando integrar la API de respuestas en sus proyectos, o le preocupa el sol de la API de asistentes de OpenAI?

¿Cómo se siente acerca de las herramientas incorporadas, como la búsqueda web, la búsqueda de archivos y el uso de la computadora? ¿Resuelven problemas reales o introducen nuevos desafíos?

¿Y qué hay del SDK de los agentes? ¿Lo ves como un cambio de juego para el desarrollo de agentes de IA, o todavía faltan algunas características? Háganos saber en los comentarios a continuación.


Puede seguir mis actualizaciones de proyecto diarias en las redes sociales. Asegúrese de suscribirse a mi boletín de actualizaciones semanales y sígueme en Twitter/X en @Davidgewirtzen Facebook en Facebook.com/davidgewirtz, en Instagram en Instagram.com/davidgewirtz, en bluesky en @davidgewirtz.com, y en YouTube en youtube.com/davidgewirtztv.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version