Los modelos modernos de idiomas grandes son realmente buenos en muchas tareas, como codificación, redacción de ensayos, traducción e investigación. Pero todavía hay muchas tareas básicas, especialmente en el reino del “Asistente Personal”, en los que los AIS más altamente capacitados del mundo permanecen desesperados.
Noticias
Por qué las nuevas herramientas de agente de IA de OpenAI podrían cambiar la forma en que codifica
Published
2 días agoon

Si ha sido un desarrollador de producción durante algún tiempo, sabe que las interfaces de programación de aplicaciones (API) están sujetas a cambios al capricho del proveedor.
Es posible que se vaya a la cama una noche sabiendo que su aplicación es sólida y tiene un futuro brillante. Luego se despierta por la mañana para descubrir que uno de sus proveedores de API ha anunciado un cambio que requiere que pase los próximos seis meses recodificando su aplicación para trabajar con la API revisada. Pregúntame cómo sé.
También: la mejor IA para codificar en 2025 (y qué no usar)
Las aplicaciones basadas en IA no son inmunes a esta ley inmutable de la vida de API. OpenAi ha anunciado la introducción de la API de respuestas, que desencadenará el sol de su API de asistentes en algún momento de 2026.
Como con la mayoría de los cambios de API, la nueva API hace más, funciona mejor y tiene menos calorías. Sin embargo, a pesar de estas capacidades, la nueva API aún agrega grandes elementos de tareas pendientes a los primeros usuarios de API anteriores.
Operai ha anunciado una serie de nuevas características a nivel de programador para construir agentes de IA, incluida la API. Antes de profundizar en lo nuevo, pongamos este cambio en contexto.
Probablemente haya notado que, dado que Generative AI (Gen AI) irrumpió en la escena hace unos años, casi todos los productos y servicios parecen haber agregado repentinamente una función de ventana lateral de IA a su oferta base. Es una gran extensión de la línea de muchos productos y servicios, pero no es como si cada proveedor tuviera equipos de investigación de IA que construyen grandes modelos de idiomas.
En cambio, estas compañías tienen API autorizadas que brindan servicios de IA a una tarifa bastante predecible por transacción. Diferentes modelos cuestan diferentes cantidades, pero en una estimación aproximada, un desarrollador podría hacer 67 consultas de chat típicas GPT-4.5, 1,176 consultas GPT-4O o 20,000 consultas GPT-4O por un solo dólar.
También: cómo usar chatgpt para escribir código, y mi truco favorito para depurar lo que genera
Con las API de OpenAI (y las API de otras compañías de IA), la funcionalidad de IA se puede agregar al código con llamadas de funciones simples y una tarjeta de crédito, reduciendo cortos años de desarrollo y millones de dólares de infraestructura y costos de investigación.
Las nuevas respuestas API
Hasta ahora, Openai ofrecía una API, la API de finalización de chat, para enviar consultas de inmediato a ChatGPT y obtener una respuesta. Operai también ofreció una API, la API de asistentes, que permite a los agentes realizar archivos de razonamiento y acceso de varios pasos.
La nueva API de respuestas combina las características de ambas API anteriores. Si bien se espera que la API de finalización del chat permanezca, la compañía ha anunciado planes para atacar la API de asistentes tan pronto como el próximo año a favor de la API de respuestas más capaces.
También: cómo convertir chatgpt en su herramienta de alimentación de codificación de IA y duplicar su salida
Las tarifas para usar respuestas API se encuentran en la página de precios de OpenAI y varían según el modelo y el uso.
La API de respuestas tiene tres herramientas incorporadas que los programadores pueden llamar: búsqueda web, búsqueda de archivos y uso de la computadora.
La herramienta de búsqueda web
Si alguna vez usó ChatGPT para buscar en la web y agregar una respuesta, sabe lo que hace la herramienta de búsqueda web. En el caso de la API de respuestas, permite a los programadores iniciar tales consultas desde sus programas.
Cuando se usa, la API proporciona texto como respuesta y enlaces a fuentes y citas en línea. Muchas de estas respuestas deben ser correctas. La compañía cita un cuadro que muestra que las pruebas de búsquedas web con GPT-4O fueron solo un 38% correctas (tenga en cuenta eso la próxima vez que use ChatGPT para buscar), pero las búsquedas utilizando la vista previa de búsqueda GPT-4O y la vista previa de búsqueda GPT-4O fueron correctas nueve de cada diez veces.
La mayoría de las cosas buenas es bastante buena, ¿verdad?
La herramienta de búsqueda de archivos
La siguiente es la herramienta de búsqueda de archivos, que buscará en una biblioteca de sus documentos corporativos. Y sí, sé lo que estás pensando. Operai dice que no capacita a su AIS en los datos comerciales. Por lo tanto, debe estar bastante seguro de que cargar todos sus datos será seguro y no aparecerá en la respuesta de otra persona a un aviso.
También: cómo pruebo la capacidad de codificación de un chatbot de ai, y tú también puedes
Sin embargo, hay problemas. Por un lado, a $ 0.10 por concierto, por mes, el almacenamiento de archivos no es barato. La base de datos de documentos corporativos de mi pequeña empresa es de 57TB. Si esa base de datos se cargó a OpenAI para la búsqueda de IA específica de contexto, el almacenamiento costaría casi $ 6,000 por mes, y mi compañía solo tiene dos empleados.
Los beneficios de tener una herramienta de búsqueda de IA es la capacidad de romper los silos. Pero si los silos son lo que hace que el almacenamiento de los datos sea más asequible al cargar solo datos seleccionados, este precio podría limitar la utilidad de esta característica.
Herramienta de uso de la computadora
Finalmente, OpenAI incluye su herramienta de uso de computadora, la herramienta de vista de pantalla y clic en el corazón de su oferta de agente de operador.
Se supone que esta cosa puede leer pantallas y, según el contenido de la pantalla, realizar el procesamiento o hacer clic para causar acciones. De las demos, especialmente en la vista previa del anuncio actual, parece que la herramienta tiene un largo camino por recorrer antes de que sea universalmente útil.
Estén atentos en esta función.
Agentes SDK
Una API es un conjunto de puntos finales o llamadas de función para interactuar con un sistema externo. Un SDK (Kit de desarrollo de software) es una colección más amplia, que a menudo incluye herramientas de software, algunas API, bibliotecas y servicios públicos, que todo funcionan juntos.
Operai anunció a los agentes SDK, un conjunto de herramientas para la construcción, depuración y monitoreo de agentes en acción. El kit incluye la API de respuestas y agrega orquestación de flujo de trabajo, lo que permite a los codificadores realizar un razonamiento y ejecución de tareas de varios pasos.
También: este nuevo punto de referencia de IA mide la cantidad de modelos que se encuentran
El kit también permite a los codificadores crear equipos de agentes, cada uno encargado de responsabilidades específicas. Una funcionalidad de “transmitir” permite a un agente hacer algo de trabajo, luego el procesamiento de transferencia a otro agente, y así sucesivamente.
Además, y creo que esta es una de las características más importantes, un tablero de monitoreo permite a los desarrolladores ver cada interacción con la IA, identificar qué agentes se usaron para qué y cómo se les encargó. Con la prevalencia de alucinaciones de IA, es importante poder realizar un seguimiento de lo que están haciendo todas esas tareas independientes.
¿Qué piensas de las últimas actualizaciones de Openai?
¿Está planeando integrar la API de respuestas en sus proyectos, o le preocupa el sol de la API de asistentes de OpenAI?
¿Cómo se siente acerca de las herramientas incorporadas, como la búsqueda web, la búsqueda de archivos y el uso de la computadora? ¿Resuelven problemas reales o introducen nuevos desafíos?
¿Y qué hay del SDK de los agentes? ¿Lo ves como un cambio de juego para el desarrollo de agentes de IA, o todavía faltan algunas características? Háganos saber en los comentarios a continuación.
Puede seguir mis actualizaciones de proyecto diarias en las redes sociales. Asegúrese de suscribirse a mi boletín de actualizaciones semanales y sígueme en Twitter/X en @Davidgewirtzen Facebook en Facebook.com/davidgewirtz, en Instagram en Instagram.com/davidgewirtz, en bluesky en @davidgewirtz.com, y en YouTube en youtube.com/davidgewirtztv.
You may like
Noticias
El agente chino de IA Manus es una llamada de atención a las empresas tecnológicas estadounidenses
Published
9 minutos agoon
14 marzo, 2025
No puedes preguntarle a Chatgpt o Claude “Pídeme un burrito de Chipotle” y obtenga uno, y mucho menos “Reserve un tren de Nueva York a Filadelfia”. Operai y Anthrope ofrecen AIS que pueden ver su pantalla, mover su cursor y hacer algunas cosas en su computadora como si fueran una persona (a través de sus funciones de “operador” y “uso de computadora”, respectivamente).
Regístrese aquí para explorar los grandes y complicados problemas que enfrenta el mundo y las formas más eficientes de resolverlos. Enviado dos veces por semana.
Que tales “agentes de IA” a veces funcionen, más o menos, se trata de lo más fuerte que puedes decir para ellos en este momento. (Divulgación: Vox Media es uno de los varios editores que ha firmado acuerdos de asociación con OpenAI. Uno de los primeros inversores de Anthrope es James McClave, cuya fundación BEMC ayuda a financiar el futuro perfecto. Nuestro informe sigue siendo editorialmente independiente).
Esta semana, China lanzó un competidor: el agente de IA Manus. Produjo una tormenta de nieve de publicaciones y testimonios brillantes de influencers altamente seleccionados, junto con algunas impresionantes demostraciones del sitio web.
Manus es solo por invitación (y aunque presenté una solicitud para la herramienta, no se ha otorgado), por lo que es difícil saber desde el exterior cuán representativos son estos ejemplos altamente seleccionados. Sin embargo, después de unos días de fervor de Manus, la burbuja apareció un poco y algunas críticas más moderadas comenzaron a salir.
Manus, sostiene el creciente consenso, es peor que la investigación profunda de Openai en las tareas de investigación; Pero mejor que el uso del operador o la computadora en las tareas del asistente personal. Es un paso adelante hacia algo importante, AIS que puede tomar medidas más allá de la ventana de chatbot, pero no es un avance impactante fuera de la nada.
Quizás lo más importante es que la utilidad de Manus para usted estará muy limitada si no confía en una empresa china de la que nunca ha oído hablar con su información de pago para que pueda reservar cosas en su nombre. Y probablemente no deberías.
Cuando escribí por primera vez sobre los riesgos de los poderosos sistemas de IA que desplazan o destruyen la humanidad, una pregunta muy razonable fue esta: ¿cómo podría una IA actuar contra la humanidad, cuando realmente no lo hacen? acto ¿en absoluto?
Este razonamiento es correcto, en lo que respecta a la tecnología actual. Claude o Chatgpt, que solo responden a las indicaciones del usuario y no actúan de forma independiente en el mundo, no pueden ejecutar en un plan a largo plazo; Todo lo que hacen es en respuesta a un aviso, y casi toda esa acción tiene lugar dentro de la ventana de chat.
Pero la IA nunca iba a permanecer como una herramienta puramente receptiva simplemente porque hay mucho potencial para obtener ganancias en los agentes. Las personas han estado tratando de crear AIS que se construyen con modelos de idiomas, pero que toman decisiones de forma independiente, para que las personas puedan relacionarse con ellos más como un empleado o un asistente que como un chatbot.
En general, esto funciona creando una pequeña jerarquía interna de modelos de idiomas, como una pequeña compañía de IA. Uno de los modelos se solicita cuidadosamente y, en algunos casos, ajustado a hacer una planificación a gran escala. Se le ocurre un plan a largo plazo, que delega a otros modelos de idiomas. Varios subgententes verifican sus resultados y los enfoques de cambio cuando un subagente falla o informa problemas.
El concepto es simple, y Manus está lejos de ser el primero en probarlo. Quizás recuerde que el año pasado tuvimos a Devin, que fue comercializado como empleado de ingeniería de software junior. Era un agente de IA con el que interactuó a través de la holgura para dar tareas, y que luego funcionaría para lograr sin más información humana, excepto, idealmente, del tipo que un empleado humano podría necesitar ocasionalmente.
Los incentivos económicos para construir algo como Manus o Devin son abrumadores. Las compañías tecnológicas pagan a los ingenieros de software junior hasta $ 100,000 al año o más. Una IA que en realidad podría proporcionar ese valor sería asombrosamente rentable. Agentes de viajes, desarrolladores del plan de estudios, asistentes personales: todos estos son trabajos bastante bien pagados, y un agente de IA podría, en principio, poder hacer el trabajo a una fracción del costo, sin necesidad de descansos, beneficios o vacaciones.
Pero Devin resultó ser sobrevalorado, y no funcionó lo suficientemente bien para el mercado al que apuntaba. Es demasiado pronto para decir si Manus representa un avance suficiente para tener un poder de permanencia comercial real, o si, como Devin, su alcance excederá su alcance.
Diré que parece que Manus funciona mejor que cualquier cosa que haya venido antes. Pero trabajar mejor no es suficiente: para confiar en una IA para gastar su dinero o planificar sus vacaciones, necesitará una confiabilidad extremadamente alta. Mientras Manus permanezca muy limitado en disponibilidad, es difícil decir si podrá ofrecer eso. Mi mejor suposición es que los agentes de IA que funcionan sin problemas todavía están a uno o dos años de distancia, pero a solo un año o dos.
Manus no es solo el último y mejor intento de un agente de IA.
También es el producto de una empresa china, y gran parte de la cobertura se ha mantenido en el ángulo chino. Manus es claramente una prueba de que las empresas chinas no solo imitan lo que se está construyendo aquí en Estados Unidos, ya que a menudo han sido acusados de hacer, sino mejorarlo.
Esa conclusión no debería ser impactante para cualquiera que sea consciente del intenso interés de China en la IA. También plantea preguntas sobre si seremos reflexivos sobre la exportación de todos nuestros datos personales y financieros a empresas chinas que no son responsables significativamente ante los reguladores de los Estados Unidos o la ley estadounidense.
La instalación de Manus en su computadora le da mucho acceso a su computadora: es difícil para mí descubrir los límites exactos en su acceso o la seguridad de su Sandbox cuando no puedo instalarlo yo mismo.
Una cosa que hemos aprendido en los debates de privacidad digital es que muchas personas harán esto sin pensar en las implicaciones si sienten que Manus les ofrece suficiente conveniencia. Y como la pelea de Tiktok dejó en claro, una vez que millones de estadounidenses aman una aplicación, el gobierno enfrentará una fuerte batalla cuesta arriba al tratar de restringirla u obligarlo a seguir las reglas de privacidad de los datos.
Pero también hay razones claras por las que Manus salió de una empresa china y no de, por ejemplo, meta, y son las mismas razones por las que podríamos preferir usar agentes de IA de Meta. Meta está sujeto a la ley de responsabilidad estadounidense. Si su agente comete un error y gasta todo su dinero en el alojamiento del sitio web, o si roba su bitcoin o carga sus fotos privadas, Meta probablemente será responsable. Por todas estas razones, Meta (y sus competidores estadounidenses) están siendo cautelosos en este ámbito.
Creo que la precaución es apropiada, incluso porque puede ser insuficiente. Construir agentes que actúan de forma independiente en Internet es un gran problema, uno que plantea grandes preguntas de seguridad, y me gustaría que tengamos un marco legal sólido sobre lo que pueden hacer y quién es en última instancia responsable.
Pero lo peor de todos los mundos posibles es un estado de incertidumbre que castiga la precaución y alienta a todos a administrar agentes que no tienen responsabilidad en absoluto. Tenemos uno o dos años para descubrir cómo hacerlo mejor. Esperemos que Manus nos impulse a trabajar no solo en la construcción de esos agentes, sino también en construir el marco legal que los mantendrá a salvo.
Una versión de esta historia apareció originalmente en el Futuro perfecto hoja informativa. ¡Regístrese aquí!
Noticias
Acabo de probar Manus vs Chatgpt con 5 indicaciones: aquí está el ganador
Published
9 horas agoon
14 marzo, 2025
Desde su lanzamiento la semana pasada, el agente de IA Manus ha ganado rápidamente tracción en línea. Desarrollado por la startup mariposa con sede en Wuhan, la comunidad de IA se ha dado cuenta, con más de 2 millones de personas en la lista de espera.
Al compararlo con Deepseek, Manus se distingue a sí mismo como lo que dice ser el primer agente general de IA del mundo, lo que lo distingue de los chatbots de IA tradicionales. En lugar de confiar en un solo modelo de lenguaje grande, como ChatGPT, Grok, Deepseek y otros sistemas de IA conversacionales, Manus opera con múltiples modelos de IA, incluidos el soneto Claude 3.5 de Anthrope y las versiones ajustadas de Alibaba’s Open-Source Qwen.
Noticias
Operai pide a Trump que elimine las restricciones a la industria de la IA
Published
12 horas agoon
13 marzo, 2025
Operai ha presentado una larga propuesta al gobierno de los Estados Unidos, con el objetivo de influir en su próximo plan de acción de IA, un informe de estrategia que muchos creen que guiará la política del presidente Donald Trump sobre la tecnología de inteligencia artificial.
La propuesta de la compañía de IA más reconocible de Estados Unidos es previsiblemente controvertida, y requiere que el gobierno de los Estados Unidos enfatice la velocidad del desarrollo sobre el escrutinio regulatorio, al tiempo que advierte los peligros que plantean las empresas de IA chinas para el país.
Trump pidió que el Plan de Acción de AI fuera redactado por la Oficina de Política de Ciencia y Tecnología y se sometió a él para julio poco después de asumir su segunda residencia en la Casa Blanca. Eso sucedió en enero, cuando expulsó una orden ejecutiva relacionada con la IA que fue firmada por su predecesor Joe Biden en octubre de 2023, reemplazándola con la suya, declarando que “es la política de los Estados Unidos para mantener y mejorar el dominio global de IA de Estados Unidos”.
Operai ha perdido poco tiempo al tratar de influir en las recomendaciones en ese plan, y en su propuesta dejó en claro sus sentimientos sobre el nivel actual de regulación en la industria de la IA. Pidió que los desarrolladores de IA recibieran “la libertad de innovar en el interés nacional”, y abogó por una “asociación voluntaria entre el gobierno federal y el sector privado”, en lugar de “leyes estatales demasiado pesadas”.
Argumenta que el gobierno federal debería poder trabajar con compañías de IA de manera “puramente voluntaria y opcional”, diciendo que esto ayudará a promover la innovación y la adopción de la tecnología. Además, pidió a los EE. UU. Que cree una “estrategia de control de exportación” que cubra los sistemas de IA fabricados en Estados Unidos, que promoverán la adopción global de su tecnología de IA de cosecha propia.
Impulso por la adopción del gobierno
La compañía argumenta además en sus recomendaciones que el gobierno otorga a las agencias federales una mayor libertad para “probar y experimentar” las tecnologías de IA que utilizan “datos reales”, y también solicitó a Trump que otorgue una exención temporal que negaría la necesidad de que los proveedores de IA estén certificados bajo el programa federal de gestión de riesgos y autorización. Pidió a Trump que “modernice” el proceso que las compañías de IA deben pasar para ser aprobadas para el uso del gobierno federal, pidiendo la creación de una “ruta más rápida basada en criterios para la aprobación de las herramientas de IA”.
Openai argumenta que sus recomendaciones harán posible que las agencias del gobierno federal utilicen los nuevos sistemas de IA hasta 12 meses más rápido de lo que es posible actualmente. Sin embargo, algunos expertos de la industria han expresado su preocupación de que la adopción tan rápida de la IA por parte del gobierno podría crear problemas de seguridad y privacidad.
Al presionar más, OpenAi también le dijo al gobierno de los Estados Unidos que debería asociarse más estrechamente con las empresas del sector privado para construir sistemas de IA para uso de seguridad nacional. Explicó que el gobierno podría beneficiarse de tener sus propios modelos de IA que están capacitados en conjuntos de datos clasificados, ya que estos podrían “ajustados para ser excepcionales en las tareas de seguridad nacional”.
Operai tiene un gran interés en abrir el sector del gobierno federal para productos y servicios de IA, después de haber lanzado una versión especializada de ChatGPT, llamada ChatGPT Gov, en enero. Está diseñado para ser dirigido por agencias gubernamentales en sus propios entornos informáticos seguros, donde tienen más control sobre la seguridad y la privacidad.
‘Libertad para aprender’
Además de promover el uso gubernamental de la IA, Operai también quiere que el gobierno de los Estados Unidos facilite su propia vida al implementar una “estrategia de derechos de autor que promueva la libertad de aprender”. Pidió a Trump que desarrollara regulaciones que preservarán la capacidad de los modelos de IA estadounidenses para aprender de los materiales con derechos de autor.
“Estados Unidos tiene tantas nuevas empresas de IA, atrae tanta inversión y ha hecho tantos avances de investigación en gran medida porque la doctrina de uso justo promueve el desarrollo de IA”, declaró la compañía.
Es una solicitud controvertida, porque la compañía actualmente está luchando contra múltiples organizaciones de noticias, músicos y autores sobre reclamos de infracción de derechos de autor. El ChatGPT original que se lanzó a fines de 2022 y los modelos más poderosos que se han lanzado desde entonces están en gran medida entrenados en Internet público, que es la principal fuente de su conocimiento.
Sin embargo, los críticos de la compañía dicen que básicamente está plagiando contenido de los sitios web de noticias, de los cuales muchos están paseados por pagos. Operai ha sido golpeado con demandas por el New York Times, el Chicago Tribune, el New York Daily News y el Centro de Informes de Investigación, la sala de redacción sin fines de lucro más antigua del país. Numerosos artistas y autores también han emprendido acciones legales contra la empresa.
Si no puedes vencerlos, ¿prohibirlos?
Las recomendaciones de Openai también apuntaron a algunos de los rivales de la compañía, en particular Deepseek Ltd., el laboratorio de IA chino que desarrolló el modelo Deepseek R-1 con una fracción del costo de cualquier cosa que Operai haya desarrollado.
La compañía describió a Deepseek como “subsidiado por el estado” y “controlado por el estado”, y le pidió al gobierno que considerara prohibir sus modelos y los de otras empresas chinas de IA.
En la propuesta, Openai afirmó que el modelo R1 de Deepseek es “inseguro”, porque la ley china requiere que cumpla con ciertas demandas con respecto a los datos del usuario. Al prohibir el uso de modelos de China y otros países de “nivel 1”, Estados Unidos podría minimizar el “riesgo de robo de IP” y otros peligros, dijo.
“Mientras Estados Unidos mantiene una ventaja en la IA hoy, Deepseek muestra que nuestro liderazgo no es ancho y está reduciendo”, dijo Openii.
Foto: TechCrunch/Flickr
Su voto de apoyo es importante para nosotros y nos ayuda a mantener el contenido libre.
Un clic a continuación admite nuestra misión de proporcionar contenido gratuito, profundo y relevante.
Únete a nuestra comunidad en YouTube
Únase a la comunidad que incluye a más de 15,000 expertos en #Cubealumni, incluido el CEO de Amazon.com, Andy Jassy, el fundador y CEO de Dell Technologies, Michael Dell, el CEO de Intel, Pat Gelsinger y muchos más luminarios y expertos.
GRACIAS
Related posts






















































































































































































































Trending
-
Startups10 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales10 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Recursos10 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Recursos10 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Startups8 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos10 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Startups10 meses ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Estudiar IA10 meses ago
Curso de Inteligencia Artificial de UC Berkeley estratégico para negocios