Connect with us

Noticias

🔮 De ChatGPT a mil millones de agentes

Published

on

Hola, soy Azeem.

Estoy en la Cumbre DealBook en Nueva York hoy y acabo de escuchar a Sam Altman hablar sobre su visión sobre los próximos años:

Espero que en 2025 tengamos sistemas que la gente mire, incluso aquellos que son escépticos sobre el progreso actual, y digan: ‘Vaya, no esperaba eso’. Los agentes son de lo que todo el mundo habla y por una buena razón. Esta idea de que puedes darle a un sistema de IA una tarea bastante complicada, el tipo de tarea que le darías a un ser humano muy inteligente, que lleva un tiempo implementar y usar un montón de herramientas y crear algo de valor. Ese es el tipo de cosas que esperaría el próximo año. Y eso es un gran problema. Si eso funciona tan bien como esperamos, realmente puede transformar las cosas.

Los agentes han estado en mi hoja de ruta por un tiempo. El año pasado hablé de nuestra mil millones de agentes futuros e invirtió en un par de nuevas empresas que construyen sistemas agentes. En la publicación de hoy, analizamos cómo pensamos que pasaremos de asistentes de inteligencia artificial como ChatGPT a miles de millones de agentes que nos respaldan en segundo plano. ¡Disfrutar!

Por

y

En un futuro muy cercano, los trabajadores del conocimiento podrían contar con el apoyo de miles de agentes de IA, todos operando en paralelo. Esto no es futurismo especulativo. Jensen Huang de Nvidia habló recientemente sobre el papel de los agentes Ya juega en Nvidia y cómo ve su futuro:

Puntilla: ¿Ya estás utilizando cadenas de razonamiento y herramientas como o1 en nuestro propio negocio para mejorarlo?

Jensen: Absolutamente. Nuestro sistema de ciberseguridad actual no puede funcionar sin nuestros propios agentes. Contamos con agentes de IA que ayudan a diseñar chips: Hopper no sería posible, Blackwell no sería posible y ni siquiera pensamos en Rubin. Contamos con diseñadores de chips de IA, ingenieros de software de IA e ingenieros de verificación de IA, y los construimos todos internamente. Tenemos la capacidad y preferiríamos aprovechar la oportunidad para explorar la tecnología nosotros mismos. Espero que Nvidia algún día sea una empresa de 50.000 empleados con 100 millones de asistentes de IA […] Las IA reclutarán a otras IA para resolver problemas […] Por lo tanto, seremos simplemente una gran base de empleados, algunos de ellos digitales y otros biológicos.

De manera similar, Sam Altman anticipa el surgimiento de una unicornio unipersonal—Una empresa de mil millones de dólares administrada por un solo individuo que aprovecha un ejército de agentes de IA.

Los asistentes de IA actuales, como ChatGPT, requieren una participación humana constante: son copilotos, no actores autónomos. La próxima evolución, que ya está en marcha, es la de agentes que ejecutan tareas de forma independiente una vez que se les asigna un objetivo, muy parecido a delegar a un equipo experimentado y dar un paso atrás mientras ellos se encargan del resto. Y no hay límite para el tamaño de este equipo.

Para ayudarle a entender esto, nos asociamos con

ingeniero de aprendizaje automático, escritor y editor en jefe de .

Juntos, exploraremos tres áreas en la publicación de hoy:

  • El estado actual de los agentes de IA y sus aplicaciones en el mundo real.

  • ¿Por qué su adopción generalizada se está volviendo inevitable?

  • Cómo esta transición podría conducir a un futuro en el que miles de millones de agentes aumenten el trabajo humano.

Los agentes han sido una prioridad para los científicos informáticos durante décadas, pero hasta hace poco se lograron pocos avances. Lo lejos que hemos llegado se refleja mejor en una cita de un artículo de 1997 por los científicos informáticos Christopher Welty y Louis Hoebel, quienes luego escribieron

Cualquiera que tenga conocimientos sobre “agentes” no puede evitar reconocer que, como tecnología de inteligencia artificial, normalmente hay muy poca inteligencia real involucrada. En cierto sentido, los Agentes pueden definirse como IA a pequeña escala que funciona.

La era ChatGPT introdujo sistemas basados ​​en LLM que actualmente consideramos “agentes de IA”. Los primeros prototipos como BebéAGIpor ejemplo, demostró que la planificación de tareas podría permitir a los LLM actuar de forma autónoma.

Ejemplo de Yohei Nakajima

Las últimas mejoras se han capturado en puntos de referencia (consulte la Informe sobre el estado de la IA 2024 para profundizar) e investigaciones que demuestran que los LLM existentes se pueden utilizar para crear agentes que aprenden continuamente en entornos abiertos (como Minecraft).

Lanzamiento de DeepMind gatoun “agente generalista” que utiliza la misma idea subyacente en los LLM para realizar tareas, desde apilar bloques con un brazo robótico real hasta subtitular imágenes. Joon Park y sus colegas propusieron Agentes generativos como una caja de arena interactiva que se utilizará principalmente para las ciencias sociales. En ciencias duras, investigadores de Stanford crearon un laboratorio virtual que utilizaba agentes crear 92 nuevos diseños de nanocuerposincluidos múltiples nanocuerpos con actividad de unión exitosa contra el virus que causa Covid-19 (como se destaca en EV#501).

En la empresa, Adepto imaginó un asistente digital que podría convertir un comando de texto en una serie de acciones, como hacer un plano para una pieza nueva de un automóvil, y recaudó 350 millones de dólares hacerlo antes de ser absorbido en Amazon.

En el ámbito del consumo, empresas emergentes como Shortwave han desarrollado agentes que pueden desempeñar el papel de asistentes ejecutivos para gestionar y estructurar la información en dominios como el correo electrónico. Azeem ha invertido en dos nuevas empresas de agentes, WordWare y Mellizo.

Mientras tanto, Microsoft ha estado aprovechando su fortaleza en software empresarial para establecer silenciosamente un punto de apoyo en esta área. Encima 100.000 de sus clientes empresariales ya están experimentando en Copilot Studio, creando agentes autónomos personalizados o implementando soluciones listas para usar.

Hiscox, una aseguradora, utilizó agentes para reducir el tiempo de cotización de riesgos complejos de tres días a unos pocos minutos. De manera similar, McKinsey, utilizando el ecosistema de agentes de Microsoft, ha reducido su flujo de trabajo de admisión de proyectos de 20 días a dos días.

Socios de conocimiento predice que todos tendrán un asistente de IA: estos agentes tomarán diferentes formas y redefinirán los límites entre aplicaciones, plataformas y servicios.

Durante el siglo pasado, hemos sido testigos de asombrosos aumentos de productividad en industrias como la manufacturera y la agrícola: las fábricas producen productos exponencialmente más rápido y las granjas alimentan a miles de millones con una fracción de la fuerza laboral que alguna vez necesitaron. Sin embargo, en las aulas todavía se necesita un maestro para educar a 30 estudiantes. Esto es La maldición de Baumol. Cuando los salarios aumentan en sectores de alta productividad como el manufacturero, los servicios intensivos en mano de obra deben aumentar los salarios para competir, incluso si su productividad permanece estancada. Así, mientras los productos manufacturados se abaratan, muchos servicios se encarecen.

En el centro de esta cuestión está nuestra incapacidad para escalar nuestra propia humano tiempo. Según la Ley de Amdahl, la velocidad de un sistema está limitada por su componente más lento. En muchas partes del sector de servicios, esto se reduce a limitaciones en torno a los procesos dependientes de los seres humanos. La Revolución Industrial superó las limitaciones físicas mediante la mecanización; La IA podría ser una oportunidad similar para superar los obstáculos cognitivos al otro lado de…

  1. Velocidad: Los sistemas de IA operan mucho más allá de los tiempos de reacción humanos, procesando datos en milisegundos. El LLM más rápido produce resultados a 6000 veces la velocidad que puede alcanzar un humano.

  2. Escala: Podemos implementar tantos agentes de IA como lo permitan nuestros recursos computacionales, superando potencialmente la población humana.

  3. Paralelización: Las tareas se pueden dividir entre miles o incluso millones de agentes de IA. En lugar de analizar 100 documentos secuencialmente, 100 agentes de IA pueden procesarlos simultáneamente y fusionar sus hallazgos en un solo informe.

  4. Eficiencia de costes: Con el tiempo, los agentes se vuelven más baratos que la mano de obra humana, especialmente cuando se escala. En este momento podemos conseguir un sistema protoagente para realizar un metanálisis de 200 artículos de ArXiv por aproximadamente el 1% del costo humano. AlphaFold predijo 200 millones de estructuras proteicas, cada una de las cuales tradicionalmente cuesta $100,000 y un doctorado completo para determinar.

  5. Personalización: En lugar de dividir un servicio humano entre muchos, la IA permite experiencias individualizadas para todos: un tutor privado para usted o su hijo, por ejemplo.

  6. Aprendizaje y adaptación: Como sostiene el investigador independiente Gwern Branwen: “Todo problema suficientemente difícil se convierte en un problema de aprendizaje por refuerzo.“Cada desafío complejo requiere tomar secuencias de decisiones bajo incertidumbre donde cada elección afecta las opciones y resultados futuros, que es exactamente lo que resuelve el aprendizaje por refuerzo. Con esto, los sistemas de IA pueden ejecutar millones de experimentos paralelos, agregar sus aprendizajes mediante el reparto de peso y actuar sobre esos conocimientos de una manera que los sistemas biológicos no pueden.

Durante el próximo año, el despliegue de agentes tomará un “Gatear, caminar, correr” acercarse. Las empresas están experimentando con casos de uso simples, antes de expandirse en complejidad. De ahí todo lo que se habla de los agentes de servicio al cliente, una implementación fácil y de riesgo relativamente bajo. Pero la complejidad y la variedad de tareas que un agente puede realizar crecerán.

Para pensar más en una evolución que podríamos comenzar a ver el próximo año, veamos una profesión que todos aman… los abogados.

Honoré Daumier, Les Gens du Justice: Les avocats et les plaideurs, 1845

De acuerdo a una base de datos mantenida por el Departamento de Trabajo de EE. UU.los abogados realizan 22 tareas profesionales distintas. Una de estas tareas principales es la preparación de escritos y dictámenes legales para presentaciones judiciales. Imagine a un socio de una firma de abogados asignando un complejo escrito de apelación a lo que parece ser un único asistente de IA, pero que en realidad es una orquesta de agentes especializados, cada uno con una “experiencia” distinta.

El proceso comienza en el momento en que se cargan los expedientes del caso. Un agente coordinador (un director de proyectos de IA, por así decirlo) analiza inmediatamente los requisitos del tribunal y los plazos de presentación. En cuestión de segundos, un agente de investigación revisa bases de datos legales a una velocidad sobrehumana. Identifica todos los precedentes relevantes y patrones sutiles en el razonamiento judicial en casos similares. Al mismo tiempo, un agente de análisis de casos examina el expediente del juicio, relaciona los hechos del caso con elementos legales e identifica argumentos prometedores que los abogados humanos podrían pasar por alto en miles de páginas de testimonios.

Así como un agente de redacción elabora argumentos preliminares en un lenguaje legal preciso, un agente de gestión de citaciones garantiza que cada referencia cumpla con los estándares del Bluebook y valida que cada caso citado siga siendo una buena ley. Un agente de cumplimiento técnico monitorea continuamente el formato, el recuento de palabras y las reglas judiciales en tiempo real, mientras que un agente de control de calidad valida las cotizaciones y garantiza la coherencia lógica. El agente coordinador contrata a otros agentes, gestiona los flujos de trabajo y resuelve conflictos.

Y esto es sólo para una única tarea…

La magia del sistema agente es que puede escalar. Podría tener una docena o más de informes preparados en paralelo. Lo que comienza con unos pocos agentes especializados manejando un informe legal rápidamente se convierte en cascada. Empezar con 1,3 millones de abogados estadounidensescada uno de los cuales despliega 5 agentes especializados para cada una de las 22 tareas que realizan; eso ya son mil millones de agentes. Eso es sólo para 1 millón de abogados… Se estima que hay 1.000 millones trabajadores del conocimiento en todo el mundo. Habrá miles de millones de agentes. Y esto supone 5 agentes por tarea. ¿Pero por qué no 5, 10, 100 agentes? Teóricamente no hay más límite que el de eficacia.

Pero hacer que las organizaciones de abogados sean más eficientes no es lo único que los agentes permitirán. Como señala Flo Crivello, fundador y CEO de Lindy, cuando las herramientas se vuelven exponencialmente más baratas, pasan de ser activos corporativos a permitir la creatividad individual:

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Tu luna nueva en el horóscopo de Géminis

Published

on

Las nuevas lunas son un momento de rejuvenecimiento y manifestación. Si tiene falta en su vida, este es el momento en que el colectivo trabajará para llenarlo, ya sea a través de una nueva experiencia, persona o artículo. Debemos hacer espacio para comienzos y un comportamiento tonto durante las nuevas lunas. Eso sí, todos somos tontos cuando comenzamos algo nuevo, así que no tengas miedo de ser experimentales.

Para los novatos, una luna nueva es cuando la luna conjuía con el sol en el mismo grado. Las nuevas lunas son para establecer intenciones y objetivos para manifestarse. ¡Tome el tema de cada luna nueva (período de manifestación) como inspiración para presentar la mejor versión de usted mismo! Si encuentra útil su horóscopo o tiene alguna pregunta, comparta su horóscopo y etiquétame en las redes sociales @monishaholmes.


La luna nueva en Géminis, que tiene lugar en 26 de mayo de 2025, a las 11:01 pm EST, Se trata de reconocer el peligro de llegar a conclusiones antes de tener la imagen completa. Imagina esto: lees un párrafo de libros de texto y de repente crees que has desbloqueado el secreto de la vida. Escuchas un fragmento de chismes y comienzas a sacar conclusiones audaces y seguras. Bienvenido a la temporada de Géminis. Este signo aéreo ama las ideas, las conversaciones y la información, pero no necesariamente información completa. Y bajo esta lunación, existe una gran posibilidad de que muchos de nosotros caigamos en la trampa de pensar que lo sabemos todo … cuando no lo hacemos.

Durante esta luna nueva en Géminis, hay cinco consideraciones para recordar:

1. Las distorsiones cognitivas están en su punto más alto.

Nuestros cerebros están diseñados para llenar los espacios en blanco, pero a veces eso puede funcionar contra nosotros. Los psicólogos llaman a estos percances mentales como “distorsiones cognitivas”, que son básicamente patrones de pensamiento inútiles como el pensamiento en blanco y negro, catastrófando o asumiendo lo peor sin evidencia. Bajo esta luna nueva, es posible que esté leyendo demasiado lejos en un texto, pensando demasiado en un tono de voz o suponiendo que alguien esté enojado contigo cuando estén distraídos. La tarea? No considere los hechos de sus supuestos.

2. Estás trabajando con información incompleta.

La energía de Géminis es rápido y mentalmente estimulante, pero no siempre es exhaustiva. Puede recibir un poderoso mensaje, idea o revelación, e inmediatamente desea actuar en consecuencia. Pero la verdad es que solo tienes parte de la historia. Tenga en cuenta la tentación de correr con una astilla. No salte a la conclusión del libro procediendo hacia el triunfo sin leer todos los capítulos (sí, incluido el glosario).

3. El arquetipo de tramposo está en juego.

Géminis está asociado con el tramposo, un arquetipo que prospera en la dualidad, los matices y la contradicción. Esto no significa que la gente te esté mintiendo, solo significa que la realidad puede estar más en capas de lo que parece. Lo que parece una contradicción podría ser dos verdades que coexisten. En lugar de llamarlo engaño, considere la posibilidad de que la complejidad sea parte de la verdad.

4. La curiosidad es su protección.

En lugar de reaccionar, tenga curiosidad. Haga más preguntas. Mantente abierto. Esté dispuesto a admitir: “Todavía no lo sé”. Esa mentalidad lo protegerá de malentendidos, desinformación y drama innecesario. Esta luna nueva recompensa a aquellos que hacen una pausa para investigar en lugar de aquellos que se apresuran a resolver. Asumir menos. Escucha más. La claridad vendrá, pero solo para aquellos que son lo suficientemente pacientes como para recibirlo.

5. Deje que la historia se desarrolle.

Con varios planetas que pronto se mudan a Aries, la necesidad de “resolverlo ahora” puede parecer abrumador. Pero manifestar bajo esta luna nueva significa entregar su necesidad de saberlo todo. No necesita decidir, concluir o definir todavía. La trama todavía se está engrosando. Déjalo. Confía en que la verdad se revela en el tiempo, no bajo presión.

A continuación, lea su horóscopo basado en su sol, luna y señales ascendentes. Lea para que su signo solar obtenga información basada en la versión de usted mismo en la que está madurando, su signo creciente para reflexionar sobre su estado actual y su signo de luna para orientación sobre el cuidado de su hijo interior.


Su horóscopo para la luna nueva en Géminis el 26 de mayo de 2025 a las 11:01 pm EST

Aries

Vaya, Aries. Chica, saben que solo estás al comienzo de un nuevo viaje, ¿verdad? Saturno, el planeta de crecimiento, ha entrado en su órbita energética y lo está guiando lentamente hacia el triunfo a largo plazo. Eso significa que trabajará estrechamente con la energía saturniana entre ahora y el 14 de abril de 2028 (jajaja, disfruta eso). ¡En tres años, disfrutarás de las recompensas de tu avance espiritual! Esta luna nueva es el inicio oficial, que le enseña nuevas formas de comunicarse y expresarse. Mira hacia arriba, nena, estás creciendo.

Tauro

Las constelaciones hacen que parezca que tienes mucho en mente, Tauro. Lo mejor que puedes hacer por ti mismo es mantener un diario. Coloque a su crítico interno a un lado y deje que lo que flote en la parte superior de su mente se derrame en la página. Sounddreams, miedos, esperanzas o incluso sonidos aleatorios, escriba todo. Estos vertederos de cerebro actuarán como un espejo para ayudarlo a conocer a la versión que puede traerle paz. Esta luna nueva está probando sus valores. Párese diez dedos en lo que cree, a menos que se le entregue evidencia de que es hora de evolucionar.

Géminis

¿Cómo se siente ser la belleza de la pelota, Géminis? Estás cerca del final de un largo capítulo en autodescubrimiento. Justo cuando crees que has volteado cada roca y girado cada página, serás invitado a verlo todo nuevamente, pero desde un ángulo diferente. Pasar de un enfoque “Me-First” a una mentalidad más colaborativa y centrada en el otro es su próximo paso. Por ahora, absorbe el centro de atención. Muy pronto, pasará con gracia un papel más solidario, y se adaptará maravillosamente a usted.

Cáncer

Intente que sea posible para compartimentar o descartar sus instintos, su sexto sentido siempre encuentra una manera de hablar. Durante la luna nueva en Géminis, finalmente ver Una situación claramente, tal vez la que ha estado tratando de salir de su salida. ¿Pero adivina qué? Eso no es algo malo. La honestidad trae curación, y te sentirás más fuerte por enfrentar la verdad de frente. Ahora que las gafas de color rosa están apagados, puede moverse con precisión y potencia.

León

Mantenga la barbilla en alto, Leo: espera la roca. Puede haber algunas lecciones de salud importantes (y posiblemente humillantes) en su camino. Si ha estado evitando una cita con el médico o ignorando su aplicación de bienestar, ahora es el momento de seguir adelante. Esta luna nueva tiene grandes bendiciones que ofrecer, pero requerirán toda su energía. Y eso significa aprender a descansar cuando su cuerpo pregunta. El autocuidado somático no es un castigo: es parte de su viaje de tres años.

Virgo

Es hora de salir de la cueva, Virgo. Por mucho que ames tu era ermitaño, cada retiro necesita un retorno. No puedes escapar del mundo si nunca lo vuelves a ingresar. Esta luna nueva lo guía de regreso hacia una conexión profunda, especialmente en formas que pueden elevar su carrera. Las relaciones que construye ahora pueden dar forma a su camino profesional en los próximos años. Así que desempolve, salga al sol y sepa que está apoyado mientras se vuelve a conectar.

Libra

¿Qué podría aprender de una escapada rápida fuera de su código de área? La luna nueva del 26 de mayo te invita a explorar, literalmente. Ya sea un viaje por carretera, un vuelo, un viaje en tren o incluso una aventura en bicicleta, el movimiento es tu magia. Solo elige una dirección y ve. Encontrarás una chispa de inspiración escondida en lugares desconocidos. Confía en tu pasión por los viajes. En caso de duda, lidere con curiosidad y juego.

Escorpión

Oh, Scorpio. Para alguien que prospera en las profundidades, es posible que se sienta un poco encerrado debajo de esta luna nueva de Géminis. Las transformaciones en el hogar están tomando su energía, lo que hace que ser visto sentirse arriesgado. Pero no se retire todavía: esta es su señal para dejar que alguien entre en su espacio y suavizar su control sobre el control. Deja ir el guión. Deja que la gente te sorprenda. Encontrarás alegría en la espontaneidad que sigue.

Sagitario

Las asociaciones están evolucionando de maneras inesperadas, SAG. No se asuste, esto es algo bueno. Estás aprendiendo que la conexión real a menudo viene después del caos, los desvíos y algunos errores cómicos. Ser valiente. Habla tu verdad. La gente destinada a ti se quedará para el viaje completo. Ocupa el espacio sin disculpas: mereces relaciones que se sientan como hogarno una actuación. Trae todo tu ser. Así es como llamas lo que significa para ti.

Capricornio

Tómelo con calma, Guerrero de Gimnasia. Has estado moliendo, y la luna nueva Géminis quiere que cambies tu ritmo. Si se trata de entrenamientos de alta intensidad, intente algo más lento. Si has estado arrastrando, tal vez sea hora de agregar un poco de fuego. El autocuidado de estilo de día opuesto es tu mejor opción. Sorprende tu cuerpo. Actualiza tu rutina. Te lo agradecerás más tarde. ¿Y si te sientes confundido sobre lo que necesitas? Pregúntele a su cuerpo, siempre lo sabe.

Acuario

Yum, Acuario. Esta luna nueva quiere que lo hagas Diviértete. Piense: placer, curiosidad, caos alegre. Canaliza la energía de un delfín coqueto, sí, y date permiso para romper las reglas. Besar a alguien inesperado. Los fantasma juguetonamente. Haz travesuras sin cuerdas. El mundo es tu buffet, intenta todo. La vida no siempre necesita ser una misión. Deje que la diversión sea el propósito por una vez.

Piscis

¿Alguna vez existe el final de las mejoras en el hogar, Piscis? Probablemente no, pero eso es lo que lo hace hermoso. Tu espacio es una extensión de tu alma, y ​​esta luna nueva te pide que lo devuelvas de vuelta. Ya sea que se trate de candelabros en forma de palomitas de maíz o una decoración del núcleo de circo (me escuchaste), es hora de jugar. ¿No estás seguro de por dónde empezar? Haga una lista de cosas que te hacen sonreír, luego encuentre formas de incorporar más de eso en tu hogar. Las cosas raras pertenecen. Tú también.

Continue Reading

Noticias

Los expertos en IA reaccionan a la fusión de OpenAi y Jony Ive para crear dispositivos AI

Published

on

A medida que la ubicuidad de AI se difunde en línea, una fusión anunciada entre Operai y la fábrica de ideas de Jony Ive, la mente detrás del diseño del iPhone y MacBook Pro, probablemente saltará al mundo real con una familia de dispositivos específica de IA.

Operai publicó una declaración conjunta el miércoles entre su CEO Sam Altman y Ive sobre el acuerdo para adquirir IO por $ 6.5 mil millones. La fusión incluye la confianza del cerebro de IO de más de 50 empleados.

El sitio web también tiene un video de nueve minutos, integrado a continuación, donde los visionarios de IA discuten la justificación general detrás de la fusión sobre café en un pub de San Francisco, así como el hecho de que han estado trabajando en silencio juntos durante más de un año.

Altman e Ive: ¿un partido hecho en el dispositivo de dispositivo AI?

En el video, Altman explica por qué se necesita un dispositivo específico de IA. “Si quisiera preguntarle a Chatgpt algo en este momento, necesitaría alcanzar mi bolso, sacar mi computadora portátil, abrirla, lanzar un navegador, comenzar a escribir y luego explicar esa cosa, luego entrar en ENTER, luego esperar una respuesta. Ese es el límite de lo que puede hacer la herramienta actual de una computadora portátil”, dijo Altman.

“Es solo sentido común al menos pensar, seguramente hay algo más allá de estos productos heredados”, dijo Ive. “Tengo la creciente sensación de que todo lo que he aprendido en los últimos 30 años me ha llevado a este momento. Si bien estoy ansioso y entusiasmado con la responsabilidad del trabajo sustancial por delante, estoy muy agradecido por la oportunidad de ser parte de una colaboración tan importante”.

Si bien no se mostraron prototipos, Altman describió el dispositivo beta que el equipo de IO ya ha desarrollado como “la mejor pieza de tecnología que el mundo haya visto”.

Los expertos comparten por qué un dispositivo de IA es un gran problema

Conor Grennan es el arquitecto Jefe de AI en la NYU Stern School of Business, así como el CEO y fundador de la consultora AI Mindset. Está entusiasmado con la perspectiva del hardware que coincide con la imaginación de la utilidad de AI.

“La IA está en todas partes, pero la forma en que lo usamos todavía se siente torpe, con demasiada fricción. Jony Ive hizo que los productos de Apple se sintieran como mágicos: hermosa, simple y algo que quise tener. Si OpenAi puede combinar su cerebro de IA de clase mundial con hardware diseñado por Ive, podrían hacer que AI se sintiera natural y sin esfuerzo.

Daniel Newman es un analista líder de la industria de la IA, autor de tecnología más vendida y CEO de Futurum Group. Él dice que la fusión es audaz y arriesgada.

“Hardware could be a new frontier for OpenAI. This merger, with access to a designer like Ive, could open up the door to creating new devices and profiles that are built for the AI ​​world. A lot of people see this as a big threat to Apple. I do have my doubts, as I think it will be harder to disrupt the hardware ecosystem and the software of iOS and Android due to the large install base. But this belief has also led to meaningful errors of disruption Eso incluyó el pivote de los teléfonos y moras de Nokia ”, dijo Newman.

Ahmed Banafa, Ph.D., es experto en tecnología y profesor de ingeniería en la Universidad Estatal de San José. Él dice que este sindicato es mucho más que simplemente poner a la IA en una caja de mano.

“Se trata de una estrategia de integración vertical que remodelará fundamentalmente el panorama de la IA. OpenAi ya no se contenta con simplemente proporcionar el cerebro; quieren diseñar el cuerpo, el alma y todo el sistema nervioso de las futuras interacciones de IA. Al controlar tanto el software como el hardware, pueden optimizar el rendimiento, las experiencias sin problemas y las capacidades sin problemas y las capacidades completamente nuevas.

Lo que los dispositivos de IA podrían significar para las personas promedio

Rob Howard, consultor de IA y educador en innovar con IA durante más de una década, es un poco escéptico de que los usuarios casuales de IA graviten hacia un dispositivo específico de IA, especialmente dado el hecho de que la mayoría del software de IA está disponible a través de una aplicación de dispositivo móvil.

“La idea de que los consumidores están abiertos a comprar otra pieza de hardware muy costosa para complementar su iPhone o su teléfono Android es una apuesta bastante grande para OpenAI. Es notoriamente difícil lograr que los consumidores adopten un nuevo hardware para el uso diario. El Apple Watch fue un ejemplo de éxito, pero ha habido muchos ejemplos de fallas”, señaló.

“Creo que es muy probable que ocurra una intensa competencia entre Apple y OpenAi y posiblemente conduzca a más bloqueos y ecosistemas que sean menos abiertos y menos interoperables”, agregó. “Para el consumidor típico, eso significa que es posible que no puedan usar OpenAI en un dispositivo Apple en algún momento en el futuro”.

Grennan reconoce que existen desafíos con la adopción de hardware, pero cree que la combinación de Ive y OpenAI tiene una oportunidad.

“Los grandes cambios de hardware llevan tiempo. Pero las personas tienen hambre de un dispositivo que hace que la IA sea divertida, útil y fácil de interactuar. Hemos visto la exageración de cosas como el conejo R1, incluso si no entregan. Si OpenAi y he logrado esto correctamente, podría cambiar la forma en que usamos la tecnología todos los días, esto podría ser útil, un símbolo de estado y cambiar la forma en que el mundo mira el mundo en la inteligencia cotidiana”, dijo.

El Dr. Banafa señaló que, si bien los consumidores son un objetivo obvio para un dispositivo específico de IA, los competidores de Big Tech, y su participación en el mercado de dispositivos respectivos, también son objetivos prominentes para la fusión OpenAI e IVE.

“Esto no es una relación; es una declaración. OpenAi se está moviendo más allá de ser un juego de software puro para convertirse en un competidor directo en el espacio de electrónica de consumo. Esto los coloca en un curso de colisión con gigantes tecnológicos como Apple, Google y Meta, todos los que están fuertemente invertidos en hardware de IA. El panorama competitivo se vuelve mucho más interesante”.

ForbesEsta IA descentralizada podría revolucionar el desarrollo de fármacos

Continue Reading

Noticias

Operai actualiza su nueva API de respuestas rápidamente con el soporte de MCP, GPT-4O Native Image Gen y más características empresariales

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Operai está implementando un conjunto de actualizaciones significativas de su nueva API de respuestas, con el objetivo de facilitar que los desarrolladores y empresas creen aplicaciones de agente inteligentes orientadas a la acción.

Estas mejoras incluyen soporte para servidores de protocolo de contexto del modelo remoto (MCP), integración de la generación de imágenes y herramientas de intérpretes de código, y actualizaciones para las capacidades de búsqueda de archivos, todo disponible a partir de hoy, 21 de mayo.

Lanzado por primera vez en marzo de 2025, la API de respuestas sirve como la caja de herramientas de OpenAI para que los desarrolladores de terceros creen aplicaciones de agente sobre algunas de las funcionalidades centrales de sus exitosos servicios CHATGPT y sus agentes de IA de propiedades profundas y operadores.

En los meses posteriores a su debut, ha procesado billones de tokens y ha apoyado una amplia gama de casos de uso, desde la investigación de mercado y la educación hasta el desarrollo de software y el análisis financiero.

Las aplicaciones populares construidas con la API incluyen el agente de codificación de Zencoder, el asistente de inteligencia de mercado de Revi y la plataforma educativa de MagicSchool.

La base y el propósito de la API de las respuestas

La API de respuestas debutó junto con el SDK de los agentes de código abierto de Opengai en marzo de 2025, como parte de una iniciativa para proporcionar acceso a desarrolladores de terceros a las mismas tecnologías que alimentan a los propios agentes de inteligencia artificial de Openi como la investigación y el operador profundo.

De esta manera, las nuevas empresas y las empresas fuera de OpenAI podrían integrar la misma tecnología que ofrece a través de ChATGPT en sus propios productos y servicios, ya sean internos para el uso de empleados o externos para clientes y socios.

Inicialmente, la API combinó elementos de las completaciones de chat y la API de asistentes, que libera herramientas incorporadas para la búsqueda en la web y los archivos, así como el uso de la computadora, lo que permite a los desarrolladores construir flujos de trabajo autónomos sin lógica de orquestación compleja. Openai dijo en ese momento que la API de finalización de chat estaría en desuso a mediados de 2026.

La API de respuestas proporciona visibilidad en las decisiones del modelo, el acceso a los datos en tiempo real y las capacidades de integración que permitieron a los agentes recuperar, razonar y actuar sobre la información.

Este lanzamiento marcó un cambio para dar a los desarrolladores un conjunto de herramientas unificado para crear agentes de IA específicos de dominio listos para la producción con una fricción mínima.

El servidor remoto del servidor MCP amplía el potencial de integración

Una adición de clave en esta actualización es el soporte para los servidores MCP remotos. Los desarrolladores ahora pueden conectar los modelos de OpenAI a herramientas y servicios externos como Stripe, Shopify y Twilio utilizando solo unas pocas líneas de código. Esta capacidad permite la creación de agentes que pueden tomar medidas e interactuar con los usuarios de los sistemas de la que ya dependen. Para apoyar este ecosistema en evolución, OpenAI se ha unido al Comité Directivo de MCP.

La actualización trae nuevas herramientas incorporadas a la API de respuestas que mejoran lo que los agentes pueden hacer dentro de una sola llamada API.

Una variante del exitoso modelo de generación de imágenes nativas de GPT-4O de OpenAI, que inspiró una ola de memes de anime estilo “Studio Ghibli” en la web y abrochó los servidores de OpenAI con su popularidad, pero obviamente puede crear muchos otros estilos de imagen ahora está disponible a través de la API bajo el nombre del modelo “GPT-IMage-1”. Incluye nuevas características potencialmente útiles y bastante impresionantes, como vistas previas de transmisión en tiempo real y refinamiento múltiple.

Esto permite a los desarrolladores crear aplicaciones que puedan producir y editar imágenes dinámicamente en respuesta a la entrada del usuario.

Además, la herramienta de intérprete de código ahora está integrada en la API de respuestas, lo que permite que los modelos manejen el análisis de datos, las matemáticas complejas y las tareas basadas en la lógica dentro de sus procesos de razonamiento.

La herramienta ayuda a mejorar el rendimiento del modelo en varios puntos de referencia técnicos y permite un comportamiento de agentes más sofisticado.

Búsqueda de archivos mejorado y manejo de contexto

La funcionalidad de búsqueda de archivos también se ha actualizado. Los desarrolladores ahora pueden realizar búsquedas en múltiples tiendas vectoriales y aplicar el filtrado basado en atributos para recuperar solo el contenido más relevante.

Esto mejora la precisión del uso de los agentes de la información, mejorando su capacidad para responder preguntas complejas y operar dentro de grandes dominios de conocimiento.

Nuevas empresas de fiabilidad, características de transparencia

Varias características están diseñadas específicamente para satisfacer las necesidades empresariales. El modo de fondo permite tareas asincrónicas de larga duración, abordando problemas de tiempos de espera o interrupciones de la red durante el razonamiento intensivo.

Los resúmenes de razonamiento, una nueva adición, ofrecen explicaciones en idioma natural del proceso de pensamiento interno del modelo, ayudando con la depuración y la transparencia.

Los elementos de razonamiento cifrados proporcionan una capa de privacidad adicional para clientes de retención de datos cero.

Estos permiten a los modelos reutilizar los pasos de razonamiento anteriores sin almacenar ningún dato en los servidores Operai, mejorando tanto la seguridad como la eficiencia.

Las últimas capacidades son compatibles con la serie GPT-4O de Openai, la serie GPT-4.1 y los modelos O-Series, incluidos O3 y O4-Mini. Estos modelos ahora mantienen el estado de razonamiento en múltiples llamadas y solicitudes de herramientas, lo que conduce a respuestas más precisas a un costo y latencia más bajos.

¡El precio de ayer es el precio de hoy!

A pesar del conjunto de características ampliada, OpenAI ha confirmado que los precios de las nuevas herramientas y capacidades dentro de las respuestas API seguirán siendo consistentes con las tasas existentes.

Por ejemplo, la herramienta de intérprete de código tiene un precio de $ 0.03 por sesión, y el uso de búsqueda de archivos se factura a $ 2.50 por 1,000 llamadas, con costos de almacenamiento de $ 0.10 por GB por día después del primer gigabyte gratuito.

El precio de búsqueda web varía según el tamaño del modelo y el tamaño del contexto de búsqueda, que oscila entre $ 25 y $ 50 por cada 1,000 llamadas. La generación de imágenes a través de la herramienta GPT-Image-1 también se cobra de acuerdo con la resolución y el nivel de calidad, a partir de $ 0.011 por imagen.

Todo el uso de la herramienta se factura a las tarifas por juicio del modelo elegido, sin un marcado adicional para las capacidades recientemente agregadas.

¿Qué sigue para la API de respuestas?

Con estas actualizaciones, OpenAI continúa expandiendo lo que es posible con la API de respuestas. Los desarrolladores obtienen acceso a un conjunto más rico de herramientas y funciones listas para la empresa, mientras que las empresas ahora pueden construir aplicaciones más integradas, capaces y seguras de IA.

Todas las características están en vivo a partir del 21 de mayo, con detalles de precios e implementación disponibles a través de la documentación de OpenAI.

Continue Reading

Trending