Noticias

Analizadores de análisis superiores: Pares de investigación profundos de Openai razonamiento de LLMS con trapo de agente para automatizar el trabajo y reemplazar trabajos

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Las empresas empresariales deben tomar nota de la investigación profunda de OpenAI. Proporciona un poderoso producto basado en nuevas capacidades, y es tan bueno que podría dejar a mucha gente fuera de trabajo.

La investigación profunda está en el borde sangrado de una tendencia creciente: la integración de modelos de idiomas grandes (LLM) con motores de búsqueda y otras herramientas para expandir en gran medida sus capacidades. (Justo cuando se informó este artículo, por ejemplo, el XAI de Elon Musk presentó Grok 3, que reclama capacidades similares, incluido un producto de búsqueda profunda. Sin embargo, es demasiado pronto para evaluar el rendimiento del mundo real de Grok 3, ya que la mayoría de los suscriptores no han en realidad todavía lo conseguí).

La investigación profunda de Openai, lanzada el 3 de febrero, requiere una cuenta profesional con OpenAI, que cuesta $ 200 por mes, y actualmente está disponible solo para los usuarios de EE. UU. Hasta ahora, esta restricción puede tener comentarios tempranos limitados de la comunidad de desarrolladores globales, que generalmente se apresura a diseccionar nuevos avances de IA.

Con el modo de investigación profunda, los usuarios pueden hacer cualquier pregunta al modelo O3 líder de OpenAI. El resultado? Un informe a menudo superior a lo que producen los analistas humanos, entregado más rápido y a una fracción del costo.

Cómo funciona la investigación profunda

Si bien la investigación profunda se ha discutido ampliamente, sus implicaciones más amplias aún no se han registrado completamente. Las reacciones iniciales elogiaron sus impresionantes capacidades de investigación, a pesar de sus alucinaciones ocasionales en sus citas. Estaba el tipo que dijo que lo usó para ayudar a su esposa que tenía cáncer de seno. Proporcionó un análisis más profundo de lo que sus oncólogos proporcionaron sobre cómo la radioterapia era el curso de acción correcto, dijo. El consenso, resumido por el profesor de Wharton AI, Ethan Mollick, es que sus ventajas superan con creces las imprecisiones ocasionales, ya que la verificación de hechos lleva menos tiempo de lo que la IA salva en general. Esto es algo con lo que estoy de acuerdo, basado en mi propio uso.

Las instituciones financieras ya están explorando las solicitudes. BNY Mellon, por ejemplo, ve potencial en el uso de una investigación profunda para las evaluaciones de riesgos de crédito. Su impacto se extenderá entre las industrias, desde la atención médica hasta la gestión minorista, de fabricación y de la cadena de suministro, prácticamente cualquier campo que se basa en el trabajo de conocimiento.

Un agente de investigación más inteligente

A diferencia de los modelos de IA tradicionales que intentan respuestas de un solo disparo, la investigación profunda primero hace preguntas aclaratorias. Puede hacer cuatro o más preguntas para asegurarse de que comprenda exactamente lo que desea. Luego desarrolla un plan de investigación estructurado, realiza múltiples búsquedas, revisa su plan basado en nuevas ideas e itera en un bucle hasta que compila un informe integral y bien formato. Esto puede llevar entre unos minutos y media hora. Los informes varían de 1,500 a 20,000 palabras, y generalmente incluyen citas de 15 a 30 fuentes con URL exactas, al menos de acuerdo con mi uso durante la última semana y media.

La tecnología detrás de la investigación profunda: razonamiento LLMS y el trapo de agente

La investigación profunda hace esto fusionando dos tecnologías de una manera que no hemos visto antes en un producto de mercado masivo.

LLMS de razonamiento: El primero es el modelo de vanguardia de OpenAI, O3, que conduce en un razonamiento lógico y procesos extendidos de la cadena de pensamiento. Cuando se anunció en diciembre de 2024, el O3 obtuvo un 87.5% sin precedentes en el punto de referencia SUPER-DIFFICTULT ARC-AGI diseñado para probar nuevas habilidades de resolución de problemas. Lo interesante es que O3 no se ha lanzado como un modelo independiente para que los desarrolladores lo usen. De hecho, el CEO de OpenAI, Sam Altman, anunció la semana pasada que el modelo en cambio estaría envuelto en un sistema de “inteligencia unificada”, que uniría modelos con herramientas de agente como la búsqueda, los agentes de codificación y más. La investigación profunda es un ejemplo de dicho producto. Y aunque competidores como Deepseek-R1 se han acercado a las capacidades de O3 (una de las razones por las que había tanta emoción hace unas semanas), OpenAi todavía se considera ampliamente que está ligeramente por delante.

Trapo de agente: El segundo, Agentic Rag, es una tecnología que ha existido durante aproximadamente un año. Utiliza agentes para buscar información autónoma y contexto de otras fuentes, incluida la búsqueda de Internet. Esto puede incluir otros agentes de llamas de herramientas para encontrar información no WEB a través de API; agentes de codificación que pueden completar secuencias complejas de manera más eficiente; y búsquedas en la base de datos. Inicialmente, la investigación profunda de OpenAI está buscando principalmente en la web abierta, pero los líderes de la compañía han sugerido que podría buscar más fuentes con el tiempo.

La ventaja competitiva de OpenAI (y sus límites)

Si bien estas tecnologías no son completamente nuevas, las refinamientos de OpenAI, habilitados por cosas como su inicio de trabajo en trabajar en estas tecnologías, fondos masivos y su modelo de desarrollo de código cerrado, han llevado a una investigación profunda a un nuevo nivel. Puede funcionar a puerta cerrada y aprovechar los comentarios de los más de 300 millones de usuarios activos del popular producto CHATGPT de Openai. Operai ha liderado en investigación en estas áreas, por ejemplo, en cómo hacer verificación paso a paso para obtener mejores resultados. Y ha implementado claramente la búsqueda de una manera interesante, tal vez tomando prestado de Microsoft’s Bing y otras tecnologías.

Si bien todavía está alucinando algunos resultados de sus búsquedas, lo hace menos que los competidores, tal vez en parte porque el modelo O3 subyacente ha establecido una industria baja para estas alucinaciones al 8%. Y hay formas de reducir aún más los errores, mediante el uso de mecanismos como umbrales de confianza, requisitos de citas y otras verificaciones de credibilidad sofisticadas.

Al mismo tiempo, hay límites para el liderazgo y las capacidades de OpenAi. Dentro de los dos días del lanzamiento de Deep Research, Huggingface presentó un agente de investigación de IA de código abierto llamado Open Deep Research que obtuvo resultados que no estaban muy lejos de la de OpenAi, de manera similar, fusionando modelos líderes y capacidades de agente disponibles gratuitamente. Hay pocos focos. Los competidores de código abierto como Deepseek parecen mantenerse cerca en el área de los modelos de razonamiento, y Magentic-One de Microsoft ofrece un marco para la mayoría de las capacidades de agente de OpenAI, por nombrar solo dos ejemplos más.

Además, la investigación profunda tiene limitaciones. El producto es realmente eficiente para investigar información oscura que se puede encontrar en la web. Pero en áreas donde no hay mucho en línea y donde la experiencia en el dominio es en gran medida privada, ya sea en las cabezas de las personas o en bases de datos privadas, no funciona en absoluto. Por lo tanto, esto no va a amenazar los trabajos de los investigadores de fondos de cobertura de alta gama, por ejemplo, a quienes se les paga para hablar con expertos reales en una industria para encontrar información muy difícil de Obtain, como argumentó Ben Thompson En una publicación reciente (ver gráfico a continuación). En la mayoría de los casos, la investigación profunda de OpenAI afectará a los trabajos de analistas más bajos y calificados.

El valor de Deep Research primero aumenta a medida que la información en línea se vuelve escasa, luego cae cuando se vuelve realmente escaso. Fuente: Stratechery.

El producto más inteligente hasta ahora

Cuando fusiona el razonamiento de primer nivel con la recuperación de agente, no es realmente sorprendente que obtenga un producto tan poderoso. La investigación profunda de Openai logró un 26,6% en el último examen de la humanidad, posiblemente el mejor punto de referencia para la inteligencia. Este es un punto de referencia de IA relativamente nuevo diseñado para ser el más difícil de completar para cualquier modelo de IA, que cubra 3.000 preguntas en 100 sujetos diferentes. En este punto de referencia, la investigación profunda de OpenAI supera significativamente la investigación profunda de Perplexity (20.5%) y modelos anteriores como O3-Mini (13%) y Deepseek-R1 (9.4%) que no estaban conectados con trapo de agente. Pero las primeras revisiones sugieren clientes potenciales abiertos tanto en calidad como en profundidad. La investigación profunda de Google aún no se ha probado con este punto de referencia, pero las primeras revisiones sugieren clientes potenciales de calidad y profundidad.

Cómo es diferente: la primera IA del mercado masivo que podría desplazar los trabajos

Lo que es diferente con este producto es su potencial para eliminar los empleos. Sam Witteveen, cofundador de Red Dragon y desarrollador de agentes de IA, observó en una discusión de video de inmersión profunda conmigo que mucha gente va a decir: “Solía ​​mierda, puedo obtener estos informes por $ 200 que podría obtener de los que podría obtener una compañía de consultoría entre 4 mejores que me costarían $ 20,000 ”. Esto, dijo, causará algunos cambios reales, incluido probablemente dejar a las personas fuera de los trabajos.

Lo que me lleva de vuelta a mi entrevista la semana pasada con Sarthak Pattanaik, Jefe de Ingeniería e IA en BNY Mellon, un importante banco estadounidense.

Sin duda, Pattanaik no dijo nada sobre las ramificaciones del producto para los recuentos de trabajos reales en su banco. Ese será un tema particularmente sensible que cualquier empresa probablemente rehuya abordar públicamente. Pero dijo que podía ver que la investigación profunda de OpenAI se utilice para informes de suscripción de crédito y otras actividades de “línea superior”, y que tenga un impacto significativo en una variedad de trabajos: “Ahora eso no afecta a cada trabajo, pero eso afecta a un conjunto de empleos alrededor de la estrategia [and] Investigación, como la gestión de los proveedores de comparación, comparación del producto A versus producto B “. Agregó: “Así que creo que todo lo que está más en el sistema dos pensamientos: más exploratorio, donde puede no tener una respuesta correcta, porque la respuesta correcta se puede montar una vez que tenga esa definición de escenario, creo que es una oportunidad”.

Una perspectiva histórica: pérdida de empleo y creación de empleo

Las revoluciones tecnológicas han desplazado históricamente a los trabajadores a corto plazo mientras crean nuevas industrias a largo plazo. Desde automóviles que reemplazan los carruajes tirados por caballos hasta las computadoras que automatizan el trabajo administrativo, los mercados laborales evolucionan. Las nuevas oportunidades creadas por las tecnologías disruptivas tienden a generar una nueva contratación. Las empresas que no adoptan estos avances se quedarán atrás de sus competidores.

Altman de OpenAI reconoció el vínculo, incluso si es indirecto, entre investigaciones profundas y mano de obra. En la cumbre de IA en París la semana pasada, se le preguntó sobre su visión de inteligencia general artificial (AGI), o la etapa en la que AI puede realizar casi cualquier tarea que un humano pueda. Como respondió, su primera referencia fue una investigación profunda: “Creo que es un modelo capaz de hacer como un porcentaje de bajo dígito de todas las tareas en la economía en el mundo en este momento, que es una declaración loca, y Hace un año no creo que algo que la gente pensara vendrá “. (Ver minuto tres de este video). Continuó: “Por 50 centavos de cómputo, puede hacer como $ 500 o $ 5,000 de trabajo. Las empresas están implementando eso para ser mucho más eficientes “.

La comida para llevar: una nueva era para el trabajo de conocimiento

Deep Research representa un momento decisivo para la IA en las industrias basadas en el conocimiento. Al integrar el razonamiento de vanguardia con capacidades de investigación autónoma, OpenAi ha creado una herramienta que es más inteligente, más rápida y significativamente más rentable que los analistas humanos.

Las implicaciones son enormes, desde servicios financieros hasta atención médica hasta toma de decisiones empresariales. Las organizaciones que aprovechan esta tecnología de manera efectiva obtendrán una ventaja competitiva significativa. Aquellos que lo ignoran lo hacen bajo su riesgo.

Para una discusión más profunda sobre cómo funciona la investigación profunda de OpenAI, y cómo funciona el conocimiento, consulte mi conversación en profundidad con Sam Witteveen en nuestro último video:

https://www.youtube.com/watch?v=3m3qcf_ptdc

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version