Noticias
Investigación profunda de OpenAI: una prueba práctica de la revisión de la literatura con IA

“Realice una revisión integral de la literatura sobre el estado del arte en el aprendizaje automático y el consumo de energía. […]”
Con este aviso, probé la nueva función de investigación profunda, que se ha integrado en el modelo de razonamiento Operai O3 desde finales de febrero, y realizé una revisión de literatura de vanguardia en 6 minutos.
Esta función va más allá de una búsqueda web normal (por ejemplo, con chatgpt 4o): la consulta de investigación se descompone y estructura, se busca información en Internet, que luego se evalúa, y finalmente, se crea un informe estructurado y completo.
Echemos un vistazo más de cerca a esto.
Tabla de contenido
1. ¿Qué es la investigación profunda de Operai y qué puedes hacer con él?
2. ¿Cómo funciona la investigación profunda?
3. ¿Cómo puedes usar investigaciones profundas? – Ejemplo práctico
4. Desafíos y riesgos de la función de investigación profunda
Pensamientos finales
¿Dónde puedes seguir aprendiendo?
1. ¿Qué es la investigación profunda de Operai y qué puedes hacer con él?
Si tiene una cuenta Operai Plus (el plan de $ 20 por mes), tiene acceso a una investigación profunda. Esto le da acceso a 10 consultas por mes. Con la suscripción Pro ($ 200 por mes), ha extendido el acceso a la investigación profunda y el acceso a la vista previa de la investigación de GPT-4.5 con 120 consultas por mes.
Operai promete que podemos realizar investigaciones de varios pasos utilizando datos de la web pública.
Duración: 5 a 30 minutos, dependiendo de la complejidad.
Anteriormente, dicha investigación generalmente tomaba horas.
Está destinado a tareas complejas que requieren una búsqueda y una minuciosidad profundas.
¿Cómo son los casos de uso de concreto?
- Realice una revisión de la literatura: Realice una revisión de la literatura sobre el aprendizaje automático y el consumo de energía de última generación.
- Análisis de mercado: cree un informe comparativo sobre las mejores plataformas de automatización de marketing para empresas en 2025 en función de las tendencias y evaluaciones actuales del mercado.
- Tecnología y desarrollo de software: investigue lenguajes y marcos de programación para el desarrollo de aplicaciones de IA con análisis de rendimiento y casos de uso
- Inversión y análisis financiero: realizar investigaciones sobre el impacto de la negociación de IA en el mercado financiero en función de informes recientes y estudios académicos.
- Investigación legal: Realice una visión general de las leyes de protección de datos en Europa en comparación con los EE. UU., Incluyendo las decisiones relevantes y los cambios recientes.
2. ¿Cómo funciona la investigación profunda?
Deep Research utiliza varios métodos de aprendizaje profundo para llevar a cabo un análisis sistemático y detallado de la información. Todo el proceso se puede dividir en cuatro fases principales:
1. Descomposición y estructuración de la pregunta de investigación
En el primer paso, la herramienta procesa la pregunta de investigación utilizando métodos de procesamiento del lenguaje natural (PNL). Identifica los términos clave, conceptos y subcuestiones más importantes.
Este paso asegura que la IA comprenda la pregunta no solo literalmente, sino también en términos de contenido.
2. Obtener información relevante
Una vez que la herramienta ha estructurado la pregunta de investigación, busca específicamente información. Deep Research utiliza una mezcla de bases de datos internas, publicaciones científicas, API y raspado web. Estas pueden ser bases de datos de acceso abierto como ARXIV, PubMed o Semantic Scholar, por ejemplo, pero también sitios web públicos o sitios de noticias como The Guardian, New York Times o BBC. Al final, cualquier contenido al que se pueda acceder en línea y esté disponible públicamente.
3. Análisis e interpretación de los datos
El siguiente paso es que el modelo AI resumiera grandes cantidades de texto en respuestas compactas y comprensibles. Los transformadores y los mecanismos de atención aseguran que se priorice la información más importante. Esto significa que no solo crea un resumen de todo el contenido encontrado. Además, se evalúa la calidad y la credibilidad de las fuentes. Y los métodos de validación cruzada se usan normalmente para identificar información incorrecta o contradictoria. Aquí, la herramienta AI compara varias fuentes entre sí. Sin embargo, no se sabe públicamente exactamente cómo se hace esto en investigaciones profundas o qué criterios hay para esto.
4. Generación del informe final
Finalmente, el informe final se genera y se muestra a nosotros. Esto se realiza utilizando la generación de lenguaje natural (NLG) para que veamos textos fácilmente legibles.
El sistema AI genera diagramas o tablas si se solicita en la solicitud y adapta la respuesta al estilo del usuario. Las fuentes principales utilizadas también se enumeran al final del informe.
3. Cómo puede usar investigaciones profundas: un ejemplo práctico
En el primer paso, es mejor usar uno de los modelos estándar para preguntar cómo debe optimizar el mensaje para realizar investigaciones profundas. He hecho esto con el siguiente mensaje con ChatGpt 4O:
“Optimizar este aviso para realizar una investigación profunda:
Realización de una búsqueda de literatura: realice una búsqueda de literatura sobre el estado del arte sobre el aprendizaje automático y el consumo de energía “.
El modelo 4O sugirió el siguiente aviso para la función de investigación profunda:
Luego, la herramienta me preguntó si podía aclarar el alcance y el enfoque de la revisión de la literatura. Por lo tanto, he proporcionado algunas especificaciones adicionales:
ChatGPT luego devolvió la aclaración y comenzó la investigación.
Mientras tanto, pude ver el progreso y cómo se agregaron más fuentes gradualmente.
Después de 6 minutos, la revisión de la literatura de vanguardia fue completa y el informe, incluidas todas las fuentes, estaba disponible para mí.
Ejemplo de investigación profunda.mp4
4. Desafíos y riesgos de la función de investigación profunda
Echemos un vistazo a dos definiciones de investigación:
“Un estudio detallado de un sujeto, especialmente para descubrir nueva información o llegar a una nueva comprensión”.
Referencia: Diccionario de Cambridge
“La investigación es un trabajo creativo y sistemático realizado para aumentar el stock de conocimiento. Implica la recolección, la organización y el análisis de la evidencia para aumentar la comprensión de un tema, caracterizado por una atención particular a las fuentes de control de sesgo y error “.
Referencia: Wikipedia Research
Las dos definiciones muestran que la investigación es una investigación detallada y sistemática de un tema, con el objetivo de descubrir nueva información o lograr una comprensión más profunda.
Básicamente, la función de investigación profunda cumple estas definiciones hasta cierto punto: recopila información existente, la analiza y la presenta de manera estructurada.
Sin embargo, creo que también debemos ser conscientes de algunos desafíos y riesgos:
- Peligro de superficialidad: La investigación profunda está diseñada principalmente para buscar, resumir y proporcionar información existente en una forma estructurada (al menos en la etapa actual). Absolutamente excelente para la investigación general. Pero, ¿qué pasa con cavar más profundo? La investigación científica real va más allá de la mera reproducción y analiza críticas a las fuentes. La ciencia también prospera en generar nuevos conocimientos.
- Refuerzo de los sesgos existentes en investigación y publicación: Los artículos ya tienen más probabilidades de ser publicados si tienen resultados significativos. Los resultados “no significativos” o contradictorios, por otro lado, tienen menos probabilidades de ser publicados. Esto es conocido como sesgo de publicación. Si la herramienta AI ahora evalúa principalmente los documentos citados frecuentemente, refuerza esta tendencia. Se pierden hallazgos raros o menos extendidos pero posiblemente importantes. Una posible solución aquí sería implementar un mecanismo para la evaluación de fuentes ponderada que también tenga en cuenta los documentos menos citados pero relevantes. Si los métodos de IA citan principalmente fuentes que se citan con frecuencia, se pueden perder hallazgos menos extendidos pero importantes. Presumiblemente, este efecto también se aplica a nosotros los humanos.
- Calidad de los trabajos de investigación: Si bien es obvio que una tesis de licenciatura, maestría o doctoral no puede basarse únicamente en la investigación generada por la IA, la pregunta que tengo es cómo las universidades o las instituciones científicas tratan este desarrollo. Los estudiantes pueden obtener un informe de investigación sólido con un solo mensaje. Presumiblemente, la solución aquí debe ser adaptar los criterios de evaluación para dar mayor peso a la reflexión y metodología en profundidad.
Pensamientos finales
Además de OpenAI, otras compañías y plataformas también han integrado funciones similares (incluso antes de OpenAI): por ejemplo, Perplexity AI ha introducido una función de investigación profunda que realiza y analiza de forma independiente las búsquedas. También Gemini de Google ha integrado una función de investigación tan profunda.
La función le brinda una visión general increíblemente rápida de una pregunta de investigación inicial. Queda por ver cuán confiables son los resultados. Actualmente (a partir de marzo de 2025), el propio OpenAi escribe como limitaciones de que la característica todavía está en una etapa temprana, a veces puede alucinar hechos en respuestas o sacar conclusiones falsas, y tiene problemas para distinguir información autorizada de los rumores. Además, actualmente no puede transmitir con precisión las incertidumbres.
Pero se puede suponer que esta función se ampliará aún más y se convertirá en una herramienta poderosa para la investigación. Si tiene preguntas más simples, es mejor usar el modelo GPT-4O estándar (con o sin búsqueda), donde obtiene una respuesta inmediata.
¿Dónde puedes seguir aprendiendo?
¿Quiere más consejos y trucos sobre tecnología, python, ciencia de datos, ingeniería de datos, aprendizaje automático y IA? Luego, reciba regularmente un resumen de mis artículos más leídos en mi sustitución, comisariada y de forma gratuita.
¡Haga clic aquí para suscribirme a mi subsack!