Noticias

Acabo de probar la investigación profunda de AI sobre Grok-3 vs Perplexity vs Gemini: aquí está el ganador

Published

on

La última característica en chatbots populares como chatgpt, gemini y perplejidad es la capacidad de buscar más profundamente. Hoy, Xai lanzó Grok-3 y cuenta con más de diez veces el poder computacional de su predecesor, Grok-2. La herramienta ‘DeepSearch’ se anunció como un motor de búsqueda de próxima generación.

Las habilidades de razonamiento avanzado de estos chatbots significan que pueden manejar consultas a nivel de expertos y sintetizar grandes cantidades de información en varios dominios, como finanzas, investigación de productos y más. Estos chatbots buscan en la web y navegan por los sitios web relevantes para que no tenga que hacerlo.

Chatgpt Deep Research actualmente solo está disponible para usuarios de Pro a $ 200 por mes. Grok-3 está en beta y está disponible para premium+ usuarios por $ 30 por mes. Géminis y perplejidad de Google ofrecen una función de investigación profunda disponible para los usuarios de forma gratuita. Para usar Gemini Pro 1.5 con una investigación profunda, seleccione ese modelo en el menú desplegable dentro de la plataforma o en la aplicación. Para utilizar la función de investigación profunda con AI de perplejidad, simplemente habilitelo al ingresar su consulta en el cuadro de texto.

Con tantos chatbots capaces de investigar más profundamente y manejar un razonamiento avanzado, solo tenía que ver por mí mismo cómo se comparan. Esto es lo que sucedió cuando puse a prueba estos tres chatbots con una serie de 5 indicaciones seleccionadas por Claude 3.5 Sonnet para determinar qué chatbot es el mejor en una búsqueda profunda en general.

1. Análisis comparativo

(Crédito de la imagen: futuro)

Inmediato: “Analice el impacto global de las políticas de precios del carbono en las economías nacionales y los esfuerzos de reducción de emisiones”.

Géminis ofreció una respuesta formal con un tono académico. Los detalles repetitivos y genéricos hicieron que la respuesta se leyera más como una entrada de Wikipedia pero sin ejemplos del mundo real o muchos detalles.

Perplejidad También proporcionó una respuesta académica que era demasiado densa a pesar de los fuertes detalles técnicos y las citas. La respuesta se basó demasiado en la jerga y las estadísticas, lo que la hace sobrecomplicar y difícil de digerir.

Ganadríz proporcionó la respuesta más rápida en detalle e incluyó ejemplos y análisis relevantes. También reconoció éxitos y desafíos.

Ganador: Grok Gana por su análisis altamente detallado y matizado, descomponiendo los impactos económicos y de emisiones con ejemplos específicos. La IA hace referencia a estadísticas recientes, lo que hace que la respuesta sea oportuna y creíble.

2. Computación cuántica

(Crédito de la imagen: futuro)

Inmediato: “Proporcione una descripción completa de los últimos avances en la computación cuántica en los últimos cinco años”.

Géminis ofreció una respuesta que era demasiado genérica y tenía ejemplos recientes limitados y también tenía un contexto histórico excesivo. Las secciones eran demasiado largas y repetitivas al carecer de profundidad técnica.

Perplejidad cubrió todos los avances principales en la computación cuántica, incluida la corrección de errores, las innovaciones de hardware, los sistemas clásicos cuánticos híbridos, las mejoras algorítmicas y la comercialización. También rompió el tema complejo y las secciones categorizadas lo que lo hacían legible e integral, pero digerible.

GanadrízLa respuesta se centró demasiado en los hitos históricos. Aunque era atractivo y bien escrito, estaba menos estructurado y carecía de profundidad. También terminó con una nota especulativa, mientras que la perplejidad proporcionó un resumen analítico más completo.

Ganador: Perplejidad proporcionó el análisis más informativo, estructurado y actualizado de los avances de computación cuántica de 2020-2025.

3. Impacto de la IA en el empleo

(Crédito de la imagen: futuro)

Inmediato: “Examine los efectos de la inteligencia artificial en las tendencias laborales en varias industrias. Incluya datos estadísticos sobre el desplazamiento y la creación del trabajo y analice las implicaciones a largo plazo para la fuerza laboral”.

Géminis Utiliza descripciones genéricas de la industria sin integrar profundamente tendencias o figuras específicas. También carece de una clara profundidad estadística y muchas afirmaciones son demasiado amplias o incluso vagas.

Perplejidad ofreció una respuesta con una perspectiva equilibrada sobre la creación de empleo y el desplazamiento mientras destaca las brechas educativas y las soluciones de políticas. La perplejidad también examinó a fondo el cambio de habilidad híbrido y abordó los desafíos de redistribución económica.

Ganadríz Respondió con una respuesta atractiva y bien estructurada, pero los datos no son tan profundamente de origen o analizado. Si bien menciona los números de desplazamiento laboral, no cuantifica el papel de AI en las industrias específicas tan precisamente como perplejidad.

Ganador: perplejidad La respuesta se destaca por ser tanto analítico como una gran cantidad de datos estadísticos con números y fuentes precisos.

4. Estrategias globales para la adopción de energía renovable

(Crédito de la imagen: futuro)

Inmediato: “Investigue las estrategias empleadas por los 10 principales países desarrollados y principales en desarrollo por el PIB para promover la adopción de energía renovable durante la última década”.

Géminis Parecía una cobertura superficial, lo que significa que carece de un profundo análisis financiero y de políticas. Los datos son demasiado generales y se ponen menos énfasis en las tendencias de inversión y los éxitos específicos del proyecto.

Perplejidad proporcionó información clara y cuantificada sobre el progreso de las energías renovables para cada país, respaldado por cifras específicas y fuentes acreditadas.

Grok-3 La respuesta fue altamente detallada y estructurada, pero demasiado concentrada en el país sin suficientes comparaciones o tendencias generales. La respuesta de Grok tampoco analiza las estrategias de inversión tan profundamente como la perplejidad y pierde acuerdos multilaterales y esfuerzos transfronterizos de integración energética.

Ganador: perplejidad gana para la respuesta más basada en datos, comparativa y con visión de futuro, lo que la convierte en la mejor respuesta.

5. Estudio comparativo de los sistemas de atención médica

(Crédito de la imagen: futuro)

Inmediato: “Compare y contrasta cómo los diferentes sistemas de salud en todo el mundo han respondido a las pandemias en la última década. Evaluar la efectividad de diversas estrategias, asignaciones de recursos y políticas de salud pública”.

Géminis entregó una fuerte respuesta, pero no ofreció tantos detalles como Grok-3 ni analizó efectivamente una amplia gama de sistemas de salud. La respuesta fue demasiado académica y demasiado difícil de seguir desde una perspectiva de conversación.

Perplejidad ofreció una respuesta bien investigada, pero carecía de comparaciones directas entre países. Algunas ideas se sentían más generales y ofrecían menos profundidad estadística.

Ganadríz Proporciona estadísticas detalladas sobre la capacidad del hospital, las tasas de prueba, la cobertura de vacunación y las asignaciones de financiación.

Ganador: Grok-3 Analiza sistemáticamente cómo los diferentes tipos de sistemas de atención médica (pagador único, pagador múltiple, pesado privado y en desarrollo) respondieron a las pandemias. Con las ideas basadas en datos, el enfoque estructurado de la IA hace que sea fácil ver cómo los diferentes modelos manejaban las crisis.

Ganador general: perplejidad

En este experimento, la perplejidad surge como el ganador general. Sus fortalezas superaron a la competencia en áreas clave como la profundidad de la investigación, la claridad de la organización, la amplitud del análisis e integración de datos sólidos. En las cinco indicaciones, la perplejidad demostró un enfoque altamente estructurado, equilibrando la profundidad estadística con claras ideas comparativas. Utilizó efectivamente fuentes creíbles y datos cuantitativos, asegurando que sus respuestas no solo fueran informativas sino también bien respaldadas.

A diferencia de Grok, que era fuerte en la síntesis, pero a veces se inclinaba en narraciones más amplias, la perplejidad mantuvo un enfoque preciso y respaldado por la investigación, lo que lo hacía más confiable para el análisis fáctico en profundidad. En comparación con Gemini, que a veces se desvió demasiado académico o incluso se desvió del tema a veces, la perplejidad se mantuvo enfocada en la intención del aviso, asegurando que cada respuesta abordara directamente los componentes clave de la pregunta. Su capacidad para contrastar estrategias globales, evaluar la efectividad de la política e integrar los resultados del mundo real lo convirtió en el chatbot más completo y equilibrado, dándole la ventaja como el mejor desempeño en general.

A medida que los chatbots continúen avanzando y desarrollando nuevas funciones, continuaremos experimentando y probando sus habilidades contra la competencia con indicaciones que prueban y examinan completamente sus habilidades únicas.

Más de la guía de Tom

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version