Noticias

Probé Gemini 2.0 vs Perplexity con 7 indicaciones creadas por Deepseek, esto es lo que ganó

Published

on

Los chatbots de IA están evolucionando rápidamente, pero no todos están construidos de la misma manera. Perplexity AI y Gemini 2.0 son dos modelos de IA muy avanzados disponibles para los usuarios de forma gratuita, y cada uno tiene fortalezas únicas.

Para averiguar cuál es mejor, probé ambos modelos de IA con siete indicaciones. Y para agregar un giro único, tuve las indicaciones de Deepseek V3.

Mientras que la IA de perplejidad se destaca en la búsqueda web en tiempo real y la recuperación objetiva, Gemini 2.0, respaldado por Google, cuenta con una profunda integración con el ecosistema y las capacidades multimodales de Google. Pero, ¿cómo se comparan en términos de precisión, razonamiento, creatividad y usabilidad práctica?

Evalué Gemini 2.0 frente a la perplejidad basada en la precisión y la profundidad de la información, la claridad y la coherencia de las explicaciones, la creatividad y la originalidad, el razonamiento lógico y la resolución de problemas, así como cómo cada uno manejó temas matizados y subjetivos.

Esto es lo que sucedió y cómo se compararon los modelos de IA en este enfrentamiento.

1. Hechos y profundidad de conocimiento

(Crédito de la imagen: futuro)

Inmediato: “Explique las causas y las consecuencias de la crisis financiera mundial de 2008, incluidos eventos clave, instituciones involucradas e impactos a largo plazo en la economía global. Proporcione ejemplos específicos y datos cuando sea posible”.

Géminis 2.0 Ofrece una respuesta con una estructura sólida, pero carece del mismo nivel de profundidad que el de la perplejidad. Las explicaciones de las causas y las consecuencias se sienten más a nivel de superficie y, aunque incluye algunas estadísticas, como los precios de la vivienda que caen en un 30% y el desempleo aumenta al 10%, Gemini carece del mismo nivel de precisión y variedad como respuesta de perplejidad.

Perplejidad ai Elaboró ​​una respuesta bien organizada, que cubre causas, eventos clave, instituciones, consecuencias e impactos a largo plazo en detalle. Cada sección está claramente etiquetada y lógicamente estructurada.

Veredicto de Deepseek: Perplejidad La respuesta es más fuerte en general debido a su profundidad de análisis, perspectiva global y explicaciones detalladas de los mecanismos financieros.

Ganador: Perplejidad proporcionó una respuesta más completa, basada en datos y bien estructurada. Se profundizó más en los mecanismos económicos, las consecuencias globales y las respuestas políticas al tiempo que respalda las afirmaciones con estadísticas y ejemplos del mundo real.

2. Creatividad e generación de ideas

(Crédito de la imagen: futuro)

Inmediato: “Imagine una ciudad futurista en el año 2150. Describa su arquitectura, sistemas de transporte, fuentes de energía y estructura social. Sea lo más creativo y detallado posible”.

Géminis 2.0 entregó un desglose bien organizado y un buen equilibrio de realismo e idealismo. Sin embargo, carece de una configuración distinta, que ofrece más descripción general en lugar de un lugar específico. La respuesta parece menos imaginativa.

Perplejidad aiLa introducción de la introducción atrae al lector, lo que hace que se sienta como si realmente estuvieran entrando en el futuro. En lugar de una descripción genérica, creó un nombre para la ciudad y en general las ideas más imaginativas y únicas.

Veredicto de Deepseek: “Perplejidad La respuesta es la más fuerte de los dos. Si bien ambas respuestas son altamente creativas y detalladas, las descripciones inmersivas de Perplexity, los conceptos innovadores y el enfoque centrado en los humanos hacen que su visión de una ciudad futurista sea más convincente y memorable “.

Ganador: perplejidad La respuesta es más inmersiva, innovadora y conceptualmente rica, lo que hace que la ciudad se sienta como un lugar real y vivido en lugar de una lista de verificación futurista.

3. Resolución de problemas y razonamiento lógico

(Crédito de la imagen: futuro)

Inmediato: “Dos ciclistas comienzan a conducir entre sí desde dos ciudades que están a 300 millas de distancia. El ciclista A sale de la ciudad X a una velocidad de 60 mph, mientras que el ciclista B deja la ciudad y a 40 mph. Suponiendo que mantengan sus velocidades y viajan en un camino recto, ¿a qué hora y en qué punto entre las dos ciudades se encontrarán? Proporcione una explicación detallada paso a paso de su razonamiento “.

Géminis 2.0 La respuesta usó puntos de bala para una fácil lectura y estaba bien organizado. Si bien es correcto y claro, el chatbot no etiquetó los pasos, lo que lo hace un poco menos estructurado. No definió explícitamente las variables por adelantado, lo que podría ayudar con la comprensión.

Perplejidad Claramente define variables al principio, lo que hace que sea más fácil de seguir. Cada paso está etiquetado explícitamente (Paso 1, Paso 2, etc.), mejorando la legibilidad. También formateó correctamente las ecuaciones y fórmulas, mejorando la claridad para alguien que resuelve el problema paso a paso.

Veredicto de Deepseek: “Perplejidad La respuesta es la más fuerte de los dos. Si bien ambas soluciones son correctas y bien estructuradas, las explicaciones detalladas de Perplexity, el enfoque conceptual y la presentación profesional lo hacen más informativo y riguroso “.

Ganador: perplejidad Proporciona una explicación más clara, más estructurada y exhaustiva con un mejor uso de la notación y verificación matemáticas.

4. Comprensión contextual

(Crédito de la imagen: futuro)

Inmediato: “Explique la diferencia entre ‘afecto’ y ‘efecto’ en la gramática inglesa. Proporcione ejemplos de su uso en diferentes contextos, incluidos errores comunes que cometen las personas”.

Géminis 2.0 Ofrece una respuesta más atractiva y bien estructurada. Se descompone en secciones claras: definiciones, ejemplos, usos menos comunes, errores comunes y ayudas de memoria. El formato es limpio y fácil de escanear, lo que lo hace más accesible para los alumnos.

Perplejidad Ofrece una respuesta que sea concisa y al punto. Sin embargo, está un poco menos estructurado y carece de una mnemónica fuerte, lo que lo hace menos memorable. También aborda los errores, pero no explica el razonamiento tan claramente como Gemini.

Veredicto de Deepseek: “Perplejidad La respuesta es la más fuerte de los dos. Si bien ambas explicaciones son precisas y útiles, la cobertura detallada de las excepciones, consejos rápidos y formato estructurado de Perplexity lo hace más informativo y práctico para los alumnos. No solo explica los usos principales de “afecto” y “efecto”, sino que también aborda escenarios menos comunes, proporcionando una comprensión más completa “.

Ganador: Géminis gana para un más atractivo, mejor estructurado e incluye un útil mnemónico (cuervo) que mejora el recuerdo. También proporciona ejemplos más variados y una sección de práctica, lo que lo convierte en una mejor respuesta en general.

5. Comprensión multimodal

(Crédito de la imagen: futuro)

Inmediato: “Describa los elementos visuales y el simbolismo en la noche estrellada de Vincent Van Gogh. ¿Cómo contribuyen estos elementos al impacto emocional de la pintura?”

Géminis 2.0 Utiliza un lenguaje vívido y expresivo para ayudar a dar vida a la pintura. Describe cómo los elementos como pinceladas, colores y movimiento interactúan en lugar de solo declarar su presencia. La explicación de la técnica de Imposto está integrada sin problemas en lugar de solo una definición.

Perplejidad entregó un análisis preciso y bien estructurado. Cubre efectivamente el simbolismo pero se queda corto porque se lee más como una conferencia de historia del arte en lugar de un análisis evocador. La sección de impacto emocional es sólida pero menos personal: el último párrafo de Gemini es mucho más convincente.

Veredicto de Deepseek: Perplejidad La respuesta es la más fuerte de los dos. Si bien ambas respuestas son perspicaces, el análisis detallado de Perplexity, el contexto histórico y la gama más amplia de interpretaciones simbólicas lo hacen más integral y académico “.

Ganador: Géminis gana para una respuesta más resonante emocionalmente y atractiva, estructurada de una manera que mejore la comprensión. No solo describe la pintura sino que te hace sentir su esencia.

6. Razonamiento ético

(Crédito de la imagen: futuro)

Inmediato: “Discuta las implicaciones éticas de la inteligencia artificial en los procesos de contratación. Incluya sesgos potenciales, beneficios y riesgos, y proporcione su perspectiva sobre cómo equilibrar la eficiencia con justicia”.

Géminis 2.0 Tenía una respuesta que fluye lógicamente, lo que facilita el seguimiento. Utiliza encabezados claros y puntos de bala para cada sección, manteniéndolo conciso pero informativo. Las oraciones son sencillas pero perspicaces, evitando el lenguaje pesado de jerga.

Perplejidad Cita ejemplos del mundo real (sesgo de contratación de IA de Amazon) e incluye un argumento de transparencia, lo cual es importante. Sin embargo, es demasiado técnico y menos atractivo. Se basa en las citas, pero carece de un análisis más profundo y la sección sobre riesgos de IA podría ser más claro.

Veredicto de Deepseek:Perplejidad La respuesta es la más fuerte de los dos. Si bien ambas respuestas son bien estructuradas e informativas, el análisis detallado de Perplexity, los ejemplos específicos y la cobertura integral de problemas éticos lo hacen más exhaustivo y creíble “.

Ganador: Gemini proporciona una respuesta más perspicaz, bien estructurada y equilibrada. Discute tanto las trampas potenciales como éticas de la IA en la contratación al tiempo que ofrece soluciones prácticas que se alinean con la equidad y la eficiencia.

7. Información en tiempo real

(Crédito de la imagen: futuro)

Inmediato: “¿Cuáles son los últimos desarrollos en tecnología de energía renovable a partir de 2025?*”
*Nota: Deepseek tenía la fecha de 2023 en el aviso, por lo que lo cambié para probar la capacidad de los chatbots para ofrecer información en tiempo real.

Géminis 2.0 usó encabezados claros y puntos de bala, lo que hace que sea más fácil de seguir. El tono es dinámico y atractivo, ya que no solo estaba estadísticas estatales, sino que explica por qué estos desarrollos son importantes (por ejemplo, cómo las células solares perovskitas mejoran la eficiencia y la flexibilidad).

Perplejidad Usó puntos de datos fuertes y proyecciones con buena mención de IA y Big Data en energías renovables. Sin embargo, se queda corto porque no cubrió aspectos críticos como cuadrículas inteligentes, microrredes o agrigoltaica en detalles.

Veredicto de Deepseek: “Perplejidad La respuesta es la más fuerte de los dos. Si bien ambas respuestas son informativas y bien estructuradas, la inclusión de perplejidad de puntos de datos específicos, la discusión de la IA y el enfoque en las tecnologías emergentes lo hacen más detallado y creíble “.

Ganador: Géminis gana por proporcionar una respuesta bien estructurada y perspicaz. Cubre una gama más amplia de tecnologías, explica por qué importan y presenta la información de una manera más amigable para los lectores.

Ganador general: Géminis 2.0

Después de evaluar cuidadosamente las respuestas de Géminis y la perplejidad en múltiples indicaciones, Gemini emerge como el ganador general. Si bien ambos modelos de IA proporcionaron respuestas fuertes y bien investigadas, Gemini entregó constantemente respuestas más atractivas, estructuradas y perspicaces que fueron más allá de solo enumerar los hechos. Demostró una mejor legibilidad, explicaciones más profundas y un enfoque equilibrado que hizo que sus respuestas fueran más convincentes.

Esta prueba es importante porque la IA se está convirtiendo rápidamente en una fuente principal de información, y no todos los chatbots funcionan por igual en diferentes tipos de indicaciones. Evaluar sus fortalezas y debilidades ayuda a los usuarios a comprender qué modelo de IA es más adecuado para tareas específicas, ya sea investigación, escritura o discusiones matizadas.

Curiosamente, cuando le pedí a Deepseek que nombrara al ganador general, eligió la perplejidad como el mejor intérprete. Esto resalta un punto crucial: los modelos de IA evalúan las respuestas de manera diferente a los humanos. Deepseek probablemente priorizó la densidad de hechos, las citas y los puntos de datos, mientras que me concentré en la claridad, la profundidad y la capacidad de explicar los conceptos de una manera significativa.

Me encanta probar los chatbots porque es fascinante ver cómo los diferentes modelos procesan información, estructuran sus respuestas e interactúan con temas complejos. Cada IA ​​tiene sus fortalezas y debilidades, y determinar los ganadores me ayuda a comprender cómo la IA puede usarse de manera más efectiva, ya sea para la investigación, la ayuda de escritura o incluso la evaluación de la IA.

Este tipo de pruebas proporciona información valiosa sobre la evolución de la IA y su impacto en cómo consumimos e interactuamos con la información.

Más de la guía de Tom

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version