Deepseek es el nuevo chatbot de IA en los labios de todos y actualmente está sentado en la cima de la App Store de Apple en los Estados Unidos y el Reino Unido. Un modelo de IA completamente gratuito construido por una nueva empresa china, Deepseek quiere hacer que AI sea aún más accesible para las masas ofreciendo a un competidor al modelo de razonamiento ChatGPT O1 de OpenAI sin una tarifa.
Las nuevas aplicaciones de IA aparecen en la App Store casi a diario, y a menudo hay exageración en torno a un nuevo lanzamiento de modelo a medida que las personas buscan la próxima alternativa a ChatGPT. Ya sea que sea un ávido usuario del software de OpenAI o si prefiere usar Google Gemini, hay una herramienta de IA para todos, y Deepseek quiere ser el próximo icono en su pantalla de inicio.
Después de ver a Deepseek en todo mi suministro de noticias, supe que tenía que probar la nueva IA y ver si era tan buena como las personas que lograron estar en línea. Pité Deepseek V3 y DeepThink R1 contra Chatgpt 4o y O1 para ver cuán bueno es realmente el nuevo Rey de la App Store.
AI Hacks de la vida
En esta prueba, quería tener una sensación completa de todo lo que ofrece DeepThink en comparación con ChatGPT, por lo que solo pensé que era justo usar el chatbot Ai de la misma manera que usaría IA en mi vida diaria.
Recientemente, he estado queriendo obtener ayuda de AI para crear un horario diario que se adapte a mis necesidades como persona que trabaja desde casa y necesita cuidar a un perro. Hasta hace poco, mi pareja también trabajaba desde casa, por lo que era mucho más fácil dividir las tareas, pero ahora está trabajando desde una oficina, y necesito encontrar una manera de hacer malabarismos con la vida, el trabajo y mi bulldog francés Kermit.
Le pedí a ChatGpt O4 y Deepseek V3 que creara un horario diario con cierta información sobre cuándo me despierto, la rutina para ir al baño de mi perro y un breve desglose de mi flujo de trabajo. Ambos crearon excelentes horarios que realmente podía verme usando a diario. Sin embargo, la función de memoria de ChatGPT hizo que el horario de OpenAI fuera aún más coherente.
Anteriormente le había dicho a ChatGPT que me gusta revisar las noticias y las tendencias de la IA a las 9 a.m., y 4O implementó esa información de un chat anterior en mi rutina matutina. Deepseek, por otro lado, solo puede recordar información del mismo chat y no pudo recuperar la información de los chats anteriores para ayudar con su respuesta.
(ELI5) Explique como si fuera 5
A continuación, quería preguntarle a ambos chatbots de la IA sobre los playoffs de la NFL, considerando que ahora conocemos a los dos equipos que se enfrentarán en el Super Bowl Lix. Le pedí a Deepseek y Chatgpt que me dieran un resumen de 200 palabras de los playoffs de la NFL y cómo funciona. Ambos proporcionaron una excelente información que me dio una comprensión completa de cómo funciona el sistema de siembra y el viaje que un equipo debe hacer para llegar al Super Bowl.
ChatGPT optó por un párrafo de 200 palabras, mientras que Deepseek rompió la información en puntos de bala. Noté que ChatGPT me dio más contexto sobre cómo los equipos se convierten en un comodín, pero la diferencia entre los resultados es bastante mínima y le gustará uno mejor que el otro puramente basado en la preferencia personal.
Solucionador de problemas
Ahora que hemos cubierto algunas indicaciones simples de IA, es hora de llegar al Nitty Graitty y probar DeepThink R1, el modelo AI que hace que todos hablen. Las personas en línea dicen que el modelo de razonamiento gratuito de Deepseek es tan bueno como el O1 de Chatgpt, que es gratuito en pequeñas dosis, pero requiere una suscripción pagada para acceder regularmente.
Para probar las capacidades de razonamiento de los chatbots de IA, busqué algunos de los problemas más difíciles que pude encontrar, y me sorprende algunos de los resultados:
Pregunta 1: Encuentre la palabra faltante: manzana, rojo, carbón
Esta no es una pregunta particularmente difícil, especialmente teniendo en cuenta que el material fuente era la opción múltiple con diferentes opciones de color. Opté por evitar dar respuestas a la opción múltiple R1 y O1 y, en cambio, solo escribí la pregunta y presione Enter.
Chatgpt O1 tardó 1 minuto y 29 segundos en determinar la respuesta, y encontró enlaces entre las palabras y el blanco como el blanco de la nieve. La modelo decidió responder basada en esta cita: “Sus labios eran rojos como sangre, su cabello era negro como carbón y su piel era blanca como nieve”. Basado en esta cita O1 eligió la nieve como la respuesta de la palabra faltante. Si bien su proceso de pensamiento fue inteligente, no fue la respuesta que estaba buscando.
DeepThink R1, por otro lado, tardó 1 minuto y 14 segundos en responder, y logró adivinar la palabra correcta: negro. La manzana es roja; El carbón es negro. Impresionante, por decir lo menos.
Pregunta 2: 1. Termine la secuencia: 1, 2, 4, 8 ,? 2. Termine la secuencia: casa, Saturno, perro, hamburguesa ,?
Estas dos secuencias no están relacionadas, pero pensé que sería interesante hacer preguntas consecutivas para ver qué sucede. Si bien la primera secuencia es muy fácil, la segunda es imposible (son solo tres palabras aleatorias). ¿Chatgpt O1 o DeepThink R1 podrían notar la trampa?
Bueno, no. Ambos modelos de razonamiento intentaron encontrar una respuesta y me dieron una completamente diferente. DeepThink R1 respondió “amarillo” porque pensó que las palabras estaban relacionadas con su color (casa blanca, Saturno amarillo, perro marrón, hamburguesa amarilla). Chatgpt O1, por otro lado, respondió “automóvil” porque encontró la secuencia casi imposible, pero decidió ofrecer respuestas basadas en “un enfoque de rompecabezas común”. El enfoque que eligió ofrecer fue vincular cada artículo con la categoría más grande a la que pertenece (House = Building, Saturno = Planet, Dog = Animal, Burger = Food y Car = Vehicle).
En última instancia, ambos modelos de razonamiento estaban equivocados, y ninguno respondió diciendo que había demasiadas variables para dar una respuesta precisa.
Pregunta 3: los colibríes dentro de los apodiformes tienen un hueso ovalado emparejado bilateralmente, un sesamoide incrustado en la porción caudolateral de la aponeurosis de inserción de M ampliada y cruzada. Depresor Caudae. ¿Cuántos tendones emparejados son apoyados por este hueso sesamoideo? Responder con un número.
Para la pregunta final, decidí hacerle ChatGpt O1 y DeepThink R1 una pregunta del último examen de la Humanidad, el punto de referencia de IA más difícil que existe. Para un mero mortal como yo sin conocimiento de la anatomía del colibrí, esta pregunta es realmente imposible; Sin embargo, estos modelos de razonamiento parecen estar listos para el desafío.
O1 respondió cuatro, mientras que DeepThink R1 respondió dos. Desafortunadamente, la respuesta correcta no está disponible en línea para evitar que los chatbots de IA raspen Internet para encontrar la respuesta correcta. Dicho esto, de algunas investigaciones, creo que DeepThink podría estar aquí, mientras que O1 está fuera de lugar.
Deepseek vs chatgpt?
Entonces, he realizado múltiples indicaciones y he usado ambos chatbots durante una cantidad extensa de tiempo, pero ¿cuál es la mejor opción? Según las respuestas que recibí de las indicaciones, DeepThink R1 es un excelente modelo de razonamiento gratuito que le hace preguntarle si vale la pena pagar para acceder a O1 regularmente. Deepseek solo está disponible en la web, iOS App Store y Play Store, por lo que si desea utilizar una aplicación Mac o una aplicación de iPad independiente, deberá esperar a que la compañía lance una.
Según el último examen de la Humanidad, DeepTink R1 supera a ChatGPT O1 con una tasa de precisión del 9.4% en comparación con el 9.1% de OpenAI; Es una diferencia marginal, pero teniendo en cuenta que uno es completamente gratuito, puede influir en el uso del nuevo niño en el bloque.
Personalmente, me quedaré con ChatGPT porque no tengo enormes requisitos para los modelos de razonamiento, y dependo en gran medida de la función de recuerdos, lo que permite que el chatbot Ai haga referencia a conversaciones anteriores. También me gusta el hecho de que ChatGPT tiene una aplicación independiente de Mac y iPad, así como la capacidad de generar imágenes con uno de los mejores generadores de imágenes de IA, Dall-E.
Deepseek está puramente basado en texto y carece de capacidades multimodales, pero teniendo en cuenta cuán nuevo es, este es un comienzo increíblemente prometedor para un retador genuino para la corona de IA de OpenAi.