Noticias
Deepseek R1 es genial, pero Chatgpt todavía tiene la ventaja de IA

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información
Hace solo una semana, el 20 de enero de 2025, la startup china de IA Deepseek desató un nuevo modelo de IA de código abierto llamado R1 que inicialmente podría haber sido confundido con una de las masas cada vez más crecientes de rivales casi intercambiables desde OpenAi desde OpenAi debutó ChatGPT (impulsado por su propio modelo GPT-3.5, inicialmente) hace más de dos años.
Pero eso rápidamente resultó infundada, ya que la aplicación móvil de Deepseek ha incrementado en ese corto tiempo las listas de Apple App Store en los EE. UU. Para destronar el chatgpt por el lugar número uno y causado una corrección de mercado masiva cuando los inversores arrojaron acciones en chips de computadora anteriormente caliente. Los fabricantes como Nvidia, cuyas unidades de procesamiento de gráficos (GPU) han tenido una gran demanda de uso en superclusters masivos para entrenar nuevos modelos de IA y servirles a los clientes de manera continua (una modalidad conocida como “inferencia”).
El capitalista de riesgo, Marc Andreessen, haciéndose los sentimientos de otros trabajadores tecnológicos, escribió en la red social X anoche: “Deepseek R1 es el momento sputnik de AI”, comparándolo con el lanzamiento fundamental de octubre de 1957 del primer satélite artificial en la historia, Sputnik 1, por el La Unión Soviética, que provocó la “carrera espacial” entre ese país y los Estados Unidos para dominar los viajes espaciales.
El lanzamiento de Sputnik galvanizó a los Estados Unidos para invertir mucho en la investigación y el desarrollo de naves espaciales y cohetros. Si bien no es una analogía perfecta, no se necesitaba una gran inversión para crear Deepseek-R1, todo lo contrario (más sobre esto a continuación), parece significar un importante punto de inflexión en el mercado global de IA, como por primera vez, un El producto de IA de China se ha convertido en el más popular del mundo.
Pero antes de subir al tren de bombo de Deepseek, retrocedamos y examinemos la realidad. Como alguien que ha utilizado ampliamente el ChatGPT de OpenAI, tanto en plataformas web como móviles, y ha seguido de cerca los avances de IA, creo que si bien los logros de Deepseek-R1 son notables, no es hora de descartar las inversiones de ChatGPT o US AI todavía. Y tenga en cuenta que OpenAi no me paga para decir esto: nunca he tomado dinero de la empresa y no planeo.
¿Qué hace bien?
Deepseek-R1 es parte de una nueva generación de grandes modelos de “razonamiento” que hacen más que responder consultas de los usuarios: reflexionan sobre su propio análisis mientras producen una respuesta, intentando captar errores antes de servirlos al usuario.
Y Deepseek-R1 coincide o supera el propio modelo de razonamiento de OpenAI, O1, lanzado en septiembre de 2024 inicialmente solo para usuarios de suscripción ChatGPT Plus y Pro, en varias áreas.
Por ejemplo, en el punto de referencia Math-500, que evalúa la resolución matemática de problemas matemáticos a nivel de escuela secundaria, Deepseek-R1 alcanzó una tasa de precisión del 97.3%, superando ligeramente el 96.4% de OpenAI O1. En términos de capacidades de codificación, Deepseek-R1 obtuvo un 49.2% en el punto de referencia verificado SWE-Bench, superando el 48.9% de OpenAI O1.
Además, financieramente, Deepseek-R1 ofrece ahorros de costos sustanciales. El modelo se desarrolló con una inversión de menos de $ 6 millones, una fracción del gasto, estimado de múltiples miles de millones, se asocia informalmente con modelos de capacitación como OpenAI’s O1.
Deepseek se vio esencialmente obligado a ser más eficiente con GPU escasas y antiguas gracias a una restricción de exportación de los Estados Unidos en las ventas de la tecnología a China. Además, Deepseek proporciona acceso a API a $ 0.14 por millón de tokens, restringiendo significativamente la tasa de OpenAI de $ 7.50 por millón de tokens.
La ganancia de eficiencia masiva de Deepseek-R1, los ahorros de costos y el rendimiento equivalente al modelo de IA de EE. UU. Han causado que Silicon Valley y la comunidad empresarial más amplia se asusten por lo que parece ser un aumento completo del mercado de IA, la geopolítica y la economía conocida de la IA. Entrenamiento modelo.
Si bien las ganancias de Deepseek son revolucionarias, el péndulo se está balanceando demasiado hacia él en este momento
No se puede negar que la rentabilidad de Deepseek-R1 es un logro significativo. Pero no olvidemos que Deepseek debe gran parte de su éxito a las innovaciones de IA de EE. UU., Volviendo a la arquitectura de transformadores inicial de 2017 desarrollada por Google AI Investigers (que comenzó toda la locura de LLM).
Deepseek-R1 fue entrenado en preguntas y respuestas de datos sintéticos y específicamente, según el documento publicado por sus investigadores, en el “conjunto de datos de DeepSeek-V3” supervisado, que se encontró, que se encontró. ¡Tener muchos indicadores de ser generados con el modelo GPT-4O de Opensei!
Parece bastante claro decir que sin GPT-4O para proporcionar estos datos, y sin el lanzamiento de OpenAi del primer modelo de razonamiento comercial O1 en septiembre de 2024, que creó la categoría, Deepseek-R1 casi seguramente no existiría.
Además, el éxito de Openai requirió grandes cantidades de recursos de GPU, allanando el camino para los avances que Deepseek se ha beneficiado sin duda. El actual inversor en pánico sobre EE. UU. Y las compañías de IA se sienten prematuras y exageradas.
Las capacidades de visión y generación de imágenes de ChatGPT siguen siendo muy importantes y valiosas en el lugar de trabajo y en los entornos personales: Deepseek-R1 aún no tiene ninguna
Mientras que Deepseek-R1 ha impresionado con su razonamiento visible de “cadena de pensamiento”, una especie de flujo de conciencia en la que el modelo muestra texto a medida que analiza el aviso del usuario y busca responder a él, y eficiencia en flujos de trabajo basados en texto y matemáticas, Carece de varias características que hacen que ChatGPT sea una herramienta más robusta y versátil hoy.
No hay capacidades de generación de imágenes o visión
El sitio web oficial de Deepseek-R1 y la aplicación móvil permiten a los usuarios subir fotos y archivos adjuntos de archivos. Pero, solo pueden extraer texto de ellos utilizando el reconocimiento de caracteres ópticos (OCR), una de las primeras tecnologías informáticas (que datan de 1959).
Esto palidece en comparación con las capacidades de visión de ChatGPT. Un usuario puede cargar imágenes sin ningún texto y hacer que ChatGPT analice la imagen, describirla o proporcionar más información basada en lo que ve y el texto del usuario solicita.
CHATGPT permite a los usuarios subir fotos y pueden analizar material visual y proporcionar información detallada o consejos procesables. Por ejemplo, cuando necesitaba orientación para reparar mi bicicleta o mantener mi unidad de aire acondicionado, la capacidad de ChatGPT para procesar imágenes resultó invaluable. Deepseek-r1 simplemente no puede hacer esto todavía. Vea a continuación para una comparación visual:
No hay generación de imágenes
La ausencia de capacidades de imagen generativa es otra limitación importante. Como alguien que genera frecuentemente imágenes de IA usando CHATGPT (como para el propio encabezado de este artículo) alimentado por el modelo Dall · E 3 subyacente de OpenAI, la capacidad de crear imágenes detalladas y estilísticas con ChatGPT es un cambio de juego.
Esta característica es esencial para muchos flujos de trabajo creativos y profesionales, y Deepseek aún no ha demostrado una funcionalidad comparable, aunque hoy la compañía lanzó un modelo de visión de código abierto, Janus Pro, que dice que supera a Dall · E 3, Difusión estable 3 y otros Modelos de generación de imágenes líderes en la industria en puntos de referencia de terceros.
Sin modo de voz
Deepseek-R1 también carece de un modo de interacción de voz, una característica que se ha vuelto cada vez más importante para la accesibilidad y la conveniencia. El modo de voz de ChatGPT permite interacciones naturales y conversacionales, lo que lo convierte en una opción superior para uso de manos libres o para usuarios con diferentes necesidades de accesibilidad.
Estar emocionado por el potencial futuro de Deepseek, pero también desconfíe de sus desafíos
Sí, Deepseek-R1 puede, y probablemente lo hará, agregar capacidades de voz y visión en el futuro. Pero hacerlo no es una hazaña pequeña.
La integración de la generación de imágenes, el análisis de la visión y las capacidades de voz requieren recursos de desarrollo sustanciales y, irónicamente, muchas de las mismas GPU de alto rendimiento que los inversores ahora están subvalorando. Implementar estas características de manera efectiva y de manera fácil de usar es otro desafío por completo.
Los logros de Deepseek-R1 son impresionantes y indican un cambio prometedor en el panorama global de IA. Sin embargo, es crucial mantener la emoción bajo control. Por ahora, ChatGPT sigue siendo el producto mejor redondeado y más capaz, ofreciendo un conjunto de características que Deepseek simplemente no puede igualar. Apreciamos los avances al tiempo que reconocemos las limitaciones y la importancia continua de la innovación e inversión de la IA de EE. UU.