Aparentemente, Internet tiene una nueva IA favorita, y no es el último modelo de ChatGPT de la industria intocable OpenAi.
Alzando a la cima de la App Store de Apple, la inteligencia artificial china Chatbot Deepseek se ha convertido en la aplicación gratuita mejor calificada para la productividad después de un terreno de popularidad después del lanzamiento del modelo de “razonamiento” de Deepseek-R1 el 20 de enero, superando el chatgpt de OpenAi en el proceso.
Más allá de las tablas de clasificación de App Store, las afirmaciones que rodean el desarrollo y las capacidades de Deepseek pueden ser aún más impresionantes. La compañía detrás del LLM (modelo de lenguaje grande) afirma que cuesta menos de $ 6 millones capacitar a su modelo Deepseek-V3 y usó hardware limitado en comparación con sus contemporáneos estadounidenses al tiempo que logró resultados similares.
Sin embargo, si bien Deepseek está demostrando ser popular entre los usuarios y desarrolladores por igual, principalmente gracias a sus precios de API favorables, todo lo que brilla no es oro cuando se trata de esta aplicación, y un aire de controversia socava un lanzamiento exitoso de dos IA altamente capaces modelos.
Deepseek: ¿Qué es Deepseek?
Deepseek fue fundado por Liang Wenfeng, un empresario chino y cofundador del fondo de cobertura de alto vuelo con sede en Hangzhou, Zhejiang, China. Originalmente, Deepseek tenía la intención de ser un ala de investigación AGI (inteligencia general artificial) de High-Flyer, que ha utilizado exclusivamente la IA en los algoritmos de comercio desde 2021. Sin embargo, desde mayo de 2023, Deepseek se ha mantenido como su propia compañía, con alto-flyer convertirse en uno de sus principales inversores.
Deepseek LLM (modelo de lenguaje grande) de la compañía debutó en noviembre de 2023 como el codificador Deepseek de código abierto y fue seguido por Deepseek-V2 en mayo de 2024. Popularidad, con sus aplicaciones móviles acumulando más de 1.6 millones de descargas.
Si bien el Deepseek LLM es principalmente similar a otros chatbots populares como Google Gemini o ChatGPT, los modelos de uso gratuito de la aplicación están demostrando ser populares entre los usuarios, y sus precios de API amigables con el desarrollador lo están empujando a la vanguardia de la discusión.
Deepseek: ¿Por qué es importante?
El antiguo mito dice que durante la carrera espacial de la década de 1960, la NASA gastó millones en dólares de los contribuyentes en desarrollar una pluma espacial después de darse cuenta de que las alternativas de punto de pelota eran incapaces de escribir en el entorno del espacio de gravedad cero. Mientras tanto, sus contrapartes de cosmonaut evitaron tales costos y dolores de cabeza simplemente usando un lápiz.
Si bien nada de eso es cierto, es una parábola de ahorro y practicidad lo que lo convierte en una excelente historia.
Sin embargo, reflejando la leyenda de la pluma espacial, Deepseek aparentemente ha logrado lograr una hazaña similar en la rentabilidad y la practicidad a través del desarrollo de su modelo Deepseek-V3, que afirma haber entrenado por menos de $ 6 millones, una fracción, una fracción de los cientos de millones gastados por otras compañías que buscan resultados similares (al tiempo que logran niveles comparables de rendimiento).
No solo eso, sino que el reciente lanzamiento de Deepseek de su modelo de “razonamiento” Deepseek-R1 está diseñado para simular el pensamiento lógico sacrificando la velocidad de una respuesta por una respuesta más bien razonada. Puede lograr resultados iguales al modelo de “razonamiento” del “razonamiento” de OpenAi, incluso cuando la compañía afirma ser obstaculizada por las restricciones de exportación de los Estados Unidos en las GPU de NVIDIA más potentes.
Deepseek: ¿Cuánto cuesta?
Deepseek es gratuito en línea a través de su portal web o en dispositivos móviles (con aplicaciones de Android e iOS disponibles).
Sin embargo, el impacto que tendrá la emergencia de Deepseek en el costo de la IA para las empresas, los desarrolladores y más podría ser más innovador, con el modelo de precios API de la compañía que sale de la competencia fuera del agua.
Mientras que Operai actualmente cobra $ 15 por millón de tokens (una unidad de datos en las que se desgastan las indicaciones durante la generación de la respuesta de un modelo), Deepseek cuesta solo 55 centavos por millón .
Esta diferencia de costos podría cambiar el juego para muchos usuarios profesionales involucrados con la IA y representa un riesgo significativo para los ingresos potenciales de OpenAi, con Deepseek potencialmente ahora obligando a las manos de otras compañías a reducir sus precios para seguir siendo competitivos.
El impacto de Deepseek ya se siente en los mercados. Varios nombres de semiconductores están sintiendo el golpe, incluido Nvidia. Tras el lanzamiento de los últimos modelos de Deepseek el lunes, el comercio previo al mercado cayó un 13.8%, amenazando con eliminar casi $ 500 mil millones del límite de negociación de la compañía. Sin embargo, desde entonces ha regresado al 11%.
Deepseek: controversia
Si todo Deepseek tiene que ofrecer sonidos demasiado buenos para ser verdad, eso es potencialmente porque algunas de las afirmaciones de Deepseek pueden ser solo eso.
El rendimiento de los modelos V3 y R1 de Deepseek no se puede disputar. Aún así, quedan muchas preguntas sobre los precios reales de la compañía, su uso de hardware, el costo de su capacitación y el abastecimiento de sus datos de capacitación.
Este último ya ha sido objeto de cierta controversia. Varios usuarios informaron que Deepseek V3 se referiría a sí mismo como CHATGPT, lo que podría indicar que este modelo fue capacitado en conjuntos de datos públicos generados por el modelo GPT-4 de OpenAI.
Hablando con TechCrunchMike Cook, miembro de la investigación del King’s College London especializado en IA, respaldó estas afirmaciones, declarando: “Obviamente, el modelo está viendo respuestas crudas de ChatGPT”.
Cook destaca que esta puede no ser una acción intencional de Deepseek, pero también señala que la práctica de los modelos de entrenamiento en los datos generados por otros modelos puede ser “muy malo”, comparándola con “tomar una fotocopia de una fotocopia” en el sentido de que La calidad de las salidas se degradará cada vez.
También es posible que al adoptar datos de capacitación generados, Deepseek herede cualquiera de los mismos sesgos del modelo original, que se suma a los propios prejuicios del chatbot, que imponen una censura estricta por ley del Partido Anticomunista de Narraciones (CCP), que incluyen los Eventos del incidente de la Plaza Tiananmen de 1989, protestas de Hong Kong, la propiedad de Taiwán, el tratamiento de China del pueblo uigur o la ocupación del Tíbet.
Esta forma de censura solo degrada la confianza en la plataforma, y los lazos del fundador Liang Wenfeng con el PCCh solo aumentan las preocupaciones sobre cómo se pueden usar los datos del usuario o cómo las autoridades chinas podrían apropiar mal la plataforma en el futuro.
Escribir para Actualización biométricaAnthony Kimery, ex editor en jefe y cofundador de Seguridad nacionalY, destacó cómo la plataforma podría “apoyar las campañas de desinformación destinadas a desestabilizar las instituciones estadounidenses”.
Las afirmaciones de Deepseek de que desarrollaron sus modelos en hardware menos avanzado también se cuestionan. El analista de Citi Atif Malik afirma: “Si bien el logro de Deepseek podría ser innovador, cuestionamos la noción de que sus hazañas se hicieron sin el uso de GPU avanzadas para ajustarla y/o construir los LLM subyacentes. El modelo final se basa a través de la destilación técnica.”
El interrogatorio de Malik podría tener más peso, ya que, si bien Deepseek afirma que su modelo V3 fue entrenado utilizando las GPU de NVIDIA H800, una entrevista reciente con el fundador de Scale AI Alexandr Wang sobre CNBC Vio al CEO de la compañía sugerir “Deepseek tiene alrededor de cincuenta mil H100”.
Las mismas GPU que fueron bloqueadas de la exportación a China por la administración Biden en 2023, con Wang continuando, “no pueden hablar obviamente porque está en contra de los controles de exportación que [the] Estados Unidos se ha puesto en su lugar “.
Perspectiva
Deepseek es un éxito probado que le dará a compañías como OpenAI algo a considerar al retener su considerable base de usuarios frente a la dura competencia.
Sin embargo, queda por ver si el olor a automóvil nuevo aún permanece en los últimos modelos de Deekseek es enmascarar el olor de malla que rodea cómo desarrolló sus modelos y si sus precios son sostenibles a largo plazo a largo plazo.
Dada la reciente reacción de los Estados Unidos a Tiktok, es difícil imaginar que una compañía como Deepseek no sea un escrutinio grave por mucho más tiempo, especialmente porque sus modelos corren el riesgo de alterar el carrito de Apple en los planes del presidente Trump de mantener a Estados Unidos como la “capital mundial de AI.”