Noticias
Cómo se compara la startup de IA china con chatgpt, otros

Nueva Delhi:
Hay un niño nuevo en el bloque de chatbot / modelo de lenguaje grande (LLM) basado en inteligencia artificial, y amenaza con sacar el resto del agua. Conozca a Deepseek, desarrollado por un laboratorio de investigación con sede en Hangzhou con una fracción del presupuesto (si cree que los informes) solían hacer ChatGPT, Gemini, Claude AI y otros creados por los laboratorios de computación con sede en los Estados Unidos.
Y las últimas ofertas: Deepseek V3, un parámetro de 671 mil millones, el modelo de ‘mezcla de expertos’; y Deepseek R1, un modelo de razonamiento avanzado que utiliza IA, posiblemente mejor que el 01 de OpenAI, ha subrayado su estado como un posible disruptor financiero y tecnológico de peso pesado en este campo.
¿Cuánto de un disruptor es?
Hasta el lunes, Deepseek V3 es la mejor aplicación descargada en la tienda de Apple en los Estados Unidos; Deje que eso se hunda … un chatbot desarrollado por chino es ahora la aplicación más descargada en los EE. UU.
Y esa interrupción, incluso si se considera una “potencial” en este momento, ha planteado dudas sobre qué tan bien algunas compañías tecnológicas de EE. UU. Han invertido los miles de millones se comprometieron con el desarrollo de la IA.
Leer | Deepseek nos cuestiona el gasto de mil millones de dólares de Big Tech
De cualquier manera, la calidad y la rentabilidad de los modelos de Deepseek han volteado esta narrativa; Incluso si, a largo plazo, este modelo chino en particular fluye, que se desarrolló con una fracción de los recursos financieros y tecnológicos disponibles para las empresas en Occidente es una revelación.
De nuevo, ¿cuánto de disruptor es?
Bueno, el mes pasado los creadores de Deepseek dijeron capacitar al modelo V3 requirió menos de $ 6 millones (Aunque los críticos dicen que la adición de costos de etapas de desarrollo anteriores podría impulsar costos eventuales al norte de $ 1 mil millones) en la energía informática de los chips H800 de NVIDIA, una oferta de rango medio. “¿Deepseek realmente construyó Openai por $ 5 millones? Por supuesto que no”, dijo a Reuters, analista de Bernstein, Stacy Rasgon.
Pero desglose las finanzas disponibles y se vuelve bastante notable.
El 01 de Openai cobra $ 15 por millón de tokens de entrada.
R1 de Deepseek cobra $ 0.55 por millón de tokens de entrada.
El precio, por lo tanto, vola absolutamente a la competencia.
Y, dependiendo de los casos de uso final, Se cree que Deepseek está entre 20 y 50 veces más asequible y eficienteque el modelo 01 de Openai. De hecho, los resultados de la puntuación de la prueba de razonamiento lógico son asombrosos; Deepseek supera a Chatgpt y Claude Ai por siete a 14 por ciento.
Dev.to, una comunidad en línea popular para desarrolladores de software, dijo que obtuvo un 92 por ciento para completar tareas complejas de resolución de problemas, en comparación con el 78 por ciento de GPT-4.
Los tokens de entrada, por cierto, se refieren a unidades de información como parte de un mensaje o pregunta. Estos son básicamente lo que el modelo necesita para analizar o comprender el contexto de una consulta o instrucción.
Para el contexto, se cree que Operai gasta $ 5 mil millones cada año para desarrollar sus modelos.
Entonces, incluso si los críticos de Deepseek (ver arriba) son correctos, sigue siendo una fracción de los costos de Openi.
Esto se traduce, como señaló el jefe de la compañía, Sam Altman, en capacidades informáticas significativamente mejoradas, pero para que el modelo Deepseek entregue al menos esa gran potencia de procesamiento en su presupuesto relativamente reducido es un ascenso de cejas.
Y Altman lo reconoció, llamando al modelo R1 “muy impresionante”.
El jefe de Google, Sundar Pichai, fue un paso más allá, diciéndole a CNBC en Davos: “Creo que deberíamos sacar el desarrollo de China muy en serio”. Y el presidente de los Estados Unidos, Donald Trump, sonó una llamada de “despertar”.
Y están los cientos de miles de millones de dólares que las compañías estadounidenses han perdido en medio de una derrota esta semana en acciones tecnológicas; El fabricante de chips Nvidia, por ejemplo, perdió más de $ 600 mil millones y el índice NASDAQ rico en tecnología de tecnología terminó el lunes en más del tres por ciento, con la posibilidad no deseada de una mayor caída basada en los gigantes de IA y los informes esperados de ganancias de Microsoft.
Leer | Nvidia pierde casi $ 600 mil millones a medida que Deepseek Jolts Tech acciones
Para el contexto, Meta y Microsoft tienen sus propios modelos de IA, a la vanguardia de los cuales se encuentran llamas y copilotos; El primero es un LLM que se lanzó por primera vez en febrero de 2023 y el segundo ahora es una característica integrada en varias aplicaciones de Microsoft 365, como MS Word y Excel.
Si bien tampoco está, posiblemente, en el mismo nivel tecnológico que OpenAI o ChatGPT, Meta y MS han invertido miles de millones en proyectos de IA y LLM, tanto en los Estados Unidos como en el extranjero. Por ejemplo, algunos analistas creen que las grandes compañías en la nube de EE. UU. Gastarán $ 250 mil millones este año solo en infraestructura de IA.
Pero lo que realmente hace que Deepseek sea especial es más que el costo y la tecnología.
Es que, a diferencia de sus competidores, es genuinamente de código abierto.
El El código R1 está completamente abierto al público bajo la licencia MITque es una licencia de software permisiva que permite a los usuarios usar, modificar y distribuir software con pocas restricciones.
Esto significa que puede descargarlo, usarlo comercialmente sin tarifas, cambiar su arquitectura e integrarla en cualquiera de sus sistemas existentes.
Deepseek también es más rápido que GPT 4, más práctico y, según muchos expertos, incluso comprende los modismos regionales y los contextos culturales mejor que sus contrapartes occidentales.
Hay mucho más considerar.
¿Cómo, por ejemplo, Deepseek afecta los lazos diplomáticos y militares entre China y los Estados Unidos (e India también, en realidad), y cuáles son los problemas éticos con los modelos de IA de código abierto?
Pero lo que es innegable es que los profundos de China es un disruptor. Y los expertos creen que China ahora ha saltado, de 18 a seis meses detrás de los modelos de IA de última generación desarrollados en los Estados Unidos.
Mientras tanto, el éxito de Deepseek ya se ha notado en los principales círculos políticos de China.
El 20 de enero, el día en que se lanzó al público (y también el día en que Trump fue jurado como presidente de los Estados Unidos), el fundador Liang Wenfeng asistió a un simposio de puerta cerrada para empresarios y expertos organizados por el primer ministro chino Li Qiang. Su presencia ha sido vista como un signo de profundidad podría ser importante para el objetivo político de Beijing de lograr la autosuficiencia en industrias estratégicas como la IA.
Con aportes de agencias
NDTV ahora está disponible en los canales de WhatsApp. Haga clic en el enlace para obtener las últimas actualizaciones de NDTV en su chat.