Noticias
DeepSeek: ¿Es este el momento ChatGPT de China y una llamada de atención para EE. UU.? | Noticias de tecnología
Durante años, Estados Unidos de América ha sido el líder indiscutible en inteligencia artificial, especialmente porque alberga grandes empresas de tecnología como OpenAI, Anthropic, Google, Meta y más.
Sin embargo, enero de 2025 cambió las cosas y China amenaza este dominio. El sentido de urgencia en la administración Trump es palpable. El cambio en la narrativa comenzó hace unas semanas, cuando el laboratorio chino de inteligencia artificial DeepSeek presentó su modelo de lenguaje de gran tamaño DeepSeek-V3. La conclusión más importante aquí fue que DeepSeek-V3 se construyó utilizando una fracción del costo requerido para ensamblar los modelos de vanguardia de OpenAI, Meta, etc.
La hazaña tecnológica de DeepSeek ha sorprendido a todos, desde Silicon Valley hasta el mundo entero. El laboratorio chino ha creado algo monumental: ha introducido un potente modelo de IA de código abierto que rivaliza con lo mejor que ofrecen las empresas estadounidenses. Dado que las empresas de IA requieren miles de millones de dólares en inversiones para entrenar modelos de IA, la innovación de DeepSeek es una clase magistral sobre el uso óptimo de recursos limitados. Esto indica que, además de las inversiones, también se necesita previsión para innovar en el sentido más estricto. También demuestra cómo la necesidad puede impulsar la innovación de maneras inesperadas.
El surgimiento de China como un actor fuerte en IA se produce en un momento en que los controles de exportación de Estados Unidos le han restringido el acceso a los chips de IA de NVIDIA más avanzados. Estos controles también han limitado el alcance de las empresas tecnológicas chinas para competir con sus homólogos occidentales más grandes. En consecuencia, estas empresas recurrieron a aplicaciones posteriores en lugar de crear modelos propietarios. El hardware avanzado es vital para crear productos y servicios de inteligencia artificial, y el avance de DeepSeek muestra cómo las restricciones impuestas por Estados Unidos pueden no haber sido tan efectivas como se pretendía.
En estas circunstancias, la fama de DeepSeek es una historia en sí misma. Según se informa, la empresa china de IA acaba de gastar 5,6 millones de dólares para desarrollar el modelo DeepSeek-V3, lo que es sorprendentemente bajo en comparación con los millones inyectados por OpenAI, Google y Microsoft. Según se informa, OpenAI, liderada por Sam Altman, gastó la friolera de 100 millones de dólares para entrenar su modelo GPT-4. Por otro lado, DeepSeek entrenó su modelo de ruptura utilizando GPU que se consideraban de última generación en EE. UU. De todos modos, los resultados logrados por DeepSeek rivalizan con los de modelos mucho más caros como GPT-4 y Meta’s Llama.
DeepSeek tiene su sede en HangZhou en China y tiene al empresario Lian Wenfeng como director ejecutivo. Wenfeng, que también es cofundador del fondo de cobertura cuantitativo High-Flyer, lleva mucho tiempo trabajando en proyectos de IA. Según se informa, en 2021 compró miles de GPU NVIDIA, lo que muchos consideraron otra peculiaridad de un multimillonario. Sin embargo, en 2023 lanzó DeepSeek con el objetivo de trabajar en Inteligencia General Artificial. En una de sus entrevistas a los medios chinos, Wenfeng dijo que su decisión fue motivada por la curiosidad científica y no por el lucro. Según se informa, cuando creó DeepSeek, Wenfeng no buscaba ingenieros experimentados. Quería trabajar con estudiantes de doctorado de las principales universidades de China que tuvieran aspiraciones. Al parecer, muchos de los miembros del equipo habían publicado en revistas importantes y habían recibido numerosos premios. El espíritu y el sistema de creencias de Wenfeng se reflejan en la naturaleza de código abierto de DeepSeek, que se ha ganado la admiración de la comunidad mundial de IA.
Estableciendo un nuevo punto de referencia para la innovación
Incluso cuando las empresas de inteligencia artificial en EE. UU. aprovechaban el poder del hardware avanzado como las GPU NVIDIA H100, DeepSeek dependía de GPU H800 menos potentes. Esto solo podría haber sido posible implementando algunas técnicas ingeniosas para maximizar la eficiencia de estas GPU de generación anterior. Además de las GPU de generaciones anteriores, los diseños técnicos como la atención latente de cabezales múltiples (MLA) y la combinación de expertos abaratan los modelos de DeepSeek, ya que estas arquitecturas requieren menos recursos informáticos para entrenar.
DeepSeek-V3 ahora ha superado modelos más grandes como GPT-4 de OpenAI, Claude 3.5 Sonnet de Anthropic y Llama 3.3 de Meta en varios puntos de referencia, que incluyen codificación, resolución de problemas matemáticos e incluso detección de errores en el código. Incluso cuando la comunidad de IA se aferraba a DeepSeek-V3, el laboratorio de IA lanzó otro modelo de razonamiento, DeepSeek-R1, la semana pasada. El R1 ha superado al último modelo O1 de OpenAI en varios puntos de referencia, incluidos matemáticas, codificación y conocimientos generales.
DeepSeek está ganando atención mundial en un momento en que OpenAI se estaba reestructurando para convertirse en una organización con fines de lucro. El laboratorio chino de IA ha lanzado sus modelos de IA como de código abierto, en marcado contraste con OpenAI, y amplifica su impacto global. Al ser de código abierto, los desarrolladores tienen acceso a los pesos de DeepSeeks, lo que les permite desarrollar el modelo e incluso perfeccionarlo con facilidad. Esta naturaleza de código abierto de los modelos de IA de China probablemente podría significar que la tecnología de IA china eventualmente se integraría en el ecosistema tecnológico global, algo que hasta ahora solo Estados Unidos ha podido lograr.
¿Qué está en juego en el escenario global?
El éxito desbocado de DeepSeek también genera algunas preocupaciones sobre las implicaciones más amplias del avance de la IA en China. Si bien es de código abierto, permite la colaboración global; su desarrollo, basado en regulaciones estatales chinas, podría potencialmente obstaculizar su expansión.
Críticos y expertos han dicho que tales sistemas de IA probablemente reflejarían opiniones autoritarias y censurarían la disidencia. Esto es algo que ha sido una gran preocupación en lo que respecta al debate sobre permitir TikTok de ByteDance en los EE. UU. Aunque quedaron muy impresionados, algunos miembros de la comunidad de IA han cuestionado el precio de 6 millones de dólares para construir el DeepSeek-V3. Además, muchos desarrolladores han señalado que el modelo pasa por alto las preguntas sobre Taiwán y el incidente de la Plaza de Tiananmen.
Ahora, más que nunca, hay dudas sobre si la IA reflejaría valores democráticos y apertura, especialmente si ha sido desarrollada por naciones dirigidas por gobiernos autoritarios.
¿Por qué está nervioso Estados Unidos?
En el segundo día como presidente de los Estados Unidos, Donald Trump anunció el Proyecto Stargate, una iniciativa masiva de 500 mil millones de dólares que reúne a los titanes tecnológicos OpenAI, Oracle y SoftBank. En su discurso, Trump dijo explícitamente que Estados Unidos pretende tener una ventaja sobre China. El proyecto Stargate tiene como objetivo crear una infraestructura de inteligencia artificial de última generación en los EE. UU. con más de 100.000 puestos de trabajo en el país. Trump destacó que quiere que Estados Unidos sea el líder mundial en inteligencia artificial. “Este proyecto garantiza que Estados Unidos seguirá siendo el líder mundial en inteligencia artificial y tecnología, en lugar de permitir que competidores como China obtengan la ventaja”, dijo Trump.
El apresurado anuncio del poderoso Proyecto Stargate indica la desesperación de Estados Unidos por mantener su posición superior. Si bien DeepSeek puede haber estimulado o no cualquiera de estos desarrollos, los modelos de inteligencia artificial del laboratorio chino que crean olas en la comunidad de desarrolladores e inteligencia artificial en todo el mundo son suficientes para enviar señales.
Además, el avance de China con DeepSeek desafía la noción arraigada de que Estados Unidos ha estado encabezando la ola de IA, impulsada por grandes tecnológicas como Google, Anthropic y OpenAI, que se basaban en inversiones masivas e infraestructura de última generación. El liderazgo indiscutible de los EE. UU. en IA mostró al mundo lo importante que es tener acceso a recursos masivos y hardware de vanguardia para garantizar el éxito. DeepSeek está de alguna manera socavando la suposición de que las empresas de inteligencia artificial con sede en Estados Unidos tienen ventaja sobre las empresas de inteligencia artificial de otros países. Hasta el año pasado, muchos habían afirmado que los avances en IA de China estaban años por detrás de los de Estados Unidos.
El laboratorio chino de IA también ha demostrado cómo los LLM se están convirtiendo cada vez más en productos básicos. Esto probablemente podría amenazar la ventaja competitiva que tienen los gigantes tecnológicos estadounidenses sobre sus homólogos del resto del mundo. La narrativa de que el liderazgo de la IA en Estados Unidos es invencible se ha hecho añicos, y DeepSeek está demostrando que la innovación en la IA no se trata simplemente de financiar o tener acceso a la mejor infraestructura. Esto también pone de relieve la necesidad de que Estados Unidos se adapte e innove más rápido si quiere mantener su liderazgo.