Noticias

Cómo la startup china de IA DeepSeek compite con OpenAI y Google

Published

on

El día después de Navidad, una pequeña empresa china llamada DeepSeek presentó un nuevo sistema de inteligencia artificial que podría igualar las capacidades de los chatbots de vanguardia de empresas como OpenAI y Google.

Sólo eso habría sido un hito. Pero el equipo detrás del sistema, llamado DeepSeek-V3, describió un paso aún mayor. En un artículo de investigación que explica cómo construyeron la tecnología, los ingenieros de DeepSeek dijeron que utilizaron sólo una fracción de los chips informáticos altamente especializados en los que confiaban las principales empresas de inteligencia artificial para entrenar sus sistemas.

Estos chips están en el centro de una tensa competencia tecnológica entre Estados Unidos y China. Mientras el gobierno de Estados Unidos trabaja para mantener el liderazgo del país en la carrera mundial de la IA, está tratando de limitar el número de chips potentes, como los fabricados por la empresa Nvidia de Silicon Valley, que pueden venderse a China y otros rivales.

Pero el desempeño del modelo DeepSeek plantea dudas sobre las consecuencias no deseadas de las restricciones comerciales del gobierno estadounidense. Los controles han obligado a los investigadores en China a ser creativos con una amplia gama de herramientas que están disponibles gratuitamente en Internet.

El chatbot DeepSeek respondió preguntas, resolvió problemas lógicos y escribió sus propios programas informáticos con tanta capacidad como cualquier otro que ya esté en el mercado, según las pruebas comparativas que las empresas estadounidenses de inteligencia artificial han estado utilizando.

Y se creó a bajo precio, desafiando la idea predominante de que sólo las empresas más grandes de la industria tecnológica (todas ellas con sede en Estados Unidos) podían permitirse el lujo de fabricar los sistemas de inteligencia artificial más avanzados. Los ingenieros chinos dijeron que sólo necesitaban unos 6 millones de dólares en potencia informática bruta para construir su nuevo sistema. Eso es aproximadamente 10 veces menos de lo que gastó el gigante tecnológico Meta en desarrollar su última tecnología de inteligencia artificial.

“El número de empresas que tienen 6 millones de dólares para gastar es muchísimo mayor que el número de empresas que tienen 100 millones o 1.000 millones de dólares para gastar”, dijo Chris V. Nicholson, inversor de la firma de capital de riesgo Page One Ventures, que se centra en Tecnologías de IA.

Desde que OpenAI desató el auge de la IA en 2022 con el lanzamiento de ChatGPT, muchos expertos e inversores habían llegado a la conclusión de que ninguna empresa podía competir con los líderes del mercado sin gastar cientos de millones de dólares en chips especializados.

Las principales empresas de inteligencia artificial del mundo entrenan sus chatbots utilizando supercomputadoras que utilizan hasta 16.000 chips, si no más. Los ingenieros de DeepSeek, por otro lado, dijeron que sólo necesitaban unos 2.000 chips informáticos especializados de Nvidia.

Las limitaciones de los chips en China obligaron a los ingenieros de DeepSeek a “entrenarlo de manera más eficiente para que aún pudiera ser competitivo”, dijo Jeffrey Ding, profesor asistente de la Universidad George Washington que se especializa en tecnología emergente y relaciones internacionales.

A principios de este mes, la administración Biden emitió nuevas reglas que tienen como objetivo evitar que China obtenga chips de IA avanzados a través de otros países. Las reglas se basan en múltiples rondas de restricciones anteriores que impiden que las empresas chinas puedan comprar o fabricar chips de computadora de última generación. El presidente Trump aún no ha indicado si aprobará las reglas o las rescindirá.

El gobierno de Estados Unidos ha tratado de mantener los chips avanzados fuera del alcance de las empresas chinas por temor a que puedan usarse con fines militares. En respuesta, algunas empresas en China han almacenado miles de chips, mientras que otras los obtuvieron de un próspero mercado clandestino de contrabandistas.

DeepSeek está dirigido por una empresa de negociación de acciones cuantitativa llamada High Flyer. Para 2021, había canalizado sus ganancias en la adquisición de miles de chips Nvidia, que utilizó para entrenar sus modelos anteriores. La compañía, que no respondió a las solicitudes de comentarios, se ha hecho conocida en China por captar talentos recién llegados de las mejores universidades con la promesa de altos salarios y la capacidad de seguir las preguntas de investigación que más despiertan su interés.

Zihan Wang, un ingeniero informático que trabajó en un modelo anterior de DeepSeek, dijo que la compañía también contrata personas sin ningún conocimiento en informática para ayudar a comprender la tecnología y ser capaz de generar poesía y resolver preguntas en el notoriamente difícil examen de ingreso a la universidad china.

DeepSeek no fabrica ningún producto para consumidores, por lo que sus ingenieros se centran exclusivamente en la investigación. Eso significa que su tecnología no está limitada por el aspecto más estricto de las regulaciones chinas sobre IA, que exigen que la tecnología orientada al consumidor cumpla con los controles gubernamentales sobre la información.

Las principales empresas estadounidenses siguen avanzando en los últimos avances en IA. En diciembre, OpenAI presentó un nuevo sistema de “razonamiento” llamado o3 que supera el rendimiento de las tecnologías existentes, aunque aún no está ampliamente disponible fuera de la empresa. Pero DeepSeek sigue demostrando que no se queda atrás. Este mes, lanzó su propio modelo de razonamiento impresionante.

(El New York Times ha demandado a OpenAI y su socio, Microsoft, acusándolos de infracción de derechos de autor de contenido de noticias relacionado con sistemas de inteligencia artificial. OpenAI y Microsoft han negado esas afirmaciones).

Una parte crucial de este mercado global que cambia rápidamente es una vieja idea: el software de código abierto. Como muchas otras empresas, DeepSeek ha abierto su último sistema de inteligencia artificial, lo que significa que ha compartido el código subyacente con otras empresas e investigadores. Esto permite que otros creen y distribuyan sus propios productos utilizando las mismas tecnologías.

Si bien los empleados de las grandes empresas tecnológicas chinas se limitan a colaborar con colegas, “si trabajas en código abierto, trabajas con talentos de todo el mundo”, dijo Yineng Zhang, ingeniero de software líder en Baseten en San Francisco que trabaja en el código abierto SGLang. proyecto. Ayuda a otras personas y empresas a crear productos utilizando el sistema de DeepSeek.

El ecosistema de código abierto para la IA cobró fuerza en 2023 cuando Meta compartió libremente un sistema de IA llamado LLama. Muchos asumieron que esta comunidad prosperaría sólo si empresas como Meta (gigantes tecnológicos con enormes centros de datos llenos de chips especializados) continuaran abriendo el código fuente de sus tecnologías. Pero DeepSeek y otros han demostrado que ellos también pueden ampliar los poderes de las tecnologías de código abierto”.

Muchos ejecutivos y expertos han argumentado que las grandes empresas estadounidenses no deberían abrir el código fuente de sus tecnologías porque podrían usarse para difundir desinformación o causar otros daños graves. Algunos legisladores estadounidenses han explorado la posibilidad de prevenir o limitar esta práctica.

Pero otros sostienen que si los reguladores frenan el progreso de la tecnología de código abierto en Estados Unidos, China obtendrá una ventaja significativa. Si las mejores tecnologías de código abierto provienen de China, argumentan, los desarrolladores estadounidenses construirán sus sistemas sobre esas tecnologías. A largo plazo, eso podría colocar a China en el centro de la investigación y el desarrollo de la IA.

“El centro de gravedad de la comunidad de código abierto se ha ido trasladando a China”, afirmó Ion Stoica, profesor de informática en la Universidad de California, Berkeley. “Esto podría ser un gran peligro para Estados Unidos”, porque permite a China acelerar el desarrollo de nuevas tecnologías.

Horas después de su toma de posesión, el presidente Trump rescindió una orden ejecutiva de la administración Biden que amenazaba con frenar las tecnologías de código abierto.

El Dr. Stoica y sus estudiantes construyeron recientemente un sistema de inteligencia artificial llamado Sky-T1 que rivaliza con el rendimiento del último sistema OpenAI, llamado OpenAI o1, en ciertas pruebas comparativas. Sólo necesitaban 450 dólares en potencia informática.

Lo hicieron basándose en dos tecnologías de código abierto lanzadas por el gigante tecnológico chino Alibaba.

Su sistema de 450 dólares no es tan poderoso como la tecnología de OpenAI o el nuevo sistema de DeepSeek. Y es poco probable que las técnicas que utilizaron produzcan sistemas que superen el rendimiento de las tecnologías líderes. Pero el proyecto demostró que incluso operaciones con recursos minúsculos pueden construir sistemas competitivos.

Reuven Cohen, consultor tecnológico de Toronto, ha estado utilizando DeepSeek-V3 desde finales de diciembre. Dice que es comparable a los últimos sistemas de OpenAI, Google y la nueva empresa Anthropic de San Francisco, y mucho más barato de usar.

“Para mí, DeepSeek es una forma de ahorrar dinero”, afirmó. “Éste es el tipo de tecnología que alguien como yo quiere utilizar”.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version