Noticias

Sam Altman de OpenAI vows ‘Better Models’ como el Deepseek de China interrumpe la raza global

Published

on

El presidente ejecutivo de Operai, Sam Altman, dijo que aceleraría los lanzamientos de productos y “entregaría modelos mucho mejores” después de que los avances de la nueva empresa china Deepseek socavaron el liderazgo de Silicon Valley en una carrera armamentista global de inteligencia artificial.

El chatbot generativo de AI de Deepseek, un rival directo de ChatGPT, puede realizar algunas tareas al mismo nivel que los modelos lanzados recientemente de OpenAi, Anthrope y Meta, a pesar de las afirmaciones de que cuesta una fracción del dinero y el tiempo para desarrollarse.

El lanzamiento del modelo R1 de Deepseek la semana pasada y su ascenso a la cima de la App Store de Apple ha desencadenado una venta de acciones tecnológicas. Las acciones de Asian Tech cayeron el martes a raíz de una derrota de Wall Street durante la noche.

El Nasdaq cayó un 3 por ciento y el fabricante de chips de EE. UU. Nvidia, que produce los chips utilizados para entrenar grandes modelos de IA, cayeron un 17 por ciento, perdiendo $ 600 mil millones en capitalización de mercado.

El lunes por la noche, Altman escribió en X que el modelo de Deepseek era “impresionante, particularmente en torno a lo que pueden entregar por el precio”. Añadió: “Obviamente, entregaremos modelos mucho mejores y también es legítimo tener un nuevo competidor!”

Altman, quien la semana pasada anunció que los inversores, incluido Softbank, gastarían hasta $ 500 mil millones para construir una red de centros de datos para alimentar sus modelos de IA, agregó que los recursos informáticos eran “más importantes ahora que nunca”.

Microsoft, Meta, Alphabet, Amazon y Oracle han destinado $ 310 mil millones en 2025 para gastos de capital, que incluye infraestructura de IA, según los datos compilados por Visible Alpha. Dichas estimaciones se han basado en la premisa de que se necesitarán grandes cantidades de potencia informática para avanzar en las capacidades de IA.

Pero la capacidad de Deepseek para competir en una fracción del presupuesto de OpenAi, que recientemente se valoró en $ 157 mil millones, y sus rivales antrópicos, Google y Meta, han planteado preguntas sobre las vastas sumas que se vierten en los sistemas de entrenamiento.

“Los ganadores no serán los que quemen más efectivo”, dijo Aidan Gómez, fundador de Cohere, con sede en Toronto, que construye modelos de idiomas grandes para empresas. En cambio, dijo, serían aquellos “encontrar soluciones eficientes”.

El lunes, el presidente de los Estados Unidos, Donald Trump, llamó al último lanzamiento de Deepseek “una llamada de atención para nuestras industrias que necesitamos para estar centrados en el láser en competir para ganar”.

Trump agregó que quería “desatar” a las empresas tecnológicas estadounidenses y “dominar el futuro como nunca antes”.

Pero los avances de Deepseek han expuesto riesgos para los capitalistas de riesgo que pusieron casi $ 100 mil millones en las nuevas empresas de IA de EE. UU. El año pasado. “Ahora hay un modelo de peso abierto que flota en Internet que puede usar para arrancar cualquier otro modelo base suficientemente potente para ser un razonador de IA”, dijo Jack Clark, cofundador de Anthrope, en un blog el lunes.

“Las capacidades de IA en todo el mundo acaban de avanzar un trinquete de ida”, agregó. “¡Felicitaciones a Deepseek por ser tan audaz como para traer tal cambio al mundo!”

El éxito de Deepseek ha complicado el argumento de que las pilas de efectivo masivas crean una ventaja inexpugnable, lo que ha ayudado a llevar a Silicon Valley Labs a recaudar decenas de miles de millones de dólares durante el año pasado.

“Si eres antrópico o OpenAi, intenta estar a la vanguardia, y alguien puede servir lo que puedes en una décima parte del costo, eso es problemático”, dijo Mike Volpi, quien dirigió la inversión de Index Ventures en Cohere.

El lanzamiento repentino del último modelo de Deepseek sorprendió a algunos en Meta. “La principal frustración es: ‘¿Por qué no nos ocurrieron esto primero?’ Cuando tenemos miles de las mentes más brillantes trabajando en esto ”, dijo un meta empleado.

El presidente ejecutivo Mark Zuckerberg, quien la semana pasada dijo que esperaba asignar hasta $ 65 mil millones en gastos de capital para expandir los equipos de IA y construir un nuevo centro de datos, ha abogado por el código abierto, posicionando meta a su vanguardia en los Estados Unidos.

“Queremos que Estados Unidos establezca el estándar de IA global, no China”, dijo la compañía en respuesta a Deepseek.

El científico jefe de IA de Meta, Yann Lecun, dijo que “ejecutar servicios de asistente de IA para miles de millones” aún requeriría grandes niveles de potencia informática.

Los expertos e inversores de la compañía rival han expresado escepticismo sobre los bajos costos citados por Deepseek en el desarrollo de sus modelos. En diciembre, la compañía dijo que su modelo V3, en el que se ejecuta el chatbot de su aplicación, cuesta solo $ 5.6mn para entrenar.

Sin embargo, agregó que esta cifra era solo para la ejecución de capacitación final, no para el ciclo completo, y excluyó “los costos asociados con la investigación previa y. . . Experimentos sobre arquitecturas, algoritmos o datos ”.

Deepseek ha atribuido su éxito, a pesar de usar chips inferiores a sus competidores estadounidenses, a los métodos que permiten al modelo AI centrarse selectivamente en partes específicas de los datos de entrada como una forma de reducir los costos de ejecutar el modelo.

Para su último modelo R1, utilizó una técnica de aprendizaje de refuerzo, un enfoque relativamente nuevo para la IA en el que los modelos se enseñan cómo mejorar sin supervisión humana. La compañía también utilizó modelos de código abierto, incluidos Qwen y Meta’s Llama de Alibaba, para ajustar su modelo de razonamiento R1.

Los avances técnicos y el interés de los inversores en el progreso de Deepseek podrían iluminar un incendio bajo las compañías de IA. “En general, esperamos que el sesgo esté en una capacidad mejorada, corriendo más rápido hacia la inteligencia general artificial, más que un gasto reducido”, dijo la compañía de investigación Rosenblatt el lunes.

Investigadores e inversores, incluido Marc Andreessen, han dibujado paralelos entre la carrera entre Estados Unidos y China en AGI y su competencia con la Unión Soviética durante la Guerra Fría, tanto en la exploración espacial como en el desarrollo de armas nucleares.

Stuart Russell, profesor de informática en la Universidad de California, Berkeley, dijo que la carrera a AGI fue “peor”.

“Incluso los CEO que participan en la raza han declarado que quien gane tiene una probabilidad significativa de causar extinción humana en el proceso, porque no tenemos idea de cómo controlar los sistemas más inteligentes que nosotros”, dijo. “En otras palabras, la carrera AGI es una carrera hacia el borde de un acantilado”.

Informes adicionales de Michael Acton y Rafe Uddin en San Francisco y Melissa Heikkilä en Londres

Video: AI y el potencial de una revolución en la atención médica

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version