Connect with us

Noticias

Bill Gates Recomienda: Cómo la IA Revolucionará la Educación, según Salman Khan

Published

on

Bill Gates, en su cuenta de Instagram, ha recomendado el libro “Brave New Words: How AI Will Revolutionize Education (and Why that’s a Good Thing)” de Salman Khan. Este libro aborda cómo la inteligencia artificial está transformando el ámbito educativo y por qué estos cambios son beneficiosos. Gates destaca la relevancia de este libro en su lista de lecturas de verano, enfatizando la importancia del servicio a los demás y cómo la educación puede beneficiarse de los avances tecnológicos.

En una reciente publicación en Instagram, Bill Gates ha compartido sus recomendaciones de lectura para el verano, incluyendo el libro “Brave New Words: How AI Will Revolutionize Education (and Why that’s a Good Thing)” de Salman Khan. Este libro promete ofrecer una visión profunda sobre el impacto de la inteligencia artificial en la educación.

La Visión de Salman Khan

Salman Khan, fundador de Khan Academy, es conocido por su enfoque innovador en la educación a través de recursos en línea gratuitos. En su nuevo libro, Khan explora cómo la inteligencia artificial puede personalizar y mejorar la experiencia educativa para estudiantes de todo el mundo. Destaca cómo estas tecnologías pueden adaptarse a las necesidades individuales de los alumnos, ofreciendo un aprendizaje más eficiente y accesible.

El Entusiasmo de Bill Gates

Bill Gates, un ferviente defensor de la educación y la tecnología, ha elogiado el libro de Khan. En su publicación, Gates menciona que las recomendaciones de su lista de verano se centran en la idea de servir a los demás, explorando los motivos detrás de nuestras acciones y cómo podemos hacer una diferencia. Gates considera que la educación es una de las áreas donde la inteligencia artificial puede tener un impacto significativo y positivo.

Beneficios de la IA en la Educación

El libro argumenta que la inteligencia artificial puede:

• Personalizar el aprendizaje para cada estudiante.

• Proveer retroalimentación inmediata y precisa.

• Ayudar a identificar y cerrar brechas en el conocimiento.

• Facilitar el acceso a recursos educativos de alta calidad.

Principales Temas Abordados:

1. Transformación del Aprendizaje:

• Khan explora cómo las tecnologías de IA, como GPT, cambiarán la forma en que aprendemos y enseñamos. Estas herramientas pueden personalizar la educación al adaptarse al ritmo y estilo de aprendizaje de cada estudiante, identificar fortalezas y áreas de mejora, y ofrecer apoyo y retroalimentación personalizados.

2. Mejora de la Educación Tradicional:

• La IA no pretende reemplazar la interacción humana en la educación, sino complementarla. Las herramientas de IA pueden liberar a los maestros de tareas administrativas, permitiéndoles centrarse más en actividades interactivas y creativas con los estudiantes.

3. Implicaciones Sociales y Éticas:

• Khan discute las implicaciones éticas y sociales del uso de la IA en la educación. Aborda cómo estas tecnologías pueden ayudar a crear un sistema educativo más accesible y equitativo a nivel global, y ofrece reflexiones sobre cómo mitigar posibles desventajas o abusos de estas tecnologías.

4. Aplicaciones Prácticas:

• El libro proporciona ejemplos concretos de cómo la IA puede ser utilizada en el aula y más allá. Incluye sugerencias para administradores escolares, orientadores y empleadores sobre cómo aprovechar la IA para mejorar los procesos educativos y de contratación.

5. Preparación para el Futuro:

• Khan enfatiza la importancia de preparar a los estudiantes para un mundo cada vez más digital. Las habilidades en resolución creativa de problemas y la adaptabilidad serán cruciales en un futuro dominado por la tecnología.

La recomendación de Bill Gates subraya la relevancia y el potencial de la inteligencia artificial en el campo educativo. “Brave New Words” de Salman Khan es una lectura esencial para aquellos interesados en entender cómo la tecnología puede transformar la educación y por qué estos cambios son beneficiosos para la sociedad.

Este enfoque resalta la importancia del libro y cómo se alinea con la visión de Bill Gates sobre el futuro de la educación. Puedes comprarlo en Amazon

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Deepseek R1 es genial, pero Chatgpt todavía tiene la ventaja de IA

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Hace solo una semana, el 20 de enero de 2025, la startup china de IA Deepseek desató un nuevo modelo de IA de código abierto llamado R1 que inicialmente podría haber sido confundido con una de las masas cada vez más crecientes de rivales casi intercambiables desde OpenAi desde OpenAi debutó ChatGPT (impulsado por su propio modelo GPT-3.5, inicialmente) hace más de dos años.

Pero eso rápidamente resultó infundada, ya que la aplicación móvil de Deepseek ha incrementado en ese corto tiempo las listas de Apple App Store en los EE. UU. Para destronar el chatgpt por el lugar número uno y causado una corrección de mercado masiva cuando los inversores arrojaron acciones en chips de computadora anteriormente caliente. Los fabricantes como Nvidia, cuyas unidades de procesamiento de gráficos (GPU) han tenido una gran demanda de uso en superclusters masivos para entrenar nuevos modelos de IA y servirles a los clientes de manera continua (una modalidad conocida como “inferencia”).

El capitalista de riesgo, Marc Andreessen, haciéndose los sentimientos de otros trabajadores tecnológicos, escribió en la red social X anoche: “Deepseek R1 es el momento sputnik de AI”, comparándolo con el lanzamiento fundamental de octubre de 1957 del primer satélite artificial en la historia, Sputnik 1, por el La Unión Soviética, que provocó la “carrera espacial” entre ese país y los Estados Unidos para dominar los viajes espaciales.

El lanzamiento de Sputnik galvanizó a los Estados Unidos para invertir mucho en la investigación y el desarrollo de naves espaciales y cohetros. Si bien no es una analogía perfecta, no se necesitaba una gran inversión para crear Deepseek-R1, todo lo contrario (más sobre esto a continuación), parece significar un importante punto de inflexión en el mercado global de IA, como por primera vez, un El producto de IA de China se ha convertido en el más popular del mundo.

Pero antes de subir al tren de bombo de Deepseek, retrocedamos y examinemos la realidad. Como alguien que ha utilizado ampliamente el ChatGPT de OpenAI, tanto en plataformas web como móviles, y ha seguido de cerca los avances de IA, creo que si bien los logros de Deepseek-R1 son notables, no es hora de descartar las inversiones de ChatGPT o US AI todavía. Y tenga en cuenta que OpenAi no me paga para decir esto: nunca he tomado dinero de la empresa y no planeo.

¿Qué hace bien?

Deepseek-R1 es parte de una nueva generación de grandes modelos de “razonamiento” que hacen más que responder consultas de los usuarios: reflexionan sobre su propio análisis mientras producen una respuesta, intentando captar errores antes de servirlos al usuario.

Y Deepseek-R1 coincide o supera el propio modelo de razonamiento de OpenAI, O1, lanzado en septiembre de 2024 inicialmente solo para usuarios de suscripción ChatGPT Plus y Pro, en varias áreas.

Por ejemplo, en el punto de referencia Math-500, que evalúa la resolución matemática de problemas matemáticos a nivel de escuela secundaria, Deepseek-R1 alcanzó una tasa de precisión del 97.3%, superando ligeramente el 96.4% de OpenAI O1. En términos de capacidades de codificación, Deepseek-R1 obtuvo un 49.2% en el punto de referencia verificado SWE-Bench, superando el 48.9% de OpenAI O1.

Además, financieramente, Deepseek-R1 ofrece ahorros de costos sustanciales. El modelo se desarrolló con una inversión de menos de $ 6 millones, una fracción del gasto, estimado de múltiples miles de millones, se asocia informalmente con modelos de capacitación como OpenAI’s O1.

Deepseek se vio esencialmente obligado a ser más eficiente con GPU escasas y antiguas gracias a una restricción de exportación de los Estados Unidos en las ventas de la tecnología a China. Además, Deepseek proporciona acceso a API a $ 0.14 por millón de tokens, restringiendo significativamente la tasa de OpenAI de $ 7.50 por millón de tokens.

La ganancia de eficiencia masiva de Deepseek-R1, los ahorros de costos y el rendimiento equivalente al modelo de IA de EE. UU. Han causado que Silicon Valley y la comunidad empresarial más amplia se asusten por lo que parece ser un aumento completo del mercado de IA, la geopolítica y la economía conocida de la IA. Entrenamiento modelo.

Si bien las ganancias de Deepseek son revolucionarias, el péndulo se está balanceando demasiado hacia él en este momento

No se puede negar que la rentabilidad de Deepseek-R1 es un logro significativo. Pero no olvidemos que Deepseek debe gran parte de su éxito a las innovaciones de IA de EE. UU., Volviendo a la arquitectura de transformadores inicial de 2017 desarrollada por Google AI Investigers (que comenzó toda la locura de LLM).

Deepseek-R1 fue entrenado en preguntas y respuestas de datos sintéticos y específicamente, según el documento publicado por sus investigadores, en el “conjunto de datos de DeepSeek-V3” supervisado, que se encontró, que se encontró. ¡Tener muchos indicadores de ser generados con el modelo GPT-4O de Opensei!

Parece bastante claro decir que sin GPT-4O para proporcionar estos datos, y sin el lanzamiento de OpenAi del primer modelo de razonamiento comercial O1 en septiembre de 2024, que creó la categoría, Deepseek-R1 casi seguramente no existiría.

Además, el éxito de Openai requirió grandes cantidades de recursos de GPU, allanando el camino para los avances que Deepseek se ha beneficiado sin duda. El actual inversor en pánico sobre EE. UU. Y las compañías de IA se sienten prematuras y exageradas.

Las capacidades de visión y generación de imágenes de ChatGPT siguen siendo muy importantes y valiosas en el lugar de trabajo y en los entornos personales: Deepseek-R1 aún no tiene ninguna

Mientras que Deepseek-R1 ha impresionado con su razonamiento visible de “cadena de pensamiento”, una especie de flujo de conciencia en la que el modelo muestra texto a medida que analiza el aviso del usuario y busca responder a él, y eficiencia en flujos de trabajo basados ​​en texto y matemáticas, Carece de varias características que hacen que ChatGPT sea una herramienta más robusta y versátil hoy.

No hay capacidades de generación de imágenes o visión

El sitio web oficial de Deepseek-R1 y la aplicación móvil permiten a los usuarios subir fotos y archivos adjuntos de archivos. Pero, solo pueden extraer texto de ellos utilizando el reconocimiento de caracteres ópticos (OCR), una de las primeras tecnologías informáticas (que datan de 1959).

Esto palidece en comparación con las capacidades de visión de ChatGPT. Un usuario puede cargar imágenes sin ningún texto y hacer que ChatGPT analice la imagen, describirla o proporcionar más información basada en lo que ve y el texto del usuario solicita.

CHATGPT permite a los usuarios subir fotos y pueden analizar material visual y proporcionar información detallada o consejos procesables. Por ejemplo, cuando necesitaba orientación para reparar mi bicicleta o mantener mi unidad de aire acondicionado, la capacidad de ChatGPT para procesar imágenes resultó invaluable. Deepseek-r1 simplemente no puede hacer esto todavía. Vea a continuación para una comparación visual:

No hay generación de imágenes

La ausencia de capacidades de imagen generativa es otra limitación importante. Como alguien que genera frecuentemente imágenes de IA usando CHATGPT (como para el propio encabezado de este artículo) alimentado por el modelo Dall · E 3 subyacente de OpenAI, la capacidad de crear imágenes detalladas y estilísticas con ChatGPT es un cambio de juego.

Esta característica es esencial para muchos flujos de trabajo creativos y profesionales, y Deepseek aún no ha demostrado una funcionalidad comparable, aunque hoy la compañía lanzó un modelo de visión de código abierto, Janus Pro, que dice que supera a Dall · E 3, Difusión estable 3 y otros Modelos de generación de imágenes líderes en la industria en puntos de referencia de terceros.

Sin modo de voz

Deepseek-R1 también carece de un modo de interacción de voz, una característica que se ha vuelto cada vez más importante para la accesibilidad y la conveniencia. El modo de voz de ChatGPT permite interacciones naturales y conversacionales, lo que lo convierte en una opción superior para uso de manos libres o para usuarios con diferentes necesidades de accesibilidad.

Estar emocionado por el potencial futuro de Deepseek, pero también desconfíe de sus desafíos

Sí, Deepseek-R1 puede, y probablemente lo hará, agregar capacidades de voz y visión en el futuro. Pero hacerlo no es una hazaña pequeña.

La integración de la generación de imágenes, el análisis de la visión y las capacidades de voz requieren recursos de desarrollo sustanciales y, irónicamente, muchas de las mismas GPU de alto rendimiento que los inversores ahora están subvalorando. Implementar estas características de manera efectiva y de manera fácil de usar es otro desafío por completo.

Los logros de Deepseek-R1 son impresionantes y indican un cambio prometedor en el panorama global de IA. Sin embargo, es crucial mantener la emoción bajo control. Por ahora, ChatGPT sigue siendo el producto mejor redondeado y más capaz, ofreciendo un conjunto de características que Deepseek simplemente no puede igualar. Apreciamos los avances al tiempo que reconocemos las limitaciones y la importancia continua de la innovación e inversión de la IA de EE. UU.

Continue Reading

Noticias

¿Qué es Deepseek y por qué está causando que Nvidia y otras acciones se caigan?

Published

on

Una compañía de inteligencia artificial china llamada Deepseek está captando la atención de Estados Unidos, y enviando una ola de choque a través de Wall Street, debido a su nueva tecnología, que algunos expertos rivalizan con el de Chatgpt de OpenAi.

Deepseek también está atrapando a los inversores desprevenidos debido a los bajos costos de desarrollo de su aplicación AI, que el analista de valores de Wedbush, Dan Ives, vinculó a solo $ 6 millones. En comparación, Openai, Google y otras compañías importantes de EE. UU. Están en camino de invertir un total de aproximadamente $ 1 billón en IA en los próximos años, según Goldman Sachs.

El lunes, el despliegue de Deepseek arrancó las acciones de AI Stalwarts como Nvidia, el fabricante de chips avanzados diseñados para el desarrollo de IA, y la compañía holandesa ASML, otro fabricante de chips. La tecnología de la compañía china está planteando preguntas sobre si la demanda de chips de Nvidia podría recibir un golpe, así como si los inversores están sobrevalorando las acciones tecnológicas que han sido impulsadas por la promesa de IA, de Meta a Microsoft, dijeron los expertos.

“Deepseek ha tomado el mercado por asalto al hacer más con menos”, dijo Giuseppe Sette, presidente de la firma de investigación de mercado de IA Reflexividad, en un correo electrónico. “Esto muestra que con IA las sorpresas seguirán llegando en los próximos años”.

La última aplicación de Deepseek se produce pocos días después de que Trump anunció un nueva empresa de $ 500 mil millones Con el fabricante de chatgpt OpenAi, SoftBank y Oracle, denominado Stargate, que promocionó para garantizar “el futuro de la tecnología” en los Estados Unidos

Las acciones relacionadas con la IA recibieron un golpe el lunes por la mañana, con las acciones de Nvidia que cayeron un 17% a las 2:08 pm, hora del este, mientras que ASML arrojó un 7,6%. El índice NASDAQ pesado tecnológico cayó un 3,5%, o 698 puntos, en el comercio de la tarde, mientras que el S&P 500 disminuyó 1.7%. El promedio industrial Dow Jones Blue-chip agregó 0.4%.

A pesar de la fuerte caída en el Nasdaq, está lejos del peor día para el índice durante los últimos cinco años. La peor disminución de un día desde el 27 de enero de 2020 llegó el 16 de marzo de 2020, cuando el índice cayó más del 12% cuando Covid-19 Pandemic golpeó la economía.

¿Qué es Deepseek?

Deepseek es una compañía china privada fundada en julio de 2023 por Liang Wenfeng, un graduado de la Universidad de Zhejiang, una de las principales universidades de China, que financió la startup a través de su fondo de cobertura, según el MIT Technology Review. Liang tiene alrededor de $ 8 mil millones en activos, escribió Ives en una nota de investigación del 27 de enero.

Liang, quien previamente se había centrado en aplicar IA a invertir, había comprado un “stock de chips A100 Nvidia”, un tipo de tecnología que ahora está prohibida por la exportación a China. Esos chips se convirtieron en la base de Deepseek, informó la publicación del MIT.

Ben Reitzes, jefe de investigación de tecnología en Melius, dijo a los inversores en una nota que Deepseek hace avances legítimos como una herramienta de IA, que incluye un mejor aprendizaje y un uso más eficiente de la memoria, aunque expresó escepticismo sobre la “cantidad de chips utilizados”.

¿Deepseek está disponible en los Estados Unidos?

La aplicación AI de la compañía está disponible en la App Store de Apple, así como en línea en su sitio web. El servicio es gratuito y hasta el lunes por la mañana fue la mejor descarga en la tienda de Apple, aunque algunas personas tenían problemas para suscribirse a la aplicación.

En su sitio chino, Deepseek culpó a “ataques maliciosos a gran escala” en su servicio, lo que requiere que limite temporalmente nuevos registros. “Los usuarios existentes pueden iniciar sesión como de costumbre”, dijo la compañía en la publicación, que fue fechada poco después de la medianoche el 28 de enero en la hora local de China.


Nueva aplicación de IA china Deepseek impactando los precios de las acciones de las compañías tecnológicas del área de la bahía

04:16

La compañía lanzó su último modelo de IA el 20 de enero, lo que está causando que Wall Street reevalúe el sector de IA.

“La semana pasada, Deepseek lanzó un modelo que rivaliza con el chatgpt de OpenAI y el Llama 3.1 de Meta y fue el número 1 en la tienda de aplicaciones de Apple durante el fin de semana”, escribió Ives de Wedbush. “Deepseek construyó el modelo utilizando chips de capacidad reducida de NVIDIA. Lo cual es impresionante y, por lo tanto, ha causado una gran agita para las acciones tecnológicas estadounidenses con una presión masiva sobre NASDAQ esta mañana”.

¿En qué se diferencia Deepseek de otras aplicaciones de IA?

Deepseek es un modelo de lenguaje grande de código abierto que se basa en lo que se conoce como “informática de tiempo de inferencia”, que según Sette en los términos de Layman significa “Activan solo las partes más relevantes de su modelo para cada consulta, y que ahorra dinero y potencia de cálculo “.

Algunos expertos elogiaron la actuación de Deepseek, con el destacado inversionista tecnológico Marc Andreessen escribiendo en X el 24 de enero, “Deepseek R1 es uno de los avances más sorprendentes e impresionantes que he visto, y como código abierto, un regalo profundo para el mundo. “

Sin embargo, Ives dijo que es escéptico de que el servicio ganará terreno con las principales empresas estadounidenses.

“No US Global 2000 usará una startup china Deepseek para lanzar su infraestructura de IA y casos de uso”, escribió Ives. “Al final del día, solo hay una compañía de chips en el mundo que lanza casos autónomos, robóticos y de uso de IA más amplios y eso es Nvidia”.

¿Qué significa Deepseek para Nvidia y otras compañías tecnológicas?

Wall Street está tratando de evaluar el impacto a largo plazo de una herramienta de IA de bajo costo de China que rivaliza con ChatGPT y otras llamadas aplicaciones generativas de IA. También plantea preguntas sobre si Silicon Valley está gastando demasiado en los avances tecnológicos en el sector de IA, señaló Angelo Zino, analista senior de renta variable de CFRA Research, en un correo electrónico.

“El hecho de que se supone que esta tecnología requiere menos energía y es más rentable que los modelos con sede en EE. UU. Hace que los inversores de tecnología estadounidenses sean muy preocupados”, dijo Jay Woods, estratega global de Freedom Capital Markets.

Tampoco está claro qué tipo de retroceso o reacción podría provenir de la Casa Blanca, dado que Trump ha elevado la posibilidad de imponer nuevos aranceles a las importaciones chinas, aunque también le dio un aplazamiento de Tiktok de propiedad china al ordenar al Departamento de Justicia. no hacer cumplir Una prohibición inminente.


Cómo el proyecto AI de Trump afectará a los estadounidenses

05:32

Mientras tanto, las principales compañías tecnológicas, incluidas Meta y Microsoft, están programadas para informar las ganancias esta semana, donde los inversores probablemente escucharán más de sus ejecutivos sobre sus planes de IA y sus pensamientos sobre Deepseek, dijeron los expertos.

Algunos analistas de Wall Street piensan que la venta de acciones del lunes es una reacción exagerada, y señala que la enorme demanda de IA continuará levantando jugadores clave en el sector.

“Una cosa es entrenar un [large language] El modelo por menos dinero, pero acomodar la gran demanda de consumo de toda esta tecnología de IA todavía requerirá grandes cantidades de infraestructura “, dijo Adam Crisafulli de Vitalknowledge en un informe.

Continue Reading

Noticias

¿Qué es Deepseek, el nuevo rival chino de Openai?

Published

on

Un nuevo modelo de IA chino, creado por la startup con sede en Hangzhou, Deepseek, ha sorprendido a la industria de la IA estadounidense al superar a algunos de los principales modelos de OpenAi, desplazando a Chatgpt en la parte superior de la tienda de aplicaciones de iOS y usurpando a Meta como el principal proveedor de SOM llamadas herramientas de IA de código abierto. Todo lo cual ha planteado una pregunta crítica: a pesar de las sanciones estadounidenses a la capacidad de Beijing para acceder a semiconductores avanzados, ¿se está poniendo al día con los Estados Unidos en la carrera global de IA?

A un supuesto costo de solo $ 6 millones para entrenar, el nuevo modelo R1 de Deepseek, lanzado la semana pasada, pudo igualar el rendimiento de varias métricas de matemáticas y razonamiento del modelo O1 de OpenAi: el resultado de decenas de miles de millones de dólares en inversión por OpenAI y Su patrón Microsoft.

El modelo chino también es más barato para los usuarios. El acceso a sus versiones más poderosas cuesta un 95% menos que Operai y sus competidores. El resultado: la industria de la tecnología de los Estados Unidos se enfrenta repentinamente a un retador potencialmente más barato y más poderoso, inversores desconcertantes, que vendieron acciones tecnológicas estadounidenses el lunes por la mañana.

Sin embargo, no todos están convencidos. Algunos investigadores estadounidenses de IA han puesto en duda las afirmaciones de Deepseek sobre cuánto gastó y cuántos chips avanzados implementó para crear su modelo.

Pocos, sin embargo, disputan las impresionantes capacidades de Deepseek. “Deepseek R1 es el momento Sputnik de AI”, escribió el destacado capitalista de riesgo estadounidense Marc Andreessen en X, refiriéndose al momento en la Guerra Fría cuando la Unión Soviética logró poner un satélite en órbita por delante de los Estados Unidos.

Entonces, ¿qué es Deepseek y qué podría significar para la supremacía tecnológica estadounidense?

¿Qué es Deepseek?

Deepseek fue fundado hace menos de dos años por el Fondo de cobertura chino High Flyer como un laboratorio de investigación dedicado a perseguir la inteligencia general artificial, o AGI. Una serie de lanzamientos de código abierto a fines de 2024 colocó la startup en el mapa, incluido el modelo de lenguaje grande “V3”, que superó a todos los LLM de código abierto de Meta y rivalizó con el GPT4-O de código cerrado de OpenAi.

Según los informes, Liang Wenfeng, el CEO, dijo que había contratado jóvenes investigadores de informática con un lanzamiento para “resolver las preguntas más difíciles del mundo”, críticamente, sin apuntar a las ganancias. eficiente que los lanzamientos de 2024 de Deepseek provocaron una guerra de precios dentro de la industria china de IA, lo que obligó a los competidores a reducir los precios.

Este año, esa guerra de precios parece llegar a través del Océano Pacífico.

Sin embargo, la IA de Deepseek se ve diferente de sus competidores estadounidenses de una manera importante. A pesar de su alto rendimiento en las pruebas de razonamiento, los modelos de Deepseek están limitados por las políticas restrictivas de China con respecto a las críticas al gobernante Partido Comunista Chino (PCCh). Deepseek R1 se niega a responder preguntas sobre la masacre en la Plaza Tiananmen, Beijing, en 1989, por ejemplo. “Lo siento, eso está más allá de mi alcance actual. Hablemos de otra cosa ”, dijo el modelo cuando se considera el tiempo.

¿Qué podría significar el éxito de Deepseek para los gigantes tecnológicos estadounidenses?

En un momento en que Google, Meta, Microsoft, Amazon y docenas de sus competidores se preparan para gastar más decenas de miles de millones de dólares en una nueva infraestructura de IA, el éxito de Deepseek ha planteado una pregunta preocupante: ¿podrían coincidir las empresas tecnológicas chinas potencialmente, o incluso superar, ¿Su destreza técnica mientras gastaba significativamente menos?

Meta, que planea gastar $ 65 mil millones en infraestructura de IA este año, ya ha establecido cuatro “salas de guerra” para analizar los modelos de Deepseek, buscando averiguar cómo la empresa china había logrado capacitar a un modelo tan barato y usar las ideas para mejorar Sus propios modelos de Llama de código abierto, sitio de noticias tecnológicas, la información informó durante el fin de semana.

En los mercados financieros, el precio de las acciones de Nvidia cayó más del 15% el lunes por la mañana por temor a que se necesitaran menos chips de IA para capacitar a una IA poderosa de lo que se pensaba anteriormente. Otras acciones tecnológicas estadounidenses también se cotizaban más bajo.

“Mientras [DeepSeek R1] Es una buena noticia para los usuarios y la economía global, son malas noticias para las acciones tecnológicas estadounidenses ”, dice Luca Paolini, estratega jefe de Pictet Asset Management. “Puede resultar en una reducción nominal de la inversión de capital en IA y presión sobre los márgenes, en un momento en que las expectativas de valoración y crecimiento están muy estiradas”.

Pero la tecnología estadounidense no ha perdido, al menos todavía no.

Por ahora, el modelo “O1 Pro” de Openai todavía se considera el más avanzado del mundo. Sin embargo, el rendimiento de Deepseek R1 sugiere que China está mucho más cerca de la frontera de la IA de lo que se pensaba anteriormente, y que los modelos de código abierto han alcanzado sus homólogos de código cerrado.

Quizás aún más preocupante para compañías como OpenAi y Google, cuyos modelos son de código cerrado, es cuánto, o más bien, cuán poco, DePseek está cobrando a los consumidores a acceder a sus modelos más avanzados. Openai cobra $ 60 por millón de “tokens”, o segmentos de palabras, generados por su modelo más avanzado, O1. Por el contrario, Deepseek cobra $ 2.19 por el mismo número de tokens de R1, casi 30 veces menos.

“Eroja la base industrial, erosiona el margen, erosiona el incentivo para una mayor inversión de capital en Western [AI] escala de fuentes privadas “, dice Edouard Harris, director de tecnología de Gladstone AI, una firma de IA que trabaja en estrecha colaboración con el gobierno de los Estados Unidos.

… ¿Pero Deepseek es transparente?

El éxito de Deepseek fue aún más explosivo porque parecía cuestionar la efectividad de la estrategia del gobierno de los Estados Unidos para restringir el ecosistema de IA de China restringiendo la exportación de fichas poderosas o GPU, a Beijing. Si las afirmaciones de Deepseek son precisas, significa que China tiene la capacidad de crear modelos de IA poderosos a pesar de esas restricciones, subrayando los límites de la estrategia de los Estados Unidos.

Deepseek ha afirmado que está limitado por el acceso a chips, no en efectivo o talento, diciendo que entrenó a sus modelos V3 y R1 utilizando solo 2,000 chips Nvidia de segundo nivel. “El dinero nunca ha sido el problema para nosotros”, dijo el CEO de Deepseek, Liang Wenfeng, en 2024. “Las prohibiciones de los envíos de chips avanzados son el problema”. (La política actual de EE. UU. Hace que sea ilegal exportar a China los tipos más avanzados de chips de IA, los gustos de los cuales pueblan centros de datos de EE. UU. Utilizados por OpenAi y Microsoft).

¿Pero son ciertas esas afirmaciones? “Entiendo que Deepseek tiene 50,000 H100”, dijo recientemente el CEO de Scale AI, Alexandr Wang, a CNBC en Davos, refiriéndose a los chips de GPU de NVIDIA mejor potenciados actualmente en el mercado. “No pueden hablar de [them]porque está en contra de los controles de exportación lo que Estados Unidos ha establecido “. (Un grupo H100 de ese tamaño costaría en la región de miles de millones de dólares).

En una señal de cuán en serio, el PCCh está tomando la tecnología, Liang, el CEO de Deepseek, se reunió con el primer ministro de China, Li Qiang en Beijing, el lunes pasado. En esa reunión, Según los informes, Liang le dijo a Li que Deepseek necesita más chips. “Deepseek solo tiene acceso a unos pocos miles de GPU, y sin embargo, están logrando esto”, dice Jeremie Harris, CEO de Gladstone AI. “Entonces, esto plantea la pregunta obvia: ¿qué sucede cuando obtienen una asignación del Partido Comunista Chino para proceder a toda velocidad?”

A pesar de que China podría haber logrado un nivel sorprendente de capacidad de IA con menos chips, los expertos dicen que más potencia informática siempre seguirá siendo una ventaja estratégica. En ese frente, Estados Unidos sigue muy por delante. “Nunca es malo tener más”, dice Dean Ball, investigador de la Universidad George Mason. “No importa cuánto tengas de él, siempre lo usarás”.

¿Dónde deja esto la rivalidad tecnológica de Estados Unidos con China?

La respuesta corta: desde la perspectiva de Washington, en aguas inciertas.

En los días finales de la administración Biden, el asesor de seguridad nacional saliente Jake Sullivan advirtió que la velocidad del avance de la IA era “lo más importante que sucedió en el mundo en este momento”. Y pocos días después de su nuevo trabajo, el presidente Trump anunció una nueva empresa de $ 500 mil millones, respaldada por Operai y otros, para construir la infraestructura vital para la creación de “inteligencia general artificial”, el próximo salto hacia adelante en la IA, con sistemas lo suficientemente avanzados para Haga nuevos avances científicos y razones de manera que hasta ahora se haya mantenido en el ámbito de la ciencia ficción.

Leer más: Qué saber sobre ‘Stargate’, la nueva empresa de Openai anunciada por el presidente Trump

Y aunque quedan preguntas sobre el futuro de las restricciones de Chips en China, las prioridades de Washington eran evidentes en la orden ejecutiva de IA del presidente Trump, también firmada durante su primera semana en el cargo, lo que declaró que “es la política de los Estados Unidos sostener y mejorar El dominio global de IA de Estados Unidos para promover el florecimiento humano, la competitividad económica y la seguridad nacional “.

Mantener este dominio significará, al menos en parte, comprender exactamente lo que están haciendo las empresas tecnológicas chinas, así como protegerse de la propiedad intelectual de los Estados Unidos, dicen los expertos.

“Existe una buena posibilidad de que Deepseek y muchas de las otras grandes compañías chinas estén siendo apoyadas por el [Chinese] Gobierno, de manera más que una forma monetaria “, dice Edouard Harris de Gladstone Ai, quien también recomendó que las compañías de IA de EE. UU. Enduden sus medidas de seguridad.

¿A dónde va la IA desde aquí?

Desde diciembre, los nuevos modelos O1 y O3 de Openai han roto discos en las pruebas de razonamiento avanzado diseñadas para ser difíciles para los modelos de IA.

Leer más: Los modelos de IA se están volviendo más inteligentes. Las nuevas pruebas están corriendo para ponerse al día

Deepseek R1 hace algo similar, y en el proceso ejemplifica lo que muchos investigadores dicen que es un cambio de paradigma: en lugar de escalar la cantidad de potencia informática utilizada tren El modelo, los investigadores escalan la cantidad de tiempo (y, por lo tanto, calculan la energía y la electricidad) que el modelo usa para pensar en una respuesta a una consulta antes de responder. Es esta escala de lo que los investigadores llaman “computa de tiempo de prueba” la que distingue la nueva clase de “modelos de razonamiento”, como Deepseek R1 y Openi’s O1, de sus predecesores menos sofisticados. Muchos investigadores de IA creen que queda mucho espacio para la cabeza antes de que este paradigma alcance su límite.

Algunos investigadores de IA elogiaron el R1 de Deepseek como un avance en el mismo nivel que Alphazero de Deepmind, un modelo de 2017 que se volvió sobrehumano en el ajedrez de los juegos de mesa y pasó simplemente jugando contra sí mismo y mejorando, en lugar de observar cualquier juego humano.

Esto se debe a que R1 no estaba “previamente” en los datos marcados con humanos de la misma manera que otros LLM principales.

En cambio, los investigadores de Deepseek encontraron una manera de permitir que el modelo arrancara sus propias capacidades de razonamiento esencialmente desde cero.

“En lugar de enseñar explícitamente al modelo sobre cómo resolver un problema, simplemente le proporcionamos los incentivos correctos y desarrolla de forma autónoma estrategias avanzadas de resolución de problemas”, afirman.

El hallazgo es significativo porque sugiere que las capacidades de IA poderosas podrían surgir más rápidamente y con menos esfuerzo humano de lo que se pensaba, con solo la aplicación de más potencia informática. “Deepseek R1 es como GPT-1 de este paradigma de escala”, dice Ball.

En última instancia, el reciente progreso de la IA de China, en lugar de usurpar la fuerza de los Estados Unidos, podría ser el comienzo de un reordenamiento: un paso, en otras palabras, hacia un futuro donde, en lugar de un poder hegemónico, hay muchos centros competidores de poder de IA.

“China aún tendrá su propia superinteligencia (s) no más de un año después de los Estados Unidos, ausente [for example] Una guerra “, escribió Miles Brundage, un ex empleado de políticas de Operai, en X.” Entonces, a menos que desee una guerra (literal), debe tener una visión para navegar por los resultados de IA multipolar “.

Continue Reading

Trending