“Todo lo que sé es que estoy bien para mis 80 mil millones de dólares.”
Noticias
El Proyecto Stargate de OpenAI provoca reacciones de los directores ejecutivos de Microsoft y Meta
Pocas veces una frase capta tan perfectamente el estado del momento. Aquí tienes al CEO de Microsoft. Nadella Satya diciendo que “no está en los detalles” sobre Stargate, el proyecto de infraestructura de IA supuestamente multimillonario impulsado por su importante inversión, OpenAI.
El hecho de que Nadella no haya leído los detalles nebulosos de Stargate dice mucho sobre cuánto se han distanciado Microsoft y OpenAI. Microsoft se menciona en el comunicado de prensa de Stargate ya que los modelos de OpenAI siguen siendo exclusivos de Azure. Pero el aspecto más sorprendente de Stargate no es que aún no haya dinero para ello; es que el mayor patrocinador de OpenAI ha decidido no participar en lo que Sam Altman lo llama “el proyecto más importante de esta era”. Como dejó claro Nadella en CNBC esta semana, está ejecutando su propia construcción de infraestructura de IA por valor de 80 mil millones de dólares y, en el futuro, OpenAI puede obtener computación adicional, con su bendición, en otros lugares.
Si bien recibió menos titulares esta semana, encontré la respuesta de Nadella a Elon Musk en X aún más esclarecedor. En su respuesta a las palabras de Musk: “por otro lado, Satya definitivamente tiene el dinero”, Nadella respondió: “😂 ¡Y todo este dinero no se trata de promocionar la IA, sino de construir cosas útiles para el mundo real!”.
Esa publicación sólo puede interpretarse como una indirecta a Altman. Nadella podría haber financiado Stargate para OpenAI. No lo hizo. ¿Qué sabe él que el resto de nosotros no sabemos?
La llamativa presentación de Stargate en la Casa Blanca ciertamente logró su objetivo, que claramente era lograr que todos hablaran de grandes números. Los titulares que generó provocaron Mark Zuckerberg para asegurarnos de que todos terminaran la semana sabiendo su el centro de datos será parejo más grande que Stargate.
En una publicación del viernes en su página de Facebook, Zuckerberg dijo que el centro de datos de 2 GW planeado por Meta en Luisiana “es tan grande que cubriría una parte importante de Manhattan”, con una vista de mapa de los metros cuadrados superpuestos a la ciudad para enviar el punto a casa. .
De su publicación (mi énfasis es nuestro): “Poneremos en línea ~1GW de computación en el 25 y terminaremos el año con más de 1,3 millones de GPU. Estamos planeando invertir entre 60.000 y 65.000 millones de dólares en gastos de capital este año y, al mismo tiempo, aumentar significativamente nuestros equipos de IA. tenemos la capital seguir invirtiendo en los años venideros”.
No tengo ninguna duda de que Altman, Masayoshi hijoy Larry Ellison podrán recaudar los miles de millones que necesitan para disminuir la dependencia de OpenAI de Microsoft para la computación. (El gobierno de EE. UU. no está dando dinero a Stargate, lo que hace que la apariencia de anunciarlo junto con Trump sea aún más extraña). En última instancia, todo esto apunta al tema que rápidamente definirá 2025: las grandes empresas tecnológicas ven la IA como la tecnología más tecnología existencial de la era venidera y seguirá gastando muchísimo para asegurarse de que OpenAI no se salga con la suya por completo.
AMA con spez
Pocas empresas tuvieron un 2024 tan bueno como Reddit. Desde que salió a bolsa en marzo pasado, las acciones de la compañía se han disparado un 300 por ciento, dando a la red social una valoración de 32 mil millones de dólares.
Es un cambio radical con respecto a Reddit antes de salir a bolsa, cuando sus moderadores estaban furiosos contra sus apresurados cambios de plataforma y hubo una reacción violenta por la venta de datos de la compañía a Google y OpenAI.
Con esas controversias ahora aparentemente en el espejo retrovisor, Reddit se centra en hacer crecer su base de usuarios, mantenerse rentable y utilizar la inteligencia artificial para ayudar a las personas a buscar en su sitio más fácilmente. Me reuní con el director ejecutivo Steve Huffman en CES hace unas semanas para escuchar sus prioridades para 2025, cómo lidera Reddit, su opinión sobre el debate sobre la escala de la IA, la moderación de contenido y más…
La siguiente entrevista ha sido editada para mayor extensión y claridad:
A su IPO le fue muy bien. ¿Cómo han sido para usted personalmente los últimos nueve meses?
En Reddit tenemos un dicho que dice que buenos números hacen buenas reuniones. Así que hemos tenido algunas buenas reuniones.
La preparación para salir a bolsa fue intensa. Es contar la historia una y otra vez, lo cual disfruto hacer, pero requiere mucho trabajo. Creo que, más que la mayoría de las empresas nuevas, ya estamos en el ritmo de las empresas públicas: cerrar el trimestre, hacer las auditorías, realizar la reunión de la junta directiva, las ganancias y todo eso. Entonces no ha sido un cambio importante para nosotros desde el punto de vista operativo.
Es un momento realmente emocionante para los nuevos inversores y empleados. No nos pillarás quejándonos. Lo que sigo diciéndole a la empresa es que todos deberían estar muy orgullosos del trabajo que han realizado y no dar por sentado estos momentos. Sólo les digo, miren, disfruten la vista. Si miras nuestra historia, hay muchos altibajos. Sin duda hay desafíos en nuestro futuro.
Con su capitalización de mercado donde se encuentra ahora, ¿está pensando en hacer cambios que no pensó que podría hacer hace un año?
Hay dos clases de cosas que haríamos. Una es ejecutar la estrategia central. Tenemos que contratar. Tenemos que construir. Creo que somos muy razonables en términos del tamaño de nuestra inversión. La estrategia de una frase para nosotros es hacer crecer el producto y seguir siendo rentable.
¿Qué se puede hacer con un precio de acción alto? Tal vez pueda considerar fusiones y adquisiciones que de otro modo no haría. Yo diría que esa no es realmente nuestra orientación en este momento porque las adquisiciones que hemos realizado en los últimos dos años han sido acuerdos de entre 25 y 50 millones de dólares. Es un punto ideal para nosotros conseguir tecnología y equipos. Yo diría que siempre estamos observando el mercado, pero no estamos persiguiendo nada grande o loco en este momento porque me gusta la estrategia central. Creo que podemos hacer lo que queremos dentro de nuestras capacidades actuales.
¿Cuál es el principal producto centrado en Reddit este año?
El primero es el núcleo de Reddit, que son las conversaciones comunitarias. Todo el mundo tiene un hogar en Reddit, pero ¿ves ese hogar en tu primera sesión? Hay otra dimensión completamente diferente en nuestro trabajo, que es Reddit como fuente de información. Reddit tiene toda esta increíble información. Para los usuarios que tienen una pregunta que necesita una respuesta, ¿podemos darles esa respuesta? Acabamos de empezar a probar Reddit Answers. Esto me resulta muy útil para búsquedas sobre eventos actuales. Dentro de un año, será un producto de monetización. Es uno de los pocos productos que elimina cada picazón, por lo que será un gran foco de atención.
¿Qué opinas de este debate sobre si la industria de la IA se ha quedado sin datos?
Creo que tendríamos una respuesta diferente a esa pregunta literalmente cada mes. Queremos tener buenas relaciones con otras personas en este espacio. Estamos abiertos al público.
Al mismo tiempo, queremos maximizar el valor que obtenemos de nuestros propios datos. No hemos experimentado ningún conflicto entre los dos en este momento. me encanta el [data licensing] relaciones que tenemos, las principales son Google y OpenAI. En este punto, no necesitamos hacer ninguna asociación en particular. Yo diría que es bueno tenerlos todos, pero nada es existencial para nosotros.
Uno de los desafíos es que las empresas de inteligencia artificial no saben qué producto están creando. No es nada malo. Se están iterando a sí mismos. El propio ChatGPT, el producto central de esta conversación, fue una demostración. Luego, un año después, es la pieza de tecnología empresarial más importante del mundo con una economía cuestionable. Eso lo hace muy emocionante. No creo que ninguna de estas empresas se ofenda al escucharme decir eso.
Fuiste uno de los primeros directores ejecutivos de redes sociales que vi muy crítico con TikTok. ¿Cómo afecta a Reddit una prohibición estadounidense?
Si observa el gráfico de tráfico de Reddit durante los últimos 19 años, no verá el ascenso ni la caída de ninguna plataforma en particular. Creo que todos los tipos de contenido deberían funcionar en Reddit. El vídeo en Reddit es en gran medida una cámara de salida (lo que estoy viendo) en lugar de una cámara de entrada, o ¿quién soy yo? Eso son las redes sociales. Creo que la prohibición es lo correcto por las razones que he mencionado y que, sinceramente, no tienen nada que ver con la competencia.
Con los cambios de moderación de Meta, la conversación más amplia en torno a las redes sociales parece estar cambiando en este momento.
Durante los últimos 10 años, la gente ha estado hablando sobre si el habla es el problema, lo cual es una idea descabellada. No se puede tener libertad sin expresión. Creo que ese desvío a través del cuestionamiento y relitigio de los valores fundamentales de Estados Unidos, ojalá esa era esté llegando a su fin.
¿La gente está jugando a la política? Por supuesto, la gente siempre lo es. En cuanto al tema de la moderación, siempre intentamos hacer las cosas de la manera correcta, que, no por casualidad, esté alineada con los valores estadounidenses. Es una plataforma demócrata. Creemos mucho en el poder de las personas y en la sabiduría de las multitudes y los procesos de votación. Eso es Reddit. Así que me alegra ver un regreso a donde hemos estado la mayor parte de mi vida, que es un aprecio por la libertad de expresión.
En otra parte
- Los competidores se lanzan a TikTok: Dado que TikTok ya no está disponible en las tiendas de aplicaciones de EE. UU. y su funcionalidad dentro de la aplicación está técnicamente limitada, todos están haciendo todo lo posible para aprovechar la situación. Meta anunció previamente a su competidor Capcut y está tratando de atraer a los creadores con dinero en efectivo. Substack, Bluesky y X están tomando medidas para fomentar un mayor consumo de vídeos. Mientras tanto, el presidente Trump dice que está de acuerdo con Elon Musk o Larry Ellison comprándolo. ByteDance dice que quiere llegar a un acuerdo, pero parece cada vez más arrinconado. Ellison puede tener la garantía de que Oracle no será multado por violar la ley en este momento, pero Apple y Google han demostrado que van a seguir la ley al pie de la letra. Dado que TikTok aún no está disponible para descargar en los EE. UU., su amenaza competitiva para Meta, YouTube y otros disminuye cada día.
- Trump se pone a trabajar para las grandes tecnológicas: ¿Por qué Zuckerberg y otros directores ejecutivos se arrodillan? No hay que mirar más allá de los comentarios que hizo el presidente en el Foro Económico Mundial esta semana, donde criticó las Leyes de Servicios y Mercados Digitales de la UE como una forma de “impuestos”. Este tipo de retroceso es exactamente por lo que Meta y otras empresas estadounidenses han estado orando. Veremos si les funciona.
- Más titulares: OpenAI lanzó su agente de IA llamado “Operador” para suscriptores de nivel profesional… Musk dijo a los empleados de X que “el crecimiento de usuarios está estancado, los ingresos no son impresionantes y apenas estamos alcanzando el punto de equilibrio”…. Apple se reorganizó nuevamente mientras busca ponerse al día en IA… Google está invirtiendo otros mil millones de dólares en Google Cloud a través de Anthropic y adquirió parte del equipo Vive de HTC para reforzar sus esfuerzos con Android XR (sí, prepárense para el regreso de Glass)… Epic Games dio una actualización sobre su impulso para competir con Roblox… Meta hizo una inversión excepcional en Databricks.
Más enlaces
- ¿Qué llevó a que DOGE se peleara entre Vivek Ramaswamy y Elon Musk.
- Un perfil de DeepSeek, la empresa china que tiene a varios directores ejecutivos preocupados por cuánto gastan en modelos.
- Dan Shipper’s Experiencia práctica en el uso del agente operador de OpenAI.
- El conjunto de datos de IA del “Último examen de la humanidad”.
- Brian Armstrong conclusiones de Davos.
- Un denunciante afirma que el acuerdo de 400 millones de dólares de Amazon por la mayor parte de Covariant AI fue una “adquisición inversa” diseñada para evitar el escrutinio antimonopolio.
- Nvidia es la principal empresa de tecnología en la última lista de Glassdoor de los mejores lugares para trabajar.
- El auge del podcast MAGA-bro.
Si aún no lo has hecho, no olvides suscribirte a El bordeque incluye acceso ilimitado a Línea de comandotodos nuestros informes y una experiencia publicitaria mejorada en la web.
Como siempre, quiero saber de usted, especialmente si su centro de datos está incluso grander. Responda aquí y me comunicaré con usted o envíeme un ping de forma segura en Signal.
Noticias
Deepseek: ¿La mejor alternativa de chatgpt o un semillero de reclamos dudosos?
Aparentemente, Internet tiene una nueva IA favorita, y no es el último modelo de ChatGPT de la industria intocable OpenAi.
Alzando a la cima de la App Store de Apple, la inteligencia artificial china Chatbot Deepseek se ha convertido en la aplicación gratuita mejor calificada para la productividad después de un terreno de popularidad después del lanzamiento del modelo de “razonamiento” de Deepseek-R1 el 20 de enero, superando el chatgpt de OpenAi en el proceso.
Más allá de las tablas de clasificación de App Store, las afirmaciones que rodean el desarrollo y las capacidades de Deepseek pueden ser aún más impresionantes. La compañía detrás del LLM (modelo de lenguaje grande) afirma que cuesta menos de $ 6 millones capacitar a su modelo Deepseek-V3 y usó hardware limitado en comparación con sus contemporáneos estadounidenses al tiempo que logró resultados similares.
Sin embargo, si bien Deepseek está demostrando ser popular entre los usuarios y desarrolladores por igual, principalmente gracias a sus precios de API favorables, todo lo que brilla no es oro cuando se trata de esta aplicación, y un aire de controversia socava un lanzamiento exitoso de dos IA altamente capaces modelos.
Deepseek: ¿Qué es Deepseek?
Deepseek fue fundado por Liang Wenfeng, un empresario chino y cofundador del fondo de cobertura de alto vuelo con sede en Hangzhou, Zhejiang, China. Originalmente, Deepseek tenía la intención de ser un ala de investigación AGI (inteligencia general artificial) de High-Flyer, que ha utilizado exclusivamente la IA en los algoritmos de comercio desde 2021. Sin embargo, desde mayo de 2023, Deepseek se ha mantenido como su propia compañía, con alto-flyer convertirse en uno de sus principales inversores.
Deepseek LLM (modelo de lenguaje grande) de la compañía debutó en noviembre de 2023 como el codificador Deepseek de código abierto y fue seguido por Deepseek-V2 en mayo de 2024. Popularidad, con sus aplicaciones móviles acumulando más de 1.6 millones de descargas.
Si bien el Deepseek LLM es principalmente similar a otros chatbots populares como Google Gemini o ChatGPT, los modelos de uso gratuito de la aplicación están demostrando ser populares entre los usuarios, y sus precios de API amigables con el desarrollador lo están empujando a la vanguardia de la discusión.
Deepseek: ¿Por qué es importante?
El antiguo mito dice que durante la carrera espacial de la década de 1960, la NASA gastó millones en dólares de los contribuyentes en desarrollar una pluma espacial después de darse cuenta de que las alternativas de punto de pelota eran incapaces de escribir en el entorno del espacio de gravedad cero. Mientras tanto, sus contrapartes de cosmonaut evitaron tales costos y dolores de cabeza simplemente usando un lápiz.
Si bien nada de eso es cierto, es una parábola de ahorro y practicidad lo que lo convierte en una excelente historia.
Sin embargo, reflejando la leyenda de la pluma espacial, Deepseek aparentemente ha logrado lograr una hazaña similar en la rentabilidad y la practicidad a través del desarrollo de su modelo Deepseek-V3, que afirma haber entrenado por menos de $ 6 millones, una fracción, una fracción de los cientos de millones gastados por otras compañías que buscan resultados similares (al tiempo que logran niveles comparables de rendimiento).
No solo eso, sino que el reciente lanzamiento de Deepseek de su modelo de “razonamiento” Deepseek-R1 está diseñado para simular el pensamiento lógico sacrificando la velocidad de una respuesta por una respuesta más bien razonada. Puede lograr resultados iguales al modelo de “razonamiento” del “razonamiento” de OpenAi, incluso cuando la compañía afirma ser obstaculizada por las restricciones de exportación de los Estados Unidos en las GPU de NVIDIA más potentes.
Deepseek: ¿Cuánto cuesta?
Deepseek es gratuito en línea a través de su portal web o en dispositivos móviles (con aplicaciones de Android e iOS disponibles).
Sin embargo, el impacto que tendrá la emergencia de Deepseek en el costo de la IA para las empresas, los desarrolladores y más podría ser más innovador, con el modelo de precios API de la compañía que sale de la competencia fuera del agua.
Mientras que Operai actualmente cobra $ 15 por millón de tokens (una unidad de datos en las que se desgastan las indicaciones durante la generación de la respuesta de un modelo), Deepseek cuesta solo 55 centavos por millón .
Esta diferencia de costos podría cambiar el juego para muchos usuarios profesionales involucrados con la IA y representa un riesgo significativo para los ingresos potenciales de OpenAi, con Deepseek potencialmente ahora obligando a las manos de otras compañías a reducir sus precios para seguir siendo competitivos.
El impacto de Deepseek ya se siente en los mercados. Varios nombres de semiconductores están sintiendo el golpe, incluido Nvidia. Tras el lanzamiento de los últimos modelos de Deepseek el lunes, el comercio previo al mercado cayó un 13.8%, amenazando con eliminar casi $ 500 mil millones del límite de negociación de la compañía. Sin embargo, desde entonces ha regresado al 11%.
Deepseek: controversia
Si todo Deepseek tiene que ofrecer sonidos demasiado buenos para ser verdad, eso es potencialmente porque algunas de las afirmaciones de Deepseek pueden ser solo eso.
El rendimiento de los modelos V3 y R1 de Deepseek no se puede disputar. Aún así, quedan muchas preguntas sobre los precios reales de la compañía, su uso de hardware, el costo de su capacitación y el abastecimiento de sus datos de capacitación.
Este último ya ha sido objeto de cierta controversia. Varios usuarios informaron que Deepseek V3 se referiría a sí mismo como CHATGPT, lo que podría indicar que este modelo fue capacitado en conjuntos de datos públicos generados por el modelo GPT-4 de OpenAI.
Hablando con TechCrunchMike Cook, miembro de la investigación del King’s College London especializado en IA, respaldó estas afirmaciones, declarando: “Obviamente, el modelo está viendo respuestas crudas de ChatGPT”.
Cook destaca que esta puede no ser una acción intencional de Deepseek, pero también señala que la práctica de los modelos de entrenamiento en los datos generados por otros modelos puede ser “muy malo”, comparándola con “tomar una fotocopia de una fotocopia” en el sentido de que La calidad de las salidas se degradará cada vez.
También es posible que al adoptar datos de capacitación generados, Deepseek herede cualquiera de los mismos sesgos del modelo original, que se suma a los propios prejuicios del chatbot, que imponen una censura estricta por ley del Partido Anticomunista de Narraciones (CCP), que incluyen los Eventos del incidente de la Plaza Tiananmen de 1989, protestas de Hong Kong, la propiedad de Taiwán, el tratamiento de China del pueblo uigur o la ocupación del Tíbet.
Esta forma de censura solo degrada la confianza en la plataforma, y los lazos del fundador Liang Wenfeng con el PCCh solo aumentan las preocupaciones sobre cómo se pueden usar los datos del usuario o cómo las autoridades chinas podrían apropiar mal la plataforma en el futuro.
Escribir para Actualización biométricaAnthony Kimery, ex editor en jefe y cofundador de Seguridad nacionalY, destacó cómo la plataforma podría “apoyar las campañas de desinformación destinadas a desestabilizar las instituciones estadounidenses”.
Las afirmaciones de Deepseek de que desarrollaron sus modelos en hardware menos avanzado también se cuestionan. El analista de Citi Atif Malik afirma: “Si bien el logro de Deepseek podría ser innovador, cuestionamos la noción de que sus hazañas se hicieron sin el uso de GPU avanzadas para ajustarla y/o construir los LLM subyacentes. El modelo final se basa a través de la destilación técnica.”
El interrogatorio de Malik podría tener más peso, ya que, si bien Deepseek afirma que su modelo V3 fue entrenado utilizando las GPU de NVIDIA H800, una entrevista reciente con el fundador de Scale AI Alexandr Wang sobre CNBC Vio al CEO de la compañía sugerir “Deepseek tiene alrededor de cincuenta mil H100”.
Las mismas GPU que fueron bloqueadas de la exportación a China por la administración Biden en 2023, con Wang continuando, “no pueden hablar obviamente porque está en contra de los controles de exportación que [the] Estados Unidos se ha puesto en su lugar “.
Perspectiva
Deepseek es un éxito probado que le dará a compañías como OpenAI algo a considerar al retener su considerable base de usuarios frente a la dura competencia.
Sin embargo, queda por ver si el olor a automóvil nuevo aún permanece en los últimos modelos de Deekseek es enmascarar el olor de malla que rodea cómo desarrolló sus modelos y si sus precios son sostenibles a largo plazo a largo plazo.
Dada la reciente reacción de los Estados Unidos a Tiktok, es difícil imaginar que una compañía como Deepseek no sea un escrutinio grave por mucho más tiempo, especialmente porque sus modelos corren el riesgo de alterar el carrito de Apple en los planes del presidente Trump de mantener a Estados Unidos como la “capital mundial de AI.”
Noticias
¿Qué es Deepseek? Nuevos rivales de inteligencia artificial chino Chatgpt, OpenAi
Línea superior
Una nueva compañía de IA china llamada Deepseek disparó a la cima de las listas de aplicaciones y se sacudió las acciones de Global Tech el lunes después de que obtuvo calificaciones de alto rendimiento a la par con los principales rivales estadounidenses a pesar de que aparentemente carecen del acceso a los chips de vanguardia, impulsados por las afirmaciones de la compañía desarrolladas Sus modelos a una fracción del costo necesario para las plataformas estadounidenses.
Hechos clave
La startup de Deepseek tiene menos de dos años, fue fundada en 2023 por el empresario chino de 40 años Liang Wenfeng, y lanzó sus modelos de código abierto para descargar en los Estados Unidos a principios de enero, donde desde entonces ha aumentado al La parte superior de los gráficos de descarga de iPhone, superando la aplicación para el chatgpt de Openai.
El último producto de Deepseek, un modelo de razonamiento avanzado llamado R1, se ha comparado favorablemente con los mejores productos de Operai y Meta, al tiempo que parece ser más eficiente, con costos más bajos para entrenar y desarrollar modelos y posiblemente haberse hecho sin depender de la IA más poderosa. Aceleradores que son más difíciles de comprar en China debido a los controles de exportación de los Estados Unidos.
Los modelos R1 y V3 de la compañía se clasifican en el Top 10 en el chatbot Arena, una plataforma de rendimiento organizada por la Universidad de California, Berkeley, y la compañía dice que está obteniendo casi tan bien o superando modelos rivales en tareas matemáticas, conocimiento general y cuestión de preguntas y preguntas -y-y-respuesta de referencia de rendimiento.
Deepseek dijo que la capacitación de uno de sus últimos modelos costó $ 5.6 millones, lo que sería mucho menos que el director ejecutivo de $ 100 millones a $ 1 mil millones de una IA estimó que cuesta construir un modelo el año pasado, aunque el analista de Bernstein, Stacy Rasgon, luego llamó a las cifras de Deepseek muy engañosas.
A pesar de las preguntas que quedan sobre el verdadero costo y el proceso para construir los productos de Deepseek, todavía enviaron el mercado de valores a un pánico: Microsoft (menos de 3.7%a las 11:30 a.m. ET), Tesla (1.3%), Nvidia (15%) y Broadcom (16%) se resbaló el lunes después de una venta de una venta de una venta de SE VOLVER por el éxito de Deepseek, y el NASDAQ pesado por la tecnología disminuyó un 3,5% en el camino a su tercer día de los últimos dos años.
Obtenga alertas de mensajes de texto de Breaking News: Estamos lanzando alertas de mensajes de texto para que siempre sepa las historias más grandes que dan forma a los titulares del día. Envíe “alertas” de texto a (201) 335-0739 o registrarse aquí.
Cita crucial
“Deepseek R1 es el momento Sputnik de AI”, dijo el domingo el inversor multimillonario Marc Andressen.
Gran número
1.6 millones. Esa es cuántas veces se había descargado la aplicación Mobile Deepseek hasta el sábado, informó Bloomberg, la aplicación No. 1 en las tiendas de iPhone en Australia, Canadá, China, Singapur, Estados Unidos y el Reino Unido
¿Cómo uso Deepseek?
Deepseek es gratuito en Web, APP y API, pero requiere que los usuarios creen una cuenta.
¿Cómo se compara Deepseek con OpenAi y Chatgpt?
Deepseek-R1 es más similar al modelo O1 de OpenAI, que cuesta a los usuarios $ 200 por mes. Ambos son modelos de idiomas grandes con capacidades de razonamiento avanzado, diferentes de los chatbots de preguntas y respuestas de forma corta como el chatgtp de Openai. R1 y O1 se especializan en desglosar las solicitudes en una cadena de “pensamientos” lógicos y examinar cada uno individualmente. R1 ha logrado el rendimiento a la par con O1 en varios puntos de referencia y, según los informes, superó su rendimiento en la prueba Math-500. Chatbot Arena actualmente clasifica a R1 como empatado en el tercer mejor modelo de IA que existe, con O1 en cuarto lugar.
¿Es el código abierto Deepseek-R1?
Sí. Deepseek-R1 está disponible para que cualquiera pueda acceder, usar, estudiar, modificar y compartir, y no está restringido por licencias propietarias.
¿Quién posee Deepseek?
Deepseek opera de forma independiente, pero es financiado únicamente por High-Flyer, un fondo de cobertura de $ 8 mil millones también fundado por Wenfeng. La compañía lanzó su primer producto en noviembre de 2023, un modelo diseñado para la codificación de tareas, y sus lanzamientos posteriores, todos notables por sus bajos costos, obligaron a otros gigantes tecnológicos chinos a reducir sus precios del modelo de IA para seguir siendo competitivos. En una entrevista el año pasado, Wenfeng dijo que la compañía no tiene como objetivo obtener ganancias excesivas y precios de sus productos solo un poco por encima de sus costos.
¿Deepseek es realmente tan barato?
No todos están comprando las afirmaciones de que Deepseek hizo R1 con un presupuesto reducido y sin la ayuda de chips de IA de fabricación estadounidense. El CEO de Scale AI, Alexandr Wang, dijo a CNBC el jueves (sin evidencia) Deepseek construyó su producto utilizando aproximadamente 50,000 chips Nvidia H100 que no puede mencionar porque violaría los controles de exportación estadounidenses que prohíben la venta de tales chips a las empresas chinas. El multimillonario Elon Musk apoyó la teoría y dijo que era “obviamente” cierto en una publicación sobre X. Rasgon expresó pensamientos similares en una nota el lunes, escribiendo que Deepseek no cuantificaba los recursos que utilizaba para desarrollar el modelo R1 en sus informes y que “Las modelos se ven fantásticas … no creemos que sean milagros”. También dijo que la estimación de costos de $ 5 millones puede representar con precisión lo que Deepseek pagó para alquilar cierta infraestructura para capacitar a sus modelos, pero excluye la investigación anterior, experimentos, algoritmos, datos y costos asociados con la construcción de sus productos.
Que ver
Qué gran éxito Nvidia, el fabricante de chips de inteligencia artificial muy buscado, lleva el lunes. La compañía está rastreando hacia una pérdida del 11%, o $ 400 mil millones, que sería la mayor pérdida de valor de un solo día para cualquier empresa. Ese registro ya está en manos de Nvidia, que cayó casi un 10% en septiembre para perder $ 280 mil millones en valor de mercado.
Fondo clave
China y los Estados Unidos son los principales jugadores en la carrera armamentista de inteligencia artificial que parecía ser dirigida principalmente por las empresas estadounidenses OpenAi (respaldadas por Microsoft), Meta y Alphabet. La semana pasada, el presidente Donald Trump respaldó el plan de infraestructura Stargate de $ 500 mil millones de OpenAI para superar a sus compañeros y, al anunciar su apoyo, habló específicamente sobre la importancia del dominio estadounidense sobre China en el espacio de la IA. La inteligencia artificial está impulsada en gran medida por chips semiconductores de alta tecnología y de alto dólar que proporcionan la potencia de procesamiento necesaria para realizar cálculos complejos y manejar grandes cantidades de datos de manera eficiente. Y aunque no todos los fabricantes de chips semiconductores más grandes son estadounidenses, muchos, incluidos Nvidia, Intel y Broadcom, están diseñados en los Estados Unidos. En 2022, Estados Unidos comenzó a limitar las exportaciones de semiconductores a China en un intento de obstaculizar la capacidad del país para avanzar en la IA por solicitudes militares u otras amenazas de seguridad nacional.
Lectura adicional
Noticias
Esto es lo que debes saber
El lunes, la startup china de inteligencia artificial DeepSeek tomó el codiciado lugar de su rival OpenAI como la aplicación gratuita más descargada en los EE. UU. Manzana‘s App Store, destronando a ChatGPT para el asistente de inteligencia artificial de DeepSeek. Las acciones tecnológicas mundiales se vendieron y estaban en camino de eliminar miles de millones en capitalización de mercado.
Líderes tecnológicos, analistas, inversores y desarrolladores dicen que la exageración (y el consiguiente temor de quedarse atrás en el siempre cambiante ciclo exagerado de la IA) puede estar justificada. Especialmente en la era de la carrera armamentista generativa de la IA, donde tanto los gigantes tecnológicos como las nuevas empresas compiten para asegurarse de no quedarse atrás en un mercado que se prevé superará el billón de dólares en ingresos dentro de una década.
¿Qué es DeepSeek?
DeepSeek fue fundada en 2023 por Liang Wenfeng, cofundador de High-Flyer, un fondo de cobertura cuantitativo centrado en la IA. Según se informa, la startup de IA surgió de la unidad de investigación de IA del fondo de cobertura en abril de 2023 para centrarse en grandes modelos de lenguaje y alcanzar la inteligencia artificial general, o AGI, una rama de la IA que iguala o supera al intelecto humano en una amplia gama de tareas, que OpenAI y sus rivales dicen que lo están persiguiendo rápidamente. DeepSeek sigue siendo propiedad total de High-Flyer y financiado por ella, según analistas de Jefferies.
Los rumores en torno a DeepSeek comenzaron a cobrar fuerza a principios de este mes, cuando la startup lanzó R1, su modelo de razonamiento que rivaliza con el o1 de OpenAI. Es de código abierto, lo que significa que cualquier desarrollador de IA puede usarlo, y se ha disparado a la cima de las tiendas de aplicaciones y tablas de clasificación de la industria, y los usuarios elogian su rendimiento y capacidades de razonamiento.
Al igual que otros chatbots chinos, tiene sus limitaciones cuando se le pregunta sobre ciertos temas: cuando se le pregunta sobre algunas de las políticas del líder chino Xi Jinping, por ejemplo, DeepSeek supuestamente aleja al usuario de líneas de preguntas similares.
Otra parte clave de la discusión: el R1 de DeepSeek se construyó a pesar de que Estados Unidos limitó las exportaciones de chips a China tres veces en tres años. Las estimaciones difieren sobre cuánto cuesta exactamente el R1 de DeepSeek o cuántas GPU se incluyen en él. Los analistas de Jefferies estimaron que una versión reciente tenía un “coste de capacitación de sólo 5,6 millones de dólares (suponiendo un costo de alquiler de 2 dólares por hora y 800 horas). Eso es menos del 10% del costo de Meta‘s Llama.” Pero independientemente de las cifras específicas, los informes coinciden en que el modelo fue desarrollado a una fracción del costo de los modelos rivales por OpenAI, Anthropic, Google y otros.
Como resultado, el sector de la IA está inundado de preguntas, entre ellas si el creciente número de rondas de financiación astronómicas y valoraciones de miles de millones de dólares de la industria es necesaria, y si una burbuja está a punto de estallar.
Acciones de NVIDIA cayó un 11%, con el fabricante de chips ASML bajó más del 6%. El Nasdaq cayó más del 2% y cuatro gigantes tecnológicos… Meta, microsoft, Manzana y ASML están listos para informar sus ganancias esta semana.
Los analistas de Raymond James detallaron algunas de las preguntas que afectan a la industria de la IA este mes y escribieron: “¿Cuáles son las implicaciones para la inversión? ¿Qué dice sobre los modelos de código abierto versus los propietarios? ¿Invertir dinero en GPU es realmente una panacea? ¿Existen restricciones a las exportaciones de Estados Unidos? ¿Cuáles son las implicaciones más amplias de [DeepSeek]? Bueno, podrían ser espantosos o no ser un evento, pero tengan la seguridad de que la industria está llena de incredulidad y especulación”.
Los analistas de Bernstein escribieron en una nota el lunes que “según las muchas (ocasionalmente histéricas) tomas calientes que vimos [over the weekend,] las implicaciones van desde ‘Eso es realmente interesante’ hasta ‘Esta es la sentencia de muerte del complejo de infraestructura de IA tal como lo conocemos'”.
Cómo están respondiendo las empresas estadounidenses
Algunos directores ejecutivos de tecnología estadounidenses están luchando por responder antes de que los clientes cambien a ofertas potencialmente más baratas de DeepSeek, y se informa que Meta está iniciando cuatro “salas de guerra” relacionadas con DeepSeek dentro de su departamento de IA generativa.
microsoft El director ejecutivo Satya Nadella escribió en X que el fenómeno DeepSeek era solo un ejemplo de la paradoja de Jevons: “A medida que la IA se vuelva más eficiente y accesible, veremos cómo su uso se dispara, convirtiéndola en un bien del que simplemente no podemos tener suficiente”. “. El director ejecutivo de OpenAI, Sam Altman, tuiteó una cita que atribuyó a Napoleón y escribió: “Una revolución no se puede hacer ni detener. Lo único que se puede hacer es que uno de sus hijos le dé una dirección a fuerza de victorias”.
Yann LeCun, científico jefe de IA de Meta, escribió en LinkedIn que el éxito de DeepSeek es indicativo del cambio de rumbo en el sector de la IA para favorecer la tecnología de código abierto.
LeCun escribió que DeepSeek se ha beneficiado de parte de la tecnología propia de Meta, es decir, sus modelos Llama, y que la startup “ideó nuevas ideas y las construyó sobre el trabajo de otras personas. Debido a que su trabajo está publicado y es de código abierto, todos pueden sacar provecho de ello. Ese es el poder de la investigación abierta y del código abierto”.
Alexandr Wang, director ejecutivo de Scale AI, dijo a CNBC la semana pasada que el último modelo de IA de DeepSeek fue “revolucionario” y que su versión R1 es aún más poderosa.
“Lo que hemos descubierto es que DeepSeek… tiene el mejor rendimiento, o aproximadamente está a la par de los mejores modelos estadounidenses”, dijo Wang, añadiendo que la carrera de IA entre EE.UU. y China es una “guerra de IA”. La empresa de Wang proporciona datos de entrenamiento a actores clave de la IA, incluidos OpenAI, Google y Meta.
A principios de esta semana, el presidente Donald Trump anunció una empresa conjunta con OpenAI, Oracle y SoftBank para invertir miles de millones de dólares en infraestructura de IA en Estados Unidos. El proyecto, Stargate, fue presentado en la Casa Blanca por Trump, el director ejecutivo de SoftBank, Masayoshi Son, el cofundador de Oracle, Larry Ellison, y el director ejecutivo de OpenAI, Sam Altman. Los socios tecnológicos iniciales clave incluirán a Microsoft, Nvidia y Oracle, así como a la empresa de semiconductores Arm. Dijeron que invertirían 100.000 millones de dólares para empezar y hasta 500.000 millones de dólares en los próximos cuatro años.
IA evolucionando
La noticia de la destreza de DeepSeek también llega en medio del creciente revuelo en torno a los agentes de IA (modelos que van más allá de los chatbots para completar tareas complejas de varios pasos para un usuario) que tanto los gigantes tecnológicos como las nuevas empresas están persiguiendo. Meta, Google, Amazon, Microsoft, OpenAI y Anthropic han expresado su objetivo de crear IA agente.
Anthropic, la startup de IA respaldada por Amazon y fundada por ex ejecutivos de investigación de OpenAI, intensificó su desarrollo tecnológico durante el año pasado y, en octubre, la startup dijo que sus agentes de IA podían usar computadoras como humanos para completar tareas complejas. La capacidad de uso de computadoras de Anthropic permite que su tecnología interprete lo que hay en la pantalla de una computadora, seleccione botones, ingrese texto, navegue por sitios web y ejecute tareas a través de cualquier software y navegación por Internet en tiempo real, dijo la startup.
La herramienta puede “usar computadoras básicamente de la misma manera que nosotros”, dijo a CNBC Jared Kaplan, director científico de Anthropic, en una entrevista en ese momento. Dijo que puede realizar tareas con “decenas o incluso cientos de pasos”.
OpenAI lanzó una herramienta similar la semana pasada, introduciendo una función llamada Operador que automatizará tareas como planificar vacaciones, completar formularios, hacer reservas en restaurantes y pedir alimentos.
El microsoft-La startup respaldada lo describe como “un agente que puede ir a la web para realizar tareas por usted” y agregó que está capacitado para interactuar con “los botones, menús y campos de texto que la gente usa a diario” en la web. También puede hacer preguntas de seguimiento para personalizar aún más las tareas que realiza, como información de inicio de sesión para otros sitios web. Los usuarios pueden tomar el control de la pantalla en cualquier momento.
-
Startups8 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Recursos9 meses ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Recursos9 meses ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Recursos8 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Tutoriales9 meses ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups7 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Estudiar IA8 meses ago
Curso de Inteligencia Artificial de UC Berkeley estratégico para negocios
-
Noticias7 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo