Connect with us

Noticias

Deepseek vs. chatgpt: una comparación de características y accesibilidad

Published

on

A medida que la inteligencia artificial continúa evolucionando, los nuevos jugadores ingresan al mercado, cada uno trayendo sus propias contribuciones únicas al panorama de IA. Dos de los nombres más notables en este espacio son Veterano y Chatgpt. Si bien ambos sirven como herramientas poderosas, satisfacen diferentes necesidades y ofrecen funcionalidades variables. Si ha estado explorando herramientas con IA, es posible que haya encontrado Veterano Como competidor de la aplicación CHATGPT, especialmente porque no está disponible en el Tienda GPT. Esta publicación profundiza en una comparación integral entre Veterano y chatgpt, observando sus características, accesibilidad y diferencias clave.

¿Qué es Deepseek?

Veterano es una compañía de inteligencia artificial que ofrece un conjunto de herramientas con IA, incluidos modelos de idiomas grandes (LLM) y versiones especializadas como Deepseek Coder para tareas de programación. Se lanzó en 2023, con el objetivo de hacer que la IA sea más accesible para desarrolladores, empresas y usuarios individuales en todo el mundo.

Uno de los puntos de venta únicos de Veterano es que no es solo otro chatbot. Ofrece una variedad de soluciones, incluida la generación de códigos, la resolución de problemas técnicos y el procesamiento del lenguaje natural. Estos modelos son versátiles y sirven una variedad de casos de uso, desde análisis de datos hasta asistencia de investigación y desarrollo de software.

¿Cómo funciona Deepseek?

En su núcleo, Veterano Utiliza la arquitectura del transformador, la misma base que alimenta muchos sistemas de IA modernos. Pero lo que lo distingue es su diseño optimizado y enfoque para la capacitación.

Los modelos utilizados por Veterano están entrenados con una combinación de aprendizaje supervisado y aprendizaje de refuerzo de la retroalimentación humana (RLHF), asegurando que los modelos se adapten a las preferencias humanas y produzcan resultados más relevantes y efectivos. Deepseek también ofrece múltiples versiones de sus modelos, desde más livianos como el modelo de parámetros 7B hasta el modelo 67B más pesado, lo que permite a los usuarios elegir en función de sus necesidades computacionales y complejidad de las tareas.

Versiones especializadas: Coder de Deepseek

Una característica destacada de Veterano es Coder de profundidadun modelo especializado diseñado para programas y tareas relacionadas con el código. Ya sea que necesite ayuda para escribir una pieza de código, depurar un script existente o resolver algoritmos complejos, Deepseek Coder se adapta a esas necesidades, lo que lo convierte en un fuerte competidor en el mercado de AI de codificación.

¿Quién usa Deepseek?

Veterano atiende a una amplia gama de usuarios, incluyendo:

  • Desarrolladores de software: Deepseek Coder es una herramienta invaluable para quienes trabajan en proyectos de codificación y programación.
  • Investigadores: Aquellos que necesitan ayuda con el análisis de datos complejos y las tareas de investigación pueden recurrir Veterano por ayuda.
  • Negocios: Las empresas que buscan integrar herramientas de IA avanzadas en sus operaciones pueden usar los modelos versátiles de Deepseek para la optimización del flujo de trabajo.
  • Usuarios individuales: Desde la creación de contenido hasta la resolución de problemas, los usuarios individuales se benefician de las capacidades integrales de Deepseek en varios dominios.

Deepseek vs. chatgpt: ¿Cómo se comparan?

Al comparar Veterano Para Chatgpt, está claro que ambos tienen sus fortalezas y debilidades. Echemos una mirada más profunda de cómo estas dos plataformas se acumulan entre sí.

Fortalezas de Deepseek

  • Fuerte rendimiento en la codificación: Gracias a su Coder de profundidadesta herramienta sobresale en tareas que involucran programación y resolución de problemas técnicos. ChatGPT también ofrece ayuda de codificación, pero Veterano se especializa en esta área.
  • Disponibilidad de código abierto: Muchos de los modelos de Deepseek son de código abierto, proporcionando a los usuarios la flexibilidad de modificar la herramienta para satisfacer sus necesidades específicas.
  • Opciones de implementación: Deepseek permite opciones de implementación flexibles, lo que facilita la integración con diferentes sistemas y aplicaciones.

Fortalezas de chatgpt

  • Base de usuarios más grande: ChatGPT tiene una base de usuarios significativamente mayor y un ecosistema más extenso, lo que conduce a un mejor refinamiento y aplicaciones más amplias del mundo real.
  • Conocimiento más amplio: Mientras Veterano Se especializa en tareas técnicas y científicas, ChatGPT es más generalista, capaz de responder preguntas en una amplia gama de temas.
  • Herramientas y complementos integrados: ChatGPT también tiene más integraciones, con varios complementos y herramientas disponibles para diferentes industrias.

¿Por qué es importante Deepseek?

Veterano trae algo fresco al mercado de IA, ofreciendo capacidades técnicas que lo diferencian de modelos más convencionales como ChatGPT. Es de código abierto La naturaleza es un factor clave en su importancia, ya que permite a los desarrolladores e investigadores jugar y mejorar la plataforma.

Además, el énfasis de Deepseek en dominio técnico Al igual que la programación, la resolución de problemas y el análisis de documentos lo han convertido en una herramienta esencial para casos de uso más especializados. Proporciona una competencia saludable a otras plataformas de IA, fomentando la innovación en el campo.

Capacidades clave de Deepseek

Procesamiento del lenguaje natural (PNL)

En su corazón, Veterano Maneja el procesamiento del lenguaje natural, al igual que ChatGPT. Esto incluye tareas como generar respuestas similares a los humanos, resumir textos y traducir idiomas. Sin embargo, Veterano es particularmente efectivo para explicar temas técnicos complejos en términos más simples, lo que lo convierte en un favorito entre los investigadores y desarrolladores que necesitan explicar temas intrincados a los laicos.

Generación de código

Si está trabajando en el campo del desarrollo de software, Coder de profundidad es una herramienta invaluable para generar, analizar y depurar código. Puede crear scripts completos, corregir errores o sugerir mejoras en el código existente, lo que lo convierte en un asistente poderoso para los desarrolladores. ChatGPT también puede ayudar con la generación de código, pero Veterano Excelente en esta área debido a su enfoque especializado.

Resolución de problemas y análisis de datos

Cuando se trata de resolver problemas técnicos o matemáticos, Veterano brilla. Ya sea que esté tratando de optimizar las consultas de la base de datos, resolver algoritmos complejos o analizar grandes conjuntos de datos, esta herramienta ofrece habilidades de resolución de problemas altamente sofisticadas.

Análisis de documentos

Un área donde Veterano Se destaca en el procesamiento y el análisis de documentos grandes. Puede resumir los trabajos de investigación, extraer datos relevantes de textos legales y analizar patrones de datos en grandes cantidades de texto. Esta es un área donde Veterano Ofrece ideas altamente técnicas y detalladas en comparación con las respuestas más generalizadas que puede obtener de ChatGPT.

Pros y contras de Deepseek

Ventajas

  • Flexibilidad de código abierto: El enfoque de código abierto de Deepseek permite a los desarrolladores personalizar y modificar los modelos para satisfacer sus necesidades.
  • Fuerte rendimiento técnico: Su enfoque en la codificación y las tareas técnicas significa que supera a otras herramientas de IA en estas áreas.
  • Escalabilidad: Con diferentes modelos disponibles, los usuarios pueden elegir una solución que equilibre el rendimiento con las necesidades computacionales.
  • Enfoque especializado: La atención de Deepseek a los dominios técnicos y científicos lo hace invaluable para aquellos en investigación, programación y otros campos especializados.

Limitaciones

  • Plataforma más nueva: Como participante más nuevo, Deepseek no tiene el mismo nivel de pruebas del mundo real y comentarios generalizados de los usuarios que ChatGPT.
  • Comunidad más pequeña: Mientras está creciendo, la comunidad alrededor de Deepseek es más pequeña, lo que significa menos recursos generados por el usuario o herramientas de terceros.
  • Documentación: La documentación aún se está expandiendo, por lo que los usuarios pueden enfrentar desafíos al comenzar con Deepseek o Solución de problemas.
  • Menos integraciones: En comparación con ChatGPT, Deepseek ofrece menos integraciones y complementos de terceros, lo que limita su versatilidad para ciertas aplicaciones.

Comenzando con Deepseek

Si estás interesado en probar Veteranohay algunas maneras de comenzar:

  • Integración de API: Los desarrolladores pueden integrar Deepseek en sus aplicaciones a través de API.
  • Interfaz web: Para aquellos que desean interactuar directamente con el modelo, Deepseek ofrece una interfaz basada en la web.
  • Código abierto: Para los usuarios expertos en tecnología, los modelos de código abierto de Deepseek se pueden descargar y ejecutar localmente, ofreciendo la máxima flexibilidad.

El futuro de Deepseek

Mirando hacia el futuro, Veterano está listo para hacer contribuciones significativas al espacio de IA. A medida que la plataforma continúa evolucionando, podemos esperar que lo haga:

  • Avanzar ai en dominios especializados como la codificación y la investigación científica.
  • Contribuir a la Democratización de AI A través de la disponibilidad de código abierto.
  • Conducir Innovación en la arquitectura de modelos de IA y técnicas de entrenamiento.

Conclusión

Veterano Es una herramienta poderosa que compite con los gigantes de la industria como ChatGPT al ofrecer características especializadas en codificación, resolución de problemas y procesamiento del lenguaje natural. Si bien es posible que aún no tenga la popularidad generalizada de ChatGPT, se destaca en su enfoque en aplicaciones técnicas avanzadas. Como Veterano Continúa creciendo y evolucionando, sin duda se convertirá en una fuerza aún más formidable en el mundo de la IA, haciendo contribuciones significativas al campo.

En contraste, mientras ChatGPT sigue siendo la elección dominante para las interacciones de IA de uso general, el Hacer surgimiento Chip ha introducido una nueva ola de innovación en hardware de IA, que podría afectar plataformas como Veterano en el futuro.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Los rescatadores buscan sobrevivientes en el río Potomac

Published

on

Este artículo es una versión en el sitio de nuestro primer boletín. Los suscriptores pueden inscribirse en nuestra edición de Asia, Europa/África o América para que se entregue el boletín cada mañana de los días de la semana. Explore todos nuestros boletines aquí

Buenos días y en la agenda de hoy:

  • Lo último sobre el desastre aéreo del río Potomac

  • Inversión Operai de $ 25 mil millones de SoftBank

  • Hamas libera a más rehenes

  • Lecciones de Bill Gross de una carrera de inversión

  • Y la ‘cúpula de hierro’ de Trump explicó


Diecinueve cuerpos han sido recuperados del río Potomac cerca del Aeropuerto Nacional Reagan Washington, según informes de los medios, después de una colisión en el aire entre un helicóptero militar estadounidense y un avión de pasajeros.

El vuelo comercial fue operado por PSA Airlines para American Airlines y se acercó a Reagan Washington desde Wichita, Kansas, con 60 pasajeros y cuatro miembros de la tripulación a bordo a las 9 p.m. Tenía tres personas militares a bordo.

Se lanzó una operación masiva de búsqueda y rescate y ha estado trabajando durante la noche en condiciones de congelación para buscar sobrevivientes. Un funcionario de la ley dijo que se recuperaron 19 cuerpos, según CBS News, pero esta cifra no ha sido confirmada.

El presidente Donald Trump dijo que había sido “completamente informado” sobre el incidente, dijo la Casa Blanca en un comunicado. En su plataforma social verdad, el presidente planteó preguntas sobre las acciones del helicóptero militar antes del accidente.

“El avión estaba en una línea de enfoque perfecta y rutinaria para el aeropuerto”, escribió Trump. “El helicóptero iba directamente al avión durante un período prolongado de tiempo. Es una noche clara, las luces en el avión eran ardientes. ¿Por qué el helicóptero no subió o bajó, ni giró? ”, Preguntó.

“¿Por qué la torre de control no le dijo al helicóptero qué hacer en lugar de preguntar si vieron el avión? Esta es una mala situación que parece que debería haberse evitado. ¡¡¡NO ES BUENO!!!” Trump agregó.

El patinaje artístico estadounidense, el órgano de gobierno estadounidense para el deporte, confirmó en un comunicado que varios miembros de su comunidad de patinaje estaban a bordo del vuelo 5342 de American Airlines.

Los accidentes de aviación graves en los Estados Unidos son raros. El último accidente importante que involucró a un avión comercial estadounidense fue en 2009, cuando un vuelo de Continental Airlines se estrelló contra una calle residencial en Nueva York, matando a los 49 pasajeros y a la tripulación a bordo. En noviembre de 2001, un vuelo de American Airlines desde el Aeropuerto Internacional John F. Kennedy en Nueva York hasta el Aeropuerto Internacional Las Américas en Santo Domingo se estrelló poco después del despegue, matando a las 260 personas a bordo solo dos meses después de los ataques del 11 de septiembre. Aquí está lo último de esta historia en desarrollo.

Y esto es lo que debes saber hoy:

  • Datos económicos: Estados Unidos publica estimaciones del PIB del cuarto trimestre.

  • Política monetaria: Se espera que el Banco Central Europeo reduzca su tasa de interés clave en un cuarto de punto. Vea nuestro rastreador de tasas de políticas en todo el mundo.

  • Empresas: Apple, MasterCard, Visa, Northrop, Altria, Comcast y el fabricante de chips KLA se encuentran entre las compañías que informan sobre otro día ocupado para los lanzamientos de ganancias.

  • Congreso: Está previsto que Tulsi Gabbard, nominada al presidente Donald Trump, sea director de inteligencia nacional, aparecerá frente al Comité de Inteligencia del Senado, mientras que el director del Director del FBI, Kash Patel, comparecerá ante el Comité Judicial del Senado. Robert F. Kennedy Jr se enfrenta a un segundo día de interrogatorio después de la parrilla de ayer.

Cinco historias más principales

1. Hamas ha entregado el primero de tres rehenes israelíes que se lanzarán hoy, El ejército israelí dijo, comenzando el tercer intercambio de una tregua frágil que entró en vigencia en Gaza este mes. Junto con los tres rehenes israelíes, que serán intercambiados por más de 100 prisioneros palestinos, también se espera que Hamas libere a cinco ciudadanos tailandeses que se encontraban entre las docenas de trabajadores extranjeros que capturó el 7 de octubre. James Shotter en Jerusalén está siguiendo esta historia en desarrollo.

2. SoftBank está en conversaciones para invertir hasta $ 25 mil millones en OpenAiun acuerdo que lo convertiría en el mayor patrocinador financiero del fabricante de chatgpt. La ambiciosa gambit de Masayoshi Son es la pieza central de una estrategia más amplia para cumplir con su misión autoinfundada de lograr la llamada “superinteligencia”. Lea nuestra historia exclusiva.

3. Donald Trump criticó fuertemente a la Reserva Federal Solo unas horas después de que el Banco Central de EE. UU. Desafió las llamadas del presidente para reducciones profundas en los costos de endeudamiento y dejara las tasas de interés en espera. El presidente de la Fed, Jay Powell, dijo que los establecedores de tarifas estadounidenses “no necesitan tener prisa por ajustar nuestra postura de política”. Aquí hay más sobre la decisión unánime de ayer para mantener las tasas.

  • Bahía de Guantánamo: Donald Trump ha ordenado al Pentágono que prepare la base naval de los Estados Unidos en Cuba que reciba miles de inmigrantes con antecedentes penales.

  • Financiación federal: El presidente desechó su orden de congelar cientos de miles de millones de dólares en fondos nacionales federales, en una gran escalada tras una reacción generalizada.

4. Un aumento en los envíos de oro a los Estados Unidos ha llevado a una escasez de lingotes en Londres, A medida que los comerciantes acumulan una reserva de $ 82 mil millones en Nueva York por temor a las tarifas de la administración Trump. Desde las elecciones estadounidenses de noviembre, los comerciantes e instituciones financieras de oro han trasladado 393 toneladas métricas a las bóvedas del intercambio de productos Commodity de Comex en Nueva York. Lea más sobre los flujos de oro a través del Atlántico.

5. Los científicos han descubierto una rica gama de compuestos orgánicos en muestras recuperadas de un asteroide por una nave espacial estadounidense, incluyendo muchos de los bloques de construcción químicos clave de la vida. Un análisis global del material del asteroide Bennu, sugiere que las moléculas transportadas en meteoritos pueden haber contribuido a la aparición de organismos vivos en la Tierra hace unos 4 mil años. El escritor científico senior Clive Cookson explica la importancia de los hallazgos.

La gran lectura

Ilustración de una colorida letra geométrica 'M' sobre un telón de fondo estampado con LOGOS de IA y compañía de redes sociales, incluidas Google, Meta y OpenAI
© ft montaje

El año pasado, Mistral fue aclamado como un potencial líder mundial en tecnología de IA. Pero esta semana, el valle de Silicon Silicon Valley sorprendido de China al lanzar un modelo de código abierto de vanguardia con lo que afirma es una pequeña fracción de recursos de Operai o Meta y poder informático, superando la nueva empresa francesa en su propio juego. ¿La gran esperanza de Europa para la IA ha perdido su momento?

También estamos leyendo. . .

  • Lecciones de Bill Gross: El filántropo, inversor privado y cofundador de PIMCO comparte Insights de una carrera de carrera.

  • Deepseek Breakthrough: China ha dominado el arte japonés de kaizen o “mejora continua”, y Occidente debería estar preocupado, escribe Leo Lewis.

  • Tecnología: Una nueva empresa del Área de la Bahía ofrece extensiones de pestañas ultra rápidas y ultra precisas para aquellos lo suficientemente valientes como para entrar en su máquina.

Gráfico del día

Diagrama que ilustra los componentes de un sistema de defensa de misiles balísticos

Donald Trump ordenó esta semana el trabajo en el escudo de misiles más ambicioso de la historia de los Estados Unidos para comenzar. Apodado el “Iron Dome for America”, en un guiño al famoso sistema de defensa de Israel, el escudo de misiles se construirá para destruir misiles hipersónicos y prevenir la aniquilación nuclear. Así es como funcionará.

Tómese un descanso de las noticias. . .

El exitoso drama Ruptura Lleva el dilema post-pandemia del equilibrio entre la vida laboral y la vida, o el desenfoque, a un extremo distópico, escribe Emma Jacobs.

Gracias por leer y recuerda que puedes agregar Firstft a Myft. También puede optar por recibir una notificación push Firstft todas las mañanas en la aplicación. Envíe sus recomendaciones y comentarios a [email protected]

Boletines recomendados para ti

Una lectura imprescindible – Periodismo notable que no querrás perderte. Regístrese aquí

Artesanía -Nuestro redondeo de negocios y economía. Regístrese aquí

Continue Reading

Noticias

¿Deepseek copió la tecnología AI de OpenAI? | Noticias explicadas

Published

on

Incluso cuando el creador de chatgpt Openai enfrenta un aluvión de casos de infracción de derechos de autor en algunos países, la compañía cree que su advenimiento Rival chino Deepseek Puede haber copiado de su tecnología de inteligencia artificial (IA). No solo Openai, sino uno de los principales asesores del presidente de los Estados Unidos, Donald Trump, también ha nivelado esta afirmación, sin presentar muchas pruebas.

La entrada de Deepseek en el espacio de IA, promocionado por ser de código abierto, su precisión y afirmaciones de que se basa en la fracción del costo como sus competidores estadounidenses, han causado una agitación en la industria de la tecnología. Ha enviado el stock de Nvidia en una espiral descendente, ya que su modelo fue capacitado en unites de procesamiento de gráficos inferiores (GPU) en comparación con lo que tienen acceso a OpenAI. Y su entrada ha reavivado la conversación sobre controles de exportación más estrictos.

Es en este contexto que OpenAi ha dicho que Deepseek puede haber utilizado una técnica llamada “destilación”, que permite que su modelo aprenda de un modelo previo al estado de ejercicio, en este caso ChatGPT. Si bien Deepseek ha sido acusado de robo de propiedad intelectual desde que recibió atención principal, algunos expertos de la industria han desestimado estas afirmaciones diciendo que se derivan de una comprensión inadecuada de cómo los modelos como Deepseek están capacitados.

La historia continúa debajo de este anuncio

La sospecha de Openai sobre Deepseek

OpenAI prohíbe la práctica de capacitar a un nuevo modelo de IA al consultar repetidamente un modelo más grande y pre-entrenado, una técnica comúnmente conocida como destilación, según sus términos de uso. Y la compañía sospecha que Deepseek puede haber intentado algo similar, lo que podría ser una violación de sus términos.

“Sabemos que los grupos de la RPC (China) están trabajando activamente para usar métodos, incluido lo que se conoce como destilación, para replicar los modelos AI avanzados de EE. UU.”, Dijo un portavoz de OpenAI en un comunicado. “Somos conscientes y revisando las indicaciones de que Deepseek puede haber destilado inapropiadamente nuestros modelos y compartirá información como sabemos más”.

Oferta festiva

David Sacks, asesor de IA de Trump, dijo a Fox News: “Hay evidencia sustancial de que lo que hizo Deepseek aquí es que destilaron el conocimiento de las modelos de OpenAi … y no creo que OpenAi esté muy contento con esto”.

https://www.youtube.com/watch?v=nlgfnn_cgzw

Los actores de la industria contrarrestan las afirmaciones de Openai

La historia continúa debajo de este anuncio

Sin embargo, algunos no están de acuerdo con las afirmaciones de que Deepseek copió la tecnología de OpenAi y similares.

“Hay muchas ideas erróneas de que China” clonó “las salidas de OpenAi. Esto está lejos de ser cierto y refleja una comprensión incompleta de cómo estos modelos están entrenados en primer lugar … “Aravind Srinivas, CEO de Perpleity en una publicación sobre X.

“Deepseek R1 ha descubierto RL (aprendizaje de refuerzo) Finetuning. Escribieron un artículo completo sobre este tema llamado Deepseek R1 Zero, donde no se usó SFT (ajuste fino supervisado). Y luego lo combinó con un poco de SFT para agregar conocimiento del dominio con un buen muestreo de rechazo (también conocido como filtrado). La razón principal por la que es tan bueno es que aprendió razonamiento desde cero en lugar de imitar a otros humanos o modelos ”, agregó.

La idea de usar el aprendizaje de refuerzo (RL) se convirtió en un punto de enfoque para las compañías de IA en 2024. “Este nuevo paradigma implica comenzar con el tipo de modelos prenederos ordinarios, y luego como segunda etapa utilizando RL para agregar las habilidades de razonamiento”, explicó Dario. AMODEI, CEO de Anthrope, en una publicación de blog.

La historia continúa debajo de este anuncio

El ajuste fino supervisado (SFT) es un proceso en el aprendizaje automático donde un modelo previamente capacitado está capacitado (ajustado) en un conjunto de datos etiquetado específico para una tarea en particular. Este enfoque aprovecha el conocimiento general que el modelo ya ha adquirido durante su fase inicial de pre-entrenamiento y lo adapta para funcionar bien en una tarea más especializada.

Según un resumen adjunto con el modelo de Deepseek en su página de GitHub, la compañía dijo que aplicó el aprendizaje de refuerzo al modelo base sin depender del ajuste superior supervisado como un paso preliminar.

“Este enfoque permite que el modelo explore la cadena de pensamiento (cot) para resolver problemas complejos, lo que resulta en el desarrollo de Deepseek-R1-Zero. Deepseek-r1-cero demuestra capacidades como la autoverificación, la reflexión y la generación de cunas largas, marcando un hito significativo para la comunidad de investigación. En particular, es la primera investigación abierta para validar que las capacidades de razonamiento de los LLM se pueden incentivar puramente a través de RL, sin la necesidad de SFT. Este avance allana el camino para futuros avances en esta área. ”, Dijo el resumen.

https://www.youtube.com/watch?v=b6rttqqb67k

Los propios problemas de derechos de autor de Openai

La historia continúa debajo de este anuncio

En todo el mundo, y específicamente en países como Estados Unidos e India, existe un creciente escepticismo de los editores de noticias sobre las preocupaciones de material con derechos de autor, como informes de noticias, utilizados por compañías como OpenAI para capacitar a sus modelos fundamentales, sin permiso o pago.

En noviembre pasado, la agencia de noticias Ani había demandado a OpenAi en el Tribunal Superior de Delhi, acusando a la compañía de usar ilegalmente material con derechos de autor indio para capacitar a sus modelos de IA. A principios de esta semana, una serie de editores de noticias digitales, incluido el Indian Express, han presentado una intervención en el caso.

La afirmación es que compañías como OpenAI han desarrollado grandes modelos de idiomas (LLM) al “capacitar” sobre grandes cantidades de texto, incluidas, sin licencia o permiso, obras protegidas por derechos de autor. Esta “utilización ilegal de materiales con derechos de autor beneficia exclusivamente a Openai y a sus inversores, en detrimento de los trabajos creativos en toda la industria de la India”, dijo la Asociación de Publishers de Noticias Digital (DNPA) en un comunicado.

Operai también enfrenta una serie de demandas similares en otras jurisdicciones. En diciembre de 2023, el New York Times demandó a la compañía y Microsoft, citando el uso “ilegal” de contenido con derechos de autor. La publicación ha alegado que los modelos de idiomas grandes de Openai y Microsoft, que alimentan el chatgpt y el copiloto, “pueden generar el resultado que recita el contenido textual, lo resume de cerca e imita su estilo expresivo”. Este “socavo[s] y daño[s]”La relación del Times con los lectores, al tiempo que la prive de” suscripción, licencias, publicidad e ingresos por afiliados “.

Continue Reading

Noticias

DeepSeek’s AI is bad for OpenAI and NVIDIA. But it might be great for you.

Published

on

When it comes to AI, I’d consider myself a casual user and a curious one. It’s been creeping into my daily life for a couple of years, and at the very least, AI chatbots can be good at making drudgery slightly less drudgerous.

But whenever I start to feel convinced that tools like ChatGPT and Claude can actually make my life better, I seem to hit a paywall, because the most advanced and arguably most useful tools require a subscription. Then came DeepSeek.

The Chinese startup DeepSeek sunk the stock prices of several major tech companies on Monday after it released a new open-source model that can reason on the cheap: DeepSeek-R1. The company says R1’s performance matches OpenAI’s initial “reasoning” model, o1, and it does so using a fraction of the resources. It also cost a lot less to use. That adds up to an advanced AI model that’s free to the public and a bargain to developers who want to build apps on top of it.

While OpenAI, Anthropic, Google, Meta, and Microsoft have collectively spent billions of dollars training their models, DeepSeek claims it spent less than $6 million on using the equipment to train R1’s predecessor, DeepSeek-V3. (Disclosure: Vox Media is one of several publishers that has signed partnership agreements with OpenAI. Our reporting remains editorially independent.)

To get unlimited access to OpenAI’s o1, you’ll need a pro account, which costs $200 a month. DeepSeek does charge companies for access to its application programming interface (API), which allows apps to talk to each other and helps developers bake AI models into their apps. But what DeepSeek charges for API access is a tiny fraction of the cost that OpenAI charges for access to o1. So it might not come as a surprise that, as of Wednesday morning, DeepSeek wasn’t just the most popular AI app in the Apple and Google app stores. It was the most popular app, period.

“The main reason people are very excited about DeepSeek is not because it’s way better than any of the other models,” said Leandro von Werra, head of research at the AI platform Hugging Face. “It’s more that it’s an open model, and coming from a place where people didn’t expect it to come from.”

So as Silicon Valley and Washington pondered the geopolitical implications of what’s been called a “Sputnik moment” for AI, I’ve been fixated on the promise that AI tools can be both powerful and cheap. And on top of that, I imagined how a future powered by artificially intelligent software could be built on the same open-source principles that brought us things like Linux and the World Web Web.

This could be wishful thinking and a little bit naive. After all, OpenAI was originally founded as a nonprofit company with the mission to create AI that would serve the entire world, regardless of financial return. That’s no longer the case.

But this is why DeepSeek’s explosive entrance into the global AI arena could make my wishful thinking a bit more realistic. While my own experiments with the R1 model showed a chatbot that basically acts like other chatbots — while walking you through its reasoning, which is interesting — the real value is that it points toward a future of AI that is, at least partially, open source. It indicates that even the most advanced AI capabilities don’t need to cost billions of dollars to build — or be built by trillion-dollar Silicon Valley companies. That means more companies could be competing to build more interesting applications for AI.

And while American tech companies have spent billions trying to get ahead in the AI arms race, DeepSeek’s sudden popularity also shows that while it is heating up, the digital cold war between the US and China doesn’t have to be a zero-sum game.

DeepSeek’s unconventional, almost-open-source approach

While you may not have heard of DeepSeek until this week, the company’s work caught the attention in the AI research world a few years ago. The company actually grew out of High-Flyer, a China-based hedge fund founded in 2016 by engineer Liang Wenfeng. High-Flyer found great success using AI to anticipate movement in the stock market. That, however, prompted a crackdown on what Beijing deemed to be speculative trading, so in 2023, Liang spun off his company’s research division into DeepSeek, a company focused on advanced AI research.

From the outset, DeepSeek set itself apart by building powerful open-source models cheaply and offering developers access for cheap. In the software world, open source means that the code can be used, modified, and distributed by anyone. In the context of AI, that applies to the entire system, including its training data, licenses, and other components. Thanks to DeepSeek’s open-source approach, anyone can download its models, tweak them, and even run them on local servers.

The major US players in the AI race — OpenAI, Google, Anthropic, Microsoft — have closed models built on proprietary data and guarded as trade secrets. Meta has set itself apart by releasing open-source models. Conventional wisdom suggested that open models lagged behind closed models by a year or so. DeepSeek apparently just shattered that notion.

DeepSeek’s models are not, however, truly open source. They’re what’s known as open-weight AI models. That means the data that allows the model to generate content, also known as the model’s weights, is public, but the company hasn’t released its training data or code. Von Werra, of Hugging Face, is working on a project to fully reproduce DeepSeek-R1, including its data and training pipelines. One of the goals is to figure out how exactly DeepSeek managed to pull off such advanced reasoning with far fewer resources than competitors, like OpenAI, and then release those findings to the public to give open-source AI development another leg up.

“If more people have access to open models, more people will build on top of it,” von Werra said.

Still, we already know a lot more about how DeepSeek’s model works than we do about OpenAI’s. DeepSeek published a detailed technical report on R1 under an MIT License, which gives permission to reuse, modify, or distribute the software. A similar technical report on the V3 model released in December says that it was trained on 2,000 NVIDIA H800 chips versus the 16,000 or so integrated circuits competing models needed for training. Training took 55 days and cost $5.6 million, according to DeepSeek, while the cost of training Meta’s latest open-source model, Llama 3.1, is estimated to be anywhere from about $100 million to $640 million. But because Meta does not share all components of its models, including training data, some do not consider Llama to be truly open source.

When it comes to performance, there’s little doubt that DeepSeek-R1 delivers impressive results that rival its most expensive competitors. A comparison of models from Artificial Analysis shows that R1 is second only to OpenAI’s o1 in reasoning and artificial analysis. It actually slightly outperforms o1 in terms of quantitative reasoning and coding. The big tradeoff appears to be speed. DeepSeek is kind of slow, and you’ll notice it if you use R1 in the app or on the web. It does show you what it’s thinking as it’s thinking, though, which is kind of neat.

Now, the number of chips used or dollars spent on computing power are super important metrics in the AI industry, but they don’t mean much to the average user. The most basic versions of ChatGPT, the model that put OpenAI on the map, and Claude, Anthropic’s chatbot, are powerful enough for a lot of people, and they’re free. They can summarize stuff, help you plan a vacation, and help you search the web with varying results. But chatbots are far from the coolest thing AI can do.

The challenge to America’s global AI supremacy

What’s most exciting about DeepSeek and its more open approach is how it will make it cheaper and easier to build AI into stuff. This is a huge deal for developers trying to create killer apps as well as scientists trying to make breakthrough discoveries. It’s also a huge challenge to the Silicon Valley establishment, which has poured billions of dollars into companies like OpenAI with the understanding that the massive capital expenditures would be necessary to lead the burgeoning global AI industry.

It’s not an understatement to say that DeepSeek is shaking the AI industry to its very core. The stock market’s reaction to the arrival of DeepSeek-R1’s arrival wiped out nearly $1 trillion in value from tech stocks and reversed two years of seemingly neverending gains for companies propping up the AI industry, including most prominently NVIDIA, whose chips were used to train DeepSeek’s models.

It also indicated that the Biden administration’s moves to curb chip exports in an effort to slow China’s progress in AI innovation may not have had the desired effect. Joe Biden started blocking exports of advanced AI chips to China in 2022 and expanded those efforts just before Trump took office. However, China’s AI industry has continued to advance apace its US rivals. DeepSeek is joined by Chinese tech giants like Alibaba, Baidu, ByteDance, and Tencent, who have also continued to roll out powerful AI tools, despite the embargo.

What this means for the future of America’s quest for AI dominance is up for debate. President Donald Trump praised DeepSeek’s ability to come up “with a faster method of AI and much less expensive method.” He added, “The release of DeepSeek, AI from a Chinese company should be a wakeup call for our industries that we need to be laser-focused on competing to win.”

But we’re far too early in this race to have any idea who will ultimately take home the gold. “This is like being in the late 1990s or even right around the year 2000 and trying to predict who would be the leading tech companies, or the leading internet companies in 20 years,” said Jennifer Huddleston, a senior fellow at the Cato Institute.

What is clear is that the competitors are aiming for the same finish line. Liang said in a July 2024 interview with Chinese tech outlet 36kr that, like OpenAI, his company wants to achieve general artificial intelligence and would keep its models open going forward. He added, “OpenAI is not a god.” Liang’s goals line up with those of Sam Altman and OpenAI, which has cast doubt on DeepSeek’s recent success. Microsoft and OpenAI are reportedly investigating whether DeepSeek used ChatGPT output to train its models, an allegation that David Sacks, the newly appointed White House AI and crypto czar, repeated this week.

There is, of course, the chance that this all goes the way of TikTok, another Chinese company that challenged US tech supremacy. It was originally Trump who cited national security concerns as a reason to ban the app, which is owned by ByteDance. Congress and the Biden administration took up the mantle, and now TikTok is banned, pending the app’s sale to an American company.

DeepSeek uses ByteDance as a cloud provider and hosts American user data on Chinese servers, which is what got TikTok in trouble years ago. The concern here is that the Chinese government could access that data and threaten US national security. DeepSeek also says in its privacy policy that it can use this data to “review, improve, and develop the service,” which is not an unusual thing to find in any privacy policy.

Unsurprisingly, DeepSeek does abide by China’s censorship laws, which means its chatbot will not give you any information about the Tiananmen Square massacre, among other censored subjects. But it’s not yet clear that Beijing is using the popular new tool to ramp up surveillance on Americans. At least, it’s not doing so any more than companies like Google and Apple already do, according to Sean O’Brien, founder of the Yale Privacy Lab, who recently did some network analysis of DeepSeek’s app.

“From a privacy standpoint, people need to understand that most mainstream apps are spying on them, and this is no different,” O’Brien told me. “It’s just a question of who’s doing the spying.”

Which brings us back to that paywall question. There’s an old adage that if something online is free on the internet, you’re the product. So while it’s exciting and even admirable that DeepSeek is building powerful AI models and offering them up to the public for free, it makes you wonder what the company has planned for the future.

In the meantime, you can expect more surprises on the AI front. You might even be able to tinker with these surprises, too. OpenAI recently rolled out its Operator agent, which can effectively use a computer on your behalf — if you pay $200 for the pro subscription. This week, people started sharing code that can do the same thing with DeepSeek for free.

Continue Reading

Trending