Connect with us

Noticias

OpenAI unveils its most advanced o3 reasoning model on its last day of ‘shipmas’

Published

on

NurPhoto/Getty Images

With the holiday season upon us, many companies are finding ways to take advantage through deals, promotions, or other campaigns. OpenAI has found a way to participate with its “12 days of OpenAI” event series.

OpenAI announced via an X post that starting on Dec. 5, the company would host 12 days of live streams and release “a bunch of new things, big and small,” according to the post. The company saved the best for last, sharing its biggest annoouncemnt on Friday, Dec. 20, the last day of the series. 

Also: I’m a ChatGPT power user – here’s why Canvas is its best productivity feature

Here’s everything you need to know about the campaign, as well as a round-up of every day’s drops. 

What are the ’12 days of OpenAI’?

OpenAI CEO Sam Altman shared more details about the event, which kicked off at 10 a.m. PT on Dec. 5 and occurred daily for 12 weekdays with a live stream featuring a launch or demo. The launches included both “big ones” or “stocking stuffers,” according to Altman. 

What’s dropped?

Friday, December 20

On the last day of OpenAI, OpenAI unveiled its latest models, o3, which encompass o3 and o3 mini. 

  • As previously reported, the reason for the name that skips “o2” is the existence of Telefonica’s O2 telecommunications brand, which could cause confusion and copyright issues. 
  • OpenAI said that the technology will not be available to the general public yet. 
  • o3 can outperform o1 in a variety of benchmarks, including math and science, as seen in its performance on the AIME 2024, a competition math benchmark, and the GPQA, a Ph.D. level science benchmark with biology, physics, and chemistry questions. 
  • o3 also scored a new state-of-the-art score on the ARC-AGI benchmark, which is significant because it shows the model is nearing AGI, although, to be clear, it is not there yet. 
  • o3 mini is a new model in the o3 family that will support three reasoning options: low, medium, and high. The thinking time determines the performance. At a low level, it performs the same as o1-mini on the Codeforces Competition Code benchmark, but at medium and high, it can perform comparable to o1, if not better. This performance remained consistent across other evals. 
  • In addition to internal safety testing, OpenAI is, for the first time, opening up the o3 models to external safety testing. Safety researchers can get early access to the model by filling out a form on the OpenAI website, which will be open until January 10. 
  • Sam Altman concluded the live stream by sharing that the o3 model is planned to launch at the end of January, and the full o3 model will be launched after that. 
  • The company also introduced deliberative alignment, “a training paradigm that directly teaches reasoning LLMs the text of human-written and interpretable safety specifications, and trains them to reason explicitly about these specifications before answering,” according to OpenAI. 

Thursday, December 19

On the second to last day of ’12 days of OpenAI,’ the company focused on releases regarding its MacOS desktop app and its interoperability with other apps. 

  • Users can now use the desktop app on MacOS to see and automate their work with ChatGPT. There will be more releases of this nature in 2025, but until then, OpenAI has been introducing the three features below. 
  • Using the “Work with Apps” button, users can now work with many more coding apps. The list includes: BBEdit, MatLab, Nova, Script Editor, TextMate, Android Studio, AppCode, CLion, DataGrip, GoLand, IntelliJ IDEA, PHPStorm, PyCharm, RubyMine, RustRover, WebStorm, Prompt, and Warp. 
  • For users who use ChatGPT for writing, the desktop app now supports Apple Notes, Quip, and Notion. 
  • Lastly, the desktop app for MacOS now supports Advanced Voice Mode while working with other apps.
  • Features have already been shipped. All you have to do is have the latest version of the MacOS app and a Plus, Pro, Team, Enterprise, and Edu subscription. 
  • To ease privacy concerns, OpenAI says ChatGPT will only work with apps when manually prompted. When the feature is active, users know what will be attached to the message. 
  • “Day 12, we have something super special, so don’t miss it,” teased OpenAI about its upcoming Friday release. 

Wednesday, December 18

Have you ever wanted to use ChatGPT without a Wi-Fi connection? Now, all you have to do is place a phone call.  Here’s what OpenAI released on the 10th day:

  • By dialing 1-800-ChatGPT, you can now access the chatbot via a toll-free number. OpenAI encourages users to save ChatGPT in their contacts for easy access.
  • Users can call anywhere in the US; in other countries, users can message ChatGPT on WhatsApp. Users get 15 minutes of free ChatGPT calls per month.
  • In WhatsApp, users can enter a prompt via a text as they would with any other person in their contacts. In this experience, it is just a text message. 
  • The phone call feature works on any phone, from a smartphone to a flip phone — even a rotary phone.  
  • The presenters said it is meant to make ChatGPT more accessible to more users. 

Tuesday, December 17

The releases on the ninth day all focus on developer features and updates, dubbed “Mini Dev Day.”  These launches include:  

  • The o1 model is finally out of preview in the API with support for function calling, structured outputs, developer messages, vision capabilities, and lower latency, according to the company. 
  • o1 in the API also features a new parameter: “reasoning effort.” This parameter allows developers to tell the model how much effort is put into formulating an answer, which helps with cost efficiency. 
  • OpenAI also introduced WebRTC support for the Realtime API, which makes it easier for developers “to build and scale real-time voice products across platforms.”
  • The Realtime API also got a 60% audio token price drop, support for GPT-4o mini, and more control over responses.
  • The fine-tuning API now supports Preference Fine-Tuning, which allows users to “Optimize the model to favor desired behavior by reinforcing preferred responses and reducing the likelihood of unpreferred ones,” according to OpenAI.  
  • OpenAI also introduced new Go and Java SDKs in beta. 
  • An “AMA” (ask me anything) session will be held for an hour after the live stream on the OpenAI GitHub platform with the presenters. 

Monday, December 16 

The drops for the second Monday in the 12 days of OpenAI series all focused on Search in ChatGPT. 

  • The AI search engine is available to all users starting today, including all free users who are signed in anywhere they can access ChatGPT. The feature was previously only available to ChatGPT Plus users. 
  • The search experience, which allows users to browse the web from ChatGPT, got faster and better on mobile and now has an enriched map experience. The upgrades include image-rich visual results.
  • Search is integrated into Advance Voice mode, meaning you can now search as you talk to ChatGPT. To activate this feature, just activate Advance Voice the same way you regularly would and ask it your query verbally. It will then answer your query verbally by pulling from the web. 
  • OpenAI also teased developers, saying, “Tomorrow is for you,” and calling the upcoming livestream a “mini Dev Day.”

Friday, December 13

One of OpenAI’s most highly requested features has been an organizational feature to better keep track of your conversations. On Friday, OpenAI delivered a new feature called “Projects.”

  • Projects is a new way to organize and customize your chats in ChatGPT, meant to be a part of continuing to optimize the core experience of ChatGPT.
  • When creating a Project, you can include a title, a customized folder color, relevant project files, instructions for ChatGPT on how it can best help you with the project, and more in one place. 
  • In the Project, you can start a chat and add previous chats from the sidebar to your Project. It can also answer questions using your context in a regular chat format. The chats can be saved in the Project, making it easier to pick up your conversations later and know exactly what to look for where. 
  • It will be rolled out to Plus, Pro, and Teams users starting today. OpenAI says it’s coming to free users as soon as possible. Enterprise and Edu users will see it rolled out early next year. 

Thursday, December 12

When the live stream started, OpenAI addressed the elephant in the room — the fact that the company’s live stream went down the day before. OpenAI apologized for the inconvenience and said its team is working on a post-mortem to be posted later. 

Then it got straight into the news — another highly-anticipated announcement: 

  • Advanced Voice Mode now has screen-sharing and visual capabilities, meaning it can assist with the context of what it is viewing, whether that be from your phone camera or what’s on your screen. 
  • These capabilities build on what Advanced Voice could already do very well — engaging in casual conversation as a human would. The natural-like conversations can be interrupted, have multi-turns, and understand non-linear trains of thought. 
  • In the demo, the user gets directions from ChatGPT’s Advanced Voice on how to make a cup of coffee. As the demoer goes through the steps, ChatGPT is verbally offering insights and directions. 
  • There’s another bonus for the Christmas season: Users can access a new Santa voice. To activate it, all users have to do is click on the snowflake icon. Santa is rolling out throughout today everywhere that users can access ChatGPT voice mode. The first time you talk to Santa, your usage limits reset, even if you have reached the limit already, so you can have a conversation with him. 
  • Video and screen sharing are rolling out in the latest mobile apps starting today and throughout next week to all Team users and most Pro and Plus subscribers. Pro and Plus subscribers in Europe will get access “as soon as we can,” and Enterprise and Edu users will get access early next year. 

Wednesday, December 11

Apple released iOS 18.2 on Wednesday. The release includes integrations with ChatGPT across Siri, Writing Tools, and Visual Intelligence. As a result, the live stream focused on walking through the integration. 

  • Siri can now recognize when you ask questions outside its scope that could benefit from being answered by ChatGPT instead. In those instances, it will ask if you’d like to process the query using ChatGPT. Before any request is sent to ChatGPT, a message notifying the user and asking for permission will always appear, placing control in the user’s hands as much as possible. 
  • Visual Intelligence refers to a new feature for the iPhone 16 lineup that users can access by tapping the Camera Control button. Once the camera is open, users can point it at something and search the web with Google, or use ChatGPT to learn more about what they are viewing or perform other tasks such as translating or summarizing text. 
  • Writing Tools now features a new “Compose” tool, which allows users to create text from scratch by leveraging ChatGPT. With the feature, users can even generate images using DALL-E. 

All of the above features are subject to ChatGPT’s daily usage limits, the same way that users would reach limits while using the free version of the model on ChatGPT. Users can choose whether or not to enable the ChatGPT integration in Settings.

Read more about it here: iOS 18.2 rolls out to iPhones: Try these 6 new AI features today

Tuesday, December 10 

  • Canvas is coming to all web users, regardless of plan, in GPT-4o, meaning it is no longer just available in beta for ChatGPT Plus users.
  • Canvas has been built into GPT-4o natively, meaning you can just call on Canvas instead of having to go to the toggle on the model selector. 
  • The Canvas interface is the same as what users saw in beta in ChatGPT Plus, with a table on the left hand side that shows the Q+A exchange and a right-hand tab that shows your project, displaying all of the edits as they go, as well as shortcuts. 
  • Canvas can also be used with custom GPTs. It is turned on by default when creating a new one, and there is an option to add Canvas to existing GPTs. 
  • Canvas also has the ability to run Python code directly in Canvas, allowing ChatGPT to execute coding tasks such as fixing bugs. 

Read more about it here: I’m a ChatGPT power user – and Canvas is still my favorite productivity feature a month later

Monday, December 9

OpenAI teased the third-day announcement as “something you’ve been waiting for,” followed by the much-anticipated drop of its video model — Sora.  Here’s what you need to know:

  • Known as Sora Turbo, the video model is smarter than the February model that was previewed. 
  • Access is coming in the US later today; users need only ChatGPT Plus and Pro.
  • Sora can generate video-to-video, text-to-video, and more. 
  • ChatGPT Plus users can generate up to 50 videos per month at 480p resolution or fewer videos at 720p. The Pro Plan offers 10x more usage. 
  • The new model is smarter and cheaper than the previewed February model. 
  • Sora features an explore page where users can view each other’s creations. Users can click on any video to see how it was created. 
  • A live demo showed the model in use. The demo-ers entered a prompt and picked aspect ratio, duration, and even presets. I found the live demo video results to be realistic and stunning. 
  • OpenAI also unveiled Storyboard, a tool that lets users generate inputs for every frame in a sequence. 

Friday, December 6:

On the second day of “shipmas,” OpenAI expanded access to its Reinforcement Fine-Tuning Research Program:

  • The Reinforcement Fine-Tuning program allows developers and machine learning engineers to fine-tune OpenAI models to “excel at specific sets of complex, domain-specific tasks,” according to OpenAI. 
  • Reinforcement Fine-Tuning refers to a customization technique in which developers can define a model’s behavior by inputting tasks and grading the output. The model then uses this feedback as a guide to improve, becoming better at reasoning through similar problems, and enhancing overall accuracy.
  • OpenAI encourages research institutes, universities, and enterprises to apply to the program, particularly those that perform narrow sets of complex tasks, could benefit from the assistance of AI, and perform tasks that have an objectively correct answer. 
  • Spots are limited; interested applicants can apply by filling out this form. 
  • OpenAI aims to make Reinforcement Fine-Tuning publicly available in early 2025.

Thursday, December 5: 

OpenAI started with a bang, unveiling two major upgrades to its chatbot: a new tier of ChatGPT subscription, ChatGPT Pro, and the full version of the company’s o1 model. 

The full version of o1: 

  • Will be better for all kinds of prompts, beyond math and science
  • Will make major mistakes about 34% less often than o1-preview, while thinking about 50% faster
  • Rolls out today, replacing o1-preview to all ChatGPT Plus and now Pro users 
  • Lets users input images, as seen in the demo, to provide multi-modal reasoning (reasoning on both text and images) 

ChatGPT Pro:

  • Is meant for ChatGPT Plus superusers, granting them unlimited access to the best OpenAI has to offer, including unlimited access to OpenAI o1-mini, GPT-4o, and Advanced Mode
  • Features o1 pro mode, which uses more computing to reason through the hardest science and math problems 
  • Costs $200 per month 

Where can you access the live stream?

The live streams were held on the OpenAI website, and posted to its YouTube channel immediately after. So if you missed the 12 days of OpenAI and want to rewatch, you can access them all on the company’s YouTube channel. 

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

¿Qué es Deepseek? Nuevos rivales de inteligencia artificial chino Chatgpt, OpenAi

Published

on

Línea superior

Una nueva compañía de IA china llamada Deepseek disparó a la cima de las listas de aplicaciones y se sacudió las acciones de Global Tech el lunes después de que obtuvo calificaciones de alto rendimiento a la par con los principales rivales estadounidenses a pesar de que aparentemente carecen del acceso a los chips de vanguardia, impulsados ​​por las afirmaciones de la compañía desarrolladas Sus modelos a una fracción del costo necesario para las plataformas estadounidenses.

Hechos clave

La startup de Deepseek tiene menos de dos años, fue fundada en 2023 por el empresario chino de 40 años Liang Wenfeng, y lanzó sus modelos de código abierto para descargar en los Estados Unidos a principios de enero, donde desde entonces ha aumentado al La parte superior de los gráficos de descarga de iPhone, superando la aplicación para el chatgpt de Openai.

El último producto de Deepseek, un modelo de razonamiento avanzado llamado R1, se ha comparado favorablemente con los mejores productos de Operai y Meta, al tiempo que parece ser más eficiente, con costos más bajos para entrenar y desarrollar modelos y posiblemente haberse hecho sin depender de la IA más poderosa. Aceleradores que son más difíciles de comprar en China debido a los controles de exportación de los Estados Unidos.

Los modelos R1 y V3 de la compañía se clasifican en el Top 10 en el chatbot Arena, una plataforma de rendimiento organizada por la Universidad de California, Berkeley, y la compañía dice que está obteniendo casi tan bien o superando modelos rivales en tareas matemáticas, conocimiento general y cuestión de preguntas y preguntas -y-y-respuesta de referencia de rendimiento.

Deepseek dijo que la capacitación de uno de sus últimos modelos costó $ 5.6 millones, lo que sería mucho menos que el director ejecutivo de $ 100 millones a $ 1 mil millones de una IA estimó que cuesta construir un modelo el año pasado, aunque el analista de Bernstein, Stacy Rasgon, luego llamó a las cifras de Deepseek muy engañosas.

A pesar de las preguntas que quedan sobre el verdadero costo y el proceso para construir los productos de Deepseek, todavía enviaron el mercado de valores a un pánico: Microsoft (menos de 3.7%a las 11:30 a.m. ET), Tesla (1.3%), Nvidia (15%) y Broadcom (16%) se resbaló el lunes después de una venta de una venta de una venta de SE VOLVER por el éxito de Deepseek, y el NASDAQ pesado por la tecnología disminuyó un 3,5% en el camino a su tercer día de los últimos dos años.

Obtenga alertas de mensajes de texto de Breaking News: Estamos lanzando alertas de mensajes de texto para que siempre sepa las historias más grandes que dan forma a los titulares del día. Envíe “alertas” de texto a (201) 335-0739 o registrarse aquí.

Cita crucial

“Deepseek R1 es el momento Sputnik de AI”, dijo el domingo el inversor multimillonario Marc Andressen.

Gran número

1.6 millones. Esa es cuántas veces se había descargado la aplicación Mobile Deepseek hasta el sábado, informó Bloomberg, la aplicación No. 1 en las tiendas de iPhone en Australia, Canadá, China, Singapur, Estados Unidos y el Reino Unido

¿Cómo uso Deepseek?

Deepseek es gratuito en Web, APP y API, pero requiere que los usuarios creen una cuenta.

¿Cómo se compara Deepseek con OpenAi y Chatgpt?

Deepseek-R1 es más similar al modelo O1 de OpenAI, que cuesta a los usuarios $ 200 por mes. Ambos son modelos de idiomas grandes con capacidades de razonamiento avanzado, diferentes de los chatbots de preguntas y respuestas de forma corta como el chatgtp de Openai. R1 y O1 se especializan en desglosar las solicitudes en una cadena de “pensamientos” lógicos y examinar cada uno individualmente. R1 ha logrado el rendimiento a la par con O1 en varios puntos de referencia y, según los informes, superó su rendimiento en la prueba Math-500. Chatbot Arena actualmente clasifica a R1 como empatado en el tercer mejor modelo de IA que existe, con O1 en cuarto lugar.

¿Es el código abierto Deepseek-R1?

Sí. Deepseek-R1 está disponible para que cualquiera pueda acceder, usar, estudiar, modificar y compartir, y no está restringido por licencias propietarias.

¿Quién posee Deepseek?

Deepseek opera de forma independiente, pero es financiado únicamente por High-Flyer, un fondo de cobertura de $ 8 mil millones también fundado por Wenfeng. La compañía lanzó su primer producto en noviembre de 2023, un modelo diseñado para la codificación de tareas, y sus lanzamientos posteriores, todos notables por sus bajos costos, obligaron a otros gigantes tecnológicos chinos a reducir sus precios del modelo de IA para seguir siendo competitivos. En una entrevista el año pasado, Wenfeng dijo que la compañía no tiene como objetivo obtener ganancias excesivas y precios de sus productos solo un poco por encima de sus costos.

¿Deepseek es realmente tan barato?

No todos están comprando las afirmaciones de que Deepseek hizo R1 con un presupuesto reducido y sin la ayuda de chips de IA de fabricación estadounidense. El CEO de Scale AI, Alexandr Wang, dijo a CNBC el jueves (sin evidencia) Deepseek construyó su producto utilizando aproximadamente 50,000 chips Nvidia H100 que no puede mencionar porque violaría los controles de exportación estadounidenses que prohíben la venta de tales chips a las empresas chinas. El multimillonario Elon Musk apoyó la teoría y dijo que era “obviamente” cierto en una publicación sobre X. Rasgon expresó pensamientos similares en una nota el lunes, escribiendo que Deepseek no cuantificaba los recursos que utilizaba para desarrollar el modelo R1 en sus informes y que “Las modelos se ven fantásticas … no creemos que sean milagros”. También dijo que la estimación de costos de $ 5 millones puede representar con precisión lo que Deepseek pagó para alquilar cierta infraestructura para capacitar a sus modelos, pero excluye la investigación anterior, experimentos, algoritmos, datos y costos asociados con la construcción de sus productos.

Que ver

Qué gran éxito Nvidia, el fabricante de chips de inteligencia artificial muy buscado, lleva el lunes. La compañía está rastreando hacia una pérdida del 11%, o $ 400 mil millones, que sería la mayor pérdida de valor de un solo día para cualquier empresa. Ese registro ya está en manos de Nvidia, que cayó casi un 10% en septiembre para perder $ 280 mil millones en valor de mercado.

Fondo clave

China y los Estados Unidos son los principales jugadores en la carrera armamentista de inteligencia artificial que parecía ser dirigida principalmente por las empresas estadounidenses OpenAi (respaldadas por Microsoft), Meta y Alphabet. La semana pasada, el presidente Donald Trump respaldó el plan de infraestructura Stargate de $ 500 mil millones de OpenAI para superar a sus compañeros y, al anunciar su apoyo, habló específicamente sobre la importancia del dominio estadounidense sobre China en el espacio de la IA. La inteligencia artificial está impulsada en gran medida por chips semiconductores de alta tecnología y de alto dólar que proporcionan la potencia de procesamiento necesaria para realizar cálculos complejos y manejar grandes cantidades de datos de manera eficiente. Y aunque no todos los fabricantes de chips semiconductores más grandes son estadounidenses, muchos, incluidos Nvidia, Intel y Broadcom, están diseñados en los Estados Unidos. En 2022, Estados Unidos comenzó a limitar las exportaciones de semiconductores a China en un intento de obstaculizar la capacidad del país para avanzar en la IA por solicitudes militares u otras amenazas de seguridad nacional.

Lectura adicional

ForbesNvidia stock hunde 15%, la mayor pérdida de la historia, como la alarma de los aguas profundas se sacude, cariñoForbesPanic de Deepseek: aquí está por qué las existencias tecnológicas se están aplastando a medida que Nasdaq cambia el peor día de 2025ForbesDeepseek Rattles Tech Stocks: la startup china contra los desafíos de OpenAI US AI LeadForbesEl rival chino de chatgpt Deepseek está haciendo olas en Silicon Valley a pesar de los bordillos de EE. UU.

Continue Reading

Noticias

Esto es lo que debes saber

Published

on

El lunes, la startup china de inteligencia artificial DeepSeek tomó el codiciado lugar de su rival OpenAI como la aplicación gratuita más descargada en los EE. UU. Manzana‘s App Store, destronando a ChatGPT para el asistente de inteligencia artificial de DeepSeek. Las acciones tecnológicas mundiales se vendieron y estaban en camino de eliminar miles de millones en capitalización de mercado.

Líderes tecnológicos, analistas, inversores y desarrolladores dicen que la exageración (y el consiguiente temor de quedarse atrás en el siempre cambiante ciclo exagerado de la IA) puede estar justificada. Especialmente en la era de la carrera armamentista generativa de la IA, donde tanto los gigantes tecnológicos como las nuevas empresas compiten para asegurarse de no quedarse atrás en un mercado que se prevé superará el billón de dólares en ingresos dentro de una década.

¿Qué es DeepSeek?

DeepSeek fue fundada en 2023 por Liang Wenfeng, cofundador de High-Flyer, un fondo de cobertura cuantitativo centrado en la IA. Según se informa, la startup de IA surgió de la unidad de investigación de IA del fondo de cobertura en abril de 2023 para centrarse en grandes modelos de lenguaje y alcanzar la inteligencia artificial general, o AGI, una rama de la IA que iguala o supera al intelecto humano en una amplia gama de tareas, que OpenAI y sus rivales dicen que lo están persiguiendo rápidamente. DeepSeek sigue siendo propiedad total de High-Flyer y financiado por ella, según analistas de Jefferies.

Los rumores en torno a DeepSeek comenzaron a cobrar fuerza a principios de este mes, cuando la startup lanzó R1, su modelo de razonamiento que rivaliza con el o1 de OpenAI. Es de código abierto, lo que significa que cualquier desarrollador de IA puede usarlo, y se ha disparado a la cima de las tiendas de aplicaciones y tablas de clasificación de la industria, y los usuarios elogian su rendimiento y capacidades de razonamiento.

Al igual que otros chatbots chinos, tiene sus limitaciones cuando se le pregunta sobre ciertos temas: cuando se le pregunta sobre algunas de las políticas del líder chino Xi Jinping, por ejemplo, DeepSeek supuestamente aleja al usuario de líneas de preguntas similares.

Otra parte clave de la discusión: el R1 de DeepSeek se construyó a pesar de que Estados Unidos limitó las exportaciones de chips a China tres veces en tres años. Las estimaciones difieren sobre cuánto cuesta exactamente el R1 de DeepSeek o cuántas GPU se incluyen en él. Los analistas de Jefferies estimaron que una versión reciente tenía un “coste de capacitación de sólo 5,6 millones de dólares (suponiendo un costo de alquiler de 2 dólares por hora y 800 horas). Eso es menos del 10% del costo de Meta‘s Llama.” Pero independientemente de las cifras específicas, los informes coinciden en que el modelo fue desarrollado a una fracción del costo de los modelos rivales por OpenAI, Anthropic, Google y otros.

Como resultado, el sector de la IA está inundado de preguntas, entre ellas si el creciente número de rondas de financiación astronómicas y valoraciones de miles de millones de dólares de la industria es necesaria, y si una burbuja está a punto de estallar.

Lea más informes de CNBC sobre IA

Acciones de NVIDIA cayó un 11%, con el fabricante de chips ASML bajó más del 6%. El Nasdaq cayó más del 2% y cuatro gigantes tecnológicos… Meta, microsoft, Manzana y ASML están listos para informar sus ganancias esta semana.

Los analistas de Raymond James detallaron algunas de las preguntas que afectan a la industria de la IA este mes y escribieron: “¿Cuáles son las implicaciones para la inversión? ¿Qué dice sobre los modelos de código abierto versus los propietarios? ¿Invertir dinero en GPU es realmente una panacea? ¿Existen restricciones a las exportaciones de Estados Unidos? ¿Cuáles son las implicaciones más amplias de [DeepSeek]? Bueno, podrían ser espantosos o no ser un evento, pero tengan la seguridad de que la industria está llena de incredulidad y especulación”.

Los analistas de Bernstein escribieron en una nota el lunes que “según las muchas (ocasionalmente histéricas) tomas calientes que vimos [over the weekend,] las implicaciones van desde ‘Eso es realmente interesante’ hasta ‘Esta es la sentencia de muerte del complejo de infraestructura de IA tal como lo conocemos'”.

Cómo están respondiendo las empresas estadounidenses

Algunos directores ejecutivos de tecnología estadounidenses están luchando por responder antes de que los clientes cambien a ofertas potencialmente más baratas de DeepSeek, y se informa que Meta está iniciando cuatro “salas de guerra” relacionadas con DeepSeek dentro de su departamento de IA generativa.

microsoft El director ejecutivo Satya Nadella escribió en X que el fenómeno DeepSeek era solo un ejemplo de la paradoja de Jevons: “A medida que la IA se vuelva más eficiente y accesible, veremos cómo su uso se dispara, convirtiéndola en un bien del que simplemente no podemos tener suficiente”. “. El director ejecutivo de OpenAI, Sam Altman, tuiteó una cita que atribuyó a Napoleón y escribió: “Una revolución no se puede hacer ni detener. Lo único que se puede hacer es que uno de sus hijos le dé una dirección a fuerza de victorias”.

Yann LeCun, científico jefe de IA de Meta, escribió en LinkedIn que el éxito de DeepSeek es indicativo del cambio de rumbo en el sector de la IA para favorecer la tecnología de código abierto.

LeCun escribió que DeepSeek se ha beneficiado de parte de la tecnología propia de Meta, es decir, sus modelos Llama, y ​​que la startup “ideó nuevas ideas y las construyó sobre el trabajo de otras personas. Debido a que su trabajo está publicado y es de código abierto, todos pueden sacar provecho de ello. Ese es el poder de la investigación abierta y del código abierto”.

Alexandr Wang, director ejecutivo de Scale AI, dijo a CNBC la semana pasada que el último modelo de IA de DeepSeek fue “revolucionario” y que su versión R1 es aún más poderosa.

“Lo que hemos descubierto es que DeepSeek… tiene el mejor rendimiento, o aproximadamente está a la par de los mejores modelos estadounidenses”, dijo Wang, añadiendo que la carrera de IA entre EE.UU. y China es una “guerra de IA”. La empresa de Wang proporciona datos de entrenamiento a actores clave de la IA, incluidos OpenAI, Google y Meta.

A principios de esta semana, el presidente Donald Trump anunció una empresa conjunta con OpenAI, Oracle y SoftBank para invertir miles de millones de dólares en infraestructura de IA en Estados Unidos. El proyecto, Stargate, fue presentado en la Casa Blanca por Trump, el director ejecutivo de SoftBank, Masayoshi Son, el cofundador de Oracle, Larry Ellison, y el director ejecutivo de OpenAI, Sam Altman. Los socios tecnológicos iniciales clave incluirán a Microsoft, Nvidia y Oracle, así como a la empresa de semiconductores Arm. Dijeron que invertirían 100.000 millones de dólares para empezar y hasta 500.000 millones de dólares en los próximos cuatro años.

IA evolucionando

La noticia de la destreza de DeepSeek también llega en medio del creciente revuelo en torno a los agentes de IA (modelos que van más allá de los chatbots para completar tareas complejas de varios pasos para un usuario) que tanto los gigantes tecnológicos como las nuevas empresas están persiguiendo. Meta, Google, Amazon, Microsoft, OpenAI y Anthropic han expresado su objetivo de crear IA agente.

Anthropic, la startup de IA respaldada por Amazon y fundada por ex ejecutivos de investigación de OpenAI, intensificó su desarrollo tecnológico durante el año pasado y, en octubre, la startup dijo que sus agentes de IA podían usar computadoras como humanos para completar tareas complejas. La capacidad de uso de computadoras de Anthropic permite que su tecnología interprete lo que hay en la pantalla de una computadora, seleccione botones, ingrese texto, navegue por sitios web y ejecute tareas a través de cualquier software y navegación por Internet en tiempo real, dijo la startup.

La herramienta puede “usar computadoras básicamente de la misma manera que nosotros”, dijo a CNBC Jared Kaplan, director científico de Anthropic, en una entrevista en ese momento. Dijo que puede realizar tareas con “decenas o incluso cientos de pasos”.

OpenAI lanzó una herramienta similar la semana pasada, introduciendo una función llamada Operador que automatizará tareas como planificar vacaciones, completar formularios, hacer reservas en restaurantes y pedir alimentos.

El microsoft-La startup respaldada lo describe como “un agente que puede ir a la web para realizar tareas por usted” y agregó que está capacitado para interactuar con “los botones, menús y campos de texto que la gente usa a diario” en la web. También puede hacer preguntas de seguimiento para personalizar aún más las tareas que realiza, como información de inicio de sesión para otros sitios web. Los usuarios pueden tomar el control de la pantalla en cualquier momento.

Continue Reading

Noticias

Esto es lo que debes saber: NBC 6 South Florida

Published

on

  • El zumbido alrededor de la startup de IA China Deepseek comenzó a recoger a Steam a principios de este mes, cuando la startup lanzó R1, su modelo de razonamiento que rivaliza con el O1 de Openai.
  • El lunes, Deepseek se hizo cargo del lugar codiciado de su rival Openai para la aplicación gratuita más descargada en los EE. UU. En la App Store de Apple, destronando a Chatgpt para el asistente de IA de Deepseek.
  • Global Tech Stocks se vendió, con el gigante de chip de IA Nvidia cayendo un 10%.

El lunes, la startup de inteligencia artificial china Deepseek se hizo cargo del lugar codiciado de su rival Openai como la aplicación gratuita más desactivada en los EE. UU. En la tienda de aplicaciones de Apple, destronando Chatgpt para el asistente de IA de Deepseek. Las acciones de Global Tech se vendieron y estaban en camino de acabar con miles de millones en el límite de mercado.

Los líderes tecnológicos, analistas, inversores y desarrolladores dicen que el bombo, y el consiguiente temor de quedarse atrás en el ciclo de bombo de IA en constante cambio, pueden estar justificados. Especialmente en la era de la carrera armamentista generativa de IA, donde los gigantes tecnológicos y las startups están corriendo para garantizar que no se queden atrás en un mercado previsto para superar los ingresos de $ 1 billón en una década.

¿Qué es Deepseek?

Deepseek fue fundada en 2023 por Liang Wenfeng, cofundador de High-Flyer, un fondo cuantitativo de cobertura centrado en la IA. Según los informes, la startup de IA surgió de la Unidad de Investigación de AI del fondo de cobertura en abril de 2023 para centrarse en modelos de idiomas grandes y alcanzar la inteligencia general artificial, o AGI, una rama de IA que iguala o supere el intelecto humano en una amplia gama de tareas, que se abren. Y sus rivales dicen que están persiguiendo rápidamente. Deepseek sigue siendo propiedad y financiado por High-Flyer, según analistas de Jefferies.

El zumbido alrededor de Deepseek comenzó a recoger a Steam a principios de este mes, cuando la startup lanzó R1, su modelo de razonamiento que rivaliza con el O1 de OpenAI. Es de código abierto, lo que significa que cualquier desarrollador de IA puede usarlo, y se ha disparado a la cima de las tiendas de aplicaciones y las tablas de clasificación de la industria, con los usuarios elogios de su rendimiento y capacidades de razonamiento.

Al igual que otros chatbots chinos, tiene sus limitaciones cuando se les pregunta sobre ciertos temas: cuando se le pregunta sobre algunas de las políticas del líder chino Xi Jinping, por ejemplo, Deepseek aleja al usuario de líneas similares de preguntas.

Otra parte clave de la discusión: R1 de Deepseek se construyó a pesar de las exportaciones de chips de EE. UU. A China tres veces en tres años. Las estimaciones difieren exactamente en la cantidad de R1 de Deepseek, o en cuántas GPU entró. Los analistas de Jefferies estimaron que una versión reciente tenía un “costo de capacitación de solo US $ 5,6 millones (suponiendo un costo de alquiler de US $ 2/h800 horas). Eso es menos del 10% del costo de la LLAMA de Meta”. Pero independientemente de los números específicos, los informes acuerdan que el modelo se desarrolló a una fracción del costo de los modelos rivales por OpenAI, Anthrope, Google y otros.

Como resultado, el sector de la IA está inundado de preguntas, incluido si es necesario el creciente número de rondas de financiación astronómica y las valoraciones de mil millones de dólares, y si una burbuja está a punto de estallar.

Las acciones de NVIDIA cayeron un 11%, con el fabricante de chips ASML más del 6%. El NASDAQ cayó por 2%, y cuatro gigantes tecnológicos: Meta, Microsoft, Apple y ASML están listos para informar las ganancias esta semana.

Los analistas de Raymond James detallaron algunas de las preguntas que afectan a la industria de la IA este mes, escribiendo: “¿Cuáles son las implicaciones de inversión? ¿Qué dice sobre los modelos de origen abierto versus patentado? ¿Está arrojando dinero a las GPU realmente una panacea? trabajando? ¿Cuáles son las implicaciones más amplias de [DeepSeek]? Bueno, podrían ser terribles o un no evento, pero tengan la seguridad de que la industria está llena de incredulidad y especulación “.

Los analistas de Bernstein escribieron en una nota el lunes que “según las muchas tomas (ocasionalmente histéricas) que vimos que vimos [over the weekend,] El rango de implicaciones en cualquier lugar desde ‘eso es realmente interesante’ hasta ‘Esta es la luz de muerte del complejo de infraestructura de IA tal como lo conocemos’ “.

Cómo están respondiendo las empresas estadounidenses

Algunos CEO de tecnología estadounidense están trepando por responder antes de que los clientes cambien a ofertas potencialmente más baratas de Deepseek, y Según los informes, Meta inicia cuatro “salas de guerra” relacionadas con Deepseek dentro de su departamento generativo de IA.

El CEO de Microsoft, Satya Nadella, escribió en X que el fenómeno de Deepseek era solo un ejemplo de la paradoja de Jevons, escribiendo, “A medida que AI se vuelve más eficiente y accesible, veremos su uso Skyroocket, convirtiéndolo en una mercancía, simplemente no podemos obtener suficiente de.” El CEO de Operai, Sam Altman, tuiteó una cita que atribuyó a Napoleón, escribiendo: “Una revolución no se puede hacer ni detener.

Yann Lecun, el jefe científico de AI de Meta, escribió en LinkedIn que el éxito de Deepseek es indicativo de cambiar las mareas en el sector de IA para favorecer la tecnología de código abierto.

Lecun escribió que Deepseek se ha beneficiado de algunas de la propia tecnología de Meta, es decir, sus modelos de llama, y ​​que la startup “se les ocurrió nuevas ideas y las construyó en la parte superior del trabajo de otras personas. Debido a que su trabajo es publicado y de código abierto, todos pueden Se beneficia de él.

Alexandr Wang, CEO de Scale AI, le dijo a CNBC la semana pasada que el último modelo de IA de Deepseek fue “devastador de la tierra” y que su lanzamiento de R1 es aún más poderoso.

“Lo que hemos encontrado es que Deepseek … es el mejor desempeño, o aproximadamente a la par con los mejores modelos estadounidenses”, dijo Wang, y agregó que la carrera de IA entre los Estados Unidos y China es una “guerra de IA”. La compañía de Wang proporciona datos de capacitación a jugadores clave de IA, incluidos OpenAI, Google y Meta.

A principios de esta semana, presidente Donald Trump anunció una empresa conjunta con OpenAI, Oracle y Softbank para invertir miles de millones de dólares en infraestructura de IA de EE. UU. El proyecto, Stargate, fue presentado en la Casa Blanca por Trump, el CEO de SoftBank, Masayoshi,, cofundador Larry Ellison, y el CEO de Operai, Sam Altman. Los socios de tecnología iniciales clave incluirán Microsoft, Nvidia y Oracle, así como el brazo de la compañía de semiconductores. Dijeron que invertirían $ 100 mil millones para comenzar y hasta $ 500 mil millones en los próximos cuatro años.

AI evolucionando

La noticia de la destreza de Deepseek también se produce en medio de la creciente exageración en torno a los agentes de IA, modelos que van más allá de los chatbots para completar tareas complejas de varios pasos para un usuario, que los gigantes tecnológicos y las startups están persiguiendo. Meta, Google, Amazon, Microsoft, Openai y Anthrope han expresado su objetivo de construir IA de agente.

Anthrope, la startup de IA respaldada por Amazon fundada por ex ejecutivos de investigación de Openai, aumentó su desarrollo de tecnología durante el año pasado, y en octubre, la startup dijo que sus agentes de IA pudieron usar computadoras como humanos para completar tareas complejas. La capacidad de uso de la computadora de Anthrope permite que su tecnología interprete lo que está en la pantalla de una computadora, seleccione botones, ingrese texto, navegue por los sitios web y ejecute tareas a través de cualquier software y navegación en Internet en tiempo real, dijo la startup.

La herramienta puede “usar computadoras básicamente de la misma manera que lo hacemos”, dijo Jared Kaplan, director científico de Anthrope, a CNBC en una entrevista en ese momento. Dijo que puede hacer tareas con “decenas o incluso cientos de pasos”.

Openai lanzó una herramienta similar la semana pasada, presentando una característica llamada operador que automatizará tareas como planificar vacaciones, completar formularios, hacer reservas de restaurantes y ordenar comestibles.

La startup respaldada por Microsoft lo describe como “un agente que puede ir a la web para realizar tareas para usted”, y agregó que está capacitado para interactuar con “los botones, los menús y los campos de texto que las personas usan a diario” en la web . También puede hacer preguntas de seguimiento para personalizar aún más las tareas que completa, como la información de inicio de sesión para otros sitios web. Los usuarios pueden tomar el control de la pantalla en cualquier momento.

Continue Reading

Trending