Noticias

El científico de OpenAI, Noam Brown, sorprende en la conferencia TED AI: ’20 segundos de pensamiento valen 100.000 veces más datos’

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder en la industria. Más información


Noam Brown, un destacado científico investigador de OpenAI, subió al escenario de la conferencia TED AI en San Francisco el martes para pronunciar un poderoso discurso sobre el futuro de la inteligencia artificial, con especial atención al nuevo modelo o1 de OpenAI y su potencial para transformar industrias. a través del razonamiento estratégico, codificación avanzada e investigación científica. Brown, quien anteriormente impulsó avances en sistemas de inteligencia artificial como libratola IA que juega al póquer y CICERONque dominó el juego de la diplomacia, ahora imagina un futuro en el que la IA no sea solo una herramienta, sino un motor central de innovación y toma de decisiones en todos los sectores.

“El increíble progreso en IA durante los últimos cinco años se puede resumir en una palabra: escala”, comenzó Brown, dirigiéndose a una audiencia cautivada de desarrolladores, inversores y líderes de la industria. “Sí, ha habido avances en el enlace ascendente, pero los modelos de vanguardia de hoy todavía se basan en la misma arquitectura de transformador que se introdujo en 2017. La principal diferencia es la escala de los datos y la computación que se incluye en ellos”.

Brown, una figura central en los esfuerzos de investigación de OpenAI, se apresuró a enfatizar que si bien los modelos de escala han sido un factor crítico en el progreso de la IA, es hora de un cambio de paradigma. Señaló la necesidad de que la IA vaya más allá del mero procesamiento de datos y adopte lo que denominó “pensamiento del sistema dos”, una forma de razonamiento más lenta y deliberada que refleja cómo los humanos abordan problemas complejos.

La psicología detrás del próximo gran salto de la IA: comprender el pensamiento del sistema dos

Para subrayar este punto, Brown compartió una historia de sus días de doctorado cuando trabajaba en libratola IA del juego de póquer que derrotó a los mejores jugadores humanos en 2017.

“Resultó que hacer que un robot pensara durante sólo 20 segundos en una mano de póquer conseguía el mismo rendimiento que ampliar el modelo 100.000 veces y entrenarlo 100.000 veces más”, dijo Brown. “Cuando obtuve este resultado, literalmente pensé que esto lo había roto todo. Durante los primeros tres años de mi doctorado, logré ampliar estos modelos 100 veces. Estaba orgulloso de ese trabajo. Había escrito varios artículos sobre cómo hacer esa ampliación, pero supe rápidamente que todo eso sería una nota a pie de página en comparación con este pensamiento del sistema dos de ampliación”.

La presentación de Brown introdujo el pensamiento del sistema dos como la solución a las limitaciones del escalamiento tradicional. Popularizado por el psicólogo Daniel Kahneman en el libro Pensar, rápido y lentoel pensamiento del sistema dos se refiere a un modo de pensamiento más lento y deliberado que los humanos utilizan para resolver problemas complejos. Brown cree que incorporar este enfoque en los modelos de IA podría conducir a importantes mejoras de rendimiento sin requerir exponencialmente más datos o potencia informática.

Relató que permitir librato Pensar durante 20 segundos antes de tomar decisiones tuvo un efecto profundo, lo que equivale a escalar el modelo 100.000 veces. “Los resultados me dejaron boquiabierto”, dijo Brown, ilustrando cómo las empresas podrían lograr mejores resultados con menos recursos centrándose en el pensamiento del sistema dos.

Dentro de o1 de OpenAI: el modelo revolucionario que requiere tiempo para pensar

La charla de Brown se produce poco después del lanzamiento de los modelos de la serie o1 de OpenAI, que introducen el pensamiento del sistema dos en la IA. Lanzados en septiembre de 2024, estos modelos están diseñados para procesar información con más cuidado que sus predecesores, lo que los hace ideales para tareas complejas en campos como la investigación científica, la codificación y la toma de decisiones estratégicas.

“Ya no estamos obligados a limitarnos a ampliar el sistema con una sola capacitación. Ahora también podemos ampliar el pensamiento del sistema dos, y lo hermoso de ampliarlo en esta dirección es que está en gran medida sin explotar”, explicó Brown. “Esta no es una revolución que está a 10 años o incluso a dos años de distancia. Es una revolución que está ocurriendo ahora”.

Los modelos o1 ya han demostrado un sólido rendimiento en varios puntos de referencia. Por ejemplo, en un examen de calificación para la Olimpiada Internacional de Matemáticas, el modelo o1 logró una tasa de precisión del 83%, un salto significativo con respecto al 13% obtenido por el GPT-4o de OpenAI. Brown señaló que la capacidad de razonar a través de fórmulas matemáticas complejas y datos científicos hace que el modelo o1 sea especialmente valioso para industrias que dependen de la toma de decisiones basada en datos.

El argumento comercial a favor de una IA más lenta: por qué la paciencia vale la pena en las soluciones empresariales

Para las empresas, el modelo o1 de OpenAI ofrece beneficios más allá del rendimiento académico. Brown enfatizó que el pensamiento del sistema dos de escala podría mejorar los procesos de toma de decisiones en industrias como la atención médica, la energía y las finanzas. Usó el tratamiento del cáncer como ejemplo y preguntó a la audiencia: “Levanten la mano si estarían dispuestos a pagar más de 1 dólar por un nuevo tratamiento contra el cáncer… ¿Qué tal 1.000 dólares? ¿Qué tal un millón de dólares?

Brown sugirió que el modelo o1 podría ayudar a los investigadores a acelerar la recopilación y el análisis de datos, permitiéndoles centrarse en interpretar los resultados y generar nuevas hipótesis. En energía, señaló que el modelo podría acelerar el desarrollo de paneles solares más eficientes, lo que podría conducir a avances en energía renovable.

Reconoció el escepticismo sobre los modelos de IA más lentos. “Cuando le menciono esto a la gente, una respuesta frecuente que recibo es que la gente tal vez no esté dispuesta a esperar unos minutos para obtener una respuesta, o pagar unos pocos dólares para obtener una respuesta a la pregunta”, dijo. Pero para los problemas más importantes, argumentó, ese costo bien vale la pena.

La nueva carrera de IA de Silicon Valley: por qué la potencia de procesamiento no lo es todo

El cambio de OpenAI hacia el pensamiento del sistema dos podría remodelar el panorama competitivo de la IA, especialmente en las aplicaciones empresariales. Si bien la mayoría de los modelos actuales están optimizados para la velocidad, el proceso de razonamiento deliberado detrás de o1 podría ofrecer a las empresas información más precisa, particularmente en industrias como las finanzas y la atención médica.

En el sector tecnológico, donde empresas como Google y Meta están invirtiendo fuertemente en IA, el enfoque de OpenAI en el razonamiento profundo lo distingue. Gemini AI de Google, por ejemplo, está optimizado para tareas multimodales, pero aún está por ver cómo se comparará con los modelos de OpenAI en términos de capacidades de resolución de problemas.

Dicho esto, el costo de implementar o1 podría limitar su adopción generalizada. El modelo es más lento y más caro de ejecutar que las versiones anteriores. Los informes indican que el modelo de vista previa o1 cuesta $15 por millón de tokens de entrada y $60 por millón de tokens de salida, mucho más que GPT-4o. Aún así, para las empresas que necesitan resultados de alta precisión, la inversión puede valer la pena.

Al concluir su charla, Brown enfatizó que el desarrollo de la IA se encuentra en un momento crítico: “Ahora tenemos un nuevo parámetro, uno en el que también podemos ampliar el pensamiento del sistema dos, y estamos apenas en el comienzo de la ampliación en este sentido. dirección.”

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version