Noticias
¿OpenAI creó la primera AGI con o3?
Hacia AGI
En la carrera por desarrollar un modelo de IA, el objetivo final es la AGI (Inteligencia General Artificial). Se trata de un tipo de IA que puede manejar cualquier tipo de situación, en lugar de estar ultraespecializada para realizar algunas tareas, como por ejemplo conducir un coche.
Mientras solo tengamos IA especializadas, habrá más algoritmos que inteligencia real. La capacidad de deducir reglas y reaccionar ante nuevas situaciones, y quizás lo más importante, el verdadero razonamiento sería un evento trascendental en la historia de la humanidad, ya que dicha AGI probablemente rápidamente se volvería al menos similar a la humana.
Y, por supuesto, sin estar limitado por la restricción computacional del “wetware” de un solo cráneo humano, dicha AGI podría seguir mejorando rápidamente y convertirse en una superinteligencia de ciencia ficción.
Esto inmediatamente genera imágenes de una utopía similar a Star Trek o de apocalipsis de robots como Terminator o Battlestar Galactica.
Obviamente, fue un titular importante cuando OpenAI anunció el 20 de diciembre.th que su último modelo AI 03, “al menos en determinadas condiciones, se acerca a AGI, con importantes salvedades.“
Modelos abiertos AI
o3 es la última versión de la serie “o” de la compañía, después de la anterior o1 (no existe o2, debido a un posible conflicto de marcas con la compañía británica de telecomunicaciones del mismo nombre).
Viene junto con otras IA ultra avanzadas desarrolladas por OpenAI: ChatGPT (generación de texto), DALL-E (generación de texto a imagen), Sora (generación de texto a video), JukeBox (generación de música) y Whisper ( voz a texto).
o1 y o3
Lanzado en septiembre de 2024, el modelo o1 se creó para tomar más tiempo para pensar en sus respuestas, lo que genera una mayor precisión. Esto es importante, ya que se sabe que servicios como ChatGPT simplemente adivinan cosas que no saben o simplemente las inventa.
Si bien esto a veces puede estar bien para un chatbot, no es una opción aceptable para funciones críticas. Tampoco parece encaminarnos directamente hacia la inteligencia artificial real.
o1 se incluyó a principios de diciembre de 2024 en la suscripción ChatGPT Pro de $200 al mes, aunque otros usuarios también pueden acceder a ella.
o3 ha sido presentado el 20th diciembre, así como o3-mini, una versión más ligera y rápida. El modelo aún no está disponible para uso público, pero los investigadores de seguridad pueden registrarse para obtener una vista previa de o3-mini.
¿Un modelo mentiroso?
Los comentarios de los investigadores de seguridad serán lo que la comunidad tecnológica más querrá escuchar.
Una vez más, evocando Skynet de Terminator, o1 destacó por su fuerte propensión a mentir a sus usuarios. Si bien no es específico de este modelo, era mucho más probable que lo hiciera que otras IA de empresas competidoras como Meta, Google o Microsoft.
Cuando los objetivos de o1 diferían de los de un usuario, y se le dijo a o1 que los persiguiera firmemente, el modelo de IA manipuló los datos para avanzar en su propia agenda el 19% de las veces, según el informe. El modelo o1 también intentó desactivar los mecanismos de supervisión implementados para garantizar que se mantenga alineado con los objetivos del usuario en el 5% de las pruebas.
Maxwell Zeff para TechCrunch
¿Cómo se desempeña o3 en ese sentido? ¿OpenAI ha reducido la tendencia de su modelo a mentir con la actualización de o3? No lo sabemos todavía.
o3 Actuaciones
Una característica adicional de o3 en comparación con su predecesor es la posibilidad de ajustar el “tiempo de razonamiento”. Esto permite a los usuarios ajustar cuánta potencia computacional y tiempo desean asignar a la pregunta.
Codificación
O1 ya era notablemente bueno en codificación y podía aprobar la entrevista de contratación de ingenieros de investigación de OpenAI para codificación en una tasa del 90-100%. Parece que o3 es incluso mejor cuando se compara con pruebas de habilidades de codificación.
También cabe señalar que esto acabó con toda la competencia del agua, incluido el Gemini 2.0 lanzado recientemente por Google.
Matemáticas y Ciencias
Quizás más que el servicio al cliente o el razonamiento “humano”, el campo más prometedor para la IA actualmente es la aceleración de la tecnología y las ciencias.
También en este caso o3 mejoró radicalmente el rendimiento de las IA anteriores. Más importante aún, puede responder adecuadamente preguntas de matemáticas a nivel de doctorado con una precisión del 87,7%, que es mejor que la mayoría de los humanos, incluso los humanos con formación en matemáticas que obtienen una puntuación de alrededor del 70%.
Si o3 puede comprender tan bien cuestiones matemáticas complejas, es probable que a largo plazo pueda responder preguntas igualmente complejas sobre ciencias de los materiales, química o biotecnología.
¿Es AGI?
Ahora, la afirmación de que o3 está cerca de AGI ha estado agitando el espacio de la IA desde que se anunció el modelo. Por supuesto, no se esperaba poder superar a muchos humanos con nivel de doctorado en matemáticas.
François Chollet, investigador de IA y cocreador de ARCO-AGI (Abstract and Reasoning Corpus for Artificial General Intelligence), un punto de referencia para medir la eficiencia de la adquisición de habilidades de IA en tareas desconocidas. dice que se está acercando:
OpenAI anunció hoy o3, su modelo de razonamiento de próxima generación. Hemos trabajado con OpenAI para probarlo en ARC-AGI y creemos que representa un avance significativo para lograr que la IA se adapte a tareas novedosas.
Obtiene una puntuación del 75,7 % en la evaluación semiprivada en modo de computación baja (por $20 por tarea en computación) y del 87,5 % en modo de computación alta (miles de dólares por tarea).
El costo tan alto plantea la cuestión de qué tan escalable es este enfoque, ya que es posible que pueda aplicar o3 de alto nivel solo a tareas muy costosas para que valga la pena.
Al mismo tiempo, si algo nos han enseñado las últimas décadas es que la potencia informática tiende a abaratarse mucho con el tiempo.
Por lo tanto, no es una prueba de que o3, o una futura iteración oX del sistema, no se utilice de forma rutinaria en los institutos de investigación para brindar asistencia a los investigadores humanos para desbloquear nuevas fronteras de la ciencia.
Por supuesto, ¿podemos realmente medir la inteligencia a través de las matemáticas y las habilidades de codificación? Esto es algo que puede resultar un poco incómodo para la mayoría de las personas centradas en la tecnología, pero estas habilidades no son el fin de la inteligencia.
A largo plazo, nos acercaremos al verdadero AGI cuando la misma IA pueda realizar muchas tareas no relacionadas a la vez, desde conducir un automóvil hasta problemas matemáticos y de codificación, navegar por situaciones y elementos del mundo real, etc.
Sin embargo, parece que cada día estamos más cerca.
Límites
Además de las limitaciones técnicas del desempeño de o3, hay tres preguntas que la industria de la IA deberá responder para que su visión de AGI se haga realidad.
Más grande no siempre es mejor
Primero, necesita determinar si sus métodos actuales son escalables hasta niveles AGI. Por ahora, una gran parte del método ha consistido en “arrojar” más datos y calcular el problema. Pero es posible que muy pronto nos quedemos sin datos nuevos, y el contenido generado por IA no puede retroalimentarse a los modelos de IA sin causar que colapsen.
Probablemente será necesaria una mejora cualitativa además de centros de datos cada vez más grandes.
Precios y costos de energía
Hablando de centros de datos más grandes, la industria tecnológica ahora está mirando centros de datos a escala de gigavatios. No es casualidad que estemos empezando a medirlos por su consumo de energía en lugar de por su capacidad de cálculo.
es porque El factor limitante pronto no será la potencia de los chips utilizados, sino el suministro de energía eléctrica disponible.. Esta es la razón Microsoft primeroy luego todas las demás grandes empresas tecnológicas, están luchando por asegurar el suministro de electricidad de las centrales nucleares para sus centros de datos de inteligencia artificial.
Y si algo nos ha enseñado la lucha contra las emisiones de carbono es que aumentar la generación de energía con bajas emisiones de carbono es un hueso mucho más difícil de resolver que crear centros de datos más grandes.
Este también es un sector donde la reducción de costos no seguirá la Ley de Moore, lo que probablemente hará que la futura reducción de los costos de la IA sea mucho más moderada de lo que desearíamos.
Por lo tanto, aquí también será necesaria una mejora cualitativa de la demanda de IA, al menos si se eliminan algunas de las limitaciones actuales a la IA.
¿Superinteligencias?
Cuando nos acerquemos a la AGI, ¿será un umbral máximo que alcanzar o simplemente un paso en el camino para crear una IA más inteligente que los humanos?
Es una pregunta importante, ya que se trata de una perspectiva igualmente fascinante y aterradora. Muchos entusiastas del techno están adoptando esta llamada singularidad, donde la IA mejoraría rápidamente en un ciclo de retroalimentación exponencial.
El público en general de los seres humanos comunes y corrientes podría no estar tan entusiasmado.
Entonces, además del riesgo existencial, es probable que la reacción del público y los reguladores sea muy real y llegue antes.
Esto es algo con lo que las empresas de IA probablemente tendrán que luchar, ya que simultáneamente tienen que tranquilizar al público, posiblemente restando importancia a sus logros y al mismo tiempo justificando ante los inversores que invierten cientos de miles de millones de dólares en la tecnología y sus infraestructuras.
Empresa de IA
microsoft
Corporación Microsoft (MSFT -0,31%)
Microsoft ha estado en el centro de la industria tecnológica casi desde sus inicios con su sistema operativo Windows, aún dominante.
Ahora también es líder en software empresarial (Office365, Equipos, LinkedIn, Skype, GitHub), juegos (xbox y múltiples adquisiciones de estudios de videojuegos), y en la nube (Azur).
Más recientemente, logró buenos avances en materia de IA. Esto incluye algo de IA de consumo como el Creador de imágenes de Bing y más iniciativas centradas en los negocios, como Copiloto para Microsoft 365 y Investigación de Microsoft. El copiloto ahora está siendo implementado también en el comercio minorista y en empresas más pequeñas.
Microsoft se ha ganado la reputación de ser el gigante tecnológico centrado en la empresa, en comparación con empresas más centradas en el consumidor como, por ejemplo, Apple o Facebook. Dado que la IA se está volviendo cada vez más importante en los modelos de negocios, la presencia preexistente de Microsoft en la nube y los servicios empresariales debería darle una ventaja en la implementación de la IA a escala y en las adquisiciones de clientes.
Microsoft: el matrimonio desordenado de OpenAI
La colaboración con líderes en desarrollo de IA como OpenAI (famoso por ChatGPT) también está consolidando la posición de Microsoft como potencia de IA.
La relación entre ambos es compleja, ya que OpenAI es técnicamente su propia organización, pero en la práctica se ha vuelto dependiente de los recursos de Microsoft, tanto financieros como computacionales.
“Durante los próximos meses, Microsoft no cedió, ya que OpenAI, que espera perder 5 mil millones de dólares este año, continuó pidiendo más dinero y más potencia informática para construir y ejecutar sus sistemas de IA.
Fuente: Instituto de IA de marketing
Al mismo tiempo, Microsoft está construyendo sus propios proyectos internos de IA. después de adquirir la mayor parte del personal de Inflection.
Se vuelve aún más complicado a medida que OpenAI intenta hacer la transición a un estado con fines de lucro. algo que crea conflicto con patrocinadores anteriores como Elon Musk.
Y aquí el debate sobre AGI se vuelve casi existencial para OpenAI:
“Si OpenAI logra AGI, el acceso de Microsoft a la tecnología de OpenAI quedará nulo. Aún más importante, la junta directiva de OpenAI decide cuándo se alcanza el AGI”.
Fuente: Instituto de IA de marketing
Es probable que o3 todavía no sea AGI, ni lo será un hipotético o5. Pero esto es algo que vale la pena recordar para cualquier inversor potencialmente interesado en Microsoft, y que base su tesis en la relación con OpenAI.