Noticias

Operai libera el modelo “más grande y conocedor de los conocimientos” GPT-4.5 con alucinaciones reducidas y alto precio de API

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Está aquí: OpenAI ha anunciado el lanzamiento de GPT-4.5, una vista previa de investigación de su último y más poderoso modelo de lenguaje (LLM) para aplicaciones de chat. Desafortunadamente, es el modelo más caro de Openai (más sobre eso a continuación).

Tampoco es un “modelo de razonamiento”, la nueva clase de modelos ofrecidos por Operai, Deepseek, Anthrope y muchos otros que producen “cadenas de pensamiento” o flujo de conciencia, como bloques de texto en los que reflexionan sobre sus propios supuestos y conclusiones para tratar de atrapar errores antes de servir respuestas/salidas a los usuarios. Aún es más un LLM clásico.

No obstante, acordando la publicación del cofundador y CEO de OpenAI Sam Altman en la red social X, GPT-4.5 es: “El primer modelo que se siente como hablar con una persona reflexiva para mí. He tenido varios momentos en los que me he sentado en mi silla y me sorprendió obtener un buen consejo de una IA “.

Sin embargo, advirtió que la compañía está aumentando contra el extremo superior de su suministro de unidades de procesamiento de gráficos (GPU) y ha tenido que limitar el acceso como resultado:

Malas noticias: es un modelo gigante y costoso. Realmente queríamos lanzarlo a Plus y Pro al mismo tiempo, pero hemos estado creciendo mucho y no estamos fuera de las GPU. Agregaremos decenas de miles de GPU la próxima semana y lo lanzaremos al nivel más. (Cientos de miles llegarán pronto, y estoy bastante seguro de que usarán todos los que podamos acumular).

No es así como queremos operar, pero es difícil predecir perfectamente las oleadas de crecimiento que conducen a la escasez de GPU.

A partir de hoy, GPT-4.5 está disponible para los suscriptores del nivel de suscripción más caro de OpenAI, ChatGPT Pro ($ 200 USD/mes) y los desarrolladores de todos los niveles de API pagados, con planes de ampliar el acceso a los niveles más costosos y de equipo ($ 20/$ 30 mensuales) la próxima semana.

GPT – 4.5 puede acceder a la búsqueda y el modo de lienzo ChatGPT de OpenAI, y los usuarios pueden cargar archivos e imágenes, pero aún no tiene otras características multimodales como modo de voz, video y pantallas de pantalla.

Operai está organizando un evento en vivo hoy a las 12 pm Pt/ 3 pm ET, donde los investigadores de OpenAI discutirán el desarrollo y las capacidades del modelo.

https://www.youtube.com/watch?v=cfryp0nitz8

Avance de IA con aprendizaje no supervisado

GPT-4.5 representa un paso adelante en la capacitación de IA, particularmente en el aprendizaje no supervisado, lo que mejora la capacidad del modelo para reconocer patrones, dibujar conexiones y generar ideas creativas.

Durante la transmisión en vivo, los investigadores de Operai notaron cómo fue entrenado en los datos generados por modelos de IA más pequeños y que esto mejoró su “modelo mundial”. También declararon que fue previamente entrenado en múltiples centros de datos simultáneamente, lo que sugiere un enfoque descentralizado similar al de la investigación rival de laboratorio.

Aparentemente, este régimen de entrenamiento ayudó a GPT-4.5 a aprender a producir interacciones más naturales e intuitivas, seguir la intención del usuario con mayor precisión y demostrar una mayor inteligencia emocional.

El modelo se basa en el trabajo previo de OpenAI en la escala de IA, reforzando la idea de que aumentar los datos y calcular la potencia conduce a un mejor rendimiento de la IA.

En comparación con sus predecesores y contemporáneos, se espera que GPT-4.5 produzca menos alucinaciones (37.1% en lugar de 61.8% para GPT-4O), lo que lo hace más confiable en una amplia gama de temas.

¿Qué hace que GPT-4.5 se destaque?

Según OpenAI, GPT-4.5 está diseñado para crear conversaciones cálidas, intuitivas y de flujo natural. Tiene una comprensión más fuerte de los matices y el contexto, lo que permite interacciones más humanas y una mayor capacidad de colaborar de manera efectiva con los usuarios.

La base de conocimiento ampliada del modelo y la capacidad mejorada para interpretar señales sutiles le permiten sobresalir en varias aplicaciones, incluidas:

Asistencia de escritura: Refinar contenido, mejorar la claridad y generar ideas creativas.

Soporte de programación: Depuración, sugerir mejoras de código y automatizar flujos de trabajo.

Resolución de problemas: Proporcionar explicaciones detalladas y ayudar en la toma de decisiones prácticas.

GPT-4.5 también incorpora nuevas técnicas de alineación que mejoran su capacidad para comprender las preferencias e intenciones humanas, mejorando aún más la experiencia del usuario.

Cómo acceder a GPT-4.5

A partir de hoy, los usuarios de ChatGPT Pro pueden seleccionar GPT-4.5 en el selector de modelos en web, móvil y escritorio. La próxima semana, OpenAi comenzará a implementarlo a los usuarios de más y en el equipo.

Para los desarrolladores, GPT-4.5 se está poniendo a disposición a través de la API de OpenAi, incluida la API de finalización de chat, la API de asistentes y la API por lotes. Admite características clave como llamadas de funciones, salidas estructuradas, transmisión, mensajes de sistema e entradas de imágenes, lo que lo convierte en una herramienta versátil para varias aplicaciones basadas en AI. Sin embargo, actualmente no admite capacidades multimodales, como el modo de voz, el video o el intercambio de pantalla.

Precios e implicaciones para los tomadores de decisiones empresariales

Las empresas y los líderes de equipo se beneficiarán significativamente de las capacidades introducidas con GPT-4.5. Con su menor tasa de alucinación, una mejor confiabilidad y habilidades de conversación natural, GPT-4.5 puede respaldar una amplia gama de funciones comerciales:

Compromiso mejorado del cliente: Las empresas pueden integrar GPT-4.5 en sistemas de soporte para interacciones más rápidas y naturales con menos errores.

Generación de contenido mejorada: Los equipos de marketing y comunicaciones pueden producir contenido de alta calidad y en la marca de manera eficiente.

Operaciones simplificadas: La automatización con IA puede ayudar en la depuración, la optimización del flujo de trabajo y la toma de decisiones estratégicas.

Escalabilidad y personalización: La API permite implementaciones personalizadas, lo que permite a las empresas construir soluciones impulsadas por IA adecuadas para sus necesidades.

Al mismo tiempo, el precio para GPT-4.5 a través de la API de OpenAi para desarrolladores de terceros que buscan construir aplicaciones en el modelo parece sorprendentemente alta, a $ 75/$ 180 por millón de tokens de entrada/salida en comparación con $ 2.50/$ 10 para GPT-4O.

Y con otros modelos rivales lanzados recientemente, desde Claude 3.7 de Anthrope hasta Gemini 2 Pro de Google hasta la propia serie “O” de razonamiento de OpenAI (O1, O3-Mini High, O3), la pregunta será si el valor de GPT-4.5s vale la pena el costo relativamente alto, especialmente a través de la API.

Las reacciones tempranas de otros investigadores de IA y usuarios avanzados varían ampliamente

El lanzamiento de GPT-4.5 ha provocado reacciones mixtas de los investigadores de IA y los entusiastas de la tecnología en la red social X, particularmente después de una versión de la “tarjeta del sistema” del modelo (un documento técnico que describe su capacitación y evaluaciones) filtradas anteriormente (incluida a continuación en la parte inferior de este artículo), revelando una variedad de resultados de referencia por delante del anuncio oficial.

La tarjeta del sistema final real publicada por OpenAI después de la fuga contiene diferencias notables, incluida la eliminación de una línea de que “GPT-4.5 no es un modelo fronterizo, pero es el LLM más grande de OpenAI, que mejora la eficiencia computacional de GPT-4 en más de 10 veces”, que según un portavoz de OpenAI resultó no ser precisa. La tarjeta del sistema oficial está aquí en el sitio web de OpenAI, mientras que la versión filtrada se adjunta a continuación.

Teknium (@Teknium1), el cofundador seudónimo del proveedor de modelos de IA rival Nous Research, expresó su decepción en el nuevo modelo, señalando mejoras mínimas en los puntajes de MMLU (comprensión multilingüe) y puntos de referencia de codificación del mundo real en comparación con otros LLM principales.

“Han pasado más de 2 años y más de 1000 veces más capital se ha desplegado desde GPT-4 … ¿Qué pasó?” preguntó.

Otros señalaron que GPT-4.5 tuvo un rendimiento inferior en relación con el modelo O3-Mini de Openi en puntos de referencia de ingeniería de software, lo que plantea preguntas sobre si esta versión representa un progreso significativo.

Sin embargo, algunos usuarios defendieron el potencial del modelo más allá de los puntos de referencia sin procesar.

El desarrollador de software Haider (@slow_developer) destacó la mejora de la eficiencia computacional 10x de GPT-4.5 sobre GPT-4 y sus capacidades más fuertes de uso general en comparación con los modelos O-Series OpenI de OpenAI centrados en el STEM.

El cartel de AI News Andrew Curran (@Andrewcurran_) tomó una visión más cualitativa, prediciendo que GPT-4.5 establecería nuevos estándares en escritura y pensamiento creativo, llamándolo “Opus” de Openi.

Estas discusiones subrayan un debate más amplio en la IA: ¿Deberían medirse el progreso exclusivamente en puntos de referencia, o las mejoras cualitativas en el razonamiento, la creatividad y las interacciones similares a los humanos tienen un mayor valor?

Todavía en la vista previa de la investigación

Operai está posicionando a GPT-4.5 como una vista previa de investigación para obtener información más profunda sobre sus fortalezas y limitaciones. La compañía sigue comprometida a comprender cómo los usuarios interactúan con el modelo e identificando casos de uso inesperados.

“Estamos compartiendo GPT-4.5 como una vista previa de investigación para comprender mejor sus fortalezas y limitaciones”, declaró OpenAI. “La escala del aprendizaje no supervisado continúa impulsando el progreso de la IA, mejorando la precisión, la fluidez y la confiabilidad”.

A medida que OpenAI continúa refinando sus modelos, GPT-4.5 sirve como base para futuros avances de IA, particularmente en el razonamiento y los agentes de uso de herramientas. Si bien GPT-4.5 ya está demostrando capacidades impresionantes, OpenAI está evaluando activamente su papel a largo plazo dentro de su ecosistema.

Con su base de conocimiento más amplia, la inteligencia emocional mejorada y las habilidades de conversación más naturales, GPT-4.5 ofrecerá mejoras significativas para los usuarios en varios dominios. Operai está ansioso por ver cómo los desarrolladores, empresas y empresas integran el modelo en sus flujos de trabajo y aplicaciones.

A medida que AI continúa evolucionando, GPT-4.5 marca otro hito en la búsqueda de OpenAI de modelos de lenguaje más capaces, confiables y alineados por el usuario, prometiendo nuevas oportunidades para la innovación en el panorama empresarial.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version