Noticias

El soneto de Claude 3.7 de Anthrope apunta a Operai y Deepseek en la próxima gran batalla de AI

Published

1 mes ago

24 febrero, 2025

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información

Anthrope acaba de disparar un disparo de advertencia a Openai, Deepseek y toda la industria de la IA con el lanzamiento de Claude 3.7 Sonnet, un modelo que brinda a los usuarios un control sin precedentes sobre cuánto tiempo pasa una IA “pensando” antes de generar una respuesta. El lanzamiento, junto con el debut de Claude Code, un agente de codificación de AI de línea de comandos, señala el impulso agresivo de Anthrope en el mercado empresarial de IA, una que podría remodelar cómo las empresas construyen software y automatizan el trabajo.

Las apuestas no podrían ser más altas. El mes pasado, Deepseek sorprendió al mundo tecnológico con un modelo de IA que coincidía con los sistemas estadounidenses a una fracción del costo, enviando las acciones de Nvidia a un 17% y generando alarmas sobre el liderazgo de IA de Estados Unidos. Ahora Anthrope está apostando a que el control preciso sobre el razonamiento de la IA, no solo la velocidad cruda o el ahorro de costos, le dará una ventaja.

Claude 3.7 Sonnet presenta una alternancia de ‘modo de pensamiento’, lo que permite a los usuarios optimizar el tiempo de respuesta de la IA en función de la complejidad de la tarea. (Crédito: antrópico)

“Simplemente creemos que el razonamiento es una parte central y un componente central de una IA, en lugar de una cosa separada a la que tiene que pagar por separado para acceder”, dijo Dianne Penn, quien dirige la gestión de productos para la investigación en Anthrope, en una entrevista con VentureBeat . “Al igual que los humanos, la IA debe manejar respuestas rápidas y un pensamiento complejo. Para una pregunta simple como ‘¿Qué hora es?’, Debería responder al instante. Pero para tareas complejas, como planificar un viaje de dos semanas en Italia al tiempo que acomoda las necesidades dietéticas sin gluten, necesita un tiempo de procesamiento más extenso “.

“No vemos razonamiento, planificación y autocorrección como capacidades separadas”, agregó. “Por lo tanto, esta es esencialmente nuestra forma de expresar esa diferencia filosófica … idealmente, el modelo en sí debería reconocer cuándo un problema requiere un pensamiento y ajuste más intensivo, en lugar de exigir a los usuarios que seleccionen explícitamente diferentes modos de razonamiento”.

Una comparación de los modelos AI muestra el rendimiento del soneto de Claude 3.7 en varias tareas, con ganancias notables en capacidades de pensamiento extendido en comparación con su predecesor. (Crédito: antrópico)

Los datos de referencia respaldan la ambiciosa visión de Anthrope. En el modo de pensamiento extendido, Claude 3.7 Sonnet logra una precisión del 78.2% en las tareas de razonamiento de nivel de posgrado, desafiando los últimos modelos de OpenAI y superan a Deepseek R1.

Pero las métricas más reveladoras provienen de aplicaciones del mundo real: el modelo obtiene un 81.2% en el uso de la herramienta centrada en el comercio minorista y muestra mejoras marcadas en el seguimiento de las instrucciones (93.2%), áreas donde los competidores han tenido problemas o no han publicado resultados.

Mientras que Deepseek y Operai lideran en puntos de referencia de matemáticas tradicionales, el enfoque unificado de Claude 3.7 demuestra que un solo modelo puede cambiar efectivamente entre respuestas rápidas y análisis profundos, eliminando potencialmente la necesidad de que las empresas mantengan sistemas de IA separados para diferentes tipos de tareas.

Cómo la IA híbrida de Anthrope podría remodelar la computación empresarial

El momento de la liberación es crucial. El surgimiento de Deepseek el mes pasado envió ondas de choque a través de Silicon Valley, lo que demuestra que se podría lograr un razonamiento sofisticado de IA con mucho menos poder informático de lo que se pensaba anteriormente. Esto desafió los supuestos fundamentales sobre los costos de desarrollo de IA y los requisitos de infraestructura. Cuando Deepseek publicó sus resultados, las acciones de Nvidia cayeron un 17% en un solo día, los inversores de repente cuestionaron si los chips caros eran realmente esenciales para la IA avanzada.

Para las empresas, las apuestas no podrían ser más altas. Las empresas están gastando millones integrando IA en sus operaciones, apostando a qué enfoque dominará. El modelo híbrido de Anthrope ofrece una ruta media convincente: la capacidad de ajustar el rendimiento de la IA en función de la tarea en cuestión, desde respuestas instantáneas del servicio al cliente hasta un análisis financiero complejo. El sistema mantiene el precio previo de Anthrope de $ 3 por millón de tokens de entrada y $ 15 por millón de tokens de salida, incluso con características de razonamiento adicionales.

Claude 3.7 Sonnet presenta una alternancia de ‘modo de pensamiento’, lo que permite a los usuarios optimizar el tiempo de respuesta de la IA en función de la complejidad de la tarea. (Crédito: antrópico)

“Nuestros clientes están tratando de lograr resultados para sus clientes”, explicó Michael Gerstenhaber, jefe de plataforma de Anthrope. “Usar el mismo modelo y provocar el mismo modelo de diferentes maneras permite a alguien como Thompson Reuters hacer investigación legal, permite que nuestros socios de codificación como Cursor o Github puedan desarrollar aplicaciones y cumplir con esos objetivos”.

El enfoque híbrido de Anthrope representa tanto una evolución técnica como un gambito estratégico. Mientras que OpenAI mantiene modelos separados para diferentes capacidades y Deepseek se centra en la eficiencia de rentabilidad, Anthrope está buscando sistemas unificados que pueden manejar tareas rutinarias y razonamiento complejo. Es una filosofía que podría remodelar cómo las empresas implementan IA, eliminando la necesidad de hacer malabarismos con múltiples modelos especializados.

Conozca el código Claude: el nuevo asistente de desarrollador de AI

Anthrope hoy también presentó Claude Code, una herramienta de línea de comandos que permite a los desarrolladores delegar tareas de ingeniería complejas directamente a la IA. El sistema requiere la aprobación humana antes de cometer cambios en el código, lo que refleja el enfoque creciente de la industria en el desarrollo responsable de la IA.

La interfaz terminal de Claude Code, parte de la nueva suite de herramientas de desarrollador de Anthrope, enfatiza la simplicidad y la interacción directa. (Crédito: antrópico)

“En realidad, todavía tienes que aceptar los cambios que hace Claude. Eres un revisor con la rueda práctica ”, señaló Penn. “Hay esencialmente una especie de lista de verificación que debe aceptar esencialmente para que el modelo tome ciertas acciones”.

Los anuncios vienen en medio de una intensa competencia en el desarrollo de la IA. Los investigadores de Stanford recientemente crearon un modelo de razonamiento de código abierto por menos de $ 50, mientras que Microsoft solo integró el modelo O3-Mini de OpenAI en Azure. El éxito de Deepseek también ha estimulado nuevos enfoques para el desarrollo de la IA, y algunas compañías exploran técnicas de destilación modelo que podrían reducir aún más los costos.

La interfaz de línea de comandos del código Claude permite a los desarrolladores delegar tareas de ingeniería complejas mientras mantienen la supervisión humana. (Crédito: antrópico)

De Pokémon a Enterprise: Probar la nueva inteligencia de AI

Penn ilustró el dramático progreso en las capacidades de IA con un ejemplo inesperado: “Hemos estado pidiendo diferentes versiones de Claude para jugar Pokémon … Esta versión ha llegado a Vermilion City, capturado múltiples Pokémon e incluso se mueve para subir de nivel. Tiene el Pokémon correcto para luchar contra los rivales “.

“Creo que nos verá continuar innovando y impulsando la calidad del razonamiento, empuje hacia cosas como el razonamiento dinámico”, explicó Penn. “Siempre hemos pensado en ello como una parte central de la inteligencia, en lugar de algo separado”.

La prueba real del enfoque de Anthrope vendrá de la adopción empresarial. Si bien jugar Pokémon puede parecer trivial, demuestra el tipo de inteligencia adaptativa que las empresas necesitan: AI que puede manejar las operaciones de rutina y las decisiones estratégicas complejas sin cambiar entre modelos especializados. Las versiones anteriores de Claude no podían navegar más allá de la ciudad inicial de un juego. La última versión construye estrategias, administra recursos y toma decisiones tácticas, capacidades que reflejan la complejidad de los desafíos comerciales del mundo real.

Para los clientes empresariales, esto podría significar la diferencia entre mantener múltiples sistemas de IA para diferentes tareas e implementar una solución única y más capaz. Los próximos meses revelarán si la apuesta de Anthrope sobre el razonamiento de AI unificado remodelará el mercado empresarial o se convertirá en otro experimento en la rápida evolución de la industria.

Insights diarias sobre casos de uso comercial con VB diariamente

Si quieres impresionar a tu jefe, VB Daily te tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI máximo.

Lea nuestra Política de privacidad

Gracias por suscribirse. Mira más boletines de VB aquí.

Ocurrió un error.

Noticias de Inteligencia Artificial

Noticias

El soneto de Claude 3.7 de Anthrope apunta a Operai y Deepseek en la próxima gran batalla de AI

Cómo la IA híbrida de Anthrope podría remodelar la computación empresarial

Conozca el código Claude: el nuevo asistente de desarrollador de AI

De Pokémon a Enterprise: Probar la nueva inteligencia de AI

Leave a Reply

Leave a Reply

Trending

Cómo la IA híbrida de Anthrope podría remodelar la computación empresarial

Conozca el código Claude: el nuevo asistente de desarrollador de AI

De Pokémon a Enterprise: Probar la nueva inteligencia de AI

Leave a Reply Cancelar respuesta

Leave a Reply

Trending

Leave a Reply