Connect with us

Noticias

Trump Tanks Tech, Intel y TSMC hacen un acuerdo, y OpenAi establece un récord de recaudación de fondos

Published

on

Las tarifas altas de Trump, impuestas el miércoles por la noche, de alguna manera lograron sorprender a los inversores, ya que las acciones tecnológicas, y casi todas las acciones junto con nuestras 401 (k) s, se despeinaban el jueves, y muchos observadores piensan que incluso ahora el mercado no tiene precios en el impacto total. Es difícil ver cómo todo esto no nos lleva a una recesión, y aún más difícil ver por qué Trump lo está haciendo. No hay ajedrez 3D aquí, solo un tablero de ajedrez pateado en el piso por un narcisista mezquino y maligno. (Pregúntame qué pienso realmente).

Intel y TSMC han llegado a un acuerdo preliminar para que una empresa conjunta opere las fábricas de chips de Intel, con TSMC tomando una participación del 20%. Pero cuán útil será esto con Intel, y por extensión de la fabricación de chips estadounidenses, depende de los detalles, que son escasos en este momento.

En otra parte del frente de chips, Qualcomm se está volviendo más adquisitivo, buscando comprar Alphawave al fabricante de chips, además de comprar el grupo de investigación de inteligencia artificial vietnamita Movianai a principios de esta semana y Edge Impulse el mes pasado.

Openai recaudó una cantidad ridícula de dinero, un récord de $ 40 mil millones, tanto que completamente sesgó las últimas estadísticas de capital de riesgo. Tan capaz que sea la compañía, una valoración de $ 300 mil millones no deja absolutamente ningún espacio para el error, incluso si los errores no son propios. De hecho, los aranceles de Trump podrían ralentizar el crecimiento de la IA al hacer que los componentes del centro de datos sean más caros, y ya Alibaba y Microsoft están ralentizando sus gastos de centros de datos.

Sin embargo, el financiamiento de la IA sigue llegando: los laboratorios isomórficos de Alphabet Spinout también obtuvieron $ 600 millones y la pista de IA de la pista de $ 308 millones. Uno más bien preocupante de la AI generativo de un nuevo informe de Gartner: “Los consumidores no persiguen estas características. Como los fabricantes integran la IA como una característica estándar en los dispositivos de consumo, los consumidores se verán obligados a comprarlas”. Mmm.

Pero la IA está a punto de restablecer la industria de la seguridad cibernética, como Dave y Zeus describieron en el último análisis de ruptura. Y efectivamente, un nuevo estudio muestra que la IA ahora está superando a los equipos rojos humanos. Además, los inversores y las compañías cibernéticas apostan por el reinicio, ya que Reliaquest recaudó $ 500 millones y Cyberhaven obtuvo $ 100 millones por sus herramientas cibernéticas impulsadas por IA, y otros como Solarwinds y Exabeam subieron sus juegos de IA.

El drama de Tiktok parece estar llegando a su fin, tal vez, pero todavía es una suposición de quién será el dueño de todo o parte de él, dado que Trump y China tienen la última palabra, como Oracle, Applovin e incluso Amazon levantan las manos.

Crypto continúa ganando impulso en la era de Trump, ya que el proveedor de Stablecoin Circle finalmente se presentó para hacer pública. En cuanto a las OPI, aparte del mercado de mercado, ahora el aparente Dud de CoreWeave se ve un poco mejor ya que sus acciones subieron muy por encima de su precio inicial. Pero el colapso del mercado de valores ha retrasado las OPI por Klarna y StubHub.

Aquí están las noticias de esta semana de Siliconangle y más allá:

AI y datos: Abra la caja registradora para OpenAI

El dinero importa

OpenAi bolsas $ 40B en fondos, aumentando su valoración posterior al dinero a $ 300B

Siemens to Buy Life Sciences I + D Company Dotmatics por $ 5.1B

Alphabet Spinout Isomorphic Labs recauda $ 600 millones para su motor de diseño de medicamentos AI

La pista de inicio de la generación de video de IA recauda una ronda de $ 308 millones respaldada por NVIDIA

Gartner pronósticos Gastos de IA generativos en todo el mundo para alcanzar $ 644B en 2025 Interesante cita del analista vicepresidente distinguido John-David Lovelock, basándose en el pronóstico de que el 80% de ese gasto estará en hardware como servidores, teléfonos inteligentes y PC: “los consumidores no persiguen estas características. Como los fabricantes integran la IA como una característica estándar en los dispositivos de los consumidores, los consumidores estarán obligados a comprarlas”.

Microsoft Scale Back Global AI Data Center Planes de expansión en medio de tendencias emergentes del modelo de bajo costo

La financiación global de VC alcanza $ 113 mil millones en el primer trimestre, conducido por ofertas de IA descomunal

Startup de gestión de datos Hydrolix carretes en $ 80 millones

Qualcomm adquiere Movianai para reforzar sus capacidades de IA

Unframe se lanza con $ 50 millones en fondos para ofrecer soluciones de IA basadas en resultados para empresas

DevOps Startup Opsera recauda $ 20 millones para acelerar la entrega de software con agentes de IA

SourceTable obtiene $ 4.3 millones en fondos para ayudar a todos a convertirse en un usuario de hoja de cálculo

Autonomyai se lanza con $ 4 millones para construir agentes de IA de desarrollo front-end

Tarrai recibe $ 4 millones en fondos para promover la automatización de la IA en el sector de seguros

Vallor recauda $ 4 millones para avanzar en la automatización de IA para la adquisición empresarial

Política

Para su crédito, Google mantiene el enfoque en la seguridad de la inteligencia artificial a medida que avanza la inteligencia general artificial, con un nuevo papel describiendo más claramente cuáles son los riesgos reales: cuatro de ellos, de hecho: Google Deepmind describe el marco de seguridad para el desarrollo de AGI futuro

Nuevos modelos y servicios

OpenAI para lanzar su primer modelo de ‘peso abierto’ desde 2019

EXCLUSIVO: Panzura desbloquea metadatos de los archivos de archivo de IBM para el entrenamiento de IA

Amazon presenta la Ley Nova, un agente de IA que puede usar un navegador web

AWS trae su asistente generativo de IA al servicio de Amazon OpenSearch

La puerta de enlace AI actualizada de Kong ayuda a asegurar las implementaciones de producción del modelo de IA

La AI de emergencia está usando agentes de IA para construir nuevos agentes de IA en tiempo real

Cognition AI lanza el asistente de codificación renovado Devin 2.0 con un precio inicial mucho más bajo

Runway lanza un nuevo generador de video Gen-4 AI

La startup francesa Gladia lanza el modelo de IA de voz a texto multilingüe de próxima generación solaria

OUMI libera el modelo de detección de alucinación de parámetros pequeños al código abierto

Hay aún más AI y big data Noticias sobre Siliconangle

Alrededor de la empresa: llega la depresión de Trump

Noticias principales

Trump Tanks Tech Titans (y, en última instancia, casi todos los demás): Las existencias tecnológicas se desploman después de que Trump anuncia aranceles ‘Día de Liberación’

Informe: TSMC acuerda tentativamente establecer una empresa conjunta de fabricación de chips con Intel

Cobertura seleccionada de Kubecon + CloudNativecon

Agentes, Deepseek y MCP: Kubernetes se adapta al valiente nuevo mundo de la IA

Kubecon Day 1 Análisis principal: domesticar la complejidad multicloud con observabilidad y automatización nativa de nube

¿Algo más que no se patrocine directamente? De cheques…

Nuevos productos y servicios

Conectividad GPU de turbocompresores de LightMatter con sus primeras interconexiones de redes basadas en fotónicas

Splunk aumenta el soporte de Operentelemetry en su marco de observabilidad

Parasail promete alimentar cualquier carga de trabajo de IA con acceso a pedido a GPU basados ​​en la nube

LoftLabs lanza VNODE para mejorar el aislamiento seguro de la carga de trabajo en Kubernetes

El dinero importa

Qualcomm que pesa la adquisición del diseñador de chips de cotización pública Alphawave

CoreWeave Acciones rotura Casi 42% más del martes, aumentando por encima del precio de la OPI

Las acciones de United Microelectronics se acercan un 9% en el informe de acuerdo potencial de GlobalFoundries

Amd completo Adquisición de sistemas ZT

La startup de tecnología financiera cierra la inversión de $ 575 millones a una valoración de $ 6B

Temporal recauda $ 146 millones para su plataforma de confiabilidad de la aplicación

La compañía de infraestructura del centro de datos de IA se lanza junto con un aumento de $ 75 millones

Cerebras gana el contrato de DARPA para construir el sistema de IA con óptica copresionada

Controltheory se lanza con $ 5 millones en fondos para abordar el costo de observabilidad y la complejidad

Penguin Solutions supera las estimaciones y plantea orientación sobre la creciente demanda de infraestructura de IA

El software de progreso agradece a los inversores, ya que supera las expectativas y plantea orientación

Intel tiene un nuevo (ish) identidad de marca: “Ese es el poder de Intel en el interior”.

Tenemos muchas más noticias sobre nube, infraestructura y aplicaciones

Cyber ​​Beat: el reinicio de AI

Análisis

Análisis de la ruptura: Seguridad de realización: cómo Palo Alto Networks ve el reinicio

Y viene rápido: Ai Phishing llega a su momento Skynet a medida que los agentes superan a los equipos rojos humanos

El dinero importa

Reliaquest recauda $ 500 millones a una valoración de $ 3.4b para expandir la ciberseguridad impulsada por la IA

Cyberhaven obtiene $ 100 millones por su plataforma de protección de datos con IA

Adaptive Security recauda $ 43 millones para su plataforma de simulación AI CyberAttack

Prowler recauda $ 12.5 millones para avanzar en su plataforma de seguridad en la nube impulsada por el código abierto

La startup de servicio rojo Yrikka se lanza con fondos previos a las semillas para asegurar sistemas de IA críticos

Ataque y respuesta

Oracle niega la violación de la nube, mientras que los investigadores señalan indicadores creíbles Pero entonces: Según los informes, Oracle informa a los clientes sobre la violación del sistema después de la negación anterior

El informe de Cisco Talos encuentra que los ataques basados ​​en la identidad impulsaron la mayoría de los incidentes cibernéticos en 2024

JFROG Report encuentra amenazas de la cadena de suministro de software que impulsa el crecimiento de IA.

Nuevos servicios

Exabeam presenta al agente de Nova AI para racionalizar la detección y respuesta de amenazas

SolarWinds expande las capacidades de IA a través de la cartera de observabilidad y gestión de TI

Google inicia el cifrado de correo electrónico de extremo a extremo del lado del cliente

Más Noticias de ciberseguridad aquí

En otro lugar alrededor de la tecnología: otra IPO de cripto

Stablecoin Firma Circle busca OPI después de un revés SPAC anterior

Humanoid Robot Creator Agility Robotics Objetivos de $ 400 millones de fondos ronda

Amazon enviará 27 satélites de comunicaciones de Kuiper a órbita el próximo mes

Informe: X podría estar mirando una multa de $ 1B de la UE sobre contenido ilícito y desinformación

El tabaco D-Wave y Japón use cuántico para construir un mejor modelo de IA para el descubrimiento de drogas

A medida que se avecina Tiktok Ban, el subsack lanza contenido de video corto

Actualizaciones tecnológicas a Oracle Park de SF Giants destinado a eliminar la fricción de la experiencia de los fanáticos

Y mira más noticias sobre tecnología emergente, blockchain y cripto y política

Comings and Goings

Diecinueve años Google veterano Sissie Hsiaoquien lideró sus aplicaciones de IA de consumidores, como su chatbot gemini, ha renunciado y se tomará un descanso antes de recoger algo más en Google. Josh Woodwardque lidera Google Labs y supervisó el lanzamiento de Notebooklm, la reemplazó (por semáfor).

Joelle Pineau, Meta plataforma‘Jefe de investigación de inteligencia artificial, dijo en LinkedIn que se irá el 30 de mayo, “tomando un tiempo para observar y reflexionar, antes de saltar a una nueva aventura”.

Alterando contratado Microsoft ejecutivo de mucho tiempo Ben Canning Como director de productos.

Proveedor de plataforma de datos Nasuní fijado Veterano de Veracode Rey de Sam CEO.

Ninja fijado John Sapone oficial de ingresos

Lunes.com también fijado un nuevo Cro, Casey GeorgeEl antiguo EVP de ventas globales de Qlik.

Intel Director de personas Christy Pambianchi se va a tomar el mejor trabajo de recursos humanos en Caterpillar (por CRN).

Creador de WordPress Automático despedido 16% de su personal, o 281 personaspor todas las razones habituales de discurso corporativo.

¿Qué sigue?

9-11 de abril: Google Cloud NextLas Vegas: Siliconangle y thecube Ambos estarán en el sitio para todas las noticias, entrevistas y análisis.

Imagen: silicio/ideograma

Su voto de apoyo es importante para nosotros y nos ayuda a mantener el contenido libre.

Un clic a continuación admite nuestra misión de proporcionar contenido gratuito, profundo y relevante.

Únete a nuestra comunidad en YouTube

Únase a la comunidad que incluye a más de 15,000 expertos en #Cubealumni, incluido el CEO de Amazon.com, Andy Jassy, ​​el fundador y CEO de Dell Technologies, Michael Dell, el CEO de Intel, Pat Gelsinger y muchos más luminarios y expertos.

“TheCube es un socio importante para la industria. Ustedes realmente son parte de nuestros eventos y realmente les apreciamos que vengan y sé que la gente aprecia el contenido que crea también” – Andy Jassy

GRACIAS

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Cómo indicar el nuevo chatgpt, según OpenAi

Published

on

La última versión de ChatGPT es significativamente más poderosa, pero requiere nuevas técnicas de indicación. El modelo ahora sigue las instrucciones más literalmente y hace menos suposiciones sobre lo que está pidiendo. Esto es importante para los empresarios que usan la herramienta.

No seas consejos anticuados. No indique usando palabras deficientes. Eres mejor que eso.

Las indicaciones mal construidas desperdician su tiempo y dinero. Hazlo bien y desbloqueas una IA significativamente más capaz. Los miembros del equipo de Operai, Noah MacCallum y Julian Lee, han publicado una amplia documentación sobre cómo provocar sus nuevos modelos.

Aquí hay un resumen de su orientación, para que pueda aprovechar al máximo la herramienta.

Las reglas de indicación han cambiado

La provisión de técnicas que funcionaron para modelos anteriores en realidad podrían obstaculizar sus resultados con las últimas versiones. ChatGPT-4.1 sigue las instrucciones más literalmente que sus predecesores, que solían inferir la intención liberalmente. Esto es bueno y malo. La buena noticia es que ChatGPT ahora es altamente orientable y responde a las indicaciones bien especificadas. La mala noticia es que sus viejas indicaciones necesitan una revisión.

La mayoría de las personas todavía usan indicaciones básicas que apenas rascan la superficie de lo que es posible. Escriben preguntas o solicitudes simples, luego se preguntan por qué sus resultados se sienten genéricos. Operai ahora ha revelado cómo entrenaron el modelo para responder, ayudándole a obtener exactamente lo que desea de sus modelos más avanzados.

Optimice sus indicaciones con la guía de información privilegiada de Openai

Estructura tus indicaciones estratégicamente

Comience organizando sus indicaciones con secciones claras. OpenAI recomienda una estructura básica con componentes específicos:

• Rol y objetivo: dígale a ChatGPT a quién debe actuar y qué está tratando de lograr

• Instrucciones: proporcionar pautas específicas para la tarea

• Pasos de razonamiento: indique cómo desea que aborde el problema

• Formato de salida: especifique exactamente cómo desea la respuesta estructurada

• Ejemplos: Muestre muestras de lo que espera

• Contexto: proporcionar información de fondo necesaria

• Instrucciones finales: incluya los últimos recordatorios o criterios

No necesita todas estas secciones para cada aviso, pero un enfoque estructurado ofrece mejores resultados que una pared de texto.

Para tareas más complejas, la documentación de OpenAI sugiere usar reducción para separar sus secciones. También aconsejan el uso de caracteres de formato especial alrededor del código (como Backticks, que se ven así: `) para ayudar a ChatGPT a distinguir el código del texto regular y el uso de listas numeradas o balas estándar para organizar información.

Dominar el arte de delimitar información

La separación de la información afecta adecuadamente sus resultados significativamente. Las pruebas de Openai encontraron que Etiquetas XML Realice excepcionalmente bien con los nuevos modelos. Le permiten envolver las secciones con precisión con etiquetas de inicio y extremo, agregar metadatos a las etiquetas y habilitar la anidación.

El formato JSON funciona mal con contextos largos (que proporcionan los nuevos modelos), particularmente al proporcionar múltiples documentos. En su lugar, intente formatos como ID: 1 | Título: El zorro | Contenido: El Fox Brown rápido salta sobre el perro perezoso que Openai encontró que funcionó bien en las pruebas.

Construir agentes de IA autónomos

Chatgpt ahora puede funcionar como un “agente” Eso funciona de manera más independiente en su nombre, abordando tareas complejas con una supervisión mínima. Lleve sus indicaciones al siguiente nivel construyendo estos agentes.

Un agente de IA está esencialmente ChatGPT configurado para trabajar a través de problemas de forma autónoma en lugar de solo responder a sus preguntas. Puede recordar el contexto en una conversación, usar herramientas como navegación web o ejecución de código, y resolver problemas de varios pasos.

OpenAI recomienda incluir tres recordatorios clave en todas las indicaciones del agente: persistencia (continuar hasta la resolución), callarse de herramientas (usando herramientas disponibles en lugar de adivinar) y planificar (pensar antes de actuar).

“Estas tres instrucciones transforman el modelo de un estado de chatbot en un agente mucho más ‘ansioso’, impulsando la interacción de forma autónoma e independiente”, explica el equipo. Sus pruebas mostraron un aumento del rendimiento del 20% en las tareas de ingeniería de software con estas simples adiciones.

Maximizar el poder de los contextos largos

El último chatGPT puede manejar una impresionante ventana de contexto de 1 millón de tokens. Las capacidades son emocionantes. Según OpenAi, el rendimiento sigue siendo fuerte incluso con miles de páginas de contenido. Sin embargo, el rendimiento del contexto largo se degrada cuando se requiere un razonamiento complejo en todo el contexto.

Para obtener los mejores resultados con documentos largos, coloque sus instrucciones tanto al principio como al final del contexto proporcionado. Hasta ahora, esto ha sido más seguro de fallas en lugar de una característica requerida de su aviso.

Cuando use el nuevo modelo con un contexto extenso, sea explícito sobre si debe confiar únicamente en la información proporcionada o combinarlo con su propio conocimiento. Para respuestas estrictamente basadas en documentos, OpenAI sugiere instruir explícitamente: “Solo use los documentos en el contexto externo proporcionado para responder a la consulta del usuario”.

Implementar la solicitud de la cadena de pensamiento

Si bien GPT-4.1 no está diseñado como un modelo de razonamiento, puede solicitar que muestre su trabajo como podría los modelos más antiguos. “Pedirle al modelo que piense paso a paso (llamada ‘cadena de pensamiento’) puede ser una forma efectiva de dividir los problemas en piezas más manejables”, señala el equipo de OpenAI. Esto viene con un mayor uso de tokens pero ofrece una mejor calidad.

Una instrucción simple como “Primero, piense cuidadosamente paso a paso sobre qué información o recursos se necesitan para responder a la consulta” puede mejorar drásticamente los resultados. Esto es especialmente útil cuando se trabaja con archivos cargados o cuando CHATGPT necesita analizar múltiples fuentes de información.

Haga que el nuevo chatgpt funcione para ti

Operai ha compartido información más extensa sobre cómo aprovechar al máximo sus últimos modelos. Las técnicas representan objetivos de capacitación reales para los modelos, no solo conjeturas de la comunidad. Al implementar su orientación sobre una estructura rápida, delimitar información, creación de agentes, manejo de contexto largo y suministro de cadena de pensamiento, verá mejoras dramáticas en sus resultados.

El éxito con ChatGPT proviene de tratarlo como un compañero de pensamientono solo un generador de texto. Siga la guía directamente de la fuente para obtener mejores resultados del mismo modelo que todos los demás están utilizando.

Acceder a todos mis Las mejores indicaciones de contenido de chatgpt.

Continue Reading

Noticias

Una nueva estrategia de Google AI podría interrumpir el dominio de Openai

Published

on

Hay tantos trabajos de investigación de IA en estos días que es difícil destacarse. Pero un artículo ha programado mucha discusión en toda la industria tecnológica en los últimos días.

“Esto es lo más inspirador que he leído en IA en los últimos dos años”, escribió el fundador de inicio Suhail Doshi en X este fin de semana. Jack Clark, cofundador de Anthrope, presentó el periódico en la edición del lunes de su boletín de importación AI, que es leída de cerca por miles de investigadores de la industria.

Escrito por el investigador de Google David Silver y el científico informático canadiense Rich Sutton, el documento anuncia audazmente una nueva era de AI.

Los autores identifican dos épocas de IA modernas anteriores. El primero fue personificado por Alphago, un modelo de Google AI que aprendió a jugar el juego de mesa “Go” mejor que los humanos en 2015. El segundo es el que estamos en este momento, definido por ChatGPT de Opensei.

Silver y Sutton dicen que ahora estamos entrando en un nuevo período llamado “La era de la experiencia”.


Un gráfico del trabajo de investigación "Bienvenido a la era de la experiencia, 'por David Silver y Richard Sutton

Un gráfico del documento de investigación “Bienvenido a la Era of Experience”, de David Silver y Richard Sutton

David Silver, Richard Sutton



Para mí, esto representa un nuevo intento de Google de abordar uno de los problemas más persistentes de la IA, la escasez de datos de entrenamiento, al tiempo que va más allá de un enfoque tecnológico que OpenAi básicamente ganó.

La era de la simulación

Comencemos con la primera época, que, según los autores, era la “era de la simulación”.

En este período, aproximadamente a mediados de la década de 2010, los investigadores utilizaron simulaciones digitales para que los modelos de IA jueguen repetidamente para aprender a actuar como humanos. Estamos hablando de millones y millones de juegos, como ajedrez, póker, atari y “gran turismo”, jugados una y otra vez, con recompensas colgadas por buenos resultados, enseñando así a las máquinas lo que es bueno versus malo e incentivándolos para seguir mejor estrategias.

Este método de aprendizaje de refuerzo, o RL, produjo Alphago de Google. Y también ayudó a crear otro modelo de Google llamado Alphazero, que descubrió nuevas estrategias para el ajedrez y “ir”, y cambió la forma en que los humanos juegan estos juegos.

El problema con este enfoque: las máquinas entrenadas de esta manera funcionaban bien en problemas específicos con recompensas definidas con precisión, pero no podían abordar problemas más generales y abiertos con pagos vagos, según los autores. Entonces, probablemente no sea realmente completo.

La era de los datos humanos

La siguiente área fue lanzada por otro artículo de investigación de Google publicado en 2017. “La atención es todo lo que necesita” propuesta que los modelos de IA deben ser entrenados en montañas de datos creados por humanos de Internet. Simplemente permitiendo que las máquinas presten “atención” a toda esta información, aprenderían a comportarse como los humanos y desempeñarse tan bien como nosotros en una amplia variedad de tareas diferentes.

Esta es la era en la que estamos ahora, y ha producido ChatGPT y la mayoría de los otros potentes modelos y herramientas de IA generativos que se utilizan cada vez más para automatizar tareas como el diseño gráfico, la creación de contenido y la codificación de software.

La clave de esta época ha sido acumular la mayor calidad posible de datos generados por los humanos, y usar eso en el entrenamiento masivo y intensivo de cómputo se extiende a los modelos IMBue AI con una comprensión del mundo.

Mientras que los investigadores de Google iniciaron esta era de datos humanos, la mayoría de estas personas abandonaron la empresa y comenzaron sus propias cosas. Muchos fueron a OpenAI y trabajaron en tecnología que Ultimate produjo ChatGPT, que es, con mucho, el producto de IA generativo más exitoso de la historia. Otros comenzaron Anthrope, otra startup de IA generativa líder que ejecuta Claude, un poderoso agente de chatbot y IA.

¿Un google dis?

Muchos expertos en la industria de la IA, y algunos inversores y analistas en Wall Street, piensan que Google puede haber dejado caer la pelota aquí. Se le ocurrió este enfoque de IA, pero OpenAi y Chatgpt se han escapado con la mayoría de los botines hasta ahora.

Creo que el jurado todavía está fuera. Sin embargo, no puede evitar pensar en esta situación cuando los autores parecen estar disgustando la era de los datos humanos.

“Se podría argumentar que el cambio en el paradigma ha tirado al bebé con el agua del baño”, escribieron. “Si bien RL centrado en el ser humano ha permitido una amplitud de comportamientos sin precedentes, también ha impuesto un nuevo techo al rendimiento del agente: los agentes no pueden ir más allá del conocimiento humano existente”.

Silver y Sutton tienen razón sobre un aspecto de esto. La oferta de datos humanos de alta calidad ha sido superado por la demanda insaciable de los laboratorios de IA y las grandes compañías tecnológicas que necesitan contenido fresco para capacitar nuevos modelos y hacer avanzar sus habilidades. Como escribí el año pasado, se ha vuelto mucho más difícil y más costoso hacer grandes saltos en la frontera de IA.

La era de la experiencia

Los autores tienen una solución bastante radical para esto, y está en el corazón de la nueva era de la experiencia que proponen en este documento.

Sugieren que los modelos y los agentes deberían salir y crear sus propios datos nuevos a través de interacciones con el mundo real.

Esto resolverá el problema de suministro de datos persistente, argumentan, mientras ayudan al campo a alcanzar AGI, o inteligencia general artificial, un santo grial técnico donde las máquinas superan a los humanos en la mayoría de las actividades útiles.

“En última instancia, los datos experimentales eclipsarán la escala y la calidad de los datos generados por los humanos”, escriben Silver y Sutton. “Este cambio de paradigma, acompañado de avances algorítmicos en RL, desbloqueará en muchos dominios nuevas capacidades que superan a las que poseen cualquier humano”.

Cualquier padre moderno puede pensar en esto como el equivalente a decirle a su hijo que salga del sofá, deje de mirar su teléfono y salga afuera y juegue con sus amigos. Hay experiencias mucho más ricas, satisfactorias y más valiosas para aprender.

Clark, el cofundador antrópico, quedó impresionado por la chutzpah de esta propuesta.

“Documentos como este son emblemáticos de la confianza que se encuentra en la industria de la IA”, escribió en su boletín el lunes, citando “el sentido común de dar a estos agentes la independencia y la latitud suficientes para que puedan interactuar con el mundo y generar sus propios datos”.

Ejemplos y un posible disco final

Los autores flotan algunos ejemplos teóricos de cómo esto podría funcionar en la nueva era de la experiencia.

Un asistente de salud de IA podría fundamentar los objetivos de salud de una persona en una recompensa basada en una combinación de señales como su frecuencia cardíaca en reposo, duración del sueño y niveles de actividad. (Una recompensa en la IA es una forma común de incentivar a los modelos y agentes para que funcionen mejor. Al igual que podrías molestar a tu pareja para hacer más ejercicio diciendo que se fortalecerán y se verán mejor si van al gimnasio).

Un asistente educativo podría usar los resultados del examen para proporcionar un incentivo o recompensa, basado en una recompensa fundamentada por el aprendizaje de idiomas de un usuario.

Un agente científico con el objetivo de reducir el calentamiento global podría usar una recompensa basada en observaciones empíricas de los niveles de dióxido de carbono, sugiere Silver y Sutton.

En cierto modo, este es un retorno a la era anterior de simulación, que Google podría liderar. Excepto esta vez, los modelos y agentes de IA están aprendiendo del mundo real y recopilando sus propios datos, en lugar de existir en un videojuego u otro ámbito digital.

La clave es que, a diferencia de la era de los datos humanos, puede no haber límite para la información que se puede generar y recopilar para esta nueva fase de desarrollo de IA.

En nuestro período de datos humanos actuales, se perdió algo, argumentan los autores: la capacidad de un agente para autodescubrir su propio conocimiento.

“Sin esta base, un agente, sin importar cuán sofisticado, se convertirá en una cámara de eco del conocimiento humano existente”, escribieron Silver y Sutton, en una posible final final para OpenAi.