Noticias
OpenAI apoyándose en robots humanoides AI. RTZ #581
Base Los LLM están llegando a Robots en esto Ola tecnológica de IAun área he discutido en detalle. Las inversiones aquí están aumentandoy China está en la pole position aquí debido al amplio y profundo ecosistema de fabricación de tecnología. Y las empresas tecnológicas estadounidenses de tesla, NVIDIA, Google et al tienen sus ojos puestos en robots impulsados por IA, humanoides o no.
Ahora parece que OpenAI también quiere volver a los robots, en además de sus asociaciones con robots. La información lo expone en “OpenAI ha discutido la creación de un robot humanoide”:
“sobre el pasado año, AbiertoAI ha dejado pistas no tan sutiles sobre su renovado interés en la robótica: invertir en Startups que desarrollan hardware y software para robots. como Cifra y Inteligencia física y reiniciando su equipo interno de software de robóticaque había disuelto hace cuatro años”.
“Ahora, OpenAI podría llevar ese interés al siguiente nivel. La empresa ha considerado recientemente desarrollar un robot humanoide, según dos personas con conocimiento directo de las discusiones”.
OpenAI aparentemente está interesado en versiones humanoidesal igual que el enfoque de Elon Musk con su Línea Optimus de robots.
“Como recordatorio, los robots humanoides suelen tener dos brazos y dos piernas, lo que los distingue de los robots típicos de un almacén o fábrica que pueden tener un solo brazo realizando repetidamente la misma tarea en una línea de montaje. Los desarrolladores de robots humanoides creen que les resultará más fácil manejar tareas en el mundo físico (que está diseñado para los humanos) que cambiar nuestros entornos físicos para adaptarlos a los nuevos robots”.
OpenAI, por supuesto, tiene una función cada vez más plato completo con sus otros productos y servicios de IA alrededor Razonamiento de IA y agentes a continuación.
“Sin embargo, no se emocionen demasiado todavía: cualquier robot humanoide potencial parece ser una prioridad menor para OpenAI que otras tecnologías y productos, como su modelos de razonamiento muy elogiados y un agente que podría ayudar a automatizar todo tipo de tareas de análisis e ingeniería de software, dijo una de estas personas”.
“Pero el hecho de que OpenAI esté siquiera considerando desarrollar un robot humanoide resalta su creciente ambición de abarcar todo, desde búsquedas y navegadores web hasta chips de servidores y planificación de centros de datos. Ayer mismo mis colegas escribieron que era un Es cuestión de tiempo antes de que OpenAI (y Google) desarrollen robots humanoidesdado Elon Musk comenta que dichos productos representaban una oportunidad de ingresos de 1 billón de dólares”.
“También resalta otro patrón: la tendencia de OpenAI a competir con algunos de sus clientes y socios más importantes”.
OpenAI, por supuesto, también es un firme practicante de Enfoque de ‘coopetición y enemigos’ en la industria tecnológica.
“El interés de OpenAI en los robots humanoides podría enfrentarlo cara a cara con Figura y Tecnologías 1Xdos startups de robots humanoides en las que OpenAI ha invertido. A principios de este año, OpenAI anunció que se asociaría con Figure para proporcionar los modelos de IA que impulsan los robots de la startup. Desde entonces, Figura ha lanzó varias demostraciones destacando las nuevas capacidades de sus robots, como poder mantener conversaciones completas con humanos, gracias al software de OpenAI. (Figure y 1X Technologies no respondieron cuando les preguntamos cómo se sentían al respecto)”.
Pero estos son los primeros días de los robots impulsados por LLM, y queda mucho por hacer.
“Todavía hay mucho que los investigadores deben hacer para que los robots humanoides funcionen de manera consistente, incluyendo navegar en entornos desconocidos o saber cómo responder a un evento inesperado, como una persona”. Tirarle una camiseta al robot mientras intenta doblar la ropa.. Los grandes modelos de lenguaje desempeñan un papel porque ayudan a estos robots comunicarse con los humanos y darles una comprensión fundamental del mundo y la relación entre diferentes conceptos. Los modelos multimodales (o aquellos que pueden comprender y producir texto, imágenes y audio) también pueden brindar a los robots la capacidad de “ver” y comprender mejor su entorno. Y otras técnicas tomadas de la IA generativa, como la difusión, que se utiliza para generar imágenes, ayudan a los robots a superar obstáculos como chocar contra las paredes”.
Y, por último, el último gran problema para todas las empresas estadounidenses con ambiciones de escalar robots de IA: Porcelana.
“Un efecto secundario no deseado de las ambiciones de robots humanoides de OpenAI es una mayor dependencia de China. Al igual que los vehículos eléctricos, China es fundamental para la cadena de suministro y la fabricación de robots. Pero trabajar más estrechamente con empresas chinas probablemente no le caerá bien a la Administración Trump. OpenAI ha estado tratando de adaptarse a “La administración entrante enfatiza la construcción de centros de datos e infraestructura de IA en los EE. UU. y se asegura de que Estados Unidos se mantenga por delante de China en el desarrollo de la IA”.
Es importante señalar que todas estas empresas saben que apenas estamos en el comienzo de la construcción de robots humanoides. El datos que tenemos para entrenar a estos robots es mucho más escaso que el datos que hemos utilizado para entrenar nuestros mejores LLM AI hasta la fecha.
Y eso es porque lo visual datos necesarios para entrenar estos robots no existe en la mayor parte del texto utilizado para entrenar nuestros mejores modelos de IA hasta la fecha.
AI ‘El padrino’ Yann LeCuny meta científico jefe de IA, hace este punto simplemente en términos de la cantidad de datos visuales que entrena un niño de 4 años (16.000 horas), que todos los datos de texto que entrenan a nuestras IA de LLM. Y como ese dato en cantidad son unos 30 minutos de vídeos de YouTube actualizados hasta la fecha:
“Ya he señalado ese punto antes: – LLM: 1E13 tokens x 0,75 palabras/token x 2 bytes/token = 1E13 bytes. – Niño de 4 años: 16.000 horas de vigilia x 3600 s/hora x 1E6 fibras nerviosas ópticas x 2 ojos x 10 bytes/s = 1E15 bytes”.
“En 4 años, un niño ha visto 50 veces más datos que los mayores LLM. Los tokens 1E13 son prácticamente todo el texto de calidad disponible públicamente en Internet. A un humano le llevaría 170.000 años leer (8 h/día, 250 palabras/minuto)”.
“El texto es simplemente un ancho de banda demasiado bajo y una modalidad demasiado escasa para aprender cómo funciona el mundo. El vídeo es más redundante, pero la redundancia es precisamente lo que necesita para que el aprendizaje autosupervisado funcione bien. Por cierto, 16.000 horas de vídeo equivalen a unos 30 minutos de cargas en YouTube”.
Escúchalo explica esto con sus propias palabras. Está claro que en 2024 todavía falta mucha “ciencia esencial” y datos para entrenar las IA del futuro.
Así que estos robots humanoides, de Tesla, Google, OpenAi y docenas de empresas de todo el mundo, son simplemente la salva inicial en la recopilación de datos de vídeo en el mundo físico. No se están desplegando porque todavía hacen cosas útiles. Están siendo desplegados para aprender cómo hacer cosas útiles en el futuro.
Junto con innumerables cámaras y otros sensores en el mundo físico, entrenarán los sistemas LLM AI del mundo físico real del futuro. para hacer el razonamiento, agente, y eventuales cosas ‘AGI’ Todos anhelamos que la IA lo haga por nosotros.
Todo esto está a más de unos pocos años de distancia. Y miles de millones más en inversiones de capital.
es lógico para OpenAI para unirse la oportunidad de los robots de IA, incluso en estos primeros días de la Ola tecnológica de IA. Pero asegúrese de que nuestras expectativas para los robots de IA convencionales, puede tomar un tiempo. Manténganse al tanto.
(NOTA: Las discusiones aquí son solo para fines informativos y no pretenden ser consejos de inversión en ningún momento. Gracias por uniéndose a nosotros aquí)