Noticias

Una semana en IA generativa: OpenAI, 2024 y robots

Published

on

¡Bienvenidos de nuevo y hola 2025! Después de un final tan frenético de 2024, no sorprende que haya sido un comienzo lento de 2025 en el frente de noticias sobre GenAI. Sin embargo, se compartieron algunas cosas a fines del año pasado que vale la pena comentar, y también hubo un par de excelentes reseñas de 2024 de Simon Willison y Jim Fan que quería compartir.

En el frente de la ética, hay un informe que estima que Microsoft gastará una enorme cantidad 80.000 millones de dólares en infraestructura de IA solo este año y la investigación analiza cómo la IA pronto podrá manipular la toma de decisiones en línea de las personas. Al estar en la industria de la publicidad, diría que eso empezó a suceder hace mucho tiempo, ¡pero esa es una publicación para otro momento!

En Long Reads también hay un excelente artículo de Francoise Chollet, fundadora de ARC-AGI sobre El increíble rendimiento de o3 frente a sus puntos de referencia. También compartí el artículo de Anthropic sobre cómo construir agentes efectivosdel cual estoy seguro veremos mucho más este año!

Este cambio de OpenAI a una empresa con fines de lucro se rumorea desde hace mucho tiempo y está en juego. Soy un poco cínico respecto del momento de la anuncio – la noticia se publicó entre Navidad y Año Nuevo, y ciertamente es una decisión controvertida.

Por un lado, entiendo el razonamiento, ya que desarrollar capacidades de IA de vanguardia es un negocio increíblemente costoso y pasar a una empresa con fines de lucro permitirá a OpenAI recaudar mucha más inversión que bajo su estructura corporativa actual, lo cual es un poco complicado. desorden.

La nueva corporación de OpenAI será una corporación de beneficio público, que puede obtener ganancias pero tiene la misión declarada de “producir un beneficio público”. Sin embargo, para mí esto es un poco vago, y creo que es necesario elaborar un nuevo enfoque de las estructuras corporativas para las grandes empresas de IA de vanguardia que tienen hambre de capital pero que también tienen el potencial de perturbar gravemente la sociedad si tienen éxito en su misión. .

Fuente

Esta es una publicación fantástica de Simon Willison que hace un gran trabajo al resumir todo lo que aprendimos sobre la tecnología GenAI a lo largo de 2024. A continuación se muestran algunos de los aspectos más destacados:

  • La barrera GPT-4 – Llegamos a principios de año sin que nadie fuera de OpenAI pudiera construir un modelo con las capacidades de GPT-4. Terminamos el año con alrededor de 70 modelos que ocupan un lugar más alto que el GPT-4 original, algunos de los cuales pueden ejecutarse localmente en una computadora portátil.

  • Los costos se desplomaron – No solo mejoraron las capacidades en todos los ámbitos, sino que los precios también bajaron significativamente, siendo los modelos de última generación actuales 12 veces más baratos que los modelos de última generación de hace un año. Esto también significa que el impacto medioambiental de estos modelos también se ha reducido considerablemente (aunque todavía quedan muchos desafíos en este frente).

  • El multimodal es el futuro – Apenas teníamos modelos GenAI multimodales en 2023 y todavía no hemos visto todas sus capacidades ni hemos resuelto todos los increíbles casos de uso que tendrán. Los modelos que pueden ver, oír y hablar en tiempo real supondrán un cambio fundamental en la forma en que interactuamos con la tecnología. Todo el mundo debería probar las funciones de voz y vídeo en directo de ChatGPT y Gemini: es ciencia ficción hecha realidad.

  • El acceso freemium probablemente esté muerto – Probablemente hemos visto lo último del acceso gratuito a modelos de última generación a medida que los costos de capital para construirlos comienzan a disminuir. Hubo una época maravillosa este año en la que cualquiera podía acceder a los mejores modelos de forma gratuita, con límites de uso, pero eso parece haber pasado, lo cual es muy triste.

  • ‘Agentes’ aún no ha sucedido – El término ‘Agentes’ está mal definido y necesita más matices (esta es una de las razones por las que escribí toda una serie de publicaciones sobre Compañeros digitales), y hemos visto muchas promesas a lo largo de 2024. Sin embargo, la tecnología aún no es lo suficientemente confiable como para implementarse ampliamente. La confiabilidad probablemente sea de alrededor del 80% para los modelos agentes de frontera, pero probablemente deba llegar al 99% antes de ser lanzado públicamente y para que los consumidores comiencen a confiar en ellos.

  • Los modelos de razonamiento son la nueva frontera – Modelos como o1, o3 y otros son los nuevos chicos del bloque y donde veremos el mayor (y más rápido) progreso este año. Son los modelos que cerrarán la brecha de confiabilidad al 99% e impulsarán verdaderas experiencias similares a las de “agentes” para los consumidores, además de impulsar nuevos enfoques para la investigación científica.

  • La educación es más importante que nunca – Existe una enorme brecha de conocimiento y experiencia entre quienes utilizan regularmente modelos GenAI y quienes no. Me temo que esto se convertirá en un problema aún mayor a medida que desaparezca el acceso gratuito a modelos de última generación y se abra una gran brecha entre lo que está disponible para la mayoría de las personas (gratis) y lo que está disponible para aquellos que pueden o quieren. para pagar.

Hay muchos otros comentarios geniales de Simon en su publicación, ¡así que te recomiendo que le eches un vistazo!

Fuente

Jim Fan (famoso por NVIDIA) también compartió sus pensamientos sobre 2024 que yo quería compartir y cubrir. A continuación se muestran algunos de los aspectos más destacados:

  • Equipos para robots – Hemos visto avances asombrosos en robótica en 2024 y es muy probable que seamos la última generación de la humanidad en crecer sin robótica avanzada en todas partes. Esto tendrá profundas implicaciones.

  • Hardware de computadora – esto ha seguido aumentando a buen ritmo, no ve signos de desaceleración y la computación cuántica se está volviendo rápidamente más práctica, lo que significa que no veremos una desaceleración en el aumento de la potencia de procesamiento en el corto plazo.

  • Modelos mundiales – Los modelos de texto a vídeo de Sora y Veo son el comienzo de un nuevo tipo de modelo que aprende cómo funciona el mundo físico real. Esto conducirá a modelos más inteligentes, una aceleración de la robótica y el surgimiento de experiencias interactivas increíblemente realistas.

  • Modelos de lenguaje – la interfaz de usuario de los LLM de frontera está muy por detrás de las capacidades de los modelos. Se necesita una gran cantidad de trabajo de diseño UIUX para desbloquear completamente el potencial de la tecnología GenAI de vanguardia (un sentimiento del que también se hace eco Simon Willison en su publicación)

Luego, Jim termina con una gran cita de Edward O. Wilson, profesor de Harvard y autor ganador del premio Pulitzer, que realmente tengo que compartir:

El verdadero problema de la humanidad es el siguiente: tenemos emociones paleolíticas, instituciones medievales y tecnología divina.

Nuevamente, vale la pena leer todos los pensamientos de Jim y están divididos en tres partes en el enlace a continuación: échales un vistazo:

Primera parte

segunda parte

Tercera parte

Este impresionante vídeo fue publicado a finales del año pasado por Unitree, una empresa china de robótica. Su B2-W parece increíblemente robusto, versátil y fuerte, ¡capaz de transportar a una persona! También tiene algunos equilibrios sorprendentes en las cuatro extremidades y solo en dos de ellas.

Esta es una gran demostración que muestra un lado ligeramente diferente de la robótica de las demostraciones habituales de robots humanoides que han estado circulando durante el último año: ¡es genial ver un robot que es capaz de moverse a gran velocidad y realizar algunas maniobras impresionantes!

Fuente

“El futuro ya está aquí, sólo que no está distribuido equitativamente.”

Guillermo Gibson

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Trending

Exit mobile version