Noticias
Sora es el bot más publicitado desde ChatGPT
Durante más de dos años, cada nuevo anuncio de IA ha vivido a la sombra de ChatGPT. Ningún modelo de ninguna empresa ha eclipsado o igualado esa fiebre inicial. Pero quizás lo más cerca que alguna empresa estuvo de replicar el rumor fue en febrero pasado, cuando OpenAI mostró por primera vez su modelo de IA de generación de video, Sora. Clips tentadores (mamuts lanudos levantando nubes de nieve, animaciones al estilo Pixar de adorables bichos esponjosos) prometían un futuro deslumbrante, uno en el que cualquiera puede crear clips de alta calidad escribiendo mensajes de texto simples en un programa de computadora.
Pero Sora, que no estuvo inmediatamente disponible para el público, se quedó sólo en eso: un adelanto. La presión sobre OpenAI ha aumentado. En los meses intermedios, varias otras empresas tecnológicas importantes, incluidas Meta, Google y Amazon, han presentado sus propios modelos de generación de vídeos. Hoy, OpenAI finalmente respondió. “Este es un lanzamiento que hemos estado entusiasmando durante mucho tiempo”, dijo el director ejecutivo de la nueva empresa, Sam Altman, en un vídeo de anuncio. “Vamos a lanzar Sora, nuestro producto de vídeo”.
En el anuncio, la compañía dijo que los suscriptores pagos de ChatGPT en los Estados Unidos y varios otros países podrán usar Sora para generar sus propios videos. A diferencia de los modelos de generación de vídeos de otras empresas de tecnología, que siguen siendo vistas previas o están disponibles únicamente a través de plataformas empresariales en la nube, Sora es el primer producto de generación de vídeos que una importante empresa de tecnología pone directamente en manos de los usuarios. Los chatbots y los generadores de imágenes como DALL-E de OpenAI ya han hecho que cualquiera pueda crear y compartir contenido detallado en tan solo unos segundos, amenazando industrias enteras y precipitando cambios profundos en la comunicación en línea. Ahora, la era de los modelos de IA que generan videos hará que esos cambios sean más profundos, rápidos y extraños.
La palabra clave de OpenAI esta tarde fue producto. La compañía está presentando a Sora no como un avance en la investigación sino como una experiencia para el consumidor, parte de la continua sacudida comercial de la compañía. En su fundación, en 2015, OpenAI era una organización sin fines de lucro con la misión de desarrollar inteligencia digital “para beneficiar a la humanidad en su conjunto, sin las limitaciones de la necesidad de generar retorno financiero”. Hoy en día, produce productos y acuerdos comerciales como cualquier otra empresa de tecnología que busca ingresos. OpenAI agregó una rama con fines de lucro en 2019 y, a partir de septiembre, supuestamente está considerando revocar por completo el control de su junta sin fines de lucro. El marketing de Sora supone incluso un cambio respecto a febrero, cuando OpenAI presentó el modelo de generación de vídeo como un paso hacia la elevada misión de la empresa de crear tecnología más inteligente que los humanos. Bill Peebles, uno de los investigadores principales de Sora, me dijo en mayo que el video permitiría “un par de vías hacia AGI”, o inteligencia artificial general, al permitir que los programas de la compañía simulen la física e incluso los pensamientos humanos. Para generar un vídeo de un partido de fútbol, es posible que Sora necesite modelar tanto la aerodinámica como la psicología de los jugadores.
Mientras tanto, el anuncio de hoy fue precedido por una reseña de Marques Brownlee, un YouTuber famoso por sus reseñas de dispositivos como iPhones y cascos de realidad virtual. Altman llevaba una sudadera con capucha adornada con la palabra sora. Altman y el equipo de producto de Sora hablaron durante más de 17 minutos; Peebles y otro investigador hablaron durante un minuto y 45 segundos, principalmente elogiando cómo la compañía está lanzando una versión “turbo” de Sora que es “mucho más rápida y más barata” para lanzar una “nueva experiencia de producto”.
El lanzamiento de Sora se produce en el tercero de los “12 días de OpenAI”, un período de lanzamiento o demostración de un nuevo producto para los usuarios todos los días. Lo que la compañía ha anunciado ciertamente se parece más a un producto que a un avance en informática: una interfaz elegante para crear y editar videos, con funciones como “Remix”, “Loop” y “Blend”. Hasta ahora, muchas de las producciones de Sora han sido impresionantes, incluso asombrosas. La compañía no ha creado un bot nuevo y más inteligente sino una interfaz al estilo de iMovie y Premiere Pro.
Los videos que el personal de OpenAI y los usuarios de acceso temprano generaron con Sora ya están llegando a las redes sociales, y seguirá una avalancha de usuarios de todo el mundo. Durante más de dos años, modelos de IA generativa baratos y fáciles de usar han convertido a todos en ilustradores potenciales; Pronto cualquiera podría convertirse también en animador. Esto plantea una amenaza obvia para los ilustradores y animadores humanos, muchos de los cuales llevan mucho tiempo dando la alarma contra la IA generativa que les quita el sustento. Sora y programas similares también plantean el espectro de campañas de desinformación. (Los videos de Sora vienen con una marca de agua visual, pero con el nivel más alto de suscripción de OpenAI, que cuesta $200 al mes, los clientes pueden crear clips sin una).
Pero el desplazamiento laboral y la desinformación pueden no ser las consecuencias más inmediatas o significativas del tercer día de OpenAI. Ambos estaban sucediendo sin Sora, incluso si el programa acelera cada problema: los estudios de producción ya estaban experimentando con productos de inteligencia artificial empresarial para generar videos, como un reciente comercial navideño de Coca-Cola. Y los métodos baratos y de baja tecnología para crear y difundir información falsa han tenido mucho éxito por sí solos.
Lo que la adopción masiva de productos de inteligencia artificial que generan videos podría cambiar significativamente es la forma en que las personas se expresan en línea. Durante el año pasado, memes, dibujos animados, caricaturas y otras imágenes generadas por IA, a veces llamadas “bazobra”, han saturado Internet. Este contenido, en gran parte claramente generado por IA en lugar de destinado a engañar (un medio de autoexpresión burdo, no un subterfugio sofisticado), puede haber sido el mayor impacto de la tecnología en las elecciones presidenciales de 2024. El hecho de que cualquiera pueda generar tales imágenes proporciona una manera de expresar inmediatamente sentimientos incipientes sobre un mundo incipiente a través de una imagen inmediatamente digerible. Como ha escrito mi colega Charlie Warzel, dicho contenido debe consumirse “de forma fugaz y con poca o ninguna reflexión más allá de la respuesta inicial del sistema límbico”.
Una avalancha de videos generados por IA podría proporcionar formas aún más poderosas de comunicar visualmente confusión, sentimientos cargados o propaganda persuasiva; tal vez una versión mucho más realista del reciente video de baja calidad generado por IA de Donald Trump y Jill Biden en un pelea a puñetazos, por ejemplo. Sora podría hacerse cargo de TikTok y plataformas similares de videos cortos justo cuando los modelos de generación de imágenes de IA han deformado Facebook y alterado la forma en que las personas muestran su apoyo en X a los candidatos políticos.
La adquisición de la web por parte de Sora no está garantizada. En mayo, Tim Brooks, otro investigador de Sora que desde entonces se unió a Google, comparó el estado actual del programa con GPT-1, la primera versión de los programas subyacentes a ChatGPT, que actualmente se encuentran en su cuarta generación. OpenAI repitió la analogía hoy. Esa comparación se ha roto a medida que la empresa se ha vuelto cada vez más orientada a las ganancias: GPT-1 fue una investigación altamente preliminar, un concepto antes de una prueba de concepto, y faltaron cuatro años para el lanzamiento de ChatGPT. Puede que Sora esté tan poco desarrollado como una vía para AGI, pero se ha convertido en un producto completo casi 10 meses después de que OpenAI se burlara del modelo. Es posible que una tecnología en etapa temprana no suponga un progreso significativo hacia la curación del cáncer, la solución de la crisis climática u otras formas en que la empresa emergente ha afirmado que la IA podría beneficiar a la humanidad en su conjunto. Pero podría ser todo lo que OpenAI necesita para mejorar sus resultados.