Noticias
Probé Sora de OpenAI, pero tengo problemas con su curva de aprendizaje

Ryan Haines / Autoridad de Android
Después de meses de espera, finalmente sucedió: OpenAI lanzó su generador de video, Sora. O, al menos, abrió el acceso a la herramienta, solo para que todo Internet se uniera simultáneamente, lo que obligó a OpenAI a frenar la creación de cuentas. Gracias a un poco de paciencia y determinación, logré superar la lista de espera y ahora tengo el poder de generar casi cualquier cosa que se me ocurra, dentro de unos límites bien definidos.
Sin embargo, ese gran poder y responsabilidad conllevan algo más: una gran curva de aprendizaje. Aunque disfruto de Sora y estoy impresionado por sus capacidades, tengo problemas para encontrar las indicaciones perfectas para obtener videos que me satisfagan. Estoy seguro de que es sólo una cuestión de práctica, pero así es como han sido mis primeros días con Sora.
¿Ya has utilizado Sora de OpenAI para generar vídeos?
0 votos
¿Creación de vídeos a tu alcance?

Ryan Haines / Autoridad de Android
Primero, hablemos de cómo funciona Sora, o al menos de cómo acceder a la poderosa herramienta de generación de videos. Aunque proviene de OpenAI y debes ser miembro de ChatGPT Plus o Pro para comenzar a crear, no puedes acceder a Sora a través de la interfaz principal de ChatGPT. En su lugar, debe dirigirse directamente al sitio web de Sora (sora.com), donde encontrará una galería de clips destacados que establecen el listón. increíblemente alto.
Al menos, pusieron el listón muy alto en mi cabeza. Revisé algunos de ellos, miré sus indicaciones, vi cómo funcionaban sin problemas y pensé que yo podía hacer lo mismo. Después de todo, mis indicaciones se ejecutarían a través de la misma adaptación de DALL-E 3 que las de ellos, por lo que deberían verse igual de bien, ¿verdad? No es tan fácil. Claro, escribir indicaciones es bastante fácil, pero descubrir a qué responde mejor Sora es un poco más difícil.
Crear vídeos es tan fácil como escribir lo que quieres ver… o al menos así parece en el papel.
Antes de pasar a los desafíos, probablemente debería aclarar algunas de las limitaciones actuales de Sora. A diferencia de Pixel Studio de Google u otro generador de imágenes básico, no puedes simplemente sentarte y ejecutar Sora a tu antojo, al menos no como miembro de ChatGPT Plus por $20 al mes.
En su lugar, se le otorga un banco de 1000 créditos, que puede gastar en la generación de videos como mejor le parezca. Todo lo que cambie dentro de su mensaje, desde la relación de aspecto hasta la duración y la resolución, costará una cierta cantidad de esos créditos hasta que se acabe el mes. Los videos nuevos cuestan entre 20 y 2000 créditos, y puedes consultar una útil tabla de costos aquí, algo que desearía haber encontrado antes de gastar 260 créditos en aproximadamente 20 minutos. También estás limitado a una generación de video a la vez y una resolución máxima de 720p como miembro Plus.
Si opta por una membresía ChatGPT Pro, los límites son mucho más flexibles pero el precio es mucho, mucho más alto: $200 por mes. En lugar de 1000 créditos, obtienes 10 000 créditos para vídeos prioritarios, después de los cuales obtienes generaciones de vídeos ilimitadas; simplemente tardan un poco más: OpenAI los llama “videos relajados”. Los miembros Pro también pueden generar cinco videos a la vez, subirlos a 1080p y dejar que se reproduzcan durante 20 segundos.
Desafortunadamente, sin embargo, no importa qué nivel de ChatGPT pagues, ninguno de los videos de Sora tiene audio, por lo que tendrás que descargar tus clips y sincronizar música o efectos de sonido después de haber definido las imágenes. OpenAI ha sugerido que el soporte para audio llegará a Sora eventualmente, pero aún no ha llegado.
¿Qué tan difícil podría ser?
Una vez terminada esa introducción básica, el resto del uso de Sora para generar videos debería ser fácil, ¿verdad? Bueno, sí y no. Mientras escribe su mensaje, elige su configuración en el menú en la parte inferior y espera a que se genere su video es Así de fácil, es mucho más difícil encontrar algo digno del feed destacado en constante cambio de Sora.
En un intento de compartir mi caché limitado de tokens para el mes, tan pronto como tuve acceso a Sora, me comuniqué con mi colega Mitja. Él y yo habíamos estado discutiendo qué tan rápido podríamos obtener acceso a la plataforma, por lo que pensé que podría tener algunas buenas ideas para generaciones desde el principio. Al final resultó que, su primer pensamiento fue algo que nunca podría haber imaginado: diez cebras trajeadas bailando una canción de Michael Jackson frente a la Ópera de Sydney mientras comían ravioles al pesto. Puede parecer un vídeo extraño de hacer, pero si Sora puede manejar esa cantidad de detalles, entonces definitivamente es el verdadero negocio.
Sora intentará casi cualquier cosa que le pidas, pero tienes que describirlo correctamente.
Una vez que terminé de reírme de la idea, se la pasé a Sora y esperé el resultado. Técnicamente, el producto final hizo bien la mayoría de las cosas. Puso un grupo de cebras vestidas de traje frente a la Ópera de Sydney, y todas tenían placas verdes en sus manos. Sin embargo, el número fluctuó entre ocho y aproximadamente 12 cebras, no había indicios de que fuera una canción de Michael Jackson, y los raviolis al pesto definitivamente eran solo un plato verde: cerca, pero no del todo correcto. Lo más preocupante es que había aumentado el coste del vídeo a 100 tokens porque esperaba que un clip de diez segundos mostrara más baile. No fue así.
Sin embargo, desde entonces aprendí que la herramienta Storyboard de Sora es imprescindible para casi cualquier cosa que implique movimiento complejo. Te permite arrastrar y soltar clips a lo largo de tu línea de tiempo de cinco o diez segundos, lo que ayuda a Sora a dividir la acción y fluir de una dirección a otra. Entonces, en un intento de sacar un poco más de acción de mis amigas cebra, salté al guión gráfico y dividí el baile y los ravioles de pesto en dos acciones separadas espaciadas a lo largo del clip de cinco segundos, luego usé ChatGPT para golpear. Sube mi descripción: otra característica más incorporada del Storyboard.
Una vez más… En cierto modo funcionó, pero en cierto modo no funcionó. Sí, conseguí las cebras, y estaban frente a la Ópera de Sydney, pero habían dejado de bailar y cuando les pidieron que comieran algunos de sus raviolis, de repente les crecieron manos humanas para sostener sus tenedores. Lo siento, feed destacado, pero creo que estoy muy lejos.
También probé indicaciones más naturales, como pingüinos macarrones deslizándose por icebergs hacia el mar, y sugerencias más fantásticas, como una tostada con una cara parecida a la de Pixar saltando de una tostadora, y la historia ha sido prácticamente la misma. Sora maneja increíblemente bien algunas partes de cada mensaje, pero debes describir tu escena con la cantidad justa de detalles. Demasiado, y Sora comienza a fusionar diferentes elementos. Demasiado poco y se obtiene un producto final relativamente aburrido.
Y, sin embargo, de alguna manera, hay más en Sora de lo que he tocado, especialmente cuando se trata de edición. El generador de video también ofrece la capacidad de volver a cortar, remezclar y combinar clips para ampliar una idea, unir un video a otro o recortar elementos que no funcionan bien. Pero, de nuevo, todavía me gustaría conseguir un vídeo que se vea bien la primera vez.
Dejando a un lado los desafíos, estoy emocionado por el futuro.
Ryan Haines / Autoridad de Android
En general, es justo decir que mis primeros días usando Sora fueron una mezcla de cosas. ¿Ha quedado perfecto el generador de vídeo? No, pero no puedo culpar del todo a OpenAI por eso. Esta es mi primera oportunidad de generar videos basados exclusivamente en texto, por lo que no me sorprende haber tenido dificultades para lograr el nivel correcto de detalle. Hasta ahora, le he dado a Sora demasiada información y le he dado muy poca, lo que significa que dar con el mensaje correcto tiene que estar a la vuelta de la esquina.
Pero lo más importante es que me ha impresionado mucho lo que Sora promete hacer. Los videos que puedo crear como miembro de ChatGPT Plus toman solo unos minutos para crearlos, e imagino que se volverán más rápidos a medida que el modelo continúe su entrenamiento. No estoy del todo seguro de si usaría alguno de los clips rápidos que Sora ha preparado todavía (muchos de ellos todavía sufren de artefactos extraños como los brazos humanos que aparecen en mis cebras), pero los clips que sí llegan a la casa de Sora. La colección destacada me da la esperanza de que sea solo cuestión de aprender a pedir los elementos correctos.
Estoy impresionado con Sora, pero tengo mucho que aprender.
Además de eso, no me sorprendería si también se abre la forma en que OpenAI maneja las indicaciones y las creaciones. En este momento, cuando agotas tus 1000 créditos como miembro de ChatGPT Plus, eso es todo: no hay forma de comprar algunos más hasta que finalice tu período de facturación. Del mismo modo, no hay forma de transferir los créditos no utilizados de un mes al siguiente, por lo que debe encontrar el equilibrio adecuado entre gastos y ahorros para pasar el mes.
Si fuera por mí, seguramente me gustaría reclamar algunos de los créditos más tontos que he gastado, pero esa no es una opción. En cambio, lo llamaré costo de aprendizaje y tendré que tomarme un poco más de tiempo para afinar mis indicaciones antes de enviárselas a Sora. Quizás algún día se me ocurra algo que valga la pena presentar.