Connect with us

Noticias

El controvertido Sora de OpenAI finalmente se lanza hoy. ¿Realmente alterará Hollywood? | Negocio

Published

on

LOS ÁNGELES – La controvertida herramienta de inteligencia artificial de texto a video de OpenAI, Sora, causó conmoción en la industria del entretenimiento cuando la compañía la presentó a principios de este año.

La tecnología prometía revolucionar la cinematografía al crear automáticamente cortometrajes basados ​​en comandos escritos. Por ejemplo, los usuarios podrían escribir descripciones, como “una mujer elegante camina por una calle de Tokio”, y Sora proporcionaría videos de hasta 60 segundos basados ​​en esa información. Los trabajadores temían que fuera el preludio de un futuro en el que la IA desplazara puestos de trabajo en todo Hollywood.

Pero hasta ahora, Sora ha estado disponible sólo para personas que participan en investigaciones, pruebas y avances para artistas.

El lunes, Sora se enfrenta a su próxima gran prueba cuando OpenAI, mejor conocido por el robot de texto ChatGPT, lo ponga a disposición del público en general. En Estados Unidos, los consumidores pueden utilizar Sora con una suscripción ChatGPT Plus, que cuesta 20 dólares al mes. Puede generar hasta 50 videos de hasta 20 segundos de duración. Los clientes pueden obtener un mayor uso de Sora, mayor resolución y videos más largos con una suscripción a ChatGPT Pro.

Los ejecutivos de OpenAI dicen que Sora generará nuevas posibilidades para artistas y creativos.

“Realmente creemos que Sora puede abrir puertas para que las personas exploren y compartan su creatividad visualmente, especialmente sin grandes recursos o capacitación”, dijo Souki Mansoor, líder del programa de artistas Sora para OpenAI, en una entrevista. “Como sabemos, hacer cine es muy caro”.

La herramienta será accesible para personas mayores de 18 años donde ChatGPT esté disponible, excepto en el Reino Unido, Suiza y los países del Espacio Económico Europeo. OpenAI dijo que está trabajando para habilitar Sora en esas ubicaciones. La empresa también está preparando una versión gratuita de Sora.

La IA es una importante fuente de tensión en la industria del entretenimiento. Fue un tema clave en las huelgas del año pasado de actores y escritores, que buscaron protección contra la tecnología en ascenso como parte de sus negociaciones contractuales.

Muchos también han expresado su preocupación sobre cómo se entrenan los modelos de IA y si los titulares de derechos de propiedad intelectual y los artistas están recibiendo una compensación justa, o ninguna, por el contenido digerido por la poderosa tecnología.

Mientras tanto, las empresas de entretenimiento han estado explorando asociaciones con nuevas empresas de inteligencia artificial como una forma de ahorrar dinero.

Mansoor dijo que OpenAI es sensible a las preocupaciones planteadas por los creativos sobre posibles pérdidas de empleos, pero es optimista sobre las oportunidades.

“Sora está diseñado como un colaborador creativo, por lo que la esperanza es que ayude a los artistas a dar vida a proyectos muy ambiciosos sin recursos costosos”, dijo Mansoor. “Creemos que esto está elevando el nivel de lo que es posible en la creación de videos”.

Los defensores de Sora dicen que podría ayudar a los artistas a probar ideas audaces sin tantas restricciones presupuestarias. Alexia Adana, directora creativa y artista visual radicada en Nueva York, argumentó que podría permitir más historias de personas, incluidos creadores subrepresentados, que carecen de recursos financieros o equipos.

“Estamos en esta era en la que puedes crear cualquier cosa y aprender cualquier cosa, y es gratis o de muy bajo costo”, dijo Adana, que tuvo acceso temprano a Sora. “Este es un momento muy emocionante para personas que normalmente no tendrían los recursos para demostrar su visión”.

Adana usó a Sora para crear un concepto cinematográfico llamado “Bloomchild”, que mostraba a un niño hecho de tierra y tierra que florece y lucha por encajar. Dijo que fue influenciado por sus propias experiencias como persona de Jamaica que creció en los suburbios. de Connecticut.

“Puedo utilizar una herramienta para crear un tráiler completo”, dijo Adana. “Nunca antes habría podido hacer eso”.

El artista de pop independiente Washed Out utilizó a Sora para crear un vídeo musical. El director dijo que la herramienta le permitió mostrar escenas de múltiples lugares a una fracción del costo de filmar en exteriores. Mientras tanto, un vídeo que explica los orígenes de Toys R Us fue realizado en un 80% con Sora, dijo Nik Kleverov, director creativo de Native Foreign, una agencia creativa y productora con sede en Culver City.

OpenAI dijo que Sora implementará medidas de seguridad para evitar abusos de la herramienta, como la desnudez infantil.

Rohan Sahai, líder de ingeniería de Sora, dijo que OpenAI ha realizado “mucho trabajo de seguridad para comprender mejor cómo prevenimos el uso indebido” desde que se anunció Sora por primera vez en febrero.

Algunos artistas están enojados con la forma en que OpenAI ha probado y desarrollado Sora. El mes pasado, un grupo de artistas expresó su preocupación en una carta en línea sobre cuántos creadores, en su opinión, están siendo utilizados para probar y promover la tecnología sin una compensación adecuada.

La carta abierta ha recibido más de 1.170 firmas, incluida la del artista londinense Jake Elwes.

“Si bien cientos contribuyen de forma gratuita, unos pocos seleccionados serán elegidos a través de un concurso para que se proyecten sus películas creadas por Sora, ofreciendo una compensación mínima que palidece en comparación con el importante valor de relaciones públicas y marketing que recibe OpenAI”, escribieron los artistas.

Mansoor dijo que los comentarios del grupo no tuvieron influencia en el momento del lanzamiento de Sora. Dijo que la compañía se centró en brindar acceso temprano a los artistas que se verían más afectados por herramientas como Sora y darles la opción de ayudar a dar forma al desarrollo de la herramienta.

“No había obligación ni siquiera de utilizar la herramienta, y mucho menos de dar retroalimentación”, dijo.

Mansoor dijo que provenía de la industria creativa y pasó más de una década en el cine independiente. “Llegué a OpenAI para crear el tipo de experiencias que desearía tener en la industria”, dijo.

Kleverov dijo que las preocupaciones planteadas en la carta no reflejaban las opiniones de los primeros evaluadores. “El mundo de la IA ya es muy pequeño y dentro del mundo, aquellos de nosotros que jugamos con Sora, es un espacio de gran apoyo”, dijo.

Walter Woodman, director y cofundador de la productora Shy Kids de Toronto y Los Ángeles, dijo que una vez que la gente experimente Sora, “todos verán que no es una solución mágica”. Shy Kids ha utilizado a Sora para trabajar en cortometrajes como “My Love”.

Muchos creadores que han utilizado herramientas de inteligencia artificial dicen que lleva tiempo dominarlas y que la tecnología tiene limitaciones importantes.

“Sora puede ayudar, al igual que una cámara, un equipo de edición o un gran rendimiento”, dijo Woodman en un correo electrónico. “Pero sin una gran narración y narradores, será solo una herramienta en el estante. Sin embargo, aquellos con talento tendrán un despertar creativo”.


©2024 Los Ángeles Times. Visítelo en latimes.com. Distribuido por Tribune Content Agency, LLC.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Informe de chatgpt para marketing

Published

on

Continue Reading

Noticias

Operai supera a Deepseek en el razonamiento a nivel de oración

Published

on

Chatgpt y otros chatbots de IA basados ​​en modelos de idiomas grandes se sabe que ocasionalmente inventa cosas, incluidas las citas científicas y legales. Resulta que medir cuán precisas son las citas de un modelo AI es una buena manera de evaluar las habilidades de razonamiento del modelo.

Un modelo de IA “razones” descomponiendo una consulta en pasos y trabajando a través de ellos en orden. Piense en cómo aprendió a resolver problemas de palabras matemáticas en la escuela.

Idealmente, para generar citas, un modelo de IA comprendería los conceptos clave en un documento, generaría una lista clasificada de documentos relevantes para citar y proporcionaría un razonamiento convincente sobre cómo cada documento sugerido respalda el texto correspondiente. Destacará las conexiones específicas entre el texto y la investigación citada, aclarando por qué cada fuente importa.

La pregunta es, ¿se puede confiar en los modelos de hoy para hacer estas conexiones y proporcionar un razonamiento claro que justifique sus elecciones de origen? La respuesta va más allá de la precisión de las citas para abordar cuán útiles y precisos son los modelos de lenguaje grande para cualquier propósito de recuperación de información.

Soy un informático. Mis colegas, investigadores del Instituto AI de la Universidad de Carolina del Sur, la Universidad Estatal de Ohio y el Condado de Baltimore del Condado de Baltimore, y he desarrollado las razones de referencia para probar qué tan bien modelos de idiomas pueden generar automáticamente citas de investigación y proporcionar un razonamiento comprensible.

Utilizamos el punto de referencia para comparar el rendimiento de dos modelos de razonamiento de IA populares, Deepseek’s R1 y OpenAI’s O1. Aunque Deepseek fue en los titulares con su impresionante eficiencia y rentabilidad, el advenedizo chino tiene un camino por recorrer para que coincida con el rendimiento de razonamiento de OpenAI.

Oración específica

La precisión de las citas tiene mucho que ver con si el modelo AI está razonando sobre la información a nivel de oración en lugar del párrafo o a nivel de documentos. Se puede considerar que las citas a nivel de párrafo y a nivel de documentos arrojan una gran parte de la información a un modelo de idioma grande y le piden que proporcione muchas citas.

En este proceso, el modelo de lenguaje grande se generaliza e incorporan las oraciones individuales. El usuario termina con citas que explican todo el párrafo o documento, no la información de grano relativamente fino en la oración.

Además, el razonamiento sufre cuando le pide al modelo de idioma grande que lea un documento completo. Estos modelos se basan principalmente en memorizar patrones que típicamente son mejores para encontrar al principio y al final de los textos más largos que en el medio. Esto les dificulta comprender completamente toda la información importante a lo largo de un documento largo.

Los modelos de idiomas grandes se confunden porque los párrafos y documentos tienen mucha información, lo que afecta la generación de citas y el proceso de razonamiento. En consecuencia, el razonamiento de los modelos de idiomas grandes sobre los párrafos y los documentos se vuelve más como resumir o parafrasear.

Las razones por las que Benchmark aborde esta debilidad al examinar la generación y el razonamiento de las citas de los modelos de idiomas grandes.

https://www.youtube.com/watch?v=kqzzymhre0u

Cómo Deepseek R1 y OpenAI O1 se comparan generalmente con los problemas lógicos.

Prueba de citas y razonamiento

Tras el lanzamiento de Deepseek R1 en enero de 2025, queríamos examinar su precisión en la generación de citas y su calidad de razonamiento y compararlo con el modelo O1 de OpenAI. Creamos un párrafo que tenía oraciones de diferentes fuentes, dio a los modelos oraciones individuales de este párrafo y pedimos citas y razonamiento.

Para comenzar nuestra prueba, desarrollamos un pequeño lecho de prueba de aproximadamente 4,100 artículos de investigación alrededor de cuatro temas clave que están relacionados con el cerebro humano y la informática: neuronas y cognición, interacción humana-computadora, bases de datos e inteligencia artificial. Evaluamos los modelos utilizando dos medidas: la puntuación F-1, que mide cuán precisa es la cita proporcionada, y la tasa de alucinación, que mide cuán sonido es el razonamiento del modelo, es decir, con qué frecuencia produce una respuesta inexacta o engañosa.

Nuestras pruebas revelaron diferencias de rendimiento significativas entre OpenAI O1 y Deepseek R1 en diferentes dominios científicos. El O1 de OpenAI conectó bien la información entre los diferentes sujetos, como comprender cómo la investigación sobre neuronas y cognición se conecta con la interacción humana y la computadora y luego con los conceptos en inteligencia artificial, sin dejar de ser precisa. Sus métricas de rendimiento superaron constantemente a Deepseek R1 en todas las categorías de evaluación, especialmente para reducir las alucinaciones y completar con éxito las tareas asignadas.

Operai O1 fue mejor para combinar ideas semánticamente, mientras que R1 se centró en asegurarse de que generara una respuesta para cada tarea de atribución, lo que a su vez aumentó la alucinación durante el razonamiento. Openai O1 tenía una tasa de alucinación de aproximadamente 35% en comparación con la tasa de Deepseek R1 de casi el 85% en la tarea de razonamiento basada en la atribución.

En términos de precisión y competencia lingüística, Openai O1 obtuvo alrededor de 0.65 en la prueba F-1, lo que significa que era correcto aproximadamente el 65% del tiempo al responder preguntas. También obtuvo alrededor de 0.70 en la prueba BLEU, que mide qué tan bien un modelo de lenguaje escribe en lenguaje natural. Estos son puntajes bastante buenos.

Deepseek R1 obtuvo un puntaje más bajo, con aproximadamente 0.35 en la prueba F-1, lo que significa que era correcto aproximadamente el 35% del tiempo. Sin embargo, su puntaje Bleu fue solo alrededor de 0.2, lo que significa que su escritura no era tan natural como la O1 de OpenAI. Esto muestra que O1 fue mejor al presentar esa información en un lenguaje claro y natural.

OpenAi tiene la ventaja

En otros puntos de referencia, Deepseek R1 se desempeña a la par con OpenAi O1 en tareas de matemáticas, codificación y razonamiento científico. Pero la diferencia sustancial en nuestro punto de referencia sugiere que O1 proporciona información más confiable, mientras que R1 lucha con la consistencia objetiva.

Aunque incluimos otros modelos en nuestras pruebas integrales, la brecha de rendimiento entre O1 y R1 resalta específicamente el panorama competitivo actual en el desarrollo de IA, con la oferta de OpenAI que mantiene una ventaja significativa en las capacidades de razonamiento e integración del conocimiento.

Estos resultados sugieren que OpenAi todavía tiene una ventaja cuando se trata de atribución y razonamiento de origen, posiblemente debido a la naturaleza y el volumen de los datos en los que fue entrenado. La compañía anunció recientemente su herramienta de investigación profunda, que puede crear informes con citas, hacer preguntas de seguimiento y proporcionar razonamiento para la respuesta generada.

El jurado todavía está en el valor de la herramienta para los investigadores, pero la advertencia permanece para todos: verifique todas las citas que le brinda una IA.

Continue Reading

Noticias

Me mudé y Géminis me ayudó de más formas que puedas imaginar

Published

on

Ryan Haines / Android Authority

Estoy en el proceso de mudarme a mi nuevo apartamento y, sinceramente, toda la experiencia ha sido estresante, por decir lo menos. Entre tratar de descifrar todo el papeleo legal vinculado a mi compra de bienes raíces y descubrir cómo decorar el espacio para que no se sienta apretado o pegajoso, ha habido muchos desafíos que superar.

Afortunadamente, no estaba solo en esto. Tuve la ayuda de mi buen amigo, AI. Me encontré inclinado fuertemente en Géminis para la gran mayoría de los problemas que me encontré, aunque cambié a Notebooklm para una tarea específica y muy importante.

Simplificando la jerga legal

Manual de autos de cuaderno

Andy Walker / Android Authority

El papeleo involucrado con mi compra de bienes raíces fue desalentador: más de cien páginas, gran parte llena de jerga legal densa que era increíblemente difícil de entender. Aquí es donde AI realmente me ayudó.

Para la mayoría de mis preguntas relacionadas con el documento, recurrí a Géminis. Podría cargar los archivos y hacer preguntas específicas sobre cláusulas o términos que me confundieron. Por ejemplo, la política de garantía no estaba claramente explicada; Acaba de hacer referencia a leyes específicas. Géminis fue un salvavidas aquí. Con una consulta rápida, explicó las leyes relevantes y respondió pacientemente todas mis preguntas de seguimiento, aclarando exactamente lo que estaba cubierto y por cuánto tiempo.

Sin embargo, para las inmersiones profundas en todo el conjunto de documentos, cambié a Notebooklm. Su capacidad para trabajar dentro de un conjunto definido de fuentes lo hizo perfecto para esto. Creé un cuaderno dedicado que contiene todos los documentos relacionados con mi compra. Cada vez que una pregunta aparecía en mi cabeza, ya sea legal o simplemente práctica, Notebooklm podría escanear mis documentos y proporcionar la respuesta en segundos. Esto me ahorró una increíble cantidad de tiempo; De lo contrario, fácilmente habría pasado media hora o más cavando a través de esas más de 100 páginas tratando de encontrar una sola información. La tranquilidad de saber que podría verificar rápidamente los detalles fue invaluable.

Abordar el diseño de interiores con Géminis

Géminis también fue de gran ayuda con el diseño interior. Si alguna vez has intentado decorar una casa desde cero sin mucha experiencia, sabes lo complicado que es. Es sorprendentemente fácil terminar con un espacio que se siente frío y estéril o simplemente pegajoso.

Géminis actuó como mi consultor de diseño personal. Ofrecía consejos sobre todo, desde esquemas de color que funcionarían bien en mis condiciones de iluminación específicas hasta mantener el equilibrio visual y las proporciones entre los muebles adyacentes, como garantizar que un gran armario no haya dominado por completo la cómoda de los cajones al lado.

Géminis fue mi consultor de diseño personal.

También ayudó con una planificación espacial práctica, sugiriendo cosas como la distancia mínima cómoda necesaria entre el mostrador de la cocina y la mesa del comedor en mi espacio relativamente estrecho, y asesorando en las dimensiones correctas de la alfombra para anclar la sala de estar sin abrumarla. Utilicé una herramienta 3D Home Design Planner para visualizar estas recomendaciones, y tengo que decir que el diseño realmente se unió maravillosamente gracias a la entrada de Gemini.

Consejos iluminadores sobre iluminación

Aidot Linkind Bulb de luz inteligente A19 RGBTW Luces y caja 2

Edgar Cervantes / Android Authority

Luego hay iluminación, otro tema sorprendentemente complejo si no está familiarizado con los tecnicismos. Tuve que descubrir y comprender la diferencia entre lúmenes (brillo) y los celví (temperatura de color), y lo que podría funcionar para mí. Planificación de la iluminación perfecta en un apartamento completo, especialmente teniendo en cuenta las diferentes necesidades (luz más brillante y más blanca en la cocina para la visibilidad frente a la luz más cálida, más suave en el dormitorio para relajarse), se sintió abrumadora.

Géminis entró aquí también. Calculó fácilmente cuántas lúmenes probablemente necesitaría para áreas específicas en función de su tamaño y función, sugirió niveles de brillo apropiados (rangos de kelvin) para diferentes habitaciones y más. Incluso me ayudó a comprender los entresijos del sistema de iluminación del hogar inteligente IKEA que estaba considerando, explicando cómo funciona, dando una idea de los costos involucrados e incluso estimando el impacto potencial en mi factura de electricidad.

Antes de tener un asistente de IA como Gemini, habría pasado horas buscando en Google, dando docenas de artículos y publicaciones de foro, y probablemente aún terminaba con preguntas sin respuesta o consejos contradictorios.

Resolver problemas inesperados

Mudarse a un nuevo lugar rara vez va perfectamente suavemente. Me encontré con problemas inesperados, como manchas obstinadas en el piso del baño que realmente no deberían haber estado allí. Gemini me ayudó a hacer una lluvia de ideas sobre el tipo de mancha más probable en función de su apariencia y ubicación, y luego sugirió una gama de métodos de limpieza para probar, desde opciones suaves hasta soluciones más fuertes.

Desafortunadamente, varios defectos menores también formaron parte de mi “nueva” experiencia inmobiliaria, y hacer que Gemini proporcione resúmenes rápidos de mis derechos basados ​​en los documentos legales (como las cláusulas de garantía) fue increíblemente útil al comunicarse con el desarrollador.

Dando un paso más allá: Análisis de plano de planta

Moto G Power 2025 Imagen de revisión que muestra el cuadro de inmediato de Ask Gemini

Rushil Agrawal / Android Authority

Sintiéndome ambicioso, tomé las cosas un poco al proporcionar a Géminis el plano de planta real de mi apartamento y solicitando consejos de posicionamiento de muebles. Estaba realmente impresionado con las sugerencias.

La IA recomendó ideas prácticas como “Zoning” mi sala de estar. Dado que es parte de un área de planta abierta que combina la vida, la comida y la cocina, Géminis sugirió usar la disposición de muebles y posiblemente una alfombra para separar visualmente el espacio vital y hacer que se sienta más distinta. Dado que mi área de vida principal es larga y relativamente estrecha, también sugirió inteligentemente el uso de espejos para crear una ilusión de amplitud y optar por muebles de color más ligero para mejorar esa sensación de aire.

Algunos de estos consejos que podría haber encontrado eventualmente, pero Gemini definitivamente provocó ideas que no había considerado y ayudó a confirmar algunos de mis propios instintos.

Lo que deseo que Géminis pueda hacer a continuación

Aplicación Géminis iOS

Robert Triggs / Android Authority

Si bien aprecié la ayuda de Gemini durante todo este proceso, la experiencia también destacó las áreas donde deseé que AI pudiera hacer aún más.

La función de sueño? Subir mi plano de planta y hacer que Gemini genere un modelo 3D interactivo del apartamento. Imagine una IA que luego podría sugerir automáticamente esquemas de decoración basados ​​en preferencias personales (estilo, color, presupuesto) y le permita modificar todo a los detalles más pequeños dentro de ese espacio virtual. Terminé usando Homestyler para crear mi modelo 3D y planificar el diseño, lo cual fue divertido pero definitivamente un proceso que requiere mucho tiempo. Si Gemini tuviera esta capacidad incorporada, me habría ahorrado horas e hizo que el proceso de visualización fuera sin problemas.

Todavía se parece un poco a la ciencia ficción, pero realmente creo que llegaremos a ese punto más temprano que tarde. ¿Una IA que no solo puede aconsejar sino también visualizar e implementar ideas de diseño en un espacio virtual? Ese será un cambio de juego para cualquiera que cree un nuevo hogar.

Continue Reading

Trending