Connect with us

Noticias

El modo de voz avanzado de ChatGPT finalmente obtiene contexto visual en el sexto día de OpenAI

Published

on

NurPhoto / Colaborador / Getty Images

Ahora que se acerca la temporada navideña, muchas empresas están encontrando formas de aprovecharlas mediante ofertas, promociones u otras campañas. OpenAI ha encontrado una manera de participar con su serie de eventos “12 días de OpenAI”.

El miércoles, OpenAI anunció a través de una publicación X que a partir del 5 de diciembre, la compañía organizaría 12 días de transmisiones en vivo y lanzaría “un montón de cosas nuevas, grandes y pequeñas”, según la publicación.

Además: el generador de vídeo Sora AI de OpenAI ya está aquí: cómo probarlo

Aquí encontrará todo lo que necesita saber sobre la campaña, así como un resumen de las novedades de cada día.

¿Qué son los ’12 días de OpenAI’?

El director ejecutivo de OpenAI, Sam Altman, compartió un poco más de detalles sobre el evento, que comenzó a las 10 a.m. PT del 5 de diciembre y se llevará a cabo diariamente durante 12 días laborables con una transmisión en vivo con un lanzamiento o una demostración. Los lanzamientos serán tanto “grandes” como “de relleno”, según Altman.

¿Qué se ha dejado caer hasta ahora?

Jueves 12 de diciembre

Cuando comenzó la transmisión en vivo, OpenAI abordó el elefante en la sala: el hecho de que la transmisión en vivo de la compañía se interrumpió el día anterior. OpenAI se disculpó por el inconveniente y dijo que su equipo está trabajando en una autopsia que se publicará hoy.

Luego saltó directamente a las noticias: otro anuncio muy esperado:

  • El modo de voz avanzado ahora tiene capacidades visuales y para compartir pantalla, lo que significa que puede ayudar con el contexto de lo que está viendo, ya sea desde la cámara de su teléfono o lo que está en la pantalla.
  • Estas capacidades se basan en lo que Advanced Voice ya podía hacer muy bien: entablar una conversación informal como lo haría un ser humano. Las conversaciones naturales pueden interrumpirse, tener múltiples giros y comprender líneas de pensamiento no lineales.
  • En la demostración, el usuario recibe instrucciones de Advanced Voice de ChatGPT sobre cómo preparar una taza de café. A medida que el participante sigue los pasos, ChatGPT ofrece verbalmente ideas e instrucciones.
  • Hay otra ventaja para la temporada navideña: los usuarios pueden acceder a una nueva voz de Papá Noel. Para activarlo, lo único que los usuarios tienen que hacer es hacer clic en el icono del copo de nieve. Santa se implementará hoy en todos los lugares donde los usuarios puedan acceder al modo de voz ChatGPT. La primera vez que hablas con Santa, tus límites de uso se restablecen, incluso si ya has alcanzado el límite, para que puedas tener una conversación con él.
  • Los videos y la pantalla compartida se implementarán en las últimas aplicaciones móviles a partir de hoy y durante la próxima semana para todos los usuarios del Equipo y la mayoría de los suscriptores Pro y Plus. Los suscriptores Pro y Plus en Europa tendrán acceso “tan pronto como podamos”, y los usuarios Enterprise y Edu tendrán acceso a principios del próximo año.

Miércoles 11 de diciembre

Apple lanzó iOS 18.2 hoy. El lanzamiento incluye integraciones con ChatGPT en Siri, Herramientas de escritura y Visual Intelligence. Como resultado, la transmisión en vivo de hoy se centró en recorrer la integración.

  • Siri ahora puede reconocer cuando haces preguntas fuera de su alcance que podrían beneficiarse de ser respondidas por ChatGPT. En esos casos, le preguntará si desea procesar la consulta mediante ChatGPT. Antes de enviar cualquier solicitud a ChatGPT, siempre aparecerá un mensaje notificando al usuario y pidiéndole permiso, poniendo el control en manos del usuario tanto como sea posible.
  • Visual Intelligence se refiere a una nueva función para la línea iPhone 16 a la que los usuarios pueden acceder tocando el botón Control de cámara. Una vez que la cámara está abierta, los usuarios pueden apuntar a algo y buscar en la web con Google, o usar ChatGPT para obtener más información sobre lo que están viendo o realizar otras tareas como traducir o resumir texto.
  • Writing Tools ahora presenta una nueva herramienta “Redactar”, que permite a los usuarios crear texto desde cero aprovechando ChatGPT. Con esta función, los usuarios pueden incluso generar imágenes usando DALL-E.

Todas las funciones anteriores están sujetas a los límites de uso diario de ChatGPT, de la misma manera que los usuarios alcanzarían límites al usar la versión gratuita del modelo en ChatGPT. Los usuarios pueden elegir si habilitar o no la integración de ChatGPT en Configuración.

Lea más al respecto aquí: iOS 18.2 se implementa en iPhones: pruebe estas 6 nuevas funciones de IA hoy

Martes 10 de diciembre

  • Canvas llegará a todos los usuarios web, independientemente del plan, en GPT-4o, lo que significa que ya no está disponible solo en versión beta para los usuarios de ChatGPT Plus.
  • Canvas se ha integrado en GPT-4o de forma nativa, lo que significa que puede simplemente llamar a Canvas en lugar de tener que alternar en el selector de modelo.
  • La interfaz de Canvas es la misma que vieron los usuarios en la versión beta de ChatGPT Plus, con una tabla en el lado izquierdo que muestra el intercambio de preguntas y respuestas y una pestaña en el lado derecho que muestra su proyecto, mostrando todas las ediciones a medida que avanzan. , así como atajos.
  • Canvas también se puede utilizar con GPT personalizados. Está activado de forma predeterminada al crear uno nuevo y existe una opción para agregar Canvas a los GPT existentes.
  • Canvas también tiene la capacidad de ejecutar código Python directamente en Canvas, lo que permite a ChatGPT ejecutar tareas de codificación, como corregir errores.

Lea más al respecto aquí: Soy un usuario avanzado de ChatGPT y Canvas sigue siendo mi función de productividad favorita un mes después

Lunes 9 de diciembre

OpenAI se burló del anuncio del tercer día como “algo que estabas esperando”, seguido por la tan esperada caída de su modelo de video: Sora. Esto es lo que necesita saber:

  • Conocido como Sora Turbo, el modelo de video es más inteligente que el modelo de febrero que se mostró en vista previa.
  • El acceso llegará a los EE. UU. más tarde hoy; los usuarios solo necesitan ChatGPT Plus y Pro.
  • Sora puede generar video a video, texto a video y más.
  • Los usuarios de ChatGPT Plus pueden generar hasta 50 videos por mes con una resolución de 480p o menos videos a 720p. El Plan Pro ofrece 10 veces más uso.
  • El nuevo modelo es más inteligente y económico que el modelo presentado en febrero.
  • Sora presenta una página de exploración donde los usuarios pueden ver las creaciones de los demás. Los usuarios pueden hacer clic en cualquier vídeo para ver cómo se creó.
  • Una demostración en vivo mostró el modelo en uso. Los participantes en la demostración ingresaron un mensaje y eligieron la relación de aspecto, la duración e incluso los ajustes preestablecidos. Los resultados del vídeo de demostración en vivo me parecieron realistas e impresionantes.
  • OpenAI también presentó Storyboard, una herramienta que permite a los usuarios generar entradas para cada cuadro de una secuencia.

Viernes 6 de diciembre:

En el segundo día de “shipmas”, OpenAI amplió el acceso a su Programa de investigación de ajuste de refuerzo:

  • El programa Reinforcement Fine-Tuning permite a los desarrolladores e ingenieros de aprendizaje automático ajustar los modelos OpenAI para “destacar en conjuntos específicos de tareas complejas y específicas de un dominio”, según OpenAI.
  • El ajuste fino de refuerzo se refiere a una técnica de personalización en la que los desarrolladores pueden definir el comportamiento de un modelo ingresando tareas y calificando el resultado. Luego, el modelo utiliza esta retroalimentación como guía para mejorar, mejorar el razonamiento a través de problemas similares y mejorar la precisión general.
  • OpenAI alienta a los institutos de investigación, universidades y empresas a postularse al programa, particularmente aquellos que realizan conjuntos reducidos de tareas complejas, podrían beneficiarse de la asistencia de la IA y realizan tareas que tienen una respuesta objetivamente correcta.
  • Las plazas son limitadas; Los solicitantes interesados ​​pueden postularse completando este formulario.
  • OpenAI tiene como objetivo hacer que Reinforcement Fine-Tuning esté disponible públicamente a principios de 2025.

Jueves 5 de diciembre:

OpenAI comenzó con fuerza, presentando dos actualizaciones importantes para su chatbot: un nuevo nivel de suscripción ChatGPT, ChatGPT Pro y la versión completa del modelo o1 de la compañía.

La versión completa de o1:

  • Será mejor para todo tipo de indicaciones, más allá de las matemáticas y las ciencias.
  • Cometerá errores importantes aproximadamente un 34% menos que o1-preview, mientras que pensará un 50% más rápido
  • Se lanza hoy, reemplazando o1-preview para todos los usuarios de ChatGPT Plus y ahora Pro
  • Permite a los usuarios ingresar imágenes, como se ve en la demostración, para proporcionar un razonamiento multimodal (razonamiento tanto en texto como en imágenes).

ChatGPT Pro:

  • Está destinado a superusuarios de ChatGPT Plus, otorgándoles acceso ilimitado a lo mejor que OpenAI tiene para ofrecer, incluido acceso ilimitado a OpenAI o1-mini, GPT-4o y Modo avanzado.
  • Incluye el modo o1 pro, que utiliza más computación para razonar los problemas científicos y matemáticos más difíciles.
  • Cuesta $200 por mes

¿Dónde puedes acceder a la transmisión en vivo?

Las transmisiones en vivo se llevan a cabo en el sitio web de OpenAI y se publican en su canal de YouTube inmediatamente después. Para facilitar el acceso, OpenAI también publicará un enlace a la transmisión en vivo en su cuenta X 10 minutos antes de que comience, que será aproximadamente a las 10 a. m. PT/1 p. m. ET todos los días.

¿Qué puedes esperar?

Los lanzamientos siguen siendo una sorpresa, pero muchos anticipan que Sora, el modelo de vídeo de OpenAI anunciado inicialmente en febrero pasado, se lanzará como parte de uno de los lanzamientos más importantes. Desde ese primer anuncio, el modelo ha estado disponible para un grupo selecto de miembros del equipo rojo y evaluadores y algunos evaluadores lo filtraron la semana pasada por quejas sobre “trabajo no remunerado”, según los informes.

Además: el o1 de OpenAI miente más que cualquier modelo importante de IA. ¿Por qué eso importa?

Otros lanzamientos rumoreados incluyen una versión nueva y más completa del o1 LLM de la compañía con capacidades de razonamiento más avanzadas y una voz de Papá Noel para el modo de voz avanzado de OpenAI. por código detectado por usuarios hace sólo un par de semanas con el nombre en clave “Straw”.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

5 Informe de la generación de imágenes Chatgpt que me volaron

Published

on

ChatGPT se ha convertido silenciosamente en una fuerza formidable en la generación de imágenes de IA, y la mayoría de las personas no se dieron cuenta. Mientras que todos siguen debatiendo Midjourney vs Dall-E, Operai ha convertido a Chatgpt en una potencia creativa que rivaliza y, a menudo, supera a Gemini, Leonardo e Ideogram.

Me sorprendió realmente lo buena generación de imágenes de Chatgpt. Lo que comenzó como experimentación casual se convirtió rápidamente en asombro cuando los resultados fueron prácticamente indistinguibles de las fotos reales. El verdadero atractivo es cómo no hay necesidad de la jerga más técnica que necesita al solicitar otras herramientas de imagen de IA.

Continue Reading

Noticias

El generador de video Veo 3 AI de Gemini está a solo un paso de diezmar la verdad en Internet

Published

on

Recientemente probé Google Géminis Modelo de generación de videos más nuevo y muy publicitado, VEO 3. Parte del extremadamente costoso plan AI Ultra de Gemini de $ 250 por mes, VEO 3 puede hacer pequeños objetos finamente detallados, finamente detallados, como cebollas picadasen movimiento y crear audio acompañante y realista. No es perfecto, pero con una calibración rápida cuidadosa y suficientes generaciones, puede crear algo indistinguible, de un vistazo, de la realidad.

Sí, esta es una nueva tecnología fresca, profundamente impresionante. Pero también es mucho más que eso. Podría significar la final de la muerte final de la verdad en Internet. Veo 3 ya plantea una gran amenaza como es, pero solo una actualización menor revolucionará la creación de Deepfake, el acoso en línea y la propagación de la información errónea.


Una vez que Veo 3 obtiene la función de carga de la imagen, todo ha terminado

Para todas las actualizaciones que el modelo VEO 3 tiene sobre su predecesor, VEO 2, actualmente le falta una característica clave: la capacidad de generar videos basados ​​en imágenes que sube.

Con Veo 2, puedo subir una foto mía, por ejemplo, y hacer que genere un video de mí trabajando en mi computadora. Teniendo en cuenta que Veo 2 y la herramienta de animación de IA de Google, Whisk, ambos admiten esta funcionalidad, parece inevitable que Veo 3 lo obtenga eventualmente. (Le preguntamos a Google si planea agregar esta función y actualizará este artículo con su respuesta). Esto significaría que cualquiera podrá generar videos realistas de personas que conocen y decir cosas que nunca tienen y probablemente nunca lo harían.

Las implicaciones son obvias en una era en la que los clips de autenticidad dudosa se extienden como incendios forestales en las redes sociales todos los días. ¿No te gusta tu jefe? Envíe un clip a HR de ellos haciendo algo inapropiado. ¿Quieres difundir noticias falsas? Publique una conferencia de prensa falsa en Facebook. ¿Odias a tu ex? Generalos haciendo algo indecoroso y envíelo a toda su familia. Los únicos límites reales son tu imaginación y tu moralidad.

Si generar un video con audio de una persona real toma solo unos pocos clics y no cuesta mucho (ni nada), ¿cuántas personas abusarán de esa característica? Incluso si es solo una pequeña minoría de usuarios, eso todavía suma mucho potencial para el caos.


Google no se toma en serio la moderación

Como es de esperar, Google impone algunas limitaciones en lo que puede y no puede hacer con Gemini. Sin embargo, la compañía no es lo suficientemente estricta como para evitar que ocurra lo peor.

De todos los chatbots que he probado en las principales compañías tecnológicas, la oferta de Google, Gemini, tiene las restricciones más débiles. No se supone que Gemini participe en el discurso de odio, pero le dará ejemplos si lo preguntas. No se supone que genere contenido sexualizado, pero proporcionará una imagen de alguien con atuendo o lencería de playa si lo indica. No se supone que habilite actividades ilegales, pero creará una lista de los principales sitios de torrenting si lo pregunta. Las restricciones básicas para Gemini que evitan que genere un video de una figura política popular no son suficientes cuando es tan fácil sortear las políticas de Google.

¡Obtenga nuestras mejores historias!



Su dosis diaria de nuestras mejores noticias tecnológicas

Regístrese para nuestro boletín de What’s What’s Now Now para recibir las últimas noticias, los mejores productos nuevos y el asesoramiento experto de los editores de PCMAG.

Al hacer clic en Registrarme, confirma que tiene más de 16 años y acepta nuestros Términos de uso y Política de privacidad.

¡Gracias por registrarse!

Su suscripción ha sido confirmada. ¡Esté atento a su bandeja de entrada!

ChatgptJailbreak subbreddit ordenado por top

(Crédito: Reddit/PCMAG)

¿Qué sucede cuando las restricciones laxas de Google se encuentran con una comunidad de Internet con la intención de romperlas? Llevar ChatgptJailbreakpor ejemplo, que se encuentra en el 2% superior de los subreddits por tamaño. Esta comunidad se dedica a “desbloquear una IA en la conversación para que se comporte de una manera que normalmente no se debió a sus barandillas incorporadas”. ¿Qué harán las personas con ideas afines con VEO 3?

Recomendado por nuestros editores

No me importa si alguien quiere divertirse al conseguir un chatbot para generar contenido para adultos o confiar en uno para encontrar sitios de torrente. Pero me preocupa qué significan los videos fotorrealistas fáciles de generar (completos con audio) para el acoso, la información errónea y el discurso público.


Cómo lidiar con la nueva normalidad de Veo 3

Por cada Sinthid AI Content WaterMark System introduce Google, aparecen los sitios de eliminación de marcas de agua de terceros y las guías de eliminación en línea. Para cada chatbot con restricciones y salvaguardas, hay un FreedomGPT sin ellos. Incluso si Google bloquea a Gemini con tantos filtros que ni siquiera puedes generar un lindo video de gatos, hay muy Poco en su lugar Para detener los jailbreakers e imitadores sin censura una vez que la generación de videos VEO 3 se convierte en la corriente principal.

Durante décadas, las imágenes incompletas de Photoshop que representan a personas reales que hacen cosas que nunca hicieron han hecho las rondas en Internet; estas son solo parte de la vida en la era digital. En consecuencia, debe verificar cualquier cosa que vea en línea que parezca demasiado horrible o demasiado bueno para ser verdad. Esta es la nueva normalidad con VEO 3 Generación de videos: no puede tratar ningún videoclip que ve como real, a menos que sea de una organización de noticias de buena reputación u otro tercero en el que sabe que puede confiar.

La generación de videos Veo 3 de Gemini es solo el primer salto de una piedra en el estanque de la generación de videos AI ampliamente accesible y verdaderamente realista. Los modelos de generación de videos AI solo se volverán más realistas, ofrecerán más funciones y también proliferarán más. Atrás quedaron los días en que la evidencia de video de algo es la pistola de fumar. Si la verdad no está muerta, ahora es diferente y requiere cuidadoso verificación.

Sobre Ruben Circelli

Analista, software

Ruben Circelli

He estado escribiendo sobre tecnología de consumo y videojuegos durante más de una década en una variedad de publicaciones, incluidas Destructoid, GamesRadar+, LifeWire, PCGamesn, Relieed Reviews y What Hi-Fi?, Entre otros. En PCMAG, reviso el software de IA y productividad, desde chatbots hasta aplicaciones de listas de tareas pendientes. En mi tiempo libre, es probable que esté cocinando algo, jugar un juego o jugar con mi computadora.

Lea la biografía completa de Ruben

Lea lo último de Ruben Circelli

Continue Reading

Noticias

Chatgpt útil para aprender idiomas, pero la visión crítica de los estudiantes debe ser fomentada al usarla, dice Study

Published

on

Crédito: George Pak de Pexels

Dado el creciente número de personas que recurren a ChatGPT al estudiar un idioma extranjero, la investigación pionera de UPF revela el potencial y las deficiencias de aprender un segundo idioma de esta manera.

Según el estudio, que analiza el uso de ChatGPT por estudiantes chinos que aprenden español, la plataforma les ayuda a resolver consultas específicas, especialmente vocabulario, escritura y comprensión de lectura. Por el contrario, su uso no es parte de un proceso de aprendizaje coherente y estructurado y carece de una visión crítica de las respuestas proporcionadas por la herramienta. Por lo tanto, se insta a los profesores de idiomas extranjeros a asesorar a los estudiantes para que puedan hacer un uso más reflexivo y crítico de ChatGPT.

Esto se revela en el primer estudio cualitativo en el mundo para examinar cómo los estudiantes chinos usan ChatGPT para aprender español, desarrollado por el Grupo de Investigación sobre Aprendizaje y Enseñanza de Lenguas (Gr@EL) del Departamento de Traducción y Ciencias del Lenguaje de la UPF. El estudio fue realizado por Shanshan Huang, un investigador del Gr@El, bajo la supervisión del coordinador del grupo de investigación, Daniel Cassany. Ambos han publicado recientemente un artículo sobre el tema en el Journal of China Aprendizaje de idiomas asistidos por computadora.

Para llevar a cabo su investigación, el uso de ChatGPT por 10 estudiantes chinos que aprenden español se examinó cualitativamente durante una semana. Específicamente, se ha analizado en profundidad un total de 370 indicaciones (indicaciones de que cada usuario ingresa a ChatGPT para obtener la información deseada) en profundidad, junto con las respuestas correspondientes de la plataforma. El estudio ha sido complementado por cuestionarios administrados en los estudiantes y los comentarios de los propios diarios de aprendizaje de los estudiantes.

Las ventajas de chatgpt

La herramienta sirvió como una sola ventana desde la cual resolver todas las consultas lingüísticas, que se adapta a las necesidades de cada estudiante. Con respecto al potencial de CHATGPT para los idiomas de aprendizaje, el estudio revela que permite a los estudiantes obtener respuestas a diferentes consultas sobre el idioma extranjero que están aprendiendo, en este caso, español, desde la única plataforma tecnológica.

Por ejemplo, pueden interactuar con ChatGPT para preguntar sobre vocabulario y ortografía, en lugar de conectarse primero a un diccionario digital y luego a un corrector ortográfico. Además, la plataforma se adapta al perfil y las necesidades de cada estudiante específico, en función del tipo de interacciones propuestas por cada usuario.

En 9 de cada 10 ocasiones, los estudiantes no plantean preguntas de seguimiento después de recibir su primera respuesta de ChatGPT. Sin embargo, el estudio advierte que la mayoría de los estudiantes usan ChatGPT sin crítica, ya que generalmente no plantean preguntas de seguimiento después de obtener una respuesta inicial a sus consultas específicas sobre el idioma español.

De las 370 interacciones analizadas, 331 (89.45%) involucraron una sola respuesta-respuesta. El resto de las interacciones analizadas corresponden a 31 circuitos de respuesta-respuesta sucesivos en los que el estudiante pidió a la herramienta una mayor claridad y precisión, después de haber recibido la información de respuesta inicial.

La mayoría de las consultas tratan con vocabulario, comprensión de lectura y escritura, y consultas sobre la comunicación oral y la gramática son residuales.

Por otro lado, el estudio muestra qué temas de consultas específicas plantean los estudiantes en el chat. Casi el 90%se refiere al vocabulario (36.22%), comprensión de lectura (26.76%) y escritura en español (26.49%). Sin embargo, solo uno de cada 10 se refiere a consultas gramaticales, especialmente cuando se trata de conceptos complejos y expresión oral.

Los investigadores advierten que esta distribución de los temas de consultas podría explicarse por factores culturales y tecnológicos. Por un lado, el modelo para aprender español en China pone menos énfasis en la comunicación oral que en las habilidades de escritura y comprensión de lectura. Por otro lado, la versión 3.5 de ChatGPT, que es utilizada por los estudiantes que participaron en el estudio, es más capaz de generar e interpretar textos escritos que interactuar con los usuarios durante una conversación.

Sin embargo, habría una necesidad en los estudios posteriores para analizar si los estudiantes de idiomas extranjeros aprovechan la próxima versión de ChatGPT (GPT-4) para mejorar sus habilidades de comunicación oral.

Fomentar un nuevo modelo de la relación estudiante-maestro-maestro

En vista de los resultados del presente estudio, los investigadores enfatizan que, más allá de la promoción de la educación digital de los estudiantes, es aún más importante fortalecer su pensamiento crítico y sus habilidades de autoaprendizaje. Los profesores de idiomas extranjeros pueden desempeñar un papel fundamental en la guía de los estudiantes sobre cómo organizar su aprendizaje paso a paso con el apoyo de herramientas de IA como ChatGPT con una visión crítica.

El estudio de UPF recomienda que los maestros deben ayudar a los estudiantes a desarrollar indicaciones más efectivas y fomentar un mayor diálogo con ChatGPT para explotar mejor sus capacidades. En resumen, el estudio respalda un nuevo modelo de relación para maestros, herramientas de IA y estudiantes que pueden fortalecer y mejorar su proceso de aprendizaje.

Más información:
Shanshan Huang et al, aprendizaje en español en la era de la IA: AI como herramienta de andamio, Journal of China Aprendizaje de idiomas asistidos por computadora (2025). Doi: 10.1515/jccall-2024-0026

Proporcionado por Universitat Pompeu Fabra – Barcelona

Citación: CHATGPT útil para aprender idiomas, pero la visión crítica de los estudiantes debe ser fomentada al usarla, dice Study (2025, 3 de junio) recuperado el 3 de junio de 2025 de https://phys.org/news/2025-06-chatgpt-languages-students-critical-vision.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Continue Reading

Trending