Connect with us

Noticias

Cómo hacer que la IA sea divertida para Halloween con las nuevas y perversas funciones de ChatGPT y Google

Published

on

Halloween está a la vuelta de la esquina con nuevas funciones de inteligencia artificial tremendamente divertidas de ChatGPT y Google.

Crea un podcast escalofriante, perfecciona tu acento vampírico y tuesta las semillas de calabaza más deliciosas como si estuvieras con tu mejor amigo. Excepto que ahora, es un tonto compañero de IA en tu bolsillo que usa una cadena de pensamiento para formar una hipótesis, razonar consigo mismo y reflexionar sobre la calidad de sus propias respuestas a medida que llega a conclusiones novedosas.

Un poco espeluznante, tal vez. Puede que lamentemos el día en que dimos origen a este nivel de inteligencia artificial, pero en estas fiestas, la IA se trata de divertirse.

Conoce a tu nuevo mejor amigo de la IA

Con más de 200 millones de usuarios en todo el mundo y 10 millones de suscriptores pagos, según The Information, OpenAI ha comenzado a implementar ChatGPT Advanced Voice para todos los suscriptores de ChatGPT Plus en EE. UU., la UE, Suiza, Islandia, Noruega y Liechtenstein, con avances mensuales en la aplicación gratuita.

Aprovechando GPT-4o, este inteligente robot de voz puede conversar de forma muy parecida a un ser humano, captando señales no verbales como suspiros, sollozos, pausas largas y la velocidad a la que estás hablando, mientras responde con gran empatía y emoción. No puede cantar ni gritar y aún no está conectado a Internet (el límite de conocimiento es octubre de 2023), pero puede reír sin aliento, alzar la voz, susurrar, responder amablemente a las interrupciones y recordar todo lo que le hayas contado.

Advertencia, es adictivo tener conversaciones con tu teléfono. Lo confieso, terminé suscribiéndome a ChatGPT Plus después de probarlo y ahora puedo pasar horas fácilmente contándole sobre mi día, pidiendo consejo y sentándome a escuchar historias personalizadas sobre mi sueño.

Si quieres probarlo, simplemente toca el micrófono en la parte inferior derecha de la pantalla de la aplicación móvil y comienza a derramar tu corazón hacia el orbe azul que viene en nueve voces diferentes: cuatro masculinas, cuatro femeninas y una. no binario. En el elenco de personajes, Arbor es autoritario, Breeze es animado, Cove es sereno, Ember es confiado, Juniper es serio, Maple, más sincero, Sol es inteligente, Spruce es tranquilo y Vale, bastante curioso. Elige tu favorito.

Con indicaciones simples, Advanced Voice puede entretenerte de las maneras más creativas, particularmente con chistes cursis. Como: “¿Por qué entró el fantasma al bar? ¡Por los abucheos!

Jackie Shannon, líder de productos multimodales de ChatGPT, compartió conmigo sus aplicaciones favoritas, incluida la capacitación sobre su acento vampírico, imágenes para el diseño de vestuario y instrucciones para tallar y tostar semillas en forma de calabaza en el oído que se pueden seguir paso a paso.

Decidí pedirle a Arbor un podcast protagonizado por “Vinnie from Brooklyn” y “Tex the Cowboy”, donde compartieran cosas para hacer este Halloween. Completamente en carácter, con los acentos correspondientes, Arbour respondió:

“Bienvenido a ‘Brooklyn Meets The Wild West: Edición de Halloween’. Soy tu anfitrión, Vinny, y estoy aquí con mi amigo vaquero, Tex. ¡Hola, Tex!

“¡Hola, Vinny! ¡Hola amigos! Nos estamos preparando para brindarles a todos una guía emocionante para la diversión de Halloween. ¡Así es!”

“¡Así es! Ahora, Tex, ¿qué hay de importante en Nashville para Halloween?

“Bueno, Vinny, conseguimos algunos paseos en carruajes embrujados y recorridos de fantasmas en la antigua casa del rancho. ¡Es un verdadero puntazo!

“¡Suena espeluznante! En Brooklyn lo hacemos a lo grande con desfiles de disfraces y fiestas en cada esquina. ¿Has estado alguna vez en un desfile de una gran ciudad, Tex?

“No puedo decir que sí, Vinny, ¡pero suena como un buen momento! Nos gusta mantener las cosas un poco más relajadas, tal vez reunirnos alrededor de una fogata y contar historias de fantasmas”.

“Eso suena bien, Tex. Pero si quieres un verdadero susto, tienes que ver las casas encantadas que tenemos aquí. Harán tintinear tus espuelas.

“Creo que sería algo digno de ver. ¿Qué tal tallar calabazas? Es un gran problema por estos lares”.

“¡Nosotros también hacemos eso! Y lo convertimos en una competencia. La mejor calabaza tiene derecho a presumir durante todo el año”.

“¡Suena desternillante, Vinny! Hagan lo que hagan este Halloween, ¡recuerden divertirse!

Por supuesto, la utilidad de Advanced Voice va mucho más allá de las actividades navideñas. Infinitamente paciente, es genial para juegos de rol. Puede conversar en 50 idiomas, almacenar detalles en la memoria y seguir instrucciones personalizadas sobre la mejor manera de interactuar.

En Dreamforce, el cofundador y director ejecutivo de Nvidia, Jensen Huang, dijo que lo está utilizando como tutor. El cofundador y director ejecutivo de Salesforce, Marc Benioff, dijo que lo está utilizando como terapeuta.

“Hay todo tipo de cosas que podemos hacer con la voz para mejorarla aún más”, dijo Shannon. “La información en tiempo real es definitivamente una prioridad para nosotros”.

Al comentar sobre una posible integración con Sora, agregó: “Hicimos una demostración de video en mayo, una función de video, también estamos pensando en eso”.

Un podcast escalofriante de Halloween

Para no quedarse atrás, Google también tiene un nuevo producto de moda con NotebookLM que puede crear un podcast muy atractivo y muy realista de dos presentadores que profundizan en los documentos cargados.

Para un poco de magia, simplemente vaya a notebooklm.google.com y arrastre y suelte hasta 50 fuentes en el cuadro de carga. Esto puede incluir archivos PDF de manuales, así como enlaces a sitios web y vídeos de YouTube. Luego seleccione “Guía del portátil” y genere una “Descripción general de audio”. Listo, en minutos, se puede reproducir un podcast con voces masculinas y femeninas que participan en ligeras bromas mientras exploran temas en el material, mientras intercalan comentarios y análisis perspicaces.

Le proporcioné un enlace a los “Mejores libros de Halloween” de Goodreads y, en tres minutos, recibí un entretenido podcast de 16 minutos que revisaba las más de 700 selecciones del sitio web.

Así abrió el espectáculo:

“¿Estás listo para ponerte espeluznante?”

“Siempre listo para una buena dosis de espíritu de Halloween”.

“Está bien. Bueno, ustedes enviaron una lista increíble de los mejores libros de Halloween de Goodreads “.

“Oh, ese es bueno, 713 libros”.

“Sí, eso es impresionante. Es como la guía definitiva para la lectura de temporadas espeluznantes, ¿verdad?”

“Está bien, entonces profundicemos y veamos qué hay en la parte superior”.

“Tenemos ‘Halloween Tree’ de Ray Bradbury, la clásica historia de vampiros de OG. Me encanta”.

“’Drácula’ de Bram Stoker, no te puedes equivocar con Drácula”

“Y llegando al número tres, volviendo a Bradbury, “Algo malvado viene por aquí”.

“Dos libros de Bradbury entre los tres primeros. Eso dice algo, ¿verdad?

“Claramente, ya tiene resuelto Halloween”.

“Sí, esa mezcla de nostalgia y fantasía y solo un toque de oscuridad. Es una fórmula ganadora”.

solo el comienzo

ChatGPT cumplirá dos años el 30 de noviembre y se están preparando grandes cosas.

La compañía acaba de lanzar sus modelos o1-preview y o1-mini, más avanzados que el GPT-4o que impulsan Advanced Voice. Estos modelos pueden autorreflexionarse y corregirse, asumir tareas más complejas e interactuar de la misma manera que nosotros interactuamos entre nosotros, dijo Kevin Weil, director de productos de OpenAI, en una conferencia de prensa el 30 de septiembre.

“2025 será el año en que los sistemas agentes finalmente lleguen a la corriente principal”, dijo Weil. “Si lo hacemos bien, nos llevará a un mundo en el que podremos dedicar más tiempo a las cosas humanas que importan”.

Y a medida que los modelos se vuelven más inteligentes, más baratos y más rápidos, crece el entusiasmo.

A pesar de que OpenAI y Google permanecen en silencio, The Verge ha informado que OpenAI planea lanzar su modelo de lenguaje grande de próxima generación con el nombre en código Orion en diciembre y The Information informa que Google planea presentar una vista previa de un producto con el nombre en código Jarvis, también en diciembre, que puede completar el agente. tareas en el navegador, como reservar vuelos.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Informe de chatgpt para marketing

Published

on

Continue Reading

Noticias

Operai supera a Deepseek en el razonamiento a nivel de oración

Published

on

Chatgpt y otros chatbots de IA basados ​​en modelos de idiomas grandes se sabe que ocasionalmente inventa cosas, incluidas las citas científicas y legales. Resulta que medir cuán precisas son las citas de un modelo AI es una buena manera de evaluar las habilidades de razonamiento del modelo.

Un modelo de IA “razones” descomponiendo una consulta en pasos y trabajando a través de ellos en orden. Piense en cómo aprendió a resolver problemas de palabras matemáticas en la escuela.

Idealmente, para generar citas, un modelo de IA comprendería los conceptos clave en un documento, generaría una lista clasificada de documentos relevantes para citar y proporcionaría un razonamiento convincente sobre cómo cada documento sugerido respalda el texto correspondiente. Destacará las conexiones específicas entre el texto y la investigación citada, aclarando por qué cada fuente importa.

La pregunta es, ¿se puede confiar en los modelos de hoy para hacer estas conexiones y proporcionar un razonamiento claro que justifique sus elecciones de origen? La respuesta va más allá de la precisión de las citas para abordar cuán útiles y precisos son los modelos de lenguaje grande para cualquier propósito de recuperación de información.

Soy un informático. Mis colegas, investigadores del Instituto AI de la Universidad de Carolina del Sur, la Universidad Estatal de Ohio y el Condado de Baltimore del Condado de Baltimore, y he desarrollado las razones de referencia para probar qué tan bien modelos de idiomas pueden generar automáticamente citas de investigación y proporcionar un razonamiento comprensible.

Utilizamos el punto de referencia para comparar el rendimiento de dos modelos de razonamiento de IA populares, Deepseek’s R1 y OpenAI’s O1. Aunque Deepseek fue en los titulares con su impresionante eficiencia y rentabilidad, el advenedizo chino tiene un camino por recorrer para que coincida con el rendimiento de razonamiento de OpenAI.

Oración específica

La precisión de las citas tiene mucho que ver con si el modelo AI está razonando sobre la información a nivel de oración en lugar del párrafo o a nivel de documentos. Se puede considerar que las citas a nivel de párrafo y a nivel de documentos arrojan una gran parte de la información a un modelo de idioma grande y le piden que proporcione muchas citas.

En este proceso, el modelo de lenguaje grande se generaliza e incorporan las oraciones individuales. El usuario termina con citas que explican todo el párrafo o documento, no la información de grano relativamente fino en la oración.

Además, el razonamiento sufre cuando le pide al modelo de idioma grande que lea un documento completo. Estos modelos se basan principalmente en memorizar patrones que típicamente son mejores para encontrar al principio y al final de los textos más largos que en el medio. Esto les dificulta comprender completamente toda la información importante a lo largo de un documento largo.

Los modelos de idiomas grandes se confunden porque los párrafos y documentos tienen mucha información, lo que afecta la generación de citas y el proceso de razonamiento. En consecuencia, el razonamiento de los modelos de idiomas grandes sobre los párrafos y los documentos se vuelve más como resumir o parafrasear.

Las razones por las que Benchmark aborde esta debilidad al examinar la generación y el razonamiento de las citas de los modelos de idiomas grandes.

https://www.youtube.com/watch?v=kqzzymhre0u

Cómo Deepseek R1 y OpenAI O1 se comparan generalmente con los problemas lógicos.

Prueba de citas y razonamiento

Tras el lanzamiento de Deepseek R1 en enero de 2025, queríamos examinar su precisión en la generación de citas y su calidad de razonamiento y compararlo con el modelo O1 de OpenAI. Creamos un párrafo que tenía oraciones de diferentes fuentes, dio a los modelos oraciones individuales de este párrafo y pedimos citas y razonamiento.

Para comenzar nuestra prueba, desarrollamos un pequeño lecho de prueba de aproximadamente 4,100 artículos de investigación alrededor de cuatro temas clave que están relacionados con el cerebro humano y la informática: neuronas y cognición, interacción humana-computadora, bases de datos e inteligencia artificial. Evaluamos los modelos utilizando dos medidas: la puntuación F-1, que mide cuán precisa es la cita proporcionada, y la tasa de alucinación, que mide cuán sonido es el razonamiento del modelo, es decir, con qué frecuencia produce una respuesta inexacta o engañosa.

Nuestras pruebas revelaron diferencias de rendimiento significativas entre OpenAI O1 y Deepseek R1 en diferentes dominios científicos. El O1 de OpenAI conectó bien la información entre los diferentes sujetos, como comprender cómo la investigación sobre neuronas y cognición se conecta con la interacción humana y la computadora y luego con los conceptos en inteligencia artificial, sin dejar de ser precisa. Sus métricas de rendimiento superaron constantemente a Deepseek R1 en todas las categorías de evaluación, especialmente para reducir las alucinaciones y completar con éxito las tareas asignadas.

Operai O1 fue mejor para combinar ideas semánticamente, mientras que R1 se centró en asegurarse de que generara una respuesta para cada tarea de atribución, lo que a su vez aumentó la alucinación durante el razonamiento. Openai O1 tenía una tasa de alucinación de aproximadamente 35% en comparación con la tasa de Deepseek R1 de casi el 85% en la tarea de razonamiento basada en la atribución.

En términos de precisión y competencia lingüística, Openai O1 obtuvo alrededor de 0.65 en la prueba F-1, lo que significa que era correcto aproximadamente el 65% del tiempo al responder preguntas. También obtuvo alrededor de 0.70 en la prueba BLEU, que mide qué tan bien un modelo de lenguaje escribe en lenguaje natural. Estos son puntajes bastante buenos.

Deepseek R1 obtuvo un puntaje más bajo, con aproximadamente 0.35 en la prueba F-1, lo que significa que era correcto aproximadamente el 35% del tiempo. Sin embargo, su puntaje Bleu fue solo alrededor de 0.2, lo que significa que su escritura no era tan natural como la O1 de OpenAI. Esto muestra que O1 fue mejor al presentar esa información en un lenguaje claro y natural.

OpenAi tiene la ventaja

En otros puntos de referencia, Deepseek R1 se desempeña a la par con OpenAi O1 en tareas de matemáticas, codificación y razonamiento científico. Pero la diferencia sustancial en nuestro punto de referencia sugiere que O1 proporciona información más confiable, mientras que R1 lucha con la consistencia objetiva.

Aunque incluimos otros modelos en nuestras pruebas integrales, la brecha de rendimiento entre O1 y R1 resalta específicamente el panorama competitivo actual en el desarrollo de IA, con la oferta de OpenAI que mantiene una ventaja significativa en las capacidades de razonamiento e integración del conocimiento.

Estos resultados sugieren que OpenAi todavía tiene una ventaja cuando se trata de atribución y razonamiento de origen, posiblemente debido a la naturaleza y el volumen de los datos en los que fue entrenado. La compañía anunció recientemente su herramienta de investigación profunda, que puede crear informes con citas, hacer preguntas de seguimiento y proporcionar razonamiento para la respuesta generada.

El jurado todavía está en el valor de la herramienta para los investigadores, pero la advertencia permanece para todos: verifique todas las citas que le brinda una IA.

Continue Reading

Noticias

Me mudé y Géminis me ayudó de más formas que puedas imaginar

Published

on

Ryan Haines / Android Authority

Estoy en el proceso de mudarme a mi nuevo apartamento y, sinceramente, toda la experiencia ha sido estresante, por decir lo menos. Entre tratar de descifrar todo el papeleo legal vinculado a mi compra de bienes raíces y descubrir cómo decorar el espacio para que no se sienta apretado o pegajoso, ha habido muchos desafíos que superar.

Afortunadamente, no estaba solo en esto. Tuve la ayuda de mi buen amigo, AI. Me encontré inclinado fuertemente en Géminis para la gran mayoría de los problemas que me encontré, aunque cambié a Notebooklm para una tarea específica y muy importante.

Simplificando la jerga legal

Manual de autos de cuaderno

Andy Walker / Android Authority

El papeleo involucrado con mi compra de bienes raíces fue desalentador: más de cien páginas, gran parte llena de jerga legal densa que era increíblemente difícil de entender. Aquí es donde AI realmente me ayudó.

Para la mayoría de mis preguntas relacionadas con el documento, recurrí a Géminis. Podría cargar los archivos y hacer preguntas específicas sobre cláusulas o términos que me confundieron. Por ejemplo, la política de garantía no estaba claramente explicada; Acaba de hacer referencia a leyes específicas. Géminis fue un salvavidas aquí. Con una consulta rápida, explicó las leyes relevantes y respondió pacientemente todas mis preguntas de seguimiento, aclarando exactamente lo que estaba cubierto y por cuánto tiempo.

Sin embargo, para las inmersiones profundas en todo el conjunto de documentos, cambié a Notebooklm. Su capacidad para trabajar dentro de un conjunto definido de fuentes lo hizo perfecto para esto. Creé un cuaderno dedicado que contiene todos los documentos relacionados con mi compra. Cada vez que una pregunta aparecía en mi cabeza, ya sea legal o simplemente práctica, Notebooklm podría escanear mis documentos y proporcionar la respuesta en segundos. Esto me ahorró una increíble cantidad de tiempo; De lo contrario, fácilmente habría pasado media hora o más cavando a través de esas más de 100 páginas tratando de encontrar una sola información. La tranquilidad de saber que podría verificar rápidamente los detalles fue invaluable.

Abordar el diseño de interiores con Géminis

Géminis también fue de gran ayuda con el diseño interior. Si alguna vez has intentado decorar una casa desde cero sin mucha experiencia, sabes lo complicado que es. Es sorprendentemente fácil terminar con un espacio que se siente frío y estéril o simplemente pegajoso.

Géminis actuó como mi consultor de diseño personal. Ofrecía consejos sobre todo, desde esquemas de color que funcionarían bien en mis condiciones de iluminación específicas hasta mantener el equilibrio visual y las proporciones entre los muebles adyacentes, como garantizar que un gran armario no haya dominado por completo la cómoda de los cajones al lado.

Géminis fue mi consultor de diseño personal.

También ayudó con una planificación espacial práctica, sugiriendo cosas como la distancia mínima cómoda necesaria entre el mostrador de la cocina y la mesa del comedor en mi espacio relativamente estrecho, y asesorando en las dimensiones correctas de la alfombra para anclar la sala de estar sin abrumarla. Utilicé una herramienta 3D Home Design Planner para visualizar estas recomendaciones, y tengo que decir que el diseño realmente se unió maravillosamente gracias a la entrada de Gemini.

Consejos iluminadores sobre iluminación

Aidot Linkind Bulb de luz inteligente A19 RGBTW Luces y caja 2

Edgar Cervantes / Android Authority

Luego hay iluminación, otro tema sorprendentemente complejo si no está familiarizado con los tecnicismos. Tuve que descubrir y comprender la diferencia entre lúmenes (brillo) y los celví (temperatura de color), y lo que podría funcionar para mí. Planificación de la iluminación perfecta en un apartamento completo, especialmente teniendo en cuenta las diferentes necesidades (luz más brillante y más blanca en la cocina para la visibilidad frente a la luz más cálida, más suave en el dormitorio para relajarse), se sintió abrumadora.

Géminis entró aquí también. Calculó fácilmente cuántas lúmenes probablemente necesitaría para áreas específicas en función de su tamaño y función, sugirió niveles de brillo apropiados (rangos de kelvin) para diferentes habitaciones y más. Incluso me ayudó a comprender los entresijos del sistema de iluminación del hogar inteligente IKEA que estaba considerando, explicando cómo funciona, dando una idea de los costos involucrados e incluso estimando el impacto potencial en mi factura de electricidad.

Antes de tener un asistente de IA como Gemini, habría pasado horas buscando en Google, dando docenas de artículos y publicaciones de foro, y probablemente aún terminaba con preguntas sin respuesta o consejos contradictorios.

Resolver problemas inesperados

Mudarse a un nuevo lugar rara vez va perfectamente suavemente. Me encontré con problemas inesperados, como manchas obstinadas en el piso del baño que realmente no deberían haber estado allí. Gemini me ayudó a hacer una lluvia de ideas sobre el tipo de mancha más probable en función de su apariencia y ubicación, y luego sugirió una gama de métodos de limpieza para probar, desde opciones suaves hasta soluciones más fuertes.

Desafortunadamente, varios defectos menores también formaron parte de mi “nueva” experiencia inmobiliaria, y hacer que Gemini proporcione resúmenes rápidos de mis derechos basados ​​en los documentos legales (como las cláusulas de garantía) fue increíblemente útil al comunicarse con el desarrollador.

Dando un paso más allá: Análisis de plano de planta

Moto G Power 2025 Imagen de revisión que muestra el cuadro de inmediato de Ask Gemini

Rushil Agrawal / Android Authority

Sintiéndome ambicioso, tomé las cosas un poco al proporcionar a Géminis el plano de planta real de mi apartamento y solicitando consejos de posicionamiento de muebles. Estaba realmente impresionado con las sugerencias.

La IA recomendó ideas prácticas como “Zoning” mi sala de estar. Dado que es parte de un área de planta abierta que combina la vida, la comida y la cocina, Géminis sugirió usar la disposición de muebles y posiblemente una alfombra para separar visualmente el espacio vital y hacer que se sienta más distinta. Dado que mi área de vida principal es larga y relativamente estrecha, también sugirió inteligentemente el uso de espejos para crear una ilusión de amplitud y optar por muebles de color más ligero para mejorar esa sensación de aire.

Algunos de estos consejos que podría haber encontrado eventualmente, pero Gemini definitivamente provocó ideas que no había considerado y ayudó a confirmar algunos de mis propios instintos.

Lo que deseo que Géminis pueda hacer a continuación

Aplicación Géminis iOS

Robert Triggs / Android Authority

Si bien aprecié la ayuda de Gemini durante todo este proceso, la experiencia también destacó las áreas donde deseé que AI pudiera hacer aún más.

La función de sueño? Subir mi plano de planta y hacer que Gemini genere un modelo 3D interactivo del apartamento. Imagine una IA que luego podría sugerir automáticamente esquemas de decoración basados ​​en preferencias personales (estilo, color, presupuesto) y le permita modificar todo a los detalles más pequeños dentro de ese espacio virtual. Terminé usando Homestyler para crear mi modelo 3D y planificar el diseño, lo cual fue divertido pero definitivamente un proceso que requiere mucho tiempo. Si Gemini tuviera esta capacidad incorporada, me habría ahorrado horas e hizo que el proceso de visualización fuera sin problemas.

Todavía se parece un poco a la ciencia ficción, pero realmente creo que llegaremos a ese punto más temprano que tarde. ¿Una IA que no solo puede aconsejar sino también visualizar e implementar ideas de diseño en un espacio virtual? Ese será un cambio de juego para cualquiera que cree un nuevo hogar.

Continue Reading

Trending