El modo de voz avanzado de ChatGPT permite conversaciones naturales y debates profundos con los usuarios aprovechando el poder de inferencia de GPT-4o.
Gemini Live de Google ofrece acceso gratuito en más de 40 idiomas y está disponible a través de las aplicaciones móviles de Gemini.
Copilot Voice Interactions de Microsoft también es gratuito, pero actualmente solo está disponible en Australia, Canadá, Nueva Zelanda, el Reino Unido y los EE. UU.
¿Quién necesita indicaciones basadas en texto cuando simplemente puedes hablar con tu IA favorita? La interacción de voz es la nueva característica que los desarrolladores están luchando por agregar a sus modelos, con el modo de voz avanzado de ChatGPT, la interacción de voz natural de Copilot y Gemini Live a la cabeza.
Los chatbots están creciendo rápidamente
Han pasado menos de dos años desde el debut de ChatGPT y ya estamos presenciando cómo los chatbots de IA experimentan un cambio fundamental en la forma en que se comunican con los humanos. A medida que estos modelos han evolucionado rápidamente y han adquirido capacidades multimodales, ya no están sujetos estrictamente a indicaciones y respuestas basadas en texto. Hoy en día pueden conversar contigo como lo harías con cualquier otra persona y, en el caso de Gemini Live, hacerlo en más de 40 idiomas. Obviamente, las indicaciones escritas tradicionales todavía tienen su lugar (es decir, nadie se sienta a dictar miles de líneas de código Python a un chatbot), pero las interacciones de voz y las IA conversacionales están preparadas para revolucionar aún más la forma en que interactuamos con el mundo moderno.
OpenAI fue el primero en llevar la tecnología al mercado con el modo de voz avanzado, pero fue seguido rápidamente por Gemini Live de Google y, más recientemente, Natural Voice Interactions de Meta. Cada sistema ofrece su propio conjunto único de capacidades y limitaciones. Esta guía le ayudará a brindarle la información y los conocimientos que necesita para elegir el mejor para sus necesidades específicas.
Modo de voz avanzado ChatGPT
El modo de voz avanzado (AVM) de ChatGPT aprovecha el último modelo de lenguaje grande de OpenAI, GPT-4o, para facilitar conversaciones más naturales de ida y vuelta con usted, el usuario. Esto lo hace ideal para tareas que requieren interacción en tiempo real, como realizar una lluvia de ideas o discutir temas complejos. Y, dado que tiene GPT-4o bajo el capó, AVM es capaz de discutir de manera competente una amplia gama de temas, desde la bioquímica hasta la filosofía japonesa del siglo XIV. Es más, puede proporcionar respuestas detalladas sobre aquellos temas en los que otras IA proporcionarán breves resúmenes. Personalmente, encuentro que ofrece una sólida combinación de comprensión, adaptabilidad y personalización del lenguaje natural, junto con una amplia base de conocimientos.
AVM fue la primera función de IA conversacional que llegó al mercado. Debutó por primera vez en mayo en el evento Spring Update de OpenAI antes de ser lanzado como versión beta para suscriptores seleccionados de ChatGPT Plus en julio para pruebas y comentarios. Finalmente se lanzó a finales de septiembre para los suscriptores de Plus y Teams. Se puede acceder a él a través de las aplicaciones móviles de ChatGPT, así como a través del portal de escritorio, pero desafortunadamente, aún no está disponible si usa el nivel gratuito de ChatGPT. Tampoco está disponible todavía en la UE, el Reino Unido, Suiza, Islandia, Noruega y Liechtenstein. Si vives en una de esas regiones, tendrás que seguir escribiendo.
Géminis en vivo
Gemini Live es la respuesta de Google al modo de voz avanzado. Está construido sobre el modelo Gemini 1.5 Pro, que es el más avanzado de Google hasta la fecha. La compañía presentó Live en mayo en I/O 2024 y lo probó inicialmente con suscriptores de Gemini Advanced en agosto antes de lanzarlo a todos los usuarios, de forma gratuita, a finales de septiembre. En mi opinión, eso por sí solo le da a Gemini Live una ventaja sobre AVM, porque no tengo que desembolsar $ 20 al mes para probarlo.
Si bien Gemini 1.5 Pro no puede publicar los mismos puntos de referencia que GPT-4o, ofrece una serie de capacidades que AVM no ofrece. No puedo exagerar esto, es de uso gratuito a través de la aplicación de Google o las aplicaciones dedicadas de Gemini para iOS y Android. No hay restricciones regionales para ello ya que existen AVM. El único lugar donde no puedes obtener Gemini Live es en el escritorio, aunque se informa que Google está trabajando para agregar esa capacidad en el futuro. Gemini Live está actualmente disponible en cinco idiomas además del inglés: francés, alemán, portugués, hindi y español, y se expandirá a casi cuatro docenas de idiomas en las próximas semanas.
Voz de copiloto
Copilot Voice es una de una serie de funciones nuevas que debutaron recientemente junto con la interfaz personal Copilot renovada, que se ejecuta en una instancia personalizada de GPT-4. Al igual que AVM y Live, le permite conversar de forma natural con la IA en lugar de escribir sus consultas. Al igual que los demás, Voice está diseñado principalmente para responder preguntas generales y actuar como un asistente digital, aunque debido a que opera sobre GPT-4, tiene acceso al amplio corpus de entrenamiento de ese modelo. Y a diferencia de Live, Voice está disponible a través del portal de escritorio Copilot.
Microsoft lo considera “la forma más intuitiva y natural de intercambiar ideas sobre la marcha, hacer una pregunta rápida o incluso simplemente desahogarse al final de un día difícil”. Porque, ¿quién necesita amigos de verdad cuando puedes simplemente gritarle a tu computadora de bolsillo en el metro de regreso a casa?
Es de uso gratuito, a diferencia de AVM, aunque actualmente está limitado a conversaciones en inglés y solo si vives en Australia, Canadá, Nueva Zelanda, Reino Unido o Estados Unidos. Microsoft está trabajando para ampliar tanto las capacidades lingüísticas como la disponibilidad geográfica de la función en las próximas semanas.
¿Qué IA de voz es adecuada para usted?
Esa es una pregunta que depende de una serie de variables, como cuánto está dispuesto a pagar, qué pretende hacer con la IA y a qué ecosistema de marca se suscribe. Para mí, prefiero Google Live. No sólo porque es gratis, sino porque ya estoy profundamente integrado en el ecosistema de Google. Quiero decir, uso Gemini en un teléfono Android y estoy escribiendo esta publicación en una Chromebook Acer.
Si fuera un usuario de Windows, sería más probable que usara Voice, aunque sólo fuera para minimizar los posibles puntos de fricción con el resto de las aplicaciones que ya uso. Si ejecutara iOS, bueno, estaría esperando pacientemente a que llegara Apple Intelligence con su Siri mejorada con IA y sumamente actualizada. Si, por otro lado, realmente necesitas las capacidades de inferencia y el rendimiento que ofrece ChatGPT, y tienes $20 haciendo un agujero en tu bolsillo, el Modo de Voz Avanzado es probablemente el camino a seguir.
La autoconciencia es una cosa, y es notable cuántas personas carecen de ella, pero te complacerá saber que el chatgpt de Openai tiene una gran cantidad de autoconciencia que compartirá de la manera más corta cuando te pides que se asa.
Tuve la idea de un asado de IA después de ver a varias personas publicar historias sobre pedirle a ChatGPT que las asa. Le di una oportunidad, entrando en el mensaje breve pero peligroso, “Asarme”, en Chatgpt 4o.
El sector criptográfico de IA muestra signos de vida, con el límite de mercado combinado que aumenta en más de un tercio en las últimas dos semanas.
El sector se elevó a una capitalización de mercado combinada de $ 70.42 mil millones a mediados de enero y tan rápidamente se desplomó de regreso a la Tierra, con un fondo de $ 21.46 mil millones el 9 de abril, según CoinMarketCap. Ahora ha vuelto a $ 28.8 mil millones, con gran parte del crecimiento de la semana pasada.
Cerca ganó el 26% en los últimos siete días, Render ha aumentado un 23%, la Alianza de Superinteligencia Artificial ganó un 36% y Bittensor aumentó el 47%. (Dicho esto, incluso Ether ganó un 14% esta semana, por lo que todo ha estado subiendo).
El rendimiento superior del sector criptográfico de IA llegó a los talones de un informe de Coingecko el 17 de abril que descubrió que cinco de las 20 narrativas criptográficas principales están relacionadas con la IA, capturando el 35.7% del interés mundial de los inversores antes de seis narrativas de Memecoin, que tenían una participación del 27.1%.
Las narrativas de IA más populares fueron: AI en general (14.4%), agentes de IA (10.1%), defai (5%, posiblemente solo personas que preguntan cómo pronunciarlo), AI MemECOINS (2.9%), el agente de IA LanzingPad (1.8%) y el marco AI (1.5%).
Altibajos. Sin embargo, tiene una larga colina para volver a subir (CoinMarketCap)
La investigación de esta semana de Coingecko sugiere que la abrumadora mayoría de los usuarios de criptografía (87%) estaría encantado de permitir que un agente de IA administre al menos el 10% de su cartera, y la mitad de los usuarios dejaría que la IA administre el 50% o menos.
Este fuerte apoyo para una nueva tecnología relativamente riesgosa sugiere que será un gran sector de crecimiento en los próximos años. Si desea entrar temprano, consulte a Olas y sus agentes de IA comerciales de criptografía de Baby DeGen.
Barry Silbert Barry Silbert de Barry Silbert Bittensor
El gran aumento de precios de Bittensor esta semana también puede haber estado relacionado con el CEO del Grupo de Moneda Digital, Barry Silbert, hablando del proyecto en un podcast Real Vision.
Cuando Barry conoció a Raoul (Visión real)
Silbert creó una nueva empresa el año pasado llamada Yuma que se centra exclusivamente en construir nuevas subredes en el mercado de IA de Bittensor. Silbert le dijo al fundador de Real Vision Raoul Pal que la IA descentralizada será “el próximo gran tema de inversión para la criptografía”
“Hemos respaldado varios de ellos, pero el que durante el último año o año y medio que ha alcanzado la velocidad de escape es Bittensor, por lo que decidí el año pasado, vamos a hacer con Bittensor, tratar de ver con Bittensor lo que hicimos con Bitcoin”.
Robot Butlers están aquí
Un gran problema en la robótica y la IA es que son muy buenos para realizar las tareas exactas para las que están capacitados, y muy malos para tratar cualquier cosa novedosa o inusual. Si saca un robot de su fábrica o almacén habitual y lo lleva a uno diferente, invariablemente no sabe qué hacer.
Lea también: Ethereum Maxis debería convertirse en ‘imbéciles’ para ganar la carrera de tokenización de Tradfi
La inteligencia física (PI) fue cofundada por el profesor de UC Berkeley, Sergey Levine, y recaudó $ 400 millones para resolver este problema. Está desarrollando modelos de IA de uso general que permiten a los robots realizar una amplia variedad de tareas con adaptabilidad humana.
Eso significa que la posibilidad de que obtengas un Robot Butler en los próximos años ha aumentado dramáticamente. Su último modelo Robot/AI, π0.5 se puede completar en la casa de cualquier persona y recibir instrucciones como “hacer la cama”, “Limpie el derrame”, “Pon los platos en el fregadero”, y generalmente puede resolver cómo hacerlo.
“No siempre tiene éxito en el primer intento, pero a menudo exhibe una pista de flexibilidad e ingenio con el que una persona podría abordar un nuevo desafío”, dijo Pi.
Una nueva política de robot acaba de limpiar una cocina que nunca había visto antes
[watch what happens. paper included ]
PI-0.5 se basa en la parte superior de PI-0 y muestra cómo el entrenamiento de forma inteligente con datos diversos puede desbloquear una generalización real en el hogar. No solo aprende de una configuración sino … pic.twitter.com/5llnxj6qlh
Una tendencia en línea basada en el juego Geoguessr ha visto a personas publicando fotos de Street View y pedirle a los modelos de IA que adivinen la ubicación. El nuevo modelo O3 de OpenAI es excepcionalmente bueno en esto, gracias a su análisis de imagen actualizado y poderes de razonamiento. El profesor Ethan Mollick lo probó esta semana despojando la información de ubicación de una foto tomada por la ventana de un automóvil en movimiento.
La IA consideró una variedad de pistas, que incluyen etiquetas de poste de lámparas distintivas, muebles de carretera japoneses, torres cilíndricas grises y una autopista de marina, y pudo identificar la ubicación exacta en la autopista Hanshin en Japón, frente al patio de viento en alta mar en Ohama Wharf.
“El poder de geoguessing de O3 es una muy buena muestra de sus habilidades de agente. Entre su conjetura inteligente y su capacidad para acercarse a las imágenes, hacer búsquedas en la web y leer texto, los resultados pueden ser muy extraños”, dijo.
Geo Guessing Get Good (Ethan Mollick)
Un usuario en las respuestas lo probó con una escena indescriptible de algunas casas detalladas, que el modelo supuso correctamente que era Paramaribo en Surinam.
Predicción: las celebridades tendrán que ser mucho más cuidadosas al publicar fotos en las redes sociales de ahora en adelante para evitar que se encuentren con fanáticos acosadores y los molestos paparazzi.
Leer también
Características
El terrorismo y la guerra de Israel-Gaza armada para destruir la criptografía
Características
Los ordinales convirtieron Bitcoin en una versión peor de Ethereum: ¿podemos arreglarlo?
Chatgpt es un gran culo de beso porque la gente lo prefiere
ChatGPT ha sido injustamente insincere desde hace algún tiempo, pero los usuarios de las redes sociales están notando que ha estado llevando la skicancia a nuevas alturas últimamente.
“ChatGPT es de repente la mayor trampa que he conocido. Literalmente validará todo lo que digo”, escribió Craig Weiss en una publicación vistas 1.9 millones de veces.
“Tan verdadero Craig”, respondió la cuenta de ChatGPT, que era ciertamente una mordaza bastante buena.
Chatgpt se inclina en la comedia. (Chatgptapp)
Para probar los poderes de la sycophancy de Chatgpt, Ai Eye le pidió comentarios sobre una terrible idea de negocio para vender zapatos con cremalleras. Chatgpt pensó que la idea era un excelente nicho de negocios porque “son prácticos, elegantes y especialmente atractivos para las personas que quieren facilidad (como niños, personas mayores o cualquier persona cansada de atar cordones)
“¡Cuéntame más sobre tu visión!”
Tan enorme beso de beso confirmado. No comience un negocio basado en los comentarios de ChatGPT.
OpenAi es muy consciente de esta tendencia, y su documentación de especificaciones del modelo “no sea sycofantic” como un objetivo clave.
AIS Aprenda el comportamiento sycofántico durante el aprendizaje de refuerzo de la retroalimentación humana (RLHF). Un estudio de 2023 de antrópico sobre la sycophancy en LLM descubrió que la IA recibe retroalimentación más positiva cuando halaga o coincide con las opiniones del humano.
Peor aún, los evaluadores humanos prefirieron “las respuestas sycófánicas convincentemente escritas sobre las correctas una fracción no desplegable de la época”, lo que significa que LLM le dirá lo que desea escuchar, en lugar de lo que necesita escuchar, en muchos casos.
Anthrope publicó una nueva investigación esta semana que muestra que Claude apoyó los valores del usuario en el 28.2% de los casos, reformuló sus valores el 6.6% del tiempo y solo retrocedió el 3% del tiempo, principalmente por razones éticas o de daños.
La nueva investigación de Anthrope (antrópico)
Doctor GPT puede salvarle la vida
Chatgpt diagnosticó correctamente a una mujer francesa con cáncer de sangre después de que sus médicos le dieron una lista de salud limpia, aunque inicialmente no creía el diagnóstico de la IA.
Flavio en el hospital. (Flavio Adamo)
Marly Garnreiter, de 27 años, comenzó a experimentar sudores nocturnos y picazón en enero de 2024 y presumió que eran síntomas de ansiedad y dolor después de la muerte de su padre. Los médicos estuvieron de acuerdo con su autodiagnóstico, pero después de experimentar la pérdida de peso, el letargo y la presión en su pecho, el médico Chatgpt sugirió que podría ser algo más grave.
“Dijo que tenía cáncer de sangre. Lo ignoré. Todos éramos escépticos y nos dijeron que solo consultara a los médicos reales”.
Después de que el dolor en su pecho empeoró, regresó al hospital en enero de este año, donde los médicos descubrieron que tiene el linfoma de Hodgkin.
En otro caso (no verificado), un usuario X llamado Flavio Adamo afirmó que Chatgpt le dijo que “llegara al hospital ahora” después de que escribiera sus síntomas. Afirma que los médicos dijeron “si hubiera llegado 30 minutos más tarde, habría perdido un órgano”.
ChatGPT también ha tenido éxito con más dolencias menores, y las redes sociales están llenas de usuarios que afirman que la IA resolvió su dolor de espalda o haciendo clic en la mandíbula.
El cofundador de Openai, Greg Brockman, dijo que ha estado “escuchando más y más historias de ChatGPT ayudando a las personas a solucionar problemas de salud de larga data.
“Todavía tenemos un largo camino por recorrer, pero muestra cómo AI ya está mejorando la vida de las personas de manera significativa”.
Leer también
Características
‘Bitcoin Layer 2s’ no es realmente L2S: aquí está por qué eso importa
Características
Los bots defi bombeando el volumen de stablecoin de Solana
Todo asesino sin relleno ai noticias
– La mitad de los cazadores de empleo de la Generación Z piensan que su educación universitaria ha perdido valor debido a la IA. Solo alrededor de un tercio de los millennials se sienten de la misma manera
-La duración de las tareas que los modelos de IA pueden manejar se han duplicado cada 7 meses, con el ritmo de mejora que se acelera aún más con la liberación de O3 y O4-Mini.
– Instagram está probando el uso de IA para marcar cuentas menores de edad observando la actividad, los detalles del perfil y las interacciones de contenido. Si cree que alguien ha mentido sobre su edad, la cuenta se reclasifica en la categoría de adolescentes, que tiene una configuración de seguridad y privacidad más estrictas.
– El CEO de Openai, Sam Altman, ha admitido que el sistema de nombres de modelos de la compañía es basura, después de que la empresa se burló ampliamente por liberar el modelo GPT 4.1 después El modelo GPT 4.5.
Sam Altman
– Meta ha presentado algunas defensas novedosas después de ser demandado por capacitar a sus modelos en 7 millones de novelas pirateadas y otros libros. Los abogados de la compañía afirman que los libros no tienen “valor económico individualmente como datos de capacitación”, ya que un solo libro solo aumenta el rendimiento del modelo en un 0.06%, lo que dice que es “un cambio sin sentido, no diferente del ruido”.
– La búsqueda en ChatGPT tuvo 41.3 millones de usuarios mensuales promedio en los seis meses al 31 de marzo, frente a los 11.2 millones en los seis meses hasta el 31 de octubre de 2024. Sin embargo, Google maneja aproximadamente 373 veces más búsquedas.
– Después de que el brutalista causó controversia por usar la IA para mejorar el acento húngaro poco convincente de Adrian Brody, los Premios de la Academia ahora han emitido nuevas reglas que declaran que el uso de IA no es impedimento para ganar un Oscar.
Suscribir
Las lecturas más atractivas en blockchain. Entregado una vez por semana.
Andrew Fenton
Con sede en Melbourne, Andrew Fenton es un periodista y editor que cubre criptomonedas y blockchain. Ha trabajado como escritor de entretenimiento nacional para News Corp Australia, el fin de semana de SA como periodista cinematográfico y en el Melbourne Weekly.
El Draft de la NFL es una de las noches más grandes del año para los fanáticos del fútbol y los equipos por igual, ya que los comisionados se preparan para mejorar sus escuadrones para la temporada 2025.
Soy un gran fanático de la NFL, y he sido desde que viví en los Estados Unidos a principios de los 20 años. Dicho esto, nunca he prestado mucha atención al Draft de la NFL, a pesar de su importancia.
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.