A medida que los asistentes de voz con IA mejoran continuamente, no pude evitar notar algunas diferencias clave entre dos de mis favoritos: ChatGPT Advance Voice y el nuevo Siri.
Ambos modelos tienen una serie de características destacadas que incluyen un nuevo diseño, tiempos de respuesta más rápidos y la capacidad de controlar la aplicación con la voz; sin embargo, los avances de Apple en inteligencia artificial aún se quedan cortos en varias áreas. Sus propios informes internos sugieren que lleva al menos dos años de retraso.
He reunido una lista de cosas que encuentro útiles en ChatGPT y que los ingenieros de Apple deberían considerar adoptar para que Siri sea lo mejor posible. Esto le ayudaría a ganarse el título de pieza central del ecosistema de Apple y controlador de Apple Intelligence.
1. Participar en conversaciones complejas
Comenzaré con lo que quizás sea lo más obvio, que es la capacidad de ChatGPT para mantener conversaciones largas y complejas mientras se comprende el contexto. ChatGPT recuerda detalles anteriores y puede usarlos nuevamente en respuestas futuras. Esto hace que la conversación sea mucho más atractiva y humana.
Si bien Siri ahora está más adaptado para seguirte si te equivocas con las palabras, todavía no es tan conversacional como ChatGPT. Como no puede recordar consultas anteriores, cada vez que intentas hablar con Siri es como empezar de nuevo. Esto puede hacer que las interacciones parezcan fragmentadas.
Para que Siri pueda competir, Apple necesita mejorar las capacidades de recuperación y la memoria para que el asistente de IA pueda seguir las discusiones y ofrecer respuestas más naturales. También es necesario permitir mejores seguimientos, ya que no todo se puede abordar en la primera pregunta.
2. Capacidades multimodales
Siri aún no tiene comprensión visual. ChatGPT no sólo puede escuchar y hablar, sino que también puede “ver”. Es decir, si los usuarios piden al modelo de IA que analice, describa o genere información a partir de fotografías o diagramas, proporcionará análisis e información contextual basada en la imagen.
Esto es algo que llegará al ecosistema de Apple a través de Apple Visual Intelligence, al que inevitablemente Siri podrá acceder en el futuro. Meta AI tiene una función que le permite describir lo que puede ver a través de las gafas inteligentes en respuesta a una pregunta como “¿Qué estoy mirando?”. Esta será una buena manera para que Apple le dé ojos a Siri.
3. Conciencia del contexto
Ésta es un área en la que el nuevo Siri ha mejorado. Puedes preguntarle qué tiempo hace y te dará una respuesta, o puedes preguntarle si necesitas un paraguas y te dirá si está lloviendo actualmente. Sin embargo, esto no llega tan lejos como ChatGPT Voice en términos de conversación contextual. El bot de OpenAI responderá con una explicación o de forma más natural.
Lo que puede hacer Siri es acceder a tu ubicación, al tiempo actual y dar información real. Lo que no puede hacer es responder con detalle. Todo lo que obtendrás es la temperatura en respuesta a “¿Necesito una chaqueta?” o “No creo que esté lloviendo” si preguntas si necesitas un paraguas.
Si bien ChatGPT responderá con algo como “podría ser una buena idea ya que es una temperatura bastante baja”, primero debes decirle la temperatura ya que el modo de voz no tiene datos en vivo.
Apple necesitaría mejorar significativamente la capacidad de Siri para establecer conexiones contextuales entre consultas para que coincida con el modelo de conversación fluida de ChatGPT. Pero ChatGPT necesita datos en vivo en su modo de voz para ser un asistente útil.
4. Voz natural y adaptable
ChatGPT Voice utiliza un procesamiento avanzado del lenguaje natural para adaptar su tono, estilo y conversación según el usuario. Agrega elementos humanos como burlas, pausas e incluso ums, que lo hacen sentir más natural que Siri.
Aunque Apple Intelligence ha mejorado la voz de Siri, todavía carece de la adaptabilidad matizada. Apple necesitaría invertir más en procesamiento del lenguaje natural y dinámica del habla para que Siri iguale lo que ChatGPT Voice puede hacer. Lo que Siri tiene a su favor es que se ejecuta en gran medida localmente, por lo que funciona sin conexión.
5. Más allá de lo básico
Cuando quieras configurar un recordatorio o enviar un mensaje, Siri es genial. Puede ayudarle a realizar un seguimiento de sus medicamentos, a qué aplicaciones se ha suscrito e incluso ayudarle a compartir su contraseña de WiFi. Siri puede enviar mensajes de texto y correos electrónicos. Pero hay que decirle qué decir. Por ejemplo, cuando Siri inicia un correo electrónico, solicita la línea de asunto. Si le pides a ChatGPT que te ayude a escribir un correo electrónico, crea la línea de asunto por ti. ChatGPT Voice lleva una tarea básica aún más lejos al ayudar a resolver problemas complejos. Por esa razón, ChatGPT Voice puede ayudarte a escribir el mensaje que quieres que envíe Siri.
El modelo de IA realiza tareas que requieren un análisis y una comprensión más profundos que Siri simplemente no puede realizar. capacidad para aprender ChatGPT me conoce tan bien que puede perfilar a sus usuarios. A pesar de las actualizaciones y los cambios de software de Siri, no llega a conocer a los usuarios de la misma manera que lo hace ChatGPT Voice.
ChatGPT aprende de cada interacción y mejora sus respuestas según las preferencias del usuario, haciendo que las conversaciones futuras sean más personalizadas. Siri, a pesar de las actualizaciones periódicas de software, no aprende de conversaciones individuales en tiempo real. Apple necesitaría implementar algoritmos de aprendizaje en tiempo real para que Siri proporcione respuestas más personalizadas y adaptativas.
Alternativamente, y algo que creo que veremos, es que Apple se asocie con OpenAI para transferir algunas de las tareas más complejas al modelo más avanzado.
6. Capacidad de aprender
ChatGPT me conoce tan bien que puede perfilar a sus usuarios. A pesar de las actualizaciones y los cambios de software de Siri, no llega a conocer a los usuarios de la misma manera que lo hace ChatGPT Voice. La razón es que ChatGPT aprende de sus interacciones en tiempo real y mejora las respuestas a medida que recopila datos. Cada interacción le ayuda a sintonizarse mejor con las preferencias específicas y los hábitos de conversación de cada usuario.
Si bien Siri es experta en enviar mensajes de texto, configurar recordatorios y brindar respuestas básicas, ChatGPT Voice puede ayudar con tareas complejas como resolver problemas o redactar correos electrónicos detallados. La capacidad de ChatGPT para crear líneas de asunto y analizar tareas más allá de los comandos básicos lo coloca un paso por delante. Siri necesitaría capacidades de aprendizaje automático más profundas para manejar tareas más analíticas y creativas sin que el usuario se lo pida.
Cuando Apple adopte estas capacidades, Siri será imparable, ya que tiene algo con lo que OpenAI sólo puede soñar: un enorme contexto personal. Es decir, una amplia biblioteca de datos personales, desde correos electrónicos y mensajes de texto hasta descargas y notas. Puede aprovechar todo eso de una manera segura y localmente segura para mejorar sus respuestas y ser más útil.
7. Fluidez multilingüe
ChatGPT Voice maneja una gran cantidad de idiomas con fluidez y puede cambiar entre ellos en una sola conversación. Siri admite varios idiomas, pero no ofrece la misma flexibilidad para cambiar en mitad de una conversación o manejar traducciones avanzadas.
Para que Siri pueda competir, Apple tendría que centrarse en mejorar sus capacidades de procesamiento multilingüe. Maneja la traducción localmente en el dispositivo, pero sigue siendo un complemento, no profundamente integrado en la IA como las capacidades de voz de ChatGPT.
Bono: creación de contenido
Siri se limita a responder preguntas y realizar tareas básicas mientras ChatGPT genera el esquema de su próxima novela. En resumen, Siri no es capaz de generar contenido creativo ni resultados personalizados porque no es tan contextual como ChatGPT.
Conclusión
Desde manejar conversaciones contextuales más largas hasta integrar capacidades multimodales, ChatGPT Voice traspasa los límites de lo que la IA de voz puede lograr. Si bien Siri sigue siendo una parte integral del ecosistema de Apple, ChatGPT Voice ofrece funciones más avanzadas en términos de complejidad de conversación, capacidades multimodales y resolución de problemas.
Para que Siri cierre la brecha, Apple necesitará invertir en mejorar la memoria, la comprensión contextual, la adaptabilidad natural del habla y las capacidades de aprendizaje en tiempo real de Siri.