Noticias
2 formas en que estoy usando la voz avanzada de chatgpt para mejorar mi vida
El otoño pasado, mi artista madre y yo fuimos invitados a dar una presentación en el Festival de Ciencias de Cambridge sobre la intersección de la IA y el arte. Fue una oportunidad emocionante. Pero tampoco había hecho un taller práctico en persona como este antes. Necesitaba a alguien, o algo, para ayudarme a hablar de mis ideas.
Eso resultó ser la función de voz avanzada de Chatgpt. Esta característica salió en el verano de 2024, pero a menudo no es el primer caso de uso que viene a la mente.
Como creador de tiempo completo de más de 10 años, estoy constantemente examinando nuevas herramientas para ver cuáles son realmente útiles, en comparación con las características son solo más aire caliente. Y con lo rápido que ChatGPT ha estado lanzando nuevas características y actualizaciones, OpenAi me ha mantenido ocupado. También me ha hecho darme cuenta de que muchas personas que usan chatgpt no son conscientes de todas las diferentes cosas que el chatbot puede hacer actualmente.
(Divulgación: Ziff Davis, la empresa matriz de CNET, en abril presentó una demanda contra OpenAi, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA).
Conozca a los creadores de la industria, colaboradores y líderes de pensamiento emergentes que se han combinado con el galardonado equipo editorial de CNET para proporcionarle contenido único desde diferentes perspectivas.
La diferencia entre los modos de voz estándar y avanzados de Chatgpt
La principal diferencia entre la voz estándar de ChatGPT y la voz avanzada es que la voz estándar utiliza motores de texto a voz, mientras que Advanced Voice usa un modelo unificado.
En el modo estándar, el IA crea su respuesta en el texto primero y luego una herramienta de voz separada lee el texto en voz alta. Si bien la voz puede sonar decente, puede sentirse antinatural y a menudo retrasada. Un modelo unificado como Advanced Voice no separa la escritura y el habla. Según el sitio web de OpenAI, el modelo multimodal del modo de voz avanzado (GPT-4O) funciona más como un humano y ajusta su tono en un flujo suave.
En la interfaz de voz de la aplicación móvil de chatgpt, el modo estándar está representado por un círculo negro en el centro de la pantalla de conversación; Para modo avanzado, es un orbe azul. El modo avanzado es una característica pagada, pero los usuarios en el plan gratuito de ChatGPT pueden obtener un uso limitado de TI cada día.
El orbe azul está escuchando.
¿Para qué podría usar una herramienta como la voz avanzada de chatgpt? Aquí hay dos formas en que lo estoy incorporando a mi vida cotidiana.
Deja que AI actúe como un tablero de resonancia
Estoy entusiasmado por usar la voz avanzada como un socio de pensamiento estratégico para ayudarme a trabajar en problemas importantes y desafiantes.
Una limitación de ChatGPT es que sus datos de capacitación base solo suben a cierto mes y año. Si bien se basa en una amplia gama de libros, artículos y contenido web, puede carecer de conocimiento actualizado o información sobre temas de nicho y altamente especializados. Esto cambia cuando ciertas características están habilitadas, y puede habilitar estas funciones mientras usa una voz avanzada.
Mis características de solicitud de chatgpt favoritas son:
- Buscar. Alterne esta función para que ChatGPT explique Internet y acceda a la información en línea.
- Investigación profunda. Haga que ChatGPT busque en la web y devuelva ideas más detalladas. (Me parece útil al explorar temas menos convencionales).
- Subir. Compartir archivos, informes de proyectos u otros documentos desde su dispositivo o almacenamiento en la nube. (Haga clic en el icono “+” para acceder a esto).
Para acceder a una de estas características en una computadora, haga clic en la función apropiada para habilitarla, luego haga clic en el botón de voz a la derecha.
En el escritorio, las características especiales se pueden alternar antes de enviar un mensaje.
Para habilitar las funciones de ChatGPT en dispositivos móviles utilizando una voz avanzada:
- Toque el icono del control deslizante.
- Elija la función que desea habilitar. (Sabrá que está habilitado porque su icono aparecerá debajo de la burbuja rápida).
- Toque el botón de voz avanzado.
- Permita que la voz avanzada responda.
- Salga de la ventana de voz una vez que la respuesta esté completa para ver la respuesta por escrito.
Cualquier fuente web utilizada para informar la respuesta aparecerá en el panel de control.
Las características indicadas se pueden activar en el móvil antes de usar la voz avanzada. Si realiza una búsqueda en la web o una investigación profunda, CHATGPT incluirá algunas de sus fuentes.
De vuelta al festival que mencioné al principio. Xiang Li es mi madre y la artista detrás de una colección masiva de emperatriz chinas pintadas de seda con acuarelas de piedras preciosas. Cuando usé la voz avanzada de ChatGPT y pregunté qué sabía sobre Xiang Li Art, rápidamente hizo referencia a la información que solo habíamos actualizado recientemente.
Desde la exploración artística interactiva de IA hasta demostraciones de IA en vivo, panel de discusión y actividades de participación juvenil, pudimos implementar varias ideas prácticas durante nuestro evento en vivo en Cambridge, y fueron muy bien recibidos.
Puede ser muy específico con sus preguntas y puede hacer que los seguimientos sean aún más profundos. A menudo me gusta tratar la voz avanzada como un amigo o un compañero de escucha en lugar de un motor de búsqueda mientras trabajo a través de ideas.
Traducción más matizada
Gracias a la voz avanzada, cuando mi pareja (que habla principalmente inglés) se comunica con mi madre (que solo habla chino mandarín), las traducciones se sienten más naturales.
La voz avanzada de Chatgpt puede hablar más de 50 idiomas. Este modelo se siente mucho más natural, como puede pensar, hablar, detener y reaccionar. Este puede ser un experimento un poco complicado si está utilizando una voz avanzada para este propósito por primera vez. Mi aviso generalmente es algo como esto:
“Hola chatgpt, tengo dos altavoces en la habitación: Adam y mi madre Xiang. Adam habla inglés, y Xiang habla mandarín chino. Quiero que actúes como traductor entre ellos. Después de que Adam ha terminado de hablar, traducirlo al chino mandarín para mamá, y viceversa”.
El único problema que experimentamos a veces es el momento. Chatgpt puede saltar un poco temprano mientras alguien todavía está hablando. Para mejorar esto, le dijimos a ChatGPT que escuchara la palabra “ir” antes de proporcionar la traducción. Encuentro que este tipo de ajuste fino puede ser útil porque nuestros patrones de habla y la entonación difieren de persona a persona, lo que hace que sea difícil para ChatGPT descifrar cómo reaccionar.
Después de usar la función regularmente, noto que está recogiendo contexto en situaciones más complejas. Puede recordar información en conversaciones más largas, comprender los matices sutiles y responder a mis emociones con mayor precisión. Espero que la voz avanzada se vuelva más inteligente e intuitiva con el tiempo.
Empiece a explorar la voz avanzada de chatgpt para usted
Advanced Voice puede responder una amplia gama de preguntas, por lo que es una herramienta versátil para la creatividad, la creación de contenido, la resolución de problemas e incluso la asociación estratégica. Actualmente, Advanced Voice está disponible para todos los usuarios de ChatGPT; Los usuarios gratuitos reciben un límite diario en el uso avanzado de voz, mientras que el límite es mucho más alto para los usuarios de Plus, Pro y Team.
Mira mi demostración de voz avanzada en tiempo real aquí en mi canal de YouTube. Y si tiene alguna pregunta o idea sobre cómo crecer con una voz avanzada, conéctese conmigo en YouTube y LinkedIn para saludar.
Las opiniones expresadas por los contribuyentes de CNET Perspectives son propias.