Connect with us

Noticias

Siri con ChatGPT es mucho mejor de lo que crees

Published

on

Resumen

  • De forma predeterminada, Siri solo recurrirá a ChatGPT en busca de ayuda si el asistente no puede responder su consulta por sí solo.
  • Siri puede tomar y pasar capturas de pantalla a Siri, lo que permite a los usuarios consultar sobre el contenido visible.
  • Siri con ChatGPT permite generar imágenes fácilmente, mejor que Image Playground.


Si su iPhone es compatible con Apple Intelligence, Siri puede pasar solicitudes a ChatGPT. Para algunas solicitudes, es difícil ver la diferencia con Siri estándar, pero te sorprenderá saber exactamente lo que puedes hacer usando Siri y ChatGPT juntos.



Obtenga ChatGPT para responder todo

Una razón común por la que las personas se sienten decepcionadas con Siri con ChatGPT es que, siempre que sea posible, Siri siempre intentará responder por sí mismo. Siri recurrirá a ChatGPT en busca de ayuda si cree que es una solicitud que no puede responder directamente, pero Siri responde todas las demás consultas.

Esto significa que, para muchas solicitudes, obtienes exactamente las mismas respuestas de Siri que siempre. Esto hace que parezca como si nada hubiera cambiado. Sólo cuando Siri pasa una solicitud a ChatGPT se obtiene un nivel de respuesta que no había sido posible antes.

Sin embargo, es sencillo lograr que Siri pase todas sus solicitudes a ChatGPT si no está impresionado con las respuestas de Siri. Todo lo que necesita hacer es agregar “Preguntar a ChatGPT” al inicio de su solicitud. Por ejemplo, decir “Hola Siri, pídele a ChatGPT que escriba un haiku” producirá resultados mucho más impresionantes que pedirle a Siri.


Pregúntale a Siri cualquier cosa sobre lo que se muestra en tu pantalla

Siri obtendrá reconocimiento nativo en pantalla más adelante en 2025. La función se espera en la actualización de iOS 18.4 y le permitirá consultar a Siri sobre cualquier cosa que se muestre actualmente en la pantalla de su iPhone. Por ejemplo, si alguien te envió su nueva dirección en un correo electrónico, podrás pedirle a Siri que agregue la dirección a un contacto y extraerá la información de la pantalla.

Sin embargo, ya es posible extraer información de la pantalla de tu iPhone usando Siri con ChatGPT. Todo lo que necesitas hacer es hacerle a Siri una pregunta relacionada con el contenido que se muestra actualmente en la pantalla de tu iPhone. Si la consulta es claramente sobre su pantalla, no necesitará mencionarla directamente, pero si Siri no capta la indirecta, puede incluir algo como “en mi pantalla” en su solicitud.

Por ejemplo, si tienes una foto de algunos pingüinos y quieres saber qué tipo de pingüinos son, simplemente abre la foto y luego pregunta “Oye Siri, ¿qué especie es esta?”. Luego, Siri te preguntará si deseas enviar una captura de pantalla a ChatGPT para analizarla. Toque “Enviar” y la imagen se enviará a ChatGPT, que dará una respuesta basada en lo que había en su pantalla.


Las solicitudes de Siri se procesan en el dispositivo, pero las de ChatGPT se procesan en la nube. Si utiliza este método, es posible que desee evitar enviar capturas de pantalla de imágenes o datos confidenciales a los servidores de OpenAI.

Usa tu cámara para preguntarle a Siri sobre cualquier cosa que te rodea

La capacidad de hacer preguntas sobre lo que se muestra en la pantalla significa que incluso puedes hacer preguntas sobre los objetos que te rodean. Esto proporciona una experiencia similar a la función de inteligencia visual de Apple, lo cual es una buena noticia para los usuarios de iPhone 15 Pro y Pro Max que no obtienen inteligencia visual.

Simplemente abre la aplicación de la cámara, apunta a un objeto y hazle una pregunta a Siri sobre lo que hay en el visor. Es posible que tengas que agregar “en la pantalla de mi iPhone” o algo similar a tu consulta si Siri no se da cuenta de que estás preguntando sobre la imagen en vivo.


Puedes utilizar este truco para identificar objetos, por ejemplo. Abra la aplicación Cámara, apunte a un objeto y luego diga “Hola Siri, ¿qué es esto?” Siri te preguntará si deseas enviar una captura de pantalla a ChatGPT. Toque “Enviar” y ChatGPT analizará la imagen desde su visor y brindará una respuesta.

Haga que Siri analice páginas web enteras

Después de haber leído sobre el uso de ChatGPT a través de Siri para preguntar sobre lo que hay en su pantalla, es posible que ya haya pensado en usarlo para obtener información de páginas web. Sin embargo, en la pequeña pantalla de un iPhone, sólo una pequeña parte de la página web es visible en cualquier momento, con cierta información que no puedes ver hasta que te desplazas hacia arriba o hacia abajo.


La buena noticia es que esto no es un problema. Cuando le preguntas a Siri sobre información en una página web que está en tu pantalla, tienes la opción de enviar una captura de pantalla de la parte visible o enviar una captura de pantalla de toda la página web, para que puedas solicitar información que ni siquiera está visible actualmente en tu iPhone.

Abra una página web y hágale a Siri una pregunta relacionada con el contenido de esa página, incluso si actualmente está fuera de la pantalla. Cuando se le pregunte si desea enviar una captura de pantalla a ChatGPT, toque el menú desplegable “Captura de pantalla”. Seleccione “Contenido completo” para enviar el contenido completo de la página web. Toque “Enviar” y ChatGPT analizará la página web y proporcionará una respuesta.

Pídele a Siri que genere imágenes

Apple Intelligence agrega algunas herramientas de generación de imágenes al iPhone, incluido Image Playground, que puede utilizar para generar imágenes a partir de descripciones de texto. Sin embargo, la función es bastante limitada y uno de los mayores problemas es que no se puede utilizar para generar imágenes fotorrealistas; Todos los resultados tienen un estilo caricaturesco o ilustrado.


Usar Siri con ChatGPT hace que generar imágenes sea pan comido. Todo lo que necesitas hacer es preguntarle a Siri y la solicitud se pasa a ChatGPT, que generará la imagen usando DALL-E. Si no tiene una cuenta ChatGPT paga, está limitado a dos imágenes por día, por lo que deberá actualizar a una suscripción ChatGPT Plus si desea más.

Todo lo que necesitas hacer es pedirle a Siri que cree una imagen, con una descripción de lo que quieres crear. A veces, Siri simplemente muestra resultados de imágenes similares, por lo que es mejor incluir “Preguntar a ChatGPT” en su solicitud. Por ejemplo, podrías decir “Oye Siri, pídele a ChatGPT que cree una imagen fotorrealista de un pingüino vestido de monja en una discoteca”. ChatGPT luego generará la imagen que has solicitado.


Usar Siri directamente es aún mejor para algunas consultas

Si bien ChatGPT es muy superior a Siri en términos de lo que es capaz de hacer, hay algunas ocasiones en las que usar Siri es mejor. Cuando usas ChatGPT, Siri no puede tomar el control de tu iPhone. Si desea iniciar un temporizador, reproducir su lista de reproducción favorita en Apple Music o desactivar Bluetooth, pedirle a Siri lo logrará, pero preguntarle a ChatGPT no.

Siri también tiene acceso a información de ubicación, que no pasa a ChatGPT. Por ejemplo, si le preguntas a Siri si va a nevar el sábado, obtendrás un pronóstico del tiempo local, pero si le preguntas a ChatGPT a través de Siri, no sabrá dónde te encuentras.

Siri también puede procesar algunos comandos sin conexión. Puedes usar Siri para abrir aplicaciones, iniciar temporizadores, aumentar el volumen y más, incluso cuando no tienes una conexión de red. Sin embargo, dado que las solicitudes de ChatGPT se procesan en la nube, no podrás utilizar ChatGPT a través de Siri cuando no estés conectado.



Si su iPhone es compatible con Apple Intelligence y ha actualizado a iOS 18.2 o superior, puede usar ChatGPT a través de Siri. Sin embargo, muchas personas se sienten decepcionadas cuando lo prueban, ya que al principio puede parecer que poco ha cambiado. De hecho, ocurre todo lo contrario; hay muchas cosas que puedes hacer al combinar la comodidad de Siri con el poder de ChatGPT. No es perfecto, pero es un paso más hacia el asistente personal genuinamente útil que siempre esperé que Siri pudiera convertirse.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

La batalla de los gigantes tecnológicos

Published

on

OpenAI siempre ha sido excelente para captar la atención en las noticias. Sus anuncios a menudo vienen acompañados de afirmaciones grandes y audaces. Por ejemplo, anunciaron GPT-2 pero dijeron que era demasiado peligroso lanzarlo. O su campaña “12 días de Navidad”, donde mostraron un producto nuevo todos los días durante 12 días.

Ahora, Sam Altman ha compartido sus pensamientos sobre el año pasado, centrándose en la dramática telenovela de la sala de juntas en torno a su despido y regreso. También hizo una predicción audaz:

“Ahora sabemos cómo construir AGI como se entiende habitualmente. En 2025, creemos que los agentes de IA se unirán a la fuerza laboral y cambiarán la forma en que trabajan las empresas”.

AGI (Inteligencia General Artificial) significa crear una IA que sea tan inteligente y general como un humano. A diferencia de la IA estrecha, que está diseñada para tareas específicas como traducir idiomas, jugar al ajedrez o reconocer rostros, AGI puede manejar cualquier tarea intelectual y adaptarse en diferentes áreas. mientras no creo “AGI está cerca” Creo que la IA se unirá a la fuerza laboral, pero tal vez no de la manera que Altman imagina.

¿Está AGI cerca? No, al menos no el AGI que nosotros (o Sam) imaginamos

La llegada de AGI en 2025 parece muy improbable. La IA actual, como ChatGPT, funciona reconociendo patrones y haciendo predicciones, no comprendiendo realmente. Por ejemplo, completar la frase “La vida es como una caja de…” con “chocolates” se basa en probabilidades, no en razonamiento.

No creo que la AGI se produzca en 2025, y muchos expertos están de acuerdo. Demis Hassabis, con quien trabajé en Google, predice que AGI podría llegar alrededor de 2035. Ray Kurzweil estima que 2032, y Jürgen Schmidhuber, director de IDSIA, sugiere más cerca de 2050. Los escépticos son muchos y el cronograma sigue siendo incierto.

¿Importa cuándo? La IA ya es poderosa.

Quizás no importe exactamente cuándo llegará AGI. Incluso Sam Altman recientemente restó importancia a la “G” en AGI, diciendo:

“Creo que alcanzaremos el AGI antes de lo que la mayoría de la gente piensa y importará mucho menos”.

Estoy de acuerdo con esto hasta cierto punto. La IA ya tiene capacidades impresionantes. Por ejemplo, la IA de Netflix conoce tus preferencias cinematográficas mejor que tu pareja. Incluso se ha bromeado sobre los algoritmos de TikTok por reconocer la orientación sexual de alguien antes que ellos. La IA sobresale en el reconocimiento de patrones y, en muchos casos, es mejor que los humanos.

Sam Altman ve que la IA “se une a la fuerza laboral”

El punto más importante del memorando de Sam es su creencia de que la IA “se unirá a la fuerza laboral”. Estoy completamente de acuerdo en que esto va a suceder. Como escribí en mi actualización del agente de IA, para que la IA tenga éxito en el lugar de trabajo, necesita dos cosas clave: (1) acceso a herramientas y (2) acceso a datos. Estos son los pilares para que la IA sea realmente eficaz en entornos empresariales. Sin embargo, aunque Sam a menudo vincula esta idea con AGI, es posible que OpenAI no lidere la tarea de proporcionar estas soluciones de fuerza laboral de IA.

La primera posición de Microsoft: acceso a los usuarios

¿Quién tiene las herramientas laborales? Microsoft. Microsoft. Microsoft. Están en la pole position. La mayoría de la gente ya utiliza productos de Microsoft, les guste o no, y la IA se está integrando profundamente en estas herramientas, con copilotos apareciendo por todas partes.

En 2023 y 2024, muchas nuevas empresas lanzaron impresionantes servicios de inteligencia artificial para trabajos de oficina, solo para ser rápidamente eclipsadas por gigantes como Microsoft y Google, que tienen acceso directo a los clientes. Tomemos como ejemplo a Jasper.ai, una herramienta de inteligencia artificial para redactar textos que alguna vez fue famosa. Como señalé en esta publicación de LinkedIn, características similares ahora están integradas directamente en los productos de Google y Microsoft, lo que hace cada vez más difícil competir para los jugadores más pequeños.

El poder del acceso a los datos

La IA necesita datos para ser verdaderamente eficaz. Si está buscando respuestas sobre los procesos internos de una empresa o información valiosa a partir de documentos, herramientas generales como ChatGPT no serán suficientes. Lo que necesitamos son herramientas que puedan leer y resumir documentos de la empresa, diseñadas específicamente para uso empresarial. Como dije antes, 2025 será el año de la BÚSQUEDA, especialmente la búsqueda empresarial. Las herramientas que pueden responder preguntas, resumir contenido y ayudar a los usuarios a navegar por información compleja cambiarán las reglas del juego.

¿Quién tiene acceso a este tipo de datos? Microsoft es un gran actor, pero no está solo. Salesforce, por ejemplo, posee una enorme cantidad de datos valiosos: interacciones con los clientes, debates, documentos de procesos, estrategias de marketing y más. ¿Salesforce quiere que los agentes de IA ayuden a desbloquear este potencial? Absolutamente.

No sorprende que el director ejecutivo de Salesforce, Marc Benioff, haya criticado recientemente a Microsoft. Llamó a su asistente de IA, Copilot, “decepcionante” y dijo: “Simplemente no funciona y no ofrece ningún nivel de precisión”. Incluso lo llamó “Clippy 2.0”, el insulto más divertido que he escuchado en mucho tiempo, antes de lanzar la propia solución de inteligencia artificial de Salesforce, Agent Forces.

¿OpenAI es “simplemente” la herramienta más inteligente?

OpenAI no tiene el mismo nivel de acceso a datos o alcance al consumidor que Microsoft, ni tiene el tesoro de datos comerciales de Salesforce. Entonces, ¿cuál es su ángulo? Afirman ser la herramienta más inteligente del mercado, y probablemente lo sean, aunque personalmente considero que Claude 3.5 de Anthropic es actualmente mejor que GPT-4 de OpenAI.

OpenAI apuesta por su capacidad para superar a todos los demás con tecnología superior. Es por eso que Sam Altman afirma con seguridad que veremos AGI. ¿Qué hay detrás de esa audaz afirmación? Razonamiento o, como lo llama OpenAI, Razonamiento.

OpenAI y razonamiento

OpenAI lanzó recientemente o1, un modelo diseñado para mostrar capacidades de razonamiento avanzadas a través de un proceso iterativo de autollamada:

  1. Iteración y reflexión: el modelo genera un resultado, lo evalúa o critica y lo refina en una nueva ronda de razonamiento.
  2. Bucle de retroalimentación: esto crea un circuito de retroalimentación donde el modelo revisa sus resultados, los critica y los mejora aún más.

En esencia, GPT con o1 no sólo proporciona respuestas: planifica, critica el plan y lo mejora continuamente.

Lo que es especialmente digno de mención es el cambio de paradigma que esto representa. En lugar de simplemente lanzar un modelo más grande como GPT-5, la próxima generación de modelos de IA se centra en “pensar más” durante la inferencia. Esta capacidad de procesar de forma iterativa puede ser a lo que se refiere Sam Altman cuando dice: “Ahora sabemos cómo construir AGI”.

¿El razonamiento es razón suficiente?

Pero, ¿el “razonamiento” por sí solo hace que OpenAI entre en juego? OpenAI todavía necesita acceso a los datos y una fuerte presencia de usuarios, similar a Salesforce o Microsoft. Para solucionar este problema, OpenAI lanzó la aplicación de escritorio ChatGPT para macOS. Esta aplicación ahora puede leer código directamente desde herramientas centradas en desarrolladores como VS Code, Xcode, TextEdit, Terminal e iTerm2. Esto significa que los desarrolladores ya no necesitan copiar y pegar su código en ChatGPT, una solución común hasta ahora. Es una herramienta realmente útil y una medida inteligente para integrarse más profundamente en el flujo de trabajo del desarrollador.

Chatear con modelos de lenguaje grandes cuesta dinero

Cada llamada a un modelo de lenguaje grande (LLM) cuesta dinero. Para los grandes usuarios de ChatGPT, es posible que la suscripción de $ 20 ni siquiera cubra el costo de su uso. OpenAI recaudó recientemente 6.600 millones de dólares en una ronda de financiación Serie E, un impulso muy necesario para sostener sus operaciones. Si bien Agentforce genera ingresos sólidos de sus clientes y Microsoft disfruta de un enorme fondo de guerra financiera, OpenAI aún se encuentra en las primeras etapas para lograr que las empresas y los usuarios paguen lo suficiente para compensar los elevados costos del desarrollo de IA de vanguardia.

Su nivel premium de $200 por mes, que incluye la versión ampliada de O1, es un paso en esta dirección. ¿Pero vale la pena el precio? Quizás es por eso que AGI sigue siendo parte de la conversación: ayuda a justificar el posicionamiento premium. Sin embargo, la carrera por crear modelos superiores está lejos de terminar. Incluso O1 pronto podría ser superado por alternativas de código abierto, como hemos visto antes con Meta’s Llama.

Hablando de Meta, estoy seguro de que veremos sus intentos de monetizar los modelos de IA en 2025. En última instancia, el mayor desafío para estos actores sigue siendo claro: justificar enormes costos sin asegurar un flujo de ingresos constante y confiable.

Sam tiene razón: los agentes de IA estarán en la fuerza laboral

En 2025, veremos más agentes de IA ingresar a la fuerza laboral, transformando los flujos de trabajo al simplificar, mejorar y automatizar tareas en todas las industrias. Estos no serán modelos AGI que lo abarquen todo, sino modelos más pequeños y especializados diseñados para flujos de trabajo dedicados. La IA ampliará y mejorará los procesos paso a paso, combinando la IA tradicional, la recuperación de contexto y un diseño de usuario sólido para abordar desafíos como la seguridad, las alucinaciones y el control del usuario.

El éxito dependerá de la entrega de valor a través de soluciones bien integradas, fáciles de usar y diseñadas éticamente, como se describe en mi marco para crear herramientas de IA listas para la empresa. Para Sam Altman, la pregunta estratégica clave no será lograr AGI sino cómo fijar el precio de los modelos base de OpenAI para clientes empresariales como Microsoft o Salesforce, especialmente si OpenAI termina compitiendo directamente con ellos.

Pero, ¿cómo trabajaremos con esos nuevos colegas de IA?

Las empresas emergerán como ganadoras en la carrera por mejores modelos, mejores datos y mejores integraciones. Su principal objetivo debería ser formar a los empleados y clientes para que trabajen de forma eficaz con sus nuevos colegas de IA. En mi curso certificado de eCornell sobre soluciones de IA, vi de primera mano cómo la productividad se disparó una vez que los estudiantes aprendieron a comunicarse con un copiloto de IA. Inicialmente, muchos lucharon por lograr resultados, pero una guía paso a paso sobre cómo interactuar con la IA marcó una diferencia significativa.

¿Por qué? Porque incluso con capacidades de razonamiento y planificación, la IA aún no es verdaderamente “general”, por mucho revuelo que genere Sam Altman. Los estudiantes tuvieron que aprender cuándo confiar en la IA y cuándo aplicar el juicio humano. Creo que 2025 será el año en que las empresas se den cuenta de esta necesidad e inviertan mucho en educación sobre IA.

Continue Reading

Noticias

Google TV de Alphabet integrará Gemini AI: informe

Published

on

El equipo de consumidores de Alphabet está preparado para mejorar los televisores que ejecutan su sistema operativo Google TV integrando Gemini AI en su sistema de control de voz Google Assistant. Bloomberg ha informado.

Esta actualización tiene como objetivo mejorar la interacción del usuario con comandos de voz más naturales y capacidades mejoradas de búsqueda de contenido, incluida una integración más profunda de YouTube.

La actualización Gemini, que se espera que se implemente más adelante en 2025, permitirá a los usuarios entablar conversaciones con televisores de terceros sin necesidad de la frase desencadenante “Hola Google” para cada comando.

Google demostró esta característica en la conferencia de tecnología CES.

Además, Google mostró la capacidad de recuperar contenido de forma más natural, como solicitar videos de un viaje reciente guardados en la cuenta de Google Photos de un usuario.

Se afirma que esta actualización es la primera vez que Google lleva Gemini a televisores de terceros que ejecutan su sistema operativo, incluidos los de Sony Group, Hisense Home Appliances Group y TCL Technology Group, luego de su debut en la caja de transmisión propia de Google el pasado año. año.

Acceda a los perfiles de empresa más completos del mercado, impulsados ​​por GlobalData. Ahorre horas de investigación. Obtenga una ventaja competitiva.

Perfil de la empresa: muestra gratuita

¡Gracias!

Su correo electrónico de descarga llegará en breve

Confiamos en la calidad única de nuestros perfiles de empresa. Sin embargo, queremos que tome la decisión más beneficiosa para su negocio, por lo que ofrecemos una muestra gratuita que puede descargar enviando el siguiente formulario.

Por GlobalData






Visite nuestra Política de privacidad para obtener más información sobre nuestros servicios, cómo podemos usar, procesar y compartir sus datos personales, incluida información sobre sus derechos con respecto a sus datos personales y cómo puede darse de baja de futuras comunicaciones de marketing. Nuestros servicios están destinados a suscriptores corporativos y usted garantiza que la dirección de correo electrónico enviada es su dirección de correo electrónico corporativa.

Google TV compite con otros sistemas operativos de televisión, incluidos los de Samsung Electronics, Amazon.com y Roku.

La compañía también presentó un nuevo modo “siempre encendido” para televisores, que utiliza sensores para detectar la presencia del usuario y mostrar información personalizada, como noticias y pronósticos del tiempo.

TCL será el primer fabricante en ofrecer este modo siempre activo a finales de este año, seguido de Hisense en 2026.

Esta función tiene como objetivo proporcionar a los usuarios información relevante cuando están cerca de su televisor, mejorando aún más la experiencia del usuario.

En diciembre de 2024, Google anunció planes para integrar Gemini AI en su plataforma de realidad extendida (XR), Android XR, a través de los auriculares Project Moohan XR de Samsung.


Continue Reading

Noticias

Utilicé estas 7 indicaciones de ChatGPT para ayudar a desarrollar la fortaleza mental y desafiar los pensamientos negativos: he aquí por qué me gustan

Published

on

El invierno puede ser una época difícil para mantenerse motivado y tener pensamientos positivos. Los días más cortos y las temperaturas gélidas son especialmente difíciles para mí porque me encanta el sol y estar al aire libre. Aunque todavía trato de salir y salir a correr cuando el clima lo permite, a menudo me siento deprimido y tiendo a pensar negativamente.

Si bien los terapeutas profesionales no son rival para ChatGPT, en caso de necesidad, a menudo utilizo ChatGPT para explorar estrategias para desarrollar la fortaleza mental mientras desafío los pensamientos negativos durante los meses de invierno.

Aprecio el modo de voz avanzado de ChatGPT porque los usuarios pueden tener una conversación humana sobre cualquier cosa, incluso pensamientos desanimados y desmotivados. Esto es lo que sucedió cuando compartí mis pensamientos con ChatGPT y las sugerencias que me dio.

1. Considere las alegrías invernales simples

(Crédito de la imagen: futuro)

Inmediato: “¿Qué pequeños placeres o actividades acogedoras puedes sugerir para traer calidez y alegría durante la temporada de invierno?”

Continue Reading

Trending