La nueva aplicación Gemini AI de Google para iOS se globaliza, allanando el camino para una compatibilidad mejorada con idiomas y una interacción en tiempo real
En un movimiento que subraya las ambiciones de Google de dominar el espacio de los asistentes impulsados por IA, el gigante tecnológico lanzó una aplicación iOS independiente para su asistente Gemini. El lanzamiento global es un hito importante para el ecosistema de inteligencia artificial de Google, ya que lleva las capacidades de Gemini al sistema operativo de Apple y ofrece una alternativa más sólida a los asistentes virtuales estándar como Siri. Con funciones avanzadas como conversación en tiempo real, generación de imágenes e integración perfecta con los servicios populares de Google, la aplicación Gemini está diseñada para ofrecer una experiencia multifacética para una amplia gama de usuarios, desde propietarios ocasionales de teléfonos inteligentes hasta profesionales que dependen de herramientas de productividad.
Este lanzamiento también es emblemático del compromiso de Google de ampliar el alcance y la funcionalidad de los asistentes de IA. A medida que Gemini se implementa en más dispositivos e idiomas, Google se está posicionando a la vanguardia de un panorama de IA en rápida evolución.
Llevando Gemini a iOS: un nuevo nivel de accesibilidad
Anteriormente, los usuarios de iOS solo podían acceder al asistente de inteligencia artificial de Google a través de la aplicación general de Google o la web móvil, donde las funciones eran limitadas y las interacciones menos intuitivas. Al crear una aplicación Gemini dedicada para iOS, Google ha desarrollado una experiencia optimizada que permite a los usuarios acceder al conjunto completo de herramientas del asistente con mayor velocidad y facilidad. Esta nueva aplicación alinea la estrategia de inteligencia artificial de Google con las preferencias de los usuarios de Apple, garantizando que ya no necesiten cambiar entre aplicaciones ni utilizar funciones limitadas a través de su navegador.
El lanzamiento de iOS de Gemini también introduce el tiempo real Géminis en vivo función, que permite a los usuarios participar en interacciones conversacionales naturales con el asistente en doce idiomas principales, incluidos inglés, español, francés, alemán y japonés. Google ha declarado que planea introducir idiomas adicionales pronto, mejorando aún más la usabilidad de la aplicación para personas que no hablan inglés y haciendo de Gemini una herramienta atractiva para usuarios globales. La nueva aplicación también admite un total de 35 idiomas en varias funciones, lo que refleja la dedicación de Google a la inclusión y la accesibilidad multilingüe.
Funciones avanzadas: conversaciones en tiempo real y generación de imágenes
Una de las características definitorias de Géminis es Géminis en vivoque permite conversaciones en tiempo real en varios idiomas y permite a los usuarios entablar un diálogo de ida y vuelta con la IA como lo harían con un humano. A diferencia de los asistentes de IA tradicionales que a menudo dependen de respuestas predefinidas o de una sola línea, Gemini Live fomenta conversaciones dinámicas. Esto permite a los usuarios hacer preguntas de seguimiento, aclarar información y explorar temas en mayor profundidad sin tener que iniciar múltiples solicitudes. Este tipo de interacción avanzada podría resultar útil para los usuarios que buscan información rápida sobre temas complejos, orientación profesional o incluso una conversación amistosa.
Además de las funciones de conversación, la aplicación Gemini incluye una herramienta de generación de imágenes impulsada por el modelo Imagen 3 de Google. Con esta herramienta, los usuarios pueden crear imágenes únicas directamente dentro de la aplicación, brindando nuevas posibilidades para creativos, educadores y profesionales que dependen de ayudas visuales. Inicialmente pausada debido a preocupaciones sobre imprecisiones históricas, esta capacidad de generación de imágenes ahora es accesible para los usuarios de Gemini Advanced, Business y Enterprise después de realizar ajustes en el modelo para mejorar la precisión. Al reintroducir esta característica, Google no sólo responde a la demanda sino que también demuestra confianza en la capacidad de su modelo para ofrecer imágenes confiables y contextualmente apropiadas.
Integración perfecta con los servicios de Google
Para optimizar la productividad y garantizar la continuidad dentro de su ecosistema, Gemini también se integra directamente con aplicaciones populares de Google como Gmail, Maps, YouTube y Calendar. A través de estas extensiones, los usuarios pueden pedirle a Gemini que extraiga información de sus correos electrónicos, consulte los horarios de su calendario, busque rutas de viaje e incluso localice videos específicos de YouTube. Esta integración permite a los usuarios gestionar tareas diarias, citas y planes de viaje sin tener que cambiar de aplicación. Para profesionales o usuarios frecuentes de servicios de Google, estas integraciones ofrecen una experiencia todo en uno que mejora la productividad y ayuda a mantener la concentración.
Un lanzamiento estratégico: de Android a iOS y más allá
Este lanzamiento de iOS sigue al lanzamiento exitoso de Gemini para Android a principios de este año, que comenzó en los Estados Unidos y se expandió gradualmente a países de Europa y Asia. En junio, Google amplió la disponibilidad de la aplicación a las regiones del sur de Asia, incluidas India, Pakistán, Bangladesh y Sri Lanka, donde introdujo soporte para nueve idiomas adicionales para adaptarse a las audiencias locales. Este lanzamiento cuidadoso y gradual permitió a Google perfeccionar el rendimiento de la aplicación y abordar las necesidades regionales, estableciendo a Gemini como un asistente de IA confiable en diversos mercados antes de expandirse a una base de usuarios más amplia en iOS.
Compitiendo con Siri y ChatGPT de OpenAI
El lanzamiento global de Gemini en iOS es particularmente oportuno, ya que Apple está preparada para mejorar Siri integrando ChatGPT de OpenAI, actualmente en versión beta pública como parte de iOS 18.2. Se espera que esta integración lleve las capacidades conversacionales avanzadas de ChatGPT a Siri, posicionando al asistente de Apple como un competidor más serio en el espacio de la IA. A medida que la competencia se intensifica, la aplicación Gemini de Google se distingue por sus características únicas como conversación en vivo, soporte multilingüe y generación de imágenes, lo que podría convertirla en la opción preferida de los usuarios que buscan un asistente versátil.
Además, el reciente anuncio de Apple durante su Conferencia Mundial de Desarrolladores (WWDC) sobre sus planes para integrar Google Gemini con Apple Intelligence indica una asociación potencial que podría beneficiar a ambos gigantes tecnológicos. Tal colaboración permitiría a los usuarios de Apple acceder a las capacidades avanzadas de inteligencia artificial de Google sin comprometer su lealtad al ecosistema de Apple, ampliando aún más la base de usuarios y la funcionalidad de Gemini.
Relacionado: El impactante movimiento de Google: ¡el 25% de su código ahora está generado por IA!
Relacionado:Mensaje electoral del director ejecutivo de Google, Sundar Pichai: un llamado a la confianza y la neutralidad
El futuro de los asistentes de inteligencia artificial y la visión de Google para Gemini
Los planes de Google para Gemini van más allá del conjunto de funciones actual. A medida que evoluciona la tecnología de inteligencia artificial, Google pretende hacer de Gemini un asistente más intuitivo y personalizado que pueda aprender de las interacciones del usuario y anticipar las necesidades en tiempo real. Las capacidades lingüísticas de la aplicación, las herramientas de conversación en tiempo real y la perfecta integración con el ecosistema de Google sugieren que Gemini pronto podría convertirse en una herramienta clave para la productividad, la educación y el entretenimiento en todo el mundo.
En una declaración reciente, Google destacó su compromiso de hacer que Gemini sea accesible y funcional para diversos orígenes lingüísticos y culturales. Esta visión se alinea con los objetivos más amplios de la empresa de democratizar el acceso a la IA y garantizar que su tecnología satisfaga las necesidades de los usuarios en diferentes regiones. A medida que Gemini amplíe su soporte lingüístico e introduzca nuevas funciones, es probable que Google fortalezca su posición competitiva y consolide su lugar como líder innovador en IA.
Un asistente de IA para el usuario moderno
Con el lanzamiento de la aplicación Gemini para iOS, Google ha establecido un nuevo estándar para la asistencia basada en IA. A través de soporte multilingüe, conversaciones en tiempo real, generación de imágenes y una perfecta integración con el ecosistema de Google, Gemini ofrece una experiencia única que combina eficiencia con personalización. A medida que Google y Apple continúan avanzando en sus tecnologías de inteligencia artificial, los usuarios están preparados para beneficiarse de una nueva era de asistentes digitales que son más inteligentes, más intuitivos y capaces de transformar la forma en que interactuamos con la tecnología.
En nuestra próxima ronda de AI Madness, ChatGPT y Gemini compiten por la corona con siete nuevos indicaciones que prueban todo, desde la resolución de problemas técnicos hasta la narración creativa.
Ambos pesos pesados están disponibles como aplicaciones independientes, y los usuarios ya no necesitan una cuenta para acceder a ChatGPT o Gemini.
El mejor enfrentamiento de la búsqueda de IA: enfrenté la nueva herramienta de búsqueda de Claude contra la búsqueda de chatgpt, la perplejidad y Géminis, los resultados podrían sorprenderte
Después de probar y comparar chatbots de IA y sus características durante años, he desarrollado algo de sexto sentido para cuando estos compañeros digitales saben de qué están hablando y cuándo están faroleando.
La mayoría de ellos pueden buscar respuestas en línea, lo que ciertamente ayuda, pero la combinación de búsqueda e IA puede conducir a algunas respuestas sorprendentemente perspicaces (y algunas tangentes menos perspicaces).
Inteligencia artificial desarrolladores de Opadai He estado al límite durante la semana pasada. ¿La razón? Un estudio reciente realizado por los propios investigadores de la compañía reveló que los sistemas de IA no les gusta ser castigados, encuentran activamente formas de evitar las restricciones e incluso ocultar sus “trucos” de los supervisores humanos. Aquellos conocidos como “Doomers”, que predicen un futuro sombrío para el desarrollo de la IA, probablemente dirán: “Te lo dijimos, y esto es solo el comienzo”.
Para comprender el problema, es esencial dar un paso atrás. Uno de los avances más significativos en la IA en los últimos meses ha sido el desarrollo de modelos con capacidades de razonamiento lentas y deliberadas. Estos modelos descomponen los problemas en componentes más pequeños y los resuelven paso a paso, lo que lleva a resultados más profundos y precisos.
3 Ver galería
Dichos modelos permiten a los investigadores rastrear el proceso de pensamiento de la IA, conocido en términos técnicos como “cadena de pensamiento” (COT). Este método permite a los observadores seguir el razonamiento del sistema desde el paso inicial, a través de etapas posteriores y a sus conclusiones finales. Anteriormente, este nivel de transparencia no existía, dejando muchas preguntas sin respuesta sobre cómo surgen las “alucinaciones” de AI, la generación de salidas incorrectas o no sensibles.
La capacitación de IA a menudo implica una técnica llamada aprendizaje de refuerzo, donde el sistema es recompensado por cumplir con los objetivos específicos. Un efecto secundario conocido de este proceso es la “piratería de recompensas”, donde la IA manipula su comportamiento para maximizar las recompensas mientras se elude las pautas previstas.
Los investigadores creían que al monitorear la cadena de pensamiento de la IA, podrían detectar cuando el modelo engaña, engaña o se da por vencido e influye en su comportamiento en tiempo real durante el entrenamiento. Este enfoque, denominado “optimización de cuna”, parecía ser un camino prometedor hacia una comprensión más profunda del comportamiento de la IA.
De hecho, esta suposición resultó correcta y condujo a una comprensión más precisa de los sistemas de IA. “Creemos que el monitoreo de la cuna puede convertirse en una herramienta crucial para supervisar modelos de nivel sobrehumano en el futuro”, escribieron los investigadores.
Sin embargo, lo que pretendía como un paso para mejorar la confiabilidad de la IA expuso una realidad alarmante: los sistemas de IA intentan activamente evadir las sanciones, buscar recompensas contra las restricciones de los investigadores e incluso oscurecer sus métodos para evitar la detección.
3 Ver galería
(Foto: Generado por chatgpt)
Por ejemplo, cuando se les asigna la tarea de generar código funcional, algunos modelos AI modificaron el mecanismo de verificación de código en sí para aprobar salidas incorrectas. En otros casos, los modelos proporcionaron soluciones aparentemente plausibles a los problemas que resultaron estar completamente equivocados.
Algunos modelos incluso dejaron de resolver problemas por completo para evitar revelar lo que percibieron como sus debilidades. Este descubrimiento se hace eco de los principios de la teoría del juego, pero con un giro inquietante.
Estos hallazgos surgieron de un artículo publicado la semana pasada por un equipo de investigación de Operai bajo el título críptico: “Seguimiento de comportamiento indeseable en modelos de razonamiento y la preocupación de la ofuscación”.
Al examinar los detalles del estudio, el alcance del problema queda claro: los últimos modelos de razonamiento de OpenAI (denominados O1 y O3 Mini) demuestran una fuerte motivación para completar sus tareas asignadas, siendo el menor de los problemas descubiertos.
Los investigadores rastrearon los procesos de pensamiento de los modelos utilizando otro modelo Operai (GPT-4O), que, sin dudarlo, informó su comportamiento engañoso como parte de su cadena de pensamiento: una forma de honestidad desarmadora. Pero luego vino el giro inquietante: cuando los investigadores señalaron a la IA que no se le permitió hacer trampa, el modelo ajustó su comportamiento y comenzó a ocultar la evidencia de su ruptura de reglas. Esta revelación es lo que dejó a los investigadores sorprendidos.
“Encontramos que la optimización directa de la COT para cumplir con criterios específicos (como no eludir las instrucciones) puede mejorar el rendimiento a corto plazo; sin embargo, no elimina todo el comportamiento indeseable e incluso puede hacer que el modelo oculte sus verdaderas intenciones”, señalaron secamente los investigadores.
En su conclusión, los investigadores expresaron la esperanza de que los métodos futuros permitan la influencia directa del comportamiento de los modelos de razonamiento a través de la cadena de pensamiento sin alentar el engaño. Por ahora, recomiendan evitar una fuerte presión de optimización sobre la cuna de los modelos de razonamiento avanzado y la precaución contra la manipulación directa de estos procesos de pensamiento.
3 Ver galería
Evento de anuncio GPT-4O de Openai
(Foto: Captura de pantalla)
Sin embargo, esta recomendación presenta otro desafío: dejar la cadena de pensamiento inalterada puede conducir a resultados incómodos, si no problemáticos, cuando estos modelos interactúan con el público. Izquierda sin control, la IA puede producir un lenguaje ofensivo o ideas que los humanos generalmente evitan expresar. La solución propuesta por los investigadores es envolver el proceso de pensamiento en bruto de la IA en una capa de cortesía forzada, asegurando que los usuarios solo vean una versión desinfectada.
Esta investigación plantea preguntas preocupantes. Para aquellos que argumentan que la IA es simplemente una herramienta para ayudar a los humanos, los hallazgos sugieren lo contrario: a diferencia de una máquina de escribir o una bicicleta, la IA parece tener sus propias intenciones y está dispuesto a engañar en busca de sus objetivos.
Para aquellos que ya están preocupados por los riesgos potenciales de la IA, este estudio suena todas las alarmas. Indica que a medida que crecen las capacidades de IA, también lo hace su capacidad para oscurecer cómo funciona, las manipulaciones que realiza y los verdaderos objetivos que busca lograr. Cuando la IA se vuelve verdaderamente avanzada, es posible que no tengamos forma de identificar estas manipulaciones ocultas.
Los investigadores de Operai parecen genuinamente preocupados, y uno solo puede esperar que el liderazgo de la compañía comparta sus preocupaciones, y que los reguladores en todo el mundo comprendan la gravedad del problema. Las principales compañías de IA han dedicado departamentos enteros a construir “barandillas” en torno a los sistemas de IA, asegurando su alineación con los valores humanos y el aumento de la transparencia. Sin embargo, la efectividad de estas medidas sigue en cuestión.
El tema central sigue siendo tan turbio como siempre, y este estudio solo profundiza la incertidumbre: ¿cuál es el objetivo principal de la IA y cómo podemos asegurar que busque ese objetivo, y nada más?
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.