There has been a surge of AI tools and features in Android and iOS smartphones. To keep up with the advancements, Google has framed Google Gemini as its go-to virtual assistant in the latest Android smartphones, especially the Pixel series. While you can still switch back to the good old Google Assistant, the experience will not be the same as Gemini comes equipped with a ton of extensions that you can integrate with the app to make the responses more precise and personalized.
Advertisement
That is exactly what we will cover here — how to use the best Google Gemini AI extensions that can be useful every day. Integrating these extensions is what puts Gemini a step ahead of Google Assistant to make it more than a conventional voice assistant. Thankfully, accessing Gemini is easier now than ever before. You can simply alert Gemini with “Hey Google,” removing the hassle of picking up your phone to use the app — just turn on the “Hey Google” and Voice Match feature inside Gemini’s Settings tab and you’re ready to go.
Even better, Google Gemini extensions are also available in the free version, so there is no need to worry about spending extra dollars to avail yourself of these perks. However, something worth remembering is that the Gemini Apps Activity has to be enabled in the app to pair the extensions. This way, Gemini keeps a memory of your past conversations to piece information together for more tailored future responses. That said, Gemini’s responses may not always be correct, so it is a good practice to double-check the information it provides.
Advertisement
How to use Google Gemini extensions
Cheng Xin/Getty Images
To enable any of the extension we will be covering in this article, first open the Gemini app on your phone and tap the profile icon in the top-right corner. Scroll to Extensions to find a list of extensions supported by Gemini AI to maximize the app’s usability. Toggle the switch on or off depending on which app or service you use more often.
Advertisement
Google Support is clear about the fact that when you add an extension to Gemini, the data is shared with that app to generate prompts suited to your request. On the bright side, there is no limit to how many Google Gemini extensions you can add at a time, so feel free to use as many as you’d like. Moreover, interacting with third-party apps like WhatsApp and Spotify inside the Gemini app also means the data will be shared across apps. The key point to note here is that this is all done with your consent. If you wish to stop the cross-share of data at any point, switch off the extension.
One more thing to be aware of is that you do not always have to tag the particular extension you want to use in your prompt. Gemini knows which extension to use based on the requirements and keywords in the user query. If you ask it to get flight details, the Google Flights extension will activate automatically.
Advertisement
Google Workspace
Piotr Swat/Shutterstock
If you are someone whose life revolves around Google Workspace apps like Google Keep and Gmail, this extension is a must-have. With it, you can consider Gemini your personal assistant for the entire Google ecosystem. Think that you might have missed an important work email from a colleague? Prompt Gemini to “Get the last three emails from Jason,” and it will look through your Gmail for Jason’s emails. It will then show you a couple of pointers summarizing each email along with the receiving date so you can quickly find it in your inbox.
Advertisement
Other than this, use Gemini to your advantage to quickly find information or create a short summary of Google Docs and Drive files instead of reading long documents. It can also fetch lists and content from your Google Keep notes or add content to the ones already there on your phone. You can also add meetings to the Google Calendar immediately with your personal AI assistant to make sure you don’t forget them later. Even better, ask it to check if your calendar is free for a particular day and time to schedule commitments accordingly.
Phone and SMS
JLStock/Shutterstock
With Google Assistant, you have long had the convenience of texting or calling anyone on the contact list with a voice command. There is an additional step to perform before you can do the same action with Gemini — turn on the Phone and SMS extensions in the app. After that is done, you can enter the text and prompt Gemini to deliver the SMS to the named contact on your smartphone. If you are unsure about the tone, ask it to modify the message before sending it to the receiver. It will ask you for a final confirmation before delivering the text message.
Advertisement
Want to make a quick phone call on the go? Let Gemini know who to call, and it will ring up that person in your phone’s contact list right away. Merging the Phone and SMS extensions with this digital assistant made things much more feasible in my day-to-day life. You no longer have to scroll through my contact list to find the person you need to contact — instead, you can just let Gemini do the work for me while you can focus on other important tasks at hand.
Google Flights and Google Maps
Syeda Laiba Alam/SlashGear
Get real-time ticket prices and flight schedules for any destination you wish to travel. Gemini can fetch the flight availability within seconds and help you plan your next trip with the Google Flights extension. In fact, Gemini is smart enough to know what data to use for which query. If you just ask it to show you the earliest flight to Istanbul in economy class, it will identify the nearest airport to your current location and show the details accordingly.
Advertisement
Not only one, but you get multiple airline options to choose from to make an informed decision. The response will contain all the essential information you need, including the airline name, flight number, arrival/departure times, and the approximate travel time. You name it, and you get it.
Once you have booked the most suitable flight and traveled to your destination, don’t worry about getting lost in a foreign city. Gemini has your back with the Google Maps extension. Tell Gemini where you are headed, and it will use your live location data to map out a route to your destination. Let it map out the quickest way to your destination while you also receive regular updates about the distance and estimated travel time.
Advertisement
Google Home
Mojahid Mottakin/Shutterstock
Smart home owners, pay attention. If you sync your smart home devices with the same Google account, then you can control them with the Gemini assistant. From smart fans, lights, and media devices to coffee makers, thermostats, and window coverings — just about anything that’s compatible with the Google Home ecosystem can now be controlled with just your voice.
Advertisement
With each passing day that the AI behind Gemini gets smarter, it is becoming more proficient in understanding and comprehending the human language. A good example is if you just say, “I feel we need more sunlight in the kitchen,” Gemini will know that it needs to open the kitchen window covering. Similarly, the prompt “It’s too cold inside” can activate the thermostat settings to increase the temperature for a warmer house.
The integration of Gemini with Google Home has made smart devices more accessible for users, offering them a greater sense of control over these devices. Thanks to this, the Google ecosystem has become much more useful than ever before. The only downside is that the Google Home extension? As of January 2025, it is only available in Public Preview. Oh, and you cannot access the Google Home extension unless you reside in the U.S. That’s a bummer, but maybe we can see wider availability once the extension is released officially.
Advertisement
Utilities
S3studio/Getty Images
Utilities is another cool extension that is compatible with Google Gemini. With Utilities, you can navigate to different apps on your phone or set timers and alarms using just your voice. The AI presents the option to perform almost any task within your phone without the need to access the particular app separately.
Advertisement
Want to quickly add something to the Calendar app? No worries, tell Gemini to do that for you. Want to jot down important pointers, but your hands are full? Dictate it to Gemini and ask it to add the content in a separate note on your phone. You are the CEO and Gemini — paired with the Utilities extension — is your personal secretary that is always there at your service.
Here’s a very practical use case of the Utilities extension. Imagine that there is an unexpected electricity breakdown in your area. The lights go out, and you cannot locate your phone in the pitch-black room. What do you do? Yell “Hey Google” to activate Gemini and prompt it to turn on the flashlight. There you go — you can now see around as well as find your smartphone in this unforeseen situation.
Advertisement
Spotify and YouTube Music
Syeda Laiba Alam/SlashGear
If life feels incomplete to you without your favorite music playing in the background, link up Spotify or Google Music to the Gemini app. Ask Gemini to play a song for a certain mood or fetch one from your playlists when the phone is out of your hand’s reach. Discover new songs and artists or create a curated playlist for your study session in YouTube Music, all with the help of this smart assistant. Unfortunately, the Spotify extension is not quite as well integrated and only lets you search for songs to play.
Advertisement
Still, there are plenty of impressive things you can get done with Gemini’s integrated music features, even at times when you vaguely remember a music video but not the exact name of the song. Hit the virtual AI with a prompt like, “Play a song where Zayn Malik and Sia feature together.” Gemini will then ask you to pick the media provider between Spotify and YouTube Music. Make a selection and receive a mix of songs in which the mentioned artists collaborated. Play to your liking and dance to the beat.
YouTube
Syeda Laiba Alam/SlashGear
Merging the YouTube extension with Google Gemini will save much of your time. Tell Gemini to get you the most relevant YouTube videos about what you want to learn or know more about. For instance, try “I bought a new BBQ grill. Show me a YouTube video on its assembly.” So how is this different from performing the same search in the YouTube app? Well, once again, you can do all this with Gemini without having to grab the phone.
Advertisement
However, there’s more that Gemini can do after you find the clip you want. Use the Ask About This Video feature in YouTube when you are running short on time but need to familiarize yourself with a concept super quick. So, if you have a Chemistry test in the next few minutes and cannot recall the steps to perform filtration, Gemini is there to the rescue! Pull up a video for filtration and summon Gemini by holding your phone’s Power or Home button, then tap the Ask About This Video button once it pops up to get a concise summary of the process in the blink of an eye.
OpenStax
13_Phunkod/Shutterstock
OpenStax is a resource goldmine. With the ability to source relevant academic material from open-source textbooks, this extension is perfect for undergraduates whose curriculum is incomplete without extensive research. The extension also comes in handy when you want to do last-minute revisions for concepts that you cannot mess up in the exam.
Advertisement
In a press release, Professor Richard G. Baraniuk, the founder and director of OpenStax, discussed how “content provided through AI learning tools should be accurate and inclusive. This integration with Gemini embodies these principles, providing another avenue for learners and educators to access our high-quality content through a trusted technology partner.” Unfortunately, the extension only works in the U.S. and for those who are 18 or older.
The extension allows Gemini to look up information in its extensive database of over 70 textbooks from Rice University’s educational resources that have been peer-reviewed and have open licenses. It brings a wealth of knowledge to the table for learners and educators alike.
Advertisement
WhatsApp
Primakov/Shutterstock
WhatsApp has established itself as a giant of digital communication in this era. Many of us a part of different group chats with your friends, classmates or work buddies hosted on the app. Google understood the importance of WhatsApp in a user’s life and designed a dedicated extension for the Gemini assistant.
Advertisement
Don’t feel like opening WhatsApp work groups after office hours? Instruct Gemini to write a message for the particular group in WhatsApp, for instance, saying you are out with the family. Review it and hit the Send button to deliver the text instantly.
Unfortunately, our testing has shown that the WhatsApp extension does not work very well for me compared to the other Google extensions. The call feature rings the contact immediately, but the texts sometimes take a few minutes before they are delivered to the receiver. On a few occasions, we had to manually open my WhatsApp app on the phone so the text could be delivered.
Cuando el CEO de Google, Sundar Pichai, suba al escenario en la Conferencia de desarrolladores de Google I/O 2025 la próxima semana para entregar sus comentarios de apertura, espere que dos cartas dominen la discusión: la IA.
La inteligencia artificial se ocupa de gran parte del enfoque en Google en estos días, con características de IA que llegan a través de múltiples productos, proyectos centrados en la IA que capturan gran parte de la atención y predicciones del público sobre el futuro de la IA que asume muchos de los pronunciamientos públicos de la compañía.
Ya sea que se dé cuenta o no, la inteligencia artificial está en todas partes. Se encuentra detrás de los chatbots con los que hablas en línea, las listas de reproducción que transmites y los anuncios personalizados que aparecen en tu desplazamiento. Y ahora está tomando una personalidad más pública. Piense en Meta AI, que ahora está integrado en aplicaciones como Facebook, Messenger y WhatsApp; o Géminis de Google, trabajando en segundo plano en las plataformas de la compañía; o Apple Intelligence, lanzando a través de iPhones ahora.
AI tiene una larga historia, volviendo a una conferencia en Dartmouth en 1956 que primero discutió la inteligencia artificial como una cosa. Los hitos en el camino incluyen Eliza, esencialmente el primer chatbot, desarrollado en 1964 por el informático del MIT Joseph Weizenbaum y, saltando 40 años, cuando la función de autocompleta de Google apareció por primera vez en 2004.
Luego llegó 2022 y el ascenso de Chatgpt a la fama. Los desarrollos generativos de IA y los lanzamientos de productos se han acelerado rápidamente desde entonces, incluidos Google Bard (ahora Gemini), Microsoft Copilot, IBM Watsonx.ai y los modelos de LLAMA de código abierto de Meta.
Desglosemos qué es la IA generativa, cómo difiere de la inteligencia artificial “regular” y si la Generación AI puede estar a la altura de las expectativas.
IA generativa en pocas palabras
En esencia, la IA generativa se refiere a sistemas de inteligencia artificial que están diseñados para producir un nuevo contenido basado en patrones y datos que han aprendido. En lugar de solo analizar números o predecir tendencias, estos sistemas generan salidas creativas como texto, música de imágenes, videos y código de software.
Algunas de las herramientas de IA generativas más populares en el mercado incluyen:
El principal entre sus habilidades, ChatGPT puede crear conversaciones o ensayos similares a los humanos basados en algunas indicaciones simples. Dall-E y MidJourney crean obras de arte detalladas a partir de una breve descripción, mientras que Adobe Firefly se centra en la edición y el diseño de imágenes.
Chatgpt / captura de pantalla por cnet
Ai eso no es generativo
No toda la IA es generativa. Si bien Gen AI se enfoca en crear contenido nuevo, la IA tradicional se destaca por analizar datos y hacer predicciones. Esto incluye tecnologías como el reconocimiento de imágenes y el texto predictivo. También se usa para soluciones novedosas en:
Ciencia
Diagnóstico médico
Pronóstico del tiempo
Detección de fraude
Análisis financiero para pronósticos e informes
La IA que venció a los grandes campeones humanos en el ajedrez y el juego de mesa no fue una IA generativa.
Es posible que estos sistemas no sean tan llamativos como la Generación AI, pero la inteligencia artificial clásica es una gran parte de la tecnología en la que confiamos todos los días.
¿Cómo funciona Gen AI?
Detrás de la magia de la IA generativa hay modelos de idiomas grandes y técnicas avanzadas de aprendizaje automático. Estos sistemas están capacitados en grandes cantidades de datos, como bibliotecas completas de libros, millones de imágenes, años de música grabada y datos raspados de Internet.
Los desarrolladores de IA, desde gigantes tecnológicos hasta nuevas empresas, son conscientes de que la IA es tan buena como los datos que lo alimenta. Si se alimenta de datos de baja calidad, la IA puede producir resultados sesgados. Es algo con lo que incluso los jugadores más grandes en el campo, como Google, no han sido inmunes.
La IA aprende patrones, relaciones y estructuras dentro de estos datos durante el entrenamiento. Luego, cuando se le solicita, aplica ese conocimiento para generar algo nuevo. Por ejemplo, si le pide a una herramienta Gen AI que escriba un poema sobre el océano, no solo extrae versos preescritos de una base de datos. En cambio, está usando lo que aprendió sobre la poesía, los océanos y la estructura del lenguaje para crear una pieza completamente original.
Chatgpt / captura de pantalla por cnet
Es impresionante, pero no es perfecto. A veces los resultados pueden sentirse un poco apagados. Tal vez la IA malinterpreta su solicitud, o se vuelve demasiado creativo de una manera que no esperaba. Puede proporcionar con confianza información completamente falsa, y depende de usted verificarla. Esas peculiaridades, a menudo llamadas alucinaciones, son parte de lo que hace que la IA generativa sea fascinante y frustrante.
Las capacidades generativas de IA están creciendo. Ahora puede comprender múltiples tipos de datos combinando tecnologías como el aprendizaje automático, el procesamiento del lenguaje natural y la visión por computadora. El resultado se llama IA multimodal que puede integrar alguna combinación de texto, imágenes, video y habla dentro de un solo marco, ofreciendo respuestas más contextualmente relevantes y precisas. El modo de voz avanzado de ChatGPT es un ejemplo, al igual que el proyecto Astra de Google.
Desafíos con IA generativa
No hay escasez de herramientas de IA generativas, cada una con su talento único. Estas herramientas han provocado la creatividad, pero también han planteado muchas preguntas además del sesgo y las alucinaciones, como, ¿quién posee los derechos del contenido generado por IA? O qué material es un juego justo o fuera de los límites para que las compañías de IA los usen para capacitar a sus modelos de idiomas; vea, por ejemplo, la demanda del New York Times contra Openai y Microsoft.
Otras preocupaciones, no son asuntos pequeños, implican privacidad, responsabilidad en la IA, los profundos profundos generados por IA y el desplazamiento laboral.
“Escribir, animación, fotografía, ilustración, diseño gráfico: las herramientas de IA ahora pueden manejar todo eso con una facilidad sorprendente. Pero eso no significa que estos roles desaparezcan. Simplemente puede significar que los creativos deberán mejorar y usar estas herramientas para amplificar su propio trabajo”, Fang Liu, profesor de la Universidad de Notre Dame Dame y Coeditor-Chief de las transacciones de ACM en las transacciones de Probabilista, contó el aprendizaje en el poderoso de la máquina probabilística, le dijo a Cetnet.
“También ofrece una forma para las personas que tal vez carecen de la habilidad, como alguien con una visión clara que no puede dibujar, pero que puede describirlo a través de un aviso. Así que no, no creo que interrumpa a la industria creativa. Con suerte, será una co-creación o un aumento, no un reemplazo”.
Otro problema es el impacto en el medio ambiente porque la capacitación de grandes modelos de IA utiliza mucha energía, lo que lleva a grandes huellas de carbono. El rápido ascenso de la Generación AI en los últimos años ha acelerado las preocupaciones sobre los riesgos de la IA en general. Los gobiernos están aumentando las regulaciones de IA para garantizar el desarrollo responsable y ético, especialmente la Ley de IA de la Unión Europea.
Recepción de IA generativa
Muchas personas han interactuado con los chatbots en el servicio al cliente o han utilizado asistentes virtuales como Siri, Alexa y Google Assistant, que ahora están en la cúspide de convertirse en Gen AI Power Tools. Todo eso, junto con las aplicaciones para ChatGPT, Claude y otras herramientas nuevas, es poner ai en sus manos. Y la reacción pública a la IA generativa se ha mezclado. Muchos usuarios disfrutan de la conveniencia y la creatividad que ofrece, especialmente para cosas como escribir ayuda, creación de imágenes, soporte de tareas y productividad.
Mientras tanto, en la encuesta global de IA 2024 de McKinsey, el 65% de los encuestados dijo que sus organizaciones usan regularmente IA generativa, casi el doble de la cifra reportada solo 10 meses antes. Industrias como la atención médica y las finanzas están utilizando Gen AI para racionalizar las operaciones comerciales y automatizar tareas mundanas.
Como se mencionó, existen preocupaciones obvias sobre la ética, la transparencia, la pérdida de empleos y el potencial del mal uso de los datos personales. Esas son las principales críticas detrás de la resistencia a aceptar la IA generativa.
Y las personas que usan herramientas de IA generativas también encontrarán que los resultados aún no son lo suficientemente buenos para el tiempo. A pesar de los avances tecnológicos, la mayoría de las personas pueden reconocer si el contenido se ha creado utilizando Gen AI, ya sean artículos, imágenes o música.
AI ha secuestrado ciertas frases que siempre he usado, por lo que debo autocorrectar mi escritura a menudo porque puede parecer una IA. Muchos artículos escritos por AI contienen frases como “en la era de”, o todo es un “testimonio de” o un “tapiz de”. La IA carece de la emoción y la experiencia que viene, bueno, ser una vida humana y viviente. Como explicó un artista en Quora, “lo que AI hace no es lo mismo que el arte que evoluciona de un pensamiento en un cerebro humano” y “no se crea a partir de la pasión que se encuentra en un corazón humano”.
AI generativa: vida cotidiana
La IA generativa no es solo para técnicos o personas creativas. Una vez que obtienes la habilidad de darle indicaciones, tiene el potencial de hacer gran parte del trabajo preliminar por ti en una variedad de tareas diarias.
Digamos que está planeando un viaje. En lugar de desplazarse por páginas de resultados de búsqueda, le pide a un chatbot que planifique su itinerario. En cuestión de segundos, tiene un plan detallado adaptado a sus preferencias. (Ese es el ideal. Por favor, verifique siempre sus recomendaciones).
Un propietario de una pequeña empresa que necesita una campaña de marketing pero que no tiene un equipo de diseño puede usar una IA generativa para crear imágenes llamativas e incluso pedirle que sugiera copia publicitaria.
Chatgpt / captura de pantalla por cnet
Gen Ai está aquí para quedarse
No ha habido un avance tecnológico que haya causado tal boom desde Internet y, más tarde, el iPhone. A pesar de sus desafíos, la IA generativa es innegablemente transformadora. Está haciendo que la creatividad sea más accesible, ayudando a las empresas a racionalizar los flujos de trabajo e incluso inspirar formas completamente nuevas de pensar y resolver problemas.
Pero quizás lo más emocionante es su potencial, y estamos rascando la superficie de lo que estas herramientas pueden hacer.
Preguntas frecuentes
¿Cuál es un ejemplo de IA generativa?
ChatGPT es probablemente el ejemplo más popular de IA generativa. Le das un aviso y puede generar texto e imágenes; Código de escritura; Responder preguntas; resumir el texto; borrador de correos electrónicos; y mucho más.
¿Cuál es la diferencia entre la IA y la IA generativa?
La IA generativa crea contenido nuevo como texto, imágenes o música, mientras que la IA tradicional analiza los datos, reconoce patrones o imágenes y hace predicciones (por ejemplo, en medicina, ciencia y finanzas).
Si busca “CHATGPT” en su navegador, es probable que se tope en sitios web que parecen estar alimentados por OpenAI, pero no lo son. Uno de esos sitios, chat.chatbotapp.ai, ofrece acceso a “GPT-3.5” de forma gratuita y utiliza marca familiar.
Pero aquí está la cosa: no está dirigida por OpenAi. Y, francamente, ¿por qué usar un GPT-3.5 potencialmente falso cuando puedes usar GPT-4O de forma gratuita en el actual ¿Sitio de chatgpt?
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.