Google ha estado implementando las funciones de video visuales de Astrapodered de Gemini Live muy lentamente, pero está empezando a expandirse. Esto es lo que es usar y lo que necesita saber.
La compañía sugiere que la llegada de la cámara y los controles para compartir la pantalla son parte de una “caída de píxeles de abril 2025”, pero un conjunto de características no programados se siente extraño dado que la función funcionará en prácticamente cualquier teléfono Android.
Cuando inicia la aplicación Gemini en su teléfono Android, una ventana emergente indicará que las funciones Astra-Powered de Gemini Live están listas para probar. La mini ventana emergente dice que puede “hablar sobre ideas, aprender sobre su entorno” o “obtener ayuda con lo que está en su pantalla”. Este último se refiere a la función de intercambio de pantalla, que es como una versión mejorada de Circle to Search.
Para acceder a cualquiera de los nuevos modos visuales, necesitará un plan de suscripción avanzado de Google One AI. Si tiene un Pixel 9 Pro, Pro XL, Pro Fold o algunos modelos Galaxy S25, habrá recibido una prueba gratuita sustancial de este nivel pagado. La prueba es de 12 meses en los modelos Pixel 9 Pro y 6 meses en dispositivos S25.
Google nos ha dado un par de formas de acceder a los nuevos controles. Lo más fácil es a través de la aplicación Gemini dedicada. Cuando lance Gemini Live, la interfaz de usuario de estilo de llamada habitual ganará un par de botones adicionales. Hay un botón de cámara y un icono de presentación.
Puedes usar tu voz con la frase de Wake “Hey, Google”. Sobre la barra emergente compacta de Géminis, verá un botón de aquistar “Compartir con Live” que comenzará a compartir la pantalla con IA. Todavía no puede seleccionar una sola aplicación. En cambio, debe compartir toda su pantalla. Esto podría ser intrusivo para algunas personas. Un chip de barra de estado indicará que esto está activo. Tocar le permite cerrar o terminar su sesión rápidamente.
¿Cómo es usar?
El inicio e introducción inicial es muy rápido, pero el visor se abre y es muy fácil de descifrar. Algo imita la interfaz de usuario de la cámara de píxeles, por lo que es instantáneamente familiar para alguien que ha usado los teléfonos de Google por un tiempo. No tienes que usar la cámara trasera. Hay una alternancia para cambiar a la cámara selfie si desea ponerse a sí mismo oa su fondo en el marco y hacer preguntas o consejos.
Al usar el modo Gemini Live Astra, descubrí que el enfoque en la cámara es un poco quisquilloso, ya que las lentes que cambian automáticamente pueden ser molestas. Le aconseja que se quede quieto o mantenga el tema lo más quieto posible. Puedo dar fe de esto, pero a pesar de que algunos sujetos no están enfocados, Gemini se apresura a determinar qué es o producir información sin demasiada dificultad.
No poder acercarse, incluso con teleobjetos dedicados en su teléfono también se siente miope. Si quieres señalar algo en el mundo, tendrás que ponerse muy cerca, o esperas que Géminis pueda calcular a lo que estás señalando.
Para consultas simples o básicas, es perfectamente adecuado. Sin embargo, los mejores casos de uso son para preguntas más profundas como ayuda o asesoramiento sobre objetos, áreas y ubicaciones en lugar de hacer cosas simples que probablemente podría buscar.
Un excelente ejemplo es obtener la fecha calórtica sobre los alimentos o la información de alérgenos. Incluso probé algunas traducciones en tiempo real, pero aunque parecían ser bastante precisas, Gemini Live no da ni muestra texto en pantalla. Solo obtienes señales de audio y respuestas. Google Lens se superpone al texto traducido, por lo que puede ser una mejor opción para traducir señales, texto y más.
Por el momento, debe esperar hasta cerrar una sesión antes de poder “ver” algunas de las respuestas basadas en texto. Entonces obtienes un registro de chat de lo que se dijo, lo que Gemini respondió y cualquier acción que puedas tomar. Esto podría ser un poco mejor implementado, pero por ahora está bien. En conjunto con otras aplicaciones como Google Maps y varios otros servicios, probablemente podría usar esto como una opción de ayuda o tutorial de aprendizaje visual.
Probé las funciones de video de estilo Astra de Gemini Live en el Pixel 9 Pro XL, y aunque no siempre fue instantáneo, se sintió bastante suave, y las respuestas casi siempre fueron lo suficientemente rápidas como para sentirse fluidos.
El intercambio de pantalla se siente un poco menos “natural” que usar una cámara. Debido a que no recibe comentarios visuales, simplemente señales e información de audio, no se siente integrado de la misma manera. Obtener resúmenes de la página web es sobre el alcance de la usabilidad de la función o obtener más información sin salir de una página o pantalla. Apuesto a que esto cambiará a medida que obtengamos más integraciones. Piense en la capacidad de agregar cosas a las listas de compras con URL o información de vuelo a su calendario al hacer planes de viaje. No podemos hacer nada de eso todavía.
Precisión y otras consideraciones
Como casi todas las plataformas de IA, Gemini no es un sistema perfecto. De hecho, puede equivocarse en muchos escenarios. Donde lo hace bien es con el retiro de información.
Descubrí que ciertos elementos causaban problemas en los que Gemini no podía darme información precisa. Esto va a estar bien para las cosas que sabes, y puedes interrumpir efectivamente y corregir el curso de la IA rebelde. El problema aquí es que las alucinaciones sobre cosas que quizás no sepa todo lo que bien podría conducir a problemas.
Por ejemplo, pregunté sobre un cartucho de juego de Gameboy, y Gemini identificó erróneamente el carro y me dio información muy incorrecta sobre el título y el juego. Asegurarse de tener una visión clara de algo dentro del visor ayuda a mitigar esto. Simplemente ajustar dónde “filmé” resolvió instantáneamente el problema sin intervención. Simplemente no puede confiar en la información a ciegas en esta etapa. Géminis todavía es propenso a los errores, y varían de menor a especialización en igual medida.
La cámara del mundo … con advertencias
Android XR y la plataforma AR dependerán en gran medida de Gemini como el medio para interactuar y obtener información sobre el mundo que nos rodea. Gemini Live utilizando funciones Astra es el primer paso para darse cuenta de ese objetivo final. Según las demostraciones que se muestran a fines del año pasado, podríamos estar a unos años de las gafas AR fabricadas en Google, pero esta introducción temprana no es una mala manera de comenzar.
Al igual que cualquier producto de IA, tenga cuidado al 100% de su confianza en la información. Dicho esto, esto parece un gran comienzo y una forma sólida de interactuar con el mundo que te rodea o ayudarte cuando te quedas atascado. Mejorará con el tiempo y mejorará a medida que se introduzcan más puntos de datos, por lo que al menos en teoría, es lo peor que los modos de video en vivo de Gemini, lo que no es tan malo para empezar.
Compartir su pantalla es muy limitada en esta etapa, y aunque es una buena opción secundaria, es aún más limitado. Si puede desarrollarse para jugar bien con más de sus otros servicios, será una herramienta útil. En este momento, es un truco de salón que hace poco más que Gemini Regular.
FTC: Utilizamos ingresos que ganan enlaces de afiliados para automóviles. Más.
En el mundo de los coleccionables, ha habido una clara tendencia hacia la integración de la tecnología y la cultura pop. Si bien las figuras de acción han sido durante mucho tiempo un favorito entre los entusiastas, la aparición de coleccionables impulsados por la tecnología, como la figura de acción ChatGPT, marca una nueva era. Combinando la inteligencia artificial con el atractivo tradicional de las figuras de acción, este coleccionable está ganando rápidamente popularidad entre los entusiastas de la IA y los aficionados a la cultura pop. Pero, ¿qué hace que la cifra de acción de ChatGPT sea tan especial, y por qué está surgiendo como un elemento de coleccionista imprescindible en la era digital?
El surgimiento de los coleccionables inspirados en la tecnología
En las últimas décadas, el mundo de los coleccionables se ha expandido mucho más allá de las figuras y juguetes de acción tradicionales. Con el surgimiento de nuevas tecnologías, como la inteligencia artificial (IA) y la realidad virtual (VR), los productos que integran estos avances están comenzando a capturar la imaginación de una nueva generación de coleccionistas. La cifra de acción de ChatGPT, por ejemplo, no es solo un juguete, sino una pieza de declaración que representa la tecnología de AI de vanguardia.
Incorporar elementos del mundo de la inteligencia artificial en una figura tangible e interactiva es una forma única de sacar la IA de la vida abstracta y cotidiana. Este tipo de coleccionable ayuda a humanizar la tecnología que está remodelando las industrias en todo el mundo, lo que hace que la IA sea más identificable y atractiva para personas de todas las edades.
¿Qué hace que la figura de acción de Chatgpt se destaque?
Entonces, ¿qué distingue a la figura de acción de ChatGPT de la mercancía tradicional con temática tecnológica? Aquí hay algunas características que lo convierten en un coleccionable excepcional:
Diseño elegante y futurista
La figura de acción de ChatGPT cuenta con un diseño elegante y minimalista que refleja la naturaleza futurista de la IA. Con acentos brillantes, contornos suaves y una interfaz detallada en su pecho que representa las capacidades de IA, la figura se destaca como un símbolo de tecnología e innovación. Ya sea que se muestre en un estante o que se use para jugar, muestra la fusión de la creatividad humana y la tecnología avanzada.
Características interactivas
A diferencia de las figuras de acción típicas, la figura de acción de ChatGPT puede comprometerse con sus propietarios de una manera significativa. Con la capacidad de “hablar” u ofrecer trivia sobre la inteligencia artificial, proporciona una experiencia interactiva que mejora su valor como una herramienta de juguete y una herramienta educativa. Esta interacción fomenta una conexión más profunda con el tema de la IA y la curiosidad de las chispas.
Valor del coleccionista
A medida que AI continúa evolucionando, la figura de acción de ChatGPT es un símbolo de esta emocionante era. No se trata solo de la figura física en sí; Representa un momento cultural. Esto hace que la figura sea un elemento altamente coleccionable, especialmente a medida que la popularidad de la IA crece y se integra más en varios aspectos de la sociedad. Los coleccionistas que ven el valor de poseer algo que simboliza el futuro de la tecnología puede encontrar que esta cifra es una adición preciada a sus colecciones.
Atraer tanto a los entusiastas de la IA como a los fanáticos de la cultura pop
Los entusiastas de la IA y los amantes de la tecnología sin duda apreciarán la complejidad y el diseño de la figura de acción de ChatGPT, pero también tiene un atractivo masivo para los fanáticos de la cultura pop. La creciente influencia de la IA en películas, programas de televisión y juegos hace que los productos relacionados con la IA sean cada vez más relevantes. Al combinar el mundo de los coleccionables con un tema tecnológico, la figura de acción de ChatGPT sirve como un puente entre dos bases de fanáticos distintas: aquellos apasionados por la tecnología y aquellos que admiran los recuerdos de la cultura pop.
Figuras de acción de Chatgpt: una nueva herramienta educativa
Uno de los aspectos más emocionantes de los coleccionables inspirados en AI es su potencial de educación. La figura de acción de ChatGPT, aunque es un elemento divertido y coleccionable, también sirve como una herramienta para presentar a las personas, especialmente al público joven, a las maravillas de la inteligencia artificial.
Para los niños, jugar con tal figura puede despertar un interés en la IA y sus posibles aplicaciones. A través de la narración de historias o el diálogo interactivo, los niños pueden aprender sobre cómo funciona la IA y qué significa para su futuro. Además, la figura de acción de ChatGPT fomenta la creatividad, lo que permite a los usuarios participar en un juego imaginativo mientras desarrollan una comprensión más profunda de los conceptos de IA.
Como herramienta educativa, la figura de acción de ChatGPT puede complementar el creciente número de recursos educativos que tienen como objetivo desmitificar la IA. Por ejemplo, puede combinar esta figura de acción con otros recursos que profundizan en la tecnología de IA o explorar las mejores herramientas de IA disponibles para tareas creativas, como los generadores de imágenes de IA. Explore más sobre los mejores generadores de imágenes de IA aquí. Al vincular la tecnología con los elementos cotidianos, como las cifras de acción, los alumnos jóvenes están expuestos a conceptos importantes que pueden dar forma a sus carreras profesionales en el futuro.
El atractivo del coleccionista: una inversión futura
En el mundo de los artículos coleccionables, la rareza y la importancia cultural a menudo determinan el valor. La figura de acción de ChatGPT todavía está en sus primeras etapas como un elemento coleccionable, pero a medida que AI continúa evolucionando y impregnando diferentes industrias, esta figura podría convertirse en un símbolo clave de la era digital. Al igual que las primeras cifras de acción de los populares programas de televisión o películas, la figura de acción de ChatGPT podría ver un aumento significativo en el valor a medida que la tecnología se integra más en la vida diaria.
Para los coleccionistas, esto representa una oportunidad para poseer un pedazo de historia. Imagine tener una figura de acción que simboliza uno de los avances tecnológicos más revolucionarios del siglo XXI. En los próximos años, los coleccionistas pueden mirar hacia atrás en esta pieza y verla como un artefacto valioso que representa el rápido aumento de la IA en la sociedad.
Además, a medida que se lanzan AI avances y nuevas versiones de la figura de acción de ChatGPT, los coleccionistas pueden encontrarse buscando expandir su colección con variantes de edición limitada, accesorios y actualizaciones. Esto hace que la cifra de acción de ChatGPT no solo sea una inversión coleccionable sino a largo plazo en el mundo de los recuerdos impulsados por la tecnología.
Dónde encontrar la figura de acción de chatgpt
Actualmente, la cifra de acción de ChatGPT está disponible en mercados selectos en línea, tiendas tecnológicas y tiendas coleccionables especializadas. Dada la creciente demanda de mercancías relacionadas con la tecnología, la disponibilidad puede limitarse a medida que crece la popularidad de la figura. Los coleccionistas que deseen tener una de estas figuras más temprano que tarde deben vigilar las opciones oficiales de lanzamiento y pre-pedido para asegurar una pieza de este nuevo y emocionante producto.
Por qué la recolección de figuras de acción con temática AI-AI tiene sentido
A primera vista, las cifras de acción de recolección pueden parecer un pasatiempo reservado para los fanáticos de los superhéroes o la ciencia ficción. Sin embargo, los coleccionables inspirados en AI como la figura de acción ChatGPT aportan una nueva capa de significado a la práctica. Estas figuras representan una conexión entre el mundo digital y los objetos físicos, cerrando la brecha entre la tecnología y la vida cotidiana tangible.
El futuro de la IA es emocionante, y se está convirtiendo en una parte integral de nuestra vida cotidiana. Al recolectar cifras de acción con temas de AI-AI, no solo expresan su admiración por la tecnología, sino que también están invirtiendo en un coleccionable que crecerá con importancia con el tiempo. Ya sea que se muestre en un estante, utilizado como una herramienta educativa, o disfrutada como una pieza de recuerdos de la cultura pop, la figura de acción de ChatGPT es una adición digna a cualquier colección.
Conclusión
La figura de acción de ChatGPT representa más que un solo juguete o coleccionable: es un vistazo al futuro de la tecnología y cómo continuará dando forma a nuestro mundo. A medida que AI se integra más en nuestra vida cotidiana, esta figura ofrece una conexión tangible con ese futuro, por lo que es un elemento emocionante y significativo para los entusiastas de la tecnología y los coleccionistas por igual.
Al combinar la educación, la tecnología y la cultura pop, la figura de acción de ChatGPT tiene el potencial de convertirse en un símbolo atemporal de la era digital. A medida que AI continúa evolucionando, la cifra solo puede crecer en valor, por lo que es una inversión para el futuro del mundo de la tecnología colectable. Ya sea que sea un coleccionista experimentado o un entusiasta curioso, la figura de acción de ChatGPT es imprescindible para cualquiera que quiera tener una parte del futuro hoy.
Como entrenador que ha estado viendo ChatGPT y AI se vuelven cada vez más prominentes en la industria del fitness, quería ponerlo a prueba. No es la primera vez: le pedí a Chat GPT que construyera un programa de entrenamiento de 4 semanas hace un tiempo, y tuve emociones mixtas sobre los resultados.
Más de dos años después, e incluso más adelante en la línea de desarrollo de IA, decidí ponerlo a prueba nuevamente. Esta vez, pedí una rutina de movilidad de la cadera de 15 minutos que pudiera hacer desde casa usando solo una de las mejores esteras de yoga como equipo. Le expliqué que me considero hacia el extremo avanzado de la escala de movilidad y dejo que haga lo suyo.
[Image created via OpenAI’s image generation technology]
“Estamos en la cúspide de sistemas que pueden hacer una nueva ciencia”.
Esa línea, en la página 3 del último “Marco de preparación” de OpenAI (versión 2, actualizada el 15 de abril de 2025), señala un posible cambio de paradigma para el ecosistema de I + D, que rápidamente está pasando de ser una etapa interna ansiosa, si no siempre precisa, a una colega potencial de AA, o incluso un investigador principal.
Mirando hacia el futuro, el marco lidia con el potencial de la IA para convertirse en “mejorando recursivamente”. Advierte que la “aceleración importante en la tasa de IA I + D” podría introducir rápidamente nuevas capacidades y riesgos. Esta aceleración podría superar las medidas de seguridad actuales, haciendo que la supervisión sea “insuficiente” y marcando explícitamente el peligro de perder el “mantenimiento del control humano” sobre el sistema de IA.
Hablando en un evento de Goldman Sachs solo unas semanas antes, el 5 de marzo (lanzado el 11 de abril en YouTube), la directora financiera de Operai Sarah Friar reforzó este punto de vista, afirmando que los modelos ya están “presentando cosas novedosas en su campo” y superando simplemente reflejando el conocimiento existente para “extender eso”. Friar señaló además el rápido enfoque hacia la inteligencia general artificial (AGI), lo que sugiere “Podemos estar allí”.
Si bien reconoce el debate en curso con algunos expertos que se balancean incluso en el término AGI y mucho menos su viabilidad, al menos con modelos de idiomas grandes), Friar mencionó la opinión del CEO Sam Altman de que la inteligencia general artificial (AGI), la IA que maneja el trabajo humano más valioso, podría ser “inminente”. Esto sugiere que la transición de la IA como herramienta para los investigadores de la IA como investigador puede estar más cerca de lo que muchos se dan cuenta, con primeros ejemplos potencialmente emergentes en campos como el desarrollo de software.
Las principales instituciones de I + D están construyendo activamente capacidades de ‘investigación autónoma’. Por ejemplo, los laboratorios nacionales como Argonne y Oak Ridge están desarrollando ‘laboratorios autónomos’ diseñados específicamente para la ciencia y la química de los materiales. Los Alamos también está trabajando con OpenAi Probar sus modelos de razonamiento en Energía y Aplicaciones de Seguridad Nacional en su supercomputadora de Venado.
En general, los laboratorios nacionales están explorando el uso de IA para asumir tareas de investigación básicas: generar hipótesis (a menudo a través de estrategias de optimización), diseñar experimentos de varios pasos, controlar la ejecución robótica, analizar los resultados en tiempo real e iterando hacia objetivos de descubrimiento con una intervención humana significativamente reducida dentro de dominios operativos específicos. Si bien aún requiere supervisión humana para la validación y la dirección estratégica, que funciona quizás en un ‘nivel 3’ o ‘nivel 4’ emergente de la autonomía de la investigación, tales iniciativas demuestran que la IA se va más allá del análisis de datos pasivos para participar directamente en el proceso de descubrimiento científico. Esto se extiende más allá de la construcción de sistemas integrados; Implica empoderar directamente a los investigadores, como se ve en el reciente Doe ‘1,000 científico Ai Jam’. Esta colaboración a gran escala reunió a unos 1.500 científicos en múltiples laboratorios nacionales, incluido Argonne, para probar modelos avanzados de razonamiento de IA de compañías como OpenAi y Anthrope en problemas científicos del mundo real. Los investigadores exploraron específicamente su potencial para mejorar las tareas como la generación de hipótesis y la automatización del experimento.
Una transición similar ya está en marcha en el desarrollo de software, aunque los desarrolladores actualmente tienen vistas mixtas sobre el potencial de las herramientas habilitadas para Genai. La IA de hoy a menudo sirve como asistente, pero la tecnología está aumentando rápidamente su juego de software, especialmente para lenguajes comunes que van desde Javascript hasta Python. Los modelos de OpenAI están demostrando un progreso significativo, “acercándose a nivel humano” en puntos de referencia clave, y Fray señaló que uno ya es “literalmente el mejor codificador del mundo”. Esto respalda el potencial fraile descrito para un “ingeniero de software de agente”, una IA que “puede salir y trabajar de forma independiente para usted”, incluidas la construcción, las pruebas y las aplicaciones de documentación. Esta evolución hacia capacidades más autónomas podría remodelar el campo por completo.
AI de 5 niveles de Openai marco de madurez
Según los informes, Operai utiliza un marco interno de cinco niveles para comparar su progreso hacia la inteligencia general artificial (AGI). Esta estructura, discutida dentro de la compañía a mediados de 2024 y luego informada por puntos de venta como Bloomberg, describe distintas etapas de capacidad de IA:
Nivel 1: Chatbots / AI conversacional: Sistemas expertos en el lenguaje natural, como Chatgpt.
Nivel 2: razonadores: AI capaz de resolver problemas básicos comparables a un humano altamente educado. En este nivel, los modelos también pueden demostrar habilidades de razonamiento emergentes sin herramientas externas.
Nivel 3: Agentes: Sistemas de IA autónomos que pueden administrar tareas complejas y tomar decisiones durante períodos prolongados en nombre de los usuarios.
Nivel 4: Innovadores: La IA contribuye significativamente a la creatividad y el descubrimiento generando ideas novedosas, ayudando a la invención o impulsando los avances.
Nivel 5: Organizaciones: La etapa del ápice donde la IA puede gestionar y operar las funciones complejas de toda una organización, potencialmente excediendo la eficiencia humana.
En general, los laboratorios nacionales están explorando el uso de IA para asumir tareas de investigación básicas: generar hipótesis (a menudo a través de estrategias de optimización), diseñar experimentos de varios pasos, controlar la ejecución robótica, analizar los resultados en tiempo real e iterando hacia objetivos de descubrimiento con una intervención humana significativamente reducida dentro de dominios operativos específicos. Si bien aún requiere supervisión humana para la validación y la dirección estratégica, que funciona quizás en un ‘nivel 3’ o ‘nivel 4’ emergente de la autonomía de la investigación, tales iniciativas demuestran que la IA se va más allá del análisis de datos pasivos para participar directamente en el proceso de descubrimiento científico. Esto se extiende más allá de la construcción de sistemas integrados; Implica empoderar directamente a los investigadores, como se ve en el reciente Doe ‘1,000 científico Ai Jam’. Esta colaboración a gran escala reunió a unos 1.500 científicos en múltiples laboratorios nacionales, incluido Argonne, para probar modelos avanzados de razonamiento de IA de compañías como OpenAi y Anthrope en problemas científicos del mundo real. Los investigadores exploraron específicamente su potencial para mejorar las tareas como la generación de hipótesis y la automatización del experimento.
Una transición similar ya está en marcha en el desarrollo de software, aunque los desarrolladores actualmente tienen vistas mixtas sobre el potencial de las herramientas habilitadas para Genai. La IA de hoy a menudo sirve como asistente, pero la tecnología está aumentando rápidamente su juego de software, especialmente para lenguajes comunes que van desde Javascript hasta Python. Los modelos de OpenAI están demostrando un progreso significativo, “acercándose a nivel humano” en puntos de referencia clave, y Fray señaló que uno ya es “literalmente el mejor codificador del mundo”. Esto respalda el potencial fraile descrito para un “ingeniero de software de agente”, una IA que “puede salir y trabajar de forma independiente para usted”, incluidas la construcción, las pruebas y las aplicaciones de documentación. Esta evolución hacia capacidades más autónomas podría remodelar el campo por completo.
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.