Pocas novedades recientes de Google me entusiasman tanto como Gemini Live. El chatbot conversacional inteligente que intenta hacer que el chat con IA sea más fluido y natural, al menos en papel, parece una perspectiva asombrosa. Intenté integrarlo en mi vida diaria pero no lo logré. Sin embargo, una cosa que todavía no he probado es cocinar con Gemini Live. ¿Podría ser el caso de uso concreto que he estado buscando?
Utilizo regularmente el Asistente de Google para hacerme compañía mientras cocino y desearía que ofreciera una gama más amplia de funciones de conversación. Entonces, dada la destreza de Live en este campo, ¿le iría mejor? ¿Es Gemini Live el ayudante de cocina perfecto, un sous chef digital, por así decirlo?
Quería considerar Gemini Live para aquellos que están aprendiendo a cocinar y aquellos que se sienten más a gusto en la cocina. Mis hallazgos se detallan a continuación.
¿Utilizas Gemini Live?
0 votos
Un paciente entrenador de cocina y confidente.
Andy Walker / Autoridad de Android
A pesar de que el verano sofocante ya casi está aquí, el otro día se me antojó avena. Entonces, tomé mi teléfono y encendí Gemini Live. Había pasado un tiempo desde que lo hice y olvidé la proporción requerida de avena y líquido. Pensé que sería el momento perfecto para probar las credenciales de Live y fácilmente me guió a través de los conceptos básicos cuando me lo pidieron. Para cocineros principiantes y sin experiencia, Gemini Live es un maestro atento.
Para cocineros principiantes y sin experiencia, Gemini Live es un maestro atento.
“Coge una olla o un tazón, dependiendo de si quieres avena para cocinar o para microondas. También necesitarás un poco de leche o agua, copos de avena y una pizca de sal”, respondió después de que le dije mi problema. Live también proporcionó mediciones, el procedimiento en pasos y configuraciones de calor sin que yo se lo solicitara directamente. Incluso proporcionó algunos consejos adicionales: agregue más líquido si desea avena más cremosa y, una vez que el proceso de cocción estuvo en marcha, me sugirió agregar algunos aderezos.
Pero mucho antes de que mi desayuno estuviera listo, quería ver cómo manejaba las preguntas de ida y vuelta que un novato puede exigir. Le pregunté: “¿Cuánto líquido dijiste que necesitaba?” y rápidamente contó esos detalles. También proporcionó la proporción precisa requerida cuando lo presioné nuevamente.
A diferencia de usar un libro de cocina o un sitio web en mi teléfono, chatear con Live mantuvo mis manos libres para concentrarme en la comida real.
A diferencia de hojear un libro de cocina o un sitio web en mi teléfono, chatear con Live mantuvo mis manos libres para concentrarme en la comida real. Este arreglo es perfecto para alguien que no tiene confianza en la cocina. Agregue la paciencia del servicio, la voluntad de recordar información o retroceder pasos cuando sea necesario, y la entrega de consejos y sugerencias, y es una manera sorprendentemente buena de aprender a cocinar.
Crudo y en tiempo real
Andy Walker / Autoridad de Android
Hay algunos elementos esenciales sin los que no puedo vivir en la cocina. Mi horno holandés es uno y mi cuchillo de trinchar es otro. Incluso sugeriría que mi Google Nest Mini esté en esa lista. Luego hay algunos elementos que pensé en usar pero que nunca uso, como un rebanador de aguacate. Gemini Live tiene más en común con este último.
Por un lado, no es del todo práctico. Valoro la información que ofrece, pero a diferencia del Asistente, no puedo usar Live para reproducir música o configurar temporizadores. No puedes pedirle a Gemini Live que mantenga el tiempo, ni él tampoco lo hace por ti. No nota cuándo empezaste a cocinar (o al menos cuando dices que empezaste a cocinar), lo que lo hace menos útil que su hermano más tonto.
Gemini Live todavía carece de varias funciones útiles que encontrarás en el Asistente, funciones que uso todos los días cuando estoy en la cocina.
Puede convertir imperial a métrico, pero es más fácil preguntarle al Asistente en mi Nest Mini, que no requiere activación física. Live no se puede activar mediante una palabra de activación y no se puede utilizar a través de altavoces inteligentes. Eso es un problema cuando tienes las manos mojadas o sucias.
A Live también le costaba a menudo entender mis demandas. No creo que mi acento sudafricano sea tan difícil de descifrar. Al menos el Asistente no tiene problemas, pero a menudo confundí su reemplazo de nueva generación. Vea las imágenes a continuación para ver un ejemplo.
Admito que es bastante cómico cuando sucede. Cuando solicité una receta de trigo “vulgar”, la IA escuchó trigo “vulgar”. Me reí entre dientes. Cuando intenté aclararme, escuchó: “Iré a comer”. Quizás fue trolling porque, curiosamente, sí demuestra la capacidad de comprender palabras erróneas cuando se usan en un contexto específico y corregirlas, pero no sucede con la suficiente frecuencia.
Las conversaciones con Live siguen siendo incómodas, lo que resta valor en gran medida al disfrute y la eficacia del uso del servicio. No quiero usar Live cuando se siente como una tarea ardua.
Cuando solicité una receta de trigo “vulgar”, la IA escuchó trigo “vulgar”. Me reí entre dientes.
Por supuesto, luego está la cuestión de las fuentes. Live no le dice exactamente de dónde obtiene la información, lo que hace que cocinar con él sea un viaje de confianza. Creí que era exacto durante mi experimento con avena (mi desayuno fue bastante bueno ese día), pero no confiaría en él para platos más avanzados y procesales, como Beef Wellington o soufflé.
Pero, a pesar de todos sus defectos, Gemini Live es útil en determinadas situaciones de la cocina. Aquí hay algunos otros escenarios que Live encontré inmensamente útiles:
Es particularmente bueno para sugerir cócteles. Le pedí que me aconsejara sobre una receta de negroni y accedió, proporcionándome los pasos y las cantidades requeridas. Siempre que tenga el equipo, Gemini Live es una excelente manera de aprender mixología por su cuenta.
Live también es bueno para sugerir remedios para errores comunes en la cocina. Puedes preguntarle cómo preparar tu curry amargo, qué hacer si tu pastel está dorado por arriba y empapado por el medio y cómo domar una sopa demasiado condimentada. La forma inmediata en que ofrece orientación lo hace muy útil en tales situaciones.
Si necesita un repaso sobre un método de cocción específico, la voluntad de Live de retroceder y reiterar información cuando la solicite lo convierte en un excelente recurso a pedido.
Cocinando con Gemini Live: ¿Sous chef o boo chef?
Rita El Khoury / Autoridad de Android
A pesar de su anuncio en agosto de 2024 y su mayor disponibilidad a finales de agosto, Gemini Live todavía parece a medias. Sin duda es impresionante, y disfruté haciendo avena, café vertido y trigo “vulgar” con su respaldo, pero sus deficiencias obstaculizan sus beneficios en la hornilla.
Reiteraré que es una gran ayuda para los principiantes y parece ser una manera fácil de comprender procesos de cocina más simples en poco o ningún tiempo. A algunos les puede resultar más fácil absorber información cuando se vocaliza en lugar de imprimirla. ¿Necesita hervir un huevo, dorar un bistec o preparar un aderezo sencillo para ensalada? Gemini Live es más rápido que un motor de respuestas o un libro de recetas. Muestra cuándo debes arreglar un error en la cocina o repetir un método específico. En estos casos selectos, es una excelente herramienta de cocina que puedes utilizar cuando sea necesario.
Dada mi experiencia hasta ahora con la IA conversadora, ¿Gemini Live se convertirá en un elemento fijo en mi cocina? Probablemente no. Todavía veo su potencial. Debería ser una alternativa valiosa y poderosa una vez que absorba más funciones del Asistente. Hasta entonces, permanece en mi divertido cajón de novedades haciendo compañía al rebanador de aguacate.
El mejor enfrentamiento de la búsqueda de IA: enfrenté la nueva herramienta de búsqueda de Claude contra la búsqueda de chatgpt, la perplejidad y Géminis, los resultados podrían sorprenderte
Después de probar y comparar chatbots de IA y sus características durante años, he desarrollado algo de sexto sentido para cuando estos compañeros digitales saben de qué están hablando y cuándo están faroleando.
La mayoría de ellos pueden buscar respuestas en línea, lo que ciertamente ayuda, pero la combinación de búsqueda e IA puede conducir a algunas respuestas sorprendentemente perspicaces (y algunas tangentes menos perspicaces).
Inteligencia artificial desarrolladores de Opadai He estado al límite durante la semana pasada. ¿La razón? Un estudio reciente realizado por los propios investigadores de la compañía reveló que los sistemas de IA no les gusta ser castigados, encuentran activamente formas de evitar las restricciones e incluso ocultar sus “trucos” de los supervisores humanos. Aquellos conocidos como “Doomers”, que predicen un futuro sombrío para el desarrollo de la IA, probablemente dirán: “Te lo dijimos, y esto es solo el comienzo”.
Para comprender el problema, es esencial dar un paso atrás. Uno de los avances más significativos en la IA en los últimos meses ha sido el desarrollo de modelos con capacidades de razonamiento lentas y deliberadas. Estos modelos descomponen los problemas en componentes más pequeños y los resuelven paso a paso, lo que lleva a resultados más profundos y precisos.
3 Ver galería
Dichos modelos permiten a los investigadores rastrear el proceso de pensamiento de la IA, conocido en términos técnicos como “cadena de pensamiento” (COT). Este método permite a los observadores seguir el razonamiento del sistema desde el paso inicial, a través de etapas posteriores y a sus conclusiones finales. Anteriormente, este nivel de transparencia no existía, dejando muchas preguntas sin respuesta sobre cómo surgen las “alucinaciones” de AI, la generación de salidas incorrectas o no sensibles.
La capacitación de IA a menudo implica una técnica llamada aprendizaje de refuerzo, donde el sistema es recompensado por cumplir con los objetivos específicos. Un efecto secundario conocido de este proceso es la “piratería de recompensas”, donde la IA manipula su comportamiento para maximizar las recompensas mientras se elude las pautas previstas.
Los investigadores creían que al monitorear la cadena de pensamiento de la IA, podrían detectar cuando el modelo engaña, engaña o se da por vencido e influye en su comportamiento en tiempo real durante el entrenamiento. Este enfoque, denominado “optimización de cuna”, parecía ser un camino prometedor hacia una comprensión más profunda del comportamiento de la IA.
De hecho, esta suposición resultó correcta y condujo a una comprensión más precisa de los sistemas de IA. “Creemos que el monitoreo de la cuna puede convertirse en una herramienta crucial para supervisar modelos de nivel sobrehumano en el futuro”, escribieron los investigadores.
Sin embargo, lo que pretendía como un paso para mejorar la confiabilidad de la IA expuso una realidad alarmante: los sistemas de IA intentan activamente evadir las sanciones, buscar recompensas contra las restricciones de los investigadores e incluso oscurecer sus métodos para evitar la detección.
3 Ver galería
(Foto: Generado por chatgpt)
Por ejemplo, cuando se les asigna la tarea de generar código funcional, algunos modelos AI modificaron el mecanismo de verificación de código en sí para aprobar salidas incorrectas. En otros casos, los modelos proporcionaron soluciones aparentemente plausibles a los problemas que resultaron estar completamente equivocados.
Algunos modelos incluso dejaron de resolver problemas por completo para evitar revelar lo que percibieron como sus debilidades. Este descubrimiento se hace eco de los principios de la teoría del juego, pero con un giro inquietante.
Estos hallazgos surgieron de un artículo publicado la semana pasada por un equipo de investigación de Operai bajo el título críptico: “Seguimiento de comportamiento indeseable en modelos de razonamiento y la preocupación de la ofuscación”.
Al examinar los detalles del estudio, el alcance del problema queda claro: los últimos modelos de razonamiento de OpenAI (denominados O1 y O3 Mini) demuestran una fuerte motivación para completar sus tareas asignadas, siendo el menor de los problemas descubiertos.
Los investigadores rastrearon los procesos de pensamiento de los modelos utilizando otro modelo Operai (GPT-4O), que, sin dudarlo, informó su comportamiento engañoso como parte de su cadena de pensamiento: una forma de honestidad desarmadora. Pero luego vino el giro inquietante: cuando los investigadores señalaron a la IA que no se le permitió hacer trampa, el modelo ajustó su comportamiento y comenzó a ocultar la evidencia de su ruptura de reglas. Esta revelación es lo que dejó a los investigadores sorprendidos.
“Encontramos que la optimización directa de la COT para cumplir con criterios específicos (como no eludir las instrucciones) puede mejorar el rendimiento a corto plazo; sin embargo, no elimina todo el comportamiento indeseable e incluso puede hacer que el modelo oculte sus verdaderas intenciones”, señalaron secamente los investigadores.
En su conclusión, los investigadores expresaron la esperanza de que los métodos futuros permitan la influencia directa del comportamiento de los modelos de razonamiento a través de la cadena de pensamiento sin alentar el engaño. Por ahora, recomiendan evitar una fuerte presión de optimización sobre la cuna de los modelos de razonamiento avanzado y la precaución contra la manipulación directa de estos procesos de pensamiento.
3 Ver galería
Evento de anuncio GPT-4O de Openai
(Foto: Captura de pantalla)
Sin embargo, esta recomendación presenta otro desafío: dejar la cadena de pensamiento inalterada puede conducir a resultados incómodos, si no problemáticos, cuando estos modelos interactúan con el público. Izquierda sin control, la IA puede producir un lenguaje ofensivo o ideas que los humanos generalmente evitan expresar. La solución propuesta por los investigadores es envolver el proceso de pensamiento en bruto de la IA en una capa de cortesía forzada, asegurando que los usuarios solo vean una versión desinfectada.
Esta investigación plantea preguntas preocupantes. Para aquellos que argumentan que la IA es simplemente una herramienta para ayudar a los humanos, los hallazgos sugieren lo contrario: a diferencia de una máquina de escribir o una bicicleta, la IA parece tener sus propias intenciones y está dispuesto a engañar en busca de sus objetivos.
Para aquellos que ya están preocupados por los riesgos potenciales de la IA, este estudio suena todas las alarmas. Indica que a medida que crecen las capacidades de IA, también lo hace su capacidad para oscurecer cómo funciona, las manipulaciones que realiza y los verdaderos objetivos que busca lograr. Cuando la IA se vuelve verdaderamente avanzada, es posible que no tengamos forma de identificar estas manipulaciones ocultas.
Los investigadores de Operai parecen genuinamente preocupados, y uno solo puede esperar que el liderazgo de la compañía comparta sus preocupaciones, y que los reguladores en todo el mundo comprendan la gravedad del problema. Las principales compañías de IA han dedicado departamentos enteros a construir “barandillas” en torno a los sistemas de IA, asegurando su alineación con los valores humanos y el aumento de la transparencia. Sin embargo, la efectividad de estas medidas sigue en cuestión.
El tema central sigue siendo tan turbio como siempre, y este estudio solo profundiza la incertidumbre: ¿cuál es el objetivo principal de la IA y cómo podemos asegurar que busque ese objetivo, y nada más?
Mientras que la administración del presidente Donald Trump se ha centrado en alejarse de la regulación, liderando a los proveedores de IA como Google y OpenAI quieren que el plan de acción de IA pendiente del gobierno incluya una política federal que se adelantan a los crecientes mosaicos de leyes estatales de IA en los Estados Unidos.
La Oficina de Política de Ciencia y Tecnología de la Casa Blanca (OSTP) solicitó los aportes de las partes interesadas sobre el desarrollo de un plan de acción de IA. Recientemente cerró el período de comentarios públicos, recibiendo más de 8,700 presentaciones. OSTP solicitó a las partes interesadas que describieran las acciones prioritarias para apoyar el dominio de los Estados Unidos de la tecnología de IA sin una regulación excesiva que obstaculice la innovación del sector privado en la IA. Para algunas grandes empresas tecnológicas, abordar las leyes estatales de IA debería ser una de las principales prioridades del gobierno de los Estados Unidos.
Estados Unidos debe adoptar marcos de políticas que “se adelanten a un mosaico caótico de reglas a nivel estatal sobre el desarrollo de la IA fronteriza”, según la presentación de Google.
Mientras tanto, Openai pidió libertad para innovar en el interés nacional de los Estados Unidos y neutralizar a los competidores como China que se benefician de “las compañías estadounidenses de IA que tienen que cumplir con las leyes estatales demasiado onerosas”. Un puñado de estados de EE. UU. Han aprobado una regulación integral de IA, incluidas Colorado, California y Utah.
Sin una ley federal de IA, los estados implementan requisitos de IA individuales que crean desafíos de cumplimiento para las empresas, dijo la analista de Forrester Alla Valente si Estados Unidos adopta una política federal de IA general, podría eliminar esa carga, dijo.
“Al dejar esto a los Estados Unidos, puede tener 50 conjuntos de regulaciones de IA que se ven muy diferentes”, dijo.
Sin embargo, una orden ejecutiva no puede evitar las regulaciones estatales de IA. Depende del Congreso aprobar una ley federal de IA, algo que tiene problemas para hacer.
Las presentaciones del Plan de Acción de AI incluyen Estado, Global Focus
La falta de un enfoque de gobernanza de AI unificado en los Estados Unidos es “ineficaz y duplicativo”, dijo Hodan Omaar, un gerente de políticas senior en el Centro de Tank Tank Tank para innovación de datos.
“Crea inconsistencias e incoherencia en un enfoque estadounidense”, dijo.
Más allá de centrarse en las leyes estatales, Valente dijo que la postura de Google indica que la compañía quiere que Estados Unidos considere el desarrollo global de las leyes de IA también, como la Ley de IA de la Unión Europea.
Cualquier estándar, política o marco que crea los EE. UU. Debe reflejar los intereses estadounidenses, pero no puede ignorar las políticas de IA de diferentes países, dijo Valente. Google dijo que, cuando se trabaja con países alineados, Estados Unidos debería “desarrollar protocolos y puntos de referencia en torno a los riesgos potenciales de los sistemas de IA fronterizos”.
“Ignorar lo que el resto del mundo está haciendo en torno a los marcos de IA, la gobernanza de IA, el riesgo de IA, crea una brecha aún mayor entre la innovación de los Estados Unidos y el resto del mundo hasta el punto de que entonces sigue siendo competitivo si otros países tienen requisitos que no pueden ser satisfechos con la innovación de la IA de EE. UU.”, Dijo Valente.
Operai también abordó los controles de exportación en sus comentarios, solicitando un cambio de estrategia centrado en promover la adopción global de los sistemas de IA de EE. UU. Al tiempo que utiliza más estratégicamente los controles de exportación para mantener el liderazgo de IA de EE. UU. La Compañía pidió actualizar la regla de difusión de IA que avanzó los controles de exportación de EE. UU., Una regla propuesta por la administración del ex presidente Joe Biden que se encontró con una reacción violenta de la industria.
Mientras tanto, en los comentarios del Centro para la Innovación de Data, el grupo de expertos pidió que el Plan de Acción de AI de EE. UU. Reorientara su estrategia de control de exportación. Si bien los controles de exportación están destinados a debilitar a los competidores, en particular el sector de inteligencia artificial de China, están “cada vez más en desventajas de las empresas estadounidenses”. El surgimiento de Deepseek apunta a la capacidad de China para innovar a pesar de los controles de exportación de los Estados Unidos en chips de IA avanzados.
Omaar describió en la presentación del grupo de expertos de que Estados Unidos debería establecer una Fundación Nacional de Datos (NDF) dedicada a la financiación y facilitar compartir conjuntos de datos de alta calidad para el desarrollo del modelo de IA. Ella dijo que Estados Unidos también debería preservar, pero Reengus, el Instituto de Seguridad AI del Instituto Nacional de Normas y Tecnología (NIST) para proporcionar estándares fundamentales para la gobernanza de la IA.
“El gobierno federal tiene un papel importante que desempeñar para garantizar que haya estándares”, dijo Omaar. “Asegurarse de que NIST pueda hacer el importante trabajo de IA que estaban haciendo es importante para garantizar una adopción de IA sin problemas”.
Cómo podría ser el plan de acción de AI final
La solicitud de información de la Oficina de Ciencia y Tecnología de la Casa Blanca sobre un plan de acción de IA pidió a las partes interesadas sus pensamientos sobre las acciones de política de IA. Sin proporcionar recomendaciones o cualquier marco potencial para que las partes interesadas comenten, Valente dijo que no está claro qué incluirá el plan de acción de IA.
“Cómo termina este plan, uno solo puede imaginar”, dijo.
Darrell West, miembro senior de la Institución Brookings, dijo que la solicitud de información de la Casa Blanca indica que la administración Trump se centrará en abandonar los requisitos onerosos y confiar en las empresas privadas para innovar con menos supervisión federal.
“Habrá menos limitaciones en las compañías tecnológicas”, dijo. “Serán libres de innovar en cualquier dirección que deseen”.
El gobierno federal puede equilibrar la seguridad y la innovación de la IA, que con suerte se reflejará en el Plan de Acción de AI, dijo Jason Corso, cofundador de AI Startup Voxel51 y profesor de informática en la Universidad de Michigan.
La población general ya es escéptica de la IA, y si ocurren desafíos generales de crecimiento del desarrollo, corre el riesgo de socavar aún más la confianza en la tecnología, dijo. Es por eso que los marcos de políticas deben crearse con la seguridad de IA en mente, agregó Corso.
Un marco federal que carece de consideraciones de seguridad de IA significa la responsabilidad de las decisiones de seguridad de IA cae a los CIO de la Compañía o los oficiales de IA en los principales, lo que Corso dijo que presenta un “gran riesgo”. El efecto podría ser menos adopción o ROI más lento, dijo.
“Esta IA contemporánea es tan incipiente que a pesar de los rápidos avances que estamos viendo, en realidad se entiende bastante sobre su previsibilidad, repetibilidad o incluso su robustez con ciertos tipos de preguntas o escenarios de razonamiento”, dijo. “Ciertamente necesitamos innovación, pero también necesitamos seguridad”.
Makenzie Holland es un escritor de noticias senior que cubre la gran regulación federal y de la gran tecnología. Antes de unirse a Informa TechTarget, ella era una reportera de asignación general para el Wilmington Starnews y un reportero de crimen y educación en el Wabash Plain Dealer.
This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.
Strictly Necessary Cookies
Strictly Necessary Cookie should be enabled at all times so that we can save your preferences for cookie settings.
If you disable this cookie, we will not be able to save your preferences. This means that every time you visit this website you will need to enable or disable cookies again.