Connect with us

Noticias

Pasé tiempo cocinando con Gemini Live. ¿Fue pan comido?

Published

on

Andy Walker / Autoridad de Android

Pocas novedades recientes de Google me entusiasman tanto como Gemini Live. El chatbot conversacional inteligente que intenta hacer que el chat con IA sea más fluido y natural, al menos en papel, parece una perspectiva asombrosa. Intenté integrarlo en mi vida diaria pero no lo logré. Sin embargo, una cosa que todavía no he probado es cocinar con Gemini Live. ¿Podría ser el caso de uso concreto que he estado buscando?

Utilizo regularmente el Asistente de Google para hacerme compañía mientras cocino y desearía que ofreciera una gama más amplia de funciones de conversación. Entonces, dada la destreza de Live en este campo, ¿le iría mejor? ¿Es Gemini Live el ayudante de cocina perfecto, un sous chef digital, por así decirlo?

Quería considerar Gemini Live para aquellos que están aprendiendo a cocinar y aquellos que se sienten más a gusto en la cocina. Mis hallazgos se detallan a continuación.

¿Utilizas Gemini Live?

0 votos

Un paciente entrenador de cocina y confidente.

cocinando con geminis en vivo 2

Andy Walker / Autoridad de Android

A pesar de que el verano sofocante ya casi está aquí, el otro día se me antojó avena. Entonces, tomé mi teléfono y encendí Gemini Live. Había pasado un tiempo desde que lo hice y olvidé la proporción requerida de avena y líquido. Pensé que sería el momento perfecto para probar las credenciales de Live y fácilmente me guió a través de los conceptos básicos cuando me lo pidieron. Para cocineros principiantes y sin experiencia, Gemini Live es un maestro atento.

Para cocineros principiantes y sin experiencia, Gemini Live es un maestro atento.

“Coge una olla o un tazón, dependiendo de si quieres avena para cocinar o para microondas. También necesitarás un poco de leche o agua, copos de avena y una pizca de sal”, respondió después de que le dije mi problema. Live también proporcionó mediciones, el procedimiento en pasos y configuraciones de calor sin que yo se lo solicitara directamente. Incluso proporcionó algunos consejos adicionales: agregue más líquido si desea avena más cremosa y, una vez que el proceso de cocción estuvo en marcha, me sugirió agregar algunos aderezos.

Pero mucho antes de que mi desayuno estuviera listo, quería ver cómo manejaba las preguntas de ida y vuelta que un novato puede exigir. Le pregunté: “¿Cuánto líquido dijiste que necesitaba?” y rápidamente contó esos detalles. También proporcionó la proporción precisa requerida cuando lo presioné nuevamente.

A diferencia de usar un libro de cocina o un sitio web en mi teléfono, chatear con Live mantuvo mis manos libres para concentrarme en la comida real.

A diferencia de hojear un libro de cocina o un sitio web en mi teléfono, chatear con Live mantuvo mis manos libres para concentrarme en la comida real. Este arreglo es perfecto para alguien que no tiene confianza en la cocina. Agregue la paciencia del servicio, la voluntad de recordar información o retroceder pasos cuando sea necesario, y la entrega de consejos y sugerencias, y es una manera sorprendentemente buena de aprender a cocinar.

Crudo y en tiempo real

cocinando con geminis en vivo 1

Andy Walker / Autoridad de Android

Hay algunos elementos esenciales sin los que no puedo vivir en la cocina. Mi horno holandés es uno y mi cuchillo de trinchar es otro. Incluso sugeriría que mi Google Nest Mini esté en esa lista. Luego hay algunos elementos que pensé en usar pero que nunca uso, como un rebanador de aguacate. Gemini Live tiene más en común con este último.

Por un lado, no es del todo práctico. Valoro la información que ofrece, pero a diferencia del Asistente, no puedo usar Live para reproducir música o configurar temporizadores. No puedes pedirle a Gemini Live que mantenga el tiempo, ni él tampoco lo hace por ti. No nota cuándo empezaste a cocinar (o al menos cuando dices que empezaste a cocinar), lo que lo hace menos útil que su hermano más tonto.

Gemini Live todavía carece de varias funciones útiles que encontrarás en el Asistente, funciones que uso todos los días cuando estoy en la cocina.

Puede convertir imperial a métrico, pero es más fácil preguntarle al Asistente en mi Nest Mini, que no requiere activación física. Live no se puede activar mediante una palabra de activación y no se puede utilizar a través de altavoces inteligentes. Eso es un problema cuando tienes las manos mojadas o sucias.

A Live también le costaba a menudo entender mis demandas. No creo que mi acento sudafricano sea tan difícil de descifrar. Al menos el Asistente no tiene problemas, pero a menudo confundí su reemplazo de nueva generación. Vea las imágenes a continuación para ver un ejemplo.

Admito que es bastante cómico cuando sucede. Cuando solicité una receta de trigo “vulgar”, la IA escuchó trigo “vulgar”. Me reí entre dientes. Cuando intenté aclararme, escuchó: “Iré a comer”. Quizás fue trolling porque, curiosamente, sí demuestra la capacidad de comprender palabras erróneas cuando se usan en un contexto específico y corregirlas, pero no sucede con la suficiente frecuencia.

Las conversaciones con Live siguen siendo incómodas, lo que resta valor en gran medida al disfrute y la eficacia del uso del servicio. No quiero usar Live cuando se siente como una tarea ardua.

Cuando solicité una receta de trigo “vulgar”, la IA escuchó trigo “vulgar”. Me reí entre dientes.

Por supuesto, luego está la cuestión de las fuentes. Live no le dice exactamente de dónde obtiene la información, lo que hace que cocinar con él sea un viaje de confianza. Creí que era exacto durante mi experimento con avena (mi desayuno fue bastante bueno ese día), pero no confiaría en él para platos más avanzados y procesales, como Beef Wellington o soufflé.

Pero, a pesar de todos sus defectos, Gemini Live es útil en determinadas situaciones de la cocina. Aquí hay algunos otros escenarios que Live encontré inmensamente útiles:

  • Es particularmente bueno para sugerir cócteles. Le pedí que me aconsejara sobre una receta de negroni y accedió, proporcionándome los pasos y las cantidades requeridas. Siempre que tenga el equipo, Gemini Live es una excelente manera de aprender mixología por su cuenta.
  • Live también es bueno para sugerir remedios para errores comunes en la cocina. Puedes preguntarle cómo preparar tu curry amargo, qué hacer si tu pastel está dorado por arriba y empapado por el medio y cómo domar una sopa demasiado condimentada. La forma inmediata en que ofrece orientación lo hace muy útil en tales situaciones.
  • Si necesita un repaso sobre un método de cocción específico, la voluntad de Live de retroceder y reiterar información cuando la solicite lo convierte en un excelente recurso a pedido.

Cocinando con Gemini Live: ¿Sous chef o boo chef?

google gemini live escuchando en pantalla completa

Rita El Khoury / Autoridad de Android

A pesar de su anuncio en agosto de 2024 y su mayor disponibilidad a finales de agosto, Gemini Live todavía parece a medias. Sin duda es impresionante, y disfruté haciendo avena, café vertido y trigo “vulgar” con su respaldo, pero sus deficiencias obstaculizan sus beneficios en la hornilla.

Reiteraré que es una gran ayuda para los principiantes y parece ser una manera fácil de comprender procesos de cocina más simples en poco o ningún tiempo. A algunos les puede resultar más fácil absorber información cuando se vocaliza en lugar de imprimirla. ¿Necesita hervir un huevo, dorar un bistec o preparar un aderezo sencillo para ensalada? Gemini Live es más rápido que un motor de respuestas o un libro de recetas. Muestra cuándo debes arreglar un error en la cocina o repetir un método específico. En estos casos selectos, es una excelente herramienta de cocina que puedes utilizar cuando sea necesario.

Dada mi experiencia hasta ahora con la IA conversadora, ¿Gemini Live se convertirá en un elemento fijo en mi cocina? Probablemente no. Todavía veo su potencial. Debería ser una alternativa valiosa y poderosa una vez que absorba más funciones del Asistente. Hasta entonces, permanece en mi divertido cajón de novedades haciendo compañía al rebanador de aguacate.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Probé la habilidad de chat de chatgpt de modo de voz avanzado al horno de pan de plátano, así es como fue como fue

Published

on

No creo que haya seguido a sabiendas una receta a la carta. Para mí, hornear siempre ha sido divertido, desordenado y tonto. Una excusa para comer glaseado directamente del tazón, luego reír cuando nada se levanta o una bandeja de galletas se fusiona en una galleta gigante porque colé la masa en la bandeja en grupos que estaban demasiado juntos.

Entonces, cuando me pidieron que probara el modo de voz avanzado de Chatgpt mientras hornear y luego escribir sobre él, estaba ansioso por ver cómo mi enfoque caótico encajaría con el robótico de Chatgpt.

Continue Reading

Noticias

La guerra de redes sociales de IA ha comenzado

Published

on

Suscríbase a Freethink en Susmack de forma gratuita

Obtenga nuestras nuevas historias favoritas directamente a su bandeja de entrada todas las semanas

La carne de res de Sam Altman versus Elon Musk ahora es todo menos cortés. En febrero, Musk lanzó una granada de adquisición de $ 97.4 mil millones en Operai, a la que Altman respondió en X con un “No gracias, pero compraremos Twitter por $ 9.74 mil millones si lo desea”.

X no fue comprado, pero Altman está construyendo su competidor.

Operai ha estado dibujando su propio patio de recreo de estilo X durante meses, lo suficiente como para que los expertos ahora hablen sobre el lanzamiento de la nueva red social en términos de cuandono si.

En febrero, después de que Meta anunció planes para construir una aplicación independiente para que su asistente de IA rivalice con la aplicación Chatgpt, Altman volvió a disparar en X: “Está bien, tal vez hagamos una aplicación social”.

Luego se filtró el 15 de abril de que un prototipo interno de Operai que combina un feed social con las capacidades de generación de imágenes de Chatgpt estaba en revisión. Más fuentes fueron tan lejos como para confirmar que, más allá de este prototipo, Operai ahora estaba “considerando” un rival completo de X.

Esta red social empuja las tierras en un momento crucial cuando los modelos de IA se están volviendo comerciales, el monopolio de las redes sociales de Meta muestra signos de vulnerabilidad, y la integración de hardware está surgiendo como un diferenciador clave.

Al combinar tres elementos, una plataforma social construida de forma nativa para la IA, el diseñador tecnológico de clase mundial Jony Ive y los dispositivos complementarios especialmente diseñados, OpenAi se está posicionando en la intersección de las tres tendencias poderosas.

Si la compañía logra este juego de redes sociales con éxito, atrapará a otros gigantes tecnológicos de pie plano, tanto que estoy convencido de que estamos presenciando las primeras salvas de una revolución de las redes sociales en toda regla.

AI-First Social Media

En lugar de simplemente conectar a los usuarios para compartir contenido, el prototipo de red social de OpenAI aparece diseñado para aprovechar la IA para mejorar el proceso de creación de contenido en sí. En lugar de “compartir y luego desplazarse”, la IA salta en el minuto uno para ayudar hacer el post.

Esto es similar a la integración de Grok de X: si lo ha usado, notará rápidamente que a la gente le encanta que la IA diga algo estúpido para que puedan compartir la salida y ver que su publicación se vuelve viral.

El equivalente aquí para OpenAI es aprovechar sus capacidades de generación de imágenes favoritas de los fanáticos en un entorno social. En la primera semana de la disponibilidad de la herramienta, más de 130 millones de usuarios de ChatGPT crearon más de 700 millones de imágenes. Esta adopción masiva indica un interés significativo de los usuarios en compartir contenido visual generado por IA, de la misma manera que las personas ya comparten contenido escrito generado por IA en X.

Sin embargo, lejos de ser otro clon X, la red social de OpenAi se perfila como algo completamente nuevo. Esto es lo que he reconstruido hasta ahora:

  • La creación de contenido asistida por AI-AI-AI-Capacidades de generación de imágenes de Chatgpt
  • Un feed social para compartir e interactuar con contenido generado por IA
  • Integración con las capacidades de IA existentes de OpenAI y potencialmente su base de usuarios
  • Guardacas de seguridad similares a las utilizadas en la generación de imágenes de Chatgpt

También es probable que haya un componente de hardware para la red.

El 21 de mayo, Openai anunció su adquisición de IO, una compañía de hardware fundada por el ex jefe de diseño de Apple, Jony Ive. El acuerdo, valorado en casi $ 6.5 mil millones en una transacción de todo el stock, lleva aproximadamente 55 ingenieros de hardware, desarrolladores de software y expertos en fabricación al redil OpenAI.

Los primeros dispositivos después de la adquisición se lanzarán en 2026, pero no serán reemplazos de teléfonos inteligentes. Se mencionaron algunos detalles sobre la tecnología, incluido que será de bolsillo, contextualmente consciente, sin pantalla y no un par de gafas inteligentes, en una llamada interna de OpenAI.

La conexión entre esta iniciativa de hardware y las ambiciones de redes sociales de OpenAI es estratégicamente significativa. Estoy convencido de que al desarrollar una plataforma social y dispositivos complementarios, OpenAi se está posicionando para crear un ecosistema totalmente integrado donde las experiencias sociales con IA se optimizan para el hardware especialmente diseñado.

Es el clásico libro de jugadas de Apple, solo esta vez el principio de organización es pura IA.

Además, si bien IVE no se unirá a OpenAi directamente, su firma de diseño, LoveFrom, continuará siendo independiente, la asociación verá Love de “Take Onge para todos los OpenAi, incluido su software”. La experiencia estética y de usuario de la red social de OpenAI, sin duda, se beneficiará de la reconocida sensibilidad de diseño de Ive.

“La IA es una tecnología increíble, pero las grandes herramientas requieren trabajo en la intersección de la tecnología, el diseño y la comprensión de las personas y el mundo”, dijo Altman en un comunicado anunciando la adquisición de IO.

El contramardo de IO de Google

Google es, sin duda, uno de los mayores competidores de Openai en el espacio de IA, y en I/O 2025 (casualmente celebrado el mismo día que OpenAI anunció la adquisición de IO), el gigante de la búsqueda presentó actualizaciones de IA significativas e impresionantes.

Dos grandes fueron la integración de Gemini en Chrome para los usuarios de escritorio y el anuncio del “modo de agente”, una característica experimental donde los usuarios simplemente pueden describir su objetivo final y Gemini puede trabajar de manera autónoma para lograrlo. Esta capacidad refleja el tipo de experiencia asistida por AI-AI que las fuentes dicen que OpenAi se está incorporando a su red social.

Según la publicación oficial de blog de E/S 2025 de Google, Gemini 2.5 Pro es ahora el modelo líder mundial en las tablas de clasificación Webdev Arena y Lmarena, y en base a mi experiencia personal utilizando los modelos de Google con puntos de referencia de rendimiento específicamente en la mente, están liderando en muchos aspectos. La publicación también señala que la aplicación Gemini ahora tiene más de 400 millones de usuarios activos mensuales, una base de usuarios lo suficientemente masiva como para ponerla en competencia directa con ChatGPT.

Sin embargo, si bien estos avances posicionan a Google como una amenaza para el creciente ecosistema de inteligencia artificial de Openii, también sugieren que la estrategia de la compañía es continuar mejorando sus productos existentes con IA en lugar de tratar de competir directamente en el espacio de redes sociales.

Un imperio debilitante

En cuanto al rey de ese espacio, meta, está avanzando con los esfuerzos para defender su territorio contra los avances de OpenAi.

Durante una llamada de ganancias del primer trimestre de 2025 el 30 de abril, el CEO Mark Zuckerberg describió una estrategia integral de IA. “Estamos haciendo un buen progreso en las gafas de IA y la meta ai, que ahora tiene casi mil millones de activos mensuales”, dijo Zuck a los inversores, según la transcripción de la llamada. Este hito pone al asistente de IA de Meta a la par de Géminis de Google en términos de adopción del usuario, y potencialmente antes de ChatGPT.

La familia de modelos de Meta’s Llama 4 ha visto una notable adopción, y Meta dijo en marzo de 2025 que Llama había alcanzado las 1 mil millones de descargas. El día antes de la llamada de ganancias, la compañía lanzó una aplicación Meta AI dedicada construida con Llama 4, llamándola “un primer paso para construir una IA más personal”. Esta aplicación independiente representa un desafío directo a ChatGPT y, por extensión, los planes de redes sociales de OpenAI.

Operai puede posicionarse como una alternativa fresca y nativa de AI a las experiencias sociales existentes de Meta.

Sin embargo, aunque sigue siendo dominante en el espacio de redes sociales, Meta muestra signos de vulnerabilidad.

La compañía parece firme en su creencia de que las experiencias sociales en última instancia abarcarán tanto los asistentes de IA como los mundos virtuales inmersivos, como lo demuestran su continua inversión en los mundos de horizonte. Esta visión de la realidad virtual social pronto puede competir directamente con las iniciativas de hardware y redes de hardware de Openai, pero la inversión aún no ha producido rendimientos significativos: en el primer trimestre de 2025, la División de Laboratorios VR de Meta informó otras pérdidas de $ 4.2 mil millones.

El pivote de Meta a la IA también sugiere una postura defensiva contra las amenazas emergentes, como OpenAi y Anthrope. Esto crea una apertura estratégica para la nueva red social de Openai: puede posicionarse como una alternativa nueva y nativa de AI a las plataformas heredadas de Meta y las experiencias sociales existentes, que se están modificando con capacidades de IA.

Antrópico como el retador

Hablando de antrópico, el día después de la salpicadura de Altman, el paisaje de IA se volvió aún más competitivo con la inauguración de la startup de Claude 4 y la introducción de dos nuevos modelos: Claude Opus 4 y Claude Sonnet 4.

“Claude Opus 4 es el mejor modelo de codificación del mundo, con un rendimiento sostenido en tareas complejas y de larga duración y flujos de trabajo de agentes”, compartió Anthrope en su anuncio de lanzamiento. La compañía respaldó este reclamo con impresionantes puntos de referencia: 72.5% de precisión en el punto de referencia de ingeniería de software y 43.2% en el banco terminal. He revisado los puntos de referencia y ya he usado Claude 4 en mi IDE para tareas de codificación compleja y estoy convencido de que estamos en un punto de inflexión para los modelos de codificación de IA.

Lo que hace que Claude 4 sea particularmente relevante para las ambiciones de las redes sociales de OpenAi es su capacidad mejorada de trabajar continuamente durante varias horas, una capacidad que podría permitir agentes de IA más sofisticados dentro de las plataformas sociales. Según Anthrope, Claude Opus 4 puede mantener el enfoque en las tareas que requieren “miles de pasos”, superando drásticamente los modelos anteriores.

Este lanzamiento de Claude 4 subraya una realidad estratégica crítica para OpenAI: los modelos de IA en sí mismos se están volviendo rápidamente comerciantes.

Con múltiples compañías que ahora ofrecen potentes capacidades de IA de última generación, la tecnología subyacente por sí sola ya no es un diferenciador suficiente. Esta mercantilización hace que el juego de red social de OpenAI sea cada vez más importante como una forma de crear una posición de mercado única y defendible. Controlando ambos modelos de IA y La plataforma social donde los usuarios interactúan con ellos, OpenAi puede crear un valor que va más allá de lo que es posible solo con los modelos.

Las apuestas sociales

Y luego están los datos. Siempre los datos.

Las interacciones de los usuarios en tiempo real son invaluables para capacitar a los futuros modelos de IA: son como el oro digital en un mundo ahora invadido por AI SLOP. Una red social proporciona a su propietario un suministro constante de estos datos, que solo se volverán más valiosos a medida que las capacidades del modelo base converjan entre los competidores.

X y Meta ya están obteniendo estos datos de capacitación únicos en tiempo real de sus redes. Operai lo necesita, y la adquisición de IO de Ive podría agregar un diseño de clase mundial y hardware dedicado a sus ofertas de redes sociales, ayudando a atraer a los usuarios.

A medida que los principales jugadores de inteligencia artificial, OpenAi, Google, Meta y Anthrope, continúan evolucionando sus estrategias y capacidades, las líneas entre asistentes de IA, redes sociales y dispositivos de hardware son cada vez más borrosos. Creo que estamos presenciando no solo mejoras incrementales en la tecnología de IA, sino también la aparición de una categoría completamente nueva de productos y experiencias que podrían remodelar fundamentalmente la forma en que interactuamos con las redes sociales.

Nos guste o no, los ojos de IA ahora están en nuestros feeds.

¡Nos encantaría saber de ti! Si tiene un comentario sobre este artículo o si tiene un consejo para una futura historia de Freethink, envíenos un correo electrónico a tips@freethink.com.

Suscríbase a Freethink en Susmack de forma gratuita

Obtenga nuestras nuevas historias favoritas directamente a su bandeja de entrada todas las semanas

Continue Reading

Noticias

Acabo de probar las versiones más recientes de Claude, Gemini, Deepseek y Chatgpt, y el ganador me sorprendió por completo

Published

on

Los chatbots de IA están evolucionando rápidamente con actualizaciones que ocurren constantemente de los nombres más familiares en Big Tech. Una vez más, Deepseek de China se encuentra entre los últimos en unirse a la carrera de primer nivel con un contexto de 128k, lo que significa que puede manejar conversaciones más largas y documentos más complejos.

Con la reciente actualización de su modelo R1, Deepseek se está posicionando como un competidor serio para Chatgpt, Claude y Gemini.

Continue Reading

Trending