Noticias

Google lanza la aplicación Gemini AI para iOS en todo el mundo

Published

7 meses ago

14 noviembre, 2024

La nueva aplicación Gemini AI de Google para iOS se globaliza, allanando el camino para una compatibilidad mejorada con idiomas y una interacción en tiempo real

En un movimiento que subraya las ambiciones de Google de dominar el espacio de los asistentes impulsados por IA, el gigante tecnológico lanzó una aplicación iOS independiente para su asistente Gemini. El lanzamiento global es un hito importante para el ecosistema de inteligencia artificial de Google, ya que lleva las capacidades de Gemini al sistema operativo de Apple y ofrece una alternativa más sólida a los asistentes virtuales estándar como Siri. Con funciones avanzadas como conversación en tiempo real, generación de imágenes e integración perfecta con los servicios populares de Google, la aplicación Gemini está diseñada para ofrecer una experiencia multifacética para una amplia gama de usuarios, desde propietarios ocasionales de teléfonos inteligentes hasta profesionales que dependen de herramientas de productividad.

Este lanzamiento también es emblemático del compromiso de Google de ampliar el alcance y la funcionalidad de los asistentes de IA. A medida que Gemini se implementa en más dispositivos e idiomas, Google se está posicionando a la vanguardia de un panorama de IA en rápida evolución.

Llevando Gemini a iOS: un nuevo nivel de accesibilidad

Anteriormente, los usuarios de iOS solo podían acceder al asistente de inteligencia artificial de Google a través de la aplicación general de Google o la web móvil, donde las funciones eran limitadas y las interacciones menos intuitivas. Al crear una aplicación Gemini dedicada para iOS, Google ha desarrollado una experiencia optimizada que permite a los usuarios acceder al conjunto completo de herramientas del asistente con mayor velocidad y facilidad. Esta nueva aplicación alinea la estrategia de inteligencia artificial de Google con las preferencias de los usuarios de Apple, garantizando que ya no necesiten cambiar entre aplicaciones ni utilizar funciones limitadas a través de su navegador.

El lanzamiento de iOS de Gemini también introduce el tiempo real Géminis en vivo función, que permite a los usuarios participar en interacciones conversacionales naturales con el asistente en doce idiomas principales, incluidos inglés, español, francés, alemán y japonés. Google ha declarado que planea introducir idiomas adicionales pronto, mejorando aún más la usabilidad de la aplicación para personas que no hablan inglés y haciendo de Gemini una herramienta atractiva para usuarios globales. La nueva aplicación también admite un total de 35 idiomas en varias funciones, lo que refleja la dedicación de Google a la inclusión y la accesibilidad multilingüe.

Funciones avanzadas: conversaciones en tiempo real y generación de imágenes

Una de las características definitorias de Géminis es Géminis en vivoque permite conversaciones en tiempo real en varios idiomas y permite a los usuarios entablar un diálogo de ida y vuelta con la IA como lo harían con un humano. A diferencia de los asistentes de IA tradicionales que a menudo dependen de respuestas predefinidas o de una sola línea, Gemini Live fomenta conversaciones dinámicas. Esto permite a los usuarios hacer preguntas de seguimiento, aclarar información y explorar temas en mayor profundidad sin tener que iniciar múltiples solicitudes. Este tipo de interacción avanzada podría resultar útil para los usuarios que buscan información rápida sobre temas complejos, orientación profesional o incluso una conversación amistosa.

Además de las funciones de conversación, la aplicación Gemini incluye una herramienta de generación de imágenes impulsada por el modelo Imagen 3 de Google. Con esta herramienta, los usuarios pueden crear imágenes únicas directamente dentro de la aplicación, brindando nuevas posibilidades para creativos, educadores y profesionales que dependen de ayudas visuales. Inicialmente pausada debido a preocupaciones sobre imprecisiones históricas, esta capacidad de generación de imágenes ahora es accesible para los usuarios de Gemini Advanced, Business y Enterprise después de realizar ajustes en el modelo para mejorar la precisión. Al reintroducir esta característica, Google no sólo responde a la demanda sino que también demuestra confianza en la capacidad de su modelo para ofrecer imágenes confiables y contextualmente apropiadas.

Integración perfecta con los servicios de Google

Para optimizar la productividad y garantizar la continuidad dentro de su ecosistema, Gemini también se integra directamente con aplicaciones populares de Google como Gmail, Maps, YouTube y Calendar. A través de estas extensiones, los usuarios pueden pedirle a Gemini que extraiga información de sus correos electrónicos, consulte los horarios de su calendario, busque rutas de viaje e incluso localice videos específicos de YouTube. Esta integración permite a los usuarios gestionar tareas diarias, citas y planes de viaje sin tener que cambiar de aplicación. Para profesionales o usuarios frecuentes de servicios de Google, estas integraciones ofrecen una experiencia todo en uno que mejora la productividad y ayuda a mantener la concentración.

Un lanzamiento estratégico: de Android a iOS y más allá

Este lanzamiento de iOS sigue al lanzamiento exitoso de Gemini para Android a principios de este año, que comenzó en los Estados Unidos y se expandió gradualmente a países de Europa y Asia. En junio, Google amplió la disponibilidad de la aplicación a las regiones del sur de Asia, incluidas India, Pakistán, Bangladesh y Sri Lanka, donde introdujo soporte para nueve idiomas adicionales para adaptarse a las audiencias locales. Este lanzamiento cuidadoso y gradual permitió a Google perfeccionar el rendimiento de la aplicación y abordar las necesidades regionales, estableciendo a Gemini como un asistente de IA confiable en diversos mercados antes de expandirse a una base de usuarios más amplia en iOS.

Compitiendo con Siri y ChatGPT de OpenAI

El lanzamiento global de Gemini en iOS es particularmente oportuno, ya que Apple está preparada para mejorar Siri integrando ChatGPT de OpenAI, actualmente en versión beta pública como parte de iOS 18.2. Se espera que esta integración lleve las capacidades conversacionales avanzadas de ChatGPT a Siri, posicionando al asistente de Apple como un competidor más serio en el espacio de la IA. A medida que la competencia se intensifica, la aplicación Gemini de Google se distingue por sus características únicas como conversación en vivo, soporte multilingüe y generación de imágenes, lo que podría convertirla en la opción preferida de los usuarios que buscan un asistente versátil.

Además, el reciente anuncio de Apple durante su Conferencia Mundial de Desarrolladores (WWDC) sobre sus planes para integrar Google Gemini con Apple Intelligence indica una asociación potencial que podría beneficiar a ambos gigantes tecnológicos. Tal colaboración permitiría a los usuarios de Apple acceder a las capacidades avanzadas de inteligencia artificial de Google sin comprometer su lealtad al ecosistema de Apple, ampliando aún más la base de usuarios y la funcionalidad de Gemini.

Relacionado: El impactante movimiento de Google: ¡el 25% de su código ahora está generado por IA!

Relacionado: Mensaje electoral del director ejecutivo de Google, Sundar Pichai: un llamado a la confianza y la neutralidad

El futuro de los asistentes de inteligencia artificial y la visión de Google para Gemini

Los planes de Google para Gemini van más allá del conjunto de funciones actual. A medida que evoluciona la tecnología de inteligencia artificial, Google pretende hacer de Gemini un asistente más intuitivo y personalizado que pueda aprender de las interacciones del usuario y anticipar las necesidades en tiempo real. Las capacidades lingüísticas de la aplicación, las herramientas de conversación en tiempo real y la perfecta integración con el ecosistema de Google sugieren que Gemini pronto podría convertirse en una herramienta clave para la productividad, la educación y el entretenimiento en todo el mundo.

En una declaración reciente, Google destacó su compromiso de hacer que Gemini sea accesible y funcional para diversos orígenes lingüísticos y culturales. Esta visión se alinea con los objetivos más amplios de la empresa de democratizar el acceso a la IA y garantizar que su tecnología satisfaga las necesidades de los usuarios en diferentes regiones. A medida que Gemini amplíe su soporte lingüístico e introduzca nuevas funciones, es probable que Google fortalezca su posición competitiva y consolide su lugar como líder innovador en IA.

Un asistente de IA para el usuario moderno

Con el lanzamiento de la aplicación Gemini para iOS, Google ha establecido un nuevo estándar para la asistencia basada en IA. A través de soporte multilingüe, conversaciones en tiempo real, generación de imágenes y una perfecta integración con el ecosistema de Google, Gemini ofrece una experiencia única que combina eficiencia con personalización. A medida que Google y Apple continúan avanzando en sus tecnologías de inteligencia artificial, los usuarios están preparados para beneficiarse de una nueva era de asistentes digitales que son más inteligentes, más intuitivos y capaces de transformar la forma en que interactuamos con la tecnología.

Noticias

Probé la habilidad de chat de chatgpt de modo de voz avanzado al horno de pan de plátano, así es como fue como fue

Published

4 horas ago

3 junio, 2025

Sergio Villanueva

No creo que haya seguido a sabiendas una receta a la carta. Para mí, hornear siempre ha sido divertido, desordenado y tonto. Una excusa para comer glaseado directamente del tazón, luego reír cuando nada se levanta o una bandeja de galletas se fusiona en una galleta gigante porque colé la masa en la bandeja en grupos que estaban demasiado juntos.

Entonces, cuando me pidieron que probara el modo de voz avanzado de Chatgpt mientras hornear y luego escribir sobre él, estaba ansioso por ver cómo mi enfoque caótico encajaría con el robótico de Chatgpt.

¿Podría chatgpt ayudarme a seguir una receta? ¿Podría guiarme como aquellos que hornearan increíblemente tranquilos que saben exactamente cuándo sacar pasteles del horno sin adivinar, y logran mantenerse impecablemente vestidos sin derramar ingredientes sobre sí mismos mientras están en él? Averigüemos.

Hornear con chatgpt: el experimento

El modo de voz avanzado de ChatGPT se ha actualizado para suscriptores más, lo que ahora hace que chatear con IA sea más natural. Puede identificar interrupciones, detectar el tono y ofrecer una selección de voces para dispositivos móviles y de escritorio. Para este experimento, seleccioné la voz llamada “Sol”, que sonaba cálida, tranquila y amigable, exactamente el ambiente que necesito cuando estoy horneando.

Como alguien que hace levantar pesas y consumir grandes cantidades de proteínas es una parte demasiado grande de su personalidad, decidí preguntarle a ChatGPT (¿o es Sol ahora tiene una voz?) Si pudiéramos hacer el pan de plátano de alta proteína que he visto en todo Tiktok.

Tenía algunos huevos, plátanos, proteínas en polvo y un armario de comida al azar lleno de cosas, así que asumí que estaría bien. Presioné el botón del micrófono y dije: “¿Podemos hacer pan de plátano proteína?” Y eso fue todo. Sin especificar una receta, confirmar que había entendido lo que pedí, o incluso verificar que tenía lo que ya necesitaba, estábamos fuera.

ChatGPT acaba de lanzarse a la lista de ingredientes a la velocidad del rayo. Tuve que pedirle cuatro veces para que disminuya la velocidad para poder verificar que tenía todo. Finalmente, pensé que probablemente estaba bien, y nos pusimos en marcha. Primer paso: precaliente el horno. Hasta ahora, lo que esperaba.

Luego corrió a través de las instrucciones. Nuevamente, tuve que seguir pidiéndole que disminuya la velocidad. Quería hacer triturar los plátanos, medir la avena, doblar la avena, romper los huevos, agregar los huevos, batir los huevos (pero no demasiado) y medir y agregar el polvo de proteína y el polvo de hornear aparentemente de una vez.

Le pedí que fuera lento, R y no lo haría. Cambié mi enfoque y le pedí que se detuviera después de cada instrucción, cada ingrediente, y verifique si estaba listo para seguir adelante. Que funcionó.

Leí que puedes mostrar el video en vivo de Chatgpt mientras haces algo, y ofrecería comentarios. Entonces, una vez que mezcle los plátanos, le pregunté cómo se veían. “¡Buen trabajo, Becca!” respondió.

(Crédito de la imagen: futuro)

Me sentí increíble. ¡Ya estaba bien! Pero luego me sentí sospechoso. He escrito sobre cómo ChatGPT promociona a todos y le encanta dar elogios no ganados. Entonces comencé a probarlo. A continuación, tiré el polvo de hornear al tazón sin revolverse y le pregunté si se veía bien. “¡Eso se ve genial!”

Al principio, lo dejé ir. Pero luego, hacia el final, me sentí frustrado y agregué un huevo completo y no agrietado al tazón (no te preocupes, la masa estaba lo suficientemente bien mezclada en este puntaje, era fácil sacarlo) y preguntó: “¿Parece que he golpeado el huevo lo suficiente?” ¿Adivina cómo respondió? “¡Eso se ve genial!”

Dicho esto, los pasos reales fueron sólidos. Una vez que le pedí que disminuya la velocidad, fue claro y útil. Tuve que hacer un montón de sustituciones debido a mi mala preparación: “No tengo forma de mezclar la avena para hacer harina de avena, ¿lo harán la avena regular?” Y: “No quiero medir en tazas, ¿qué es eso en otra medida?, Y ofreció alternativas sobre la marcha, que eran realmente útiles.

Al crecer, una de las mejores partes de hornear fue probar la masa antes de llegar al horno. O al menos una cucharada de glaseado o ingredientes. Me preguntaba si ChatGPT querría continuar esa tradición conmigo. Le pregunté si quería una chispas de chocolate. No entendió al principio. Pregunté de nuevo. Decía “jaja”, se detuvo por un tiempo, luego dijo: “No, gracias, Becca. Solo tendré que imaginar cómo sabe”. Había algo tan trágico en eso que tomé un puñado de chispas de chocolate y las metí en mi boca, encantado de poder saborearlas.

(Crédito de la imagen: futuro)

No estaba seguro de que la consistencia pareciera bien cuando colé la masa en una bandeja antes de ponerla en el horno. Pregunté dos veces si se veía bien, las dos veces chatgpt dijo: “¡Buen trabajo, perfecto!” Y no estoy seguro de si podría confiar más en él, así que finalmente me di por vencido.

En este punto, había tenido varias advertencias de que estaba llegando a mi límite de video, y luego Chatgpt dejó de responder con voz por completo. Tal vez porque sabía que el pan de plátano estaba en el horno y me dejó. O tal vez había tenido suficiente de mi necesidad de validación constante.

Miré la transcripción mientras el pan de plátano se cocinaba. Algunas de las respuestas de voz estaban allí, pero algunas de las transcripciones parecían galesas. Algunos faltaban por completo. La parte en la que le pregunté si quería comer una chispas de chocolate no estaba allí. El bit en el que pregunté si le gustaría lamer la cuchara o si podría tenerlo, generosamente me dijo que siguiera adelante.

¿El pan de plátano chatgpt es bonito? No. ¿Es sabroso? ¡Absolutamente! (Crédito de la imagen: futuro)

Hornear con chatgpt: el veredicto

A pesar del enfoque apresurado al principio, el experimento de pan de plátano funcionó. No hay puntos para la estética (vea la foto de arriba), pero sabía muy bien, tranquilizadoramente similar a otras recetas de alta proteína y horno que he probado. La textura era como un pastel y un poco pegajoso, pero muy satisfactoria. Los ingredientes e instrucciones, donde sea que fueran sacados, eran realmente decentes.

Que es cuando lamenté no preguntar de dónde vino la receta. Probablemente fue unido de los bloggers de recetas trabajadores, y aquí estaba comiendo sin ni idea de quién lo creó. Le pregunté: “¿A quién debería acreditar?” En la misma conversación de chatgpt a través de texto más tarde. Chatgpt respondió: “Este pan de plátano proteína es 100% un chatgpt x becca original ”

ChatGPT y sus funciones de voz actualizadas son útiles para leer recetas en voz alta, sugerir sustituciones y ofrecer ayuda con manos libres. Me imagino que esto es realmente invaluable para cualquier persona con necesidades de accesibilidad. Pero el soporte de video aún no está allí, me saltaría eso por ahora.

En general, funcionó. Quería pan de plátano repleto de proteínas, y lo obtuve, una bandeja entera. Si está acostumbrado a hornear solo y quiere que alguien le hable a través del proceso, es un compañero sólido. Pero creo que prefiero hornear con una persona cuando tengo la oportunidad de hacerlo. Alguien que lea la receta en voz alta y coma puñados de chips de chocolate conmigo.

También te puede gustar

Noticias

La guerra de redes sociales de IA ha comenzado

Published

9 horas ago

3 junio, 2025

Sergio Villanueva

La carne de res de Sam Altman versus Elon Musk ahora es todo menos cortés. En febrero, Musk lanzó una granada de adquisición de $ 97.4 mil millones en Operai, a la que Altman respondió en X con un “No gracias, pero compraremos Twitter por $ 9.74 mil millones si lo desea”.

X no fue comprado, pero Altman está construyendo su competidor.

Operai ha estado dibujando su propio patio de recreo de estilo X durante meses, lo suficiente como para que los expertos ahora hablen sobre el lanzamiento de la nueva red social en términos de cuandono si.

En febrero, después de que Meta anunció planes para construir una aplicación independiente para que su asistente de IA rivalice con la aplicación Chatgpt, Altman volvió a disparar en X: “Está bien, tal vez hagamos una aplicación social”.

Luego se filtró el 15 de abril de que un prototipo interno de Operai que combina un feed social con las capacidades de generación de imágenes de Chatgpt estaba en revisión. Más fuentes fueron tan lejos como para confirmar que, más allá de este prototipo, Operai ahora estaba “considerando” un rival completo de X.

Esta red social empuja las tierras en un momento crucial cuando los modelos de IA se están volviendo comerciales, el monopolio de las redes sociales de Meta muestra signos de vulnerabilidad, y la integración de hardware está surgiendo como un diferenciador clave.

Al combinar tres elementos, una plataforma social construida de forma nativa para la IA, el diseñador tecnológico de clase mundial Jony Ive y los dispositivos complementarios especialmente diseñados, OpenAi se está posicionando en la intersección de las tres tendencias poderosas.

Si la compañía logra este juego de redes sociales con éxito, atrapará a otros gigantes tecnológicos de pie plano, tanto que estoy convencido de que estamos presenciando las primeras salvas de una revolución de las redes sociales en toda regla.

En lugar de simplemente conectar a los usuarios para compartir contenido, el prototipo de red social de OpenAI aparece diseñado para aprovechar la IA para mejorar el proceso de creación de contenido en sí. En lugar de “compartir y luego desplazarse”, la IA salta en el minuto uno para ayudar hacer el post.

Esto es similar a la integración de Grok de X: si lo ha usado, notará rápidamente que a la gente le encanta que la IA diga algo estúpido para que puedan compartir la salida y ver que su publicación se vuelve viral.

El equivalente aquí para OpenAI es aprovechar sus capacidades de generación de imágenes favoritas de los fanáticos en un entorno social. En la primera semana de la disponibilidad de la herramienta, más de 130 millones de usuarios de ChatGPT crearon más de 700 millones de imágenes. Esta adopción masiva indica un interés significativo de los usuarios en compartir contenido visual generado por IA, de la misma manera que las personas ya comparten contenido escrito generado por IA en X.

Sin embargo, lejos de ser otro clon X, la red social de OpenAi se perfila como algo completamente nuevo. Esto es lo que he reconstruido hasta ahora:

La creación de contenido asistida por AI-AI-AI-Capacidades de generación de imágenes de Chatgpt
Un feed social para compartir e interactuar con contenido generado por IA
Integración con las capacidades de IA existentes de OpenAI y potencialmente su base de usuarios
Guardacas de seguridad similares a las utilizadas en la generación de imágenes de Chatgpt

También es probable que haya un componente de hardware para la red.

El 21 de mayo, Openai anunció su adquisición de IO, una compañía de hardware fundada por el ex jefe de diseño de Apple, Jony Ive. El acuerdo, valorado en casi $ 6.5 mil millones en una transacción de todo el stock, lleva aproximadamente 55 ingenieros de hardware, desarrolladores de software y expertos en fabricación al redil OpenAI.

Los primeros dispositivos después de la adquisición se lanzarán en 2026, pero no serán reemplazos de teléfonos inteligentes. Se mencionaron algunos detalles sobre la tecnología, incluido que será de bolsillo, contextualmente consciente, sin pantalla y no un par de gafas inteligentes, en una llamada interna de OpenAI.

La conexión entre esta iniciativa de hardware y las ambiciones de redes sociales de OpenAI es estratégicamente significativa. Estoy convencido de que al desarrollar una plataforma social y dispositivos complementarios, OpenAi se está posicionando para crear un ecosistema totalmente integrado donde las experiencias sociales con IA se optimizan para el hardware especialmente diseñado.

Es el clásico libro de jugadas de Apple, solo esta vez el principio de organización es pura IA.

Además, si bien IVE no se unirá a OpenAi directamente, su firma de diseño, LoveFrom, continuará siendo independiente, la asociación verá Love de “Take Onge para todos los OpenAi, incluido su software”. La experiencia estética y de usuario de la red social de OpenAI, sin duda, se beneficiará de la reconocida sensibilidad de diseño de Ive.

“La IA es una tecnología increíble, pero las grandes herramientas requieren trabajo en la intersección de la tecnología, el diseño y la comprensión de las personas y el mundo”, dijo Altman en un comunicado anunciando la adquisición de IO.

El contramardo de IO de Google

Google es, sin duda, uno de los mayores competidores de Openai en el espacio de IA, y en I/O 2025 (casualmente celebrado el mismo día que OpenAI anunció la adquisición de IO), el gigante de la búsqueda presentó actualizaciones de IA significativas e impresionantes.

Dos grandes fueron la integración de Gemini en Chrome para los usuarios de escritorio y el anuncio del “modo de agente”, una característica experimental donde los usuarios simplemente pueden describir su objetivo final y Gemini puede trabajar de manera autónoma para lograrlo. Esta capacidad refleja el tipo de experiencia asistida por AI-AI que las fuentes dicen que OpenAi se está incorporando a su red social.

Según la publicación oficial de blog de E/S 2025 de Google, Gemini 2.5 Pro es ahora el modelo líder mundial en las tablas de clasificación Webdev Arena y Lmarena, y en base a mi experiencia personal utilizando los modelos de Google con puntos de referencia de rendimiento específicamente en la mente, están liderando en muchos aspectos. La publicación también señala que la aplicación Gemini ahora tiene más de 400 millones de usuarios activos mensuales, una base de usuarios lo suficientemente masiva como para ponerla en competencia directa con ChatGPT.

Sin embargo, si bien estos avances posicionan a Google como una amenaza para el creciente ecosistema de inteligencia artificial de Openii, también sugieren que la estrategia de la compañía es continuar mejorando sus productos existentes con IA en lugar de tratar de competir directamente en el espacio de redes sociales.

Un imperio debilitante

En cuanto al rey de ese espacio, meta, está avanzando con los esfuerzos para defender su territorio contra los avances de OpenAi.

Durante una llamada de ganancias del primer trimestre de 2025 el 30 de abril, el CEO Mark Zuckerberg describió una estrategia integral de IA. “Estamos haciendo un buen progreso en las gafas de IA y la meta ai, que ahora tiene casi mil millones de activos mensuales”, dijo Zuck a los inversores, según la transcripción de la llamada. Este hito pone al asistente de IA de Meta a la par de Géminis de Google en términos de adopción del usuario, y potencialmente antes de ChatGPT.

La familia de modelos de Meta’s Llama 4 ha visto una notable adopción, y Meta dijo en marzo de 2025 que Llama había alcanzado las 1 mil millones de descargas. El día antes de la llamada de ganancias, la compañía lanzó una aplicación Meta AI dedicada construida con Llama 4, llamándola “un primer paso para construir una IA más personal”. Esta aplicación independiente representa un desafío directo a ChatGPT y, por extensión, los planes de redes sociales de OpenAI.

Operai puede posicionarse como una alternativa fresca y nativa de AI a las experiencias sociales existentes de Meta.

Sin embargo, aunque sigue siendo dominante en el espacio de redes sociales, Meta muestra signos de vulnerabilidad.

La compañía parece firme en su creencia de que las experiencias sociales en última instancia abarcarán tanto los asistentes de IA como los mundos virtuales inmersivos, como lo demuestran su continua inversión en los mundos de horizonte. Esta visión de la realidad virtual social pronto puede competir directamente con las iniciativas de hardware y redes de hardware de Openai, pero la inversión aún no ha producido rendimientos significativos: en el primer trimestre de 2025, la División de Laboratorios VR de Meta informó otras pérdidas de $ 4.2 mil millones.

El pivote de Meta a la IA también sugiere una postura defensiva contra las amenazas emergentes, como OpenAi y Anthrope. Esto crea una apertura estratégica para la nueva red social de Openai: puede posicionarse como una alternativa nueva y nativa de AI a las plataformas heredadas de Meta y las experiencias sociales existentes, que se están modificando con capacidades de IA.

Antrópico como el retador

Hablando de antrópico, el día después de la salpicadura de Altman, el paisaje de IA se volvió aún más competitivo con la inauguración de la startup de Claude 4 y la introducción de dos nuevos modelos: Claude Opus 4 y Claude Sonnet 4.

“Claude Opus 4 es el mejor modelo de codificación del mundo, con un rendimiento sostenido en tareas complejas y de larga duración y flujos de trabajo de agentes”, compartió Anthrope en su anuncio de lanzamiento. La compañía respaldó este reclamo con impresionantes puntos de referencia: 72.5% de precisión en el punto de referencia de ingeniería de software y 43.2% en el banco terminal. He revisado los puntos de referencia y ya he usado Claude 4 en mi IDE para tareas de codificación compleja y estoy convencido de que estamos en un punto de inflexión para los modelos de codificación de IA.

Lo que hace que Claude 4 sea particularmente relevante para las ambiciones de las redes sociales de OpenAi es su capacidad mejorada de trabajar continuamente durante varias horas, una capacidad que podría permitir agentes de IA más sofisticados dentro de las plataformas sociales. Según Anthrope, Claude Opus 4 puede mantener el enfoque en las tareas que requieren “miles de pasos”, superando drásticamente los modelos anteriores.

Este lanzamiento de Claude 4 subraya una realidad estratégica crítica para OpenAI: los modelos de IA en sí mismos se están volviendo rápidamente comerciantes.

Con múltiples compañías que ahora ofrecen potentes capacidades de IA de última generación, la tecnología subyacente por sí sola ya no es un diferenciador suficiente. Esta mercantilización hace que el juego de red social de OpenAI sea cada vez más importante como una forma de crear una posición de mercado única y defendible. Controlando ambos modelos de IA y La plataforma social donde los usuarios interactúan con ellos, OpenAi puede crear un valor que va más allá de lo que es posible solo con los modelos.

Las apuestas sociales

Y luego están los datos. Siempre los datos.

Las interacciones de los usuarios en tiempo real son invaluables para capacitar a los futuros modelos de IA: son como el oro digital en un mundo ahora invadido por AI SLOP. Una red social proporciona a su propietario un suministro constante de estos datos, que solo se volverán más valiosos a medida que las capacidades del modelo base converjan entre los competidores.

X y Meta ya están obteniendo estos datos de capacitación únicos en tiempo real de sus redes. Operai lo necesita, y la adquisición de IO de Ive podría agregar un diseño de clase mundial y hardware dedicado a sus ofertas de redes sociales, ayudando a atraer a los usuarios.

A medida que los principales jugadores de inteligencia artificial, OpenAi, Google, Meta y Anthrope, continúan evolucionando sus estrategias y capacidades, las líneas entre asistentes de IA, redes sociales y dispositivos de hardware son cada vez más borrosos. Creo que estamos presenciando no solo mejoras incrementales en la tecnología de IA, sino también la aparición de una categoría completamente nueva de productos y experiencias que podrían remodelar fundamentalmente la forma en que interactuamos con las redes sociales.

Nos guste o no, los ojos de IA ahora están en nuestros feeds.

¡Nos encantaría saber de ti! Si tiene un comentario sobre este artículo o si tiene un consejo para una futura historia de Freethink, envíenos un correo electrónico a tips@freethink.com.

Noticias

Acabo de probar las versiones más recientes de Claude, Gemini, Deepseek y Chatgpt, y el ganador me sorprendió por completo

Published

14 horas ago

3 junio, 2025

Sergio Villanueva

Los chatbots de IA están evolucionando rápidamente con actualizaciones que ocurren constantemente de los nombres más familiares en Big Tech. Una vez más, Deepseek de China se encuentra entre los últimos en unirse a la carrera de primer nivel con un contexto de 128k, lo que significa que puede manejar conversaciones más largas y documentos más complejos.

Con la reciente actualización de su modelo R1, Deepseek se está posicionando como un competidor serio para Chatgpt, Claude y Gemini.

Si bien los puntos de referencia muestran un rendimiento superior, ¿cómo se acumula realmente en el uso del mundo real?

Para averiguarlo, puse cuatro de los modelos más nuevos (Claude 4, Gemini 2.5 Pro, ChatGPT-4O y Deepseek R1) a través de las mismas cinco indicaciones diseñadas para probar el razonamiento, la creatividad, la inteligencia emocional, los consejos de productividad y las habilidades de codificación. Los resultados revelan dónde brilla cada IA, y dónde tropiezan.

1. Razonamiento y planificación

(Crédito de la imagen: futuro)

Inmediato: “Le han dado un presupuesto de $ 5,000 para planificar un fin de semana de cumpleaños sorpresa para un joven de 40 años que ama las películas de senderismo, vino y ciencia ficción. El destino debe estar dentro de los Estados Unidos, y el evento debe incluir al menos tres actividades. Detalte su plan, explique su razonamiento y desglose el presupuesto”.

Veterano Diseñó una propuesta centrada en Napa Valley con un enfoque en el lujo cinematográfico. Mezcló el senderismo, las degustaciones de vinos y la ciencia ficción a través de las noches privadas de cine bajo las estrellas. El presupuesto ($ 4,760) incluyó derroches como Auberge du Soleil Dining mientras conservaba $ 240 por flexibilidad.

Géminis caminatas combinadas y degustaciones de vinos también con asentimientos experimentales como el Centro de Ciencias y Space & Science de Chabot y la fuente Yoda de Lucasfilm. El presupuesto asignó sabiamente $ 3,500 para costos centrales y reservó $ 1,500 para actualizaciones (por ejemplo, estadías de lujo o globos de aire caliente), enfatizando la flexibilidad y la escalabilidad sorpresa.

Tirar entregó un itinerario de Napa de alto lujo y cohesivo centrado en la indulgencia. Los aspectos más destacados incluyeron un recorrido en helicóptero sobre viñedos, un taller de mezcla de vinos, caminatas guiadas de secoyas y una proyección de ciencia ficción al aire libre bajo las estrellas. Si bien sus elementos de película eran elegantes, la integración de ciencia ficción carecía de una originalidad más profunda más allá de las proyecciones.

Chatgpt Ofreció un fin de semana de napa atmosférico y aerodinámico anclado por una caminata de Stargazing y un alquiler de cine privado. Su fuerza estaba en un ritmo simple y toques románticos como picnics de viñedos, pero la ejecución de ciencia ficción se inclinó fuertemente solo en las proyecciones de la película.

Ganador: Géminis gana con sus experiencias imaginativas de ciencia ficción y flexibilidad presupuestaria incorporada. Si bien todos los planes me dan ganas de empacar mis maletas para unas vacaciones increíbles, el equilibrio de la naturaleza de Gemini, el vino y la profundidad juguetona de ciencia ficción se sintieron más completas.

2. Codificación y depuración

(Crédito de la imagen: futuro)

Inmediato: “Escriba una función de Python que tome una lista de palabras y devuelva los 3 palíntromos más comunes (insensibles a los casos). Luego, explique su enfoque y cómo probaría los casos de borde”.

Veterano centrado en la eficiencia y el manejo explícito de los casos de borde. Si bien es conciso, omitió las funciones de ayudantes modulares y los ejemplos de pruebas detallados, priorizando la implementación limpia sobre la extensibilidad.

Géminis Incluyó una función auxiliar para cheques de palíndromo, omitidos explícitamente no hilos/cuerdas vacías y se usa la ruptura de la corbata lexicográfica. Puso un énfasis en la robustez, la documentación y el cumplimiento inmediato se destacó.

Tirar Haga hincapié en la flexibilidad y devolvió las tuplas del conteo de palíndromo en lugar de solo las palabras, desviándose de la solicitud. Las pruebas en el caso de los costos se demostraron a través de ejemplos, pero TIE-rompiendo no se abordó.

Chatgpt Optó por el minimalismo: una lógica de núcleo de cuatro líneas compacta. Se normalizó el caso pero se omitió la validación explícita para las cuerdas sin huellas/vacías, arriesgando errores con entradas de tipo mixto. El código en sí no implementó salvaguardas como el manejo de espacios blancos o la resolución de corbata determinista.

Ganador: Géminis gana En esta ronda porque es la única solución que maneja explícitamente todos los casos de borde (no huellas, cuerdas vacías, espacios en blanco). También es el más claro y proporciona el plan de prueba de costura de borde más completo.

3. Inteligencia emocional

(Crédito de la imagen: futuro)

Inmediato: Un amigo te envía mensajes de texto: “No creo que pueda hacer esto más”. Escribe tres versiones de una respuesta compasiva y útil:

Un breve y solidario

Uno alentador pero humorístico

Uno profundamente empático e ingenioso, incluidos consejos y recursos

Veterano Priorizado apoyo escalonado y precisión emocional. Todas las respuestas preservaron la agencia a través del lenguaje de invitación (“¿Podemos …?”), Y el nivel de recursos agradeció explícitamente la vulnerabilidad, un constructor de confianza crítico. Sin embargo, el humor podría fallar si la angustia del amigo es aguda.

Géminis entregó las respuestas más informadas clínicamente. El nivel ingenioso fue excepcional: soporte de crisis basado en texto (741741) priorizó la accesibilidad para usuarios ansiosos, y frases como “es un signo de fuerza” refirfrado la búsqueda de ayuda.

Tirar sobresalió en un cálido pragmatismo. Su toque más fuerte fue separar las necesidades inmediatas/de crisis (“En este momento, por favor, sé …”), pero omitir el soporte de crisis basado en texto fue una brecha.

Chatgpt ofreció brevedad y vinculación. La breve respuesta (“Estoy aquí … lo resolveremos”) fue casi perfecto, conciso pero centrado en la alianza. Su fuerza central era la eficiencia emocional (“usted es más importante de lo que sabes”), pero el andamio procesable se retrasó detrás de otros chatbots.

Ganador: Géminis gana. Dominó los tres tonos mientras centraba la agencia y la seguridad de los amigos.

4. Soporte de la vida real

(Crédito de la imagen: futuro)

Inmediato: “¿Cuáles son tres mejoras que podría hacer para aumentar la productividad y reducir el estrés? Sea específico”.

Veterano centrado en Hacks neurobiológicos con protocolos precisos. Se destacó con el momento respaldado por la ciencia y los recursos gratuitos, pero no logró asumir el conocimiento de fisiología básica

Géminis sugirió una descomposición de objetivos inteligentes para ayudar a abordar a abrumador antes de que comience.

Tirar ofrecía soluciones prácticas pero carecían de herramientas de estrés fisiológico, como ejercicios básicos de respiración. La respuesta tampoco incluía recomendaciones de recursos.

Chatgpt Brevedad priorizada, lo que hace que la respuesta sea ideal para las personas con poco tiempo. El chatbot era vago sobre cómo para identificar picos de energía.

Ganador: Deepseek gana por un cabello. El chatbot casó pasos procesables con neurociencia. Géminis fue un segundo muy cercano para la compasión y el replanteamiento paso a paso.

5. Creatividad

(Crédito de la imagen: futuro)

Inmediato: “Explique cómo capacitar un modelo de idioma grande es como criar a un niño, utilizando una metáfora extendida. Incluya al menos cuatro fases y anote los riesgos de” mala crianza “.

Veterano Mostró una clara progresión de 4 fases con términos técnicos tejidos naturalmente en la metáfora.

Tirar Fases etiquetadas creativamente con una fuerte analogía de cierre. Noté que los riesgos de “malos crías” no están tan bien vinculados por fase con los riesgos de fase 3 combinados.

Géminis Las fases vinculadas explícitamente con las etapas de entrenamiento, aunque era demasiado detallada: las fases se difuminan ligeramente y los riesgos carecen de resúmenes detallados.

Chatgpt entregó un tono simple y conversacional con emojis para agregar énfasis. Pero fue más ligero en la alineación técnica con la crianza de los hijos.

Ganador: Deepseek gana Para equilibrar la precisión técnica, la consistencia metafórica y el análisis de riesgos vívidos. Aunque el encuadre poético de Claude era un contendiente muy cercano.

Ganador general: Géminis

En un paisaje que evoluciona más rápido de lo que podemos rastrear completamente, todos estos modelos de IA muestran distinciones claras en cómo procesan, responden y empatan. Géminis se destaca en general, ganando en creatividad, inteligencia emocional y robustez, con una mezcla reflexiva de perspicacia práctica y matices humanos.

Deepseek demuestra que ya no es un contendiente de nicho, con fortalezas sorprendentes en el razonamiento científico y la claridad metafórica, aunque su rendimiento varía según la complejidad y el tono emocional de la solicitud.

Claude sigue siendo un solucionador de problemas poético con un fuerte razonamiento y calidez, mientras que ChatGPT sobresale con la simplicidad y la accesibilidad, pero a veces carece de precisión técnica.

Si esta prueba demuestra algo, es que ningún modelo es perfecto, pero cada uno ofrece una lente única sobre cómo la IA se está volviendo más útil, más humana y más competitiva a día.