Noticias
Todo lo que necesitas saber
Published
5 meses agoon

Lanzado inicialmente en diciembre de 2023, Google Gemini ha experimentado recientemente una actualización sustancial con el lanzamiento a principios de diciembre de Gemini 2.0. Está diseñado para lo que Google llama la “era agente”, con capacidades que le permiten actuar de manera más independiente en procesos complejos de varios pasos.
Otras mejoras principales incluyen procesamiento nativo de imágenes y audio, tiempos de respuesta más rápidos, capacidades de codificación mejoradas y nuevas integraciones que se están desarrollando con otras aplicaciones y soluciones de Google para ayudar a alimentar su teléfono inteligente, computadora y otros dispositivos conectados con Android.
Relacionado
5 formas sencillas de potenciar tu Android con Google Gemini
¿El asesino del Asistente de Google?
Una avalancha vertiginosa de nuevos modelos Gemini

Google ha estado lanzando un montón de modelos de IA diferentes últimamente, con múltiples versiones nuevas lanzadas en las últimas semanas. En ciertos aspectos, como la velocidad en Flash 2.0, las mejoras son fácilmente perceptibles. Otros están en áreas más especializadas, como la codificación. Mientras tanto, 2.0 Pro aún está en desarrollo.
Los nuevos modelos 2.0 están disponibles en escritorio y, más recientemente, en la aplicación móvil Gemini, donde encontrarás un selector para elegir entre ellos. Y no olvidemos el modelo Nano en el dispositivo, que ya incluye ciertas funciones de Google Pixel, como los resúmenes de llamadas. También vale la pena señalar que otro modelo nuevo, 2.0 Experimental Advanced, apareció en el escritorio en los últimos días.
Sin embargo, como señala Taylor Kerns, Géminis se está volviendo más complejo y cada vez es más difícil realizar un seguimiento de todas las variantes. Como no hay mucha información disponible sobre Experimental Advanced, me quedé con los dos en la comparación a continuación.
Característica | Géminis 1.5 Pro | Experimental Flash Géminis 2.0 |
Ventana de contexto | 1 millón de tokens (alrededor de 750.000 palabras o 1.500 páginas de texto) | 1 millón de tokens (alrededor de 750.000 palabras o 1.500 páginas de texto) |
Velocidad | Respuestas en unos segundos | Aproximadamente 2 veces más rápido |
Consumo de energía | Más alto | Más bajo |
Razonamiento/Lógica | Fuerte razonamiento y colaboración. | Reclama un razonamiento mejorado y agrega capacidades de agente |
Multimodal | Imagen y audio convertidos a texto para su procesamiento. | Procesamiento nativo de imágenes y audio. Ahora puede “hablar” usando voces de IA. |
Creación de imágenes | fue suspendido | Apoyado |
Codificación | Puede generar código | Puede generar y ejecutar código, analizar respuestas API e integrar datos en aplicaciones externas. |
Gemini 2.0 Flash tiene que ver con velocidad y eficiencia

Fuente: Google
Como sugiere el nombre, Gemini 2.0 Flash está diseñado para la velocidad. Google afirma que duplica la velocidad de su predecesor y, como usuario de 1.5 Pro y 2.0 Flash Experimental, puedo dar fe de su rapidez.
2.0 proporciona respuestas casi instantáneas a las mismas consultas que podrían tardar unos segundos en 1.5 Pro. Puede que esto no parezca un impacto enorme, pero la respuesta instantánea abre un nuevo potencial para aplicaciones en tiempo real, como las interacciones de voz. También hace que la experiencia general del usuario parezca más refinada. A pesar de su mayor potencia, Gemini 2.0 Flash también está diseñado para ser más eficiente energéticamente, lo que podría traducirse directamente en una mejor duración de la batería de su teléfono inteligente.
Gemini 2.0 Flash ofrece capacidades mejoradas en otras áreas centrales. Google dice que supera a Gemini 1.5 Pro en tareas complejas como codificación, matemáticas y razonamiento lógico. Además, Gemini 2.0 Flash ahora puede ejecutar código directamente, procesar de forma autónoma respuestas API y llamar a funciones definidas por el usuario. 2.0 está empezando a parecerse más a una solución de desarrollo de un extremo a otro que a un simple generador de código.
Géminis quiere ser tu agente de IA

La IA agente lleva a Gemini hacia la asistencia proactiva. Esto significa que Gemini ahora puede actuar como agente y realizar tareas de varios pasos en su nombre. Las aplicaciones futuras incluirán de todo, desde juegos y robótica hasta planificación de viajes.
Digamos que estás planeando un viaje a Tokio. En lugar de simplemente pedirle a Gemini sugerencias turísticas, podría pedirle que “cree un itinerario detallado para un viaje de 5 días a Tokio, que incluya atracciones imperdibles, recomendaciones de restaurantes locales y costos estimados”. Probé exactamente este mensaje y la plataforma generó un itinerario diario convincente para mí. Pero todavía faltan componentes.
En teoría, Géminis podría incluso ir más allá reservando vuelos y alojamiento, reservando mesas en restaurantes y mucho más. De hecho, Flash 2.0 se integra con Google Flights y puede mostrar la disponibilidad de hoteles en su destino, pero el paso final de automatizar todo el proceso aún está por llegar. Es fácil ver que esto podría ser difícil de resolver, ya que reservar el vuelo equivocado, por ejemplo, puede literalmente conllevar un precio elevado. ¡Imagina una IA que te reserva un viaje al Springfield equivocado!
Gemini 2.0 puede ver, oír y hablar

Los avances en entrada y salida multimodal dentro de Gemini 2.0 son otra característica clave. Al integrar perfectamente información de diversas fuentes como texto, imágenes, vídeo y audio, Gemini 2.0 puede experimentar el mundo de forma más parecida a como lo hacemos nosotros. Esto allana el camino para una comunicación más humana.
Gemini 2.0 ahora puede conversar usando una voz AI. En la aplicación móvil, encontré varias voces diferentes para elegir, seleccioné una que me gustó y tuve una conversación fluida y sorprendentemente natural en la que le hice preguntas a la IA sobre una ciudad que me gustaría visitar. El nivel de esfuerzo fue definitivamente menor que escribir consultas y leer respuestas. Si bien esta funcionalidad no es nueva para la industria (piense en las aplicaciones “complementarias” de IA), sí lo es para Gemini.
El procesamiento nativo de imágenes y audio ofrece mejoras notables
Una mejora interesante en Gemini 2.0 es su capacidad para procesar imágenes y audio directamente. Por el contrario, sus predecesores convertían estas entradas en texto, lo que provocaba una mayor pérdida de información. El procesamiento directo permite una comprensión más profunda de la entrada. Gemini 2.0 no sólo puede identificar elementos dentro de una imagen o audio, sino que también puede comprender las interrelaciones y la escena en su conjunto.
Durante las pruebas, introduje en Gemini 2.0 Flash una imagen que tomé mirando desde mi oficina. En primer plano hay una mampara de ventana, mientras que en el medio hay arbustos y otros objetos. La IA supo de inmediato que la foto fue tomada a través de una pantalla y describió con gran detalle otros elementos de la escena. En general, descubrí que el modelo 2.0 ofrece un análisis de imágenes más matizado y detallado que la versión anterior.
La generación de imágenes de Géminis ha vuelto, pero ¿a alguien le importa?
A pesar de la fanfarria en torno a las capacidades mejoradas de Gemini 2.0, el regreso de su función de generación de imágenes Imagen fue un poco aburrido. Después de la controversia inicial y la posterior desactivación de la función debido a sesgos e imprecisiones, el relanzamiento parece poco interesante. Tal vez Imagen se haya diluido para evitar controversias adicionales, o tal vez sea simplemente que la novedad de la generación de imágenes mediante IA desapareció durante la larga pausa de Google.

La imagen de arriba es lo que Gemini 2.0 Flash Experimental creó cuando se le pidió “crear la imagen más interesante que pueda evocar”. Si bien entiendo que es un mensaje subjetivo, aun así llamaría al resultado decepcionante. En el mejor de los casos, parece una escena de un videojuego.
A través de más experimentación, cuando le pedí a 2.0 Flash Experimental simplemente que “creara una imagen de personas”, se negó. Volver a 1.5 Pro y dar el mismo mensaje resultó en una imagen similar a una fotografía de archivo de un grupo de amigos en colores vibrantes. Con Imagen, vemos a través de los ojos de la IA de Google y su perspectiva no es muy inspiradora.
Nuevas integraciones presagian el futuro

Fuente: Google
Al integrar las capacidades de Gemini en servicios centrales como Búsqueda, Maps y Workspace, Google pretende ofrecer una experiencia de usuario más unificada.
En el futuro, sus consultas de búsqueda en Google generarán respuestas dinámicas impulsadas por inteligencia artificial que probablemente aprovecharán información de sus correos electrónicos, documentos e incluso su historial de ubicaciones para brindar resultados más relevantes personalmente. Google ya está experimentando con resúmenes de búsqueda de IA que incluyen descripciones generales de audio al estilo de su producto hermano, NotebookLM.
Iniciativas iniciales como el Proyecto Astra y el Proyecto Mariner finalmente están viendo la luz en los últimos modelos Gemini. Astra comprende la experimentación con agentes de código impulsados por IA, como Jules. Mientras tanto, Mariner podría permitir tareas como completar formularios automáticamente o resumir páginas web. Estos proyectos son esencialmente los pilares filosóficos sobre los que Google desarrolla sus aplicaciones y servicios de IA.

Relacionado
El modelo experimental Gemini 2.0 Advanced de Google ya está aquí, pero no para todos
La suscripción gratuita de tu Pixel puede resultarte útil
Google está construyendo una base sólida de inteligencia artificial con Gemini
Gemini 2.0 es un importante paso adelante para la IA de Google, ya que ofrece velocidades más rápidas, razonamiento mejorado y una integración multimodal perfecta. El mediocre retorno de la generación de imágenes y la confusa variedad de variantes de modelos resaltan las complejidades de esta categoría en rápido movimiento.
Sin embargo, los avances en IA agente, nuevas capacidades de codificación, voz e imagen, junto con una integración más profunda con los servicios centrales de Google presagian cosas buenas por venir en 2025.
You may like
Noticias
Operai gana la demanda por difamación presentada por el activista de los derechos de las armas sobre reclamos de malversación de fondos alucinados
Published
2 horas agoon
20 mayo, 2025
En la decisión de ayer por el juez Tracie Cason (Georgia Super. Ct. Gwinnett County) en Walters v. Openai, LLCel activista de los derechos de armas Mark Walters demandó a OpenAi después de que el periodista Frederick Riehl (“editor de Ammoland.com, un sitio de noticias y defensa relacionada con los derechos de la Segunda Enmienda”) recibió una alucinación generada por IA de Chatgpt que alegaba que Walters estaba siendo demandado por presunta presunta sobresslemento. El tribunal otorgó un juicio sumario de OpenAI, concluyendo que OpenAi debe prevalecer “por tres razones independientes”:
[1.] En Contexto, un lector razonable no habría entendido las acusaciones “podrían ser” razonablemente entendidas que describen hechos reales “,”, “,” que es un elemento clave de un reclamo de difamación. El Tribunal no concluyó que OpenAi y otras compañías similares son categóricamente inmunes cada vez que incluyen un descargo de responsabilidad, sino que declaró que “el descargo de responsabilidad o el lenguaje de advertencia pesan en la determinación de si este objetivo objetivo, el estándar de ‘lector razonable’ se cumple”, y que “en las circunstancias presentes aquí, un lector razonable en la posición de Riehl no podría haber concluido que el chatgptutputppppput en la comunicación ” en realidad ‘: las hechos reales’ en realidad ” en realidad ”.
{Riehl pegó secciones del Fergusón queja [a Complaint in a civil case that Riehl was researching] en Chatgpt y le pidió que resumiera esas secciones, que hizo con precisión. Riehl luego proporcionó un enlace de Internet, o URL, a la queja a ChatGPT y le pidió que resumiera la información disponible en el enlace. ChatGPT respondió que “no tenía acceso a Internet y no puede leer ni recuperar ningún documento”. Riehl proporcionó la misma URL nuevamente. Esta vez, Chatgpt proporcionó un resumen diferente e inexacto del Fergusón Queja, diciendo que implicaba acusaciones de malversación de malversación por parte de un tesorero y director financiero no identificado de SAF. Riehl nuevamente proporcionó la URL y le preguntó a ChatGPT si podía leerla. Chatgpt respondió “sí” y nuevamente dijo que la queja involucraba acusaciones de malversación de fondos; esta vez, dijo que el malversador acusado era un individuo llamado Mark Walters, quien Chatgpt dijo que era el tesorero y director financiero de la SAF.}
En esta interacción específica, ChatGPT advirtió a Riehl que no podía acceder a Internet o acceder al enlace al Fergusón Queja que Riehl le proporcionó y que no tenía información sobre el período de tiempo en el que se presentó la queja, que fue después de su “fecha de corte de conocimiento”. Antes de que Riehl proporcionara el enlace a la queja, ChatGPT resumió con precisión el Fergusón Queja basada en el texto riehl ingresada. Después de que Riehl proporcionó el enlace, y después de ChatGPT inicialmente advirtió que no podía acceder al enlace, ChatGPT proporcionó un resumen completamente diferente e inexacto.
Además, los usuarios de ChatGPT, incluido Riehl, fueron advertidos repetidamente, incluso en los términos de uso que gobiernan las interacciones con ChatGPT, que ChatGPT puede y a veces proporciona información fácticamente inexacta. Un usuario razonable como Riehl, que era consciente de la experiencia pasada que ChatGPT puede y sí proporciona “respuestas ficticias planas”, y quién había recibido las repetidas renuncias que advierte que la producción equivocada era una posibilidad real, no habría creído que el resultado estaba diciendo “hechos reales” sobre Walters sin intentar verificarlo …
Eso es especialmente cierto aquí, donde Riehl ya había recibido un comunicado de prensa sobre el Fergusón Queja y tuvo acceso a una copia de la queja que le permitió verificar de inmediato que la salida no fuera verdadera. Riehl admitió que “en aproximadamente una hora y media” había establecido que “lo que sea [Riehl] estaba viendo “en la producción de Chatgpt” no era cierto “. Como Riehl testificó, él ” entendió que la máquina fantaseaba por completo. …
Por separado, es indiscutible que Riehl en realidad no creyera que el Fergusón La queja acusó a Walters de malversación de la SAF. Si el individuo que lee una declaración desafiada no cree subjetivamente que sea real, entonces la declaración no es difamatoria como una cuestión de derecho.… [Riehl] Sabía que Walters no era, y nunca había sido, el tesorero o director financiero de la SAF, una organización para la cual Riehl sirvió en la junta directiva …
[2.a.] El tribunal también concluyó que Walters no podía mostrar ni siquiera negligencia Por parte de Operai, que se requiere para todas las reclamaciones de difamación sobre asuntos de preocupación pública:
El Tribunal de Apelaciones ha sostenido que, en un caso de difamación “,[t]El estándar de conducta requerido de un editor … se definirá por referencia a los procedimientos de un editor razonable en [its] El puesto habría empleado antes de publicar [an item] como [the] uno [at issue. A publisher] será mantenido a la habilidad y experiencia normalmente ejercida por miembros de [its] profesión. La costumbre en el comercio es relevante pero no controladora “. Walters no ha identificado evidencia de qué procedimientos un editor razonable en la posición de Openal habría empleado en función de la habilidad y la experiencia que normalmente ejercen los miembros de su profesión. Tampoco Walters ha identificado ninguna evidencia que OpenAI no cumpliera con este estándar.
Y Openai ha ofrecido evidencia de su experto, el Dr. White, que Walters no refutó ni se abordó, lo que demuestra que Operai lidera a la industria de la Liga Americana al intentar reducir y evitar la producción equivocada como la producción desafiada aquí. Específicamente, “Openai ejerció un cuidado razonable en el diseño y la liberación de Chatgpt basado en ambos (1) los esfuerzos líderes en la industria OpenAi emprendió para maximizar la alineación de la producción de ChatGPT a la intención del usuario y, por lo tanto, reducen la probabilidad de alucinamiento; y (2), proporcionando a las advertencias recurrentes a los usuarios sobre la posibilidad de alucinaciones en la producción de Chatgpt. ChatGPT y los diversos LLM que OpenAI ha puesto a disposición de los usuarios a través de ChatGPT. Operai también ha tomado medidas extensas para advertir a los usuarios que ChatGPT puede generar resultados inexactos a veces, lo que niega aún más cualquier posibilidad de que Walters pueda mostrar OpenAi fue negligente …
Ante esta evidencia indiscutible, el abogado de Walters afirmó el argumento oral de que OpenAi era negligente porque “un hombre prudente se encargaría de no desatar un sistema en el público que forme declaraciones falsas aleatorias sobre los demás … En otras palabras, el abogado de Walters argumentó que debido a que ChatGPT es capaz de producir una producción errónea, OpenAi tuvo la culpa simplemente al operar ChatGpt en absoluto, sin tener en cuenta los procedimientos de un editor razonable en [OpenAl’s] el puesto habría empleado “o a la” habilidad y experiencia normalmente ejercida por miembros de [its] profesión. “El tribunal no es persuadido por el argumento del demandante.
Walters no ha identificado ningún caso que tenga en cuenta que un editor es negligente como una cuestión de ley de difamación simplemente porque sabe que puede cometer un error y por una buena razón. Tal regla impondría un estándar de responsabilidad estricta, no negligencia, porque sería responsable de OpenAi por lesiones sin ninguna “referencia a” un grado razonable de habilidad y cuidado “medido contra una determinada comunidad”. La Corte Suprema de los Estados Unidos y la Corte Suprema de Georgia han sostenido claramente que un demandante de difamación debe demostrar que el acusado actuó con “al menos negligencia ordinaria” y puede no responsabilizar a un acusado “sin culpa”. …
[2.b.] El tribunal también concluyó que Walters era una figura pública y, por lo tanto, tuvo que mostrar no solo negligencia, sino también Falsidad Conocer o imprudente por parte de OpenAi (llamada “malicia real”):
Walters califica como una figura pública dada su prominencia como presentador de radio y comentarista sobre los derechos constitucionales, y la gran audiencia que ha construido para su programa de radio. Admite que su programa de radio atrae a 1,2 millones de usuarios por cada segmento de 15 minutos y se llama a sí mismo ” la voz más fuerte en Estados Unidos que lucha por los derechos de las armas “. Como el demandante en Williams v. Trust Company of Georgia (Ga. App.), Walters es una figura pública porque ha “recibido publicidad generalizada por sus derechos civiles … actividades”, tiene “su propio programa de radio”, ” llevó su causa a la gente a pedir el apoyo del público “, y es” franco sobre asignaturas de interés público “. Además, Walters califica como una figura pública porque tiene” una oportunidad más real para contrarrestar falsas declaraciones falsas que las personas privadas que normalmente disfrutan de las personas que normalmente se disfrutan de la radio de radio con una gran audiencia con una gran audiencia de radio con una gran audiencia con un audiencia de radio. Las declaraciones de chatgpt falsas en cuestión aquí … [And] Como mínimo, Walters califica como una figura pública de propósito limitado aquí porque estas declaraciones son claramente “pertinentes” a la “participación” admitida de Walters en los “controversos públicos[ies]”que están relacionados con la salida de chatgpt en cuestión aquí …
Los dos argumentos de Walters de que ha demostrado malicia real. Primero, argumenta que Operai actuó con “malicia real” porque OpenAi dijo a los usuarios que ChatGPT es una “herramienta de investigación”. Pero esta afirmación no se relaciona de ninguna manera con si OpenAi sabía subjetivamente que la producción de ChatGPT desafiada era falsa en el momento en que se publicó, o ignoraba imprudentemente la posibilidad de que pudiera ser falso y lo publicara de todos modos, que es lo que requiere el estándar de “malicia real”. Walters no presenta evidencia de que alguien en OpenAi tuviera forma de saber que la producción que recibió probablemente sería falsa … [The] El estándar de “malicia real” requiere prueba de la “conciencia subjetiva del acusado de la falsedad probable” …
En segundo lugar, Walters parece argumentar que Operai actuó con “malicia real” porque es indiscutible que OpenAi era consciente de que ChatGPT podría cometer errores al proporcionar salida a los usuarios. El mero conocimiento de que un error fue posible Se encuentra muy por debajo de la “evidencia clara y convincente” requerida de que OpenAi en realidad “tenía una conciencia subjetiva de la falsedad probable” cuando ChatGPT publicó la producción cuidada específica en sí …
[3.] Y el tribunal concluyó que en cualquier caso Walters tuvo que perder porque (a) no podía mostrar daños reales, (b) No pudo recuperar presuntos daños, porque aquí la evidencia refuta cualquier presunción de daño, dado que Riehl era la única persona que vio la declaración y no lo creyó, y (c) bajo la ley de Georgia “,”.[A]LL Libel Demandantes que tienen la intención de buscar daños punitivos [must] Solicite una corrección o retracción antes de presentar su acción civil contra cualquier persona para publicar una declaración falsa y difamatoria “, y no se hizo dicha solicitud aquí.
Una decisión interesante, y bien podría ser correcta (ver mi Modelos de difamación grandes Artículo para la imagen legal más grande), pero está vinculado estrechamente a sus hechos: en otro caso, donde el usuario no tenía tantas señales de que la afirmación sea falsa, o cuando el usuario distribuyó más ampliamente el mensaje (que puede haber producido más daños), o cuando el demandante no fue una cifra pública, o cuando el demandante había alertado al demandante del demandante y aún no lo hizo a la demandante que no lo hizo, el resultado, el resultado. Para comparar, consulte el Starbuck v. Meta Platforms, Inc. Caso discutido en esta publicación de hace tres semanas.
Tenga en cuenta que, como es común en los tribunales de algunos estados, la decisión adopta en gran medida una orden propuesta presentada por la parte que prevaleció sobre la moción de juicio sumario. Por supuesto, el juez ha aprobado la orden y está de acuerdo con lo que dice (ya que podría haber editado fácilmente partes con las que no estaba de acuerdo); Pero el encuadre retórico en tales casos a menudo es más el de la parte prevaleciente que la del juez.
Operai está representado por Stephen T. Labriola y Ethan M. Knott (Fellows Labriola LLP); Ted Botrous, Orin Snyder y Connor S. Sullivan (Gibson, Dunn & Crutcher LLP); y Matthew MacDonald (Wilson Sonsini Goodrich y Rosati, PC).
Noticias
New Android 16, Gemini AI y todo lo demás que esperar en la nota clave del martes
Published
7 horas agoon
20 mayo, 2025Google I/O, la conferencia anual de desarrolladores del gigante de la búsqueda, comienza el martes 20 de mayo. El evento es posiblemente el más importante en el calendario anual de la compañía, ofreciendo la oportunidad para que la compañía comparta un vistazo a todo lo que ha estado trabajando durante el año pasado, y contextualiza sus mayores prioridades durante los próximos doce meses.
Aparentemente, la tarjeta de baile para Google estaba tan llena que la compañía salió de un escaparate de Android dedicado una semana antes. (Vea todo lo que se anunció en el Show de Android o vaya a nuestro Blog LiveBlog para tener una idea de cómo se desarrollaron las cosas). Con ese evento ahora detrás de nosotros, Google puede mantenerse enfocado en su competencia central más importante: la IA.
La presentación de Google vendrá inmediatamente después de los anuncios de tres grandes rivales en los últimos días. Además de la costa del Pacífico, Microsoft está organizando su Conferencia de Desarrollador Build, donde ya ha presentado una aplicación de AI de copilotas actualizada. Mientras tanto, en el Show de Computex en Taiwán, el CEO de NVIDIA, Jensen Huang, destacó una asociación con Foxconn para desarrollar una “supercomputadora de fábrica de IA” impulsada por 10,000 chips de IA Blackwell. Y Meta celebró su conferencia debut Llamacon AI el mes pasado, pero los planes del CEO Mark Zuckerberg para el dominio de la inteligencia artificial han llegado a algunos enganches. (Apple compartirá su hoja de ruta AI actualizada el 9 de junio cuando comience su conferencia de desarrolladores de WWDC).
Si desea sintonizar desde casa y seguir mientras Google hace sus anuncios, consulte nuestro artículo sobre cómo ver la nota clave de Google I/O 2025. También estaremos en Live Blogging el evento, por lo que puede venir a Engadget para las últimas noticias.
Android 16
La presentación presentó al presidente del ecosistema de Android, Sameer Samat, quien se hizo cargo de Burke en 2024. Vimos a Samat y a sus colegas mostrar años, Android no ha tenido mucha atención en la conferencia anual de desarrolladores de Google. Afortunadamente, el show de Android de la semana pasada, el sistema operativo móvil de Google permitió que el centro de atención tome el centro de atención durante al menos un día.
La presentación presentó al presidente del ecosistema de Android, Sameer Samat, quien se hizo cargo de Burke en 2024. Vimos a Samat y sus colegas mostrar el nuevo diseño expresivo del nuevo material 3, y lo que aprendimos confirmó algunas de las características que se filtraron anteriormente, como la barra de “notificaciones continuas”. Material 3 Expressive también está llegando a Wear OS 6, y la compañía está ampliando el alcance de Gemini al llevarlo a su plataforma Smartwatch, Android Auto y Google TV. Android también está ampliando sus características de detección de estafas y un centro de búsqueda refinado que verá soporte para la conectividad satelital más adelante en el año.
Hablando de tiempo, Google ya ha confirmado que el nuevo sistema operativo llegará en algún momento antes de la segunda mitad del año. Aunque hoy no lanzó una construcción estable de Android 16, Samat compartió durante el programa que Android 16 (o al menos parte) llegará el próximo mes a los dispositivos de píxeles. Y aunque la compañía cubrió algunas características nuevas que llegaron a Android XR, el director senior de Android Product y UX Guemmy Kim dijo durante la presentación que “compartiremos más en Android XR en E/S la próxima semana”.
Claramente parece que aún está por venir, y no solo para Android XR. No obtuvimos confirmación en el Autoridad de Android Informe que Google podría agregar un selector de fotos más robusto, con soporte para soluciones de almacenamiento en la nube. Eso no significa que no estará en Android 16, podría ser algo que la compañía no pudiera mencionar en su escaparate de 30 minutos. Además, Google ha estado lanzando nuevas funciones de Android en una cadencia trimestral últimamente, en lugar de esperar hasta una ventana de actualización anual para poner a disposición actualizaciones. Es posible que veamos más a Android 16 a medida que avanza el año.
Uno de los mejores lugares para tener una idea de lo que vendrá en Android 16 está en su versión beta, que ya ha estado disponible para los desarrolladores y actualmente está en su cuarta iteración. Por ejemplo, aprendimos en marzo que Android 16 traerá el soporte de Auracast, lo que podría facilitar la escucha y cambiar entre múltiples dispositivos Bluetooth. Esto también podría permitir a las personas recibir audio Bluetooth en audífonos que han emparejado con sus teléfonos o tabletas.
Android XR
¿Recuerdas Google Glass? ¿No? ¿Qué tal Daydream? ¿Quizás cartón? Después de enviar (al menos) tres proyectos XR al cementerio, pensaría que incluso Google diría que lo suficiente es suficiente. En cambio, la compañía se está preparando para lanzar Android XR después de una vista previa de la plataforma a fines del año pasado. Esta vez, la compañía dice que el poder de sus modelos Gemini AI hará que las cosas sean diferentes. Sabemos que Google está trabajando con Samsung en un proyecto con nombre en código auricular Moohan. El otoño pasado, Samsung insinuó que el dispositivo podría llegar en algún momento de este año.
Ya sea que Google y Samsung Demo Project Moohan en E/S, imagino que el gigante de la búsqueda tendrá más que decir sobre Android XR y los socios del ecosistema que ha trabajado para llevar a su lado para la iniciativa. Esto está en línea con lo que Kim dijo sobre más sobre Android XR que se comparte en E/S.
Ai, ai y más ai
Si Google sintió la necesidad de dividir a Android en su propio escaparate, es probable que obtengamos más anuncios relacionados con la IA en E/S que nunca. La compañía no ha proporcionado muchas sugerencias sobre lo que podemos esperar en ese frente, pero si tuviera que adivinar, es probable que las características como las descripciones de IA y el modo AI obtengan actualizaciones sustantivas. Sospecho que Google también tendrá algo que decir sobre Project Mariner, el agente de vigilancia web que se demostró en la E/S 2024. De cualquier manera, Google es una compañía de IA ahora, y cada E/S en el futuro lo reflejará.
Proyecto Astra
Hablando de la IA, Project Astra fue una de las demostraciones más impresionantes que Google mostró en I/O 2024. La tecnología aprovechó al máximo las últimas capacidades multimodales de los modelos Gemini de Google para ofrecer algo que no habíamos visto antes de la compañía. Es un asistente de voz con características avanzadas de reconocimiento de imágenes que le permite conversar sobre las cosas que ve. Google visualiza el proyecto Astra algún día proporciona un asistente artificial verdaderamente útil.
Sin embargo, después de ver una demostración en persona de Astra, el equipo de Engadget sintió que la tecnología necesitaba mucho más trabajo. Dado el proyecto Splash que Astra realizó el año pasado, hay una buena posibilidad de que pudiéramos obtener una actualización sobre él en I/O 2025.
Un competidor de Pinterest
Según un informe de La informaciónGoogle podría estar planeando presentar su propia versión de Pinterest en E/S. Esa caracterización es cortesía deLa información, Pero según las características descritas en el artículo, los miembros del equipo de Engadget lo encontraron más que recuerdan a Cosmos. Cosmos es una versión reducida de Pinterest, que permite que las personas guarden y seleccionen todo lo que vean en Internet. También le permite compartir sus páginas guardadas con otros.
Según los informes, la versión de Google mostrará los resultados de la imagen basados en sus consultas, y puede guardar las imágenes en diferentes carpetas en función de sus propias preferencias. Entonces, digamos que estás organizando un lookbook basado en Jennie de Blackpink. Puede buscar sus atuendos y guardar sus favoritos en una carpeta que puede titular “Lewks”, tal vez.
No está claro si esto está simplemente incorporado en la búsqueda o existe como un producto independiente, y tendremos que esperar hasta que E/S para ver si el informe era preciso y cómo es realmente la característica.
Usa el sistema operativo
El año pasado, Wear OS no recibió una mención durante la principal nota principal de la compañía, pero Google realizó una vista previa de Wear OS 5 durante las sesiones de desarrolladores que siguieron. La compañía solo comenzó a implementar Wear OS 5.1 a Pixel Devices en marzo. Este año, ya hemos aprendido en el Show de Android que Wear OS 6 se acerca, con el material 3 expresivo en el adorno de su interfaz. ¿Aprenderemos más en I/O? No está claro, pero no sería un shock si eso fuera todo el tiempo de tiempo de aire que OS obtiene este año.
Cuaderno
Google ha saltado el arma y ya lanzó una aplicación independiente Notebooklm antes de E/S. La aplicación de toma de notas de aprendizaje automático, disponible en los navegadores de escritorio desde 2023, puede resumir documentos e incluso sintetizar resúmenes de podcast de estilo NPR completo para arrancar.
Todo lo demás
Google tiene un historial terrible cuando se trata de prevenir fugas dentro de sus rangos internos, por lo que la probabilidad de que la compañía pueda sorprendernos es baja. Aún así, Google podría anunciar algo que no esperamos. Como siempre, su mejor opción es visitar Engadget el 20 y 21 de mayo. Tendremos lo último de Google, junto con nuestro LiveBlog and Analysis.
Actualización, 5 de mayo 2025, 7:08 PM ET: Esta historia se ha actualizado para incluir detalles en una publicación de blog filtrada que discute “Material 3 Expresivo”.
Actualización, 6 de mayo 2025, 5:29 PM ET: Esta historia se ha actualizado para incluir detalles sobre Android 16 Beta, así como el soporte de Auracast.
Actualización, 8 de mayo 2025, 3:20 pm ET: Esta historia se ha actualizado para incluir detalles sobre cómo ver el programa de Android y la nota clave de E/S de Google, así como ajustar la introducción para la frescura.
Actualización, 13 de mayo de 2025, 3:22 PM ET: Esta historia se ha actualizado para incluir todos los anuncios del programa de Android y un nuevo informe de La información Acerca de una posible función de búsqueda de imágenes que debutan en E/S. La introducción también fue editada para reflejar con precisión lo que ha sucedido desde la última vez que se actualizó este artículo.
Actualización, 14 de mayo de 2025, 4:32 PM ET: Esta historia se ha actualizado para incluir detalles sobre otros eventos que ocurren al mismo tiempo que la E/S de Google, incluidas Microsoft Build 2025 y ComputeX 2025.
Actualización, 19 de mayo de 2025, 5:13 PM ET: Las noticias de IA competidores actualizadas de Microsoft, Meta y Nvidia, y los rumores e informes finales contextualizados antes de la E/S.
Si compra algo a través de un enlace en este artículo, podemos ganar comisión.

En 2017, poco después de que los investigadores de Google inventaron un nuevo tipo de red neuronal llamada Transformer, un joven ingeniero de OpenAi llamado Alec Radford comenzó a experimentar con ella. Lo que hizo que la arquitectura del transformador fuera diferente a la de los sistemas de IA existentes fue que podía ingerir y hacer conexiones entre los más grandes volúmenes de texto, y Radford decidió entrenar su modelo en una base de datos de siete mil libros en inglés no publicados: ruido, aventura, cuentos especulativos, la gama completa de fantasía e invención humana. Luego, en lugar de pedirle a la red que traduzca el texto, como lo habían hecho los investigadores de Google, lo llevó a predecir la siguiente palabra más probable en una oración.
La máquina respondió: una palabra, luego otra y otra, cada nuevo término inferido de los patrones enterrados en esos siete mil libros. Radford no le había dado reglas de gramática o una copia de Strunk and White. Simplemente lo había alimentado con historias. Y, de ellos, la máquina parecía aprender a escribir por su cuenta. Se sintió como un truco mágico: Radford volcó el interruptor, y algo vino de la nada.
Sus experimentos sentaron las bases para ChatGPT, lanzadas en 2022. Incluso ahora, mucho después de esa primera Jolt, la generación de texto aún puede provocar una sensación de incansable. Pídale a ChatGPT que cuente una broma o escriba un guión, y lo que devuelve, en ración bueno, pero de manera confiable, es una especie de curva estadística adecuada para el vasto corpus en el que fue entrenado, cada oración que contiene rastros de la experiencia humana codificada en esos datos.
Cuando estoy redactando un correo electrónico y un tipo, “Hola, muchas gracias por”, luego pausa, y el programa sugiere “tomar”, luego “el”, entonces “tiempo”, me he vuelto recientemente consciente de cuál de mis pensamientos diverge del patrón y qué se ajusta a él. Mis mensajes ahora están sombreados por la imaginación general de los demás. Muchos de los cuales, al parecer, quieren agradecer a alguien por tomar. . . el . . . tiempo.
Que el avance de Radford ocurrió en Operai no fue un accidente. La organización había sido fundada, en 2015, como un “Proyecto Manhattan sin fines de lucro para IA”, con fondos tempranos de Elon Musk y el liderazgo de Sam Altman, quien pronto se convirtió en su cara pública. A través de una asociación con Microsoft, Altman aseguró el acceso a poderosas infraestructuras informáticas. Pero, para 2017, el laboratorio todavía estaba buscando un logro de firma. En otra pista, los investigadores de Operai enseñaban a un robot virtual en forma de T para voltear: el bot intentaría movimientos aleatorios, y los observadores humanos votarían sobre qué se parecían a un flip. Con cada ronda de retroalimentación, mejoró, minimalmente, pero medidablemente. La compañía también tenía un espíritu distintivo. Sus líderes hablaron sobre la amenaza existencial de la inteligencia general artificial, el momento, definida vagamente, cuando las máquinas superarían la inteligencia humana, mientras la persiguen implacablemente. La idea parecía ser que la IA era potencialmente tan amenazante que era esencial construir una buena IA más rápido que cualquier otra persona podría construir una mala.
Incluso los recursos de Microsoft no eran ilimitados; Los chips y la potencia de procesamiento dedicado a un proyecto no se pueden usar para otro. A raíz del avance de Radford, el liderazgo de Openai, especialmente el genial Altman y su cofundador y científico jefe, el débilmente chamánico Ilya Sutskever, tomó una serie de decisiones fundamentales. Se concentrarían en modelos de idiomas en lugar de, por ejemplo, los robots de flujo posterior. Dado que las redes neuronales existentes ya parecían capaces de extraer patrones de los datos, el equipo decidió no concentrarse en el diseño de la red, sino para acumular la mayor cantidad de datos de capacitación posible. Se movieron más allá del caché de libros inéditos de Radford y se convirtieron en un pantano de transcripciones de YouTube y charla de tableros de mensajes: el lenguaje raspado de Internet en un arrastre generalizado.
Ese enfoque para el aprendizaje profundo requirió más poder informático, lo que significó más dinero, ejerciendo tensión en el modelo original sin fines de lucro. Pero funcionó. GPT-2 fue lanzado en 2019, un evento de época en el mundo de la IA, seguido por el ChatGPT más orientado al consumidor en 2022, que causó una impresión similar en el público en general. Los números de usuario aumentaron, al igual que una sensación de impulso místico. En un retiro fuera del sitio cerca de Yosemite, Sutskever, según los informes, incendió una efigie que representa la inteligencia artificial no alineada; En otro retiro, lideró a colegas en un canto: “Siente el Agi. Siente el agi”.
En el espinoso “Imperio de la IA: Dreams and Nightmares in Sam Altman’s OpenAi” (Penguin Press), Karen Hao rastrea las consecuencias de los avances de GPT a través de los rivales de OpenAi: Google, Meta, Antropic, Baidu, y argumenta que cada compañía, a su manera, se refleja las elecciones de Altman. El modelo de escala OpenAI a toda costa se convirtió en el incumplimiento de la industria. El libro de Hao es a la vez admirablemente detallado y un dedo puntiagudo largo. “Era específicamente OpenAi, con sus orígenes multimillonario, una inclinación ideológica única y la unidad singular de Altman, la red y el talento de recaudación de fondos, que creó una combinación madura por su visión particular de emerger y hacerse cargo”, escribe. “Todo lo que Openai hizo fue lo contrario de inevitable; los costos globales explosivos de sus modelos masivos de aprendizaje profundo, y la peligrosa raza que provocó en toda la industria para escalar tales modelos a los límites planetarios, solo podría haber surgido del único lugar que realmente hizo”. En otras palabras, hemos sido seducidos, llenos por la retórica espeluznante y de alta mentalidad de riesgo existencial. La historia de la evolución de la IA durante la última década, en la narración de Hao, no se trata realmente de la fecha de adquisición de la máquina o el grado de control humano sobre la tecnología, los términos del debate de AGI. En cambio, es una historia corporativa sobre cómo terminamos con la versión de AI que tenemos.
Hao escribe el “pecado original” de este brazo de tecnología, yacía en una decisión de un matemático de Dartmouth llamado John McCarthy, en 1955, para acuñar la frase “inteligencia artificial” en primer lugar. “El término se presta a las exageraciones casuales antropomorfizantes y sin aliento sobre las capacidades de la tecnología”, observa. Como evidencia, señala a Frank Rosenblatt, un profesor de Cornell que, a finales de los años cincuenta, ideó un sistema que podía distinguir entre cartas con un pequeño cuadrado a la derecha contra la izquierda. Rosenblatt lo promovió como el cerebro, en su camino hacia la sensibilidad y la autocreplicación, y estas afirmaciones fueron recogidas y transmitidas por la Nueva York Veces. Pero una vacilación cultural más amplia sobre las implicaciones de la tecnología significaba que, una vez que OpenAi, hizo su avance, Altman, su CEO, se veía para ser visto no solo como un administrador fiduciario sino también como ético. La pregunta de fondo que comenzó a burbujear alrededor del valle, Keach Hagey escribe en “The Optimist: Sam Altman, OpenAi, y la carrera para inventar el futuro” (Norton): “Primero susurró, luego murmuró y luego aparece en ensayos en línea elaborados de los desertores de la compañía: ¿podemos confiar en esta persona para llevarnos a Agi?”
Dentro del mundo de los fundadores de la tecnología, Altman podría haber parecido un candidato bastante confiable. Salió de sus veinte años no solo muy influyente y muy rico (lo cual no es inusual en Silicon Valley), sino con su reputación moral básicamente intacta (lo cual es). Criado en un suburbio de St. Louis en un hogar judío de reforma, el mayor de cuatro hijos de un desarrollador de bienes raíces y un dermatólogo, había sido identificado desde el principio como una especie de niño polimatico en John Burroughs, una escuela preparatoria local. “Su personalidad me recordó a Malcolm Gladwell”, le dice a Hagey la cabeza de la escuela, Andy Abbott. “Puede hablar de cualquier cosa y es realmente interesante”: computadoras, política, Faulkner, derechos humanos.
Altman salió como gay a los dieciséis años. En Stanford, según Hagey, cuya biografía es más convencional que la de Hao, pero es bastante convincente, lanzó una campaña estudiantil en apoyo del matrimonio homosexual y entretuvo brevemente la posibilidad de tomarlo nacional. En una feria empresarial durante su segundo año, en 2005, el altman físicamente leve se paró en una mesa, abrió su teléfono, declaró que la geolocalización era el futuro e invitó a cualquier persona interesada a unirse a él. Pronto, se retiró y dirigía una compañía llamada Loopt. Abbott recordó el momento en que escuchó que su antiguo estudiante iba a la tecnología. “Oh, no vayas en esa dirección, Sam”, dijo. “¡Eres tan agradable!”
Related posts

























































































































































































































































































































Trending
-
Startups12 meses ago
Remove.bg: La Revolución en la Edición de Imágenes que Debes Conocer
-
Tutoriales1 año ago
Cómo Comenzar a Utilizar ChatGPT: Una Guía Completa para Principiantes
-
Startups10 meses ago
Startups de IA en EE.UU. que han recaudado más de $100M en 2024
-
Recursos1 año ago
Cómo Empezar con Popai.pro: Tu Espacio Personal de IA – Guía Completa, Instalación, Versiones y Precios
-
Startups1 año ago
Deepgram: Revolucionando el Reconocimiento de Voz con IA
-
Recursos12 meses ago
Perplexity aplicado al Marketing Digital y Estrategias SEO
-
Recursos1 año ago
Suno.com: La Revolución en la Creación Musical con Inteligencia Artificial
-
Noticias10 meses ago
Dos periodistas octogenarios deman a ChatGPT por robar su trabajo