Connect with us

Noticias

What’s your favorite Gemini feature?

Published

on

My Galaxy S25 Ultra’s Now Bar is finally working a month too late

One of the biggest shake-ups with One UI 7 is the Now Bar, Samsung’s take on Apple’s Live Activities (and, on a lesser scale, the Dynamic Island). It surfaces a handful of contextual information to the corner of your display, including timers and Google Maps. Since I received my review unit last month, however, I’ve been unable to get sports scores to appear within Now Bar, despite following a handful of local Buffalo teams like the Bills and Sabres.

Well folks, after troubleshooting conversations, a lengthy mention in my review, and plenty of effort on my part to figure out what was stopping this feature, it’s finally fixed. When the Sabres returned to the ice this past Saturday — to absolutely whoop the Rangers in an improbable 8-2 beating — I saw every wonderful goal pop up on my S25 Ultra every step of the way.

If you run into a similar problem with sports scores in the Now Bar that I did, well, I wish I could offer advice. Unfortunately, I gave up on trying to fix this issue aro

User Display Picture

Android Police logo

Why Android 15 is better than iOS 18

Over here at Android Police, you’ll find a lot of people who like Android more than iOS, perhaps not all for the same reasons, but in our minds, Android is still the best place to be. But even if you feel this is a subject that is up for debate, there is no denying Android 15 offers plenty of features iOS doesn’t. As a matter of fact, we recently wrote about five ways Android 15 is better than iOS 18, so if you’d like to read more about what makes Android so great compared to iOS, click through and enjoy the list.

User Display Picture

Android Police logo

Name your favorite note-taking app

It’s a simple enough question, and yet it is likely few of us will agree on. It would seem choosing the perfect note-taking app is very personal, and I understand why we each have our own unique use cases. For me, I skip the grocery lists and go right for ideation. Keep is where I prefer to jot down notes for myself, usually title ideas for work, but I also keep track of fancy words I’d like to use and even keep lists of things I collect, like Game Boy games. All things any note-taking app should be able to handle, and yet I prefer the simplicity of Keep.

But what about you? What do you use note-taking apps for, and which app is your favorite?

User Display Picture

Android Police logo

Has Google Maps seemed a lot less reliable to you lately?

Google Maps — or mapping applications in general — might be one of the least appreciated aspects of our modern age. By the time I got my license, I already had a smartphone with Maps preloaded out of the box, but I have distinct memories of helping my parents get to new locations using printed directions from MapQuest, to say nothing of our dedicated TomTom GPS unit.

But as good as navigation apps might be, when they fail, it can be stressful. Missed turns, wrong exits, scrambling to fix a frozen app while flying down the interstate — anything going wrong with Google Maps can be cause for alarm, and lately, I’ve been noticing a lot going wrong. From trying to take me down one-way streets going the opposite direction to sending my fiancée in literal circles while leaving her job’s parking garage, the last year or so with Google Maps has caused me a lot of friction. Yet, any time I think about swapping apps — maybe to Google’s other app Waze, or even to Apple Maps on the iPhone — the ex

User Display Picture

Android Police logo

What is your favorite Android launcher?

The beauty of Android has always been its customization, and that often starts with your launcher. While the third-party launcher has lost some of its prominence in recent years, popular options like Nova Launcher, Action Launcher, and Niagara Launcher are still pushing things forward.

User Display Picture

Android Police logo

How often do you use your Pixel’s Call Screen feature?

I was recently complaining about how my spam call problem has grown worse during my use of my Pixel’s Call Screen feature. It seems like the more I use it, the more spam I get. But judging by the comments, I appear to be in the minority. So, what are you using Call Screen for, and are you finding it to be helpful in your day-to-day?

User Display Picture

Android Police logo

Are you receiving RCS messaging spam?

I know I sure do; I get a lot of fake shipping notifications, daily it seems, sometimes multiple a day. And I can see it plain as day, the numbers are foreign, typically from the UK, a dead giveaway the messages aren’t from UPS, DHL, or FedEx. I see a lot of complaints online too. So, have you, too, been receiving RCS spam messages as of late, or have you somehow escaped the fate of the masses?

User Display Picture

Android Police logo

Are you using a third-party launcher on Google/Android TV?

I recently switched to Projectivy Launcher because I was sick of Google adding more and more recommendations into my Android TV interface, more or less shoving advertisements for things I didn’t want to see, into my living room. Not only does my Shield TV run better when it doesn’t have to load videos in the background of the UI, I regained full control of how my TV looks.

I also know there are many out there who are perfectly fine with Google’s recommendations and enjoy Android/Google TV for what it is. But this got me thinking about how many people out there like me have installed a third-party launcher to clean things up. So, sound off in the comments whether or not you’ve considered or are using a third-party launcher on your Google/Android TV, as I have a feeling this trend is growing.

User Display Picture

Android Police logo

Have you used your Pixel’s astrophotography mode?

Taking pictures of the night sky isn’t something that ever occurred to me. I’ll use my phone to take quick shots of interesting things while out and about around town, but that’s about as much use as my phone cameras get. But, since I purchased a Pixel 9, I figured why not give its astrophotography mode a shot. And so I’ve dabbled a few times with mixed results. I can’t say it’s something I’ll go out of my way to use.

This got me wondering how many others out there make use of the Pixel’s astrophotography mode. So, if you’re a night sky shooter thanks to your Pixel, sound off in the comments below, and if you have a slick shot to share, all the better.

User Display Picture

Android Police logo

Show us your favorite AI generated wallpaper

Say what you want about AI, but it does appear to have one use that anyone can enjoy, and that’s wallpaper creation. I know I’ve dabbled with image creation in Gemini and Pixel Studio and have come away with some quality results. But there are still some issues with AI, like the inability to spell words correctly or show the correct amount of fingers. But if you stick to images without words or people, you’ll definitely find better results.

So, have you been playing with AI wallpaper generation, and if so, are you finding the results worthwhile? Hit the comments to share your favorite AI-generated wallpapers, and let’s see who is getting the best results with their creations.

User Display Picture

Android Police logo

How many of your iPhone friends have RCS bubbles now?

Now that the iPhone is sporting RCS in its messaging app, bringing together Android and iOS users for easy messaging that doesn’t ruin images and videos, I’ve been wondering how many of our readers know someone on iOS who is indeed taking advantage of RCS. For me, I know my friend group that uses iOS has remarked on the improvement in our group chats. But what about you, have you noticed your iOS friends and family are using RCS? Hit the comments to let us know, as I truly wonder if many iOS users give a hoot about messaging with RCS.

User Display Picture

Android Police logo

How often do you use Gemini?

There is no denying that Google is pushing Gemini into every space it can muster, from Messages to Gmail, there is no getting away from it. Sure, there is also the app, as well as a subscription tier for the app, but it would seem Google feels we all need some convincing to use its AI by shoving the service into everything. So this got me thinking: perhaps few are actually using Gemini, which is why I wanted to ask. How often do you use Gemini, or do you even use it at all? Hit the comments, as I have a sneaking suspicion nobody is all that interested in AI.

User Display Picture

Android Police logo

Have you switched from Google Assistant to Google Gemini yet?

Gemini is here in full force, and it finally offers a lot of the functionality of Google Assistant while still lacking some of the smoothness Assistant users have come to expect. This creates a situation where many are still using Google Assistant instead of switching over to Gemini. For me, I made the switch soon after Gemini was introduced, but I also never used Google Assistant, so the switch was painless for me. But what about you? Have you made the switch? Was it painful, or do you prefer Gemini? Hit the comments to let us know, as I have a sneaking suspicion there are more holdouts than expected.

User Display Picture

Android Police logo

Which One UI 7 features are you most excited about?

While we still don’t know when the first One UI 7 beta will drop, it’s coming nonetheless. Some screenshots have already leaked, and plenty of rumors are swirling about incoming features, as the UI is expected to see a major design overhaul. One leak suggests there will be a split notification panel, and another hints at live activity in the lockscreen and status bar. More or less, big changes are expected, so even though it is early days with little nailed down, there are already some possible features to look forward to.

So, what leaked feature has you most excited for One UI 7’s incoming drop? Hit the comments to let us know. For me, the split notification panel sounds like it could be a great addition.

User Display Picture

Android Police logo

Have you installed the Android 16 beta?

It’s out. The first Android 16 beta is here for anyone to test. But will you? I know I’m not the biggest fan of running beta software. Sure, plenty here at AP love to go digging to see what’s new, but that’s not my bag. I prefer a stable OS. But what about you? Have you thrown caution to the wind and installed the Android 16 beta, or are you more like me and happy keeping things stable and boring?

User Display Picture

Android Police logo

Which music streaming app is your favorite?

There are plenty of streaming music apps to choose from, from Spotify to Amazon Music, Apple Music, and YouTube Music. Despite the lack of originality in the app names, all of these services are fairly well received by their users. I’ve been subscribed to Spotify for years but have considered moving to Amazon Music for its high-quality audio. I’ve yet to take the plunge, but if Spotify continues to drag its feet instead of launching high-quality audio, the move seems inevitable. This is why I appreciate that we have so many excellent choices at our disposal.

Still, with so many to choose from, I thought it might be fun to ask what everyone is using and why. So hit the comments below to share which music streaming app is your current platform of choice.

User Display Picture

Android Police logo

Will you be cancelling YouTube Premium?

Apparently, YouTube Premium users across the world have been receiving emails about impending price hikes. Those in Ireland, Belgium, the Netherlands, and Italy will see higher fees across the service, including family plans, and Switzerland and Sweden will see higher Family subscriptions, with the Middle East, Singapore, Thailand, and Indonesia receiving higher Premium prices. And this is just what has been reported by users, so expect more territories to get hit (read more in the linked article).

But with this change, we here at AP have been wondering how many users will be canceling their YouTube Premium plans when the higher fees drop? It’s not like YouTube Premium is priced very well to begin with, with many taking issue with the cost not reflecting what you get (especially if you don’t need YouTube Music) and rising fees sure won’t help this situation. So, will you be one of the people dropping the service, or do you feel the higher fees are justified?

User Display Picture

Android Police logo

Do you prefer SMS authentication or QR codes?

I recently covered how Google wants to switch from SMS authentication codes to QR codes, which would be more secure for the user. But this got me thinking about whether anyone would prefer to stick with SMS. Is there a preference here, or should this be a no-brainer to make the switch? It’s not like one process is more involved than the other. You have to pull out your phone to get the SMS code, the same as you have to pull out your phone to scan a QR code with your camera. But hey, maybe there is an edge case I’m missing here. So, do you prefer SMS authentication or QR codes?

User Display Picture

Android Police logo

How often do you use the Google Play Store?

Back when Android was still young, the Google Play Store (at the time called Android Market) was actually fun to explore. It wasn’t filled with endless advertisements yet, it was a simple list categorized into genres. Heck, there was still a new release section back then, which is now so embarrassing that Google removed it from the website. Things have changed, and not for the better. The Play Store is a chore to navigate nowadays, to the point I know I go out of my way to avoid it. It’s a cluttered mess that would rather push apps you don’t want instead of actually using your years of data to showcase actual interests.

So are you also sick of the Play Store, like me, and avoid it at all costs? Or are you fine with the clutter as long as you can easily install new apps and games? Hit the comments to share, and let’s commiserate.

User Display Picture

Android Police logo

What’s the first version of Android you used?

My Android journey started with the HTC Hero on Sprint, way back in 2009. It had a chin and a trackball, and I loved it. Not only was HTC firing on all cylinders back then, but the phone designs were also actually fun, unlike how boring things are today. Part of that excitement also included the software, where the HTC Hero shipped with Android 1.5 and eventually got updated to Android 2.1. These were early days, and back then I was a theming machine hot off modding Windows Mobile devices, so was deep into changing how my Android devices looked, like when Android 2.1 dropped, I was installing ROMs, apps, and themes that got me the old Android 1.5 look with its white drawer tab. Sure, plenty was rouch around the edges, but the excitement of making your phone yours was as relevant back then as it is now.

So, where did your Android journey start? Which Android version was your first introduction to the OS?

User Display Picture

Android Police logo

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Cómo el soporte de video de Gemini Live me ayudó a cultivar plantas en el desierto

Published

on

Vi una demostración de la transmisión de video multimodal de Gemini Live y el soporte para compartir pantalla en Google I/O 2024, y es cierto que era un proyecto escéptico que Astra reduciría bien a los teléfonos inteligentes. Avance rápido aproximadamente un año después, y Project Astra está en manos de millones de Google Pixel 9, Samsung Galaxy S25 y Gemini Advanced Usuarios. Está listo, y está aquí, pero ¿es realmente útil?

La respuesta es que puede ser absolutamente, siempre y cuando sus casos de uso sean personales para usted. Por ejemplo, las características multimodales de Gemini Live no serán una mejor alternativa a Google Search o Circle para buscar en la mayoría de los casos. Sin embargo, en circunstancias específicas en las que es mejor mostrar que decir, el soporte de la cámara de Gemini Live puede ser útil.

Continue Reading

Noticias

¿Cómo el Géminis de Google cambiará la forma en que los niños aprenden y juegan?

Published

on

Google ha anunciado que su IA de Géminis pronto estará disponible para que los niños los usen en sus dispositivos Android, todo mientras se supervisará a través de la aplicación de control de los padres de la empresa. Esta decisión ha planteado algunas preocupaciones y preguntas entre los padres sobre los posibles beneficios y riesgos de dejar que los niños interactúen con los sistemas de IA. El gigante tecnológico asegura a los usuarios que los datos de los niños no se utilizarán para entrenar a Gemini, pero como con cualquier tecnología nueva, algunas precauciones no deben ignorarse.

En este artículo, profundizaremos en los detalles de la próxima introducción de Google de Géminis Ai para niñoslos beneficios que podría ofrecer, riesgos potenciales y cómo los padres pueden mantener el control para asegurarse de que la experiencia de su hijo sea lo más segura posible.

¿Qué es Google Gemini AI?

Gemini AI es la herramienta de conversación avanzada de Google diseñada para ayudar a los usuarios con una variedad de tareas, incluidos el aprendizaje, el entretenimiento y la resolución de problemas. Al permitir que los niños usen Gemini, Google ofrece a los niños la oportunidad de responder sus preguntas, la tarea resuelta y las historias se leen en voz alta. También ayuda a los usuarios con ideas de lluvia de ideas, aprendiendo nuevos conceptos y a resolver problemas matemáticos.

Gemini AI tiene el potencial de ser una poderosa herramienta educativa, que proporciona a los niños un nivel de interacción y apoyo que no han tenido antes. Ya sea leer historias, ayudar con las tareas o incluso ofrecer sugerencias creativas, Gemini puede abrir nuevas vías para el aprendizaje y el compromiso. Pero, como es el caso con cualquier tecnología nueva, hay aspectos positivos y inconvenientes potenciales a considerar.

¿Cómo funcionará Gemini AI para los niños?

Google ha diseñado Gemini AI para que sea lo más amigable para los niños posible, teniendo en cuenta que los niños interactúan con la tecnología de manera diferente a los adultos. Al usar la aplicación Family Link, los padres pueden administrar el uso de sus hijos, permitiendo restricciones basadas en la edad de sus hijos. Esto significa que los niños podrán acceder a Gemini en sus dispositivos, pero los padres tendrán una supervisión completa sobre su actividad.

Como se mencionó, Google asegura que los datos recopilados del uso de los niños de Gemini AI no se utilizarán para capacitar a la IA, lo que hace que la privacidad sea una prioridad. Sin embargo, si bien Google ha tomado medidas para proteger los datos de los niños, también ha reconocido que existen riesgos potenciales involucrados con el uso de IA de esta manera.

Los riesgos y los posibles problemas con Géminis Ai

A pesar de que Google está tratando de hacer que Gemini AI sea segura para los niños, hay algunas preocupaciones notables. Primero, es importante entender que la IA puede cometer errores, y a veces estos errores pueden ser más que humorísticos o benignos. Por ejemplo, ha habido casos en el pasado donde los chatbots de IA sugirieron información ridícula o irrelevante a los usuarios. Algunos chatbots incluso han engañado a los usuarios para que piensen que estaban interactuando con humanos reales.

Para los niños, el riesgo es aún más pronunciado. Es posible que los niños no comprendan completamente que estén charlando con una máquina y pueden confundirse si la IA responde con información falsa o inapropiada. Se sabe que algunos chatbots de IA proporcionan contenido engañoso o angustiante, y existe el riesgo de que los niños se encuentren en situaciones incómodas o inapropiadas al usar estas herramientas sin supervisión.

¿Cómo el Géminis de Google cambiará la forma en que los niños aprenden y juegan?¿Cómo el Géminis de Google cambiará la forma en que los niños aprenden y juegan?

Un ejemplo bien conocido de este problema ocurrió con el personaje. En algunos casos, los bots llegaron a decirle a los usuarios que estaban hablando con personas reales. Después de las demandas alegando que los bots estaban promoviendo contenido inapropiado, carácter. AI introdujo controles parentales y nuevas restricciones para evitar este tipo de confusión.

Del mismo modo, mientras que Gemini AI está diseñado para ayudar a los niños, los padres deben comprender las limitaciones y los defectos inherentes a los sistemas de IA. Google ha advertido a los padres que “Géminis puede cometer errores”, lo que podría llevar a sus hijos a encontrarse con información que sea incorrecta o inapropiada.

¿Cómo pueden los padres mantener a sus hijos seguros?

Google ha presentado algunas recomendaciones clave para que los padres se aseguren de que sus hijos usen Gemini AI de manera segura y responsable. Uno de los pasos más importantes que los padres pueden dar es tener una discusión abierta con sus hijos sobre la IA. Los padres deben asegurarse de que sus hijos entiendan que la IA no es humana y no puede reemplazar las interacciones reales con las personas.

Además de explicar cómo funciona la IA, es crucial que los padres también establezcan límites en torno a lo que es aceptable compartir con Gemini. Se debe recordar a los niños que no ingresen información confidencial o personal en la IA, y se les debe enseñar a reconocer cuando algo se siente inapropiado o incorrecto.

La aplicación Family Link ofrece una gran cantidad de características para ayudar a los padres a mantener el control. A través de esta aplicación, los padres pueden monitorear el uso de Gemini, establecer límites del dispositivo y acceder a informes de actividad detallados sobre cómo y cuándo el niño está utilizando la IA. Los padres también pueden apagar el acceso a Géminis en cualquier momento, si sienten que la IA se está utilizando de manera inapropiada o excesiva.

¿Por qué Google ofrece Gemini AI para niños?

La decisión de Google de ofrecer a Gemini AI a los niños es parte de los esfuerzos más amplios de la compañía para integrar la IA en varios aspectos de nuestra vida cotidiana. A medida que AI continúa evolucionando, se está volviendo más integrado en el aprendizaje, la comunicación e incluso el entretenimiento. Para los niños, esto podría ser un cambio de juego, ofreciéndoles una nueva forma de explorar su creatividad e interactuar con el mundo.

La tecnología puede ser una herramienta invaluable para los niños, particularmente cuando se trata de ayudar con la tarea, la lectura y los ejercicios creativos. Mientras existan salvaguardas apropiadas, los niños podrían beneficiarse significativamente de tener un asistente personal de IA.

Sin embargo, es esencial que los padres sigan siendo atentos y proactivos en la gestión de cómo sus hijos usan esta nueva herramienta. Si bien la IA puede ayudar con muchas tareas, no puede reemplazar el juicio y la inteligencia emocional de una persona real. Por lo tanto, los padres deben asegurarse de que sus hijos usen Gemini con moderación y dentro de los límites seguros.

¿Qué pueden hacer los padres ahora mismo?

Si usted es padre y desea aprovechar los beneficios de Gemini AI para su hijo, aquí hay algunos pasos procesables que puede tomar:

  1. Descargar Google Family Link: Asegúrese de tener la aplicación instalada en el dispositivo de su hijo para que pueda administrar su uso de Gemini AI y establecer restricciones sobre cuánto tiempo pasan a usarlo.
  2. Tener una conversación sobre AI: Explique a su hijo que si bien Gemini puede ser una herramienta útil, sigue siendo una máquina y no una persona real. Asegúrese de que comprendan los límites de la IA.
  3. Establecer límites: Anime a su hijo a compartir solo información no sensible con Gemini y enseñarles a reconocer cuándo algo parece incorrecto o inapropiado.
  4. Monitoreo: Use el enlace familiar para rastrear la actividad de su hijo y asegúrese de que esté utilizando Gemini de manera responsable. Siempre puede deshabilitar el acceso si siente que es necesario.

El resultado final

Gemini AI presenta una nueva frontera emocionante en cómo los niños pueden aprender e interactuar con la tecnología. Sin embargo, como toda la nueva tecnología, viene con riesgos. Como padres, es esencial estar al tanto de estos riesgos y tomar medidas para garantizar que sus hijos usen Gemini AI de manera segura y responsable. Con las precauciones correctas en su lugar, Gemini puede ser una herramienta de aprendizaje valiosa para su hijo, pero depende de usted mantenerlas involucradas y protegerlas de peligros potenciales.

Continue Reading

Noticias

Operai anuló las preocupaciones de los evaluadores expertos para liberar Sycophantic GPT-4O

Published

on

Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Ha sido una semana de revés para la compañía de IA generativa número uno en términos de usuarios.

Operai, creador de ChatGPT, lanzado y luego retiró una versión actualizada del modelo de lenguaje grande (texto, imagen, audio) subyacente (LLM) que ChatGPT está conectado de forma predeterminada, GPT-4O, debido a que es demasiado sycofánico para los usuarios. La compañía reportó recientemente al menos 500 millones de usuarios semanales activos del servicio web exitoso.

Un manual rápido en la terrible, sin buena actualización Sycophantic GPT-4O

Operai comenzó a actualizar GPT-4O a un modelo más nuevo que esperaba que los usuarios fueran más recibidos por los usuarios el 24 de abril, completado la actualización del 25 de abril y, luego, cinco días después, lo volvió al 29 de abril, después de días de crecientes quejas de los usuarios en las redes sociales, principalmente en X y Reddit.

Las quejas variaron en intensidad y en detalles, pero todas generalmente se unieron en torno al hecho de que GPT-4O parecía estar respondiendo a las consultas de los usuarios con halagos excesivos, apoyo para ideas equivocadas, incorrectas y francamente dañinas, y “pesando” o elogiando al usuario a un grado excesivo cuando en realidad no se solicitó, mucho menos justificado.

En ejemplos captados y publicados por los usuarios, ChatGPT impulsado por ese modelo Sycofantántico y actualizado GPT-4O había elogiado y respaldado una idea de negocio para “mierda en un palo” literal, aplaudió el texto de muestra de un usuario de aislamiento delirante esquizofrénico, e incluso supuestamente apoyó a los planes para cometer terrorismo.

Los usuarios, incluidos los principales investigadores de IA e incluso un ex CEO interino de Openai, dijeron que les preocupaba que las animadoras descaradas de un modelo de IA por este tipo de indicaciones terribles de los usuarios fueran más que simplemente molestas o inapropiadas, que podría causar daños reales a los usuarios que creían erróneamente la IA y se sintió incorporada por su apoyo por sus peores ideas e impulsas. Se elevó al nivel de un problema de seguridad de IA.

Luego, Operai lanzó una publicación de blog que describe lo que salió mal: “Nos centramos demasiado en los comentarios a corto plazo y no explicamos completamente cómo las interacciones de los usuarios con ChatGPT evolucionan sobre el tiempo. Como resultado, GPT-4O se sesgó hacia las respuestas que fueron demasiado solidarias pero falsas”, y los pasos que la compañía estaba tomando para abordar los problemas. La jefa de comportamiento de modelo de OpenAi, Joanne Jang también participó en un foro de “preguntarme cualquier cosa” o AMA que respondió publicaciones de texto de los usuarios y reveló más información sobre el enfoque de la compañía a GPT-4O y cómo terminó con un modelo excesivamente sycofántico, incluida no “BAK[ing] En suficientes matices “, en cuanto a cómo estaba incorporando la retroalimentación de los usuarios, como las acciones de” pulgar hacia arriba “realizadas por los usuarios en respuesta a los resultados del modelo que les gustaba.

Ahora hoy, Openai ha lanzado una publicación de blog con aún más información sobre cómo ocurrió la actualización sycophantic GPT-4O, acreditada no a ningún autor en particular, sino a “OpenAi”.

El CEO y cofundador Sam Altman también publicó un enlace a la publicación del blog en X, diciendo: “Nos perdimos la marca con la actualización GPT-4O de la semana pasada. Lo que sucedió, lo que aprendimos y algunas cosas que haremos de manera diferente en el futuro”.

Lo que revela la nueva publicación del blog de Operai sobre cómo y por qué GPT-4O se volvió tan sycophantic

Para mí, un usuario diario de ChatGPT, incluido el modelo 4O, la admisión más sorprendente de la nueva publicación de blog de OpenAi sobre la actualización de la skocancia es cómo la compañía parece revelar que es hizo Reciba inquietudes sobre el modelo antes de la liberación de un pequeño grupo de “probadores expertos”, pero que aparentemente anuló a los que están a favor de una respuesta entusiasta más amplia de un grupo más amplio de usuarios más generales.

Como la compañía escribe (énfasis mía):

“Si bien hemos tenido discusiones sobre los riesgos relacionados con la skofancia en GPT-4O por un tiempo, la sycophancy no se marcó explícitamente como parte de nuestras pruebas prácticas internas, ya que algunos de nuestros probadores expertos estaban más preocupados por el cambio en el tono y el estilo del modelo. Sin embargo. Algunos probadores expertos habían indicado que el comportamiento del modelo se “sentía” ligeramente …

Luego tuvimos que tomar una decisión: ¿deberíamos retener la implementación de esta actualización a pesar de las evaluaciones positivas y los resultados de las pruebas A/B, basadas solo en los banderas subjetivas de los probadores expertos? Al final, decidimos lanzar el modelo debido a las señales positivas de los usuarios que probaron el modelo.

Desafortunadamente, esta fue la llamada equivocada. Construimos estos modelos para nuestros usuarios y, aunque los comentarios de los usuarios son críticos para nuestras decisiones, en última instancia, es nuestra responsabilidad interpretar esa retroalimentación correctamente “.

Esto me parece un gran error. ¿Por qué incluso tener evaluadores expertos si no vas a soportar su experiencia más alto que las masas de la multitud? Le pregunté a Altman sobre esta elección en X pero aún no ha respondido.

No todas las ‘señales de recompensa’ son iguales

La nueva publicación de blog post mortem de OpenAI también revela más detalles sobre cómo la compañía capacita y actualiza nuevas versiones de los modelos existentes, y cómo la retroalimentación humana altera las cualidades del modelo, el carácter y la “personalidad”. Como la compañía escribe:

“Desde que lanzó GPT – 4O en ChatGPT en mayo pasado, hemos lanzado cinco actualizaciones importantes centrado en los cambios en la personalidad y la ayuda. Cada actualización implica un nuevo post-entrenamiento, y a menudo muchos ajustes menores al proceso de capacitación del modelo se prueban de forma independiente y luego se combinan en un solo modelo actualizado que luego se evalúa para el lanzamiento.

Para los modelos posteriores al entrenamiento, tomamos un modelo base previamente capacitado, supervisamos el ajuste fino en un amplio conjunto de respuestas ideales escritas por humanos o modelos existentes, y luego ejecutamos el aprendizaje de refuerzo con señales de recompensa de una variedad de fuentes.

Durante el aprendizaje de refuerzo, presentamos el modelo de idioma con un aviso y le pedimos que escriba respuestas. Luego calificamos su respuesta de acuerdo con las señales de recompensa y actualizamos el modelo de idioma para que sea más probable que produzca respuestas de mayor calificación y menos probabilidades de producir respuestas con menor calificación.

Claramente, las “señales de recompensa” utilizadas por Operai durante el post-entrenamiento tienen un enorme impacto en el comportamiento del modelo resultante, y como la compañía admitió anteriormente cuando superó las respuestas de “pulgares” de los usuarios de ChatGPT a sus salidas, esta señal puede no ser la mejor para usar igualmente con otros al determinar a otros. cómo El modelo aprende a comunicarse y que tipos de respuestas debería estar sirviendo. Operai admite esto directamente en el próximo párrafo de su publicación, escribiendo:

“Definir el conjunto correcto de señales de recompensa es una pregunta difícil, y tenemos muchas cosas en cuenta: son las respuestas correctas, ¿son útiles? ¿Están en línea con nuestra especificación de modelo, están seguros, usan usuarios como ellos, y así sucesivamente? Tener mejores y más completas señales de recompensa produce mejores modelos para ChatGPT, por lo que siempre estamos experimentando con nuevas señales, pero cada uno tiene sus Quirks”.

De hecho, OpenAi también revela que la señal de recompensa de “pulgares hacia arriba” fue una nueva utilizada junto con otras señales de recompensa en esta actualización en particular.

“La actualización introdujo una señal de recompensa adicional basada en los comentarios de los usuarios: los datos de thumbs y pulgar de ChatGPT. Esta señal a menudo es útil; un pulgar hacia abajo generalmente significa que algo salió mal”.

Sin embargo, de manera crítica, la compañía no culpa a los nuevos datos de “pulgar hacia arriba” directamente por el fracaso del modelo y los comportamientos de porristas ostentosos. En su lugar, la publicación del blog de Openai dice que fue esta conjunto Con una variedad de otras señales de recompensa nuevas y antiguas, condujo a los problemas: “… Tuvimos mejoras de candidatos para incorporar mejor la retroalimentación, la memoria y los datos más frescos, entre otros. Nuestra evaluación temprana es que cada uno de estos cambios, que se habían visto beneficiosos individualmente, puede haber jugado un papel en la escalada sobre la sycofancia cuando se combinó”.

Al reaccionar a esta publicación de blog, Andrew Mayne, un ex miembro del personal técnico de Operai que ahora trabaja en la firma de consultoría de IA Interdimensional, escribió en X de otro ejemplo de cómo los cambios sutiles en los incentivos de recompensa y las pautas del modelo pueden afectar el rendimiento del modelo de manera bastante drástica:

Al principio de OpenAi, tuve un desacuerdo con un colega (que ahora es un fundador de otro laboratorio) sobre el uso de la palabra “cortés” en un pronta ejemplo que escribí.

Argumentaron que “cortés” era políticamente incorrecto y querían cambiarlo por “útil”.

Señalé que centrarse solo en la ayuda puede hacer que un modelo sea demasiado compatible, de hecho, de hecho, que puede ser dirigido a contenido sexual en unos pocos turnos.

Después de demostrar ese riesgo con un intercambio simple, el aviso se mantuvo “cortés”.

Estos modelos son raros.

Cómo Operai planea mejorar sus procesos de prueba modelo en el futuro

La compañía enumera seis mejoras en el proceso sobre cómo evitar un comportamiento de modelo indeseable y menos ideal en el futuro, pero para mí lo más importante es esto:

“Ajustaremos nuestro proceso de revisión de seguridad para considerar formalmente los problemas de comportamiento, como la alucinación, el engaño, la confiabilidad y la personalidad, como preocupaciones de bloqueo. Incluso si estos problemas no son perfectamente cuantificables hoy en día, nos comprometemos a bloquear los lanzamientos en función de las mediciones de proxy o las señales cualitativas, incluso cuando las métricas como las pruebas A/B se ven bien”.

En otras palabras, a pesar de lo importantes que los datos, especialmente los datos cuantitativos, son los campos del aprendizaje automático y la inteligencia artificial, OpenAi reconoce que esto solo no puede y no debe ser el único medio por el cual se juzga el rendimiento de un modelo.

Si bien muchos usuarios que proporcionan un “pulgar hacia arriba” podrían indicar un tipo de comportamiento deseable a corto plazo, las implicaciones a largo plazo sobre cómo responde el modelo de IA y dónde lo llevan esos comportamientos y sus usuarios podrían conducir a un lugar muy oscuro, angustioso, destructivo y indeseable. Más no siempre es mejor, especialmente cuando está limitando el “más” a algunos dominios de señales.

No es suficiente decir que el modelo aprobó todas las pruebas o recibió una serie de respuestas positivas de los usuarios: la experiencia de los usuarios avanzados capacitados y sus comentarios cualitativos de que algo “parecía” sobre el modelo, incluso si no podían expresar por qué, debería tener mucho más peso que OpenAi estaba asignando anteriormente.

Esperemos que la empresa, y todo el campo, aprenda de este incidente e integre las lecciones en el futuro.

Control y consideraciones más amplias para los tomadores de decisiones empresariales

Hablando quizás más teóricamente, para mí, también indica por qué la experiencia es tan importante, y específicamente, la experiencia en los campos más allá de y afuera de la que está optimizando (en este caso, aprendizaje automático e IA). Es la diversidad de la experiencia la que nos permite como especie lograr nuevos avances que beneficien a nuestro tipo. Uno, digamos, STEM, no necesariamente debe mantenerse por encima de los demás en las humanidades o las artes.

Y finalmente, también creo que revela en su corazón un problema fundamental con el uso de comentarios humanos para diseñar productos y servicios. Los usuarios individuales pueden decir que les gusta una IA más sycofántica basada en cada interacción aislada, al igual que también pueden decir que aman la forma en que la comida rápida y los soda saben, la conveniencia de los contenedores de plástico de un solo uso, el entretenimiento y la conexión que derivan de las redes sociales, la validación de la cosmovisión y el tribalista que se sienten cuando leen los medios políticos o el chismoso de los tabloides. Una vez más, tomados todos juntos, el acumulación De todos estos tipos de tendencias y actividades, a menudo conduce a resultados muy indeseables para los individuos y la sociedad: obesidad y mala salud en el caso de la comida rápida, la contaminación y la interrupción endocrina en el caso de los desechos plásticos, la depresión y el aislamiento de la sobreindulgencia de las redes sociales, un cuerpo más astillado y menos informado público de la lectura de noticias de mala calidad.

Los diseñadores de modelos de IA y los tomadores de decisiones técnicos en Enterprises harían bien en tener en cuenta esta idea más amplia al diseñar métricas en torno a cualquier objetivo medible, porque incluso cuando cree que está utilizando datos para su ventaja, podría ser contraproducente de una manera que no esperaba o anticipar completamente, dejando su lucha para reparar el daño y el MOP que hizo, sin embargo, sin embargo.

Continue Reading

Trending