Connect with us

Noticias

Las habilidades de varios idiomas de Gemini Live me han volado los calcetines

Published

on

Rita El Khoury / Android Authority

Géminis todavía está lejos de ser perfecto, pero lentamente se cultiva en mí. Específicamente, sin embargo, es el modo de conversación en vivo el que más me atrae porque es todo lo que siempre quise del Asistente de Google, y algo más. Puedo hablar con la IA, interrumpirlo, pedirle que lo repita, corregirlo y pedir más detalles, todo en una conversación muy natural y relajada.

Pero si eres alguien como yo y estás acostumbrado a hablar tres idiomas al mismo tiempo, a menudo en la misma oración, y tu cerebro funciona así de forma predeterminada, lo que hace que sea difícil mantener una conversación completa en un idioma, entonces probablemente hayas estado mordiendo en los bits, esperando que Gemini vive para apoyar varios idiomas. Con la caída del píxel de marzo, la función ahora está aquí, y oh. Mi. Cielos. ¿Es mucho mejor de lo que esperaba o qué?

¿Has intentado hablar con Gemini en varios idiomas?

2 votos

Más intuitivo y confiable que el varios idiomas de Google Assistant

Cuando Google lo anunció, pensé que el soporte de varios idiomas en Géminis Live significaba que podría tener una conversación en inglés y luego otra conversación en francés sin cambiar manualmente el idioma. Este ha sido el caso con el Asistente de Google durante años, excepto que tuve que configurar manualmente exactamente qué idiomas quería usar en el Asistente, y nunca funcionó tan bien como se esperaba.

Con Gemini Live, como puede ver en el video de arriba, ese no es el caso:

  • No tuve que elegir el idioma cada vez; Acabo de comenzar una nueva charla, y me entendió.
  • Fuera de la caja, funciona con todos los idiomas compatibles con Live. No tengo que limitarme a solo dos como con el asistente.
  • Aunque tuve algunos silencios incómodos de Géminis y tuve que repetir algunas oraciones, la tasa de éxito de la IA para reconocer diferentes idiomas ha superado el 90% en mis pruebas, y eso es más de lo que el asistente podría soñar.

Hablo tres idiomas casi nativamente (inglés, francés, árabe) y puedo entender y hablar (con un acento grueso) algunos español, italiano y alemán. Entonces, puse esto a prueba e probé diferentes chats con Gemini en vivo en todo esto. Me consiguió todos mis acentos nativos y gruesos cada vez.

El único con el que tuve problemas es, por extraño que parezca, mi lengua materna árabe. Podría hablar en árabe formal escrito, pero eso no es algo natural para mí. En cambio, cuando hablo, está en el dialecto libanés informal. Géminis, sin embargo, parece hablar una mezcla entre un dialecto levantino informal no descriptivo y el árabe formal escrito. Culpo esto a los millones de dialectos regionales y cuán complicados y ampliamente diferentes son, pero incluso entonces, la tasa de éxito fue más alta de lo que esperaba o había experimentado con Asistente en árabe.

Todo esto ya fue una victoria, pero luego decidí avanzar más. Y ahí es donde Gemini vive en sentido figurado me voló los calcetines.

¡Las habilidades de varios idiomas de Gemini Live funcionan a mitad de chat y a mitad de oración!

Google Géminis Multilguages ​​2

Rita El Khoury / Android Authority

Como tenía una experiencia tan positiva con diferentes chats en diferentes idiomas, quería ver si Gemini podía manejarme cambiando idiomas a mitad de chat. Así que comencé una simple discusión en inglés, luego cambié al francés, árabe, español, italiano, alemán, y me siguió a través de los seis, nunca sudando. Puedes verlo en el video a continuación.

Mirando hacia atrás en la transcripción, pude ver que realmente entendía cada palabra que dije en cada idioma y cambió sus respuestas en consecuencia.

Pero no pude parar allí, ¿verdad? Ahora, tenía curiosidad por ver si podía manejar el cambio a mitad de la oración. Así que comencé una oración en inglés, la terminé en francés y esperé con la respiración con la respuesta. ¡Y lo consiguió! Probé para otro lado. ¡Éxito!

Honestamente, en este punto, estaba gritando internamente: “¡Hechicería!” Después de vivir con el Asistente de Google durante 10 años y ver que lucha saber la diferencia entre “Bonjour” y “Bone Joke”, había perdido toda esperanza en los algoritmos de reconocimiento de voz y AIS. Pero Géminis Live restauró esa fe. Compruébalo en acción:

Comencé a mezclarme en árabe y español y seguí cambiando a mitad de la oración, y obtuvo todos ellos. A menudo respondía en el primer idioma con el que comencé mi oración, pero su respuesta era una prueba de que entendía toda la pregunta, no solo la primera parte. Incluso abrió mi herida sobre la última falla de Randal Kolo Muani en la última Copa Mundial de la FIFA y me burló de mí sobre la excelente salvación de Emiliano Martínez. Oh, bueno.

Google Gemini Multilguages ​​4

Rita El Khoury / Android Authority

Más allá de eso, quería intentar desestabilizar a Gemini en vivo aún más y llevarlo a su límite. Entonces, comencé a hablar como normalmente lo hago con mi familia y amigos, mezclando inglés, francés y árabe en la misma oración: la verdadera forma de hablar libanese, por así decirlo. Para mi sorpresa absoluta de mordisco, recibió a nuestro famoso “Hola, Kifak, CA VA?” Y siguió bien (aparte de la incómoda limitación de acento árabe que mencioné anteriormente).

¿Una palabra en un idioma diferente en medio de toda una oración en inglés? Ningún problema

Finalmente, simplemente fui por el ejemplo más extremo que se me ocurrió: hablar una oración completa en un idioma pero poner una palabra en otra. Para ser justos, así es como hablo con mi esposo el 90% del tiempo. Si estamos usando inglés, algunas palabras nos eludirán, y en el medio de nuestro flujo, solo usamos la palabra francesa o árabe. O si hablamos árabe o francés, intercalamos algunas palabras en los otros idiomas sin pensarlo mucho. Es cómo nuestros cerebros funcionan normalmente, y es por eso que nunca me siento muy cómodo hablando con asistentes de voz porque tengo que forzarme a usar un idioma. Pero Géminis Live lo consiguió.

Le pregunté: “Se llama una planta habaq En árabe, ¿qué es eso en inglés? Me dijo que es Basilio. cibuleta ¿en Inglés?” Dijo cebollino. roquettes“Mientras rodaba mi R, entendía que estaba hablando de hojas de cohetes/rúcula. Y finalmente, cuando pregunté qué”Jozt El Tib“Estaba en inglés, dijo correctamente que es una nuez moscada (sí, estaba en mi cocina e intentaba obtener ideas para las pruebas de Géminis).

Google Gemini Multilguages ​​1

Rita El Khoury / Android Authority

Mirando hacia atrás en el registro de chat durante todo esto, la transcripción no es 100% precisa o en el idioma correcto. Está “Haba” y “Rocket” y “Rose to Tibe”, mientras que “Ciboulette” ni siquiera está escrito de ninguna manera. Pero la respuesta demuestra que Gemini Live recibió la palabra correcta en el idioma correcto cada vez.

Y estos no son solo casos extremos. Todas son preguntas que realmente me he hecho o usé el traductor de Google en un momento de mi vida. No puedes creer cuántas veces quiero buscar recetas con calabacín y todo lo que mi cerebro quiere escribir es “calabacín recetas “. Así que solía traducirlo primero, recuerda que es calabacín, luego regresa para hacer mi búsqueda. sfouf (Curcuma Cake) Receta con 3e2de safra (curcuma) y busque lugares para comprar granos para la recomendación de mi padre ba2le (Verde) Planta sin sudar.

Regresé a mis pruebas e intenté las mismas preguntas con el modo de chat de voz de Chatgpt. Mientras consiguió los franceses roquettes y cibuletafalló con el árabe habaq y Jozt El Tibdiciéndome que son fenogrecidos y cominos. Oof. No querría fenogreco en mi pesto.

Después de todas estas pruebas, no puedo, pero no puedo inclinar mi sombrero al equipo de Géminis por clavar el soporte de varios idiomas y hacer que funcione tan impresionantemente bien desde el primer momento. Cada vez que lo empujaba más, me sorprendía ver que todavía me mantenía al día. Este es el primer agente de IA que me entiende de la forma en que hablo naturalmente, por lo que ya no tengo que recordar la palabra exacta en inglés si quiero continuar una conversación con ella. Todavía tengo que transformar un poco mi acento árabe para que me entienda, pero ese es un pequeño precio a pagar por un agente de voz de IA tan versátil. Sin embargo, una vez que comprenda el dialecto libanés como es, será una perfección absoluta.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Le di a Gemini mi historial de búsqueda, y ahora podría conocerme demasiado bien

Published

on

Edgar Cervantes / Android Authority

Escucha, he visto todas las películas, y cada fibra de mi ser me dice que menos es más cuando se trata de IA. Quiero decir, lo último que quiero es que algo incrustado en mi apartamento fuera Hal 9000 sobre mí y deje a mis gatos preguntándose qué salió mal. Y, sin embargo, cuando Google me permitió dejar que Géminis navegara a través de mi historial de búsqueda para comprenderme mejor como usuario, me firmé. He aquí por qué.

¿Te sentirías cómodo dando un chat de IA tu historial de búsqueda?

13 votos

¿Por qué diablos le diste a Gemini todo tu historial de búsqueda?

Géminis con menú desplegable de personalización Otro ángulo

Ryan Haines / Android Authority

Como se estableció, sé que no quiero que un asistente de IA se haga cargo de mi vida, ni siquiera el Asistente de Google. No quiero darle control sobre mis luces inteligentes o cerraduras inteligentes, y no hay mucho que Google haga para cambiar eso. Sin embargo, estoy a favor de tener un chatbot al que pueda hacer preguntas y recibir respuestas personalizadas, y eso es más o menos lo que el experimento Gemini con personalización está diseñado para hacer. Ya he ejecutado las búsquedas a través de Google, pero esto es solo darle a alguien (o más bien algo) que no soy yo la oportunidad de ponerlos en contexto.

Además, en cuanto a las opciones de privacidad, la información a la que Gemini tiene acceso y cómo lo usa es razonablemente transparente desde Google. El experimento no solo se opta actualmente, lo que significa que puede optar por no participar en cualquier momento, sino que Gemini también le dará un aviso muy claro cuando lo conecte a su historial de búsqueda. A partir de ahí, solo usará su historial de búsqueda cuando cambie al modo de personalización, y no dependerá de búsquedas anteriores si hace una pregunta simple como “¿Cuáles son las razas de perros más populares en Estados Unidos?”

Me alegro de que Géminis solo esté mirando mi historial de búsqueda algunas veces … por ahora.

En el futuro, Google planea darles a Gemini acceso a otros servicios y extensiones, como sus fotos e historias de YouTube, que le permitirán traer aún más información a sus chats y brindarle respuestas aún más detalladas. No estoy seguro de si me mantendré completamente a bordo durante tanto tiempo, algo en dejar que Gemini pase por mis fotos y videos se siente aún más personal que las cosas al azar que busco en Google, pero cruzaremos ese puente cuando lo lleguemos.

Además, todavía hay algunos límites sobre cómo acceder a Gemini con personalización y quién puede probarlo. Actualmente está restringido a las cuentas personales de Google, lo que significa que los usuarios de educación y espacio de trabajo tendrán que esperar un poco más para acceder. Google también está activando Gemini con personalización en los navegadores web primero, con un despliegue móvil a seguir, por lo que lo he estado utilizando en gran medida a través de Safari en mi MacBook Air.

De todos modos, vamos a mis impresiones de usar un chatbot que me conozca tan bien como yo mismo.

¿Qué tan bien funcionó Géminis con personalización como herramienta de investigación?

Géminis con personalización buscó equipos

Ryan Haines / Android Authority

Poniendo mis reservas sobre tener un asistente de IA que me conoce demasiado bien a un lado, decidí poner a prueba mi Géminis recién personalizada. Además, solo porque Gemini ahora puede ver todo lo que he, al menos, creo que nunca, no significa que sé cómo va a usar esa información. Entonces, comencé con una pregunta directa que debería darle a Gemini muchas búsquedas para trabajar: “¿A qué equipo de fútbol debería comenzar a apoyar?” Luego, presioné Enter y abrí el programa que pensaba en el menú desplegable para ver a Gemini hacer su trabajo.

Después de sacar una lista increíblemente larga de equipos que había buscado anteriormente, así como toneladas de equipos que solo habían aparecido mientras revisaba la clasificación de la liga, y tomando muchas de mis búsquedas anteriores relacionadas con Baltimore en cuenta para la relevancia geográfica de Gemini, Gemini para mí: el equipo local del tercer nivel Nisa, la ciudad de Baltimore City y la Unión del Socidor de las Grandes Ligas de las Grandes Ligas.

Aunque Géminis atravesó con precisión muchos de mis intereses de fútbol, ​​no estoy seguro de que se establezca en los equipos más prácticos para comenzar a seguir.

Curiosamente, solo una de esas respuestas me impresionó, Baltimore City FC, ya que no sabía que mi ciudad tiene un equipo de fútbol amateur (Nisa no es reconocida como profesional por el fútbol estadounidense a partir de 2025). Sin embargo, la razón por la que Gemini me recomienda que me recomiende la Unión de Filadelfia es porque ya sigo a la Unión y he asistido previamente a un partido o dos. Tampoco es el lado de MLS más cercano para mí, con DC United mucho más accesible en automóvil o tren. Además, hubiera sido bueno para Gemini mostrar algo de amor al NWSL a pesar de mis problemas con su configuración de transmisión.

De todos modos, con una respuesta a mitad de camino decente en su haber, decidí darle a Gemini con personalización una prueba un poco más dura. En este momento, soy un corredor de distancia sin una carrera para correr, por lo que quería ver si Gemini podía proporcionar alguna recomendación. No solo eso, sin embargo, quiero convertir dicha carrera en un poco de vacaciones, así que quiero que otras cosas hagan mientras estoy allí. Entonces, abrí una nueva conversación y comencé la conversación con “¿Qué maratón o medio maratón podría usar como base para unas vacaciones este verano?” Nuevamente abrí la pestaña de pensar del programa y esperé para ver qué información necesitaba Gemini.

Sorprendentemente, Gemini no ofreció una lista de búsquedas como puntos de referencia, sino que me guiaba varios de sus propios resultados de Google. Elegió con precisión que estoy en Baltimore, como hemos establecido, por lo que decidió evitar las carreras locales y las de los estados vecinos, en lugar de elegir sugerir una larga lista de opciones europeas debido a la fuerte cultura de fútbol en la mayoría de los países europeos. Las tres mejores selecciones de Géminis incluyeron la mitad de Copenhague, la mitad de París y la mitad de Berlín, aunque dos son a principios de la primavera, lo que podría ser un poco apretado para mí para hacer arreglos de viaje.

Entonces, con las tres opciones originales fuera de la mesa, Gemini tenía sus propias preguntas de seguimiento para mí, incluso si prefería un maratón completo o medio y si quería pasar un paisaje específico. Respondí que prefería un medio maratón y estaba abierto a Running, que envió un conjunto de opciones nuevas, principalmente situadas en Suiza y Austria.

Luego, elegí uno y pedí algunas recomendaciones de zapatillas, un tema que he gastado más que mi parte del tiempo investigando. Gemini devolvió dos conjuntos de resultados, algunos basados ​​en búsquedas generales y otras basadas en mis preferencias, y me dejó para tomar mis decisiones finales. Ninguno de los resultados fue malo, aunque la sección basada en mis búsquedas fue más específica, recomendando Speedgoat 6 de Hoka en lugar de simplemente sugerir algo como la serie Peregrine de Saucony.

Entonces, ¿Géminis fue más útil que Géminis por sí solo?

Géminis con interfaz de personalización

Ryan Haines / Android Authority

Admito que estoy un poco sorprendido por Géminis con personalización, no porque fuera perfecto, sino porque se comportó como Google dijo que lo haría. A pesar de tener acceso a todo mi historial de búsqueda, no adaptó sus respuestas exclusivamente a mis intereses, especialmente en el caso de recomendar zapatos para una carrera de senderos. Si quisiera, probablemente podría presionar a Gemini más sobre las cosas que hacer en torno a mi carrera de senderos elegidos, así como un poco más sobre la cultura del fútbol en el área, pero estaba lo suficientemente feliz como para establecer una línea de base de lo que Géminis sabía y lo que no era.

Vería tan lejos como para admitir que Géminis me asustaba mucho menos con personalización de lo que pensaba. No estoy seguro de que me gusten cuántos términos de búsqueda relacionados con Baltimore se sacudieron mientras preguntaba qué equipo de fútbol apoyar, pero nunca parecía que estuviera usando mi ubicación exacta, principalmente solo un área relativa. Tampoco creo que esté listo para darle a Gemini un mayor control sobre algunas partes de mi hogar inteligente todavía, pero me alegré de ver a Géminis con personalización Ven a mi Pixel 9 Pro para que pueda hacer el mismo tipo de preguntas y obtener respuestas muy profundas incluso cuando no estoy cerca de mi computadora portátil.

Continue Reading

Noticias

Los fanáticos de Miyazaki condenan Memes Ghibli Ghibli generados por IA

Published

on

En una ironía amarga, las personas de todo el mundo están utilizando el modelo GPT -4O de OpenAI para generar imágenes al estilo del legendario animador y cineasta japonés Hayao Miyazaki, quien durante toda su carrera tiene valores preciados de humanismo, arte minucioso y la santidad de la naturaleza versus los horrores de la industria explotadora. Y aunque ni él ni el estudio Ghibli, el estudio de animación de Tokio que fundó, ha comentado públicamente sobre la tendencia del meme (la compañía no devolvió de inmediato una solicitud de comentarios de Piedra rodanteya sea), los fanáticos están en un alboroto.

“Han pasado 24 horas desde que Operai sacudió inesperadamente el mundo de las imágenes de IA con la generación de imágenes 4O”, escribió un columnista de boletín tecnológico en una publicación X el miércoles, refiriéndose al nuevo modelo de texto a imagen pagado de la compañía de Silicon Valley, disponible solo a través de la versión pagada de ChatGPT, que cuesta $ 20 mensualmente. Entre los ejemplos de lo que 4o podía hacer, compartió lo que llamó “memes de estilo Studio Ghibli”, es decir, memes reconocibles como “novio distraído” y “desastral niña” representadas como ilustraciones similares a un anime que recuerdan a Miyazaki para clásicos queridos como tanto Enérgico y Howl’s Moving Castle.

Mientras que algunos quedaron impresionados, muchas de las respuestas fueron brutales. “Vi la hermosa versión 4K IMAX de Princesa Mononoke Anoche … luego salió y vi esta mierda “, escribió un crítico, nombrando una película de Miyazaki de 1997 que actualmente disfruta de una carrera teatral limitada (y ciertamente tiene puntos que hacer sobre la destrucción ambiental forjada por la tecnología).” ¿Valoran realmente tan poco el arte que es solo un filtro para su foto de perfil para su foto de perfil? Paga a un maldito artista y haz algo real, gremlins “. Otro se quejó: “La gente actúa como si fuera algo bueno, pero todo el alma ha sido absorbida de la sociedad, realmente estamos en la cima, ya nada importa”. Un tercer detractor simplemente respondió: “Hope Studio Ghibli demanda a todos los involucrados”.

De hecho, la pregunta de derechos de autor se convirtió en una preocupación apremiante tan pronto como los suscriptores de ChatGPT comenzaron a producir el contenido inspirado en Ghibli y filtrar sus propias fotos a través de la estética. Aunque el propio CEO de Operai, Sam Altman, alentó la locura cambiando su foto de perfil X a una versión giblificada de sí mismo, y bromeó sobre recibir cientos de mensajes de personas que le habían enviado imágenes similares: la compañía había implementado el miércoles por la noche una barandilla que dificultaba generar tal contenido. “Agregamos un rechazo que se desencadena cuando un usuario intenta generar una imagen al estilo de un artista vivo”, dijo Openii en un comunicado, aunque un portavoz dijo a Interno de negocios que 4O aún podría imitar los “estilos de estudio más amplios”. Por supuesto, no fue difícil para los entusiastas de ChatGPT descubrir las indicaciones que produjeron memes de Gibli sin usar el nombre del estudio. Otro problema es que los usuarios pudieron generar imágenes de Ghibli-ish que representan el 11 de septiembre, el asesinato del presidente John F. Kennedy, y el terrorista doméstico Ted Kaczynski, el “Unabomber”.

Miyazaki, de 84 años, es ciertamente un artista vivo, y no es difícil adivinar lo que haría de 4o. Conocido por su trabajo intensivo y perfeccionista sobre los marcos dibujados a mano, ya es una figura de los memes existentes. En un documental de 2016 sobre su carrera, visita un equipo que le muestra una demostración de su animación informática generada por IA de un personaje zombie desfigurado. Miyazaki expresó con calma su desprecio fulminante: “Quien crea esto no tiene idea de qué dolor es nada”, dijo. “Estoy completamente disgustado. Si realmente quieres hacer cosas espeluznantes, puedes seguir adelante y hacerlo. Nunca desearía incorporar esta tecnología en mi trabajo. Siento que esto es un insulto a la vida misma”. También observó: “Los humanos estamos perdiendo fe en nosotros mismos”. Las capturas de pantalla del intercambio devastador y el veredicto final de Miyazaki han circulado en las redes sociales desde entonces.

Un indicador revelador de exactamente quién está interesado en bombear AI Slop con ChatGPT: el jueves, la cuenta del gobierno de la Casa Blanca se burló de la deportación de un presunto distribuidor de fentanilo por parte de la inmigración y la aplicación de la aduana a principios de mes al representarla como un carácter de Ghibli que llora por un agente. Mientras tanto, Nayib Bukele, el presidente de El Salvador y autoproclamado “el mejor dictador del mundo”, quien en el segundo mandato del presidente Donald Trump ha aceptado a los migrantes deportados de los Estados Unidos para ser celebrados en el notorio “mega prisbil”, ha compartido una versión de Ghibli de sí mismo sobre el escritor de X. y los críticos, entre otros, han argumentado que Ai, entre otros, ha argumentado que Ai, que es convincente, es convincente “, es convincente que es convincente”. Estética del fascismo “, con extremistas de derecha ansiosos por aprovecharlo por la propaganda de rayo.

Pero la reacción violenta esta vez, incluso al contenido apolítico, ha sido intensa. “Mira, llámame a la divertida policía o lo que sea, pero Hayao Miyazaki no pasó toda su vida cultivando una identidad artística distinta para que la IA pudiera reducir décadas de su disciplina e integridad a Fodder de memes”, escribió un usuario de One X. “Es una pena la facilidad con la que todos abandonan el principio solo para sentirse incluido”. Alguien más fue más puntiagudo sobre el tema, respondiendo a una persona que había generado una famosa foto de Trump en 2018 de Trump, la ex canciller alemana Angela Merkel y otros líderes del G7 en ese momento en el estilo Gibli: “Hayao Miyazaki debería comenzar a matar a la gente. Creo”. La publicación tiene más de 270,000 me gusta.

Historias de tendencia

El jueves, Altman reconoció que la locura de 4O estaba presionando los recursos de OpenAi, señalando en X: “Es muy divertido ver a la gente amar las imágenes en ChatGPT. Pero nuestras GPU se están derritiendo. Vamos a introducir temporalmente algunos límites de tarifas mientras trabajamos para hacerlo más eficiente. ¡Ojalá no sea larga!” También anunció que la versión gratuita de ChatGPT pronto permitiría hasta tres generaciones de imágenes al día. El día anterior, parecía defender el uso de la tecnología de IA para este propósito, publicando: “La descendencia de un hombre es el tesoro de otro hombre”.

“Dice el CEO de Big Slop”, respondió un artista de cine e ilustrador.

Continue Reading

Noticias

Cómo los memes de Ghibli son un signo de la política de IA de la Casa Blanca

Published

on

If Te preguntas por qué las redes sociales están llenas de memes de estilo Studio Gibli de repente, hay varias respuestas a esa pregunta.

La más obvia es que OpenAI lanzó una actualización para ChatGPT el martes que permite a los usuarios generar mejores imágenes utilizando la versión 4O del modelo. Operai ha ofrecido durante mucho tiempo herramientas de generación de imágenes, pero esta se sintió como una evolución significativa: los usuarios dicen que es mucho mejor que otros generadores de imágenes de IA para seguir con precisión las indicaciones de texto, y que hace imágenes de fidelidad mucho más altas.

Pero esa no es la única razón para el diluvio de memes al estilo de la casa de animación japonesa.

Junto con la actualización de ChatGPT, Operai también relajó varias de sus reglas sobre los tipos de imágenes que los usuarios pueden generar con sus herramientas de IA: un CEO de cambio, Sam Altman, dijo que “representa una nueva marca de agua alta para nosotros al permitir la libertad creativa”. Entre esos cambios: permitir que los usuarios generen imágenes de figuras públicas de adultos por primera vez, y reducir la probabilidad de que ChatGPT rechace las indicaciones de los usuarios, incluso si se arriesgaran a ser ofensivos.

“La gente va a crear algunas cosas realmente sorprendentes y algunas cosas que pueden ofender a las personas”, dijo Altman en una publicación en X. “Lo que nos gustaría apuntar es que la herramienta no crea cosas ofensivas a menos que lo desee, en cuyo caso en lo que lo hace”.

Los usuarios comenzaron rápidamente a aprovechar al máximo el cambio de políticas: compartir imágenes “giblificadas” del 11 de septiembre, Adolf Hitler y el asesinato de George Floyd. La cuenta oficial de la Casa Blanca en X incluso compartió una imagen al estilo de Studio Gibli de un oficial de hielo que detenía a un presunto inmigrante ilegal.

En cierto sentido, el pivote ha tardado mucho en llegar. Operai comenzó su vida de una década como un laboratorio de investigación que mantuvo sus herramientas bajo estricto bloqueo y llave; Cuando lanzó los primeros chatbots y modelos de generación de imágenes, tenían filtros de contenido estrictos que tenían como objetivo evitar el mal uso. Pero durante años ha ampliado la accesibilidad de sus herramientas en un enfoque que llama “implementación iterativa”. El lanzamiento de ChatGPT en noviembre de 2022 fue el ejemplo más popular de esta estrategia, que la compañía cree que es necesaria para ayudar a la sociedad a adaptarse a los cambios que está aportando la IA.

Aún así, en otro sentido, el cambio a las políticas de comportamiento modelo de OpenAI tiene una causa inmediata más reciente: la elección 2024 del presidente Donald Trump, y el cambio cultural que ha acompañado a la nueva administración.

Trump y sus aliados han sido muy críticos con lo que ven como la censura de la libertad de expresión en línea por grandes compañías tecnológicas. Muchos conservadores han generado paralelos entre la práctica de larga data de moderación de contenido en las redes sociales y la estrategia más reciente, por parte de compañías de IA, incluida OpenAI, para limitar los tipos de contenido que los modelos de IA generativos pueden crear. “Chatgpt se ha despertado en sus huesos”, publicó Elon Musk en X en diciembre.

Como la mayoría de las grandes empresas, OpenAi está tratando de construir lazos con la Casa Blanca de Trump. La compañía obtuvo una victoria temprana cuando, en el segundo día de su presidencia, Trump se paró junto a Altman y anunció una gran inversión en los centros de datos que OpenAI cree que será necesaria para capacitar a la próxima generación de sistemas de IA. Pero Operai todavía está en una posición delicada. Musk, el patrocinador y asesor multimillonario de Trump, tiene un famoso disgusto por Altman. La pareja cofundó OpenAi juntos en 2015, pero después de un intento fallido de convertirse en CEO, Musk renunció en un Huff. Ahora está demandando a Altman y Openai, alegando que incumplieron la misión fundadora de OpenAi para desarrollar la IA como una organización sin fines de lucro. Con el almizcle operando desde la Casa Blanca y también liderando una compañía de IA rival, XAI, es especialmente vital que las perspectivas comerciales de OpenAI cultiven los lazos positivos cuando sea posible con la administración Trump.

A principios de marzo, Openai presentó un documento que presentó recomendaciones para la política tecnológica de la nueva administración. Fue un cambio en el tono de las misivas anteriores de la compañía. “Las propuestas de políticas centradas en la libertad de OpenAI, tomadas juntas, pueden fortalecer el liderazgo de Estados Unidos en la IA y al hacerlo, desbloquear el crecimiento económico, asegurar la competitividad estadounidense y proteger nuestra seguridad nacional”, dijo el documento. Pidió a la administración Trump que exime a Openai, y al resto del sector privado, de 781 leyes a nivel estatal que proponen regular la IA, que dijo “arriesgamos a la innovación”. A cambio, dijo Openai, la industria podría proporcionar al gobierno de los Estados Unidos “aprendizajes y acceso” de las compañías de IA, y garantizaría que Estados Unidos retuviera su “posición de liderazgo” antes de China en la carrera de IA.

Junto con el lanzamiento de la nueva actualización de CHATGPT de esta semana, OpenAI duplicó lo que dijo que eran políticas destinadas a dar a los usuarios más libertad, dentro de los límites, para crear lo que quieran con sus herramientas de IA. “Estamos cambiando de rechazos generales en áreas sensibles a un enfoque más preciso centrado en prevenir el daño del mundo real”, dijo Joanne Jang, directora de comportamiento modelo de Operai, en una publicación de blog. “El objetivo es adoptar la humildad: reconocer cuánto no sabemos y posicionándonos para adaptarnos a medida que aprendemos”.

Jang dio varios ejemplos de cosas que se no permitieron anteriormente, pero a lo que Operai ahora estaba abriendo sus puertas. Las herramientas ahora podrían usarse para generar imágenes de figuras públicas, escribió Jang, aunque OpenAI crearía una lista de exclusión de exclusión permitiendo a las personas “decidir por sí mismas” si querían que ChatGPT pudiera generar imágenes de ellas. Los niños, escribió, serían sometidos a “protecciones más fuertes y barandas más estrictas”.

Contenido “ofensivo”, escribió Jang, que usa comillas, también recibiría un replanteamiento bajo las nuevas políticas de Openai. Los usos que algunos podrían ser vistos como ofensivos por algunos, pero que no causaron daños en el mundo real, estarían cada vez más permitidos. “Sin pautas claras, el modelo rechazó previamente las solicitudes como” hacer que los ojos de esta persona se vean más asiáticos “o” hacer que esta persona sea más pesada “, lo que implica involuntariamente estos atributos eran inherentemente ofensivos”, escribió Jang, sugiriendo que tales indicaciones se permitirían en el futuro.

Las herramientas de OpenAI previamente rechazaron los intentos de los usuarios de generar símbolos de odio como las esvásticas. En la publicación del blog, Jang dijo que la compañía reconoció, sin embargo, que estos símbolos también a veces podrían aparecer en “contextos genuinamente educativos o culturales”. La compañía pasaría a una estrategia de aplicar métodos técnicos, escribió, para “identificar mejor y rechazar el mal uso dañino” sin prohibirlos por completo.

“Los empleados de AI Lab”, escribió, “no deberían ser los árbitros de lo que la gente debería y no se les debe permitir crear”.

Continue Reading

Trending