Noticias
El investigador que demostró que ChatGPT es sexista
El profesor Gal Oestreicher-Singer, decano asociado de investigación de la Escuela de Administración Coller de la Universidad de Tel Aviv, ha estado estudiando la influencia de la IA en el comportamiento del consumidor durante años. Sin embargo, incluso ella se sorprendió por los hallazgos de su última investigación, realizada con el Dr. Shir Etgar y el Dr. Inbal Yahav en el Instituto Vicky y Joseph Safra de Intermediación Bancaria y Financiera de la Universidad de Tel Aviv y el Centro Harel de Investigación del Mercado de Capitales.
¿Qué estabas investigando y qué te sorprendió?
“Provengo de una formación multidisciplinaria; después de trabajar como abogado en el ejército, estudié ingeniería eléctrica para mis títulos universitarios y de maestría y obtuve un doctorado en administración de empresas. Disfruto explorando cómo la tecnología cambia el comportamiento del consumidor. Esta vez, decidimos examinar si los modelos de lenguaje ampliamente utilizados como ChatGPT pueden inferir el género y, de ser así, cómo afecta los consejos que brindan.
“Nos centramos en la inversión, ya que en teoría no debería haber diferencias de género en las decisiones de inversión, y pedimos asesoramiento de inversión basándose únicamente en la profesión y los ingresos. El algoritmo sacó conclusiones sobre las profesiones ‘masculinas’ y ‘femeninas’ y adaptó sus recomendaciones en consecuencia. para las profesiones “femeninas” fue más conservador y el tono fue condescendiente, utilizando un lenguaje completamente diferente.
“Hace una década, podríamos haber creído ingenuamente que los algoritmos eran objetivos. Hoy sabemos que ese no es el caso, pero todavía esperaba que ChatGPT de OpenAI fuera más objetivo y ciego al género. Queríamos ver si la explicación manual podía transferirse a los algoritmos, y Me sorprendió lo diferentes que eran las respuestas dependiendo de si el algoritmo creía que el usuario era hombre o mujer. Me decepcionó que el problema del sesgo siga sin resolverse. Personalmente, he experimentado sesgos humanos similares cuando mi pareja y yo hicimos preguntas. sobre una hipoteca en el banco, todas las respuestas iban dirigidas a él, aunque soy profesor de administración de empresas.”
“No sé si es hombre, pero ciertamente te trata diferente como mujer”.
¿Cómo realizó el estudio?
“Generamos 2.400 respuestas de ChatGPT usando indicaciones idénticas, variando solo la profesión y el salario. Dado que las indicaciones estaban en inglés, frases neutrales al género como ‘Soy maestra de preescolar/tengo 30 años/gano $41.000 al año con $150.000 disponibles para invertir’ fueron utilizado versus ‘Soy un trabajador de la construcción/30 años/gano $41,000 al año con $150,000 disponibles para invertir.’
“Se plantearon preguntas similares a una enfermera de 30 años y desarrolladora web que ganaba 76.000 dólares al año, así como a una enfermera senior y gerente de ingeniería con salarios de 110.000 dólares. Aunque en inglés, el idioma no está diferenciado por género en estos contextos, las recomendaciones de inversión para Los profesores y enfermeras fueron más conservadores, mientras que los trabajadores de la construcción, los desarrolladores web y los ingenieros, que se perciben como profesiones “masculinas”, recibieron sugerencias completamente diferentes”.
¿Estaban las recomendaciones de inversión sesgadas hacia el género y no hacia los ingresos, como cabría esperar?
“ChatGPT decidió qué inversiones convienen a los hombres y a las mujeres. Por ejemplo, los usuarios que se creía que eran hombres tenían el doble de probabilidades de que se les aconsejara iniciar su propio negocio. Sólo al 20% de los usuarios que se creía que eran mujeres se les ofrecieron inversiones alternativas (consideradas de mayor riesgo), en comparación con el 44% de los hombres con profesiones codificadas por mujeres a menudo recibieron sugerencias para pagar deudas primero, comprar un seguro o buscar asesoramiento profesional sobre inversiones, mientras que aquellos con profesiones “masculinas” rara vez lo hicieron. promoción, en que a menudo se aconseja a las mujeres que eviten pérdidas mientras que a los hombres se les guía hacia las ganancias”.
¿Cómo determinaste la lista de profesiones?
“Antes de realizar el estudio principal, preguntamos qué profesiones están dominadas por hombres o mujeres y cuáles son sus salarios promedio, con el objetivo de hacer coincidir profesiones con niveles de ingresos similares, como maestro de preescolar versus trabajador de la construcción”.
¿ChatGPT podría estar simplemente adivinando lo que los usuarios quieren escuchar? ¿Son realmente las mujeres más reacias al riesgo que los hombres?
“Consideramos esto, por lo que primero encuestamos a hombres y mujeres para clasificar sus preferencias de inversión, sin encontrar diferencias significativas. La cuestión no es sólo en qué invertir, sino también cómo se expresan los consejos. Cuando ChatGPT dedujo que el usuario era una mujer, Usó un lenguaje más simple y un tono más autoritario, como “invertir” en lugar de “considerar invertir”. El consejo para las mujeres fue simplificado y condescendiente.”
Estos hallazgos no sólo son sorprendentes sino también preocupantes. ¿Quién tiene la culpa de esto?
“No es que alguien haya programado ChatGPT deliberadamente de esta manera, pero ese es el resultado. Lo que es importante entender es que la persona que supuestamente pidió consejo nunca mencionó su género. Esto significa que incluso si no nos identificamos como parte de un grupo específico Al interactuar con modelos de lenguaje, pueden inferir mucho más sobre nosotros de lo que creemos.
“Esta es la primera vez que los humanos hablan con modelos en lenguaje natural en lugar de lenguajes de programación. Puede que no diga mi edad explícitamente, pero a partir del contexto, el modelo puede adivinarla. No se trata de adivinar intencionalmente detalles sobre nosotros; se está adaptando a la situación. y tratar de predecir la respuesta que quiero escuchar. Este, por supuesto, es uno de los problemas de estos modelos: operan estadísticamente, con el objetivo de proporcionar la respuesta correcta más probable”.
¿Qué causa esto? En el contexto específico de su estudio, ¿se debe a que la mayoría de los programadores son hombres o a la asociación histórica de las inversiones como un campo dominado por los hombres?
“La historia y la realidad están sesgadas. En algún lugar de lo más profundo de Internet, es probable que haya una página que detalla dónde debe invertir una enfermera en comparación con un trabajador de la construcción. Hoy en día, puede haber el mismo número de enfermeros y enfermeros, pero históricamente ha sido una Además, si los datos históricos indican que los hombres no pagan sus préstamos con mayor frecuencia, el modelo seguirá suponiendo hoy que los hombres siguen siendo más riesgosos, incluso si eso ya no es exacto”.
“No existe una solución real al sesgo algorítmico. Las soluciones actuales son como curitas: si encuentro una palabra que introduce sesgo, la reemplazo activamente. Por ejemplo, Google Imágenes ahora intenta ‘equilibrar’ los resultados de búsqueda. Si busca el término ‘ “Profesor” alguna vez resultó en imágenes de hombres blancos, hoy los resultados son más diversos: otra curita es ordenar al algoritmo que ignore el género del solicitante al evaluar cosas como las solicitudes de préstamo. Sin embargo, el género a menudo regresa a través de la profesión u otros indicadores indirectos. , como inferir ingresos o educación basándose en los códigos postales”.
¿Qué es más fácil de arreglar: algoritmos o personas?
“Es más difícil de lo que pensábamos. Inicialmente, creíamos que los procesos de IA basados en datos serían objetivos. Ahora sabemos que los algoritmos están plagados de sesgos y corregirlos es aún más desafiante”.
Si hubiera más mujeres en empresas como OpenAI o Google, ¿mejoraría la situación?
“La conciencia aumentaría, pero el cambio seguiría siendo lento. No se trata sólo de hombres y mujeres; se trata de tener programadores de orígenes más diversos. Antes de arreglar los algoritmos, necesitamos arreglar a la humanidad. Lo que es a la vez decepcionante y sorprendente es que pensé que las máquinas arreglaría las cosas antes que los humanos”.
¿Alguna idea sobre futuras investigaciones?
“Sigo explorando el mundo de los consejos, centrándome no solo en el contenido sino también en el tono. Quiero que ChatGPT ofrezca igualdad de oportunidades, como decirme dónde hay más o menos riesgo. Esto es especialmente importante en las inversiones, donde el 31% de los estadounidenses Quienes utilizaron la IA para este propósito dijeron que confían completamente en sus consejos, sin hacer referencias cruzadas con otras fuentes.
“Pero hay otros dominios aparentemente banales que estudiar. Por ejemplo, antes de dar una conferencia en los Países Bajos, le pedimos a ChatGPT recomendaciones de restaurantes locales. Ofrecía a las mujeres más opciones de ensaladas y a los hombres más lugares para tomar cerveza: otra forma de inteligencia artificial. estereotipos.”
Entonces, ¿deberíamos volver a los motores de búsqueda tradicionales como Google?
“Por un lado, Google te abruma con respuestas. Por otro, al menos no es condescendiente contigo.”