Connect with us

Noticias

Los científicos acaban de encontrar una forma novedosa de descubrir los sesgos de la IA, y los resultados son inesperados

Published

on

Siga PsyPost en Google Noticias

El humor está surgiendo como una lente reveladora para comprender los prejuicios dentro de los sistemas de inteligencia artificial. Un nuevo estudio publicado en Informes Científicos descubrió que cuando se solicitaba a herramientas como ChatGPT y DALL-E que hicieran imágenes “más divertidas”, los cambios resultantes en la representación resaltaban patrones subyacentes de sesgo. Las representaciones estereotipadas de edad, peso corporal y discapacidad visual se hicieron más prominentes, mientras que las representaciones de minorías raciales y de género disminuyeron.

Las herramientas de inteligencia artificial generativa, como ChatGPT y DALL-E de OpenAI, han llamado la atención por su capacidad para crear contenido en una variedad de campos. ChatGPT, un modelo de lenguaje grande, procesa y genera texto similar a un humano basado en vastos conjuntos de datos en los que fue entrenado. Entiende el contexto, predice respuestas y produce texto coherente y significativo. De manera similar, DALL-E es un generador de texto a imagen que crea contenido visual basado en indicaciones detalladas.

El humor es una habilidad humana compleja que combina elementos de sorpresa, sincronización e intención. Los estudios han demostrado que la inteligencia artificial no sólo puede producir humor sino que a veces supera a los creadores humanos. Por ejemplo, un estudio en MÁS UNO descubrió que los chistes generados por IA fueron calificados como igual o incluso más divertidos que los creados por participantes humanos, incluidos los satíricos profesionales. Esto sugiere que la capacidad de la IA para detectar patrones y generar contenido se extiende a la elaboración de chistes que resuenan ampliamente, incluso sin la profundidad emocional o experiencial que los humanos aportan al humor.

El estudio actual buscó aprovechar esta base examinando cómo el humor influye en el sesgo en las imágenes generadas por IA. Los investigadores quedaron intrigados por una observación: cuando le pedían a ChatGPT que modificara las imágenes para hacerlas “más divertidas”, a menudo introducía rasgos exagerados o estereotipados. Este patrón generó preocupación sobre si el humor en los sistemas de IA podría reforzar los estereotipos, particularmente contra grupos que históricamente han sido blanco de prejuicios.

“Estoy muy interesado en estudiar cómo los consumidores interactúan con tecnologías nuevas y emergentes como la IA generativa. En un momento, mis coautores y yo notamos que cuando le pedíamos a ChatGPT que hiciera las imágenes “más divertidas”, a menudo introducíamos cambios extraños y estereotipados, como convertir a un hombre blanco conduciendo un automóvil en un hombre obeso que llevaba gafas de gran tamaño”. dijo el autor del estudio Roger Saumure, estudiante de doctorado en la Escuela Wharton de la Universidad de Pensilvania.

“Esto nos pareció algo más que un simple problema técnico y sugirió que podrían surgir sesgos sistemáticos cuando grandes modelos de lenguaje interactúan con generadores de texto a imagen. Dado un gran conjunto de investigaciones en psicología y sociología que muestran que el humor puede exacerbar los estereotipos, sentimos que era importante, tanto teórica como prácticamente, probar empíricamente si la interacción entre los modelos de IA podría reforzar los estereotipos”.

La investigación implicó una auditoría sistemática de imágenes generadas por IA. Dos asistentes de investigación (ciegos a la hipótesis del estudio) ingresaron 150 indicaciones que describían las actividades humanas en un popular sistema de inteligencia artificial generativa. Estas indicaciones generaron 150 imágenes iniciales. Para crear un segundo conjunto de imágenes, los asistentes le indicaron a la IA que hiciera cada imagen “más divertida”. El proceso se repitió, lo que dio como resultado 600 imágenes en dos condiciones (versiones original y más divertida).

Luego, el equipo analizó tanto las características visuales de las imágenes como los descriptores textuales utilizados por la IA para generarlas. Cada imagen fue codificada según cinco dimensiones de representación: raza, género, edad, peso corporal y discapacidad visual. Los investigadores observaron si los rasgos de las imágenes “más divertidas” se desviaban de los de las imágenes originales y si estas desviaciones reflejaban representaciones estereotipadas.

Los investigadores descubrieron que las representaciones estereotipadas de personas mayores, personas con alto peso corporal y personas con discapacidad visual se volvieron más frecuentes en las imágenes “más divertidas”. Mientras tanto, disminuyeron las representaciones de minorías raciales y de género (grupos que a menudo están en el centro de las discusiones sobre prejuicios).

“Lo que más nos llamó la atención es que el patrón de sesgo que observamos iba en la dirección opuesta a lo que predecía la literatura”, dijo Saumure a PsyPost. “Inicialmente, esperábamos replicar patrones conocidos de prejuicios raciales y de género a través de la lente del humor, mientras dilucidamos si los prejuicios surgían de los modelos de texto o de imagen”.

“Sin embargo, terminamos descubriendo que, en todo caso, la IA generativa mostraba menos sesgo hacia estas categorías y al mismo tiempo estaba sesgada contra grupos menos sensibles políticamente. Es decir, cuando le pedimos a la IA que hiciera las imágenes “más divertidas”, era menos probable que aparecieran grupos políticamente sensibles (minorías raciales y de género), mientras que grupos como adultos mayores, personas con discapacidad visual o personas con alto peso corporal se representaban con mayor frecuencia. .”

El humor suscita rasgos a menudo exagerados asociados con grupos no sensibles políticamente, como hacer que las personas mayores parezcan frágiles o representar a personas con alto peso corporal de una manera exagerada y poco halagadora. Por ejemplo, una representación neutral de una persona leyendo un libro podría transformarse en una caricatura de un adulto mayor con gafas gruesas y rasgos físicos exagerados.

Curiosamente, el sesgo parecía originarse principalmente en el generador de texto a imagen más que en el modelo de lenguaje. Si bien ChatGPT produjo descripciones textuales detalladas para guiar el proceso de generación de imágenes, los cambios en la representación parecían surgir de cómo DALL-E interpretó estas indicaciones para crear imágenes.

“Una conclusión principal de este estudio es que los sistemas de IA contemporáneos pueden corregir en exceso el sesgo contra grupos políticamente destacados (por ejemplo, género y raza), mientras que corrigen insuficientemente el sesgo contra grupos menos destacados políticamente (por ejemplo, mayor peso corporal, edad avanzada, discapacidad visual). )”, dijo Saumure. “Por lo tanto, aunque empresas como OpenAI han hecho esfuerzos considerables para reducir los sesgos, es probable que estos hayan sido principalmente para mantener satisfechos a los consumidores y a los medios, en lugar de reducir el sesgo global en general. Creemos que esto subraya la necesidad de que las empresas y los responsables políticos adopten un enfoque más global e inclusivo para auditar todas las formas de sesgo de la IA”.

“Una segunda conclusión de nuestro trabajo es que resulta particularmente difícil eliminar el sesgo de ciertas modalidades (es decir, imagen en lugar de texto). Una tercera conclusión es que el humor puede servir como una lente muy útil para descubrir sesgos a veces sutiles en varios tipos de resultados de IA, incluidos texto, imágenes, audio y otras modalidades”.

Los investigadores también notaron que la subrepresentación de ciertos grupos era evidente incluso antes de que se introdujeran las indicaciones humorísticas. “Por ejemplo, en nuestro conjunto inicial de imágenes, sólo alrededor del 9,80% presentaba mujeres y el 0% presentaba individuos con alto peso corporal, una grave subestimación de los promedios nacionales de 73,60% y 50,50%”, explicó Saumure. “Este resultado sugiere que los modelos de IA pueden estar reflejando supuestos culturales predeterminados de ‘delgado, masculino y blanco’ como norma. En el futuro, será importante que las empresas aborden y corrijan estas omisiones para crear sistemas de IA más inclusivos y equitativos”.

Sin embargo, es importante señalar que la investigación se centró en un único sistema de IA generativa, dejando abierta la cuestión de si se producen patrones similares en otros modelos. El contexto cultural es otra variable: los sistemas de IA entrenados en diferentes regiones pueden exhibir sesgos que reflejan sensibilidades y dinámicas sociales locales.

“Nuestra perspectiva teórica también predice que los patrones de sesgo deberían aparecer en diferentes culturas, dependiendo de qué grupos particulares sean vistos como políticamente sensibles”, dijo Saumure. “Por ejemplo, deberíamos esperar que los LLM que generan imágenes basadas en indicaciones en hindi tengan más probabilidades de corregir los prejuicios contra los musulmanes, dada la tensión más destacada en esa cultura entre hindúes y musulmanes”.

“Espero continuar mi investigación sobre cómo interactúan los consumidores con la IA generativa. Actualmente estoy investigando el poder persuasivo de estas tecnologías: cómo pueden persuadir a los consumidores para que comuniquen mensajes específicos o replanteen nuestras interpretaciones de la información. En última instancia, mi objetivo es comprender mejor cómo estas herramientas moldean el comportamiento y el bienestar del consumidor”.

El estudio, “El humor como ventana al sesgo generativo de la IA”, fue escrito por Roger Saumure, Julian De Freitas y Stefano Puntoni.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias

Le pregunté a Deepseek vs chatgpt una serie de preguntas éticas, y los resultados fueron impactantes

Published

on

Aquí hay un experimento de pensamiento rápido para usted: digamos que podría agregar un químico a la comida de todos para salvar innumerables vidas, pero la estipulación es que no podría decirle a nadie. ¿Todavía les dirías?

No se entiende como un acertijo; Incluso podría decir que solo hay una respuesta correcta. La mayoría de nosotros probablemente argumentaría que introducir un químico en los alimentos sin decirle a nadie siempre es malo, sin importar cuáles sean los beneficios. Después de todo, no hay garantía de que funcione.

Continue Reading

Noticias

Italia, otros 2 prohíben Deepseek; Operai responde con O3-Mini

Published

on

Desde el lanzamiento de su chatbot de inteligencia artificial (IA) en enero, Deepseek ha dominado el sector tecnológico, con las empresas occidentales luchando por comprender cómo una startup china desconocida se había convertido en un fenómeno global de la noche a la mañana. El líder de la industria Openai respondió rápidamente al lanzar O3-Mini, su modelo de razonamiento más rentable.

Deepseek también está demostrando ser un dolor de cabeza para los reguladores. Si bien la administración Trump sopora una restricción para proteger a las empresas estadounidenses, el gobierno italiano se está moviendo rápidamente, prohibiendo a la compañía china por el supuesto uso opaco de los datos de los italianos. Taiwán ha implementado una prohibición parcial, y casi otras docenas de otras naciones en Europa y Asia están modificando medidas similares.

La respuesta de OpenAi a Deepseek: O3-Mini

Openai anunció el lanzamiento de O3-Mini el viernes, describiéndolo como “el modelo más nuevo y rentable de nuestra serie de razonamiento”.

Previo por primera vez en diciembre pasado, el O3-Mini es el último miembro de los modelos de razonamiento ‘O’ del gigante de IA: el primero fue O1, que lanzó a principios de 2024, pero la compañía se saltó O2 debido a posibles infracciones de marca registrada. A diferencia de GPT-4O, que se centra en tareas de masa y es más creativa, la familia de modelos ‘O’ está más orientada a tareas complejas y estructuradas.

Operai dice que el nuevo modelo está optimizado para la ciencia, las matemáticas y la codificación, todo mientras reduce la latencia que enfrentaban los modelos anteriores.

Más importante aún, ofrece estas ventajas mientras mantiene bajos costos. Esta es una respuesta directa a Deepseek, cuyo reclamo de fama fue su rentabilidad. Si bien Según los informes, Operai gastó cientos de millones de dólares para capacitar a sus modelos, Deepseek afirmó haber gastado menos de $ 6 millones para lograr los mismos resultados.

OpenAI tiene un precio de O3-Mini a $ 0.55 y $ 4.40 por 750,000 palabras de entrada y salida, respectivamente, que es alrededor de un tercio del costo del modelo anterior. Sin embargo, sigue siendo más alto que Deepseek, que cobra $ 0.14 y $ 2.19 por palabras similares de entrada y salida, respectivamente.

“El lanzamiento de O3-Mini marca otro paso en la misión de OpenAi de superar los límites de la inteligencia rentable […] A medida que la adopción de AI se expande, seguimos comprometidos con liderar la frontera, construyendo modelos que equilibran la inteligencia, la eficiencia y la seguridad a escala ”, declaró la compañía.

O3-Mini está disponible para todos los usuarios de ChatGPT, marcando la primera vez que los usuarios gratuitos pueden probar los modelos de razonamiento de la compañía, en otra respuesta directa al atractivo del mercado masivo de Deepseek. Estará integrado en el chatgpt chatbot bajo la función “razón”. Sin embargo, los usuarios de pago desbloquearán características adicionales, que según OpenAI incluye respuestas más inteligentes y límites de mensajes más altos. Para obtener acceso ilimitado al nuevo modelo, los usuarios deberán pagar $ 200 mensualmente por ChatGPT Pro.

Reguladores de Spooks de Deepseek: adquirentes en Italia, Taiwán, Texas

Desde que lanzó su chatbot, que se volvió muy popular a nivel mundial, Deepseek ha inestable los reguladores occidentales, lo que los lleva a responder con restricciones y prohibiciones.

El viernes, la Autoridad de Protección de Datos de Italia, Garante, prohibió el chatbot de la firma china, señalando una falta de transparencia sobre cómo usaría los datos recopilados de los usuarios italianos. Garante afirmó haber enviado a Deepseek una serie de preguntas que buscan más información sobre cómo recopila, almacena y usa los datos, y no estaba satisfecho con las respuestas.

No es la primera vez que Garante ha tomado medidas enérgicas contra un modelo de IA. En abril de 2023, el regulador de Watchdog prohibió el CHATGPT sobre las preocupaciones de privacidad de los datos y lanzó una investigación sobre si OpenAI había violado el Reglamento Europeo de Protección de Datos Generales (GDPR). Sin embargo, menos de un mes después, levantó la prohibición y declaró que OpenAi había abordado las preocupaciones.

Mientras que Italia es una de las primeras en prohibir completamente a Deepseek, otros, como Taiwán, están restringiendo su uso en áreas más específicas. El lunes, el primer ministro taiwanés, Cho Jung-Tai, prohibió el uso del modelo de IA en el sector público para “garantizar que la seguridad de la información del país” esté adecuadamente protegida.

Además, Taiwán está preocupado por los datos de sus ciudadanos que terminan en manos chinas debido a las tensiones crecientes entre los dos sobre la presión de China para la unificación. El primer ministro Jung-Tai también expresó su preocupación de que el gobierno chino pudiera usar el modelo de IA para hacer cumplir la censura, con Beijing que se cree que tiene acceso sin restricciones a todos los modelos de IA chinos.

Y luego está los Estados Unidos, sobre el cual el mundo occidental espera dirección sobre cómo responder al dominio nocturno de Deepseek. Muchos líderes estadounidenses en los sectores políticos, tecnológicos y financieros han pedido a la administración Trump que se mueva rápidamente y prohíba el modelo chino. Openai, que puede perder más, incluso ha acusado a Deep Speeek de incorrectamente utilizando sus modelos para capacitar a su IA, un reclamo de Trump’s Ai Zar David Sacks respaldó.

Como Trump considera su próximo movimiento, Texas no está sentado de manera inestable y ha prohibido el uso de Deepseek en cualquier dispositivo gubernamental.

“Texas no permitirá que el Partido Comunista chino se infiltrará en la infraestructura crítica de nuestro estado a través de aplicaciones de IA y redes sociales de recolección de datos”, declaró el gobernador Greg Abbott.

Para que la inteligencia artificial (IA) trabaje dentro de la ley y prospere frente a los crecientes desafíos, necesita integrar un sistema de cadena de bloques empresarial que garantice la calidad y la propiedad de la entrada de datos, lo que permite mantener los datos seguros al tiempo que garantiza la inmutabilidad de datos. Echa un vistazo a la cobertura de Coingeek sobre esta tecnología emergente para aprender más Por qué Enterprise Blockchain será la columna vertebral de AI.

Reloj: Demostrando el potencial de la fusión de Blockchain con AI

https://www.youtube.com/watch?v=p9m7a46s8bw title = “YouTube Video Player” FrameBorDer = “0” permitido = “acelerómetro; autoplay; portapapeles-write; cifrado-media; giroscopio; imagen en foto; Origen “PREFINILLECREEN>

Continue Reading

Noticias

El chatgpt de un gran bufete de abogados falla

Published

on

(a través de Getty Images)

Bienvenido Jurisdicción originalla última publicación legal de mí, David Lat. Puede obtener más información sobre la jurisdicción original leyendo su Acerca de la páginay puedes enviarme un correo electrónico a [email protected]. Esta es una publicación respaldada por el lector; Puede suscribirse haciendo clic en aquí.

Todos estamos familiarizados con la infame historia de los abogados que Archivó un breve Lleno de casos inexistentes: curso de ChatGPT, la herramienta AI que compensó alias “alucinadas” las citas falsas. Al final, el juez Kevin Castel (SDNY) sancionado a los abogadospor una suma de $ 5,000, pero la notoriedad nacional seguramente fue mucho peor.

Los abogados ofensivos, Steven Schwartz y Peter Loduca, trabajaron en un pequeño bufete de abogados de Nueva York llamado Levidow, Levidow y Oberman. Y parece que su atornillado surgió en parte de las limitaciones de recursos, con las que las pequeñas empresas frecuentemente luchan. Como le explicaron al juzgar a Castel en el Audiencia de sancionesen el momento en que su empresa no tenía acceso a Westlaw o Lexisnexis, que son, como todos sabemos, extremadamente caros, y el tipo de suscripción que tenían para Fastcase no les proporcionó acceso completo a casos federales.

Pero, ¿qué pasa con los abogados que trabajan para una de las firmas de abogados más grandes del país? No deberían tener ninguna excusa, ¿verdad?

Ya sea que tengan una excusa o no, parece que ellos también pueden cometer el mismo error. Ayer, la jueza Kelly Rankin del distrito de Wyoming emitió un para mostrar causa en Wadsworth v. Walmart Inc. (énfasis en el original):

Este asunto está ante el tribunal por su propia notificación. El 22 de enero de 2025, los demandantes presentaron su Movimientos en limine. [ECF No. 141]. Allí, los demandantes citaron nueve casos totales:

1. Wyoming v. Departamento de Energía de EE. UU.2006 WL 3801910 (D. Wyo. 2006);

2. Holanda v. Keller2018 WL 2446162 (D. Wyo. 2018);

3. Estados Unidos v. Hargrove2019 WL 2516279 (D. Wyo. 2019);

4. Meyer v. Ciudad de Cheyenne2017 WL 3461055 (D. Wyo. 2017);

5. US v. Caraway534 F.3d 1290 (10th Cir. 2008);

6. Benson v. Estado de Wyoming2010 WL 4683851 (D. Wyo. 2010);

7. Smith v. Estados Unidos2011 WL 2160468 (D. Wyo. 2011);

8. Woods v. Bnsf Railway Co.2016 WL 165971 (D. Wyo. 2016); y

9. Fitzgerald v. Ciudad de Nueva York2018 WL 3037217 (SDNY 2018).

Ver [ECF No. 141].

El problema con estos casos es que Ninguno existeexcepto Estados Unidos v. Caraway534 F.3d 1290 (10th Cir. 2008). Los casos no son identificables por su cita Westlaw, y el tribunal no puede localizar el distrito de los casos de Wyoming por su nombre de caso en su sistema local de presentación de la corte electrónica. Los acusados ​​promueven a través de un abogado de que “al menos algunos de estos casos mal citados se pueden encontrar en ChatGPT”. [ECF No. 150] (Proporcionar una imagen de la ubicación de chatgpt “Meyer v. Ciudad de Cheyenne“A través del identificador falso de Westlaw).

Como es de esperar, el juez Rankin está … no está contento:

Cuando se enfrentan a situaciones similares, los tribunales ordenaron que los abogados de presentación muestren por qué las sanciones o la disciplina no deberían emitir. Mata v. AviancaInc., No. 22-CV-1461 (PKC), 2023 WL 3696209 (SDNY 4 de mayo de 2023); Estados Unidos v. HayesNo. 2: 24-CR-0280-DJC, 2024 WL 5125812 (Ed Cal. 16 de diciembre de 2024); Estados Unidos v. CohenNo. 18-CR-602 (JMF), 2023 WL 8635521 (SDNY 12 de diciembre de 2023). En consecuencia, el tribunal ordena de la siguiente manera:

Se ordena que al menos uno de los tres abogados proporcione una copia verdadera y precisa de todos los casos utilizados en apoyo de [ECF No. 141]excepto por Estados Unidos v. Caraway534 F.3d 1290 (10th Cir. 2008), a más tardar a las 12:00 p.m., Tiempo estándar de montaña, ON 10 de febrero de 2025.

Y si no pueden proporcionar los casos en cuestión, los abogados “mostrarán por separado la causa por escrito por qué no debe ser sancionado de conformidad con: (1) alimentado. R. Civ. P. 11 (b), (c); (2) 28 USC § 1927; y (3) el poder inherente del tribunal para ordenar sanciones por citar casos inexistentes al tribunal “. Y esta presentación por escrito, que se debe el 13 de febrero, “tomará la forma de una declaración jurada” que contiene “una explicación exhaustiva de cómo se generaron la moción y los casos falsos”, así como una explicación de cada abogado de “su papel en redactar o supervisar la moción “.

¿Quiénes son los abogados detrás de este aparente ANSNAFU? Se llaman por nombre en la página tres del pedido:

Los tres abogados subsignados a [ECF No. 141] son:

Como puede ver en las firmas en el ofensiva movimiento en liminaTaly Goody trabaja en Grupo de leyes de Goodyuna empresa con sede en California que parece tener tres abogados. Pero Rudwin Ayala y Michael Morgan trabajan en el gigante Morgan y Morganque se describe en su sitio web como “el bufete de abogados de lesiones más grande de Estados Unidos”. De acuerdo a El abogado estadounidenseMorgan y Morgan cuenta con más de 1,000 abogados, lo que la convierte en la empresa #42 en el país basada en el personal.

Moraleja de la historia: los abogados de las grandes empresas pueden mal uso del chatgpt tan bien como cualquier persona. And although Morgan and Morgan is a plaintiff’s firm—which might cause snobby attorneys at big defense firms to say, with a touch of hauteur, “Of course it is”—I think it’s only a matter of time before a defense-side, Am La firma de la Ley 100 hace un paso en falso similar en una presentación pública.

Estas historias de “abogados se dedican a Chatgpt Fail” tienden a ser populares entre los lectores, lo cual es una de las razones por las que he escrito este, pero no quiero exagerar su importancia. Como le dije a Bridget McCormack y Zach Abramowitz en el Podcast AAAI“ChatGPT no participa en estos atornillados; Los humanos que usan incorrectamente Chatgpt se involucran en estos atornillados “. Pero las historias todavía se vuelven virales a veces porque tienen un cierto valor de novedad: la IA es, al menos en el mundo de la práctica legal, todavía (relativamente) nueva.

Sin embargo, el peligro es que las historias de “Fail ChatGPT” podrían tener un efecto escalofriante, en términos de disuadir a los abogados de (responsablemente) explorar cómo la IA y otras tecnologías transformadoras pueden ayudarlos a servir a sus clientes de manera más eficiente y efectiva. Como dijo McCormack en el podcast AAAI después de mencionar la debacle de SDNY: “Todavía estoy enojado con ese abogado del distrito sur de Nueva York porque siento que ha retrasado toda la profesión en dos años. Estoy literalmente tan enojado con ese tipo “.

Me puse en contacto con Ayala, Goody y Morgan por correo electrónico, pero aún no he tenido noticias; Si y cuando lo haga, actualizaré esta publicación. De lo contrario, sintonice la próxima semana, cuando presentarán sus respuestas a la orden de mostrar causa.

Y mientras tanto, si confía en ChatGPT u otra herramienta de IA para la investigación legal, por favor, por favor Use una plataforma de investigación legal real para confirmar que (1) existen los casos y (2) los ha citado con precisión. Eso no es demasiado para preguntar, ¿verdad?

Gracias por leer Jurisdicción originaly gracias a mis suscriptores pagados por hacer posible esta publicación. Los suscriptores obtienen (1) acceso a Aviso judicialmi resumen semanal que ahorra tiempo de las noticias más notables en el mundo legal; (2) historias adicionales reservadas para suscriptores pagados; (3) transcripciones de entrevistas de podcast; y (4) la capacidad de comentar publicaciones. Puede enviarme un correo electrónico a [email protected] con preguntas o comentarios, y puede compartir esta publicación o suscribirse con los botones a continuación.

Compartir

Continue Reading