Noticias
Una disputa sobre derechos de autor, entrenamiento de IA y atribución falsa

A Se está desarrollando un caso legal importante ante el Tribunal Superior de Delhi con la agencia de noticias india ANI (Asian News International) demandando a OpenAI, los creadores de ChatGPT, alegando infracción de derechos de autor, atribución falsa y uso indebido de su contenido.
El caso, abierto el 19 de noviembre, plantea cuestiones críticas sobre la intersección de la inteligencia artificial, la propiedad de los datos y los derechos de propiedad intelectual en un panorama digital en rápida evolución.
El caso de la ANI.

Pareja
Anand y Anand
ANI, una agencia de noticias que otorga licencias de datos a medios de comunicación y organizaciones de medios (similar a Reuters), presentó el caso contra OpenAI basándose en varias acusaciones clave:
Fuentes de datos de ChatGPT. ANI alega que ChatGPT, el modelo de lenguaje grande de OpenAI para el aprendizaje automático de IA, accede a datos de tres fuentes principales: datos públicos; datos de terceros socios; y datos investigados directamente por OpenAI. ANI afirma que su contenido se incluye en estas categorías y que OpenAI lo utilizó incorrectamente para entrenar su modelo de IA.
Contenido no disponible públicamente. La ANI sostiene que, si bien parte de su material puede ser de acceso público, hay noticias, entrevistas y reportajes específicos que no están directamente disponibles para el público y sólo son accesibles para los suscriptores. Como tal, ANI afirma que OpenAI no tiene derecho a utilizar este material, ya que no tiene licencia para copiarlo, almacenarlo o utilizarlo con fines de formación.
Tres causas de acción. La denuncia legal de la ANI se fundamenta en tres causas principales de acción:
- ANI sostiene que OpenAI infringió sus derechos de autor al almacenar, usar y hacer copias de sus materiales protegidos por derechos de autor con fines de capacitación sin permiso. El hecho de que el contenido sea de acceso público no niega la necesidad de que OpenAI obtenga permiso para utilizar el material.
- ANI afirma que ChatGPT genera respuestas textuales o sustancialmente similares a su propio contenido. Esto genera preocupaciones sobre posibles violaciones de la ley de derechos de autor y el uso no autorizado de la propiedad intelectual de ANI.
- ANI señala casos en los que ChatGPT ha producido respuestas que atribuyen entrevistas o informes a individuos u organizaciones de manera engañosa o falsa. Por ejemplo, ChatGPT supuestamente afirmó que Rahul Gandhi concedió una entrevista a ANI cuando dicha entrevista no se había realizado. ANI afirma que dicha atribución falsa daña su reputación y socava la precisión de las noticias.
La defensa de OpenAI
OpenAI ha montado una sólida defensa contra las afirmaciones de la ANI, afirmando que sus prácticas son legales y transparentes. Los puntos clave incluyen:
- OpenAI ha argumentado que sus acciones están legalmente justificadas porque el material de ANI está disponible públicamente. Si ANI no quiere que los rastreadores web de OpenAI accedan a su contenido, puede bloquear dicho acceso a través del protocolo “Robots.txt”, un método ampliamente utilizado para impedir que los rastreadores web indexen contenido.
- OpenAI enfatizó que, si bien enfrenta múltiples demandas en los EE. UU., Canadá y Alemania, ningún tribunal ha otorgado una orden judicial ni ha encontrado alguna infracción de derechos de autor por parte de OpenAI. Esto incluye casos en los que otras organizaciones de medios han hecho afirmaciones similares.
- OpenAI afirma que es transparente sobre cómo opera, incluida la divulgación de sus prácticas de uso de datos en su sitio web. Sostiene que la IA no reproduce el material de la ANI palabra por palabra, sino que genera respuestas basadas en una amplia gama de fuentes de datos, incluido contenido disponible públicamente.
- OpenAI niega haber reproducido material protegido por derechos de autor de ANI y argumenta que ANI no ha proporcionado pruebas que demuestren ningún caso específico de infracción. Según OpenAI, el contenido utilizado para la capacitación no se almacena de manera que permita la reproducción del contenido exacto durante las interacciones con ChatGPT.
- OpenAI ha negado haber accedido a cualquier contenido detrás de muros de pago o disponible sólo mediante suscripción, como los informes exclusivos de ANI. La defensa sostiene que el modelo de OpenAI no accede a contenido basado en suscripción o con licencia a menos que esté disponible públicamente.
- OpenAI también niega las acusaciones de atribución falsa, argumentando que la ANI no ha presentado quejas sobre inexactitudes en la atribución. OpenAI afirma que cualquier error identificado se ha corregido de inmediato. La defensa reconoce que, si bien el modelo puede producir ocasionalmente resultados imperfectos, esos casos son raros y se abordan activamente.
- OpenAI sostiene que ANI ya ha optado por bloquear a sus rastreadores para que no puedan rastrear el sitio web de ANI a través de la función “lista de bloqueo” y, como tal, OpenAI ha respetado esta solicitud. Sin embargo, a pesar de los esfuerzos de ANI por bloquear el acceso, OpenAI argumenta que sus sistemas han seguido produciendo material que parece estar relacionado con el contenido de ANI, aunque podría obtenerse de otros datos públicos o de terceros socios.
Una parte importante de la defensa de OpenAI también gira en torno a la cuestión de la jurisdicción territorial.
OpenAI sostiene que no tiene presencia física en la India y que sus servidores están ubicados en el extranjero. Como el entrenamiento del modelo se produce fuera de la India, OpenAI cuestiona la jurisdicción del tribunal sobre el asunto.
Orden judicial provisional
Inicialmente, el tribunal emitió un aviso y una citación a OpenAI. Los puntos clave incluyen:
- El tribunal tomó nota de la objeción con respecto a la jurisdicción territorial, pero permitió que el caso continuara y la cuestión de jurisdicción se abordaría en audiencias futuras;
- El tribunal registró que ANI había colocado los rastreadores de OpenAI en una lista de bloqueo, asegurando que los rastreadores web de OpenAI ya no accederían al sitio web de ANI; y
- El tribunal decidió nombrar un amicus curiae (amigo del tribunal) para ayudar en los procedimientos legales, asegurando que el caso se considere desde todas las perspectivas relevantes.
La próxima fecha de la audiencia se fijó para el 28 de enero de 2025, lo que permitirá a ambas partes tiempo adicional para preparar sus argumentos y pruebas.
Trascendencia
El caso pone en primer plano cuestiones críticas relativas a los derechos de las organizaciones de medios en la era de la inteligencia artificial.
Si bien OpenAI defiende sus prácticas como legítimas y transparentes, las afirmaciones de ANI resaltan las complejidades del uso de datos, los derechos de autor y la atribución en la era digital.
Este caso tiene el potencial de sentar importantes precedentes en la regulación de la IA y la protección de la propiedad intelectual en el sector de los medios.
A medida que la tecnología de IA continúa avanzando, es probable que surjan más batallas legales exigiendo claridad sobre cómo se puede usar, compartir y atribuir el contenido en un mundo cada vez más interconectado.
Vaishali Mittal es socio de Anand and Anand en Delhi.
B-41, Nizamuddin Este
Nueva Delhi 110013, India
www.anandandanand.com
Datos de contacto:
Teléfono: +91 120 4059300
MI: correo electrónico@anandandanand.com