Noticias
Cinco importantes empresas de medios canadienses demandan a OpenAI por extracción de datos y violación de derechos de autor – Copyright
OpenAI, la organización de investigación de inteligencia artificial, ha creado modelos de lenguaje avanzados, incluidos GPT-3 y GPT-4. Estos modelos se entrenaron utilizando una cantidad considerable de datos disponibles públicamente para mejorar las capacidades de generación y comprensión del lenguaje. OpenAI se ha visto envuelto recientemente en desafíos legales sobre sus métodos de uso de dichos datos.
Cinco importantes empresas de medios de noticias canadienses: Torstar, Postmedia, The Globe and Mail, The Canadian Press y CBC/Radio han demandado a OpenAI por supuestamente utilizar sus artículos y contenidos protegidos por derechos de autor sin permiso para entrenar sus modelos de IA. Se quejan de que la práctica de OpenAI de extraer material disponible públicamente de la web para mejorar sus técnicas de aprendizaje automático constituye una infracción de sus derechos sobre la propiedad intelectual.
Dicho título busca establecer la premisa de que OpenAI está utilizando su contenido con fines comerciales en violación de las leyes relacionadas con los derechos de autor, ya que nunca ha compensado ni buscado el consentimiento de los medios de comunicación. Las empresas afirman que el valor total de la reclamación podría ascender a miles de millones de dólares si exigen 20.000 dólares canadienses (unos 14.700 dólares estadounidenses) por cada artículo que, según afirman, se utilizó indebidamente.
Defensa de OpenAI: trato justo y uso público de datos
Según se informa, OpenAI aún no ha profundizado en los detalles de las demandas canadienses, pero sostiene que sus métodos entran dentro del “trato justo”, tal como se define en la ley de derechos de autor canadiense. Permite el uso de trabajos protegidos por derechos de autor sin permiso según criterios específicos. OpenAI afirma además que es un modelo entrenado utilizando principalmente recursos disponibles públicamente y que cumple con los principios de trato justo. Según OpenAI, el uso de datos públicos favorece la innovación y es beneficioso para los creadores, incluso si no se ofrece ninguna compensación a las organizaciones de noticias respetadas.
Esta demanda casi refleja una disputa legal similar en los Estados Unidos, donde The New York Times demandó a OpenAI junto con su socio Microsoft por infracción de derechos de autor. Las empresas negaron esas acusaciones en ese caso, y también se espera una defensa muy similar en este caso.
Disposiciones sobre trato justo según la ley canadiense:
El artículo 29 de la Ley de derechos de autor de Canadá establece disposiciones sobre trato justo. Hay determinados fines para los cuales el uso no autorizado de una obra protegida por derechos de autor no dará lugar a ninguna infracción. Estos propósitos incluyen: investigación, estudio privado, educación, parodia, sátira, crítica, revisión y reportaje de noticias.
Si el uso cae dentro de uno de estos propósitos, entonces la equidad se determina aplicando la prueba de 6 factores establecida por la Corte Suprema de Canadá en el caso de CCH Canadian Ltd. contra la Sociedad de Abogados del Alto Canadá. Los 6 factores establecidos por el tribunal incluyen: propósito, carácter, monto, naturaleza, efecto y alternativas al trato. Los tribunales pueden basarse en otros factores si es necesario para determinar la equidad del trato. Todos estos factores deben juzgarse simultáneamente y no de forma aislada.
El propósito del trato justo debe determinarse evaluando objetivamente el motivo o intención final del usuario al utilizar la obra protegida por derechos de autor. El carácter del trato tiende a volverse injusto si se distribuyen múltiples copias de la obra. La cantidad de trabajo utilizado se concentra en la proporción del trabajo utilizado. La naturaleza de la obra se deduce de la intención de publicación. El efecto del trato examina si la obra reproducida puede competir con la obra original. Por último, se verifica si el usuario tenía otro trabajo sin derechos de autor o con licencia abierta como alternativa disponible o no para determinar la equidad del trato.
El concepto de trato justo según la ley canadiense es muy similar al concepto de uso justo en los Estados Unidos. En un caso histórico de Campbell contra Acuff-Rose Music, Inc., la Corte Suprema de los Estados Unidos sostuvo que si el propósito y el carácter del uso tienen una intención transformadora, se considerará uso legítimo.
Alegaciones referentes a incumplimiento de los Términos de servicio
Además de las reclamaciones por infracción de derechos de autor, las empresas de medios canadienses han presentado dos acusaciones adicionales. Acusan a OpenAI de evadir los sistemas anti-scraping de las organizaciones de noticias, cuyo objetivo es evitar que robots y rastreadores web no autorizados obtengan acceso a sus sitios web. Los demandantes afirman que OpenAI ignoró los términos de servicio, que limitan el acceso a la información de noticias al “uso personal y no comercial”. Las empresas de noticias argumentan que al extraer su contenido, OpenAI lo utilizó con fines comerciales sin su permiso.
Escrutinio legal: scraping, derechos de autor y trato justo
El quid de los muchos argumentos legales es si el scraping de contenidos de noticias equivale a “copiar” con fines de derechos de autor y si constituye un trato justo. Según las leyes de derechos de autor de Canadá y Estados Unidos, se permite un uso limitado no autorizado de obras protegidas bajo excepciones de uso legítimo o trato justo, que está sujeto a la consideración de los factores mencionados anteriormente.
OpenAI sostiene que “extraer citas de noticias para entrenar sus modelos no significa copiar el material directamente”, sino abstraerlo del medio. Se cuestiona que este proceso de abstracción, que deriva construcciones como patrones y relaciones en lugar de reproducir algunos artículos, no constituye ninguna infracción. Luego afirman que no hay replicación del contenido con el que fueron entrenados, sino que aprenden de patrones estadísticos, que no están sujetos a protección de derechos de autor.
La organización sin fines de lucro Creative Commons ha intervenido en la posición adoptada por OpenAI, de manera similar a cómo se percibe que la digitalización de libros por parte de Google los hace accesibles a las búsquedas. Ambos, argumentan, transforman el material original en nuevas formas que no compiten con el contenido original ni disminuyen su valor. Sin embargo, las empresas de medios responden que sus obras originales se están utilizando para obtener beneficios comerciales de OpenAI sin ninguna compensación y cuestionan si dicha práctica es justa.
Posibilidades de concesión de licencias y liquidación
Justo después de la demanda del New York Times, OpenAI tomó dos medidas como medida de precaución para minimizar pérdidas potenciales. En primer lugar, expresó que respetaría la decisión de cualquier organización de noticias que optara por que su contenido no estuviera disponible como datos de capacitación. En segundo lugar, también comenzó a celebrar acuerdos con organizaciones de noticias para otorgar licencias de su contenido con fines de capacitación. Estas medidas son una señal de que OpenAI intenta mantener un punto medio a medida que se desarrollan las demandas.
Sin embargo, estas demandas son muy importantes con respecto al futuro tanto del desarrollo de la IA como de la legislación sobre derechos de autor. Por lo tanto, si OpenAI tiene éxito al sostener que la extracción de datos está dentro de las disposiciones de derechos de autor sobre trato justo, entonces efectivamente resultaría en una disminución del mercado para las transacciones de licencias, ya que se crearían precedentes legales que autorizarían a las empresas de IA a utilizar datos disponibles públicamente sin compensar el contenido. creadores. Por el contrario, si el fallo favorece a las empresas de medios, puede catalizar más restricciones en el desarrollo de la IA y obligar a OpenAI a celebrar aún más acuerdos de licencia.
Conclusión: influencia en la IA y los derechos de autor
A medida que se desarrolle el caso, sus implicaciones serán de gran alcance para las empresas de inteligencia artificial y las organizaciones de medios y para los propios derechos de autor en la era digital. Dará forma al futuro de la capacitación de modelos de inteligencia artificial y la regulación del uso de datos si los tribunales fallan a favor de las empresas de medios. Por el contrario, un fallo a favor de OpenAI alentaría a otras empresas de tecnología a seguir su ejemplo basándose en disposiciones de uso legítimo o trato justo para evitar tarifas de licencia.
La disputa legal continúa y el destino de las tecnologías de inteligencia artificial está en juego con la ley de derechos de autor.
El contenido de este artículo pretende proporcionar una guía general sobre el tema. Se debe buscar asesoramiento especializado sobre sus circunstancias específicas.