Desafios legais enfrentados pelo IA Generativa sobre conteúdo com direitos autorais

Em uma recente declaração ao Parlamento do Reino Unido, a OpenAI, criadora do ChatGPT, admitiu que os principais modelos de IA dependem muito do acesso a livros e artigos com direitos autorais. A indústria de IA, que vale bilhões de dólares, tem argumentado há muito tempo que sua tecnologia de IA generativa aprende com esses textos em vez de copiá-los, se encaixando assim na doutrina do uso justo. No entanto, dois processos recentes movidos pela Universal Music Group e pelo The New York Times contestaram essa afirmação.

Grandes modelos de linguagem, como os que alimentam o ChatGPT, têm a capacidade de memorizar partes do texto de treinamento e reproduzi-las textualmente. Isso levanta preocupações sobre violação de direitos autorais, minando o argumento do uso justo. As implicações são significativas – se as empresas de IA precisarem compensar os autores cujo trabalho eles dependem, isso pode ter um impacto negativo na tecnologia e seu desenvolvimento.

A importante empresa de capital de risco Andreessen Horowitz, que investiu significativamente em IA generativa, reconhece que isso poderia “matar ou prejudicar significativamente” toda a tecnologia. Para resolver o problema, os modelos podem ter que ser reconstruídos usando fontes abertas ou devidamente licenciadas, o que acarretaria custos substanciais e potencialmente resultaria em modelos menos fluentes. Apesar dos contratempos, uma reconstrução responsável poderia restaurar a relação entre a IA generativa e os criadores de conteúdo que viram seu trabalho ser usado sem permissão.

Esta não é a primeira vez que a IA generativa enfrenta batalhas legais. Autores como John Grisham e Sarah Silverman já moveram ações coletivas contra empresas de IA, argumentando que treinar modelos usando seus livros constitui cópia ilegal. O argumento do uso justo tem sido um pilar para a indústria de tecnologia do Vale do Silício no passado, possibilitando inovação e novas tecnologias.

Embora empresas como a OpenAI tenham afirmado que o treinamento de modelos de linguagem é um uso não expressivo, processos recentes questionaram essa ideia. Exemplos de modelos gerando longos trechos de material com direitos autorais sem atribuição surgiram, destacando a necessidade de limites mais claros.

Com o aumento dos desafios legais, as empresas de IA buscam resolver o problema da memorização para mitigar a responsabilidade. A OpenAI, por exemplo, considera isso um bug raro e está trabalhando ativamente para eliminá-lo. No entanto, pesquisadores mostraram que a memorização ocorre em todos os grandes modelos de linguagem, levantando preocupações sobre a dependência da indústria de conteúdo com direitos autorais.

Esse acerto de contas legal moldará o futuro da IA generativa, levando as empresas a reavaliarem suas práticas e encontrarem um equilíbrio entre inovação e respeito aos direitos de propriedade intelectual.

The source of the article is from the blog be3.sk

Privacy policy
Contact