Les défis juridiques confrontés par l’IA générative en matière de contenu protégé par le droit d’auteur

Dans un récent dépôt auprès du Parlement britannique, OpenAI, le créateur de ChatGPT, a admis que les principaux modèles d’IA s’appuient largement sur l’accès à des livres et des articles protégés par le droit d’auteur. L’industrie de l’IA, qui vaut des milliards de dollars, argue depuis longtemps que sa technologie d’IA générative apprend à partir de ces textes au lieu de les copier, ce qui la placerait sous le coup de l’usage équitable. Toutefois, deux poursuites récentes intentées par Universal Music Group et The New York Times ont remis en question cette affirmation.

Les grands modèles linguistiques, tels que ceux qui alimentent ChatGPT, ont la capacité de mémoriser des portions de leur texte d’entraînement et de les reproduire textuellement. Cela soulève des préoccupations en matière de violation du droit d’auteur, sapant l’argument de l’usage équitable. Les implications sont importantes : si les entreprises d’IA doivent indemniser les auteurs dont elles dépendent, cela pourrait avoir un impact néfaste sur la technologie et son développement.

La société de capital-risque majeure Andreessen Horowitz, qui a investi massivement dans l’IA générative, reconnaît que cela pourrait « tuer ou sérieusement entraver » toute la technologie. Pour résoudre le problème, il pourrait être nécessaire de reconstruire les modèles en utilisant des sources ouvertes ou correctement licenciées, ce qui entraînerait des coûts substantiels et pourrait éventuellement donner des modèles moins fluides. Malgré les revers, une reconstruction responsable pourrait rétablir la relation entre l’IA générative et les créateurs de contenu dont le travail a été utilisé sans autorisation.

Ce n’est pas la première fois que l’IA générative est confrontée à des batailles juridiques. Des auteurs tels que John Grisham et Sarah Silverman ont déjà intenté des actions collectives contre des entreprises d’IA, arguant que l’utilisation de leurs livres pour former des modèles constitue une copie illégale. L’argument de l’usage équitable a été un pilier de l’industrie technologique de la Silicon Valley par le passé, favorisant l’innovation et les nouvelles technologies.

Alors que des entreprises comme OpenAI affirment que la formation des modèles linguistiques relève d’un usage non expressif, des poursuites récentes remettent en cause cette notion. Des exemples de modèles générant de longs extraits de matériel protégé par le droit d’auteur sans attribution ont été signalés, mettant en évidence la nécessité de définir des limites plus claires.

Face à ces défis juridiques, les entreprises d’IA cherchent à s’attaquer au problème de la mémorisation afin de réduire leur responsabilité. OpenAI, par exemple, considère cela comme un bug rare et travaille activement à l’éliminer. Cependant, des chercheurs ont montré que la mémorisation se produit dans chaque grand modèle linguistique, suscitant des inquiétudes quant à la dépendance de l’industrie vis-à-vis du contenu protégé par le droit d’auteur.

Ce règlement juridique façonnera l’avenir de l’IA générative, obligeant les entreprises à réévaluer leurs pratiques et à trouver un équilibre entre l’innovation et le respect des droits de propriété intellectuelle.

The source of the article is from the blog revistatenerife.com

Privacy policy
Contact