Meta aurait utilisé des livres piratés pour entrainer son IA

Meta, la société mère de Facebook, est actuellement au centre d’une controverse juridique.

Le procès concerne l’utilisation de données protégées par le droit d’auteur pour l’entraînement de ses modèles d’intelligence artificielle, comme Llama.

Les avocats des plaignants allèguent que le PDG de Meta, Mark Zuckerberg, aurait personnellement autorisé l’utilisation de données piratées, en particulier à partir d’un ensemble de données connu sous le nom de LibGen.

ia générative generique intelligence artificielle

LibGen au centre du problème ?

LibGen, est souvent qualifié d’« agrégateur de liens ». Il fournit un accès à des livres numériques et articles protégés par le droit d’auteur. Il sont publiés par des éditeurs tels que Cengage Learning, Macmillan Learning, McGraw Hill, et Pearson Education. LibGen a été poursuivi à plusieurs reprises pour violation de droit d’auteur. Le portail a fermé ses portes tout en étant condamné à des amendes lourdes.

Mark Zuckerberg aurait donné son feu vert

Selon des documents déposés au tribunal de district américain pour le district nord de la Californie, il a été révélé que Mark Zuckerberg avait donné le feu vert à l’équipe de Meta AI pour utiliser LibGen malgré des préoccupations en interne.

Des employés auraient exprimé des inquiétudes concernant l’utilisation de LibGen. Ils qualifiaient ces données de “piratées” et soulignant les risques potentiels pour les relations de Meta avec les régulateurs.

Les arguments de Meta

Meta, ainsi que d’autres géants de la technologie impliqués dans des affaires similaires, ont souvent invoqué le “fair use” ou “usage équitable”.
Cette doctrine juridique américaine permet l’utilisation d’œuvres protégées par le droit d’auteur à des fins de transformation notable et d’innovation. Cependant, de nombreux créateurs et éditeurs rejettent cet argument, estimant que ces pratiques violent leurs droits et leur propriété intellectuelle.

Cette affaire soulève des questions importantes sur l’éthique et la légalité de l’utilisation de données protégées par le droit d’auteur dans le développement de l’intelligence artificielle.
Elle met également en lumière les défis auxquels sont confrontées les entreprises dans leur quête de données de formation tout en respectant les lois sur le droit d’auteur.
Lire d’autres articles sur le droit d’auteur ici

 

Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Retour en haut