IA : Meta poursuivi en France pour non respect du droit d’auteur

Un regroupement d’organisations représentatives du monde de l’édition reproche à la maison mère de Facebook et Instagram d’utiliser des contenus pour entraîner ses modèles d’IA.

Meta Plainte France
Les 3 organisations ont poursuivi Meta devant le tribunal judiciaire de Paris. © Askar - stock.adobe.com

Droit d’auteur : Meta poursuivi au tribunal de Paris

Trois des principales associations françaises du monde de l’édition et du respect du droit d’auteur – le Syndicat national de l’édition (SNE), la Société des gens de lettres (SGDL) et le Syndicat national des auteurs et des compositeurs (SNAC) – ont annoncé avoir entrepris des poursuites à l’encontre de Meta, ce mercredi 12 mars 2025, devant le tribunal judiciaire de Paris. Les organisations reprochent au géant californien d’avoir constitué une base de données de près de 200 000 livres pour entraîner son modèle de langage Llama, sans respecter le droit d’auteur.

Pour Christophe Hardy, président de la SGDL, cette action ambitionne de « faire naître une volonté sérieuse des IA de tenir compte de la création, d’en respecter le cadre juridique et, le cas échéant, de trouver des contreparties pour l’utilisation d’œuvres dont elles se nourrissent ». De son côté, le président du SNAC met en garde contre la création de « faux livres », constitués à partir du pillage d’œuvres protégées.

Les plaignants réclament « le respect du droit d’auteur et, notamment, le retrait complet des répertoires de données créés sans autorisation et utilisés pour entraîner les IA ».

IA : la question de la propriété intellectuelle peine à être adressée

La question du respect du droit d’auteur et de la propriété intellectuelle a agité le monde de l’IA générative à partir de 2023, avec l’émergence de ChatGPT. Les modèles du chatbot d’OpenAI – tout comme ceux de ses concurrents – ont initialement été entraînés sur des ensembles de données massifs, la plupart du temps issus du web, ce qui inclut inévitablement des contenus protégés.

Dans une contribution adressée par OpenAI au Comité de la communication et du numérique de la Chambre des Lords du Royaume-Uni, la firme reconnaissait : « Étant donné que le droit d’auteur couvre aujourd’hui pratiquement toutes les formes d’expression humaine – y compris les articles de blog, les photographies, les messages de forum, les bouts de code de logiciel et les documents gouvernementaux -, il serait impossible d’entraîner les meilleurs modèles d’IA actuels sans utiliser des documents protégés par le droit d’auteur. » 

Et, dès 2023, les plaintes se sont succédé contre les entreprises de l’IA, qu’elles éditent des générateurs de texte (OpenAI), d’images (Stability AI, Midjourney) ou des moteurs de recherche (Perplexity), en raison de leur utilisation de contenus protégés. Si la plupart des acteurs ont depuis communiqué sur les actions mises en place pour respecter la propriété intellectuelle, les politiques d’entraînement des modèles demeurent souvent opaques. Par ailleurs, il paraît difficile d’imaginer un retour en arrière concernant l’utilisation initiale de données protégées. En ce sens, le retrait du répertoire de données, tel que demandé à Meta, pourrait s’avérer presque impossible.

IA et droit d’auteur : ce que dit l’AI Act

Pour appuyer leur démarche, les structures rappellent les obligations auxquelles sont tenus les acteurs de l’écosystème de l’IA, notamment en raison des réglementations européennes récemment adoptées.

Cette action en justice s’inscrit dans un contexte de régulation au niveau européen, l’AI Act ayant rappelé la nécessité pour les sociétés éditrices de solutions d’intelligence artificielle générative de respecter le droit d’auteur et d’assurer la transparence sur les sources utilisées pour développer des modèles de fondation.

L’AI Act impose en effet aux fournisseurs d’IA générative de respecter le droit d’auteur, en s’assurant que les œuvres protégées ne sont pas utilisées sans autorisation et en mettant en place des mécanismes de conformité. Il exige aussi une transparence sur les données d’entraînement et le fonctionnement des modèles, sauf pour ceux en open source à faible risque.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs outils pour les professionnels du web