Droit d'auteur,Intelligence artificielle,Propriété intellectuelle

IA et opt-out : la Sacem donne le la !

Par Elodie Migliore, Doctorante au CEIPI

Le développement récent, et surtout la mise à disposition au grand public, des intelligences artificielles (IA) génératives a permis de mettre en lumière certaines problématiques jusqu’alors moins abordées. L’une des problématiques sur le devant de la scène actuellement est celle de l’entraînement de ces systèmes d’IA.

Pour l’expliquer simplement, pour produire des résultats, le système d’intelligence artificielle doit être « nourri » de données. Ces données peuvent être, par exemple, des œuvres artistiques protégées par le droit d’auteur. Dès lors, de nombreuses questions juridiques se sont posées concernant la possible utilisation de certaines de ces données aux fins d’entraînement de système d’IA. En effet, certains arguent que l’utilisation de certaines données porte atteinte au droit d’auteur, comme le droit de reproduction ou, encore, au droit sui generis des bases de données, lorsqu’il s’agit de l’utilisation de bases de données. En témoigne, les nombreuses affaires en cours aux Etats-Unis (à titre d’exemple, Authors Guild et al v. OpenAI Inc. et al, 1:2023cv08292, 19/09/2023, Chabon v. OpenAI, Inc., 3:23-cv-04625, 08/09/2023 ou encore tout récemment, Universal Music Corp et al. v. Anthropic PBC, 3:23-cv-01092, 18/10/2023) sur les questions de droits d’auteur.

Pour faire face à ces problématiques, l’Union européenne s’est dotée de nouvelles exceptions afin de pouvoir autoriser certains actes protégés. Dans cette perspective, la directive européenne de 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique a créé deux exceptions en son article 3 et 4 concernant la fouille de données – aussi appelée text and data mining, opération pouvant s’appliquer dans le contexte de l’exploitation de systèmes d’IA. (Dir. [UE] 2019/790 sur le droit d’auteur et les droits voisins dans le marché unique numérique ou directive DSM).

La fouille de données est définie par la directive comme « toute technique d’analyse automatisée visant à analyser des textes et des données sous une forme numérique afin d’en dégager des informations, ce qui comprend, à titre non exhaustif, des constantes, des tendances et des corrélations », définition reprise par la transposition française. Cette technique peut être utilisée lors d’entraînement de systèmes d’intelligence artificielle, notamment lors de la phase de l’apprentissage « discriminatif » ou « prédictif », même si son utilisation peut être questionnée pour les modèles permettant de générer de nouvelles formes – c’est-à-dire les systèmes d’IA génératifs (v. à ce propos, J.-M. Brugière et J.-M. Deltorn, Intelligences artificielles génératives. Y a-t-il d’exploitation des œuvres, au sens du droit d’auteur ? N’y aurait-il pas d’autres modèles à considérer ?, D. 2023. 1657).

En tout état de cause, pour justifier l’utilisation de données couvertes par un droit – de propriété intellectuelle ou sui generis – le recours à ces exceptions est souvent perçu comme une solution.

L’article 3 de la directive prévoit une exception aux droits de reproduction et de réutilisation et d’extraction du producteur d’une base de données (article 5, point a), et article 7, paragraphe 1, directive 96/9/CE), le droit de reproduction des titulaires de droits d’auteur et de droits voisins (article 2,  directive 2001/29/CE), le droit de reproduction des titulaires de droits voisins des éditeurs de presse en ligne (article 15, paragraphe 1, directive DSM) au bénéfice « des organismes de recherche et des institutions du patrimoine culturel, en vue de procéder, à des fins de recherche scientifique, à une fouille de textes et de données sur des œuvres ou autres objets protégés auxquels ils ont accès de manière licite » (Article 3, directive DSM ).

L’article 4 quant à lui accorde une exception pour les mêmes droits que ceux énumérés à l’article 3, avec l’ajout d’une exception concernant la reproduction, la traduction, l’adaptation, l’arrangement et toute autre transformation d’un logiciel (article 4, paragraphe 1, points a) et b), directive 2009/24/CE). Cette exception n’est pas limitée dans ses bénéficiaires et est mobilisable par toutes les entités publiques ou privées, aucun opérateur en particulier n’étant désigné. Également, il n’y a pas de restrictions concernant la finalité et il est nécessaire que le contenu soit accessible de manière licite.

Toutefois, cette exception peut être mise en échec, car un mécanisme d’opt-out a été instauré. En effet, le paragraphe 3 de l’article prévoit que « l’exception ou la limitation prévue au paragraphe 1 s’applique à condition que l’utilisation des œuvres et autres objets protégés visés audit paragraphe n’ait pas été expressément réservée par leurs titulaires de droits de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne » (Article 4, directive DSM). Cela permet donc aux titulaires de droit de s’opposer à cette exception s’ils le manifestent, conformément aux instructions de la directive.

Ces deux exceptions ont été transposées en droit français à l’article L122-5-3 du code de la propriété intellectuelle, sans modification majeure. L’article reprend ici le concept d’un « droit d’opposition » exprimé de manière approprié.

C’est dans ce contexte que la Sacem, organisme de gestion collective des auteurs, compositeurs et éditeurs de musique, a décidé d’exercer son droit d’opposition – ou opt-out.

Quelques mois auparavant, d’autres organismes de gestion collective avaient déjà communiqué leur position vis-à-vis du développement des systèmes d’IA génératives et de leur impact sur les droits de propriété intellectuelle. À titre d’exemple, la SACD a partagé, en août, sa philosophie concernant l’utilisation de services d’IA. Elle s’appuyait sur cinq propositions pour une « intelligence artificielle au service  de la création, des auteurs et respectueuse de leurs droits », à savoir une obligation générale de transparence dans l’utilisation des œuvres par les intelligences artificielles, l’identification des œuvres assistées ou créées par une intelligence artificielle, la reconnaissance d’un opt-out effectif pour les auteurs, la garantie du respect du droit d’auteur, tant le droit moral que patrimonial et la nécessité d’une régulation de l’utilisation des œuvres par les IA (v. à ce propos, Pour une intelligence artificielle au service de la création, des auteurs et respectueuse de leurs droits, SACD, 31 août 2023).

Le communiqué de presse du 12 octobre 2023 de la Sacem s’inscrit dans cette logique. Par ce dernier, la Sacem exerce son droit d’opt-out pour une « intelligence artificielle vertueuse, transparente et équitable » (v. à ce propos, Pour une intelligence artificielle vertueuse, transparente et équitable, la Sacem exerce son droit d’opt-out, Sacem, 12 octobre 2023).

La Sacem explique alors qu’il ne s’agit pas ici de s’opposer au développement des systèmes d’IA, mais de conditionner les activités de fouille de données à l’autorisation préalable de la Sacem. Ainsi, les entités utilisant les œuvres du répertoire de la Sacem pour des opérations de fouille de données devront entrer en contact avec l’organisation de gestion collective pour négocier les conditions d’exploitation. Une décision de taille lorsque l’on sait que le répertoire de la Sacem est composé de plus de 200 000 œuvres, ce qui en fait une ressource clé. Cette décision vise ainsi à encourager la négociation des conditions de l’exploitation des œuvres utilisées pour l’entraînement et d’établir un équilibre entre les droits des créateurs et le développement de ces technologies. Il s’agit également d’instiller plus de transparence lors de l’utilisation de système d’IA, thème d’importance lorsque l’on considère les débats actuels au niveau européen concernant le projet de règlement sur l’IA (aussi appelé EU AI ACT), dont la transparence est l’une des notions phares.

Des initiatives similaires de blocage ont été observées précédemment chez de nombreux médias français. Ils ont en effet interdit l’accès à leur site au robot GPTBot, qui collectait des informations sur les sites internet pour le développement du système d’IA ChatGPT d’OpenAI. Ainsi, on peut citer Radio France, France 24, RFI ou encore MyTF1 comme ayant usé de cette possibilité.

Il reste à voir comment l’opt-out de la Sacem s’exercera en pratique, et si les conditions générales d’utilisations et les termes contractuels actuellement en place vont être modifiés. Cette démarche peut également inspirer d’autres sociétés de gestion collective voisines, et l’on peut se demander si ces dernières, comme la SACD, vont emboîter le pas à leur consœur.

 

IA et opt-out : la Sacem donne le la !

Par Elodie Migliore, Doctorante au CEIPI

Author Image
TeamBLIP!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.