Les systèmes d’IA générative sont entraînés au moyen de gros volumes de données, souvent tirées de sources du domaine public qui peuvent être protégées par le droit d’auteur ou d’autres droits de propriété intellectuelle, comme un droit sur les bases de données au Royaume-Uni et dans l’UE.

L’entraînement de systèmes d’IA générative au moyen d’œuvres protégées par le droit d’auteur accessibles au public constitue-t-il une contrefaçon?

Un système entraîné au moyen d’œuvres protégées par le droit d’auteur sans le consentement du détenteur de ce droit, en supposant que l’entraînement en question comprenne une opération de copie1  de la totalité ou d’une partie substantielle d’une œuvre, constituerait dans de nombreux territoires une contrefaçon, à moins qu’une défense ou exception pertinente ne s’applique.

 

Étude de cas : Allemagne

L’applicabilité d’une défense ou d’une exception dépend du territoire dans lequel l’entraînement a lieu. Par exemple, en Allemagne :

  • En vertu de la loi allemande sur le droit d’auteur, il existe plusieurs exceptions sur lesquelles les fournisseurs peuvent s’appuyer en cas d’entraînement de leur système d’IA générative au moyen d’œuvres protégées par le droit d’auteur accessibles au public : l’article 44b de la loi allemande sur le droit d’auteur (Gesetz über Urheberrecht und verwandte Schutzrechte) autorise la reproduction d’œuvres nécessaire à l’analyse automatisée de celles‑ci, à moins que l’auteur n’ait expressément réservé son droit concernant ce type d’utilisation. Il existe ainsi une autorisation légale de rassembler des œuvres à grande échelle et d’en tirer un corpus d’entraînement. Pour qu’une exception s’applique, il faut également que l’accès à l’œuvre ait été légal et que sa reproduction soit supprimée une fois que l’entraînement est terminé et que le stockage devient inutile.
  • Si l’auteur de l’œuvre protégée par le droit d’auteur a expressément réservé ses droits comme il est décrit ci-dessus, le fournisseur peut s’appuyer sur l’article 44a de la loi allemande sur le droit d’auteur. Cette disposition autorise la reproduction temporaire d’œuvres qui n’a aucune valeur économique en elle-même; la fouille de données est expressément citée comme acte relevant de cette exception. Toutefois, cette exception ne peut être utilisée que si aucun corpus d’entraînement n’est créé dans le cadre de l’entraînement de l’IA et que l’apprentissage de l’IA s’appuie sur des œuvres stockées dans la mémoire de travail, qui sera elle aussi effacée immédiatement après.
  • Enfin, l’article 60b de la loi allemande sur le droit d’auteur autorise les organismes de recherche privilégiés à reproduire une œuvre même si l’auteur de cette œuvre a opté pour le retrait du droit d’utilisation.
 

Existe-t-il des défenses/exceptions (en supposant que le système est utilisé à des fins commerciales)?

Australie

x-mark

Peu vraisemblable. Les défenses au titre de « l’utilisation équitable » prévues dans la Copyright Act 1968 (Cth) (CA 1968) dans le cadre de contrefaçons du droit d’auteur comprennent les utilisations suivantes : recherche ou étude, critique et compte rendu, communication de nouvelles ou parodie et satire2. Toutefois, en Australie, l’accent est également mis sur ce qui est considéré comme « équitable » et les objectifs commerciaux qui sous-tendent une contrefaçon ne sont généralement pas considérés comme équitables. De plus, ces défenses sont rarement appliquées en Australie et sont généralement considérées comme plus limitées que dans d’autres territoires de common law.


Canada

question-mark

Il n’existe aucune exception concernant la fouille de textes et de données (FTD) en vertu de la Loi sur le droit d’auteur (L.R.C. (1985), ch. C-42) canadienne, mais deux exceptions d’ordre général peuvent s’appliquer à l’entraînement de systèmes d’IA générative : 1) la reproduction temporaire pour processus technologique et 2) l’utilisation équitable.

Pour que l’exception de la reproduction temporaire pour processus technologique s’applique, trois exigences doivent être satisfaites3 :

  • la reproduction doit être un élément essentiel du processus technologique;
  • la reproduction doit uniquement être utilisée pour faciliter une utilisation qui ne constitue pas une contrefaçon du droit d’auteur;
  • la reproduction ne doit exister que pour la durée du processus technologique.

Il se peut que les programmes d’IA générative qui traitent de grands ensembles de données aient besoin de faire des reproductions temporaires d’éléments protégés par le droit d’auteur indispensables à leur processus technologique. Si les reproductions sont temporaires et n’existent que durant l’analyse de l’ensemble de données, il se peut qu’elles soient visées par l’exception de la reproduction temporaire pour processus technologique.

À l’instar de la législation américaine, la Loi sur le droit d’auteur canadienne prévoit une exception pour « utilisation équitable » qui autorise l’utilisation d’œuvres protégées par le droit d’auteur aux fins de recherche, d’étude privée, d’éducation, de satire, de parodie, de critique, de compte rendu ou de communication des nouvelles, pourvu que l’utilisation de l’œuvre soit « équitable »4

Si le but de l’utilisation est la critique, le compte rendu ou la communication de nouvelles, la source et l’auteur de l’œuvre doivent être cités.

Le caractère « équitable » dépendra des circonstances, et plusieurs facteurs seront pris en considération lors de l’analyse5 :

  • le but de l’utilisation (S’agit-il d’une fin commerciale, de recherche/de formation?);
  • la nature de l’utilisation (À quoi l’œuvre a-t-elle servi? L’utilisation était-elle ponctuelle ou continue/répétitive? De quelle ampleur a été sa diffusion?);
  • l’ampleur de l’utilisation (Quelle quantité de données a été copiée?);
  • les solutions de rechange à l’utilisation (L’œuvre était-elle nécessaire au résultat? Une œuvre différente aurait-elle pu être utilisée?);
  • la nature de l’œuvre (Existe-t-il un intérêt général à sa diffusion? S’agissait-il d’une œuvre non publiée?);
  • l’effet de l’utilisation sur l’œuvre originale (L’utilisation concurrence-t-elle l’œuvre originale sur le marché?).

Pour ce qui est de l’utilisation aux fins de l’entraînement de systèmes d’IA générative, la « recherche » peut être une utilisation équitable pertinente. La Cour suprême du Canada a conclu que « la recherche ne se limit[ait] pas à celle effectuée dans un contexte non commercial ou privé » et que ce terme devait par ailleurs être interprété de manière large6.

Par exemple, dans un de ses arrêts7, elle a estimé qu’une écoute préalable d’un extrait musical de 30 à 90 secondes pour déterminer les préférences musicales d’un utilisateur constituait une recherche aux fins de l’exception pour utilisation équitable. Toutefois, aucun tribunal canadien n’a déterminé si l’entraînement de systèmes d’IA générative au moyen d’éléments protégés par le droit d’auteur relevait du champ d’application de l’exception de « recherche ».


Chine

x-mark
Non. Il n’existe actuellement aucune exception concernant la FTD dans le système de droit d’auteur de la République populaire de Chine (RPC). En règle générale, l’exception qui s’applique à des allégations de contrefaçon du droit d’auteur dans la législation de la RPC vise seulement une utilisation non commerciale aux fins d’études, de recherche ou d’appréciation personnelles ou une copie d’une petite partie aux fins d’enseignement ou de recherche scientifique. Elle ne s’appliquera pas à un système aux fins d’utilisation commerciale substantielle/de grande envergure.

UE

x-mark

Oui. La FTD (c.-à-d. la reproduction et l’extraction) d’œuvres accessibles de manière licite est autorisée à toute fin pourvu que le titulaire des droits n’ait pas « expressément réserv[é] » ses droits de manière appropriée, par exemple par un procédé lisible par machine pour les contenus accessibles en ligne8.

Pour en savoir plus sur la réglementation de l’IA dans l’UE, consultez notre billet de blogue (en anglais) The EU’s AI Act: the position is agreed.


France

x-mark

Même position que l’UE9.                                                                                                                                                                                  


Allemagne

x-mark

Même position que l’UE.                                                                                                                                                                                   


Hong Kong

Check-mark
Non. Il n’existe aucune exception concernant la FTD dans l’ordonnance sur le droit d’auteur de Hong Kong (Hong Kong Copyright Ordinance) et il est peu probable que cette utilisation aux fins de l’entraînement de systèmes d’IA générative corresponde à l’une des exceptions au titre de l’utilisation équitable prévues dans l’ordonnance.

Pays-Bas

x-mark

Même position que l’UE.                                                                                                                                                                                   


Singapour

x-mark

Oui. La loi prévoit une exception autorisant la copie d’œuvres protégées par le droit d’auteur aux fins de « l’analyse computationnelle de données [notre traduction] », qui comprend ce qui suit :

  • l’utilisation d’un programme informatique pour repérer, extraire et analyser l’information ou les données contenues dans une œuvre ou un enregistrement;
  • l’utilisation d’une œuvre ou d’un enregistrement comme exemple d’un type d’information ou de données afin d’améliorer le fonctionnement d’un programme informatique lié à ce type d’information ou de données10.

L’Office de la propriété intellectuelle de Singapour a précisé que « l’analyse computationnelle de données [notre traduction] » comprenait une analyse d’opinion, une FTD et un entraînement par apprentissage automatique11.

Toutefois, cette exception est soumise à certaines conditions et protections visant à protéger les intérêts commerciaux des détenteurs de droits d’auteur :

  • l’utilisateur ne peut pas transmettre de copies d’œuvres à d’autres personnes, sauf aux fins de vérification des résultats de l’analyse computationnelle des données ou de recherche ou d’étude collaborative quant à l’objet d’une telle analyse;
  • l’utilisateur ne doit pas utiliser à d’autres fins des copies d’œuvres effectuées en vertu de cette exception;
  • l’utilisateur doit avoir légalement accès aux œuvres qui seront copiées;
  • les œuvres dont il est fait une copie ne doivent pas elles-mêmes constituer des exemplaires contrefaits (à moins que l’utilisation d’exemplaires contrefaits ne soit nécessaire dans le cadre de l’analyse prescrite) ou, s’il s’agit d’exemplaires contrefaits : i) l’utilisateur ne doit pas le savoir et ii) si ces exemplaires ont été obtenus à un emplacement en ligne violant de manière fragrante le droit d’auteur, l’utilisateur ne doit pas le savoir (ou n’aurait raisonnablement pas pu le savoir).

Bien que cette exception aux termes de la loi autorise l’entraînement de systèmes d’IA générative sans qu’il y ait pour autant contrefaçon du droit d’auteur (tant que les conditions ci-dessus sont remplies), il existe toujours un risque que les données de sortie de ces systèmes enfreignent le droit d’auteur.

Pour en savoir plus sur :


Afrique du Sud

Check-mark
Non. S’il s’agissait d’une reproduction ou adaptation substantielle de l’œuvre originale (et que la paternité et la propriété de cette dernière pouvaient être prouvées), il n’y aurait alors aucune défense à l’égard de la contrefaçon du droit d’auteur.

Royaume-Uni

Check-mark
Non. Une exception découlant de la loi et visant la FTD existe, mais elle s’applique uniquement à des fins de recherches non commerciales12.

États-Unis

question-mark

La doctrine de l’utilisation équitable peut s’appliquer pour protéger l’activité critiquée; toutefois, elle n’a pas encore été testée et la mesure dans laquelle elle s’appliquerait n’est pas claire.

Il est très probable que le processus d’entraînement comprendra la reproduction d’œuvres dans leur ensemble ou de parties substantielles de celles-ci. OpenAI, par exemple, reconnaît que ses programmes sont entraînés à partir de vastes ensembles de données accessibles au public qui comprennent des œuvres protégées par le droit d’auteur et que des copies de telles œuvres sont produites dans le cadre du processus. La copie d’œuvres protégées par le droit d’auteur sans le consentement (explicite ou implicite) du détenteur du droit d’auteur peut entraîner une responsabilité en cas de contrefaçon du droit d’auteur.

Nous nous attendons à ce que les entreprises en IA allèguent que leurs processus d’entraînement constituent une utilisation équitable et, par conséquent, n’enfreignent pas le droit d’auteur des œuvres copiées. La qualification d’utilisation équitable dépend de quatre facteurs énoncés dans l’article 107 du titre 17 du U.S. Code :

  1. l’objet et la nature de l’utilisation, y compris si cette utilisation est à des fins commerciales ou à des fins éducatives non lucratives;
  2. la nature de l’œuvre protégée par le droit d’auteur;
  3. l’ampleur et l’importance de la partie utilisée par rapport à l’intégralité de l’œuvre protégée par le droit d’auteur;
  4. l’effet de l’utilisation sur le marché éventuel ou la valeur potentielle de l’œuvre protégée par le droit d’auteur.

Les promoteurs de l’IA argueront sans doute que l’examen de ces facteurs mène indubitablement à conclure à une utilisation équitable. Par exemple, pour ce qui est du premier facteur, les entreprises en IA peuvent soutenir que leur but est « transformatif », puisque le processus d’entraînement donne lieu à un système d’IA générative utile, plutôt qu’à une œuvre expressive.

Quant au troisième facteur, il convient de noter que les copies ne sont pas rendues publiques mais sont uniquement utilisées pour entraîner le programme, argument en faveur d’une utilisation équitable qui peut être accueilli favorablement par un tribunal.

En revanche, certaines applications d’IA générative font craindre que l’entraînement de programmes d’IA au moyen d’œuvres protégées par le droit d’auteur permette à ces derniers de produire des œuvres entrant en concurrence avec les œuvres originales. Une telle preuve serait examinée en vertu du quatrième facteur d’utilisation équitable et irait clairement à l’encontre d’une conclusion d’utilisation équitable.

Pour en savoir plus sur la réglementation de l’IA aux É.-U., veuillez consulter notre billet de blogue (en anglais) President Biden issues sweeping artificial intelligence directives targeting safety, security and trust.



Notes

1  

Du point de vue des informaticiens, l’entraînement n’implique pas strictement la création d’une copie des données d’entraînement en soi. Les données d’entraînement sont plutôt transformées en un modèle mathématique qui, dans le cas de sources écrites, convertit les mots en des jetons et « apprend » les corrélations entre jetons. Néanmoins, il est présumé que le modèle peut reproduire les données d’entraînement (par exemple ChatGPT peut citer mot pour mot certains textes qui ont apparemment été utilisés pour l’entraîner); si c’est le cas, il se peut qu’ultimement, la forme sous laquelle les données sont stockées dans le modèle n’importe pas dans le cadre de l’analyse du droit d’auteur.

3   Article 30.71 de la Loi sur le droit d’auteur.

4   Article 29 de la Loi sur le droit d’auteur.

5   CCH Canadienne Ltée c. Barreau du Haut-Canada, 2004 CSC 13.

6   Ibid.

7  

Société canadienne des auteurs, compositeurs et éditeurs de musique c. Bell Canada, 2012 CSC 36.

9   L’exception prévue au paragraphe 4.3 de la directive relative au droit d’auteur numérique de I'UE est reprise à l’article L122-5-3 III du Code de la propriété intellectuelle français.

L’IA générative

Abonnez-vous et restez à l’affût des nouvelles juridiques, informations et événements les plus récents...