Risque de contrefaçon lié à l’entraînement d’un système d’IA générative
Mondial | Publication | juillet 2024
Les systèmes d’IA générative sont entraînés au moyen de gros volumes de données, souvent tirées de sources du domaine public qui peuvent être protégées par le droit d’auteur ou d’autres droits de propriété intellectuelle, comme un droit sur les bases de données au Royaume-Uni et dans l’UE.
L’entraînement de systèmes d’IA générative au moyen d’œuvres protégées par le droit d’auteur accessibles au public constitue-t-il une contrefaçon?
Un système entraîné au moyen d’œuvres protégées par le droit d’auteur sans le consentement du détenteur de ce droit, en supposant que l’entraînement en question comprenne une opération de copie1 de la totalité ou d’une partie substantielle d’une œuvre, constituerait dans de nombreux territoires une contrefaçon, à moins qu’une défense ou exception pertinente ne s’applique.
Étude de cas : AllemagneL’applicabilité d’une défense ou d’une exception dépend du territoire dans lequel l’entraînement a lieu. Par exemple, en Allemagne :
|
Existe-t-il des défenses/exceptions (en supposant que le système est utilisé à des fins commerciales)?
Australie
Peu vraisemblable. Les défenses au titre de « l’utilisation équitable » prévues dans la Copyright Act 1968 (Cth) (CA 1968) dans le cadre de contrefaçons du droit d’auteur comprennent les utilisations suivantes : recherche ou étude, critique et compte rendu, communication de nouvelles ou parodie et satire2. Toutefois, en Australie, l’accent est également mis sur ce qui est considéré comme « équitable » et les objectifs commerciaux qui sous-tendent une contrefaçon ne sont généralement pas considérés comme équitables. De plus, ces défenses sont rarement appliquées en Australie et sont généralement considérées comme plus limitées que dans d’autres territoires de common law.
|
Canada
Il n’existe aucune exception concernant la fouille de textes et de données (FTD) en vertu de la Loi sur le droit d’auteur (L.R.C. (1985), ch. C-42) canadienne, mais deux exceptions d’ordre général peuvent s’appliquer à l’entraînement de systèmes d’IA générative : 1) la reproduction temporaire pour processus technologique et 2) l’utilisation équitable. Pour que l’exception de la reproduction temporaire pour processus technologique s’applique, trois exigences doivent être satisfaites3 :
Il se peut que les programmes d’IA générative qui traitent de grands ensembles de données aient besoin de faire des reproductions temporaires d’éléments protégés par le droit d’auteur indispensables à leur processus technologique. Si les reproductions sont temporaires et n’existent que durant l’analyse de l’ensemble de données, il se peut qu’elles soient visées par l’exception de la reproduction temporaire pour processus technologique.
À l’instar de la législation américaine, la Loi sur le droit d’auteur canadienne prévoit une exception pour « utilisation équitable » qui autorise l’utilisation d’œuvres protégées par le droit d’auteur aux fins de recherche, d’étude privée, d’éducation, de satire, de parodie, de critique, de compte rendu ou de communication des nouvelles, pourvu que l’utilisation de l’œuvre soit « équitable »4.
Si le but de l’utilisation est la critique, le compte rendu ou la communication de nouvelles, la source et l’auteur de l’œuvre doivent être cités. Le caractère « équitable » dépendra des circonstances, et plusieurs facteurs seront pris en considération lors de l’analyse5 :
Pour ce qui est de l’utilisation aux fins de l’entraînement de systèmes d’IA générative, la « recherche » peut être une utilisation équitable pertinente. La Cour suprême du Canada a conclu que « la recherche ne se limit[ait] pas à celle effectuée dans un contexte non commercial ou privé » et que ce terme devait par ailleurs être interprété de manière large6. Par exemple, dans un de ses arrêts7, elle a estimé qu’une écoute préalable d’un extrait musical de 30 à 90 secondes pour déterminer les préférences musicales d’un utilisateur constituait une recherche aux fins de l’exception pour utilisation équitable. Toutefois, aucun tribunal canadien n’a déterminé si l’entraînement de systèmes d’IA générative au moyen d’éléments protégés par le droit d’auteur relevait du champ d’application de l’exception de « recherche ». |
Chine
Non. Il n’existe actuellement aucune exception concernant la FTD dans le système de droit d’auteur de la République populaire de Chine (RPC). En règle générale, l’exception qui s’applique à des allégations de contrefaçon du droit d’auteur dans la législation de la RPC vise seulement une utilisation non commerciale aux fins d’études, de recherche ou d’appréciation personnelles ou une copie d’une petite partie aux fins d’enseignement ou de recherche scientifique. Elle ne s’appliquera pas à un système aux fins d’utilisation commerciale substantielle/de grande envergure. |
UE
Oui. La FTD (c.-à-d. la reproduction et l’extraction) d’œuvres accessibles de manière licite est autorisée à toute fin pourvu que le titulaire des droits n’ait pas « expressément réserv[é] » ses droits de manière appropriée, par exemple par un procédé lisible par machine pour les contenus accessibles en ligne8. Pour en savoir plus sur la réglementation de l’IA dans l’UE, consultez notre billet de blogue (en anglais) The EU’s AI Act: the position is agreed. |
France
Même position que l’UE9. |
Allemagne
Même position que l’UE. |
Hong Kong
Non. Il n’existe aucune exception concernant la FTD dans l’ordonnance sur le droit d’auteur de Hong Kong (Hong Kong Copyright Ordinance) et il est peu probable que cette utilisation aux fins de l’entraînement de systèmes d’IA générative corresponde à l’une des exceptions au titre de l’utilisation équitable prévues dans l’ordonnance. |
Pays-Bas
Même position que l’UE. |
Singapour
Oui. La loi prévoit une exception autorisant la copie d’œuvres protégées par le droit d’auteur aux fins de « l’analyse computationnelle de données [notre traduction] », qui comprend ce qui suit :
L’Office de la propriété intellectuelle de Singapour a précisé que « l’analyse computationnelle de données [notre traduction] » comprenait une analyse d’opinion, une FTD et un entraînement par apprentissage automatique11. Toutefois, cette exception est soumise à certaines conditions et protections visant à protéger les intérêts commerciaux des détenteurs de droits d’auteur :
Bien que cette exception aux termes de la loi autorise l’entraînement de systèmes d’IA générative sans qu’il y ait pour autant contrefaçon du droit d’auteur (tant que les conditions ci-dessus sont remplies), il existe toujours un risque que les données de sortie de ces systèmes enfreignent le droit d’auteur. Pour en savoir plus sur :
|
Afrique du Sud
Non. S’il s’agissait d’une reproduction ou adaptation substantielle de l’œuvre originale (et que la paternité et la propriété de cette dernière pouvaient être prouvées), il n’y aurait alors aucune défense à l’égard de la contrefaçon du droit d’auteur. |
Royaume-Uni
Non. Une exception découlant de la loi et visant la FTD existe, mais elle s’applique uniquement à des fins de recherches non commerciales12. |
États-Unis
La doctrine de l’utilisation équitable peut s’appliquer pour protéger l’activité critiquée; toutefois, elle n’a pas encore été testée et la mesure dans laquelle elle s’appliquerait n’est pas claire. Il est très probable que le processus d’entraînement comprendra la reproduction d’œuvres dans leur ensemble ou de parties substantielles de celles-ci. OpenAI, par exemple, reconnaît que ses programmes sont entraînés à partir de vastes ensembles de données accessibles au public qui comprennent des œuvres protégées par le droit d’auteur et que des copies de telles œuvres sont produites dans le cadre du processus. La copie d’œuvres protégées par le droit d’auteur sans le consentement (explicite ou implicite) du détenteur du droit d’auteur peut entraîner une responsabilité en cas de contrefaçon du droit d’auteur. Nous nous attendons à ce que les entreprises en IA allèguent que leurs processus d’entraînement constituent une utilisation équitable et, par conséquent, n’enfreignent pas le droit d’auteur des œuvres copiées. La qualification d’utilisation équitable dépend de quatre facteurs énoncés dans l’article 107 du titre 17 du U.S. Code :
Les promoteurs de l’IA argueront sans doute que l’examen de ces facteurs mène indubitablement à conclure à une utilisation équitable. Par exemple, pour ce qui est du premier facteur, les entreprises en IA peuvent soutenir que leur but est « transformatif », puisque le processus d’entraînement donne lieu à un système d’IA générative utile, plutôt qu’à une œuvre expressive. Quant au troisième facteur, il convient de noter que les copies ne sont pas rendues publiques mais sont uniquement utilisées pour entraîner le programme, argument en faveur d’une utilisation équitable qui peut être accueilli favorablement par un tribunal. En revanche, certaines applications d’IA générative font craindre que l’entraînement de programmes d’IA au moyen d’œuvres protégées par le droit d’auteur permette à ces derniers de produire des œuvres entrant en concurrence avec les œuvres originales. Une telle preuve serait examinée en vertu du quatrième facteur d’utilisation équitable et irait clairement à l’encontre d’une conclusion d’utilisation équitable. Pour en savoir plus sur la réglementation de l’IA aux É.-U., veuillez consulter notre billet de blogue (en anglais) President Biden issues sweeping artificial intelligence directives targeting safety, security and trust. |
Notes
Du point de vue des informaticiens, l’entraînement n’implique pas strictement la création d’une copie des données d’entraînement en soi. Les données d’entraînement sont plutôt transformées en un modèle mathématique qui, dans le cas de sources écrites, convertit les mots en des jetons et « apprend » les corrélations entre jetons. Néanmoins, il est présumé que le modèle peut reproduire les données d’entraînement (par exemple ChatGPT peut citer mot pour mot certains textes qui ont apparemment été utilisés pour l’entraîner); si c’est le cas, il se peut qu’ultimement, la forme sous laquelle les données sont stockées dans le modèle n’importe pas dans le cadre de l’analyse du droit d’auteur.
Société canadienne des auteurs, compositeurs et éditeurs de musique c. Bell Canada, 2012 CSC 36.
L’IA générative
Abonnez-vous et restez à l’affût des nouvelles juridiques, informations et événements les plus récents...