L’IA générative

Guide mondial sur des questions de PI clés

L’intelligence artificielle (IA) soulève de nombreuses questions en matière de propriété intellectuelle (PI). Bien qu’il existe plusieurs modèles d’IA et études de cas connexes, le présent guide vise à répondre à des questions de PI clés soulevées par les systèmes d’IA générative, soit des systèmes comme ChatGPT, Gemini et DALL-E, dotés d’algorithmes qui génèrent du nouveau contenu (qui peut, selon le système, être fourni sous forme de textes, de fichiers audio, d’images, de codes vidéo ou autres).

En nous appuyant sur des exemples tirés de plusieurs territoires (Australie, Canada, Chine, Union européenne [UE], France, Allemagne, Hong Kong, Pays-Bas, Singapour, Afrique du Sud, Royaume-Uni et États-Unis), nous examinerons les questions de PI suivantes appliquées aux systèmes d’IA¹.

L’IA générative

Risque de contrefaçon lié à l’entraînement d’un système d’IA générative

Les systèmes d’IA générative sont entraînés au moyen de gros volumes de données, souvent tirées de sources du domaine public qui peuvent être protégées par le droit d’auteur ou d’autres droits de propriété intellectuelle, comme un droit sur les bases de données au Royaume-Uni et dans l’UE.

Perte de confidentialité des renseignements utilisés comme « requête » dans les systèmes d’IA générative

Une des inquiétudes quant à l’utilisation de déploiements publics de systèmes d’IA générative réside dans le fait que les requêtes saisies par les utilisateurs dans ces systèmes peuvent être réutilisées par le fournisseur ou le développeur sans restriction, ce qui pourrait vraisemblablement résulter en la perte de contrôle sur les renseignements confidentiels saisis dans ces systèmes et compromettre la confidentialité des renseignements en question

Les données de sortie d’un système d’IA générative sont-elles protégées par des droits de propriété intellectuelle?

L’approche et les exigences pour que les droits de propriété intellectuelle s’appliquent aux œuvres générées par ordinateur varient d’un territoire à l’autre.

Quels acteurs ont une responsabilité éventuelle en cas de contrefaçon?

Un déployeur peut s’exposer à une responsabilité primaire pour contrefaçon d’un droit d’auteur en cas de contrefaçon d’un droit d’auteur par les données de sortie d’un système d’IA générative

Risque de contrefaçon lié à la création et à l’utilisation des données de sortie d’un système d’IA générative

Lorsque les données de sortie d’un système d’IA générative sont identiques à une œuvre protégée par le droit d’auteur d’un tiers ou y sont essentiellement semblables.

Terminologie

Voici les termes que nous emploierons dans le présent guide pour désigner les étapes de création et d’utilisation de systèmes d’IA générative :

Données d’entrée : Données utilisées pour entraîner un système d’IA générative (avant ou après sa transmission au déployeur). Il peut s’agir de données précises utilisées par le déployeur pour entraîner son instance personnalisée de système d’IA générative mise au point par le fournisseur.
Requête : Question ou demande saisie par l’utilisateur d’un système d’IA générative (peut également être utilisée comme données d’entrée pour entraîner le système d’IA générative).
Données de sortie : Résultat produit par un système d’IA générative en réponse à une requête.

En règle générale, nous emploierons la terminologie de la Loi sur l’IA de l’UE (voir notre billet de blogue, en anglais : The EU AI Act – the countdown begins) pour faire référence aux acteurs suivants du processus d’IA² :

Fournisseur : Personne morale qui développe (ou fait développer pour son propre compte) un système d’IA et le met sur le marché.
Déployeur : Personne morale qui utilise un système d’IA (à noter que nous désignons les personnes physiques comme des utilisateurs dans le présent guide).
Utilisateur : Personne physique qui utilise un système d’IA pour créer des données de sortie (y compris un employé ou un client du déployeur).

Ainsi, à titre d’exemple, si une multinationale utilise ChatGPT dans le cadre de ses activités, OpenAI (développeur de ChatGPT) serait le fournisseur; la multinationale, le déployeur; et ses employés ou clients qui saisissent une requête dans le système, des utilisateurs.

Types de déploiement

Dans le présent guide, nous ferons la distinction entre différents types de déploiement de systèmes d’IA générative :

Déploiement public : Le système d’IA générative est entraîné par le fournisseur, qui l’héberge et le met à disposition selon une relation un-à-plusieurs. L’accès au système est fourni sous forme de service. Aucune instance distincte n’est maintenue par ou pour le déployeur. Selon toute vraisemblance, les modalités du déploiement prévoient que toute donnée d’entrée fournie au système par le déployeur ou par les utilisateurs pourra être réutilisée et divulguée par le fournisseur sans restriction (sous réserve de sa conformité avec les lois applicables, notamment sur la protection des données).
Déploiement privé ou en entreprise : Le fournisseur maintient une instance de système d’IA générative distincte pour le déployeur. L’accès au système est fourni sous forme de service, des interfaces de programmation d’applications (API) liant le système à l’interface utilisateur du déployeur. Le système est principalement entraîné par le fournisseur, mais peut également être entraîné (ou « affiné ») plus avant au moyen des données du déployeur. En règle générale, le fournisseur accepte les restrictions liées à son utilisation des données d’entraînement du déployeur et des données d’entrée que les utilisateurs saisissent dans le système. Le champ d’application de ces restrictions est indubitablement déterminant, mais aux fins du présent guide, nous partirons du principe que les restrictions comprennent une entente stipulant que les données doivent être traitées de manière confidentielle.
Déploiement sur place : Le système, qui peut avoir été entraîné dans une certaine mesure par le fournisseur, est téléchargé par le déployeur et utilisé (et développé et entraîné plus avant) par le déployeur dans son propre environnement de TI. Il peut le faire au moyen d’un logiciel propriétaire sous licence (par exemple OPT de Meta ou Craiyon) ou de code source libre (par exemple BLOOM ou GPT-J).

Pour en savoir plus sur l’IA générative

Pour approfondir le sujet, n’hésitez pas à consulter nos billets de blogue suivants (en anglais) :

Notes

¹ Nous ne traitons que de responsabilité civile dans le présent guide. Nous n’y traitons pas d’infractions criminelles ni de recours au criminel.

² Veuillez noter qu’il existe d’autres acteurs (par exemple des « importateurs », des « distributeurs » et des « opérateurs »), qui sont définis dans la Loi sur l’IA de l’UE. De façon générale, nous ne traiterons pas de ces acteurs dans le présent guide.