L’IA générative
Guide mondial sur des questions de PI clés
L’intelligence artificielle (IA) soulève de nombreuses questions en matière de propriété intellectuelle (PI). Bien qu’il existe plusieurs modèles d’IA et études de cas connexes, le présent guide vise à répondre à des questions de PI clés soulevées par les systèmes d’IA générative, soit des systèmes comme ChatGPT, Gemini et DALL-E, dotés d’algorithmes qui génèrent du nouveau contenu (qui peut, selon le système, être fourni sous forme de textes, de fichiers audio, d’images, de codes vidéo ou autres).
En nous appuyant sur des exemples tirés de plusieurs territoires (Australie, Canada, Chine, Union européenne [UE], France, Allemagne, Hong Kong, Pays-Bas, Singapour, Afrique du Sud, Royaume-Uni et États-Unis), nous examinerons les questions de PI suivantes appliquées aux systèmes d’IA1.
L’IA générative
Terminologie
Voici les termes que nous emploierons dans le présent guide pour désigner les étapes de création et d’utilisation de systèmes d’IA générative :
- Données d’entrée : Données utilisées pour entraîner un système d’IA générative (avant ou après sa transmission au déployeur). Il peut s’agir de données précises utilisées par le déployeur pour entraîner son instance personnalisée de système d’IA générative mise au point par le fournisseur.
- Requête : Question ou demande saisie par l’utilisateur d’un système d’IA générative (peut également être utilisée comme données d’entrée pour entraîner le système d’IA générative).
- Données de sortie : Résultat produit par un système d’IA générative en réponse à une requête.
En règle générale, nous emploierons la terminologie de la Loi sur l’IA de l’UE (voir notre billet de blogue, en anglais : The EU AI Act – the countdown begins) pour faire référence aux acteurs suivants du processus d’IA2 :
- Fournisseur : Personne morale qui développe (ou fait développer pour son propre compte) un système d’IA et le met sur le marché.
- Déployeur : Personne morale qui utilise un système d’IA (à noter que nous désignons les personnes physiques comme des utilisateurs dans le présent guide).
- Utilisateur : Personne physique qui utilise un système d’IA pour créer des données de sortie (y compris un employé ou un client du déployeur).
Ainsi, à titre d’exemple, si une multinationale utilise ChatGPT dans le cadre de ses activités, OpenAI (développeur de ChatGPT) serait le fournisseur; la multinationale, le déployeur; et ses employés ou clients qui saisissent une requête dans le système, des utilisateurs.
Types de déploiement
Dans le présent guide, nous ferons la distinction entre différents types de déploiement de systèmes d’IA générative :
- Déploiement public : Le système d’IA générative est entraîné par le fournisseur, qui l’héberge et le met à disposition selon une relation un-à-plusieurs. L’accès au système est fourni sous forme de service. Aucune instance distincte n’est maintenue par ou pour le déployeur. Selon toute vraisemblance, les modalités du déploiement prévoient que toute donnée d’entrée fournie au système par le déployeur ou par les utilisateurs pourra être réutilisée et divulguée par le fournisseur sans restriction (sous réserve de sa conformité avec les lois applicables, notamment sur la protection des données).
- Déploiement privé ou en entreprise : Le fournisseur maintient une instance de système d’IA générative distincte pour le déployeur. L’accès au système est fourni sous forme de service, des interfaces de programmation d’applications (API) liant le système à l’interface utilisateur du déployeur. Le système est principalement entraîné par le fournisseur, mais peut également être entraîné (ou « affiné ») plus avant au moyen des données du déployeur. En règle générale, le fournisseur accepte les restrictions liées à son utilisation des données d’entraînement du déployeur et des données d’entrée que les utilisateurs saisissent dans le système. Le champ d’application de ces restrictions est indubitablement déterminant, mais aux fins du présent guide, nous partirons du principe que les restrictions comprennent une entente stipulant que les données doivent être traitées de manière confidentielle.
- Déploiement sur place : Le système, qui peut avoir été entraîné dans une certaine mesure par le fournisseur, est téléchargé par le déployeur et utilisé (et développé et entraîné plus avant) par le déployeur dans son propre environnement de TI. Il peut le faire au moyen d’un logiciel propriétaire sous licence (par exemple OPT de Meta ou Craiyon) ou de code source libre (par exemple BLOOM ou GPT-J).
Pour en savoir plus sur l’IA générative
Pour approfondir le sujet, n’hésitez pas à consulter nos billets de blogue suivants (en anglais) :
Notes
Abonnez-vous et restez à l’affût des nouvelles juridiques, informations et événements les plus récents...