Le succès de l’intelligence artificielle générative soulève des questions juridiques complexes, notamment pour ce qui est du droit d’auteur. Open AI et Microsoft, font l’objet de plusieurs actions en justice pour violation d’œuvres protégées par le droit d’auteur. Ainsi, le 27 décembre 2023, le New York Times a attaqué en justice Open AI et son principal investisseur Microsoft pour violation des droits d’auteur devant la United States District Court for the Southern District of New York. Le journal les accusaient d’avoir utilisé massivement sans autorisation des millions d’articles de presse, des enquêtes approfondies, des articles d’opinion, protégés par le droit d’auteur afin d’entraîner leurs modèles d’intelligence artificielle tels que ChatGPT. Cette action contre un acteur essentiel du développement des différentes versions de ChatGPT - la 12e plainte en contrefaçon - vise non seulement à protéger les droits d’auteur mais soulève également la question de la concurrence dans le secteur de l’information.
ChatGPT, un outil conversationnel doté d’intelligence artificielle (IA) permet de générer des textes et des images. Le but de cet article est d’essayer de répondre à la question de savoir si les contenus générés par ChatGPT sont protégés par le droit d’auteur ? En d’autres termes, quid de la transgression du droit d’auteur en utilisant ChatGPT ?
1. Les fondements du droit d’auteur
Le droit d’auteur, appelé également « propriété littéraire et artistique » est une branche de la propriété intellectuelle, par opposition à la propriété industrielle qui vise la protection et la valorisation des inventions, des innovations et des créations industrielles ou commerciales. La propriété industrielle comprend notamment les brevets, les marques, les dessins et modèles industriels, ainsi que les indications géographiques.
En droit français, le droit d’auteur est régi par le livre 1er du code de la propriété intellectuelle (CPI). Ainsi, conformément à l’article L.111-1 de ce dernier, « l'auteur d'une œuvre de l'esprit jouit sur cette œuvre, du seul fait de sa création, d'un droit de propriété incorporelle exclusif et opposable à tous. Ce droit comporte des attributs d'ordre intellectuel et moral ainsi que des attributs d'ordre patrimonial ».
Comme le souligne Maître Murielle Cahen (« Droit d’auteur et internet », avril 2022), « le développement d’internet a bouleversé le mode de consommation des œuvres, mais le droit d’auteur continue de s’appliquer même sur internet, les juges français n’ont donc pas hésité à condamner des utilisateurs pour contrefaçon » […) « Le droit d’auteur et internet ne sont pas des notions antinomiques ». Cette avocate conclut que « sur internet comme ailleurs le droit s’applique ».
Au niveau européen, la Commission européenne a initié en 2016 une proposition de directive sur le droit d’auteur. L’objectif visé consistait à adapter le droit d’auteur de l’Union européenne (UE) à l’ère numérique et à protéger les détenteurs de droits. Après de vifs débats, cette proposition a été approuvée par le Parlement européen le 26 mars 2019.
2. Le concept d’intelligence artificielle générative (IAG)
Comme nous l’avons expliqué dans un article publié sur le site « Avenir de la Langue Française (ALF) le 5 novembre 2024 (« Les apports de l’intelligence artificielle générative à la Francophonie scientifique », N. Antonin), « contrairement à l’IA traditionnelle qui cherche à comprendre et à reproduire l’intelligence humaine, l’intelligence artificielle générative se concentre sur la création de contenus originaux, que ce soit du texte, de l’image, de la musique ou d’autres types de données, à partir de modèles d’apprentissage profond, c’est-à-dire des algorithmes qui simulent les processus d’apprentissage et de prise de décision du cerveau humain. L’arrivée de ChatGPT a mis en avant cette nouvelle technologie ».
ChatGPT qui signifie « Generative Pre-trained Transformer » et qui a été développé par la société d’Elon Musk OpenAI en 2015, est entraîné sur une quantité massive de données dont les sources ne sont pas mentionnées. Le manque d’indication des sources soulève de multiples questions dont celle relative au lien entre IA générative et droit d’auteur.
Pour Maître Vanessa Bouchara, spécialiste en propriété intellectuelle, « la problématique de la violation du droit d’auteur ne se pose que pour l’intelligence artificielle générative, c’est-à-dire l’intelligence artificielle utilisée pour créer un nouveau contenu (texte, image), par opposition à l’intelligence artificielle prédictive qui permet de prévoir des tendances ».
3. Les œuvres générés par l’IA peuvent-elles bénéficier de la protection du droit d’auteur ?
Le développement de l’intelligence artificielle soulève des enjeux juridiques fondamentaux concernant la notion d’auteur et la protection juridique des œuvres produites par l’IA.
En droit français, une œuvre est protégée par le droit d’auteur dès lors qu’elle est originale et qu’elle résulte d’une intervention humaine.
Une œuvre originale est celle qui exprime la personnalité de l’auteur. Elle est le résultat d’une création indépendante et non de la copie d’une œuvre d’un tiers ou du domaine public. La jurisprudence communautaire considère comme originale une œuvre qui est « la création intellectuelle propre de son auteur » (CJCE, 16 juillet 2009). Ce concept d’originalité, un critère essentiel dans le domaine du droit d’auteur, est remis en question avec l’IA.
En outre, la nécessité d’une créativité humaine pose des défis pour la protection des œuvres générés par l’IA.
Face à ces défis, les positions juridiques actuelles diffèrent selon les pays.
Aux États-Unis, L’U.S Copyright Office a soulevé cette question juridique complexe dans la deuxième partie de son étude sur l’IA et le droit d’auteur (janvier 2025). D’après cette étude, une création entièrement générée par une IA ne peut bénéficier d’une protection de droit d’auteur, arguant qu’une intervention humaine substantielle et nécessaire. Dans l’affaire Thaler contre Perlmutter (voir décision du 18 mars 2025), la United States Court of Appeals for the District of Columbia Circuit a confirmé l’absence de protection par le copyright américain d’une œuvre présentée comme générée uniquement par l’intelligence artificielle. Cette décision de la Cour d’appel s’appuie sur le principe que seules les œuvres crées par des êtres humains sont éligibles à la protection du droit d’auteur.
En Europe, le règlement européen sur l’intelligence artificielle publié en juillet 2024 vise à garantir que le développement et l’utilisation des produits et productions de l’IA respectent les droits fondamentaux et les valeurs européennes.
Au Royaume-Uni, un projet du gouvernement vise à assouplir le droit d’auteur pour faciliter l’utilisation des contenus par les entreprises d’intelligence artificielle. Ces dernières n’auraient plus besoin d’obtenir a priori l’autorisation des auteurs pour utiliser certains contenus.
4. Quid de l’entraînement de ChatGPT en utilisant des œuvres protégés par le droit d’auteur ?
ChatGPT est entraîné à partir d’une gigantesque quantité de données textuelles disponibles sur internet, souvent sans autorisation, qui lui permettent de générer des réponses à une grande variété de questions et de sujets.
D’aucuns considèrent l’utilisation d’œuvres protégées pour l’entraînement d’algorithmes d’IA comme une violation du droit d’auteur dès lors qu’elle est effectuée sans l’autorisation préalable du titulaire de droits. Ces atteintes aux droits de propriété intellectuelle sont à l’origine d’une augmentation continue des contentieux entre les fournisseurs d’IA générative (IAG) et les ayants-droits de contenus protégés par des droits d’auteur.
L’obligation d’obtenir une autorisation des auteurs avant d’utiliser leurs œuvres est contestée par des fournisseurs d’IA qui se réfèrent à certaines exceptions juridiques.
Ainsi, aux Etats-Unis les fournisseurs d’IA invoquent le fair use (usage loyal en français) pour se défendre dans les litiges relatifs aux atteintes au droit d’auteur. Cette doctrine spécifique au droit américain des droits d’auteur permet sous certaines conditions d’utiliser une œuvre protégée sans autorisation. Toutefois, une première décision judicaire rendue aux Etats-Unis le 11 février 2025 dans l’affaire Thomson Reuters c/ Ross Intelligence a affirmé que l’exception de fair use ne s’appliquait pas à l’entraînement d’une IA sur du contenu protégé par le droit d’auteur.
En Europe, les fournisseurs d’IA s’appuient sur l’exception de fouille de textes et de données (text et data mining ou TDM) pour justifier l’utilisation de contenus protégés par le droit d’auteur et les droits voisins, sans avoir à demander l’autorisation aux titulaires de droits. L’article 4 de la directive du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique, dite directive DAMUN, prévoit cette exception TDM à condition que les titulaires de droits n’aient pas expressément réservé l’usage de leurs œuvres à ces fins (opt out). La première décision en Europe sur l’exception de fouille de textes et de données a été rendue par le Tribunal régional de Hambourg le 27 septembre 2024 (affaire LAION c/ Robert Kneschke) qui a jugé que cette exception pouvait être applicable. Mais cette interprétation reste très contestée.
Comme le déclare Maître Vanessa Bouchara, « l’entraînement des modèles d’intelligence artificielle sur des contenus protégés par les droits d’auteur constitue un danger pour les titulaires de droits qui subissent une atteinte injustifiée de leurs droits ».
En définitive, face à l’essor fulgurant de l’IA générative, d’aucuns plaident pour une réforme des cadres juridiques existants afin de s’adapter à cette nouvelle réalité technologique.
Au niveau européen, le règlement sur l’intelligence artificielle, l’IA Act, que nous avons évoqué précédemment, établit un cadre harmonisé pour l’utilisation de l’IA au sein de l’Union européenne. Il fixe entre autres des obligations clés pour les créateurs de modèles d’IA génératifs : assurer la transparence dans l’utilisation des données et le respect du droit d’auteur.
5. Glossaire
Entraînement (ou apprentissage) : Processus de l’apprentissage automatique pendant lequel le système d’intelligence artificielle construit un modèle à partir de données.
Exploration de données : Analyse et extraction d’une quantité massive de données.
Intelligence artificielle générative (IAG) : Intelligence artificielle qui se concentre sur la création de contenu, tels que des textes, des images, des vidéos , des sons et d’autres types de données, par des systèmes informatiques.
Propriété intellectuelle : Ensemble de droits protégeant les œuvres de l’esprit, œuvres littéraires et artistiques, musique, dessins et modèles, logos, noms et images.
La propriété intellectuelle est composée d’une part de la propriété littéraire et artistique et d’autre part, de la propriété industrielle.
© Copyright ANDESE
Le présent document est protégé par les dispositions du code de la propriété intellectuelle. Les droits d'auteur sont la propriété exclusive d'ANDESE (Association Nationale des Docteurs ès Sciences Économiques et en Sciences de Gestion). La copie ou la reproduction (y compris la publication et la diffusion), intégrale ou partielle, par quelque moyen que ce soit (notamment électronique) sans le consentement de l’éditeur constituent un délit de contrefaçon sanctionné par les articles L. 335-2 et suivants du code de la propriété intellectuelle.