
Par une décision Authors vs Anthropic rendue le 23 juin 2025, la Cour fédérale du district nord de Californie s’est prononcée sur l’application du « fair use » (U.S.C § 107 Copyright Act) à l’entraînement d’un modèle de langage (LLM) à partir d’œuvres littéraires protégées.
Dans cette affaire, les auteurs requérants soutenaient qu’Anthropic avait reproduit leurs œuvres sans autorisation, par le biais de téléchargements de copies piratées ou par numérisation de livres papier acquis légalement, afin d’entraîner son système d’intelligence artificielle « Claude » et constituer une bibliothèque centrale regroupant tous les livres du monde. Le fair use invoqué par la société défenderesse a été partiellement retenu par le juge américain.

Un rappel de l’exception de fair use
Fair Use et IA : entrainement sur des milliers de livres
Exception en droit d’auteur américain, le fair use permet une utilisation non autorisée d’une œuvre protégée dans certaines circonstances.
Pour que son application soit reconnue, quatre critères cumulatifs énoncés par l’article 107 du Copyright Act doivent être respectés :
- • Le but et le caractère de l’usage ;
- • La nature de l’œuvre protégée ;
- • La quantité et la substantialité de la portion utilisée ;
- • L’effet de l’usage sur le marché ou la valeur de l’œuvre.
Application des critères au cas d’espèce
Fair Use et IA : entrainement sur des milliers de livres
Concernant le but et le caractère d’usage, la cour a jugé que l’utilisation des œuvres à des fins d’entraînement était « spectaculairement transformatif». L’objectif poursuivi n’est pas de reproduire ou de concurrencer les textes originaux mais d’en extraire des structures linguistiques pour la recherche et le développement d’IA générative. Ce facteur opère donc en faveur du fair use pour les copies d’entraînement. À l’inverse, l’usage de copies piratées pour créer une bibliothèque centrale « pour toujours », sans finalité précise ni transformation, ne relève pas du fair use.
Quant au critère de la nature de l’œuvre, le juge a rappelé qu’en droit américain certaines œuvres sont plus protégées que d’autres[1], mais ce facteur ne s’oppose pas à l’application du fair use aux copies d’entraînement, la nature de l’œuvre n’étant pas déterminante dans le cadre d’un usage hautement transformateur.
Sur la quantité et la substantialité des proportions utilisées bien que les œuvres aient été reproduites dans leur intégralité, le juge a estimé que cela était justifié pour le développement du LLM. En revanche, les copies piratées, utilisées sans modification et conservées à d’autres fins, ne peuvent être couvertes par le fair use.


Enfin, le juge a distingué trois types d’effets d’usages sur le marché :
► Pour les copies d’entraînement, aucun effet substitutif ni préjudice n’a été démontré : le facteur ne s’oppose pas au fair use.
► Pour les livres achetés et numérisés, le facteur est neutre, puisque les exemplaires papier ont été détruits. La numérisation relève d’une recherche de gain d’espace.
► Pour les copies piratées destinées à une bibliothèque centrale « pour toujours », l’impact est préjudiciable au marché : elles ont substitué des ventes légales et exposé les œuvres à des usages incontrôlés. Le fair use est ici écarté, même si certaines œuvres ont été utilisées à des fins d’entraînement.
La Cour valide l’entraînement des modèles de langage comme un usage transformateur pouvant relever du fair use, à condition que les copies utilisées soient acquises légalement et intégrées dans un processus de recherche. Le juge applique ainsi une lecture souple et extensive du fair use au profit des fournisseurs de systèmes d’intelligence artificielle générative, permettant ainsi un développement de la technologie et de l’innovation.
[1] Ce facteur « appelle à reconnaître que certaines œuvres sont plus proches du cœur de la protection prévue par le droit d’auteur que d’autres, avec pour conséquences que l’usage équitable est plus difficile à établir lorsque les premières œuvres sont copiées », Cambell, 510 U.S à 586.
Avec la collaboration de Cléo Carraz, stagiaire, étudiante en Master 2 Droit du patrimoine culturel.

Marie Soulez
Avocate, Directrice du département Propriété intellectuelle Contentieux

Marie Soulez
Avocate, Directrice du département Propriété intellectuelle Contentieux
- Phone:+33 (0)7 85 53 57 52
- Email:marie-soulez@lexing.law
Pour en apprendre davantage
Le Règlement européen sur l’intelligence artificielle constitue un outil essentiel pour comprendre les enjeux juridiques et techniques que pose le RIA (ou AI Act). L’ouvrage analyse et souligne les points clé et analyse article par article ce texte...
La cobotique juridique #3 : Les malfaçons. Ce troisième épisode détaille les différents facteurs de malfaçons et comment les corriger...