Livres piratés et intelligence artificielle : Mistral AI sous pression

L’intelligence artificielle générative se retrouve une nouvelle fois au cœur d’une controverse majeure liée au droit d’auteur. L’éditeur français Nouveau Monde Éditions accuse Mistral AI d’avoir utilisé plus de 200 ouvrages de son catalogue sans autorisation pour entraîner son assistant conversationnel Le Chat. Une affaire emblématique des tensions croissantes entre industries culturelles et acteurs de l’IA.

Plus de 200 livres exploités sans accord selon l’éditeur

Selon son fondateur Yannick Dehée, Nouveau Monde Éditions aurait identifié plus de 200 titres utilisés dans les jeux de données servant à l’entraînement de l’IA de Mistral. L’éditeur affirme avoir demandé une indemnisation pour les auteurs et ayants droit concernés, rappelant que la start-up française bénéficie par ailleurs de financements publics.

L’éditeur souligne également que certains de ses ouvrages traduits ont déjà fait l’objet d’utilisations non autorisées par des sociétés d’IA américaines, lesquelles auraient débouché sur des accords amiables assortis de compensations financières substantielles.

Mistral AI réfute toute utilisation illégale

De son côté, Mistral AI conteste fermement les accusations. Un porte-parole de l’entreprise assure que ses modèles sont entraînés à partir de sources publiques, de contenus sous licence et de données générées en interne, couvrant plusieurs langues et régions. La société affirme qu’aucun accord n’a été signé avec Nouveau Monde Éditions, mais nie également toute exploitation illicite d’ouvrages protégés.

Library Genesis au cœur des soupçons

Yannick Dehée remet toutefois en cause cette version et évoque une possible utilisation de Library Genesis, une base de données pirate bien connue recensant des millions d’ouvrages protégés. Ces soupçons font écho à une enquête publiée fin 2025 par Mediapart, dans laquelle le directeur scientifique de Mistral AI évoquait l’usage massif de livres issus de cette plateforme pour entraîner des modèles d’IA.

L’affaire est d’autant plus sensible qu’une autre investigation journalistique pointe les activités passées de Guillaume Lample, cofondateur et directeur scientifique de Mistral AI, lorsqu’il travaillait chez Meta. Des documents judiciaires américains indiquent qu’en 2022, environ 70 téraoctets de données provenant de Library Genesis auraient été téléchargés dans le cadre de recherches sur les modèles de langage.

Un climat judiciaire déjà tendu pour l’IA générative

L’action de Nouveau Monde Éditions s’inscrit dans un contexte judiciaire explosif. En mars 2025, le Syndicat national de l’édition, la Société des Gens de Lettres et le Syndicat national des auteurs et des compositeurs ont assigné Meta en justice pour contrefaçon et parasitisme économique, l’accusant d’avoir entraîné son modèle LLaMA à partir d’œuvres protégées.

Ces procédures traduisent une mobilisation croissante des ayants droit pour faire reconnaître l’usage illicite de contenus culturels dans l’entraînement des intelligences artificielles.

Risques réglementaires et réputationnels pour Mistral AI

L’affaire survient alors que le cadre réglementaire européen se durcit. Depuis août 2025, le règlement européen sur l’IA impose aux fournisseurs de modèles d’IA à usage général de publier un résumé détaillé de leurs données d’entraînement, document que Mistral AI n’a pas encore rendu public.

En France, une proposition de loi vise également à instaurer une présomption d’exploitation des œuvres culturelles par les fournisseurs d’IA, renforçant la pression juridique sur le secteur. Si un accord amiable n’était pas trouvé, le différend entre Nouveau Monde Éditions et Mistral AI pourrait déboucher sur une procédure judiciaire aux conséquences financières et symboliques lourdes.

Au-delà des indemnisations potentielles, Yannick Dehée estime que le principal risque pour Mistral AI serait réputationnel, susceptible de fragiliser durablement ses relations avec les éditeurs, les auteurs et les partenaires institutionnels français et européens.