IA Générative et Tatouage Numérique : « La nécessité du tatouage numérique pour l’intégrité des contenus et le respect des droits d’auteur »


ANTHONY LEVEL

Anthony occupe la fonction de Responsable de la stratégie légale et règlementaire relative à l’IA chez IMATAG, une spin-off de l’INRIA basée à Rennes, spécialisée dans le tatouage numérique (« digital watermarking »). Il est expert en réglementations et affaires publiques internationales dans les domaines de l’IA, du numérique, de l’information et des médias, et représente le GESTE auprès du CSPLA. Juriste de formation, diplômé du CEIPI et de l’école de commerce de Strasbourg, Anthony Level a notamment occupé le poste de directeur juridique et des affaires publiques européennes chez TF1. 

C’est quoi le tatouage numérique ?
Le tatouage numérique est une technologie de pointe qui consiste à intégrer des données invisibles dans des fichiers numériques (tels que des images, des vidéos, des documents ou des fichiers audio) pour préserver leur origine, leur propriété et leur intégrité. Ces informations intégrées peuvent servir à diverses fins, telles que la traçabilité, la garantie d’intégrité et la détection de l’utilisation non autorisée ou détournée des contenus. Chez IMATAG, l’accent est mis sur la robustesse de ce tatouage : les informations insérées sont conçues pour résister aux manipulations, aux compressions, aux recadrages ou aux autres modifications du contenu. Le tatouage reste intact quelles que soient les transformations subies par le fichier. Mais la robustesse n’est rien sans la sécurité, c’est pourquoi le tatouage que nous fournissons ne peut pas faire l’objet d’ingénierie inverse ni de détection de « pattern ».  En effet une clé différente existe pour chaque contenu marqué, ce qui fait du tatouage IMATAG l’un des plus fiables au monde.

Selon vous quelles sont les bonnes pratiques que les médias devraient mettre en œuvre à l’aide du tatouage numérique ? 

À l’ère de l’IA générative les contenus générés se propagent instantanément, sont de plus en plus réalistes et l’information est souvent consommée sans discernement. La question de la véracité, de l’intégrité et de la traçabilité des contenus devient donc plus que jamais cruciale. Pour les médias et éditeurs en ligne, la mise en place de technologies avancées tel que le tatouage numérique peut désormais être considérée comme une nécessité incontournable. Cette solution offre une réponse efficace aux défis posés par la multiplication des contenus générés par l’IA, dont la prolifération de fakenews et deepfakes, tout en permettant d’intégrer un droit d’opposition (« opt-out ») face à l’utilisation abusive des données destinées à entraîner les intelligences artificielles.

Existe-t-il dans le monde des textes d’ordre éthique ou réglementaire qui font référence au tatouage numérique ?

Le premier réflexe des législateurs a été de se tourner vers le tatouage numérique pour permettre d’identifier les contenus générés par l’IA, que ce soient l’AI ACT européen, le décret Biden sur l’IA, ou les règles édictées par l’Administration du cyberespace chinois. Nous retrouvons également ce principe dans le processus d’Hiroshima du G7, ou encore dans la convention-cadre du Conseil de l’Europe sur l’IA.

L’idée consiste à remonter considérablement les barrières à l’entrée pour contrer la diffusion des campagnes de désinformation, tant il est aujourd’hui facile et économique de les fabriquer à l’aide des outils d’IA générative à disposition de tous. Ceci viendra compliquer la tâche des fraudeurs, mais ne permettra pas d’endiguer complètement le phénomène surtout pour des organisations motivées ou bénéficiant de soutiens financiers. Par ailleurs, se pose la question de la régulation effective des outils open source.

C’est pourquoi d’autres textes internationaux et d’autres initiatives éthiques ou industrielles prévoient la nécessité de tatouer aussi les contenus réels (par opposition aux contenus générés par l’IA), tels que les contenus de presse et des médias, afin de rajouter de la certitude pour un public de plus en plus sceptique et désorienté. En d’autres termes, pouvoir identifier les contenus générés par l’IA est une bonne chose, pouvoir également identifier de manière certaine les contenus issus de sources fiables (telles que des photos journalistiques relatant des faits de terrain) c’est encore mieux, laissant libre court à l’esprit critique du public face aux contenus qui ne seraient estampillés ni comme générés par l’IA, ni comme issus du réel.

Par exemple, la résolution de l’ONU A/78/L.49 de mars 2024 et la Charte de Paris sur l’IA et le Journalisme initiée par RSF demandent aux médias fiables d’utiliser des outils qui garantissent l’authenticité et la provenance du contenu publié en ligne. Toutes les garanties mises en place en amont dans le processus de fabrication de l’information peuvent être réduites à néant si son intégrité n’est pas assurée une fois en ligne. 

Sur le plan industriel, parmi de nombreuses initiatives on peut mentionner le standard ouvert C2PA (Coalition for Content Provenance and Authenticity),  regroupant la plupart des géants du numérique, des fabricants d’appareils photos et des éditeurs (dont certains adhérents du GESTE), les incitant à adopter des réflexes de préservation de l’intégrité des métadonnées des contenus en y en associant du tatouage numérique.

En quoi le tatouage numérique est également pertinent pour le respect du droit d’opposition (« opt-out ») prévu dans la directive européenne Copyright 2019/790 et renforcé dans l’AI ACT ?

L’AI Act prévoit l’utilisation de dispositifs de pointe pour identifier et respecter les réservations de droits exprimées par les ayants droit tant sur leurs droits d’auteur que leurs droits voisins. Le tatouage numérique permet d’intégrer un signal invisible dans chaque contenu qui renvoie à ses métadonnées pouvant elles-mêmes contenir des informations telles que le droit d’opposition à l’entraînement des IA ou les conditions de licence propres à chaque contenu. Le procédé est sans équivoque lisible par machine et permet aux fournisseurs d’IA générative d’en prendre connaissance de manière automatisée. Ce serait une manière d’inverser le rapport de force avec les acteurs technologiques en leur fournissant un moyen sûr de prendre connaissance de la volonté des ayants droit, et ainsi de la respecter. Le tatouage constitue une alternative à une course effrénée d’opposition systématique à l’entraînement, fournisseur d’IA par fournisseur d’IA, ou à l’adoption de technologies anti-scraping. Le tatouage permet en une seule opération, de manière précise, définitive et granulaire (i.e. contenu par contenu), d’indiquer un droit d’opposition inaltérable.

Dans ce domaine, un récent projet de loi aux USA, dénommé COPIED ACT « Content Origin Protection and Integrity from Edited and Deepfakes Media of 2024 » prévoit de placer le tatouage numérique au centre des problématiques relatives à l’IA générative. Il prévoit non seulement d’utiliser cette technologie pour identifier les contenus générés, mais également pour empêcher que des contenus soient utilisés en entraînement sans l’accord explicite de leurs propriétaires. En d’autres termes, le projet de loi prévoit que si un contenu comporte un tatouage, il est « opt-out » par défaut pour l’entraînement. Le projet va même jusqu’à interdire la suppression du tatouage, tant il devient un élément central de la régulation contre les deepfakes et la protection du copyright. Espérons que ceci inspire l’AI Office et les Institutions européennes dans les mois à venir.

Le tatouage numérique serait ainsi une modalité complémentaire du résumé détaillé prévu dans l’AI ACT ?

Nous scrutons tous l’élaboration du « template » correspondant par l’AI Office. Mais même avec cette obligation relative de transparence, il ne sera pas possible d’être certain que les contenus des ayants droit n’auront pas servi à l’entraînement des IA ou que les droits d’opposition auront été respectés, car les bases de données utilisées restent la plupart du temps opaques et le résumé ne comportera aucun détail œuvre par œuvre. A contrario, avec le tatouage numérique, il est possible d’imaginer en cas de procès, qu’un ayant droit qui aurait préalablement tatoué ses contenus puisse demander au juge une expertise technique consistant à scanner les bases de données utilisées à l’entraînement afin d’y retrouver son tatouage, aboutissant à la révélation que ses contenus ont bien été utilisés.

Ainsi, il est souhaitable que les médias et éditeurs en ligne intègrent un droit d’opposition explicite dans leur stratégie numérique. Ce droit permettrait aux créateurs de contenus de refuser l’utilisation de leurs travaux pour entraîner des IA. En combinant le tatouage numérique avec une politique de protection des droits, les éditeurs peuvent non seulement sécuriser leurs œuvres face à l’IA générative mais aussi surveiller toute contrefaçon ou éventuelles manipulations ou détournements en ligne, lui permettant d’agir en conséquence, à savoir selon les cas « debunker », faire supprimer et faire valoir ses droits.

Vers un avenir sécurisé et équitable ?

L’adoption du tatouage numérique par les médias et éditeurs en ligne est plus qu’une simple mesure technique, elle est un acte de responsabilité envers la préservation de l’intégrité du journalisme et des créations numériques. En parallèle, le droit d’opposition contre l’utilisation des contenus pour l’entraînement des IA constitue une avancée indispensable pour garantir le respect des droits d’auteur et droits voisins dans un monde de plus en plus avide de données fraîches, fiables et de qualité.

En une seule opération technique, le tatouage permet d’assurer l’intégrité de l’information une fois en ligne, de lutter contre les fakenews et deepfakes, de s’opposer à l’entraînement des IA et d’éventuellement surveiller les utilisations contrefaisantes ou manipulées en ligne.

Pour le futur, il est essentiel que les acteurs du secteur collaborent pour mettre en place ces outils de manière cohérente et efficace. Le respect de ces principes assurera non seulement la protection des contenus et de l’information mais aussi l’établissement d’un cadre équitable pour la coexistence entre les médias, les créateurs et les technologies émergentes. L’avenir de l’information et de la création numérique dépend de notre capacité à allier innovation et éthique, en mettant en place des solutions adaptées aux défis que nous pose l’IA.