Le filigranage de modèle est un ensemble de techniques permettant d’intégrer des identifiants imperceptibles dans les modèles d’IA ou les sorties qu’ils génèrent. Ces filigranes servent d’empreintes numériques qui peuvent prouver la propriété d’un modèle, détecter une redistribution non autorisée et tracer la provenance du contenu généré par l’IA.
Il existe deux approches principales : le filigranage du modèle (intégrer des marqueurs dans le modèle lui-même, ses poids, son architecture ou son comportement) et le filigranage des sorties (intégrer des marqueurs dans le contenu que le modèle génère, qu’il s’agisse de texte, d’images, d’audio ou de vidéo).
Les techniques de filigranage de modèle comprennent : le filigranage par porte dérobée (le modèle produit des sorties spécifiques pour des entrées déclencheuses secrètes, prouvant la propriété), le filigranage par paramètres (intégrer des informations directement dans les poids du modèle) et le fingerprinting (créer des variantes uniques du modèle pour chaque licencié afin de tracer les fuites).
Les techniques de filigranage des sorties comprennent : le filigranage statistique pour le texte (orienter subtilement le choix des mots afin de créer des motifs détectables), le filigranage d’image invisible (intégrer des signaux imperceptibles dans les images générées), le filigranage audio (encoder des identifiants inaudibles dans la parole ou la musique générées) et les approches fondées sur les métadonnées (intégrer des informations de provenance dans les métadonnées des fichiers).
Les applications en entreprise comprennent : la protection de la propriété intellectuelle (prouver la propriété de modèles propriétaires), l’authenticité du contenu (distinguer le contenu généré par l’IA du contenu créé par des humains), la conformité réglementaire (l’EU AI Act exige la divulgation du contenu généré par l’IA), la lutte contre la désinformation (tracer la source des hypertrucages générés par l’IA) et l’application des licences (détecter la redistribution non autorisée de modèles).