Le vol de modèle d’IA (également appelé extraction de modèle ou model stealing) désigne les attaques au cours desquelles des adversaires tentent de répliquer les fonctionnalités d’un modèle d’IA propriétaire sans accès autorisé à son architecture, à ses poids ou à ses données d’entraînement. Cela représente des risques importants en matière de propriété intellectuelle et de concurrence pour les organisations qui investissent massivement dans le développement de modèles d’IA.
Les techniques de vol de modèle comprennent : l’extraction par API (interroger systématiquement l’API d’un modèle et utiliser les paires entrée-sortie pour entraîner un modèle de substitution fonctionnellement équivalent), les attaques par canal auxiliaire (exploiter les schémas de temporisation, de consommation d’énergie ou d’accès mémoire pour en déduire des détails du modèle), les menaces internes (des employés ou des prestataires exfiltrant les poids, le code ou les données d’entraînement du modèle), la compromission de la chaîne d’approvisionnement (intercepter des modèles lors de leur transfert entre systèmes) et l’ingénierie inverse (analyser les artefacts d’un modèle déployé pour en reconstruire l’architecture et les paramètres).
L’impact du vol de modèle comprend : la perte d’avantage concurrentiel (des concurrents acquérant des capacités d’IA équivalentes sans investissement en R&D), l’atteinte à la propriété intellectuelle (l’usage non autorisé d’innovations propriétaires), l’exposition à des risques de sécurité (les modèles volés peuvent être analysés pour y trouver des vulnérabilités), les risques de conformité (les modèles volés peuvent être déployés sans gouvernance appropriée) et les pertes financières (qui sapent la valeur métier des investissements en IA).
Les stratégies de défense comprennent : la limitation de débit des API et la surveillance des requêtes (détecter les tentatives d’extraction systématiques), la confidentialité différentielle sur les sorties du modèle (ajouter du bruit pour réduire la fidélité de l’extraction), le filigranage de modèle (intégrer une preuve de propriété), les contrôles d’accès et la journalisation (restreindre et surveiller l’accès au modèle), les protections juridiques (brevets, secrets d’affaires, accords de licence) et les techniques d’obscurcissement de modèle (rendre l’extraction plus difficile sans affecter l’usage légitime).