La modélisation des menaces de l’IA est la pratique systématique consistant à analyser les systèmes d’IA afin d’identifier les vecteurs d’attaque, vulnérabilités et menaces potentiels avant qu’ils ne puissent être exploités. Elle étend des méthodologies traditionnelles de modélisation des menaces telles que STRIDE et PASTA pour répondre à des risques propres à l’IA, comme les attaques adverses, l’empoisonnement des données, le vol de modèle et l’injection de requête.
Le processus de modélisation des menaces de l’IA comprend généralement : la définition du périmètre du système d’IA (modèles, pipelines de données, API, intégrations), l’identification des actifs (données d’entraînement, poids du modèle, données utilisateurs, propriété intellectuelle), la cartographie des flux de données (comment l’information circule dans le système d’IA), l’identification des menaces à l’aide de taxonomies propres à l’IA (OWASP Top 10 pour les LLM, MITRE ATLAS), l’évaluation de la probabilité et de l’impact de chaque menace, et la hiérarchisation des stratégies d’atténuation.
Les catégories de menaces propres à l’IA comprennent : les attaques par entrées adverses (entrées conçues pour provoquer une mauvaise classification), l’extraction de modèle (vol des fonctionnalités du modèle par des requêtes d’API), l’empoisonnement des données d’entraînement (corruption des données pour manipuler le comportement du modèle), l’inférence d’appartenance (déterminer si des données spécifiques ont servi à l’entraînement), l’injection de requête et le jailbreaking, la compromission de la chaîne d’approvisionnement des dépendances du modèle, et les attaques de confidentialité qui extraient des données d’entraînement sensibles.
Les organisations devraient mener une modélisation des menaces de l’IA avant de déployer tout système d’IA, lors des mises à jour majeures et périodiquement à mesure que le paysage des menaces évolue. Les résultats devraient alimenter les processus de gestion des risques liés à l’IA et orienter la mise en place des contrôles de sécurité.