L’IA explicable (XAI) désigne les méthodes, techniques et outils qui rendent les sorties des systèmes d’IA compréhensibles pour les utilisateurs humains. À mesure que les modèles d’IA, en particulier l’apprentissage profond et les grands modèles de langage, gagnent en complexité, leurs processus de décision deviennent des « boîtes noires » opaques, ce qui pose des difficultés pour la confiance, la responsabilité et la conformité réglementaire.
Les approches de la XAI se répartissent en deux catégories : les modèles intrinsèquement interprétables (des modèles plus simples comme les arbres de décision ou la régression linéaire, compréhensibles par nature) et les méthodes d’explication a posteriori (des techniques appliquées à des modèles complexes pour expliquer leurs décisions après coup).
Les techniques courantes de XAI comprennent : LIME (Local Interpretable Model-agnostic Explanations), qui explique les prédictions individuelles en approximant le modèle localement ; SHAP (SHapley Additive exPlanations), qui s’appuie sur la théorie des jeux pour attribuer l’importance des caractéristiques ; la visualisation de l’attention, qui montre sur quels éléments d’entrée le modèle s’est concentré ; les explications contrefactuelles, qui décrivent quels changements d’entrée modifieraient le résultat ; les explications fondées sur des concepts, qui relient le comportement du modèle à des concepts compréhensibles par l’humain ; et les explications en langage naturel générées par le modèle lui-même.
Les applications de la XAI en entreprise comprennent : la conformité réglementaire (droit à une explication du RGPD, exigences de transparence de l’EU AI Act), la gestion des risques (comprendre pourquoi les systèmes d’IA prennent certaines décisions), la détection des biais (identifier quelles caractéristiques entraînent des résultats potentiellement discriminatoires), le débogage et l’amélioration (comprendre les défaillances du modèle pour améliorer ses performances) et la confiance des parties prenantes (renforcer la confiance dans les systèmes d’IA parmi les utilisateurs, les clients et les autorités de régulation).