L’hallucination de l’IA désigne le phénomène par lequel un grand modèle de langage (LLM) ou un système d’IA génère des informations factuellement incorrectes, inventées ou absurdes, tout en les présentant avec la même assurance qu’une information exacte. Le terme emprunte à la psychologie et décrit des sorties où l’IA « perçoit » un contenu qui n’est pas ancré dans la réalité, inventant en réalité des éléments de toutes pièces.
Les hallucinations sont une limite inhérente aux architectures d’IA générative actuelles. Les LLM prédisent le token suivant statistiquement le plus probable à partir des données d’entraînement, sans mécanisme distinct de vérification de l’exactitude factuelle. Les modèles peuvent ainsi produire des citations, des statistiques, des précédents juridiques, des informations médicales ou des événements historiques qui semblent plausibles mais sont entièrement inventés.
Les risques d’hallucination courants en entreprise incluent des contrats générés par l’IA comportant des clauses juridiques inventées, des documents médicaux avec des posologies incorrectes, des rapports financiers citant des données inexistantes, des réponses du service client fournissant des informations erronées sur les politiques, et du code qui fait référence à des fonctions ou des API qui n’existent pas (ce que l’on appelle des « ghost packages » ou dépendances hallucinées, exploitables par des attaquants).
Des recherches d’IBM suggèrent que les hallucinations de l’IA affectent jusqu’à 20 % des réponses des LLM dans des contextes non contraints, même si les déploiements d’entreprise s’appuyant sur la génération augmentée par récupération (RAG) et un prompting structuré peuvent réduire considérablement ce taux.
Les organisations qui gèrent le risque d’hallucination de l’IA devraient mettre en place : des flux de revue humaine pour les contenus générés par l’IA dans les contextes à fort enjeu (juridique, médical, financier) ; des architectures RAG qui ancrent les sorties de l’IA dans des ensembles de documents vérifiés ; des pipelines de validation des sorties qui recoupent les affirmations de l’IA avec des sources faisant autorité ; la formation des employés aux risques d’hallucination ; et des politiques claires définissant les cas où un contenu généré par l’IA nécessite une vérification humaine avant utilisation.