Un grand modèle de langage (LLM) est un type de système d’intelligence artificielle entraîné sur des jeux de données textuelles massifs, souvent de plusieurs milliards à plusieurs billions de tokens, capable de comprendre, de générer et de manipuler le langage humain. Les LLMs constituent le fondement de la plupart des outils modernes d’IA générative.
Parmi les principaux LLMs figurent : GPT-4 et GPT-4o (OpenAI, qui alimentent ChatGPT), Claude (Anthropic), Gemini (Google), Llama (Meta, open source) et Mistral (Mistral AI). Ces modèles reposent généralement sur l’architecture Transformer et recourent à l’apprentissage auto-supervisé sur des données textuelles à l’échelle d’Internet.
Les considérations de sécurité en entreprise pour les LLMs comprennent : la confidentialité des données (les informations saisies sous forme de requêtes peuvent être conservées ou utilisées à des fins d’entraînement), les hallucinations (les LLMs peuvent générer des informations plausibles mais incorrectes), les vulnérabilités d’injection de requête, les sorties incohérentes susceptibles d’influer sur les décisions métier, les questions de propriété intellectuelle relatives au contenu généré par l’IA, et la nécessité d’une supervision humaine des sorties des LLMs.
Les organisations qui encadrent l’usage des LLMs ont besoin de politiques couvrant : quels outils reposant sur des LLMs sont approuvés, quelles données peuvent être utilisées dans les requêtes, comment le contenu généré par l’IA doit être revu et attribué, la sécurité des API pour les intégrations de LLMs, et la surveillance de l’usage des LLMs au sein de l’organisation.