Un gran modelo de lenguaje (LLM) es un tipo de sistema de inteligencia artificial entrenado con conjuntos de datos de texto masivos, a menudo de miles de millones a billones de tokens, que puede comprender, generar y manipular el lenguaje humano. Los LLMs constituyen la base de la mayoría de las herramientas modernas de IA generativa.
Entre los principales LLMs se incluyen: GPT-4 y GPT-4o (OpenAI, que impulsan ChatGPT), Claude (Anthropic), Gemini (Google), Llama (Meta, código abierto) y Mistral (Mistral AI). Estos modelos suelen basarse en la arquitectura Transformer y utilizan el aprendizaje autosupervisado sobre datos de texto a escala de Internet.
Las consideraciones de seguridad empresarial para los LLMs incluyen: la privacidad de los datos (la información introducida como instrucciones puede conservarse o utilizarse para el entrenamiento), las alucinaciones (los LLMs pueden generar información plausible pero incorrecta), las vulnerabilidades de inyección de instrucciones, las salidas incoherentes que pueden afectar a las decisiones empresariales, las cuestiones de propiedad intelectual sobre el contenido generado por IA y la necesidad de supervisión humana de las salidas de los LLMs.
Las organizaciones que gestionan el uso de LLMs necesitan políticas que cubran: qué herramientas basadas en LLMs están aprobadas, qué datos pueden utilizarse en las instrucciones, cómo debe revisarse y atribuirse el contenido generado por IA, la seguridad de las API para las integraciones de LLMs y la supervisión del uso de LLMs en toda la organización.