Ein Large Language Model (LLM) ist eine Art System künstlicher Intelligenz, das auf massiven Textdatensätzen trainiert wird, oft Milliarden bis Billionen von Tokens, und das menschliche Sprache verstehen, generieren und verarbeiten kann. LLMs bilden die Grundlage der meisten modernen generativen KI-Werkzeuge.
Zu den wichtigsten LLMs gehören: GPT-4 und GPT-4o (OpenAI, die ChatGPT antreiben), Claude (Anthropic), Gemini (Google), Llama (Meta, Open Source) und Mistral (Mistral AI). Diese Modelle basieren in der Regel auf der Transformer-Architektur und nutzen selbstüberwachtes Lernen auf Textdaten in Internetgröße.
Zu den unternehmensseitigen Sicherheitsaspekten bei LLMs gehören: Datenschutz (als Prompts eingegebene Informationen können gespeichert oder zum Training verwendet werden), Halluzinationen (LLMs können plausible, aber falsche Informationen erzeugen), Schwachstellen durch Prompt Injection, inkonsistente Ausgaben, die Geschäftsentscheidungen beeinflussen können, Fragen des geistigen Eigentums an KI-generierten Inhalten sowie die Notwendigkeit menschlicher Aufsicht über die Ausgaben von LLMs.
Organisationen, die die Nutzung von LLMs steuern, benötigen Richtlinien, die Folgendes abdecken: welche auf LLMs basierenden Werkzeuge genehmigt sind, welche Daten in Prompts verwendet werden dürfen, wie KI-generierte Inhalte geprüft und gekennzeichnet werden sollten, die API-Sicherheit für LLM-Integrationen sowie die Überwachung der LLM-Nutzung im gesamten Unternehmen.