Datenklassifizierung ist der systematische Prozess, Daten anhand ihrer Sensibilität, ihres Werts und der regulatorischen Anforderungen in Kategorien zu organisieren. Im Kontext der KI-Governance bestimmt die Datenklassifizierung, welche Informationen sicher mit KI-Tools verwendet werden können und welche eingeschränkt werden müssen.
Gängige Klassifizierungsstufen sind: Öffentlich (frei verfügbar, sicher für jedes KI-Tool), Intern (Geschäftsinformationen, nur genehmigte Unternehmens-KI-Tools), Vertraulich (sensible Daten, die bei Offenlegung Schaden verursachen könnten, für externe KI-Tools gesperrt) und Streng vertraulich (hochsensible Daten unter rechtlichem oder regulatorischem Schutz, für alle KI-Tools untersagt).
Speziell für die KI-Governance ist die Datenklassifizierung von entscheidender Bedeutung, weil: KI-Tools eingegebene Daten speichern und daraus lernen können, Prompts und Datei-Uploads klassifizierte Informationen offenlegen können, von KI generierte Ausgaben die Klassifizierung ihrer Eingaben erben und regulatorische Rahmenwerke Datenschutzkontrollen für die KI-Verarbeitung verlangen.
Die Umsetzung erfordert klare Richtlinien, die Datentypen den Klassifizierungsstufen zuordnen, Mitarbeiterschulungen zu Klassifizierungsverfahren, technische Kontrollen (DLP, Zugriffskontrollen), die die Klassifizierungsregeln durchsetzen, regelmäßige Audits der Klassifizierungsgenauigkeit sowie automatisierte Klassifizierungstools für große Datenmengen.