KI-Datenschutz umfasst die Grundsätze, Praktiken und Technologien, die zum Schutz personenbezogener und sensibler Informationen eingesetzt werden, während diese durch KI-Systeme fließen. Er adressiert Datenschutzanliegen auf jeder Stufe: Datenerhebung, Modelltraining, Inferenz (Nutzung zur Laufzeit) und Ausgabeerzeugung.
Zu den zentralen Herausforderungen des KI-Datenschutzes gehören: der Datenschutz bei Trainingsdaten (Modelle können personenbezogene Informationen aus Trainingsdaten memorieren und wiedergeben), der Datenschutz bei der Inferenz (Benutzeranfragen können sensible personenbezogene Daten enthalten), der Datenschutz bei Ausgaben (von KI generierte Inhalte können unbeabsichtigt private Informationen preisgeben), der kontextübergreifende Datenschutz (in einem Kontext geteilte Informationen, die in einem anderen auftauchen) sowie der Datenschutz von Metadaten (Nutzungsmuster, die sensible Informationen über Einzelpersonen oder Organisationen preisgeben).
Zu den datenschutzfördernden Technologien für KI gehören: Differential Privacy (das Hinzufügen von Rauschen zu Trainingsdaten, um die Identifizierung Einzelner zu verhindern), Federated Learning (das Training von Modellen auf verteilten Daten, ohne diese zu zentralisieren), homomorphe Verschlüsselung (das Verarbeiten verschlüsselter Daten ohne Entschlüsselung), Datenanonymisierung und -pseudonymisierung, sichere Mehrparteienberechnung sowie die KI-Verarbeitung auf dem Gerät, die Daten lokal hält.
Zu den regulatorischen Anforderungen, die sich auf den KI-Datenschutz auswirken, gehören das Recht auf Erläuterung automatisierter Entscheidungen nach der DSGVO, die Grundsätze der Datenminimierung, die Zweckbindung, die Speicherbegrenzung und das Recht auf Löschung, die allesamt bei der Gestaltung und Bereitstellung von KI-Systemen berücksichtigt werden müssen.