Differential Privacy ist ein rigoroses mathematisches Rahmenwerk zur Quantifizierung und Begrenzung des Datenschutzrisikos bei der Datenanalyse und beim Training von KI-Modellen. Sie fügt Daten, Abfragen oder Modelltrainingsprozessen sorgfältig kalibriertes Zufallsrauschen hinzu und stellt so sicher, dass das Einbeziehen oder Ausschließen der Daten einer einzelnen Person einen vernachlässigbaren Einfluss auf das Ergebnis hat.
Das Kernkonzept wird durch den Datenschutzparameter Epsilon (ε) erfasst: Ein niedrigeres Epsilon bietet stärkere Datenschutzgarantien, verringert jedoch den Datennutzen, während ein höheres Epsilon mehr Datengenauigkeit bewahrt, aber schwächeren Datenschutz bietet. Organisationen müssen diesen Datenschutz-Nutzen-Kompromiss anhand ihrer spezifischen Anforderungen abwägen.
Zu den Anwendungen von Differential Privacy in der Unternehmens-KI gehören: Modelltraining mit Datenschutzgarantien (verhindern, dass Modelle einzelne Datenpunkte memorieren), Analysen und Berichte über sensible Datensätze (aggregierte Statistiken veröffentlichen, ohne Einzelpersonen offenzulegen), die Generierung synthetischer Daten (datenschutzwahrende Datensätze für die KI-Entwicklung erstellen), die Verbesserung des föderierten Lernens (Datenschutz zu den zwischen Teilnehmern geteilten Modell-Updates hinzufügen) und die Einhaltung der Anforderungen zur Datenminimierung gemäß DSGVO und ähnlichen Vorschriften.
Große Technologieunternehmen haben Differential Privacy in großem Maßstab eingesetzt: Apple verwendet sie in iOS für Nutzungsanalysen, Google setzt sie in Chrome und Maps ein, und das U.S. Census Bureau nutzte Differential Privacy für den Zensus 2020. Für Unternehmen liefert sie eine mathematische Grundlage für Datenschutzaussagen, statt sich allein auf Richtlinienkontrollen zu stützen.