Winterkongress 2024
Dies ist die Website zum Winterkongress 2020. Die Website zur aktuellen Ausgabe vom 1./2. März 2024 befindet sich hier.
Anonymisierung von personenbezogenen Daten
Matthias Templ
Ein wesentlicher Bestandteil moderner Anwendungen in der Welt der digitalen Transformation ist die Analyse von Daten und die Anwendung moderner Machine- und Deep-Learning-Methoden. Begleitend - und oft entscheidend für den Erfolg - findet in allen Bereichen eine immer extensivere Datensammlung statt. Viele der interessantesten Anwendungen, welche uns als Einzelnen indirekt oder direkt betreffen, beinhalten auch die Sammlung und Verarbeitung personenbezogener Daten, vor allem von Mikrodaten (nicht-aggregierter Information).
Seit den ersten Datenschutzskandalen in den 90er Jahren weiss auch der Gesetzgeber, dass das Entfernen oder Pseudoanonymisieren direkt identifizierender Attribute wie Namen, Adressen und AHV Nummern in der Regel nicht ausreicht, um Datenschutzverletzungen zu verhindern. Das Kernkonzept der Datenanonymisierung besteht darin, Daten so zu transformieren, dass Re-Identifizierungsrisiken von Personen verringert werden, wobei die Verringerung der Risiken gegen eine Verringerung des Datennutzens abgewogen wird (de-fakto Anonymität). Dies ist eine komplexe Aufgabe welche die Anwendung und Entwicklung komplexer Methoden benötigt. Es sind formalere Ansätze erforderlich, bei denen mathematische und statistische Modelle zur Quantifizierung der Risiken und der Auswirkungen der Anonymisierung auf die Datennutzung verwendet werden. Darüber hinaus müssen komplexe Algorithmen eingesetzt werden, um einerseits das Risiko zu senken und andererseits die Datenqualität und das Analysepotential und die Forschungsfragen nicht zu einzuschränken.
Möglichkeiten und Grenzen von Anonymisierung als auch Techniken der Risikoschätzung und Anonymisierung von Mikrodaten (nicht-aggregierte Daten) werden überblicksmässig und allgemein verständlich vorgestellt. Nicht Bestandteil oder nur sehr kleiner Anteil des Vortrages sind Methoden zur Geheimhaltung aggregierter Daten und Pseudoanonymisierung.