Definition Datenanonymisierung | Data Anonymization Was ist Datenanonymisierung?

Von Dipl.-Ing. (FH) Stefan Luber 4 min Lesedauer

Anbieter zum Thema

Die Datenanonymisierung ist eine Maßnahme des Datenschutzes. Bei der Anonymisierung werden personenbezogene oder personenbeziehbare Daten so verändert, dass sie sich nicht mehr bestimmten Personen zuordnen lassen. Anonymisierte Daten fallen nicht mehr in den Anwendungsbereich der DSGVO.

Datenanonymisierung ist eine Maßnahme des Datenschutzes durch entfernen der Zuordnungsmöglichkeiten zu bestimmten Personen.(Bild:  gemeinfrei /  Pixabay)
Datenanonymisierung ist eine Maßnahme des Datenschutzes durch entfernen der Zuordnungsmöglichkeiten zu bestimmten Personen.
(Bild: gemeinfrei / Pixabay)

Datenanonymisierung (im Englischen Data Anonymization) ist eine Maßnahme des Datenschutzes. Sie wird auch den Verfahren der Datenverschleierung zugeordnet. Es handelt sich um einen Datenverarbeitungsvorgang, der personenbezogene Daten oder personenbeziehbare Daten so verändert, dass sie nicht mehr oder nur mit einem unverhältnismäßig großen Zeit-, Kosten- und Arbeitsaufwand bestimmten natürlichen Personen zugeordnet werden können.

Zur Anonymisierung kommen verschiedene Techniken und Verfahren zum Einsatz, die die betreffenden Daten entfernen, ersetzen, verfälschen oder aggregieren. Die grundsätzliche Integrität und Nutzbarkeit der anonymisierten Daten bleiben erhalten. Sie lassen sich beispielsweise weiterhin für bestimmte Analysezwecke verwenden. Die Datenanonymisierung trägt zum Schutz persönlicher oder vertraulicher Daten bei und hilft, Datenschutz- oder Compliance-Anforderungen zu erfüllen. Vollständig anonymisierte Daten ohne Personenbezug fallen nicht mehr in den Anwendungsbereich der Datenschutz-Grundverordnung (DSGVO).

Welche Verfahren werden zur Datenanonymisierung eingesetzt?

Zur Anonymisierung von Daten können zahlreiche verschiedene Techniken und Verfahren zum Einsatz kommen. So werden beispielsweise Daten oder Datenmerkmale, über die sich ein Personenbezug herstellen lässt, gelöscht oder durch Platzhalterdaten ersetzt werden. Ein weiteres Anonymisierungsverfahren ist das Aggregieren von Daten. Bei der Aggregation werden einzelne Datensätze zu Gruppen zusammengefasst, aus denen das Zuordnen zu bestimmten Personen nicht mehr möglich ist. Die Anonymisierung von Daten lässt sich auch erreichen, indem bestimmte Daten durch Daten mit vergleichbarer Bedeutung, aber ohne Bezugsmöglichkeiten zu einzelnen Personen ersetzt werden. Weitere Verfahren und Techniken zur Datenanonymisierung sind das zufallsbasierte Verfälschen beziehungsweise Verändern von Daten, das Nachbilden der Ursprungsdaten mithilfe synthetisch generierter Daten, das Verallgemeinern von Daten, das Umordnen oder Verschieben von Daten (Data Swapping oder Data Shuffling) oder das Einfügen von Datenstörungen wie zufälliges Rauschen (Data Perturbation).

Betrachtet man den zeitlichen Ablauf einer Datenanonymisierung ist eine Unterscheidung zwischen einer statischen, einer dynamischen oder einer interaktiven Anonymisierung möglich.

Welche Daten werden üblicherweise anonymisiert?

Die Datenanonymisierung wird üblicherweise auf Daten angewandt, über die sich ein Bezug zu bestimmten natürlichen Personen herstellen lässt. Typische Daten mit einem direkten Personenbezug sind beispielsweise Namen, Adressen, Geburtsdaten, E-Mail-Adressen oder Telefonnummern. Unter Umständen müssen aber auch Daten anonymisiert werden, die zwar keine direkte oder eindeutige Identifikation einer bestimmten Person zulassen, aber durch deren Kombination oder Analyse ein Personenbezug hergestellt werden kann. Setzt man beispielsweise Daten wie die Postleitzahl, Geburtsjahr, Geschlecht und Beruf in Beziehung, ist es unter bestimmten Umständen möglich, auf eine einzelne Person oder ein eng eingegrenzte Personengruppe zu schließen. Typische von einer Datenanonymisierung betroffene Daten sind:

  • Vor- und Nachname einer Person
  • Wohnadressen von Personen
  • Geburtsdaten von Personen
  • Festnetz- oder Mobilfunkrufnummern von Personen
  • Fahrzeugkennzeichen
  • Ausbildungsstatus und Beruf
  • eindeutig auf bestimmte Personen verweisende Nummern wie Mitgliedsnummern oder Ausweisnummern
  • E-Mail-Adressen
  • IP-Adressen
  • biometrische Daten wie Fingerabdrücke oder Netzhautmuster
  • Zahlungs- und Finanzdaten mit Personenbezug
  • Einkaufs- und Bestelldaten mit Personenbezug

Was ist der Unterschied zwischen Datenanonymisierung von der Datenpseudonymisierung?

Datenanonymisierung und Datenpseudonymisierung sind beides Maßnahmen des Datenschutzes, lassen sich aber deutlich voneinander abgrenzen. Während es bei der Datenanonymisierung darum geht, die Zuordnungsmöglichkeit von Daten zu bestimmten Personen vollständig zu entfernen, bleiben bei der Pseudonymisierung grundsätzliche Zuordnungsmöglichkeiten weiterhin erhalten. Sie sind allerdings ausgelagert. Die Pseudonymisierung ersetzt personenbezogene oder personenbeziehbare Daten durch Pseudonyme beziehungsweise eindeutige Schlüssel und bewahrt die Zuordnungsmöglichkeit getrennt auf. Zum Beispiel wird eine externe Datei gepflegt, in der die jeweiligen Pseudonyme beziehungsweise Schlüssel und die ihnen zugeordneten Daten gespeichert sind. Der Zugang zu den Zuordnungsinformationen ist nur unter definierten Voraussetzungen und nur für autorisierte Personen oder Anwendungen möglich. Während die Datenanonymisierung grundsätzlich ein nicht oder nur mit unverhältnismäßig großem Aufwand umkehrbarer Vorgang ist, ist die Datenpseudonymisierung durch Wiederherstellung der Identifikationsmerkmale über getrennt vorgehaltene Zuordnungsinformationen umkehrbar.

Datenanonymisierung und die Datenschutz-Grundverordnung

Anonymisierte Daten fallen nicht mehr in den Anwendungsbereich der Datenschutz-Grundverordnung. Sind alle Identifikationsmöglichkeiten aus den Daten entfernt, können sie ohne Einschränkungen gesammelt, auf unbegrenzte Zeit gespeichert und für beliebige Zwecke verwendet werden. Allerdings haben die für die Datenverarbeitungsvorgänge Verantwortlichen den Nachweis zu erbringen, dass es sich tatsächlich um anonyme Daten ohne Personenbezug oder personenbeziehbare Informationen handelt. Obwohl sich auch bei pseudonymisierten Daten ohne Zugriff auf die getrennt aufbewahrten Zuordnungsinformationen kein Personenbezug herstellen lässt, gelten pseudonyme Daten im Gegensatz zu anonymen Daten weiterhin grundsätzlich als personenbezogene Daten und müssen auch so behandelt werden. Der technische und organisatorische Schutzbedarf pseudonymisierter Daten ist jedoch niedriger als bei nicht pseudonymisierten Daten. Laut DSGVO entspricht die Pseudonymisierung dem Grundgedanken der Datenminimierung. Das Risiko des Missbrauchs der pseudonymisierten Daten ist bei einer Datenpanne ohne Zugriff auf die Zusatzinformation minimiert.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Was sind typische Anwendungsbereiche der Datenanonymisierung?

Die Datenanonymisierung ist eine Maßnahme des Datenschutzes. Sie kommt für viele verschiedene Anwendungsbereiche zum Einsatz.

In der Europäischen Union sind personenbezogen Daten von Einzelpersonen zu schützen. Sollen sie für bestimmte Zwecke verarbeitet oder außerhalb der EU gespeichert oder verarbeitet werden, gelten strenge Vorgaben. Durch die vollständige Datenanonymisierung fallen die Daten nicht mehr in den Anwendungsbereich der DSGVO. Die Daten werden für bestimmte Zwecke einsetzbar. Strafen oder Sanktionen für Datenschutzverstöße lassen sich vermeiden. Durch die Datenanonymisierung entsteht die Möglichkeit einer gemeinsamen Nutzung der Daten. Die Daten können an Dritte weitergegeben und dort in der gewünschten Art und Weise verarbeitet, analysiert und gespeichert werden. Wird unberechtigt auf anonymisierte Daten zugegriffen oder werden sie gestohlen, verhindert die Datenanonymisierung den Missbrauch personenbezogener Daten. Typische Anwendungsbereiche anonymisierter Daten sind:

  • Forschungsarbeiten
  • klinische Studien
  • Training von KI-Modellen
  • Auswerten des Verbraucherverhaltens
  • Auswertung von Finanzdaten und Finanztransaktionen
  • Auswertung des Produktnutzungsverhaltens
  • Auswertung des Internetnutzungsverhaltens
  • Analyse von Telekommunikationsdaten
  • Auswertung von Mobilitäts- und Verkehrsdaten
  • Auswertung und Durchführung von Marketing- und Werbekampagnen

(ID:50147647)