Definition Datenmaskierung | Data Masking Was ist Datenmaskierung?

Von Dipl.-Ing. (FH) Stefan Luber 4 min Lesedauer

Anbieter zum Thema

Datenmaskierung ist ein Daten­verschleierungs­verfahren. Es verfremdet Daten so, dass sie zwar eine vergleichbare Struktur haben, aber keine Identifizierung der maskierten Ursprungsdaten mehr zulassen. Maskierte Daten lassen sich weiterhin für bestimmte Datenverarbeitungsvorgänge verwenden.

 (Bild:  gemeinfrei /  Pixabay)
(Bild: gemeinfrei / Pixabay)

Der englische Begriff für Datenmaskierung lautet Data Masking. Bei der Datenmaskierung handelt es sich um ein Verfahren zur Verfremdung von Daten. Es ist neben der Datentokenisierung und der Datenverschlüsselung eines der drei gängigen und häufig genannten Datenverschleierungsverfahren. Mithilfe der Datenmaskierung lassen sich sensible, vertrauliche oder persönliche Daten vor dem unbefugten Auslesen oder vor Offenlegung schützen. Damit ist die Datenmaskierung auch eine Maßnahme des Datenschutzes und eine Form der Datenanonymisierung. Sie kann aber nicht nur zum Schutz personenbezogener Daten, sondern generell für alle Arten von Daten zum Einsatz kommen.

Beim Data Masking werden die Originaldaten durch fiktive, ähnliche oder zufällig erzeugt Daten, die real wirken und ähnliche Struktur haben, ersetzt. Es entsteht eine verfremdete Version der Ursprungsdaten. Einige der Zusammenhänge und Informationsstrukturen bleiben aber trotz Maskierung erhalten, weshalb sich die Daten nach wie vor für bestimmte Datenverarbeitungsvorgänge verwenden lassen. Die Daten stehen Geschäftsprozessen oder Anwendungen weiterhin zur Verfügung. Ohne Zugriff auf die Originaldaten lassen sich bei den maskierten Daten die Ursprungsdaten aber nicht identifizieren oder wiederherstellen. Durch das Verfremden der sensiblen oder zu schützenden Daten sind abgefangene oder gestohlene maskierte Daten für einen Angreifer mehr oder weniger nutzlos.

Der Vorgang der Datenmaskierung ist ohne die Originaldaten nicht umkehrbar. Darin unterscheidet sich die Datenmaskierung auch von der Datenverschlüsselung und der Tokenisierung. Denn mit Kenntnis der verwendeten Schlüssel und Verschlüsselungsverfahren beziehungsweise der Zuordnungsvorschriften der Token zu den ersetzten Daten sind die Verschlüsselung und die Tokenisierung umkehrbare Datenverschleierungsverfahren. Bei der Datenmaskierung muss es keine 1:1-Abbildung zwischen den Originaldaten und den verfremdeten Daten geben.

Zur Maskierung von Daten angewandte Techniken und Verfahren

Um Daten zu maskieren, können verschiedene Verfahren und Techniken zum Einsatz kommen. Ein gängiges Verfahren ist beispielsweise das Ersetzen mit ähnlich aussehenden Zufallsdaten gleicher Struktur. Auch das Ersetzen mit einem Nullwert oder Löschen der Daten ist ein Datenmaskierungsverfahren. Ein weiteres Verfahren ist das sogenannte Blacklining. Es maskiert Teile der Originaldaten, indem beispielsweise mehrere Stellen durch ein einziges Zeichen ersetzt beziehungsweise geschwärzt werden. Darüber hinaus können sensible Daten durch Durchschnittswerte oder in der Reihenfolge der Zahlen oder Zeichen vertauschte Werten ersetzt werden. Auch das zufällige Mischen von Daten, zum Beispiel der Datenelemente in den Spalten von Datentabellen, ist möglich. Häufig werden auch die Datenverschlüsselung und die Tokenisierung als Datenmaskierungsverfahren aufgeführt. Da diese Verfahren aber umkehrbar sind, werden sie in der Regel als eigenständige Datenverschleierungsverfahren betrachtet.

Was den Vorgang der Datenmaskierung betrifft, ist eine Unterscheidung zwischen statischer und dynamischer Maskierung möglich. Bei der statischen Maskierung findet die Verfremdung der sensiblen Daten vor der Speicherung oder Weitergabe der Daten über fest vorgegebene Maskierungsregeln statt. Die Daten liegen für bestimmte Anwendungen und Prozesse oder für Dritte in einer generell maskierten Form vor.

Eine dynamische Maskierung findet erst beim Zugriff oder bei der Abfrage von sensiblen Daten statt. Die Daten liegen in einer grundsätzlich unmaskierten Form, zum Beispiel in einer Datenbank, vor. Greift eine Anwendung oder ein Nutzer auf sensible Daten zu, wird ein zuvor definiertes Verfahren zu Datenmaskierung in Echtzeit angewandt. Dabei lassen sich Rollen- und Berechtigungskonzepte berücksichtigen. Nutzer oder Anwendungen werden je nach Benutzerrolle oder Zugriffsrecht maskierte oder nicht maskierte Daten ausgespielt. Die eigentlichen Ursprungsdaten bleiben in der unmaskierten Form gespeichert.

Weitere Verfahren zur Verschleierung von Daten

Datenverschleierung (Data Obfuscation) ist der Prozess des Veränderns sensibler, vertraulicher oder persönlicher Daten in der Form, dass sie vor unbefugtem Zugriff oder Auslesen oder vor einer unerwünschten Offenlegung geschützt sind. Mithilfe der Datenverschleierung lassen sich die Daten so verändern, dass sie, selbst wenn sie von Unbefugten abgefangen oder eingesehen werden, nicht in ihrer Ursprungsbedeutung lesbar oder erkennbar sind. Die drei gängigen und häufig genannten Verfahren zur Datenverschleierung sind die Datenverschlüsselung, die Datentokenisierung und die Datenmaskierung.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Die Datenverschlüsselung verschleiert die Ursprungsdaten mithilfe mathematischer Verschlüsselungsalgorithmen und digitaler Schlüssel. Verschlüsselte Daten lassen sich bei Besitz der benötigten Schlüssel und Kenntnis der angewandten Verschlüsselungsverfahren wieder in die Ausgangsdaten zurückverwandeln.

Bei der Tokenisierung werden sensible Daten durch zufällig erzeugte, bedeutungslose Daten (als Token bezeichnet) ersetzt. Über getrennt von den verschleierten Daten gespeicherte Zuordnungsinformationen lassen sich die Ursprungsdaten wieder auflösen. Um das Auflösen durch Unbefugte zu verhindern, ist die Datensammlung mit den Zuordnungsinformationen organisatorisch und technisch speziell geschützt.

Im Umfeld des Datenschutzes personenbezogener Daten werden häufig auch die nicht umkehrbare Datenanonymisierung und die umkehrbare Datenpseudonymisierung genannt. Auch sie lassen sich den Datenverschleierungsverfahren zuordnen und verwenden Techniken wie Maskierung, Tokenisierung oder Verschlüsselung.

Einige typische Anwendungsbereiche der Datenmaskierung

Die Datenmaskierung erzeugt strukturell ähnliche Datensätze, in denen sensible Daten verfremdet sind. Sensible Daten werden dadurch vor unbefugtem Zugriff und vor unerwünschter Offenlegung oder Missbrauch geschützt. Die maskierten Daten bleiben für bestimmte Datenverarbeitungsvorgänge aber weiterhin nutzbar. Typische Anwendungsbereiche der Datenmaskierung sind:

  • Verhinderung von Datenmissbrauch und Datendiebstahl
  • Einhaltung von Datenschutzbestimmungen wie die Datenschutz-Grundverordnung (DSGVO)
  • Einhaltung von Compliance-Vorgaben
  • Schutz von geistigem Eigentum
  • externe Zusammenarbeit und Weitergabe von Daten an Dritte für die externe Datenverarbeitung und Datenspeicherung
  • Minimierung des Risikos und der Auswirkungen von Datenpannen
  • Verwendung von Daten für die Forschung oder analytische Zwecke ohne Preisgabe sensibler Informationen
  • Verwendung von Daten für Schulungszwecke oder Präsentationen ohne echte Kunden- oder Geschäftsdaten preiszugeben
  • Training von Systemen oder Modellen der Künstlichen Intelligenz

(ID:50147643)