Anonymisierung von Daten in Datenbanken Welche Tools bei der Anonymisierung helfen

Autor / Redakteur: Dipl.-Phys. Oliver Schonschek / Peter Schmitz

Anonymisierung personenbezogener Daten ist der Königsweg im Datenschutz. Besonders wichtig ist die Anonymisierung der Daten, wenn Datenbanken bei Testprojekten genutzt werden. Verschiedene Datenbank-Module und spezielle Tools helfen bei der Erzeugung anonymer Daten nach Datenschutz-Grundverordnung (DSGVO / GDPR). Wir geben einen Überblick und nennen die Datenschutzforderungen.

Anbieter zum Thema

Mit Tools zur Anonymisierung von personenbezogenen Daten lässt sich der Datenschutz bei Datenbank-Tests sicherstellen und die DSGVO-Compliance gewährleisten.
Mit Tools zur Anonymisierung von personenbezogenen Daten lässt sich der Datenschutz bei Datenbank-Tests sicherstellen und die DSGVO-Compliance gewährleisten.
(© KsanaGraphica - stock.adobe.com)

Seit Monaten schon muss die Datenschutz-Grundverordnung (DSGVO / GDPR) angewendet werden. Trotzdem stecken viele Unternehmen immer noch in der Umsetzung. Da erscheint die Anonymisierung personenbezogener Daten fast wie ein Befreiungsschlag, denn in den zur DSGVO gehörenden Erwägungsgründen findet man sinngemäß:

Die Grundsätze des Datenschutzes gelten nicht für anonyme Informationen, d. h. für Informationen, die sich nicht auf eine identifizierte oder identifizierbare natürliche Person beziehen, oder personenbezogene Daten, die in einer Weise anonymisiert worden sind, dass die betroffene Person nicht oder nicht mehr identifiziert werden kann.

Anonyme Informationen haben also entweder keinen direkten oder indirekten Personenbezug, oder es handelt sich um personenbezogene Daten, die so bearbeitet wurden, dass die jeweilige Person nicht mehr identifizierbar ist.

Anonymisierung sollte aber weniger als Ausweg gesehen werden, um der DSGVO zu entgehen, sondern vielmehr als Königsweg im Datenschutz. Anonymisierung ist eine der wichtigsten Maßnahmen, um personenbezogene Daten zu schützen, indem man den Daten den direkten oder indirekten Personenbezug nimmt.

Wichtiger Anwendungsfall sind Testprojekte

Wenn ein Unternehmen zum Beispiel ein neues CRM-System (Customer Relationship Management) oder HR-System (Human Resources) testen will, um sich für oder gegen die Einführung zu entscheiden, finden Testphasen statt, in denen die neue Lösung möglichst realitätsnah getestet werden soll.

Wer jetzt echte Kundendaten oder Beschäftigtendaten in die neue Lösung importiert, um einen realistischen Test durchzuführen, darf nicht vergessen, dass für Testprojekte die gleichen, hohen Anforderungen gelten wie im späteren Produktiveinsatz.

Die Aufsichtsbehörden für den Datenschutz haben dies so ausgedrückt: Personenbezogene Daten sind vor der Freigabe eines Systems nicht weniger schutzbedürftig als nach dessen Freigabe.

Da jedoch gerade im Testfall einer neuen, datenbankgestützten Anwendung oder aber eines neuen Datenbanksystems noch nicht sichergestellt ist, dass die personenbezogenen Daten in der Datenbank angemessen geschützt sind, empfiehlt es sich ausdrücklich, den Test mit anonymisierten Daten durchzuführen, also Daten, die von der Struktur und dem Aufbau her den Echtdaten entsprechen, die aber kein direkte oder indirekte Identifizierung von Personen mehr zulassen.

Viele Datenbanken bieten bereits Anonymisierungsfunktionen

Unternehmen, die Datenbanken im Einsatz haben, sollten prüfen, ob es nicht bereits Datenschutz-Module oder -Funktionen dafür gibt, die die Anonymisierung bzw. Datenmaskierung vornehmen können. Datenmaskierung bedeutet dabei, dass das Format der Daten erhalten wird, nur die Werte werden verändert, um eine Identifizierung von Personen zu verhindern.

Beispiele für solche Module sind: Dynamische Datenmaskierung bei SQL Server, IBM InfoSphere Optim Data Masking, MariaDB MaxScale und Oracle Data Masking.

Im Fall einer zu testenden Datenbank oder datenbankgestützten Anwendung jedoch sind solche Datenschutz-Module nicht der Weg der Wahl: Ohne zu wissen, wie es um die Datensicherheit einer neuen Lösung steht, sollten die Echtdaten nicht importiert werden, um sie dann im Testsystem zu anonymisieren.

Die personenbezogenen Daten sollten bereits vor dem Test anonymisiert und dann importiert werden, wobei geprüfte und zuverlässige Anonymisierungsfunktionen bei den vorhandenen Datenbanken eingesetzt werden sollten. Doch es gibt auch Alternativen.

Spezielle Tools helfen bei der Anonymisierung

Neben den Datenbank-Modulen zur Anonymisierung gibt es auch eine Reihe von Spezialwerkzeugen, die die Anonymisierung personenbezogener Daten in bestimmten Datenbanken ermöglichen. Solche Tools und Verfahren werden von Datenschützern explizit begrüßt.

„Gerade die Entwicklung von Anonymisierungs- und Pseudonymisierungsverfahren als Privacy-by-default-Lösungen stellen einen wichtigen Beitrag zur Wahrung des Datenschutzes dar“, erklärte die Bundesbeauftragte für den Datenschutz und die Informationsfreiheit.

Beispiele für Tools zur Anonymisierung sind:

  • DataSunrise (unter anderem für Oracle, MS SQL Server, PostgreSQL, MySQL, IBM DB2, Amazon Aurora, Amazon Redshift, MS SQL Azure, Mongo DB, Amazon Dynamo DB, MariaDB, etc.)
  • DataVeil (für SQL Server , Oracle, MySQL und Azure SQL)
  • Imperva Camouflage (für Oracle, SQL Server, DB2, SAP ASE, Teradata, Netezza, MySQL, PostgreSQL, IMS etc.)

Möglichkeiten zur Anonymisierung von personenbezogenen Daten gibt es somit reichlich, der Datenschutz bei Datenbank-Tests kann also durchaus gewährleistet werden, mit Datenmaskierung, nicht um die DSGVO zu umgehen, sondern um DSGVO-Compliance zu gewährleisten.

(ID:45745029)