EU-Datenschutz wirft ein Frage auf, die verunsichert: Sind die Daten wirklich gelöscht?
Die EU-Datenschutz-Grundverordnung (DSGVO) bringt eine Frage mit sich, die gar nicht einfach zu beantworten ist: Wenn ein Kunde das Löschen von Daten wünscht – wie können Unternehmen sicher wissen, dass die Daten auch wirklich gelöscht wurden?
Anbieter zum Thema

Auf den ersten Blick mag diese Frage einfach klingen. Aber tatsächlich sind Kundendaten im gesamten Unternehmen verteilt. Das können Bilder, Konten in sozialen Netzwerken oder Videos sein, von denen man weiß, dass alle mit Erika oder Max Mustermann verknüpft sind. Die Frage ist nur: Warum werden diese Daten bei Suchen nicht gefunden?
Daten in Silos – Ja, wo laufen sie denn?
Wenn im Laufe der Jahre ein System nach dem anderen dem vorherigen „übergestülpt“ wird, gibt es kein System, das alle Daten an zentraler Stelle enthält oder diese Daten kennt. Folglich lassen sich solche (international) Suchabfragen nicht zuverlässig durchführen. Dies ist ein Problem bei der Datenintegration.
Laut einer aktuellen Studie von CrowdFlower verbringen 60 Prozent der Data Scientists ihre Zeit mit der Aufbereitung oder Bereinigung von Daten, um diese für die Datenbank passend zu machen. 80 Prozent der befragten Data Scientists gaben an, dass die Datenaufbereitung ihnen am wenigsten Spaß macht.
Das Problem der heterogenen Daten
Ein weiteres Problem liegt darin, die Daten an einer zentraler Stelle zusammenzubringen. Viele IT-Abteilungen arbeiten mit strukturierten Daten. Dahinter steckt die Überzeugung, alle Daten sollten in einer relationalen Datenbank oder einem Warehouse gespeichert werden. Doch diese Systeme laden Daten nicht in jedem Format. Allein das Mapping und Modeling dauert Monate. Und wenn die IT auch unstrukturierte oder teilweise strukturierte Daten aufnehmen will – also sämtliche Informationen, die ein Vertrag, ein digitales Foto oder eine SMS enthält –, wird die Angelegenheit noch schwieriger.
All dies kostet Zeit. Insbesondere wenn man bedenkt, dass die neue EU-Datenschutzverordnung nächstes Jahr in Kraft tritt. Was für Datenschutzgesetze (einschließlich der DSGVO) heute und in Zukunft benötigt wird, ist eine Datenbank, die alle heterogenen Daten verarbeiten kann – einschließlich strukturierter Daten, Text, JSON, XML, RDF Triples, Geodaten und großer Binärdateien.
Sind diese Schritte erfolgt, befinden sich sämtliche Daten an einer zentraler Stelle. Doch wie erfüllt man nun eine Anfrage auf Löschung sämtlicher Daten? Wie kann man sicher gehen, dass dem System nichts entgangen und wirklich alles gelöscht ist?
Alles auf einen Blick: der zentralisierte Operational Data Hub
Ein Data Hub ist ein virtueller Aktenschrank, der eine einzige, vereinheitliche Darstellung sämtlicher Daten enthalten kann. Mit diesem zentralisierten Data Hub, der semantische Assoziationen (Metadaten) zwischen Entitäten und Assets erstellt, können Unternehmen alle Assets suchen und finden, die zu einer bestimmten Person gehören. Sämtliche Daten – strukturierte wie unstrukturierte – sollten beim Laden semantisch verknüpft sein.
So wird sicher gestellt, dass wirklich jede zeichenbasierte Datei über Erika oder Max Mustermann (alphanumerisch oder in anderer Form) und jede sonstige Datei (Bilder, Videos bis hin zu Verweise in sozialen Netzwerken) erfasst wird und diese sich leicht und termingerecht löschen lässt. Wenn jetzt ein Antrag auf Datenlöschung eingeht, können Unternehmen zuversichtlich sein, dass sie alle Informationen, die zu einer Person gehören auch wirklich gefunden und gelöscht werden kann.
Horrende Strafen drohen
Die EU-Datenschutz-Grundverordnung (DSGVO) tritt im Mai 2018 in Kraft. Unternehmen, die sie bis dahin nicht erfüllen oder nicht ausreichend Maßnahmen ergriffen haben, müssen mit Bußgeldern in Höhe von vier Prozent des Jahresumsatzes oder 20 Millionen Euro rechnen. Konkret bedeutet das zum Beispiel für das Schlusslicht des britischen Aktienindexes FTSE 250: Sollte dieses Unternehmen nicht die DSGVO erfüllen, würde das Bußgeld 15,8 Millionen britische Pfund betragen. Also gute Gründe sich jetzt mit der neuen DSGVO auseinanderzusetzen.
* *Stefan Grotehans ist Director of Sales Engineering bei MarkLogic, München.
(ID:44667155)