Definition Tokenisierung | Datentokenisierung Was ist Tokenisierung?

Von Dipl.-Ing. (FH) Stefan Luber 4 min Lesedauer

Anbieter zum Thema

Die Tokenisierung ist ein Verfahren zur Datenverschleierung. Sensible Daten werden durch Token ersetzt. Die Token schützen die Daten gegenüber Unbefugten, lassen aber für autorisierte Personen oder Anwendungen die Identifikation der Ursprungsdaten über externe gesicherte Zuordnungsinformationen zu.

Tokenisierung ist ein Verfahren zur Datenverschleierung durch das Ersetzen sensibler Daten durch für Angreifer nutzlose Token.(Bild:  gemeinfrei /  Pixabay)
Tokenisierung ist ein Verfahren zur Datenverschleierung durch das Ersetzen sensibler Daten durch für Angreifer nutzlose Token.
(Bild: gemeinfrei / Pixabay)

Der Begriff Tokenisierung wird im IT-Umfeld in verschiedenen Bedeutungen verwendet. Im Bereich der Künstlichen Intelligenz versteht man unter Tokenisierung den Prozess des Aufbrechens von Text in kleinere Einheiten. Diese kleineren Einheiten werden als Token bezeichnet.

Im Umfeld von Blockchains und Kryptowährungen steht der Begriff Tokenisierung für die Umwandlung von Vermögenswerten in digitale Token einer Blockchain. In dieser Definition ist mit Tokenisierung die Datentokenisierung (Data Tokenization) als ein Verfahren zur Datenverschleierung gemeint.

Bei der Datentokenisierung werden sensible, vertrauliche oder persönliche Daten durch sogenannte Token ersetzt, um sie vor unbefugtem Auslesen, Missbrauch oder vor unerwünschter Offenlegung zu schützen. Ein Token ist eine eindeutige ID oder ein eindeutiges Identifikationssymbol mit Verweis auf die Ursprungsdaten in Form beispielsweise einer zufällig erzeugten Zeichenkette, die für einen Unbefugten keinen sinnvollen Wert hat.

Tokenisierung ist auch eine Maßnahme des Datenschutzes und eine Form der Datenpseudonymisierung. Sie eignet sich aber nicht nur zum Schutz personenbezogener Daten, sondern kann generell zur Datensicherheit für alle Arten von Daten zum Einsatz kommen. Bestimmte Informationsstrukturen und Zusammenhänge bleiben in den tokenisierten Daten erhalten.

Über das Tokenisierungssystem oder extern gesicherte Zuordnungsinformationen der Token zu den ersetzten Daten ist der Vorgang der Tokenisierung wieder umkehrbar. Für Angreifer oder Unbefugte ohne Zugriff auf das Tokenisierungssystem oder die extern gesicherten Tokenisierungsinformationen sind tokenisierte Daten mehr oder weniger nutzlos, da die sensiblen Daten durch für sie bedeutungslose Token ersetzte sind und sich dieser Vorgang für sie nicht umkehren lässt. Tokenisierte Daten lassen sich weiterhin für bestimmte Datenverarbeitungsvorgänge nutzen.

Angewandte Verfahren und Techniken zur Datentokenisierung

Um vertrauliche, personenbezogene oder andere Arten sensibler Daten zu schützen, ersetzt die Tokenisierung diese Daten durch einen zufällig erzeugten Token. Die Zuordnung zwischen Token und ersetzten Daten wird extern in einer Datensammlung oder Datenbank beziehungsweise im verwendeten Tokenisierungssystem gespeichert. Teilweise wird dies als Token-Tresor bezeichnet. Der Token-Tresor ist besonders geschützt. Nur berechtigte Personen oder Anwendungen haben Zugriff auf den Token-Tresor und können die Ursprungsdaten wiederherstellen. Bei einer Datenpanne hat das Token für jemanden ohne Zugriff auf den Token-Tresor keinen sinnvollen Wert. Zwischen dem Token und den ersetzten Daten besteht keine mathematische Beziehung. Der Vorgang der Tokenisierung ist weder über einen Algorithmus noch mithilfe von Schlüsseln umkehrbar. Bezüglich der Länge, des Formats und des Inhalts können Token je nach Datenart, Anwendung und Generierungsverfahren sehr unterschiedlich sein. Typische Generierungsverfahren sind Indexfunktionen oder zufällig erzeugte Zeichenketten.

Weitere Verfahren der Datenverschleierung

Die Tokenisierung ist eines der drei klassischen und am häufigsten genannten Verfahren zur Datenverschleierung (Data Obfuscation). Die beiden anderen Verfahren sind die Datenmaskierung und die Datenverschlüsselung. Allgemein versteht man unter Datenverschleierung den Prozess des Veränderns sensibler, vertraulicher oder persönlicher Daten, um sie vor unbefugtem Zugriff, Auslesen oder vor einer unerwünschten Offenlegung zu schützen. Die Daten werden so verändert oder verfremdet, dass sie, selbst wenn sie von Unbefugten abgefangen oder eingesehen werden, nicht in ihrer Ursprungsbedeutung lesbar oder erkennbar sind.

Bei der Datenmaskierung werden die sensiblen Originaldaten beispielsweise durch fiktive, ähnliche oder zufällig erzeugte Daten ersetzt. Es entsteht eine Art gefälschte Version der Ursprungsdaten. Die maskierten Daten wirken real und haben eine mit den Originaldaten vergleichbare Struktur. Im Gegensatz zur Tokenisierung gibt es aber keine externen Zuordnungsinformationen zwischen den Ursprungsdaten und den maskierten Werten. Der Vorgang der Maskierung ist ohne Zugriff auf die Originaldaten nicht umkehrbar. Die Datenmaskierung kann statisch im Voraus oder dynamisch beim Zugriff auf sensible Daten erfolgen.

Die Datenverschlüsselung verwendet zur Verschleierung der Ursprungsdaten mathematische Verschlüsselungsalgorithmen und digitale Schlüssel. Durch die Kenntnis des angewandten Verschlüsselungsverfahrens und den Besitz der benötigten Schlüssel ist der Vorgang der Datenverschlüsselung wieder umkehrbar. Die Originaldaten lassen sich aus den verschlüsselten Daten wiederherstellen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Im Zusammenhang mit dem Datenschutz von personenbezogenen Daten werden häufig die nicht umkehrbare Datenanonymisierung und die umkehrbare Datenpseudonymisierung genannt. Auch sie lassen sich den Datenverschleierungsverfahren zuordnen und verwenden Techniken wie Maskierung, Tokenisierung oder Verschlüsselung. Die Begriffe der Datenanonymisierung und der Datenpseudonymisierung finden aber in der Regel nur bei der Verschleierung personenbezogener Daten Anwendung, während Datenmaskierung, Datentokenisierung und Datenverschlüsselung allgemeine Datenverschleierungsverfahren sind und für alle Arten von Daten zum Einsatz kommen können.

Typische Anwendungsbereiche der Tokenisierung und Beispiele für tokenisierte Daten

Tokenisierung ist eine Maßnahme der Datensicherheit oder des Datenschutzes. Da bei der Datentokenisierung bestimmte Informationsaspekte und Funktionalitäten der Daten erhalten bleiben, lassen sie sich weiterhin für definierte Datenverarbeitungsvorgänge verwenden, ohne dass sensible Daten offengelegt werden müssen.

Einige typische Anwendungsbereiche der Tokenisierung und Beispiele für tokenisierte Daten sind:

  • Schutz von Daten vor Missbrauch
  • Minimierung des Risikos und der Auswirkungen von Datenpanne
  • Einhaltung von Datenschutzvorgaben wie die der Datenschutz-Grundverordnung (DSGVO)
  • Einhaltung von Compliance-Vorgaben bestimmter Branchen
  • Schutz von geistigem Eigentum
  • externe Zusammenarbeit und Weitergabe von Daten an Dritte für die externe Datenverarbeitung und Datenspeicherung
  • Nutzung von cloudbasierten Services und Anwendungen ohne Offenlegung von sensiblen Daten
  • Verwendung von Daten für die Forschung oder für analytische Zwecke ohne Preisgabe sensibler Informationen
  • Verwendung von Daten für Schulungszwecke oder Präsentationen ohne echte Kunden- oder Geschäftsdaten preiszugeben
  • Beispiele für tokenisierte Daten: Zahlungskartendaten, Kontonummern, Banktransaktionen, Sozialversicherungsnummern, Passnummern, Telefonnummern, E-Mail-Adressen, Strafregistereinträge, Wählerregistrierungen und andere

(ID:50147689)