Data Lineage macht Datenflüsse im KI-Zeitalter sichtbar

Data Lineage macht sichtbar, wohin Daten wirklich fließen Wer Datenflüsse nicht versteht, verliert im KI-Zeitalter die Kontrolle

05.06.2026 Ein Gastbeitrag von Steve Riley 4 min Lesedauer

Anbieter zum Thema

Netskope Germany GmbH

fsas-afc-horizontal-2-positive-rgb-nov24 (Fsas)

Fujitsu Technology Solutions GmbH

FAST LTA GmbH

FTAPI Software GmbH

Sicherheitsteams erkennen Datenlecks, können aber selten rekonstruieren, woher betroffene Daten stammen und welchen Weg sie genommen haben. Data Lineage liefert die fehlende Nachverfolgbarkeit und wird mit dem Vormarsch autonomer KI-Agenten zur operativen Notwendigkeit.a

Data Lineage macht sichtbar, wohin Daten wirklich fließen. Mit dem Vormarsch autonomer KI-Agenten wird Nachverfolgbarkeit zur operativen Notwendigkeit für Sicherheitsteams.(Bild: © Natalia - stock.adobe.com) — Data Lineage macht sichtbar, wohin Daten wirklich fließen. Mit dem Vormarsch autonomer KI-Agenten wird Nachverfolgbarkeit zur operativen Notwendigkeit für Sicherheitsteams.
(Bild: © Natalia - stock.adobe.com)

Montagmorgen, Security Operations Center: Ein Alarm meldet verdächtige Datenbewegungen. Dateien aus einem vertraulichen Speicher fließen auf ein privates Cloud-Konto. Ein Analyst stoppt den Transfer – doch einige Dateien haben das Unternehmen bereits verlassen. Was bleibt, sind offene Fragen: Welche Dateien? Von wem wurden sie erstellt? Über welche Stationen wurden sie weitergeleitet? Und warum ausgerechnet diese Daten?

Solche Szenarien sind Alltag. Laut dem IBM Cost of a Data Breach Report 2024 vergehen im Schnitt 292 Tage, bis Sicherheitsvorfälle mit gestohlenen Zugangsdaten erkannt und eingedämmt werden. 40 Prozent aller Datenlecks betreffen Daten, die über mehrere Umgebungen verteilt gespeichert sind. Selbst mit KI-gestützten Sicherheitstools gelingt es selten, eine lückenlose Nachverfolgungskette zu rekonstruieren. Ohne diese Informationen lassen sich Vorfälle jedoch kaum aufarbeiten, Richtlinien schwerlich optimieren und künftige Risiken nur bedingt minimieren.

Ein blauer Abwehr-Agent und ein roter Angreifer-Agent stehen sich im autonomen Dauerduell gegenüber. Ob ein Netzwerk-Agent verteidigt oder angreift, entscheiden allein Reward und Einsatzkonzept. (Bild: Gemini / KI-generiert)

Türen überwachen reicht nicht mehr

Klassische Sicherheitskontrollen setzen an den Zugangspunkten an – den digitalen Türen eines Unternehmens. Das Problem: In modernen IT-Landschaften entstehen ständig neue Zugangspunkte. Cloud-Migrationen, SaaS-Anwendungen und Remote-Arbeit vervielfachen die Angriffsfläche schneller als Sicherheitsteams reagieren können. In großen Unternehmen sind heute Hunderte Cloud-Dienste im Einsatz – viele davon ohne Wissen oder Genehmigung der IT-Abteilung.

Berechtigungsbasierte Zugriffskontrollen existieren seit Jahrzehnten. Doch ihre Komplexität und mangelnde Interoperabilität zwischen Systemen begrenzen den praktischen Nutzen. Statt weitere Kontrollen an die Türen zu schrauben, braucht es einen grundlegenden Perspektivwechsel: weg von der Absicherung der Zugangspunkte hin zum Schutz der Daten selbst.

Was Data Lineage konkret leistet

Data Lineage verfolgt den Weg eines Datenobjekts von seiner Erstellung bis zum aktuellen Speicherort. Jede Aktion und jeder Akteur wird dokumentiert – inklusive Zeitstempel, Dateityp und Kontext der Veränderung. Selbst ein „Speichern unter“, das normalerweise historische Metadaten aus Kopien entfernt, unterbricht die Herkunftsaufzeichnung nicht. Das Ergebnis ist ein unveränderlicher Prüfpfad, der normale Datenflüsse sichtbar macht – und Abweichungen sofort erkennen lässt.

Ein Praxisbeispiel verdeutlicht den Unterschied: Ein Mitarbeiter lädt eine Kundenliste aus einem CRM-System herunter, leitet sie per E-Mail an einen Kollegen weiter. Dieser formatiert die Daten um und lädt sie auf ein privates Cloud-Konto hoch. Ohne Lineage sind das drei isolierte, nicht zusammenhängende Ereignisse in drei verschiedenen Logquellen. Mit Lineage bleiben Akteure und Aktionen über alle Format- und Systemwechsel hinweg mit den Daten verknüpft, sodass ein durchgängiges Herkunftsdiagramm entsteht.

Dieses Diagramm – eine visuelle Darstellung des gesamten Datenlebenszyklus – verkürzt die Zeit bis zur Ursachenaufklärung erheblich. Gleichzeitig lassen sich Richtlinien definieren, die unbefugte Datenströme automatisch unterbinden. Auch wenn Angreifer Dateinamen oder Formate ändern, bleibt die Herkunftssignatur erhalten.

KI-Agenten sind weder klassische Nutzer noch Service Accounts. Unternehmen brauchen eine neue Identitätskategorie mit dynamischer Governance für autonome Agenten. (Bild: © sdecoret - stock.adobe.com)

Millionen Agenten, null Nachverfolgbarkeit

Die Relevanz von Data Lineage steigt mit dem Vormarsch autonomer KI-Agenten dramatisch an. Wo heute 10.000 Mitarbeitende Daten bewegen, werden bald Millionen Software-Agenten eigenständig auf Ressourcen zugreifen, Daten verarbeiten und weiterleiten. Jeder dieser Agenten braucht eine nachverfolgbare Identität und jede seiner Aktionen einen dokumentierten Kontext.

Für Sicherheitsverantwortliche bedeutet das: Bestehende Identity-Governance-Systeme müssen um nicht-menschliche Identitäten erweitert werden. Jeder Agent braucht ein eigenes Berechtigungsprofil innerhalb der IAM-Architektur. Ohne Lineage fehlt die Grundlage, um zu unterscheiden, ob ein Agent im Rahmen seiner Berechtigung handelt oder ob eine kompromittierte Agenten-Identität Daten abfließen lässt.

Hinzu kommt regulatorischer Druck. Ob EU AI Act, NIS2 oder branchenspezifische Vorgaben: Aufsichtsbehörden verlangen zunehmend, dass Unternehmen nachweisen können, welche Daten wohin fließen und wer darauf zugegriffen hat. Lineage liefert genau die Nachweise, die Auditoren und Regulierer einfordern – unabhängig davon, ob ein Mensch oder ein Agent die Daten bewegt hat.

Isolierte Tools liefern halbe Antworten

Ein eigenständiges Lineage-Tool allein entfaltet wenig Wirkung. Wenn Herkunftsinformationen isoliert vorliegen und keinen Einfluss auf die Richtlinien nehmen, die den Datenfluss steuern, bleibt der Mehrwert theoretisch. Erst die Integration in eine übergreifende Sicherheitsarchitektur macht Data Lineage operativ wirksam.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Daten fließen heute durch private Anwendungen, genehmigte und nicht genehmigte SaaS-Dienste, verwaltete und private Endgeräte. Sicherheitsteams brauchen Architekturen, die all diese Datenströme überprüfen, Objekte klassifizieren und Akteure nachverfolgen. Nur so lässt sich sicherstellen, dass die richtigen Personen zum richtigen Zeitpunkt aus den richtigen Gründen auf die richtigen Ressourcen zugreifen.

Manipulierte Trainings- und Eingabedaten gehören zu den zentralen Angriffsflächen agentischer Künstlicher Intelligenz: Data Poisoning und Prompt Injection setzen dort an, wo KI Entscheidungen ableitet und Aktionen auslöst. (Bild: © Xchip - stock.adobe.com)

Was Sicherheitsteams jetzt tun sollten

Schutz an die Daten knüpfen, nicht an die Türen. Richtlinien direkt an Dateien und Datenobjekte binden, sodass der Schutz die Daten begleitet – über jeden Kanal und jedes Gerät hinweg.

Lineage in DLP-Regeln einbinden. Herkunftsinformationen als zusätzliches Signal in bestehende Datenflussrichtlinien aufnehmen. Ohne Anbindung an die Richtlinien-Engine bleibt Lineage ein reines Reporting-Tool.

Herkunftsdiagramme in die Vorfallsanalyse integrieren. Das Lineage-Diagramm zeigt den gesamten Lebenszyklus eines Datenobjekts und trennt genehmigte Datenflüsse von unbefugten Bewegungen – ein entscheidendes Werkzeug im Insider-Risk-Management.

Nicht-menschliche Identitäten nachverfolgbar machen. Jeder KI-Agent braucht eine eigene Identität im IAM-System. Lineage dokumentiert, welcher Akteur welche Aktion ausgeführt hat – ob Mensch oder Maschine.

Lineage als Compliance-Nachweis nutzen. Herkunftsdaten liefern die Evidenz, die Auditoren und Aufsichtsbehörden einfordern. Wer Datenflüsse lückenlos dokumentiert, erfüllt regulatorische Anforderungen und stärkt das Vertrauen von Kunden.

Wer seine Daten versteht, beherrscht das Risiko

Daten verhalten sich wie Luft: Sie breiten sich aus, füllen jeden verfügbaren Raum und finden jeden undichten Punkt. Anders als Luft tragen Daten jedoch eine Geschichte in sich – eine Geschichte aus Akteuren, Aktionen und Zeitpunkten. Wer diese Geschichte sichtbar macht, gewinnt nicht nur Kontrolle über Datenbewegungen – sondern die Grundlage für fundierte Sicherheitsentscheidungen in einer zunehmend agentischen Welt.

Über den Autor: Steve Riley ist VP und Field CTO bei Netskope und verfügt über 25 Jahre Branchenerfahrung mit Fokus auf Cloud- und Cybersicherheit. Seine Arbeit umfasst die Gestaltung langfristiger Technologiestrategien sowie die Beratung von Führungskräften und Kunden. Zuvor war er unter anderem in leitenden Security-Positionen bei Microsoft und Amazon Web Services tätig.

Agentenbasierte KI führt im SOC eigenständig Aktionen aus, daher begrenzen klare Governance mit PAM und Zero Trust, Least‑Privilege und kurzlebigen Berechtigungen sowie Freigaben durch Menschen die Risiken. (Bild: © Gorodenkoff - stock.adobe.com)

(ID:50863850)