Data Lineage macht sichtbar, wohin Daten wirklich fließen Wer Datenflüsse nicht versteht, verliert im KI-Zeitalter die Kontrolle

Ein Gastbeitrag von Steve Riley 4 min Lesedauer

Anbieter zum Thema

Sicherheitsteams erkennen Datenlecks, können aber selten rekonstruieren, woher betroffene Daten stammen und welchen Weg sie genommen haben. Data Lineage liefert die fehlende Nachverfolgbarkeit und wird mit dem Vormarsch autonomer KI-Agenten zur operativen Notwendigkeit.a

Data Lineage macht sichtbar, wohin Daten wirklich fließen. Mit dem Vormarsch autonomer KI-Agenten wird Nachverfolgbarkeit zur operativen Notwendigkeit für Sicherheitsteams.(Bild: ©  Natalia - stock.adobe.com)
Data Lineage macht sichtbar, wohin Daten wirklich fließen. Mit dem Vormarsch autonomer KI-Agenten wird Nachverfolgbarkeit zur operativen Notwendigkeit für Sicherheitsteams.
(Bild: © Natalia - stock.adobe.com)

Montagmorgen, Security Operations Center: Ein Alarm meldet verdächtige Datenbewegungen. Dateien aus einem vertraulichen Speicher fließen auf ein privates Cloud-Konto. Ein Analyst stoppt den Transfer – doch einige Dateien haben das Unternehmen bereits verlassen. Was bleibt, sind offene Fragen: Welche Dateien? Von wem wurden sie erstellt? Über welche Stationen wurden sie weitergeleitet? Und warum ausgerechnet diese Daten?

Solche Szenarien sind Alltag. Laut dem IBM Cost of a Data Breach Report 2024 vergehen im Schnitt 292 Tage, bis Sicherheitsvorfälle mit gestohlenen Zugangsdaten erkannt und eingedämmt werden. 40 Prozent aller Datenlecks betreffen Daten, die über mehrere Umgebungen verteilt gespeichert sind. Selbst mit KI-gestützten Sicherheitstools gelingt es selten, eine lückenlose Nachverfolgungskette zu rekonstruieren. Ohne diese Informationen lassen sich Vorfälle jedoch kaum aufarbeiten, Richtlinien schwerlich optimieren und künftige Risiken nur bedingt minimieren.

Türen überwachen reicht nicht mehr

Klassische Sicherheitskontrollen setzen an den Zugangspunkten an – den digitalen Türen eines Unternehmens. Das Problem: In modernen IT-Landschaften entstehen ständig neue Zugangspunkte. Cloud-Migrationen, SaaS-Anwendungen und Remote-Arbeit vervielfachen die Angriffsfläche schneller als Sicherheitsteams reagieren können. In großen Unternehmen sind heute Hunderte Cloud-Dienste im Einsatz – viele davon ohne Wissen oder Genehmigung der IT-Abteilung.

Berechtigungsbasierte Zugriffskontrollen existieren seit Jahrzehnten. Doch ihre Komplexität und mangelnde Interoperabilität zwischen Systemen begrenzen den praktischen Nutzen. Statt weitere Kontrollen an die Türen zu schrauben, braucht es einen grundlegenden Perspektivwechsel: weg von der Absicherung der Zugangspunkte hin zum Schutz der Daten selbst.

Was Data Lineage konkret leistet

Data Lineage verfolgt den Weg eines Datenobjekts von seiner Erstellung bis zum aktuellen Speicherort. Jede Aktion und jeder Akteur wird dokumentiert – inklusive Zeitstempel, Dateityp und Kontext der Veränderung. Selbst ein „Speichern unter“, das normalerweise historische Metadaten aus Kopien entfernt, unterbricht die Herkunftsaufzeichnung nicht. Das Ergebnis ist ein unveränderlicher Prüfpfad, der normale Datenflüsse sichtbar macht – und Abweichungen sofort erkennen lässt.

Ein Praxisbeispiel verdeutlicht den Unterschied: Ein Mitarbeiter lädt eine Kundenliste aus einem CRM-System herunter, leitet sie per E-Mail an einen Kollegen weiter. Dieser formatiert die Daten um und lädt sie auf ein privates Cloud-Konto hoch. Ohne Lineage sind das drei isolierte, nicht zusammenhängende Ereignisse in drei verschiedenen Logquellen. Mit Lineage bleiben Akteure und Aktionen über alle Format- und Systemwechsel hinweg mit den Daten verknüpft, sodass ein durchgängiges Herkunftsdiagramm entsteht.

Dieses Diagramm – eine visuelle Darstellung des gesamten Datenlebenszyklus – verkürzt die Zeit bis zur Ursachenaufklärung erheblich. Gleichzeitig lassen sich Richtlinien definieren, die unbefugte Datenströme automatisch unterbinden. Auch wenn Angreifer Dateinamen oder Formate ändern, bleibt die Herkunftssignatur erhalten.

Millionen Agenten, null Nachverfolgbarkeit

Die Relevanz von Data Lineage steigt mit dem Vormarsch autonomer KI-Agenten dramatisch an. Wo heute 10.000 Mitarbeitende Daten bewegen, werden bald Millionen Software-Agenten eigenständig auf Ressourcen zugreifen, Daten verarbeiten und weiterleiten. Jeder dieser Agenten braucht eine nachverfolgbare Identität und jede seiner Aktionen einen dokumentierten Kontext.

Für Sicherheitsverantwortliche bedeutet das: Bestehende Identity-Governance-Systeme müssen um nicht-menschliche Identitäten erweitert werden. Jeder Agent braucht ein eigenes Berechtigungsprofil innerhalb der IAM-Architektur. Ohne Lineage fehlt die Grundlage, um zu unterscheiden, ob ein Agent im Rahmen seiner Berechtigung handelt oder ob eine kompromittierte Agenten-Identität Daten abfließen lässt.

Hinzu kommt regulatorischer Druck. Ob EU AI Act, NIS2 oder branchenspezifische Vorgaben: Aufsichtsbehörden verlangen zunehmend, dass Unternehmen nachweisen können, welche Daten wohin fließen und wer darauf zugegriffen hat. Lineage liefert genau die Nachweise, die Auditoren und Regulierer einfordern – unabhängig davon, ob ein Mensch oder ein Agent die Daten bewegt hat.

Isolierte Tools liefern halbe Antworten

Ein eigenständiges Lineage-Tool allein entfaltet wenig Wirkung. Wenn Herkunftsinformationen isoliert vorliegen und keinen Einfluss auf die Richtlinien nehmen, die den Datenfluss steuern, bleibt der Mehrwert theoretisch. Erst die Integration in eine übergreifende Sicherheitsarchitektur macht Data Lineage operativ wirksam.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Daten fließen heute durch private Anwendungen, genehmigte und nicht genehmigte SaaS-Dienste, verwaltete und private Endgeräte. Sicherheitsteams brauchen Architekturen, die all diese Datenströme überprüfen, Objekte klassifizieren und Akteure nachverfolgen. Nur so lässt sich sicherstellen, dass die richtigen Personen zum richtigen Zeitpunkt aus den richtigen Gründen auf die richtigen Ressourcen zugreifen.

Was Sicherheitsteams jetzt tun sollten

  • Schutz an die Daten knüpfen, nicht an die Türen. Richtlinien direkt an Dateien und Datenobjekte binden, sodass der Schutz die Daten begleitet – über jeden Kanal und jedes Gerät hinweg.
  • Lineage in DLP-Regeln einbinden. Herkunftsinformationen als zusätzliches Signal in bestehende Datenflussrichtlinien aufnehmen. Ohne Anbindung an die Richtlinien-Engine bleibt Lineage ein reines Reporting-Tool.
  • Herkunftsdiagramme in die Vorfallsanalyse integrieren. Das Lineage-Diagramm zeigt den gesamten Lebenszyklus eines Datenobjekts und trennt genehmigte Datenflüsse von unbefugten Bewegungen – ein entscheidendes Werkzeug im Insider-Risk-Management.
  • Nicht-menschliche Identitäten nachverfolgbar machen. Jeder KI-Agent braucht eine eigene Identität im IAM-System. Lineage dokumentiert, welcher Akteur welche Aktion ausgeführt hat – ob Mensch oder Maschine.
  • Lineage als Compliance-Nachweis nutzen. Herkunftsdaten liefern die Evidenz, die Auditoren und Aufsichtsbehörden einfordern. Wer Datenflüsse lückenlos dokumentiert, erfüllt regulatorische Anforderungen und stärkt das Vertrauen von Kunden.

Wer seine Daten versteht, beherrscht das Risiko

Daten verhalten sich wie Luft: Sie breiten sich aus, füllen jeden verfügbaren Raum und finden jeden undichten Punkt. Anders als Luft tragen Daten jedoch eine Geschichte in sich – eine Geschichte aus Akteuren, Aktionen und Zeitpunkten. Wer diese Geschichte sichtbar macht, gewinnt nicht nur Kontrolle über Datenbewegungen – sondern die Grundlage für fundierte Sicherheitsentscheidungen in einer zunehmend agentischen Welt.

Über den Autor: Steve Riley ist VP und Field CTO bei Netskope und verfügt über 25 Jahre Branchenerfahrung mit Fokus auf Cloud- und Cybersicherheit. Seine Arbeit umfasst die Gestaltung langfristiger Technologiestrategien sowie die Beratung von Führungskräften und Kunden. Zuvor war er unter anderem in leitenden Security-Positionen bei Microsoft und Amazon Web Services tätig.

(ID:50863850)