Autonome KI-Agenten arbeiten schon heute in Produktivumgebungen mit Datenbankzugriff, API-Schlüsseln und Systemberechtigungen. Doch ihre Absicherung basiert auf denselben softwarebasierten Guardrails, die schon 2023 bei ChatGPT-Jailbreaks versagt haben. Nur ist das Risiko diesmal ungleich größer. Es wird Zeit, dass die IT-Branche aus ihren alten, kostspieligen Fehlern lernt.
Autonome KI-Agenten arbeiten mit weitreichenden Systemberechtigungen. Ein Schutz durch rein softwarebasierte Guardrails reicht nicht aus, um Angriffe mit Maschinengeschwindigkeit zu stoppen.
Wenn Filtermechanismen versagen und eine böswillige Manipulation der KI durchlassen, bleibt menschlichen Nutzern keine Zeit mehr zum Eingreifen. Der autonome Agent führt die eingeschleusten Angriffsbefehle direkt und mit Maschinengeschwindigkeit aus. Die Dimension dieses Risikos zeigte sich deutlich, als Anthropic im November 2024 das Model Context Protocol (MCP) veröffentlichte, das KI-Agenten die standardisierte Verbindung mit Datenbanken, Dateisystemen und Unternehmensanwendungen ermöglicht.
Acht Monate klingt rasant, vor allem im Vergleich mit der Einführung früherer Technologien. Doch das Muster ist altbekannt. Wir beobachten dieselbe Entwicklung nur im Zeitraffer: schnell implementieren, Schwachstellen entdecken, hektisch patchen. Die Frage ist, ob die Branche aus drei Jahrzehnten vergangener Sicherheitsverletzungen lernen kann, bevor autonome Agenten einen schwerwiegenden Sicherheitsvorfall verursachen.
Software kann Software nicht perfekt absichern
Bei technologischen Innovationen stehen meist die schnelle Bereitstellung und ein schlankes Design im Vordergrund. Sicherheitslücken werden geschlossen, wenn sie auftreten. Diese Strategie hat der Industrie unglaubliche Agilität verliehen. Sie hat uns gleichzeitig aber auch eine ununterbrochene Kette von Cyberrisiken und Angriffen beschert. Der Zyklus wiederholt sich in jeder Sicherheitsdomäne identisch.
Netzwerksicherheitsansätze etwa nutzten in den 1990er- und 2000er-Jahren Software-Firewalls zum Schutz der Perimeter. Angreifer kompromittierten die Firewalls durch Software-Exploits. Die Antwort der Hersteller darauf war, weitere Softwareschichten hinzuzufügen – darunter Angriffserkennung, Intrusion-Prevention-Systeme sowie Lösungen für das Security Information and Event Management (SIEM). Die Cybervorfälle setzten sich dennoch fort, bis Unternehmen schließlich hardwarebasierte Netzwerksegmentierung und dedizierte Sicherheits-Appliances implementierten.
Die Endpunktsicherheitsstrategien der 2000er- und 2010er-Jahre setzten vor allem auf signaturbasierte Antivirensoftware. Aber Cyberkriminelle entwickelten ihre Malware immer weiter, um die Erkennungsmechanismen zu umgehen. Die Reaktion der Sicherheitsbranche bestand darin, Verhaltensanalysen, Sandboxing und Endpoint Detection and Response hinzuzufügen – allesamt weitere Softwareschichten. Erst TPM-Chips und hardwaregestütztes Secure Boot als Standard stärkten die Endpoint-Sicherheit merklich.
Und auch beim Thema Cloud-Sicherheit in den 2010er- und 2020er-Jahren ließ sich dieser Zyklus beobachten. Trotz softwarebasierter Hypervisor-Isolation gelangen Akteuren VM-Escapes und Container-Breakout-Angriffe. Weitere Softwaremaßnahmen wie Kubernetes-Richtlinien, Service-Mesh-Architekturen und Zero-Trust-Frameworks konnten die Sicherheitslücken nicht beseitigen, bis Hardware-Enklaven wie Intel SGX und AMD SEV eine Isolierung auf Chip-Ebene ermöglichten.
Der gemeinsame Nenner: Software-Sicherheitsgrenzen werden immer wieder kompromittiert. Hardware – also die Ebene, auf der die Daten tatsächlich gespeichert sind – bleibt verwundbar, bis die Branche entsprechende Schutzmaßnahmen entwickelt. Mit jeder neuen Technologie beginnt der Kreislauf von vorn. Jetzt führen viele Unternehmen KI-Agenten mit Systemzugang ein, abermals geschützt durch Software-Leitplanken.
KI-Agenten stellen einen grundlegenden architektonischen Wandel dar. Schon ein einzelner Agent mit autonomen Rechten kann ohne menschliche Kontrolle infrastrukturweite Schäden verursachen. Damit verändert sich das Bedrohungsmodell grundlegend. Wenn es keinen menschlichen Kontrollpunkt zwischen Entscheidung und Ausführung gibt, drohen im schlimmsten Fall autonome Datenexfiltration und Systemkompromittierung, und das über mehrere Umgebungen hinweg.
Leider folgen die derzeitigen Bemühungen, KI-Agenten abzusichern, dem etablierten Muster, dem Problem vor allem mit zusätzlicher Software zu begegnen. So bieten die NVIDIA NeMo Guardrails programmierbare Leitplanken für Agenten. Anthropics Constitutional AI implementiert eine wertorientierte Filterung; OpenAI bietet Moderationsendpunkte zur Inhaltskontrolle. Diese Tools zielen darauf ab, bösartige Anweisungen von vornherein von Agenten fernzuhalten. Doch es handelt sich dabei um heuristische Systeme, die auf Mustern basieren, nicht um Sicherheitsgarantien.
Andere Projekte konzentrieren sich auf die Themen Berechtigung und Überwachung. Das A2AS-Konsortium entwickelt Autorisierungsstandards für den Agentenzugriff. Unternehmen implementieren API-Ratenbegrenzung, Verhaltensanalysen und MCP-Server-Authentifizierungsprotokolle mit dem Ziel, zu begrenzen, worauf kompromittierte Agenten zugreifen können. Die Herausforderung ist, dass Agenten umfangreiche Berechtigungen benötigen, um überhaupt nützlich zu sein, und dass kompromittierte Agenten ihren legitimen Zugang missbrauchen können. Verhaltensüberwachung erkennt Anomalien zudem erst nach ihrem Auftreten.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Beide Maßnahmen – also Leitplanken und beschränkte Berechtigungen – sind notwendig, doch beide operieren innerhalb der Software-Zone. Echte und tiefgehende Verteidigung erfordert ein drittes Sicherheitslevel, das die Hardware-Ebene überwacht, also dort wirkt, wo Daten physisch gespeichert sind.
Die letzten 30 Jahre haben immer wieder bewiesen, dass ein rein softwarebasierter Ansatz für die Cybersicherheit zwar schnell und leichtgewichtig, aber letztlich unzureichend ist. Wenn Sicherheitsverletzungen trotz Softwareschutzmaßnahmen an der Tagesordnung bleiben, dann ist die Lösung nicht, mehr Software einzuführen, sondern die Sicherheit schon auf Hardware-Ebene zu verankern.
Für Unternehmen bedeutet das, in den Aufbau eines ganzheitlichen Sicherheitskonzepts zu investieren, das starke Hardware-Sicherheitsmaßnahmen in Kombination mit speziell entwickelten Softwarelösungen nutzt. Es sind bereits intelligente hardwarebasierte Lösungen im Markt erhältlich, die zusammen mit Software-Sicherheitsvorkehrungen eingesetzt werden können, um die KI-Sicherheit zu verbessern.
Bei der Geschwindigkeit, mit der agentische KI eingeführt wird, hat die Branche jetzt keine Zeit mehr zu verlieren. Agenten haben bereits Zugang zu Kundendaten, Finanzsystemen und kritischen Infrastrukturen. Der potenzielle Schadensradius ist also beträchtlich. Die Frage ist, ob es erst einen bedeutenden Sicherheitsvorfall geben muss, bevor Unternehmen und Hersteller die Risiken einer reinen Softwareverteidigung für autonome KI-Systeme erkennen.
Über die Autorin: Camellia Chan ist CEO und Mitbegründerin von X-PHY Inc., einem Pionier im Bereich der hardwarebasierten Cybersicherheit. Sie leitet die Mission des Unternehmens, KI-gestützte Schutzmaßnahmen in die physische Ebene einzubetten und so proaktive, autonome Sicherheit zu ermöglichen. Mit über 40 Patenten setzt sie sich für Innovation und Inklusion in der Cyberabwehr ein.