Netzverteidigung durch Reinforcement Learning neu denken
Autonome Netzwerk-Agenten lernen Verteidigung und Angriff

Von Rolf Schulz 6 min Lesedauer

Klassische Security-Stacks folgen festen Regeln, doch Angreifer ändern ihre Taktiken schneller als Teams nachziehen können. Reinforcement Learning setzt hier an: Autonome Netzwerk-Agenten lernen durch Versuch und Irr­tum, welche Verteidigungsstrategien wirken. Dieselbe Technologie funk­ti­o­niert aber auch offensiv, was ANA zu einem ambivalenten Werkzeug macht.

Ein blauer Abwehr-Agent und ein roter Angreifer-Agent stehen sich im autonomen Dauerduell gegenüber. Ob ein Netzwerk-Agent verteidigt oder angreift, entscheiden allein Reward und Einsatzkonzept.(Bild:  Gemini / KI-generiert)
Ein blauer Abwehr-Agent und ein roter Angreifer-Agent stehen sich im autonomen Dauerduell gegenüber. Ob ein Netzwerk-Agent verteidigt oder angreift, entscheiden allein Reward und Einsatzkonzept.
(Bild: Gemini / KI-generiert)

In klassischen Security-Stacks ist die Rollenverteilung klar: IDS/IPS, SIEM, NDR, Firewalls und SOAR-Playbooks folgen festen Regeln. Das Problem: Angreifer ändern ihre Taktiken schneller, als Teams Regeln nachziehen können. Genau hier setzt Reinforcement Learning (RL) an. Ein RL-Agent lernt nicht jede If-Then-Regel einzeln, sondern durch Versuch und Irrtum, welche Verteidigungsstrategien langfristig Schaden minimieren. Er beobachtet den Netzzustand, probiert Aktionen (Quarantäne, Segmentierung, Traffic-Umlenkung) und wird je nach Effekt „belohnt“ oder „bestraft“. Was in Spielen und Robotik funk­ti­o­niert, hält jetzt Einzug in Sicherheitsumgebungen.