Definition Incident Management Was ist Incident Management?

Von Dipl.-Ing. (FH) Stefan Luber 5 min Lesedauer

Anbieter zum Thema

Das Incident Management ist ein wichtiger Bestandteil des IT-Service-Managements. Störungen und Zwischenfälle im IT-Betrieb sollen schnell und effektiv identifiziert, dokumentiert und behoben werden, um den Betrieb von IT-Services aufrechtzuerhalten und Auswirkungen für ein Unternehmen zu minimieren.

Incident Management beschäftigt sich mit dem Erkennen und Beheben von Zwischenfällen im IT-Betrieb und ist ein wichtiger Bestandteil des IT-Service-Managements und ITIL-Frameworks,(Bild:  gemeinfrei /  Pixabay)
Incident Management beschäftigt sich mit dem Erkennen und Beheben von Zwischenfällen im IT-Betrieb und ist ein wichtiger Bestandteil des IT-Service-Managements und ITIL-Frameworks,
(Bild: gemeinfrei / Pixabay)

Incident Management lässt sich mit Vorfall- oder Störungsmanagement ins Deutsche übersetzen. Es handelt sich um einen wichtigen Bestandteil und Prozess des IT-Service-Managements (ITSM). Im Rahmen des Incident Managements sollen ungeplante Vorfälle und Störungen des Betriebs von IT-Services effektiv, sicher und schnell erkannt, priorisiert, behoben und dokumentiert werden. Ziel ist es, den Betrieb von IT-Services aufrechtzuerhalten oder schnellstmöglich wiederherzustellen, um die Auswirkungen eines Incidents auf das operative Geschäft eines Unternehmens zu minimieren. Das Incident Management beschäftigt sich mit allen Arten von Störungen oder Vorfällen, von technischer Art bis zu Sicherheitsvorfällen. Die Abläufe und Vorgehensweisen des Incident Managements sind im Vorfeld definiert und klar strukturiert. Sie umfassen sowohl technische als auch organisatorische Maßnahmen und berücksichtigen auch rechtliche Detailfragen. Der für den Prozess des Incident Managements jeweils Verantwortliche wird auch als Incident Manager bezeichnet.

Das Incident Management ist ein wichtiger Bestandteil des ITIL-Frameworks (Information Technology Infrastructure Library). Das ITIL-Framework stellt entsprechende Anleitungen bereit, wie auf Incidents zu reagieren ist. Es existieren zahlreiche Schnittstellen mit anderen ITIL-Prozessen wie dem Event Management, Problem Management, Change Management oder Configuration Management.

Für die Implementierung und Ausführung effektiver Incident-Management-Prozesse in einem Unternehmen kommen in der Regel unterstützende Tools und Softwarelösungen zum Einsatz. Diese sorgen beispielsweise für eine automatische Alarmierung bei Incidents oder ermöglichen deren Nachverfolgung und Dokumentation. Mehr und mehr werden auch Lösungen und Tools mit Künstlicher Intelligenz im Incident Management eingesetzt.

Wie ist ein Incident definiert und was sind typische Beispiele für Incidents?

Der Begriff Incident ist sehr weit gefasst. Das ITIL-Framework definiert einen Incident als eine ungeplante oder drohende Unterbrechung oder Qualitätsminderung eines Service. Allgemein handelt es sich bei einem Incident um ein einzelnes Ereignis, das den Betrieb von internen oder externen Services einer Organisation unterbricht oder einzelne Funktionen des Service stört. Incidents können grundsätzlich unterschiedlich schwere Auswirkungen haben, von leichten Beeinträchtigungen einzelner Servicefunktionen bis zum Komplettausfall eines oder mehrerer Services.

Typische Beispiele für Incidents sind:

  • Störung oder der Ausfall einer Netzwerkverbindung
  • Hardwaredefekt an einem Server
  • Softwarefehler in einer Anwendung
  • Stromausfall
  • Sicherheitsverletzungen
  • Cyberangriff auf ein IT-System
  • Störung eines Zugangssystems
  • Datenbankausfall
  • Benutzerfehler an einem IT-System
  • voll ausgelasteter Speicher
  • Lizenzprobleme

Ziele des Incident Managements

Primäres Ziel des Incident Managements ist es, einen durch einen Vorfall gestörten oder unterbrochenen IT-Service so schnell wie möglich wiederherzustellen und die negativen Auswirkungen eines Incidents für die Geschäftsprozesse eines Unternehmens zu minimieren. Für die Wiederherstellung des IT-Service können auch Workarounds zum Einsatz kommen. Finanzielle oder reputative Schäden für das Unternehmen sollen bestmöglich verhindert werden. Eine entsprechende Dokumentation und Nachbearbeitung des Vorfalls im Rahmen des Incident Managements sorgt für eine bessere Vorbereitung des Unternehmens bei vergleichbaren Vorfällen in der Zukunft und steigert die Servicequalität. Ein weiteres Ziel des Incident Managements ist es, durch Vorfälle drohende Strafen oder Bußgelder zu vermeiden.

Teilbereiche des Incident Managements

Das Incident Management kann in verschiedene Teilbereiche untergliedert werden. So lassen sich beispielsweise die operativen Bestandteile hinsichtlich der Reaktion auf einen Vorfall im sogenannten Incident Response Management zusammenfassen. Das Incident Response Management definiert die Zuständigkeiten und die konkreten Aktionen, wie im Fall eines bestimmten Vorfalls zu reagieren ist. Handelt es sich bei einem Incident um einen sicherheitsrelevanten Vorfall, kann dieser dem Unterbereich des Security Incident Managements zugeordnet werden. Die operativen Bestandteile dieses Unterbereichs lassen sich wiederum im Security Incident Response Management zusammenfassen.

Die verschiedenen Prozessschritte des Incident Managements

Der Prozess des Incident Managements lässt sich in verschiedene, ineinander übergehende Schritte einteilen. Je nach Konzept oder zugrundeliegendem Framework kann sich die Anzahl der Einzelschritte unterscheiden. Im Wesentlichen lässt sich der Incident-Management-Prozess aber in diesen fünf grundlegenden Schritten beschreiben:

1. Identifizieren eines Incidents:

Der erste Prozessschritt befasst sich mit dem Erkennen eines Vorfalls. Werden Anomalien oder ungewöhnliches Verhalten festgestellt, wird geprüft, ob ein Incident vorliegt. Ist ein Incident identifiziert, sind zugehörige Informationen wie eine eindeutige Nummer, Beschreibung des Incidents, Zeitpunkt des Auftretens und zuständiger Incident Manager zu erfassen. Diese Informationen dienen in den weiteren Prozessschritten als Referenz.

2. Kategorisieren des Incidents

Nachdem ein Incident identifiziert und erfasst ist, erfolgt die Kategorisierung des Incidents. Die Hintergründe des Vorfalls werden stichpunktartig beschrieben, um den Vorfall einer Kategorie wie Hardwarefehler oder DoS-Angriff zuzuordnen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

3. Priorisieren des Incidents

Nach der Kategorisierung kann die Priorisierung hinsichtlich der Schwere des Vorfalls und der Auswirkungen auf bestimmte Services erfolgen. Schwerwiegende Vorfälle erhalten eine hohe Priorität und werden im weiteren Prozessablauf bevorzugt behandelt. Incidents mit niedrigerer Priorität können beim Vorliegen schwerwiegender Vorfälle zunächst hintenangestellt werden.

4. Reaktion auf den Incident

Ist ein Vorfall entsprechend priorisiert, kann die Reaktion auf den Vorfall eingeleitet werden. Der Vorfall wird näher analysiert. Daraus ergeben sich die zu ergreifenden Maßnahmen zur Behebung der Störung oder Unterbrechung eines Service. Unter Umständen werden zunächst Workarounds genutzt, um den Betrieb des Service sicherzustellen. Die endgültige Behebung des Vorfalls erfolgt dann in einem nächsten Schritt. Ist kein Workaround oder keine Lösung für einen Incident verfügbar, durchläuft der Vorfall die definierten Eskalationsstufen, bis eine wirkungsvolle Reaktion auf den Vorfall möglich ist.

5. Abschluss und Nachbearbeitung des Incidents

Der Abschluss und die Nachbearbeitung eines Incidents sind der letzte Schritt im Incident-Management-Prozess. Es erfolgt die abschließende Protokollierung des gesamten Incident-Verlaufs. Sämtliche Aktionen und ihre jeweiligen Ergebnisse werden dokumentiert und den am Prozess beteiligten Einheiten bereitgestellt. So lässt sich die Effektivität des Incident Managements nachvollziehen und optimieren. Treten zukünftig ähnliche Vorfälle auf, ist das Unternehmen besser gerüstet. Unter Umständen lässt sich die Wiederholung ähnlicher Vorfälle durch gezielte Vorbereitung und Präventivmaßnahmen sogar gänzlich verhindern.

Incident Management und Künstliche Intelligenz

Im Rahmen des Incident Managements kommen inzwischen vermehrt Verfahren und Methoden der Künstlichen Intelligenz und des Maschinellen Lernens zum Einsatz, um einzelne Aufgaben, Tätigkeiten oder Prozesse zu automatisieren. In der Regel wird KI mit menschlichem Fachwissen und manuellen Abläufen kombiniert, um bestmögliche Ergebnisse zu erzielen. Beispielsweise lässt sich KI zur Identifizierung und Kategorisierung von Vorfällen oder bei der Analyse, Ursachensuche und Behebung von Incidents nutzen. Auf Basis der Analysen können intelligente Systeme entsprechende Maßnahmen zur Behebung vorschlagen und teilweise auch einleiten oder selbst ergreifen. Das reduziert den manuellen Aufwand, entlastet Fachabteilungen, beschleunigt Diagnose- und Fehlerbehebungsprozesse und sorgt für eine schnellere, automatisierte Wiederherstellung betroffener Services.

Vorteile durch ein effektives Incident Management

Die Implementierung eines wirkungsvollen Incident Managements ist mit vielen Vorteilen verbunden. Zu diesen Vorteilen zählen:

  • schnellere Behebung von Vorfällen und Verkürzung von Ausfall- oder Störzeiten
  • Minimierung der Beeinträchtigung des Geschäftsbetriebs
  • höhere Servicequalität und Produktivität
  • Vermeidung ähnlicher Vorfälle in der Zukunft
  • höhere Transparenz in der Erkennung, Bearbeitung und Behebung von Vorfällen
  • Unterstützung bei der Einhaltung von Service Level Agreements (SLAs)
  • bessere Mitarbeiter- und Kundenerfahrung
  • höhere Mitarbeiter- und Kundenzufriedenheit
  • Entlastung der Servicedesk-Mitarbeiter

(ID:50185572)