Wichtige Schwellenwerte des Risk Managements Optimierung der Geschäftskontinuität mit RPO, RTO und MTD

Von Dipl. Betriebswirt Otto Geißler 4 min Lesedauer

Anbieter zum Thema

Für eine optimierte Wiederherstellung von Daten im Notfall sind Leistungsziele festzulegen. Was müssen CISOs über maximal tolerierbare Ausfallzeiten (MTD), Wiederherstellungspunkte (RPO) und Wiederherstellungszeiten (RTO) wissen?

RPO, RTO und MTD fungieren für eine Organisation als wichtige Schwellenwerte zur Modellierung von Aktivitäten der Datensicherheit, Notfallwiederherstellung und Geschäftskontinuität.(Bild:  Artur - stock.adobe.com)
RPO, RTO und MTD fungieren für eine Organisation als wichtige Schwellenwerte zur Modellierung von Aktivitäten der Datensicherheit, Notfallwiederherstellung und Geschäftskontinuität.
(Bild: Artur - stock.adobe.com)

Nach einem System-Ausfall oder einer Hacker-Attacke stehen die Verfügbarkeit von IT-Systemen und die Wiederherstellbarkeit von Daten im Vordergrund. Dabei kommen unter anderem die Instrumente Recovery Point Objective (RPO), Recovery Time Objective (RTO) und Maximum Tolerable Downtime (MTD) ins Spiel.

Da die oberste Führungsebene für den erfolgreichen Betrieb jeder Organisation verantwortlich ist, sollte sie zu diesen Instrumenten in Absprache mit der IT-Abteilung unbedingt sinnvolle Leistungsziele beziffern. Vorausschauende Unternehmensleiter sind sich über die Funktionsweise und Bedeutung dieser Instrumente für alle wichtigen Systeme und Prozesse als Teil einer Risk Management-Strategie im Klaren.

Schwellenwerte des Risk Managements

Ohne klare Entscheidungen und Vorgaben seitens des Managements lassen sich diese Instrumente für eine zielführende Zweckerfüllung nur bedingt konzipieren. Wobei das Management die dafür notwendigen technischen Anforderungen oder Systemspezifikationen natürlich nicht detailliert verstehen muss. RPO, RTO und MTD fungieren für eine Organisation als wichtige Schwellenwerte zur Modellierung von Aktivitäten der Datensicherheit, Notfallwiederherstellung und Geschäftskontinuität.

Im Rahmen eines solchen Sicherheitsprogramms implementieren CISOs insbesondere Konfigurationen der Hochverfügbarkeit, um sicherzustellen, dass die IT-Systeme auch bei routinemäßigen Problemstellungen bzw. möglichen Geräteausfällen innerhalb der vorgegebenen Grenzwerte arbeitsfähig bleibt.

Im Falle eines Problems, das die Möglichkeiten dieses Hochverfügbarkeitsdesigns sprengt, befasst sich die Disaster-Recovery-Planung mit dem Austausch von Geräten bzw. der Wiederherstellung von Daten aus Backups, um die Unterstützung für kritische Geschäftsfunktionen innerhalb dieser Schwellenwerte wiederherzustellen.

Wiederherstellungspunktziel (RPO)

Bei den sogenannten Wiederherstellungspunktzielen (Recovery Point Objective / RPO) geht es um die Datenverlusttoleranz. Das bedeutet, RPO ist der Schwellenwert, der in der Geschäftskontinuität verwendet wird, um den maximal angestrebten Zeitraum zu identifizieren, in dem Daten verloren gehen können, ohne die Wiederherstellung des Betriebs erheblich zu beeinträchtigen.

Wenn ein Geschäftsprozess beispielsweise nicht mehr als einen Tag an Daten verlieren dürfte, würde der RPO für diese Informationen 24 Stunden betragen. RPO ist sehr nützlich, um die Häufigkeit von Backups für ein bestimmtes System zu bestimmen. Der Wiederherstellungspunkt wird auf der Grundlage von folgenden Fragestellungen abgeleitet:

  • Wie oft werden Daten aktualisiert?
  • Wie viel Aufwand wäre für den Anwender erforderlich, um nach Möglichkeit die seit der letzten Sicherung erstellten oder aktualisierten Daten zu rekonstruieren?
  • Wenn eine Wiederherstellung nicht möglich wäre, wie viele aktuelle Daten kann das Unternehmen unter Berücksichtigung der Wahrscheinlichkeit eines katastrophalen Datenverlusts dauerhaft verlieren?

Wenn ein Backup-System ein RPO nicht einhalten kann, muss nicht zwingend mehr Backup-Ausrüstung oder eine schnellere Internetverbindung im Falle von Remote-Backups erworben werden. Es bieten sich auch andere Techniken an, wie etwa die Segmentierung von Daten, die häufig eine dauerhaftere Lösung darstellen als die schrittweise Erhöhung der Kapazität des Backup-Systems. Vielfach ist es nicht möglich, jede Nacht alles zu sichern. Wenn der Anwender jedoch Daten, für die möglicherweise kein täglicher RPO erforderlich ist, von den anderen Daten trennt, kann er beispielsweise einen täglichen RPO erfüllen.

Wiederherstellungszeitziel (RTO)

Der Schwellenwert RTO (Recovery Time Objective) definiert, wie schnell der Anwender nach einem Ausfall oder Datenverlust wieder in der Lage sein sollte, eine Softwarefunktion wiederherzustellen, Geräte auszutauschen bzw. verlorene Daten aus einem Backup wiederherzustellen. Für jedes Gerät, jede Softwareanwendung und jede Datenbank muss die IT-Abteilung dafür die geltenden maximal tolerierbaren Ausfallzeiten (MTD) untersuchen, ein Diagramm der Abhängigkeiten der IT-Komponenten erstellen und diese Abhängigkeiten rückwärts durchgehen, um zu bestimmen, wie viel Zeit für die Wiederherstellung jeder technischen Komponente aufgewendet werden muss.

Dieses Diagramm enthält idealerweise die oben erwähnte Zeit, die der Anwender benötigt, um zu überprüfen, ob die Daten tatsächlich auch korrekt wiederhergestellt wurden. Bei der RTO spielen zudem die Redundanz, Reparaturzeiten sowie Verfügbarkeit und Kompetenz der Techniker eine Rolle. Bei Systemen mit hohem Volumen (viele Transaktionen oder User) kann es hier sinnvoll sein, Abstufungen des MTD zu definieren, um übermäßige Investitionen in redundante Geräte, Softwarelizenzen und Techniker auf Abruf zu vermeiden. So könnte ein System beispielsweise einmal im Quartal für vier Stunden außer Betrieb sein, aber nur einmal im Jahr den ganzen Tag.

Maximal tolerierbare Ausfallzeit (MTD)

Bei der Maximum Tolerable Downtime (MTD) handelt es sich um die maximale Zeitspanne, die Anwendungen oder Daten für die jeweiligen User nicht verfügbar sein dürfen. Dieser Schwellenwert muss zwingend von der Unternehmensleitung festgelegt werden, und ist im Wesentlichen Teil der Notfallwiederherstellung und der Planung der Geschäftskontinuität auf Führungsebene. Im Grunde muss die technische Funktionalität nach einem Hacker-Angriff bzw. Absturz umgehend wiederherzustellen sein, da die User alle während des Ausfalls versäumten Arbeiten natürlich nachholen müssen, während die MTD-Uhr noch läuft. In dieser Hinsicht dient die MTD als Maß für die Berechnung eines detaillierteren Schwellenwerts der RTO.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

(ID:49906742)