Rechenzentren zeigen sich gestärkt, die Telekommunikation schwächelt Uptime Institute bestätigt: Redundanz verhindert Ausfälle im Datacenter

Von Manuel Masiero 3 min Lesedauer

Anbieter zum Thema

Das Uptime Institute befragt die Betreiber von Datacenter regelmäßig nach den Ursachen, Kosten und Folgen von Ausfällen in ihren Rechenzentren. Das diesjährige Resümee ist positiv: Obwohl die Datacenter-Infrastrukturen weiter wachsen, nimmt die Häufigkeit und Schwere von Ausfällen kontinuierlich ab.

 Wie ist es um die Ausfallsicherheit von Rechenzentren bestellt? Das Uptime Institute veröffentlicht dazu regelmäßig Studien.(Bild:  frei lizenziert: TheDigitalArtist /  Pixabay)
Wie ist es um die Ausfallsicherheit von Rechenzentren bestellt? Das Uptime Institute veröffentlicht dazu regelmäßig Studien.
(Bild: frei lizenziert: TheDigitalArtist / Pixabay)

Die Vermeidung von Ausfällen digitaler Infrastruktur bleibt für Betreiber von Rechenzentren von größter Bedeutung. Zwar rücken die Ausfälle immer stärker ins Zentrum der medialen Aufmerksamkeit und stehen besonders auch in den sozialen Medien schnell im Fokus. Von einem besorgniserregenden Trend kann aber nicht die Rede sein, denn laut den Analysten des Uptime Institute nimmt die Gesamthäufigkeit und Schwere von Ausfällen ab.

Fast die Hälfte bleibt ohne Ausfall

Mehr als die Hälfte der Betreiber (55 Prozent), die an der aktuellen Rechenzentrumsumfrage teilnahmen, gaben an, in den letzten drei Jahren einen Ausfall gehabt zu haben. Das ist ein Rückgang gegenüber 60 Prozent im Jahr 2022 und 69 Prozent im Jahr 2021.

Allerdings klassifizierten die befragten Datacenter-Betreiber im Jahr 2023 nur einen von zehn Ausfällen als schwerwiegend oder kritisch. Das ist eine Verbesserung um 4 Prozentpunkte gegenüber 2022 und eine Verbesserung um 10 Prozentpunkte im Vergleich zu 2021. Als unerheblich oder minimal wurden insgesamt 73 Prozent aller Ausfälle klassifiziert, als bedeutsam noch 17 Prozent.

Bildergalerie

Zwar fallen nur wenige Ausfälle in die Kategorien schwerwiegend oder kritisch, schlagen dann aber finanziell deutlich zu Buche. So gaben 54 Prozent der Befragten gaben an, dass ihr jüngster als bedeutsamer, schwerwiegender oder kritisch eingestufter Ausfall mehr als 100.000 Dollar an Kosten nach sich zog; bei 16 Prozent waren es sogar mehr als 1 Million Dollar. Weltweit gibt es laut den Analysten jedes Jahr durchschnittlich etwa 10 bis 20 Großvorfälle, die äußerst kostspielig sind.

Mehr Ausfälle im Telekommunikationssektor

Der Löwenanteil der innerhalb der letzten 8 Jahre öffentlich gemachten Ausfälle geht auf das Konto von Cloud- und Internet-Providern, Anbietern digitaler Dienste sowie von Unternehmen aus dem Telekommunikationssektor. Zusammen kommen sie auf rund zwei Drittel aller Ausfälle (siehe: Abbildung 2).

Einen deutlichen Anstieg an Ausfällen verzeichneten im Jahr 2023 allerdings die Telekommunikationsanbieter. Das lässt sich auf verschiedene Faktoren zurückführen, unter anderem auf die stetig steigende Nachfrage nach Konnektivität und Bandbreite. Auch die Einführung von Technologien wie 5G und Netzwerkvirtualisierung erhöhen die Komplexität der Telekommunikationssysteme und damit deren Anfälligkeit.

Trend-Treiber ist die Redundanz im Rechenzentrum

Den sinkenden Ausfallzahlen in Rechenzentren stehen Risikofaktoren gegenüber, die in den letzten Jahren zugenommen haben. Beispiele sind zum einen die COVID-Pandemie mit ihren Lieferketten-Unterbrechungen, die Datacenter-Betreiber dazu zwangen, notwendige Wartungsarbeiten oder Infrastruktur-Upgrades vorübergehend auf Eis zu legen. Als weitere Risikofaktoren nennen die Analysten unter anderem höhere Netzinstabilitäten durch den zunehmenden Wechsel auf erneuerbare Energien sowie den Klimawandel, der häufigeres Auftreten extremer Wetterereignisse begünstigt.

Die positive Gesamtentwicklung trotz steigender Risikofaktoren sieht das Uptime Institute vor allem darin begründet, dass Datacenter-Betreiber Jahr für Jahr mehr Geld in die Redundanz ihrer physischen Rechenzentrumsinfrastruktur investieren. Beispielsweise gaben 39 Prozent der befragten Datacenter-Betreiber an, die Redundanz ihrer Stromversorgung innerhalb der letzten drei bis fünf Jahre erhöht zu haben, während es bei den Kühlsystemen 33 Prozent waren. Bei Unternehmen (39 Prozent beziehungsweise 37 Prozent) sowie Cloud-, Hosting- und SaaS-Anbietern (37 Prozent beziehungsweise 33 Prozent) sind die Zahlen ähnlich hoch.

Größter Störfaktor: Stromausfall

Als Hauptursache für größere Ausfälle gaben 52 Prozent der Datacenter-Betreiber Probleme mit der Stromversorgung an. Danach folgen Probleme mit der Kühlung (19 Prozent), während Probleme mit Drittanbietern, IT-Systemen und Netzwerken zusammen 24 Prozent ausmachten. Nur eine untergeordnete Rolle spielen Ausfallursachen wie Feuer (3 Prozent) oder Vorfälle bei der Informationssicherheit (1 Prozent).

Bildergalerie

Menschliches Versagen als Mitursache

Die Analysten fragten auch, ob ein innerhalb der letzten 3 Jahre aufgetretener Ausfall durch menschliches Versagen verursacht wurde. Eingegrenzt wurde das auf bedeutsame, schwerwiegende oder kritische Vorfälle.

Eine knappe Mehrheit (51 Prozent) beantwortete diese Frage mit nein, während sich 10 Prozent nicht sicher waren. Die übrigen 39 Prozent nannten als häufigste Ursache (48 Prozent) eine fehlerhafte Ausführung durch Mitarbeiter, etwa durch die Nichteinhaltung von Verfahren. Unpassende Mitarbeiterprozesse waren in 45 Prozent aller Ausfälle der Grund, während 23 Prozent aller Ausfälle durch Probleme mit Inbetriebnahmen verursacht wurden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Vier von fünf Befragten gaben an, dass der jüngste schwerwiegende Ausfall durch bessere Verwaltung sowie effizientere Prozesse und Konfigurationen hätte verhindert werden können. Daher sehen die Experten weiterhin Potenzial darin, die Anzahl der Ausfälle durch Schulungen und Prozessüberprüfungen zu reduzieren.

Artikelfiles und Artikellinks

(ID:50005654)