Suchen

Chipkill | Extended ECC | SDDC | Chipspare

| Redakteur: Rainer Graefen

Der Dateninhalt des Hauptspeichers von Rechnern wird bislang eher selten durch zusätzliche Paritätsbits oder durch Maßnahmen wie Error Checking and Correcting (ECC) auf dem Speichermodul

Der Dateninhalt des Hauptspeichers von Rechnern wird bislang eher selten durch zusätzliche Paritätsbits oder durch Maßnahmen wie Error Checking and Correcting (ECC) auf dem Speichermodul geschützt. Zwar lassen sich 1-Bitfehler durch Paritätsüberprüfungen erkennen, zur Erkennung von 3-Bitfehlern ist schon ECC-Technik notwendig, 2-Bit-Fehler lassen sich weder mti Parität noch mit ECC-Technik gar nicht erkennen. Eine Korrektur oder die Stilllegung betroffener Speicherbänke ist damit nicht möglich.

Die beiden Methoden werden auf Dauer nicht ausreichen, Verfälschungen des Dateninhalts durch interne Chipfehler zu verhindern. Aufgrund der zunehmend geringeren Ladungsmenge, die den binären Zustand „0“ oder „1“ repräsentiert, steigt zudem die Wahrscheinlichkeit der Verfälschung von Dateninhalten durch beispielsweise kosmische Bestrahlung.

Bei IBM hat man deswegen schon Mitte der 90er Jahre die Chipkill-Technik entwickelt, die auf einer erweiterten ECC-Technik beruht und mittels ECC-Korrekturwörtern, die über den Hauptspeicher verteilt werden, die Überprüfung und eventuelle Korrektur von Dateninhalten ermöglicht.

Seitdem DRAM- und NAND-Bausteine in zunehmendem Maße auf Tier-0 zur Beschleunigung von Datentransfers eingesetzt werden und Ende 2009 der erste externe SSD-Speicher mit 100 Terabyte Speicherkapazität auf den Markt kam, steigt die Wahrscheinlichkeit von fehlerhaften Dateninhalten extrem an, Als einer der ersten SSD-Speicherhersteller hat Texas Memory System die Ramsan-500 mit Chipkill ausgestattet.

Bei Google hat man über 2,5 Jahre hinweg DRAM-Fehlerraten untersucht und kam zu dem Ergebnis, dass die Fehlerrate, die in früheren Studien zu dem Thema veröffentlicht worden sind, um den Faktor 250 zu niedrig liegen. Statt 200 bis 500 Fehlern pro einer Milliarde Betriebsstunden (FIT) pro Megabit, ermittelten Google-Ingenieure 25.000 bis 75.000 FIT pro Megabit.

Alternative Technologien zu IBMs Chipkill stammen von Sun mit Extended ECC und von Intel mit SDDC. Hewlett-Packard nennt seine RAM-Korrekturtechnik Chipspare.

(ID:2042800)