RAID-Level 5 (2 / 3 / 4)
Der RAID-Level 5 ist ein Festplatten-Verbund von drei oder mehr Festplatten mit besonderen Eigenschaften, die eine einzelne Festplatte nicht hat.
Bei großen Datenmengen, die redundant gespeichert werden müssen, ist RAID 0 nicht akzeptabel und RAID 1 zu teuer, platzraubend und meistens überdimensioniert. Der RAID-Level 5 ist eine Weiterentwicklung aus den RAID-Leveln 3 und 4. Wie bei RAID 0 werden die Daten in Blöcke, den Stripes, aufgeteilt und über die gesamte Festplatte verteilt.
Der RAID-Level 5 ist eine gute Kombination aus Datensicherheit und Speicherausnutzung. Bei 5 Festplatten beträgt die Speicherkapazität 80% von der Gesamtkapazität aller Festplatten.
Aufbau von RAID 5: Block Striping mit verteilter Parität
Bei RAID 5 müssen mindestens 3 Festplatten vorhanden sein. Zur Steigerung der Gesamtkapazität des logischen Laufwerks können auch mehr Festplatten eingebunden werden.
Bei drei Festplatten wird ein Datenblock von 128 kByte in zwei Datenblöcke von 64 kByte geteilt. Aus den beiden Datenblöcken wird die Paritätsinformation gebildet, die einem dritten Block von 64 kByte entspricht. Die Parität ist das Ergebnis einer Exklusiv-Oder-Verknüpfung (XOR) der Datenblöcke eines Sektors. Die Parität wird aus Sicherheitsgründen nicht auf einem separaten Laufwerk gespeichert, sondern gleichmäßig auf alle Festplatten zwischen den Datenblöcken verteilt (Rotating Parity). Das Schreiben verzögert sich jedoch bei RAID 5. Vor dem Schreiben muss zuerst ein Lesezugriff erfolgen, damit die Paritätsinformation berechnet und danach wieder geschrieben werden kann.
Wenn eine Festplatte ausfällt, dann werden die fehlenden Datenblöcke aus den Paritätsblöcken vom Controller während der Laufzeit rekonstruiert. Wird die defekte Festplatte ausgetauscht, dann errechnet der Controller die fehlenden Daten aus der Parität und beschreibt damit die neue Festplatte. Dieser Vorgang kann einige Zeit dauern. Zusätzliche Schreib- und Lesezugriffe können die Rekonstruktion verlangsamen.
Vorteile von RAID 5
Die Daten sind vergleichsweise sicher gespeichert, solange bis eine Festplatte ausfällt. Dann müssen die Paritätsinformationen benötigt, um die fehlenden Daten zu rekonstruieren. Im Vergleich zu RAID 1 wird die Speicherkapazität besser ausgenutzt.
Nachteile von RAID 5
Der Hauptnachteil von RAID 5 ist die Notwendigkeit bei jedem Schreibzugriff den Paritäts-Sektor auszulesen, neu zu berechnen und wieder zu speichern. Daraus ergibt sich eine langsame Schreibgeschwindigkeit im Vergleich zu anderen RAID-Leveln. Doch Dank geschickter Paritätsberechnung und Puffern von Daten ist RAID 5 auch beim Schreiben vergleichsweise schnell.
Der zweite, aber weniger schwerwiegende Nachteil ist der Kapazitätsverlust durch die Speicherung der Paritätsinformationen.
Wichtig zu wissen: Fällt im RAID 5 eine Festplatte aus, so sind die Daten in höchstem Maße gefährdet. Denn fällt noch eine Festplatte aus, so sind die Daten endgültig verloren. Ein RAID 5 verkraftet den Ausfall einer zweiten Festplatte nicht.
Lese- und Schreibgeschwindigkeit bei RAID 5
Zumindest in der Theorie kann ein RAID 5 aus drei Festplatten auch die Geschwindigkeit steigern. Es kann aber auch sein, dass der RAID-Verbund langsamer ist als eine einzelne Festplatte. Warum ist das so?
Ein RAID 5 aus drei Festplatten kann bei sequenziellen Transfers theoretisch doppelt so schnell arbeiten wie eine einzelne Festplatte. Doch nicht alle RAID-Controller beherrschen die Paritätsberechnung und das Verteilen oder Anfordern der Daten so schnell, dass sie Geschwindigkeit auch tatsächlich erreicht wird. Gerade günstige RAID-Controller sind bei RAID 5 und sequentiellen Transfers langsamer als eine einzelne Festplatte.
Auch bei verstreuten Zugriffen auf viele kleine Dateien bringt ein RAID 5 nicht mehr Geschwindigkeit. Die Positionierung der Schreib-/Lese-Köpfe der Festplatten verschlingt viel Zeit. Ein RAID 5 ist dann nicht schneller als eine einzelne Festplatte.
Anwendungen von RAID 5
Wegen der geringeren Schreibgeschwindigkeit eignet sich RAID 5 am ehesten bei großen Datenmengen mit kleinen Dateien. Mit nur drei Festplatten kann man sich sehr effizient gegen Ausfall einer Festplatte schützen. Mit dem Einsatz von mehr Festplatten lässt sich der nutzbare Anteil der Speicherkapazität gegenüber der Parität erhöhen.
RAID-Level 2
Beim RAID-Level 2 werden die Festplatten wie bei RAID 0 zu einem großen logischen Laufwerk zusammengeschaltet. Dort werden die Datenblöcke gespeichert. Zusätzlich werden aus den Datenblöcken mit dem Hamming-Code Prüfsummen errechnet. Der Hamming-Code erlaubt die Rekonstruktion fehlerhafter oder fehlender Bits.
Für ein 8-Bit-Datenwort werden 3-Bit zusätzlicher Speicherplatz benötigt. Dieser wird auf einem zusätzlichen Laufwerk bereitgestellt. Die Redundanz beträgt etwa 28%.
Die Schreibgeschwindigkeit wird durch die Prüfsummenbildung und deren Speicherung gebremst. Besonders bei kleinen Datenblöcken ist das System langsam.
RAID 2 ist nicht beliebig skalierbar. Zusätzliche Daten-Festplatten benötigen zusätzlichen Speicherplatz für die Prüfsummen.
RAID-Level 3
Beim RAID-Level 3 werden die Festplatten wie bei RAID 0 zu einem großen logischen Laufwerk zusammengeschaltet. Dort werden die Daten byteweise auf alle Festplatten verteilt. Zusätzlich werden aus den Datenblöcken Prüfsummen gebildet. Sektorweise werden die Datenblöcke mit einem logischen Exklusiv-Oder (XOR) verknüft. Die Prüfsumme wird dann auf einem separaten Laufwerk gespeichert. Fällt eine Festplatte aus, kann aus der Prüfsumme und den noch vorhandenen Daten die verlorenen Daten rekonstruiert werden. Aufgrund der einfachen Berechnung der Prüfsumme halten sich die Leistungsverluste bei einem Festplattenausfall in Grenzen.
Bei einem RAID 3 mit 5 Festplatten ergibt sich eine nutzbare Kapazität von 80% der Gesamtkapazität aller Festplatten. RAID 3 ist für die Speicherung großer Dateien, wie sie z. B. bei CAD, Bild- und Videoverarbeitung anfallen geeignet. Der Vorteil gegenüber RAID 2 ist das simple Prüfsummenverfahren mit XOR. Die Schreibgeschwindigkeit ist allerdings durch die Geschwindigkeit des Prüfsummen-Laufwerks begrenzt.
RAID-Level 4 - Sector Striping
Beim RAID-Level 4 werden die Festplatten wie bei RAID 0 zu einem großen logischen Laufwerk zusammengeschaltet. Die Anzahl der Festplatten ist beliebig skalierbar und jederzeit erweiterbar. Die Dateien werden in ihrer ursprünglichen Größe auf die einzelnen Festplatten verteilt. Man bezeichnet das als Sector Striping. Auf einem zusätzlichen Laufwerk werden die XOR-Prüfsummen der Daten gespeichert.
Der Unterschied zum RAID 3 sind die unabhängig voneinander arbeitenden Festplatten und dass dadurch Zugriffe parallel voneinander abgearbeitet werden können. Beim Schreibvorgang werden die Daten nur auf zwei Festplatten gespeichert. Auf einer Daten-Festplatte und auf dem Prüfsummen-Laufwerk. Weil jeder Schreibvorgang das Prüfsummen-Laufwerk beansprucht, ist dieser nur so schnell, wie die Prüfsumme gespeichert wurde. Fehlende oder fehlerhafte Daten können aus der Prüfsumme rekonstruiert werden.
RAID 4 ist vor allem bei kleinen Dateigrößen interessant. Dort ist der Zugriff besonders schnell.
RAID-Level 1E0 - Striping, Mirroring und Skewed Parity
RAID 1E0 ist eine Erweiterung bzw. Kombination von RAID 1E und RAID 5. Entwickelt wurde es von IBM.
Konventionelles RAID 1E besteht aus mindestens 3 Festplatten, auf denen die Daten gespiegelt sind (Mirroring). Bei RAID 1E0 werden zwei oder mehr RAID-1E-Arrays zusammengeschaltet.
RAID 1E0 | |||||
---|---|---|---|---|---|
1. RAID 1E | 2. RAID 1E | ||||
Festplatte 1 | Festplatte 2 | Festplatte 3 | Festplatte 4 | Festplatte 5 | Festplatte 6 |
Block 1 | Block 3 | Block 5 | Block 2 | Block 4 | Block 6 |
Mirror 5 | Mirror 1 | Mirror 3 | Mirror 6 | Mirror 2 | Mirror 4 |
Block 7 | Block 9 | Block 11 | Block 8 | Block 10 | Block 12 |
Mirror 11 | Mirror 7 | Mirror 9 | Mirror 12 | Mirror 8 | Mirror 10 |
Ein RAID-Level 1E0 ist erst ab 6 Festplatten möglich. Das Beispiel oben besteht aus zwei 3-er Gruppen. Die Daten sind quer in jeder 3er Gruppe in den RAID 1E Arrays gespiegelt. Wenn nun eine Festplatte ausfällt, liegen deren Daten gespiegelt auf einer anderen Festplatte. Dies hat beim Lesezugriff einen Vorteil. Die Gschwindigkeit kann durch paralleles Lesen gesteigert werden.
RAID 1E0 Arrays können aus maximal 60 Festplatten bestehen. In dieser Ausbaustufe werden vier RAID 1E Arrays, bestehend aus 15 Festplatten, zu einem RAID 1E0 Array gruppiert.