RAID - Redundant Array of Independent Disk
RAID-Systeme sind Speicherkonzepte um Daten redundant zu speichern (RAID-Level 1) oder die Geschwindigkeit der Schreib- und Lesezugriffe zu steigern (RAID-Level 0). Dabei werden mehrere physikalische Festplatten zu einem logischen Laufwerk zusammen geschaltet. In der Regel geht es darum, sich vor dem Ausfall einer Festplatte zu schützen.
Bei einem RAID,
kommt es auf die Verfügbarkeit von Daten an, in dem die Daten redundant gespeichert werden. Der Redundanz-Level drückt aus, wie viele Festplatten ausfallen dürfen, bis das ganze Array defekt ist.
Für spezielle Anforderungen, wo Datensicherheit und Geschwindigkeit gefragt sind, gibt es weitere RAID-Level, die aber nicht alle standardisiert sind.
Ein RAID kommt immer dann zum Einsatz, wenn folgende Ziele erreicht werden sollen:
- Datensicherheit erhöhen (Redundanz)
- Geschwindigkeit steigern
- oder beides zusammen
Drei Dinge die man über RAID wissen muss
- Es gibt viele billige RAID-Varianten. Doch nur ein Hardware-RAID-Adapter schützt Daten ausreichend vor Hardware-Defekten.
- Eine redundante Konfiguration macht nur dann Sinn, wenn es auf hohe Verfügbarkeit ankommt, die auch bei einem Plattendefekt erhalten bleiben muss. Mehr kann RAID nicht leisten. Die oft beworbenen Geschwindigkeitsvorteile sind in der Praxis meist nicht relevant.
- RAID ersetzt kein Backup.
Die Geschichte von RAID
Die Idee zu RAID stammt aus dem Jahr 1987. 1988 wurde dazu eine Studie mit dem Namen "A Case for Redundant Arrays of Inexpensive Disks (RAID)" von David A. Patterson, Garth A. Gibson und Randy H. Katz von der University of California, Berkeley veröffentlicht. In der Studie ging es um die Speicherung großer Datenmengen auf kleinen 5,25-Zoll-Festplatten. Die damals gebräuchlichen 14-Zoll-Festplatten hatten eine größere Speicherkapazität, waren aber viel teurer. Es ging also darum, wenige große und teure Platten durch viele kleine und günstige Platten zu ersetzen. Allerdings führte die Speicherung auf vielen kleinen Festplatten statt auf einer großen Festplatten zu Verwaltungsproblemen. Außerdem stieg die Wahrscheinlichkeit eines Datenverlusts beim Speichern auf mehreren Festplatten.
Zu diesen und weiteren Erkenntnissen kam die Studie und bot sogleich eine Lösung für die Probleme an. Die Lösung war das Kombinieren mehrerer kleinerer Laufwerke mit einem Fehlererkennungs- und Fehlerkorrekturmechanismus, sowie das Zusammenschalten zu einem ausfallsicheren Festplattenverbund. RAID war geboren.
RAID-Prinzip
Ein RAID-Adapter oder ein Betriebssystem fassen mindestens zwei oder mehr Festplatten zu einem logischen Verbund zusammen. Für die Software sieht dieser Verbund wie ein einziges Laufwerk aus, das besondere Eigenschaften besitzt, die ein einzelnes Laufwerk nicht hat. Die Daten werden nach einem fest definierten Schema auf alle Festplatten verteilt. Dabei erfolgt die Arbeit des RAID unauffällig im Hintergrund.
Im Zusammenhang mit RAID und Speichersystemen (Storage) spricht man häufig von Arrays. Das ist die Bezeichnung von Festplatten, die zu einer logischen Einheit zusammen gefasst sind.
Was kann ein RAID nicht?
RAID hilft nur beim Ausfall einer Festplatte (nicht bei RAID 0). Wenn gleichzeitig eine zweite Festplatte ausfällt, dann hilft RAID nicht gegen Datenverlust (außer RAID 6). Deshalb gilt es bei einem Festplattenausfall schleunigst Ersatz zu beschaffen. Insbesondere dann, wenn man mehrere Festplatten aus der gleichen Produktion einsetzt. Wenn eines davon ausfällt, dann ist die Gefahr, dass ein anderes auch den Geist aufgibt relativ groß.
Auch schützt ein RAID nicht vor Viren, Würmern oder versehentlichem Löschen von Dateien. RAID erhöht die Ausfallsicherheit und damit die Verfügbarkeit des Speichersystems. Eine Datensicherung (Backup) kann kein RAID ersetzen.
RAID-Level
Mit RAID werden mehrere physikalische Festplatten zu einem großen logischen Laufwerk zusammen geschaltet. Die verschiedenen Möglichkeiten werden in RAID-Leveln definiert.
Offiziell gibt es 8 RAID-Level, wobei nur die Level 0 bis 5 spezifiziert sind. Einige Hersteller haben weitere RAID-Level eingeführt, die in der Praxis aber nur in Ausnahmen eine Rolle spielen. So sind die RAID-Level 6 und 7 untereinander nur bedingt kompatibel. In der Praxis haben sich die RAID-Level 0, 1 und 5 durchgesetzt und reichen aus, um die meisten Anforderungen abzudecken. Die RAID-Level 2, 3 und 4 spielen in der Praxis keine Rolle.
RAID-Level | Lesegeschwindigkeit | Schreibgeschwindigkeit | Datensicherheit | Speicherkapazität |
---|---|---|---|---|
RAID 0 | + + | + + | - - | + |
RAID 1 | + + | + | + + | - - |
RAID 5 | + | - | + | - |
Bewertungen sind ein Vergleich zu einer einzelnen Platte (neutral oder Null).
- RAID 0: Nicht ausfallsicher, dafür schnelle Lese- und Schreibgeschwindigkeit
- RAID 1: Ausfallsicher, aber teuer
- RAID 5: Ausfallsicher, aber langsame Schreibgeschwindigkeit
RAID-Level im Vergleich
Betrieb | RAID 0 | RAID 1 | RAID 5 | RAID 6 |
---|---|---|---|---|
Redundanz | nein | ja | ja | ja |
min. Datenträger | 2 | 2 | 3 | 4 |
Rechenaufwand | sehr gering | sehr gering | mittel (XOR) | hoch |
Datentransferrate | höher als Einzelplatte | beim Lesen höher als Einzelplatte | *abhängig vom Controller | *abhängig vom Controller |
Kapazität bei 2 Platten | 2 | 1 | nicht möglich | nicht möglich |
Kapazität bei 3 Platten | 3 | nicht möglich | 2 | nicht möglich |
Kapazität bei 4 Platten | 4 | 2 | 3 | 2 |
Kapazität bei 5 Platten | 5 | nicht möglich | 4 | 3 |
* Je nach Implementierung bremst der Rechenaufwand für RAID 5 und 6 beim Schreiben. Das Lesen von mehreren Platten geht in der Regel schneller als von nur einer Platte.
Um die Datentransferrate von RAID 1, 5 und 6 zu steigern werden zwei RAID-Verbünde zu einem RAID 0 zusammengeschaltet. Dadurch entstehen ein RAID 10, 50 bzw. 60.
Einrichten von RAID
Der Einsatz eines RAIDs muss sorgfältig und durchdacht geplant werden. Es müssen zertifizierte RAID-Festplatten und zusätzlich eine kompatible Ersatzkarten für den Notfall beschafft werden. Und ganz wichtig, der Ernstfall muss vor dem Produktiveinsatz geprobt werden. Dazu muss das RAID mit Daten befüllt werden. Anschließend eine Festplatte entfernt und eine neue hinzugefügt werden. Danach sollte das RAID die neue Festplatte mit Daten bespielen (nicht bei RAID 0). Erst dann, wenn während dieser Aktion das RAID ohne Probleme weiterläuft, kann das System in den Produktiveinsatz gehen.
Beim Einsatz eines RAIDs macht man ganz automatisch neue Fehlerquellen auf. So ist die Wahrscheinlichkeit eines Bedienfehlers bei einem RAID höher, als bei einem einzelnen Laufwerk. Typische Fehler sind zum Beispiel, die falsche Festplatte zu tauschen oder falsche Software-Optionen zu wählen. Manchmal fährt man besser, wenn man häufig Backups macht und ein Ersatzsystem bereitstellt.
Wenn es geplant ist, ein RAID zu einem späteren Zeitpunkt zu nutzen, dann sollte man sich vorher schon Gedanken darüber machen und mit den vorhandenen Komponenten beschäftigen. Unter Umständen muss ein bereits installiertes Betriebssystem noch mal neu aufgesetzt werden, weil sich die bestehende Festplatte nicht einfach so mit einer neuen Festplatte zu einem RAID-Verbund zusammenschließen lässt.
Zu beachten ist auch, ein richtig sicheres und schnelles RAID bekommt man nur mit Hardware-Unterstützung.
RAID-Festplatten
In einem RAID sollten grundsätzlich dauerbetriebstaugliche oder RAID-taugliche Festplatten (24x7) einsetzt werden. Solche Festplatten sind natürlich etwas teurer. Allerdings vibrieren sie weniger. Beim Betrieb mehrere Festplatten in einem Gehäuse können sich Festplatten sonst gegenseitig in Schwingung versetzen. Herkömmliche Festplatten sind wegen der hohen Spur- und Datendichte sehr empfindlich gegen Vibrationen. Höhere Latenzzeiten und im schlimmsten Fall Schreib- oder Lesefehler sind die Folge. In einem RAID führt das zu Fehlerkorrekturen, die das System verlangsamen können.
Grundsätzlich empfiehlt es sich Festplatten einzusetzen, die von der Geschwindigkeit und der Speicherkapazität gleichwertig sind. Man kann auch unterschiedliche Festplatten nehmen. Doch dann orientiert sich die Geschwindigkeit und Speicherkapazität an der kleinsten und langsamsten Festplatte. Sinnvollerweise nimmt man immer identische Festplatten.
Was, wenn eine Festplatte kaputt geht?
Wenn ein RAID 1 oder 5 nach langjähriger Betriebszeit einen Festplatten-Ausfall erleidet, dann sollte man das defekte Laufwerk nicht sofort tauschen. Tauscht man die defekte Platte aus, dann kommt es nicht selten vor, dass nach einem stressigen Rebuild weitere Platten ausfallen. Dann muss man das ganze Spiel wiederholen. Im schlimmsten Fall fällt eine andere Festplatte während des Rebuilds aus. Dann sind die Daten definitiv futsch. Deshalb gilt, RAID ersetzt kein Backup!
Wenn also bei einem RAID eine Festplatte ausfällt müssen zuerst die Daten auf den verbliebenen Festplatten gesichert und anschließend alle Festplatten des RAIDs ausgetauscht werden.
Bei einem RAID 6 kann man sich diese Vorgehensweise theoretisch sparen. RAID 6 kommt auch mit dem Ausfall einer zweiten Platte klar.
Hardware-RAID
Das klassische RAID ist das Hardware-RAID. Hier organisiert ein Mikroprozessor (RAID-Controller) auf dem RAID-Adapter die Datenverteilung auf die Festplatten. Der RAID-Controller ist so ausgelegt, dass er die Verteilung der Daten und die Berechnung der Prüfsummen selber ausführen kann und den Hauptprozessor nicht belasten muss.
Der RAID-Controller erscheint gegenüber dem Betriebssystem vollkommen transparent. Von der Zusammenschaltung der Festplatten bekommt das Betriebssystem nichts mit. Im Vergleich zum Zugriff auf eine einzelne Festplatte erkennt man auch als Anwender keinen Unterschied.
Bei der Konfiguration und im laufenden Betrieb bleiben beim Hardware-RAID keine Wünsche offen.
Software-RAID
Einige RAID-Level können auch mit Hilfe von Software realisiert werden. Für die Verteilung der Daten und der Berechnung der Prüfsummen ist dann der Hauptprozessor zuständig.
Die Betriebssysteme Linux, Windows (XP Pro, Vista, Server) und MacOS beherrschen einige RAID-Level. Linux erlaubt neben RAID 0, 1 und 5 auch noch RAID 4 und 6. MacOS beherrscht immerhin RAID 0 und 1. Windows Server beherrscht RAID 0, 1 und 5. Die Einzelplatz-Betriebssysteme von Microsoft nur RAID 0.
Host-RAID
Eine Zwischenstufe zwischen Hardware- und Software-RAID ist Host-RAID. Dazu zählen der RAID-Chipsatz, der sich auf manchen Motherboards befindet und auch einige günstige RAID-Adapter. Es gibt Motherboards, die sehr leistungsfähige RAID-Funktionen haben. Allerdings nicht immer so komfortabel, wie bei den RAID-Controllern (Hardware-RAID). Motherboards mit RAID-Funktion beherrschen meist nicht mehr als RAID 0, 1 und 5. Bei billigen Motherboards fehlt oft RAID 5.
Man spricht deshalb von Host-RAID, weil die RAID-Funktionen von der Firmware bzw. den Treibern erledigt werden. Aufwendige Berechnungen übernimmt der Hauptprozessor. Auffällig ist die hohe Belastung der CPU. Man bezeichnet diese Art von RAID auch als Fake-RAID.
Geht der RAID-Adapter kaputt, dann muss man einen kompatiblen, besser den gleich nachkaufen, um auf die Daten des RAID wieder zugreifen zu können.
Übersicht: RAID-Varianten
Bezeichnung | Software-RAID | Host-RAID | USB-RAID | NAS mit RAID |
---|---|---|---|---|
Controller-Chip | nein | ja | ja | ja |
CPU-Berechnung | ja | ja | nein | nein |
Performance | mittel | hoch | niedrig | niedrig |
Alarmfunktion | nein | möglich | nein | ja |
Kosten | integriert | gering | gering | hoch |
Vorteile | Hardware-unabhängig | billig | billig | leicht erweiterbar |
Nachteile | nur Windows | unzuverlässig | keine Warnfunktion | erschwerter Zugriff bei NAS-Defekt |
Es gibt gute Gründe, warum häufig Hardware-Host-Adapter (nicht Host-RAID) eingesetzt werden. Nur ein Hardware-RAID schützt ausreichend vor Hardware-Defekten.
RAID im Desktop-Computer
In Anbetracht dessen, dass Festplatten eine immer größere Speicherkapazität haben und Systeme, die diese Speichermenge für ein Backup sichern können sehr teuer und aufwendig sind, ist ein RAID-System auch für Einzelplatzsysteme interessant. Vor allem im Privat-Bereich, wo Computer zum Speichern von wichtigen Schriftstücken, Fotos der Digitalkamera verwendet werden und manchmal mehrere Personen daran arbeiten, wird das regelmäßige Sichern der Daten auf CD, DVD oder externe Festplatten vernachlässigt. Eine fehlende Datensicherung von wichtigen Daten ist grob fahrlässig.
Ein RAID-System, z. B. RAID 1, schützt die Daten zumindest vor Verlust bei einem Festplattenausfall. Die wichtigsten Daten sollten zusätzlich auf einem externen Speichermedium, z. B. auf einer externen Festplatte, gesichert werden, um sie z. B. vor Viren oder versehentlichem Löschen eines unbedarften Anwenders zu schützen.
In Desktop-Computern hat sich RAID noch nicht durchgesetzt. Allerdings lassen sich viele Motherboards mit RAID onboard zu einem RAID-Speichersystem konfigurieren. Alternativ unterstützt fast jedes Betriebssystem Software-RAID.
Wenn es geplant ist, RAID zu einem späteren Zeitpunkt zu nutzen, dann sollte man sich vorher schon Gedanken darüber machen und mit den vorhandenen Komponenten beschäftigen. Unter Umständen muss ein bereits installiertes Betriebssystem noch mal neu aufgesetzt werden, weil sich die bestehende Festplatte nicht einfach so mit einer neuen Festplatte zu einem RAID-Verbund zusammenschließen lässt.
RAID-Level 0
Der RAID-Level 0 ist ein Festplatten-Verbund von zwei oder mehr Festplatten. Die Transferrate und Speicherkapazität der einzelnen Festplatten lassen sich einfach aufaddieren. Die 0 im RAID-Level steht für Null Daten-Redundanz. Die Daten werden nur abwechselnd auf zwei oder mehr Festplatten verteilt. Dadurch erhöht sich die Geschwindigkeit beim Lesen und Schreiben. Fällt jedoch eine Festplatte aus, sind alle Daten weg.
RAID-Level 1
Der RAID-Level 1 ist ein Festplatten-Verbund von zwei oder mehr Festplatten. Bei RAID 1 werden die Daten doppelt, also mindestens auf zwei Festplatten gespeichert. Man bezeichnet das als Datenspiegelung oder Mirroring. RAID 1 bietet so den bestmöglichen Schutz vor Datenverlust durch Festplattenausfall. Und beim Lesen von Daten hat man annähernd die doppelte Datentransferrate wie bei einem einzelnen Laufwerk.
Aber, die Kapazität eines RAID-Laufwerks beträgt die Hälfte der eingesetzten Laufwerke. Man muss also doppelt so viel Geld ausgeben oder man hat nur halb so viel Speicherkapazität, wie bei einem Laufwerk. Doppeltes Laufwerk bedeutet auch verdoppelter Stromverbrauch und verdoppelter Kühlaufwand.
RAID-Level 5
Der RAID-Level 5 ist ein Festplatten-Verbund von drei oder mehr Festplatten mit besonderen Eigenschaften, die eine einzelne Festplatte nicht hat.
Bei großen Datenmengen, die redundant gespeichert werden müssen, ist RAID 0 nicht akzeptabel und RAID 1 zu teuer, platzraubend und meistens überdimensioniert. Der RAID-Level 5 ist eine Weiterentwicklung aus den RAID-Leveln 3 und 4. Wie bei RAID 0 werden die Daten in Blöcke, den Stripes, aufgeteilt und über die gesamte Festplatte verteilt.
Der RAID-Level 5 ist eine gute Kombination aus Datensicherheit und Speicherausnutzung. Bei 5 Festplatten beträgt die Speicherkapazität 80% von der Gesamtkapazität aller Festplatten.
Beim Ausfall einer Festplatte geht die Datentransferrate zurück, weil die Daten aus der Parität berechnet werden muss.
RAID-Level 6
Beim RAID-Level 6 wird wie bei RAID 5 auch mit Sector Striping gearbeitet. Zusätzlich wird ein Paritätslaufwerk verwendet, das über einen asynchronen Datenpfad und einen Cache verfügt. Bei RAID 6 speichert der Adapter gleich zwei Prüfsummen, sodass sich aus den Daten von verbliebenen Laufwerken die Daten rekonstruieren lassen.
Während RAID 5 nur den Ausfall eines Laufwerks verkraftet, verträgt RAID 6 den Ausfall von zwei bei mindestens 4 Laufwerken.
JBOD - Just a Bunch of Disks
Die Bezeichnung JBOD, Linear Mode oder NRAID steht für Verschiedenes. Die einen bezeichnen damit mehrere einzeln ansprechbare Festplatten an einem Adapter. Die anderen bezeichnen damit eine Verkettung von Laufwerken. Das bedeutet, dass mehrere Festplatten zu einer großen zusammenhängenden Festplatte zusammengeschalten werden, in dem sie virtuell einfach hintereinander gehängt werden. Dieser Festplattenverbund sieht für das Betriebssystem wie ein einziges großes Laufwerk aus.
JBOD ermöglicht es ausschließlich mehrere Festplatten, auch unterschiedlicher Größe, zusammenzuschalten, um daraus ein einziges großes Laufwerk zu machen. Zum Beispiel um sehr große Dateien speichern zu können. Doch diese Zusammenschaltung hat mit RAID nichts zu tun. Fällt eine Festplatte aus, dann ist das gesamte Laufwerk aus Sicht des Betriebssystems defekt. Die Chance zur Rettung von Daten ist relativ gut, wenn auf den intakten Festplatten größere zusammenhängende Dateien liegen.