RAID Systeme – Wie unterscheiden sich die einzelnen RAID Systeme?

Die Abkürzung RAID bedeutet „Redundant Array of Inexpensive Disks“. Unter diesem Begriff werden verschiedene Technologien zusammengefasst, die den unterbrechungsfreien Weiterbetrieb eines Computers im Fall des Ausfalls einer oder mehrerer Festplatten ermöglichen. Eine Ausnahme bilden RAID 0 Systeme, die ausschließlich der Optimierung der Performance dienen und keine zusätzliche Sicherheit bieten.

Die Grundidee eines RAID Systems

Raidsysteme von NetappDie klassische Absicherung gegen einen Festplattendefekt war die Spiegelung von Festplatten, bei der sämtliche Daten doppelt auf zwei verschiedene Festplatten geschrieben wurden. Im Falle es Ausfalls einer Platte übernahm die gespiegelte Platte deren Funktion. Der Nachteil dieses Verfahrens ist offensichtlich. Der Overhead an Festplattenplatz ist sehr hoch, lediglich 50 Prozent des Plattenplatzes werden im Normalbetrieb genutzt. RAID Systeme basieren auf der Erkenntnis, dass die Absicherung gegen den Ausfall einer Festplatte mit erheblich geringerem Overhead realisiert werden kann. Unabhängig von der Anzahl der Festplatten in einem Rechner kann dies durch hinzufügen einer weiteren Platte erreicht werden, statt jede Festplatte doppelt auszulegen. Auf dieser zusätzlichen Festplatte wird die so genannte Paritätsinformation gespeichert. Das bedeutet, dass für jedes Bit die Information gespeichert wird, ob die übrigen Platten an dieser Stelle eine gerade oder eine ungerade Anzahl von Einsen enthalten. Fällt nun eine Platte aus, kann mit Hilfe dieser Information der Inhalt der defekten Platte rekonstruiert werden. Ein Hinweis: In der Praxis werden die Paritätsinformationen auf alle Festplatte verteilt, d.h. dass jede Platte sowohl Nutzdaten als auch Paritätsbits enthält. Das ändert nichts an der Logik des Verfahrens, sondern dient ausschließlich der Optimierung der Performance.

Einige RAID Systeme („RAID Level“) spielen heute keine Rolle mehr. Die in der Praxis wichtigsten werden im Folgenden kurz beschrieben.

RAID Level 0

RAID 0 ist eine sehr irreführende Bezeichnung, da es keinerlei Redundanz bietet. Es handelt sich dabei vielmehr um ein „Striping without Parity“. Damit ist gemeint, dass jede Datei in einzelne Blöcke zerlegt wird und diese Blöcke auf unterschiedliche Festplatten geschrieben werden. Damit werden Schreib- und Lesevorgänge beschleunigt, da beides parallel auf mehreren Festplatten geschieht. Dieses Verfahren trägt nichts zur Ausfallsicherheit bei, sondern bewirkt das genaue Gegenteil: Bei Ausfall einer Platte werden alle Daten auf dem RAID 0 – Set unbrauchbar. Dennoch hat das Verfahren in speziellen Situationen durchaus seine Berechtigung, die eine sehr hohe Performance erfordern. Als Beispiel seien Webserver mit hoher Auslastung genannt, insbesondere wenn z.B. für die Wiedergabe von Videos große Datenmengen gelesen werden müssen.

RAID Level 1

Dabei handelt es sich um die klassische Festplattenspiegelung. Das Wesentliche dazu wurde bei der Beschreibung der Grundidee von RAID Systemen bereits gesagt: Dieses Verfahren garantiert eine sehr hohe Ausfallsicherheit, die allerdings auf Kosten eines sehr großen Overheads erkauft wird. Der RAID Level 1 legt keine Höchstanzahl der Spiegelplatten fest, d.h. die Information kann nicht nur doppelt auf zwei Platten geschrieben werden, sondern auf beliebig viele Platten mehrfach gespiegelt werden. In dieser Konstellation können alle bis auf eine Festplatte ausfallen, ohne dass es zu einer Betriebsunterbrechung kommt. Damit eignet sich dieser RAID Level für unternehmenskritische Server mit extrem hohen Anforderungen an die Verfügbarkeit.

RAID Level 3, 4, und 5

RAID 5 ist der in der Praxis wichtigste RAID Level. Es handelt sich dabei um das bereits als Grundidee geschilderte „Striping with Parity“. Die Beliebtheit dieses Verfahrens rührt daher, dass es einen guten Kompromiss zwischen Sicherheitsanforderung und Performance bietet. Wie beim RAID Level 0 werden Schreib- und Lesevorgänge auf allen Platten des Sets gleichzeitig durchgeführt. Zusätzlich zu den Nutzdaten wird auf eine Festplatte das Parity-Bit geschrieben, das den Set gegen den Ausfall einer Festplatte absichert.

Dieses Verfahren ist eng verwandt mit RAID Level 3 und 4. Im Gegensatz zu RAID 5, bei dem Nutzdaten und Paritätsinformationen über alle Festplatten verteilt werden, ist bei RAID 3 und RAID 4 eine Festplatte exklusiv für die Paritätsinformationen reserviert. Beide unterscheiden sich nur in der Art, wie die Daten auf die Paritätsplatte geschrieben werden. RAID 4 fasst diese Daten zu größeren Blöcken zusammen, während RAID 3 die Paritätsdaten byteweise schreibt. Die drei RAID Level 3, 4 und 5 bieten die gleiche Redundanz und unterscheiden sich nur in ihrer Performance. Typischerweise fällt der Performancevergleich zugunsten von RAID 5 aus, RAID 3 und 4 kommen daher nur in vergleichsweise wenigen Ausnahmesituationen zum Einsatz. Alle drei Systeme können den Ausfall von genau einer Festplatte kompensieren.

RAID Level 6

RAID 6 funktioniert ähnlich wie RAID 5, verkraftet aber den Ausfall zweier Festplatten. Ein wenig knifflig ist die Frage, welche Information zu diesem Zweck auf die zusätzliche Festplatte geschrieben werden muss. Definitiv falsch ist die verblüffen häufig anzutreffende Aussage, das Paritätsbit werde einfach auf zwei statt auf eine Platte (wie bei RAID 5) geschrieben. Wenn zwei Festplatten ausfallen nützt es natürlich gar nichts, wenn das Paritätsbit doppelt vorhanden ist. In der Praxis kommen mehrere Verfahren zu Einsatz. Eine gute Übersicht findet sich in http://www.linuxtechnicalreview.de/content/download/336/2523/file/raid6.pdf . RAID 6 bietet ebenfalls eine gute Performance und kommt zum Einsatz, wenn an die Verfügbarkeit eines Rechners höhere Anforderungen gestellt werden müssen als RAID 5 bietet.

Neuere Entwicklungen

Mittlerweile werden zahlreiche weitere Varianten von RAID Systemen angeboten. Einige basieren auf einer Kombination herkömmlicher RAID Level, in anderen Fällen handelt es sich um tatsächliche Neuentwicklungen. Diese Systeme werden charakterisiert durch die Redundanz, die sie bieten. Zur Beschreibung dieser Systeme wird die Schreibweise RAID (n,m) verwendet. Dabei bezeichnet n die Gesamtzahl der Festplatten und m die Zahl der Platten, die gleichzeitig ausfallen dürfen. Die Bezeichnung RAID (3,1) beschreibt als beispielsweise einen RAID 5 Set mit 3 Festplatten. Für alle RAID (n,m) Systeme gilt, dass Redundanz und Overhead gleich sind. Dürfen also z.B. drei Festplatten ausfallen (m=3), beträgt der Overhead ebenfalls drei Festplatten.

Hard- und Software RAID

Grundsätzlich können die an einem RAID Set beteiligten Festplatten sowohl durch eine geeignete Software zusammengeschaltet werden als auch direkt über die Hardware, also über einen speziellen RAID – Controller. In vielen Betriebssystemen ist ein Software RAID bereits integriert. In der Praxis haben sich Hardwarelösungen durchgesetzt. Die Gründe dafür liegen in der im Regelfall besseren Performance bei Schreib- und Lesevorgängen sowie der geringeren Systembelastung: Software RAID beeinträchtigt die Leistung eines Computers auch dadurch, dass Hardwareressourcen in Anspruch genommen werden, als beispielsweise CPU-Zeit.

Als wesentlichen Vorteil können Softwarelösungen darauf verweisen, dass bei Hardwarelösungen der RAID-Controller eine mögliche Fehlerquelle darstellt, die Software RAID nicht enthält. Der Ausfall eines RAID-Controllers ist bei Hardwarelösungen sehr kritisch. Eine Rekonstruktion der Daten gelingt im Regelfall nur, wenn ein identischer Ersatzcontroller zur Verfügung steht. Allerdings ist der Ausfall eines Controllers statistisch deutlich unwahrscheinlicher als ein Ausfall einer Festplatte. An diesem Problem wird jedoch deutlich, dass RAID-Systeme in keinem Fall eine Datensicherung ersetzen können!

Schließlich ist beim Vergleich der beiden Alternativen auch anzumerken, dass Softwarelösungen die deutlich preiswertere Variante sind.

Be Sociable, Share!

Ersten Kommentar schreiben

Antworten

Deine E-Mail-Adresse wird nicht veröffentlicht.


*