Geclusterte Speichersysteme: Vorteile bei Hardware und Softwarekosten

Speichercluster von NetApp
Speichercluster von NetApp

Ein Cluster ist, übersetzt, eine Gruppe, oder ein Haufen. Ein geclustertes Speichersystem ist folglich eine Ansammlung von Speicher, der zu einem System zusammgengefasst wurde. Das birgt den Vorteil, dass der gesamte Speicher über eine Schnittstelle ansprechbar ist und nicht mehr jeder Speicher einzeln angesprochen werden muss. Die notwendigen administrativen Arbeiten sinken.

Verwendung finden Cluster in den Serverräumen der einzelnen Betriebe und den Serverfarmen, bei denen man sich dann die notwendigen Speicher und CPU Mengen mieten kann. Für alles ab Servergröße ist ein Cluster interessant, weil sich dadurch die administrative Arbeit verringern lässt. Insgesamt werden die Systeme einfacher zu warten, besser skalierbar und dadurch effizienter und günstiger.


Welche Probleme müssen behandelt werden?

Wenn man ein große Menge Storage verbindet, treten dabei die gleichen Herausforderungen auf, wie bei jeder beliebigen Serveranwendung mit mehreren Servern. Die Einzelteile benötigen untereinander eine schnelle Vernetzung. Zusätzlich muss alles über einen wohldefinierten Zugang ansprechbar sein. Ein sehr wichtiger Punkt ist dabei die Datenkonsistenz. In den rießigen Zentren müssen mehrere, gleichzeitige Zugriffe auf ein und dieselbe Datei gehandhabt werden.

Zum Beispiel tritt häufig der Fall auf, dass zwei Benutzer die gleiche Datei aufrufen, etwas ändern und sie dann speichern. Benutzer Zwei erfährt jedoch nichts von der Änderung die Benutzer Eins gemacht hat und überschreibt die Information ungesehen. Dieser Fall führt zu inkonsistenten Daten und muss behandelt werden. Dafür gibt es inzwischen spezialisierte Standardbetriebssysteme.

Unterschiede der Speichersysteme

Speichersysteme lassen sich nach technischen Aspekten unterscheiden und nach ihren Einstellmöglichkeiten. In technischer Hinsicht kann es Hardware oder Software Cluster geben. Softwarecluster sind virtualisierte Speicher. Die Speichersysteme können zentral in einem Gebäude aufgebaut sein, oder dezentral. Dabei kann dezentral bedeuten, dass die Systeme in zwei Räumen nebeneinander stehen, dass sie in verschiedenen feuergeschützten Bereichen eines Gebäudes stehen und mit verschiedenen Stromkreisläufen verbunden sind, oder dass sie örtlich auseinander liegen. Eine weitere Unterscheidung wird mit homogenen und heterogenen Speichersystemen festgelegt. Eine homogenes System ist aus identischer Hardware aufgebaut, die mit identischer Software betrieben wird.

Bei den Einstellmöglichkeiten kann man unterscheiden, wie die einzelnen Knoten innerhalb der Speichersysteme miteinander verknüpft sind: lose, sehr eng, offen oder als Eigentum eines anderen Knotens. Das Speichersystem kann dem Unternehmen selbst gehören, es kann ein öffentliches System sein, es kann als Standardsystem ab Lager gekauft werden, oder der Support wird von Drittanbietern geleistet. Ebenfalls eine wichtige Einstellung ist das Backup. Gib es eine lokale oder eine remote Spiegelung, wird das Backup point in time (PIT – zu jeder Sekunde) erstellt, oder werden Snapshots gemacht. Abhängig von den eigenen Anforderungen können mit der richtigen Wahl der Einstellungen große Einsparungen erreicht werden.
Historie von Clustered Storage

Storagesysteme in der allgemeinen Verwendung sind eine neuere Erscheinung. Ursprünglich fanden sie in der High-Performance-Ecke Verwendung. Dort wurden sie von innovativen, kleinen Unternehmen betreut und vertrieben. Mit der wachsenden Menge an unstrukturierten Daten in der Film-, Medien-, Unterhaltungs- und Internetindustrie holten die IT-Verantwortlichen die Systeme aus der High-Performance-Ecke in die allgemeinen Serverräume. Der große Vorteil der Speichersysteme ist, dass sich darauf alle Arten von ungeordneten Daten ablegen und wieder finden lassen. Zudem lässt sich ihre Größe am aktuellen Bedarf orientiert skalieren.

Den Medienbranchen folgte bald ein Paradigmenwechsel. Dieser beruhte auf drei Paradigmen, die sich in den letzten Jahren geändert haben. Erstens wurden die Datenberge immer größer. Dabei wuchsen die Anforderungen an den Datendurchsatz für unstrukturierte Daten. Hinzu kamen neue Arten auf die Daten zuzugreifen und damit die Grenze der monolithischen Speicherinseln wie NAS (Network Attached Storages) und SAN (Storage Area Network). Bei beiden Systemen gab es Verfügbarkeitsengpässe und der Verwaltungsaufwand stieg. Damit erreichten die Kosten immer höhere Ebenen.

Zweitens wurde die Idee des Clustered Computing immer populärer. Diese Idee auf die Speicherindustrie übertragen bedeutet, dass statt einem Mainframe Standardhardware gekauft wird. Diese ist deutlich günstiger und flexibler in der Anpassung. Zusätzlich sind die Entwicklungszyklen bei Hardware rasant gestiegen, sodass es sehr einfach ist, mit geringen Kosten die Speicherlandschaft an der State of the Art Grenze zu halten.

Zum Dritten wurde die Standardhardware in den letzten Jahren immer günstiger und gleichzeitig immer schneller. So ist es inzwischen normal, dass zwei bis drei Generationen einer Hardware gleichzeitig auf dem Markt sind. Abhängig von den Anforderungen kann man günstig eine frühere Generation erwerben.


Bisherige Architekturen

Bevor die Clustered Storage Systeme aus der High-Performance-Ecke der Serverfarmen hervorgeholt wurden, gab es DAS (direct attachted storage), NAS und SAN. Alle diese Lösungen bekommen, bei den Ansprüchen die von ungeordneten Daten gestellt werden, den Charakter von Insellösungen. Ihre Kosten steigen teilweise unkontrollierbar. Aber sie können in den geclusterten Speichersystemen teilweise weiter verwendet werden. Denn die Verwendung von mehreren SANs in einem Cluster kann sich durchaus auf die Leistungsfähigkeit auswirken. Als Einzelsysteme können Sie jedoch die geänderten Anforderungen erfüllen.
Die Vorteile von geclusterten Speichersystemen

Vom technischen Standpunkt gesehen, haben Speichercluster entscheidende Vorteile. Sie sind sehr gut an die jeweiligen Anforderungen anpassbar. Durch diese Möglichkeit der Skalierung können die Kosten ebenfalls sehr gut skaliert wrden. Inzwischen gibt es die Möglichkeit externen Speicher nach Bedarf zusätzlich zu mieten, sodass das eigene Speichersystem immer voll ausgelastet ist. Dank der gesunkenen Hardwarekosten kann man an dieser Stelle sehr viele Ausgaben reduzieren. Zusätzlich gibt es immer mehr standardisierte Software, um ein Speichersystem zu verwalten. Abhängig von der Homogenität oder der Heterogenität des Systems kann man unter mehreren alternativen Betriebssystemen wählen, die für die Datenkonsistenz sorgen. Häufig wählt man dafür auch einen eigenen Metadatenserver, der für die Koordinierung und die Dateisperren zuständig ist. Damit erreicht man eine saubere Trennung der Aufgaben. Diese Trennung führt zu einer einfacheren Wartbarkeit, welche sich in einem reduzierten Schulungsbedarf der IT-Mannschaft niederschlägt. Gleichfalls sinken die Kosten, die für die Verwaltung einer eigenen Speicherlandschaft aufgewandt werden muss.

Insgesamt geht die Entwicklung zu standartisierten Systemen, die einfacher zu handhaben sind, als teure Spezialsysteme. Wer dennoch auf Spezialanwendungen angewiesen ist, kann prüfen, ob Teile davon auf Standardanwendungen zurück geführt werden können. Dadurch wird der spezielle Teil minimierbar und die gesamte Anwendung günstiger. Die eingesparten Kosten können in Weiterentwicklungen und Innovationen investiert werden.

Durch die insgesamt effizientere Auslastung der Systeme wird ein höheres ROI (return on investment) erreicht und der Amortisierungszeitraum der Hardware und Software sinkt.

Be Sociable, Share!

Ersten Kommentar schreiben

Antworten

Deine E-Mail-Adresse wird nicht veröffentlicht.


*