Raid systeme
RAID Systeme
Redundant Array
of
Independent Disks
Autoren: Timm Schöning
Stefan Berntheisel
Klasse: 11IT3b
Stand: Dezember 2003
Inhaltsverzeichnis
Inhaltsverzeichnis 2
Einleitung 3
Die Bezeichnung RAID 3
Was ist RAID ? 3
Warum RAID ? 3
Was bietet RAID ? 4
Beschreibung der RAID- Level 4
RAID 0 oder Data Striping (Non-Redundant Striped-Set) 4
RAID 1 oder Drive Mirroring/ Duplexing 4
RAID 2 oder Hamming System 5
RAID 3 oder Byte Striping with Parity 6
RAID 4 oder Block Striping with Parity 6
RAID 5 oder Block Striping with distribute Parity 7
RAID 6 (Gruppierung der Disks mehrere Paritäten) 8
RAID 7 (Asynchron, Cache und Parity Verteilung) 8
RAID 10 (Mirrored Striping Array) 8
RAID Erweiterungen 8
Hot spare / Hot standby 8
Hot-swap / Hot plugable 8
Tabellarische Übersicht der standardisierten RAID- Systeme 9
RAID- Zukunft und Weiterentwicklung 9
Arten von RAID -Systemen 10
Software RAID 10
Hardware RAID 10
- Host- basierende RAID- Lösungen 10
- Plattformunabhängige Disk Arrays 10
- Fibre Channel 10
Einleitung:
Die Bezeichnung RAID
Die Abkürzung RAID bedeutet im englischen soviel wie „Angriff“ oder „Überfall“. Die Buchstaben stehen für Redundant Array of Independent Disk zu Deutsch: Fehlertoleranter Stapel unabhängiger Festplatten. Früher stand das I für Inexpensive (preisgünstig) , aber da sich große und kleine Plattenlaufwerke heute kaum noch in Sachen Zuverlässigkeit und Preis/Megabyte unterscheiden, tauschte man die Bezeichnung in Independent (Unabhängig / Selbständig).
Was ist RAID ?
Im Jahre 1987 entwickelte eine Gruppe von Wissenschaftler der Universität in Berkley/Kalifornien ein Konzept der RAID- Technologie. Die Herren Patterson, Gibson und Katz stellten Vergleiche über eine Verbund von kleineren Festplatten gegenüber großen Festplatte (SLED = Single Large Expensive Drive) an, wie sich diese in Bezug auf Kosten, Leistung, Datensicherheit und Flexibilität verhalten. Das Resultat war, daß man mit mehrere kleineren Festplatten gleiche oder sogar bessere Werte erzielte, als mit den großen (SLED).
Lediglich im Bezug auf die Ausfallrate (MTBF = Mean Time between Failtures) schnitten die kleineren Platten schlechter ab.
Da es im Jahre 1988 einen Wildwuchs an inkompatiblen RAID- Systeme, von vielen Herstellern gab, sorgte dies für große Verwirrung, Unsicherheit und Kaufabstinenz bei den Anwendern. So schlossen sich im August 1992 die 8 Firmen (AIWA/CORE, Array, Data Genaral, ENDL, IBM, Segate, Symbios Logic/NCR, Technology Forums) zum RAB (RAID Advisory Board) zusammen, mit dem Ziel der Standardisierung, Zertifizierung und Ausbildung der RAID- Technologie.
Ein RAID- Array verbindet mehrere Festplatten zu einer logischen Einheit, wobei die Fehlertoleranz, Geschwindigkeit oder Kapazität primär optimiert werden soll. Es gibt verschiedene RAID-Levels die wiederum verschiedene Merkmale besitzen. Je nach dem Ziel der Optimierung und der Einsatzmöglichkeit wird die Entscheidung für den bestmöglichen RAID- Level fallen.
Warum RAID ?
Um in der heutigen Zeit der enorm wachsenden Anforderungen am Speicherbedarf und Datensicherheit in Netzen, wie zum Beispiel für Video on Demand, Audio- Video- Anwendungen, Online Datenbanken und Multimedia, zu gewährleisten bieten RAID- System eine optimale Verfügbarkeit der Daten, sowie eine Permanente Zugriffsmöglichkeit. Da mit RAID Systemen der Datenverlust stark eingeschränkt werden kann, ist es möglich durch Ausfallzeit enorme Unkosten zu vermieden. Mit Kapazitäten im Terrabyte Bereich und einer extrem hohen Datenübertragung mit Hilfe von Fibre Channel, bewältigen RAID- Lösungen diese immer großer werdende Datenflut!
Was bietet RAID ?
Absicherung gegen Ausfall einer Festplatte
Aufbau großer, logischer Laufwerke
Erhöhung der Datensicherheit durch Redundanz
Ständige Datenverfügbarkeit
Steigerung der Transferraten durch Parallelisierung
Beschreibung der RAID- Level
RAID 0 oder Data Striping (Non-Redundant Striped-Set)
Zwei oder mehrere zusammen geschaltete Festplatten, bei denen die Nutzdaten (ABCD..) in kleinere Blöcke (4-128 KB) aufgeteilt werden. Diese Blöcke werden abwechselnd auf den unterschiedlichen Platten des Array gespeichert.
Für den Anwender und das System werden die Daten auf einer einzigen logischen Platte dargestellt. Hierbei entsteht keine Redundanz der Daten, es dient einzig und allein der Performancesteigerung beim Schreiben und Lesen und einer 100%tige Ausnutzung der Speicherkapazität, fällt dabei eine Festplatte aus, sind alle Daten verloren.
RAID 1 oder Drive Mirroring / Duplexing
Das RAID Level 1 Verfahren ist das älteste. Dieses Verfahren arbeitet mit Plattenspiegelung. In diesem System werden identische Daten auf zwei Festplatten gespeichert (100 % Redundanz). Fällt eine der beiden Festplatten aus, arbeitet das Betriebssystem mit der verbleibenden Festplatte weiter.
Wegen einer 50%tigen Ausnutzung der Speicher-kapazität wird dieses System meist nur in kleineren Servern eingesetzt, da es schnell sehr teuer werden kann. Beim Duplexing hat jede Platte ihren Controller.
RAID 2 oder Hamming System
Im RAID Level 2 wird eine parallele Zugriffstechnik eingesetzt. Typischerweise sind die Schreib-Leseköofe der individuellen Platten synchronisiert. Bei diesem Verfahren werden die einzelnen Daten in Bytes aufgeteilt und auf den Festplatten des Arrays geschrieben, dabei wird der ECC (Error Correction Code) nach einem Hamming Algorithmus berechnet und auf zusätzliche Festplatten gespeichert. Wird ein 1-Bit-Fehler festgestellt, kann der Controller sofort den Fehler lokalisieren und korrigieren, so daß die Lesezugriffszeit nicht beeinträchtig wird.
Heutzutage haben alle Massenspeicher ein ECC Verfahren integriert, so das eine Korrektur einzelner Bitfehler ein RAID 2 überflüssig macht.
RAID 3 oder Byte Striping with Parity
Auch im RAID 3 werden die anffallenden Daten parallel auf die Laufwerke geschrieben oder von dort gelesen. In einer RAID 3 Konfiguration werden die Daten in einzelne Bytes aufgeteilt und dann abwechselnd auf die Festplatten geschrieben, hierbei wird ein Parity Byte (XOR) für jede Datenreihe auf einer zusätzlichen Festplatte gespeichert. Bei Ausfall einer Platte, können die Daten aus den übrigen Nutzdaten und der gespeicherten Parity Information wieder berechnet werden. Es kann nur ein Schreib- oder Lesezugriff gleichzeitig stattfinden. Da moderne Betriebssysteme und Festplatten nicht mehr mit einzelnen Bytes, sondern mit Blöcken arbeiten, findet RAID 3 kaum noch Anwendung.
RAID 4 oder Block Striping with Parity
RAID 4 unterscheidet sich von RAID 3, daß die Daten in größere Blöcke (8, 16, 64 oder sogar 128 KB) anstatt in Bytes auf den Festplatten gespeichert werden. Ein Parity Block (vergleichbar mit der Summe der Daten aus dieser Zeile) wird berechnet und auf der Parity Festplatte gespeichert. Im RAID Level 4 wird ein unabhängige Zugriffstechnik eingesetzt. Dabei operiert jede Platte im Array unabhängig von den anderen. Bei großen sequentiellen Lese- Schreibzugriffen ist die Performance sehr gut, doch bei verteilten Zugriffen ist auch ein Zugriff auf den zugehörigen Parity Block notwendig (Prüfsumme erneut berechnen!), so das die Geschwindigkeit gebremst wird. Da diese Lösung (wie auch RAID 3) eine gute Performance, bei großen zusammenhängenden Daten, bietet wird sie gerne bei der Bildverarbeitung und oder im CAD-Bereich eingesetzt.
RAID 5 oder Block Striping with distribute Parity
Im Unterschied zu RAID 4 wird hier der Parity Block über die Festplatten verteilt. Jedes Laufwerk ist damit für einen Blockbereich Parity Laufwerk. Dies beschleunigt verteilte Schreibzugriffe, da es keine dedizierte Festplatte mehr gibt, welche zu einem Flaschenhals werden könnte. Die Festplatten werden nun gleichmäßig belastet und somit wird die Gesamt- Performance gesteigert. Deshalb ist RAID 5 das typische RAID- System, das bei Servern mit hohen Speicherkapazität verwendet wird. Besonderst für viele Zugriffe auf kleine Datenmengen geeignet, daher wird diese Variante gerne in Datenbanken eingesetzt.
RAID 6 (Gruppierung der Disks, mehrere Paritäten)
Erweiterung zu RAID 5, wobei die Festplatten in Gruppen eingeteilt werden. Hierbei dürfen so viele Festplatten gleichzeitig defekt gehen, wie Gruppen vorhanden sind, weil jede Gruppe ihre eigene Parity- Information hat. Zur Berechnung der Checksummen wird der Algorithmus von Reed-Solomon benutzt. Er berechnet zwei voneinander unabhängige Checksummen.
RAID 7 (Asynchron, Cache und Parity Verteilung)
RAID 7 ist zur Zeit noch nicht im RAB- Standard (aber im Gespräch !), es handelt sich hierbei um eine proprietäre Implementierung der Storage Computer Corp., sie baut auch auf den Level 5 auf und enthält eine Steuereinheit mit einem Echtzeit-betriebsystem, schnelle Datenbusse und mehrere größere Pufferspeicher.
Die Daten aus dem Puffer sind von den Platten und dem Bus entkoppelt (asynchron). Hierdurch erfolgt eine erhebliche Beschleunigung gegenüber den anderen Verfahren. Die Paritätsinformationen können auf ein oder mehreren Platten (RAID 6) generiert werden und gleichzeitig können mehrere RAID- Level genutzt werden.
RAID 10 oder 0+1 (Mirrored Striping Array)
RAID 10 ist eigentlich nur ein Zusammenschluss von RAID 1 und RAID 0 hiermit wollte man die Eigenschaften beider RAID-Systeme koppeln. Sicherheit und sequentielle Performance. RAID 10 ist besonders geeignet, wenn große Dateien redundant gespeichert werden sollen, da keine Parity berechnet werden muss, sind Schreibzugriffe sehr schnell.
Allerdings gehen 50 Prozent der Gesamtkapazität (wie bei RAID 1) für die Redundanz verloren. RAID 10 ist für Systeme kleinerer Nutzkapazität geeignet bei denen optimaler Datendurchsatz mit optimaler Datensicherheit verknüpft werden soll.
RAID Erweiterungen
Hot-swap / Hot plugable
Dies bietet Möglichkeit eine Komponente während des Betriebes ohne Ausschalten auszutauschen. Die neue Festplatte wird dann automatisch von dem Controller mit den entsprechenden Daten wiederhergestellt.
Hot spare / Hot standby / Hot FixZum vorhanden RAID- System wird eine zusätzliche Festplatte hinzugefügt, die jederzeit bereit ist und wird im Fehlerfall aktiv wird. Diese Aufgabe wird direkt vom Controller übernommen.
Er deaktiviert die defekte Festplatte im RAID Verband und aktiviert gleichzeitig die Reservefestplatte. Nun baut er die „neue“ Festplatte genauso auf wie die ausgefallene.
Tabellarische Übersicht der standardisierten RAID- Systeme
RAID Level
0
1
2
3
4
5
6
Redundanz
0
*
*
*
*
*
*
Striping
*
0
*
*
*
*
*
Parity
0
0
Hamming
XOR
XOR
XOR
Reed
Min. Anz - / gesamt Disk
2 /
+0
2 /
x2
3 /
+n
3 /
+1
3 /
+1
3 /
+1
6 /
+ Grp.-Anzahl
Performance
+++++
++++
++
++
++
+++
+
Sicherheit
-
++
+
+
+
+
+++
Beschreibung
Verteilung auf alle Platten
Spiegelung
Haming-Code (ECC)
Byte Verteilung mit Parity
Block Verteilung mit Paryty
Block und Parityverteilung
Asynchron, / Caching und Parity verteilung
RAID- Zukunft und Weiterentwicklung
Verbesserte Zugriffsschutzmechanismen
Verbesserung der Ausfallsicherheit (kein singulärer Fehlerpunkt)
Hierarchische Speicherorganisation (HSM)
Intelligente Speicherverwaltungssysteme
Beschleunigung der Paritätsbildung
Optimierung der Cache- Funktion
Automatische (Re-)Konfiguration bei Laufwerkswechsel
Speicherlaufwerke direkt am Netz ohne Server (NAS)
Arten von RAID -Systemen
Software RAID
Eine Softwarelösung wird durch ein Treiberprogramm (Netzwerk Betriebsystemen wie NetWare und WinNT bereits integriert) realisiert, die RAID Funktionalität wird von der CPU des Systems gemanagt. Eine redundante Absicherung des Betriebssystems ist somit nicht gegeben.
Dies ist eine sehr billige Lösung, denn es wird nur ein SCSI- Adapter benötigt.
Hardware RAID
Die Funktionalität bei der Hardwarelösung wird eigens auf dafür entwickelten Controllern ausgeführt und sind vollständig unabhängig vom Betriebssystem. Das bedeutet, daß das RAID- System noch bevor das Betriebssystem geladen wird in vollem Umfang zur Verfügung steht und somit auch die Bootplatte direkt nach dem Einschaltet durch Redundanz abgesichert ist.
Host- basierende RAID- Lösungen
Hier wird der Controller direkt in den Bus (PCI, EISA) des Servers eingesteckt. Durch die direkte Anbindung erreicht man die maximal möglichen Transferraten (bei 64 Bit PCI bis zu 264 MB/s) und ist bei der Konfiguration des RAID selbst sehr flexibel. Es können Platten sowohl in den Server integriert, als auch alternativ in ein externes Gehäuse eingebaut werden.
Plattformunabhängige Disk Arrays
Die Festplatten und der RAID- Controller, welcher sämtliche RAID- Funktionen übernimmt, werden in einem externen Gehäuse untergebracht, und über einen SCSI-BUS an den Server angebunden. Dies bietet den Vorteil, das ein System Anbindung findet, für das es keine HOST- basierenden RAID- Controller gibt. Eine Erweiterung ist die SAF-TE Technik (SCSI Accessed Fault-Tolerant Enclosure), hier wird ein zusätzliches SCSI Gerät Integriert, welches die Überwachung von Temperatur, Lüfter, Netzteile, Einschübe usw. übernimmt und mit dem Controller kommuniziert. Je nach SCSI-BUS ist ein Anschluß von maximal 15 Geräten und einer Übertragungs-geschwindigkeit von 80 MB/s möglich.
Fibre Channel
Im Gegensatz zur SCSI- Technologie handelt es sich hierbei um einen Seriellen BUS.
Die Übertragung kann sowohl über Kupfer als auch über Glasfaser erfolgen. Diese High-End Technologie bietet eine mögliche Bandbreite bis zum 1 GByte/s und einen Anschluß von bis zu 126 Geräten. Bei FC-AL ( Fibre Channel Arbitrated Loop) handelt es sich um die zur Zeit verbreitetste Variante. Die FC-AL Geräte werden über einen Hub mit einer PCI-Interface-Karte des Rechners verbunden. Eine 100 MB/s Verbindung kann über ein 25m Kupferkabel bzw. eine 10 Km Fibre-Optic-Leitung realisiert werden.
Quellen:
Bücher:
TecChannel – RAID im Überblick
Telekom Schulungsunterlagen – RAID
SCSI von Gary Field, Peter Ridge
Internet:
https://www.raidweb.com/whatis.html
https://www.icp-vortex.com/download/pdf/raid_d.
pdf
https://www.tecchannel.de/hardware/422/1.html
Anmerkungen: |
| impressum | datenschutz
© Copyright Artikelpedia.com