Les systèmes RAID Sites sur le même sujet Télécharger des documentations

Présentation de la technologie RAID

La technologie RAID (acronyme de Redundant Array of Inexpensive Disks, parfois Redundant Array of Independant Disks, traduisez Ensemble redondant de disques indépendants) permet de constituer une unité de stockage à partir de plusieurs disques durs. L'unité ainsi créée (appelée grappe) a donc une grande tolérance de panne sans perte de données, ou bien une plus grande capacité d'écriture. La répartition des données sur plusieurs disques durs permet donc d'augmenter la sécurité de ces données et la fiabilité des services associés.

Cette technologie a été mise au point à l'Université de Californie (Berkeley) en 1988. Elle consiste à constituer un disque de grosse capacité (donc coûteux) à l'aide de plus petits disques peu onéreux (c'est-à-dire dont le MTBF, Mean Time Between Failure, soit le temps moyen entre deux pannes, est faible).

Les disques assemblés selon la technologie RAID peuvent être utilisés de différentes façons, appelées Niveaux RAID. L'Université de Californie en a défini 4, auxquels ont été ajoutés les niveaux 0 et 6. Chacun d'entre-eux décrit la manière de laquelle les données sont réparties sur les disques:

Chacun de ces niveaux constitue un mode d'utilisation de la grappe, fonction:

Niveau 0

Le niveau 0, appelé stripping (traduisez entrelacement) consiste à stocker les données en les répartissant sur l'ensemble des disques de la grappe, en les synchronisant. De cette façon, il n'y a pas de redondance, on ne peut donc pas véritablement parler de système RAID. En effet en cas de défaillance de l'un des disques, l'ensemble des données réparties sur les disques seront perdues. Toutefois, étant donné que chaque disque de la grappe a son propre contrôleur, cela constitue une solution offrant une vitesse de transfert élevée.

On parle de facteur d'entrelacement pour désigner la taille du fragment stocké sur chaque unité physique. Le débit de transfert moyen dépend de ce facteur (plus il est petit meilleur est le débit).

Le RAID 0 consiste ainsi en la juxtaposition logique de plusieurs disques durs physiques:

Niveau 1

Le niveau 1 a pour but de dupliquer l'information à stocker sur plusieurs disques, on parle donc de mirroring, ou shadowing pour désigner ce procédé.
On obtient ainsi une plus grande sécurité des données, car si l'un des disques tombe en panne, les données sont sauvegardées sur l'autre. D'autre part, la lecture peut être beaucoup plus rapide lorsque les deux disques sont en fonctionnement. Enfin, étant donné que chaque disque possède son propre contrôleur, le serveur peut continuer à fonctionner même lorsque l'un des disques tombe en panne, au même titre qu'un camion pourra continuer à rouler si un de ses pneus crève, car il en a plusieurs sur chaque essieu...

En contrepartie la technologie RAID1 est très onéreuse étant donné que seule la moitié de la capacité de stockage n'est effectivement utilisée.

Niveau 2

Ce niveau RAID est désormais obsolète, car il propose un contrôle d'erreur par code de Hamming (codes ECC - Error Correction Code), or ce dernier est actuellement intégré dans les contrôleurs de disques.

Cette technologie consiste à stocker les données selon le même principe qu'avec le RAID 0 mais en écrivant sur une unité distincte les bits de contrôle ECC (généralement 3 disques ECC sont utilisés pour 4 disques de données).

La technologie RAID 2 offre de piètres performances mais un niveau de sécurité élevé.

Niveau 3

Le niveau 3 propose de stocker les données en bytes sur chaque disque et de dédier un des disques au stockage d'un bit de parité. De cette manière, si l'un des disques venait à défaillir, il serait possible de reconstituer l'information à partir des autres disques. Après "reconstitution" le contenu du disque défaillant est de nouveau intègre. Par contre, si deux disques venaient à tomber en panne simultanément, il serait alors impossible de remédier à la perte de données.

Niveau 4

Le niveau 4 est très proche du niveau 3. La différence se trouve au niveau de la parité, qui est faite sur un secteur (appelé bloc) et non au niveau du bit, et est stockée sur un disque dédié. C'est-à-dire plus précisément que la valeur du facteur d'entrelacement est différente par rapport au RAID 3.

Ainsi, pour lire un nombre de blocs réduits, le système n'a pas à accéder à de multiples lecteurs physiques, mais uniquement ceux sur lesquels les données sont effectivement stockées.

Niveau 5

Le niveau 5 est similaire au niveau 4, c'est-à-dire que la parité est calculée au niveau d'un secteur, mais répartie sur l'ensemble des disques de la grappe.

De cette façon, RAID 5 améliore grandement l'accès aux données (aussi bien en lecture qu'en écriture) car l'accès aux bits de parités est réparti sur les différents disques de la grappe.

Niveau 6

Le niveau 6 a été ajouté aux niveaux définis par Berkeley. Il définit l'utilisation de 2 fonctions de parité, et donc leur stockage sur deux disques dédiés. Ce niveau permet ainsi d'assurer la redondance en cas d'avarie simultanée de deux disques.

Comparaison

Les solutions RAID généralement retenues sont le RAID de niveau 1 et le RAID de niveau 5.

Le choix d'une solution RAID est lié à trois critères :

Mise en place d'une solution RAID

Il existe trois façon différentes de mettre en place une solution RAID sur un serveur :


© Copyright 2001 Jean-François Pillou
Ce document issu de CommentCaMarche.net est soumis à la licence GNU FDL.Permission vous est donnée de distribuer, modifier des copies de cette page tant que cette note apparaît clairement.