RAID (Redundant Array of Independent Disks), à l'origine connu sous le nom de Redundant Array of Inexpensive Disks, a été proposé pour la première fois par le professeur D. A. Patterson de l'Université de Californie,Berkeley dans l'article "Un cas d'arrangement redondant de disques peu coûteux" en 1988À cette époque, les disques de grande capacité étaient chers, donc l'idée de base de RAID était de combiner organiquement plusieurs disques de petite capacité et relativement peu coûteux pour obtenir la capacité,Performance et fiabilité équivalentes à celles des disques de grande capacité coûteux à moindre coûtAlors que le coût et le prix des disques continuaient à diminuer, le terme "bon marché" perdit de son sens et le RAID Advisory Board (RAB) décida de remplacer "bon marché" par "indépendant".
Cette idée de conception du RAID a été rapidement adoptée par l'industrie. La technologie RAID, en tant que technologie de stockage haute performance et hautement fiable, a été largement appliquée.technologies de mirroring et de parité des données pour atteindre des performances élevées, fiabilité, tolérance aux défauts et évolutivité.Le RAID peut être divisé en différents niveaux pour répondre aux besoins de différentes applications de donnéesLes niveaux RAID originaux RAID1-RAID5 ont été définis dans un article par D. A. Patterson et al., et RAID0 et RAID6 ont été élargis depuis 1988.Les fournisseurs de stockage ont continuellement introduit des niveaux RAID tels que RAID7, RAID10/01, RAID50, RAID53 et RAID100, mais il n'existe pas de norme unifiée.et les quatre niveaux à l'exception de RAID2 ont été définis comme des normes industriellesLes niveaux de RAID les plus couramment utilisés dans le domaine d'application réel sont RAID0, RAID1, RAID3, RAID5, RAID6 et RAID10.
Du point de vue de la mise en œuvre, le RAID est principalement divisé en trois types: RAID logiciel, RAID matériel et RAID hybride.toutes les fonctions sont exécutées par le système d'exploitation et le processeur, et il n'y a pas de puce de contrôle / traitement RAID indépendante et de puce de traitement I / O, de sorte que l'efficacité est la plus faible.Le RAID matériel est équipé d'une puce de contrôle/traitement RAID spéciale et d'une puce de traitement I/O ainsi que d'un tampon de tableau, et n'occupe pas les ressources du processeur, mais le coût est très élevé.et sa performance et son coût sont entre RAID logiciel et RAID matériel.
Chaque niveau RAID représente une méthode et une technologie de mise en œuvre, et il n'y a pas de distinction entre les niveaux élevés et bas.le niveau RAID approprié et la méthode de mise en œuvre spécifique doivent être sélectionnés en fonction des caractéristiques des applications de données utilisateur, et la disponibilité, les performances et le coût devraient être considérés de manière exhaustive.
RAID, c'est-à-dire Redundant Array of Independent Disks, est généralement abrégé en disque array.qui offre des performances de stockage et une technologie de redondance de données supérieures à celles d'un seul disque. RAID est une technologie de gestion multi-disque qui fournit un coût efficace, une fiabilité des données élevée et un stockage de haute performance à l'environnement hôte.un tableau de disques dans lequel une partie de l'espace de stockage physique est utilisée pour enregistrer les informations redondantes des données utilisateur stockées dans l'espace restant. Lorsqu'un disque ou un chemin d'accès échoue, les informations redondantes peuvent être utilisées pour reconstruire les données utilisateur. Bien que le striping de disque ne soit pas conforme à la définition de RAID,Il est aussi appelé RAID (i.e, RAID0).
L'intention initiale de RAID était de fournir des fonctions de stockage haut de gamme et une sécurité de données redondante pour les grands serveurs.Le RAID est considéré comme un espace de stockage composé de deux disques ou plusLa plupart des niveaux RAID ont des mesures complètes de vérification et de correction des données,et même des méthodes de miroir, qui améliorent considérablement la fiabilité du système, et c'est de là que vient " redondant ".
Ici, nous devons mentionner JBOD (Just a Bunch of Disks). initialement, JBOD a été utilisé pour représenter une collection de disques sans logiciel de contrôle pour fournir un contrôle coordonné,qui est le principal facteur distinguant le RAID du JBODÀ l'heure actuelle, JBOD se réfère souvent à une enceinte de disque, indépendamment du fait qu'elle fournisse une fonctionnalité RAID ou non.
Les deux principaux objectifs du RAID sont d'améliorer la fiabilité des données et les performances d'E/S. Dans le tableau de disques, les données sont dispersées entre plusieurs disques, mais pour le système informatique,Ça ressemble à un seul disque.. La redondance est obtenue en écrivant les mêmes données sur plusieurs disques (généralement en miroir) ou en écrivant les données de parité calculées dans le tableau,de sorte que la perte de données ne sera pas causée quand un seul disque échoueCertains niveaux de RAID permettent à plus de disques de tomber en panne en même temps, comme RAID6, où deux disques peuvent être endommagés en même temps.le disque défaillant peut être remplacé par un nouveau disque, et RAID reconstruira automatiquement les données perdues en fonction des données et des données de parité dans les disques restants pour assurer la cohérence et l'intégrité des données.Les données sont dispersées et stockées sur plusieurs disques différents dans RAID, et la lecture et l'écriture simultanées des données est bien meilleure que celle d'un seul disque, de sorte qu'une bande passante d'E/S agrégée plus élevée peut être obtenue.le tableau de disques réduira l'espace de stockage total disponible de tous les disquesPar exemple, l'utilisation de l'espace de stockage de RAID1 n'est que de 50% et RAID5 perdra la capacité de stockage d'un disque,et l'utilisation de l'espace est (n-1)/n.
Le tableau de disques peut assurer le fonctionnement continu du système sans interruption lorsque certains disques (singles ou multiples, selon l'implémentation) sont endommagés.Pendant le processus de reconstruction des données du disque défectueux sur le nouveau disque, le système peut continuer à fonctionner normalement, mais les performances seront réduites dans une certaine mesure.Alors que certains soutiennent l'échange à chaud, permettant le remplacement des disques durs sans se désactiver.et le système ne peut pas être arrêté ou le temps d'arrêt doit être le plus court possible. En général, le RAID ne peut pas remplacer la sauvegarde des données. Il est impuissant pour la perte de données causée par des défaillances non disque, comme les virus, la destruction humaine, la suppression accidentelle, etc. À ce moment,la perte de données est relative au système d'exploitationPour le système RAID lui-même, les données sont intactes et aucune perte n'a eu lieu.la récupération après sinistre et d'autres mesures de protection des données sont très nécessaires, qui complètent le RAID et protègent la sécurité des données à différents niveaux pour éviter la perte de données.
Il existe trois concepts et technologies clés dans le RAID: le mirroring, le striping des données et la parité des données.et d'autre part, il peut lire des données à partir de deux copies ou plus simultanément pour améliorer les performances de lecture.et il faut plus de temps pour s'assurer que les données sont correctement écrites sur plusieurs disques. Le décapage des données stocke des tranches de données sur plusieurs disques différents, et plusieurs tranches de données forment ensemble une copie complète des données,qui est différent des copies multiples du miroir et est généralement utilisé pour des considérations de performance. Le striping des données a une granularité de concurrence plus élevée. Lors de l'accès aux données, il est possible de lire et d'écrire des données sur différents disques en même temps,obtenant ainsi une amélioration très significative des performances d'E/S. La parité de données utilise des données redondantes pour la détection et la réparation d'erreurs de données. Les données redondantes sont généralement calculées par des algorithmes tels que le code Hamming et l'opération XOR.L'utilisation de la fonction de parité peut améliorer considérablement la fiabilitéCependant, la parité des données doit lire des données à partir de plusieurs endroits et effectuer des calculs et des comparaisons, ce qui affectera les performances du système.Différents niveaux de RAID adoptent une ou plusieurs des trois technologies ci-dessus pour obtenir une fiabilité des données différentePour ce qui est du type de RAID (même de nouveaux niveaux ou types) à concevoir ou du mode de RAID à adopter,il est nécessaire de faire un choix raisonnable en partant du principe d'une compréhension approfondie des exigences du système et d'une évaluation exhaustive de la fiabilité, performance et coût pour faire un choix de compromis.
-
Une grande capacité: C'est un avantage évident du RAID. Il élargit la capacité du disque, et le système RAID composé de plusieurs disques a un énorme espace de stockage. Maintenant, la capacité d'un seul disque peut atteindre plus de 1 To,la capacité de stockage de RAID peut atteindre le niveau PBEn général, la capacité disponible du RAID est inférieure à la capacité totale de tous les disques membres.Différents niveaux d'algorithmes RAID nécessitent une certaine redondance des frais générauxSi l'algorithme RAID et la capacité sont connus, la capacité disponible de RAID peut être calculée.l'utilisation de la capacité de RAID est comprise entre 50% et 90%.
-
Des performances élevées: Les performances élevées du RAID bénéficient de la technologie de striping des données.et est souvent le goulot d'étranglement de la performance du système. Grâce à l'extraction de données, le RAID distribue les données d'E/S à chaque disque membre, obtenant ainsi une performance d'E/S agrégée plusieurs fois supérieure à celle d'un seul disque.
-
La fiabilité: La disponibilité et la fiabilité sont d'autres caractéristiques importantes du RAID. En théorie, la fiabilité d'un système RAID composé de plusieurs disques devrait être pire que celle d'un seul disque.Il y a une hypothèse implicite ici: une seule panne de disque provoquera l'indisponibilité de l'ensemble du RAID. Le RAID utilise des technologies de redondance de données telles que le mirroring et la parité des données pour briser cette hypothèse.Le mirroring est la technologie de redondance la plus primitive., qui copie complètement les données d'un certain groupe de disques sur un autre groupe de disques afin de s'assurer qu'il y a toujours une copie de données disponible.Comparé aux frais généraux de redondance de 50% du mirroring, la parité des données est beaucoup plus faible, et elle utilise les informations de parité redondantes pour vérifier et corriger les données.La technologie de redondance du RAID améliore considérablement la disponibilité et la fiabilité des données, et assure que lorsque plusieurs disques tombent en panne, les données ne seront pas perdues et le fonctionnement continu du système ne sera pas affecté.
-
Gestionnabilité: En fait, RAID est une technologie de virtualisation qui virtualise plusieurs disques physiques en un disque logique de grande capacité.Disque dur de grande capacité rapide et fiableDe cette façon, les utilisateurs peuvent organiser et stocker les données du système d'application sur ce lecteur virtuel.Depuis que RAID a effectué une grande quantité de travail de gestion de stockage en interne, l'administrateur n'a besoin que de gérer un seul lecteur virtuel, ce qui peut économiser beaucoup de travail de gestion.RAID peut ajouter ou supprimer dynamiquement les disques et effectuer automatiquement la vérification des données et la reconstruction des données, ce qui peut grandement simplifier le travail de gestion.