Xpose - Introduction à la sauvegarde réseau...
Transcript of Xpose - Introduction à la sauvegarde réseau...
Introduction à la sauvegarde réseauPrésentation des solutions NAS et SAN Kevin CORNILLEAU, IR36 janvier 2009
Introduction à la sauvegarde réseau
Le contexte
Les principesLes FS partagés et répartisObjectifs du stockage de données Calcul du MTBF
Les technologies
Le RAIDSCSIFibre Channel
Des solutions
Les NASLes réseaux SAN
Kevin CORNILLEAUIR3 6 janvier 2009
Le contextetechnique et historique
Les systèmes de stockageDéfinition
Les systèmes de stockage sont un ensemble d'équipements informatiques - ordinateur, connexion réseau, médias de stockage - et de logiciels appropriés, responsables du stockage à long terme de grandes masses d'informations et de leur accès.
Kevin CORNILLEAUIR3 6 janvier 2009
Le contextePetit historique des supports de stockage
Kevin CORNILLEAUIR3 6 janvier 2009
"emprunté" àhttp://ed-thelen.org/RAMAC
"Notre civilisation a produit plus d'informations durant ces 30 dernières années que pendant les 5000 ans qui les ont précédées." Jacques Péping in Solutions de stockage
Le contexteExplosion des données en volume comme en importance
Évolution rapide du monde de l'informatiqueTaux d'augmentation des données de 50 à 100% / an
augmentation du nombre de postes de travailaugmentation des puissances de calculnumérisation des donnéesinformatisation des tâches
Kevin CORNILLEAUIR3 6 janvier 2009
Le contexteExplosion des données en volume comme en importance
Aujourd'hui 1 Go ~ 10 centimes.
Prise de concience de l'importance des données
Baisse du coût à l'achat, mais pas nécessairement à la gestion
Kevin CORNILLEAUIR3 6 janvier 2009
Le contexteExplosion des données en volume comme en importance
Où mettre les données ?une ou plusieurs machines ?quel type de media ?
Comment organiser les données ?
Comment gérer les données ?les conserver préserver leur intégrité répondre aux besoins de croissance
Comment permettre aux utilisateurs d'y accéder ?
Kevin CORNILLEAUIR3 6 janvier 2009
Le contexteProblème de la centralisation des informations
Phénomène de balancier : reflet des modes de travail 80-90 : modèle des terminaux autour d'un serveur central 90-00 : distribution de l'information sur les postes de travail personnels
Aujourd'hui : travail collaboratif, serveurs de sauvegarde centralisée
Kevin CORNILLEAUIR3 6 janvier 2009
Les principesintervenant dans le stockage de données
Les systèmes de fichiers répartisPrincipes de bases
Les informations peuvent être réparties sur plusieurs machinesArchitecture client/serveur
Statuts non exclusifsSystème de fichiers virtuel
Transparence de l'emplacementRéalisé sous UNIX par la création d'une structure d'adressage du fichier vnode indépendante du système de gestion de fichiers
Kevin CORNILLEAUIR3 6 janvier 2009
Évolutions de l'accès aux fichiersVers les systèmes de fichiers répartis
Jusqu'au années 70
Kevin CORNILLEAUIR3 6 janvier 2009
Le mainframe est remplacé par plusieurs mini-ordinateurs
Chacun des mini-ordinateurs est relié à quelques dizaines de terminaux
Ceux-ci peuvent communiquer grâce à un réseau éthernet
Kevin CORNILLEAUIR3 6 janvier 2009
Évolutions de l'accès aux fichiersVers les systèmes de fichiers répartis
Apparition des PC et workstations
Les postes de travail sont autonomes
Pas de travail collaboratif
Kevin CORNILLEAUIR3 6 janvier 2009
Évolutions de l'accès aux fichiersVers les systèmes de fichiers répartis
Apparition des réseaux locaux reliant les stations de travail et des workgroups
Création d'"entités d'administration"
Partage de fichiers à l'intérieur d'un groupe
Kevin CORNILLEAUIR3 6 janvier 2009
Évolutions de l'accès aux fichiersVers les systèmes de fichiers répartis
Extension du réseau local à des réseaux hétérogènes
Répartition des petites tâches en local et traitements plus lourds aux calculateurs
Révolution en capacité et volume
Aucun changement logique dans les modes de travail
Kevin CORNILLEAUIR3 6 janvier 2009
Évolutions de l'accès aux fichiersVers les systèmes de fichiers répartis
Le stockage de donnéesObjectifs de la gestion du stockage de données
Les solutions d'accès aux données sont très fortement sollicitées.
Intégritéoffrir une durée de vie infinie aux données"les données doivent survivre aux incidents matériels"
Sécuritécontrôler qui accède aux données et avec quel niveau de droit
Kevin CORNILLEAUIR3 6 janvier 2009
Le stockage de donnéesObjectifs de la gestion du stockage de données
Performancel'architecture doit être dimensionnée en rapport avec les performances attendues
Transparence
l'utilisateur accédant aux données n'a pas à savoir :les accès concurrentsoù et comment les données sont stockées
Limitation des coûts
une bonne architecture de stockage doit permettre le stockage de grands volumes pour des coûts réduits
Kevin CORNILLEAUIR3 6 janvier 2009
Les systèmes de fichiers partagésConcept
Les informations sont "partagées" sur plusieurs machines/supports selon des critères
faible latence pour les petits transferts
haut débit pour les transferts importants
Kevin CORNILLEAUIR3 6 janvier 2009
Évaluation de la durée de vie d'un disqueLe MTBF
Mean Time Between Failures
Indice de calcul de la durée de fonctionnement moyenne d'un système entre 2 pannes
Evalué en fonctionnement "normal"
/!\ MTBF différent de la durée de vie de disques !
Kevin CORNILLEAUIR3 6 janvier 2009
Exemple d'applicationsoit un disque avec un MTBF d'1 million d'heuressa durée de vie est de quelques années
Si nous avons 1000 disques de ce type qui fonctionnent pendant 5 ans
Notons que l'homogénéité est respectée !
Kevin CORNILLEAUIR3 6 janvier 2009
Évaluation de la durée de vie d'un disqueLe MTBF
Les technologiesdu stockage de données
Les technologies employéesRedundant Array of Inexpensive Disks
Combiner plusieurs disques durs en une seule unité de stockage
Une partie de l'espace est souvent réservée pour faire de la redondance
Avantages
souplessetolérance aux pannesperformance
Soutenu par le RAB (Raid Advisory Board)
Kevin CORNILLEAUIR3 6 janvier 2009
Rappels sur le RAIDRAID 0
Concaténation des espaces disques
Travail parallèle de n disques Rapidité des accès Aucune protection (moins fiable qu'un seul disque)
Kevin CORNILLEAUIR3 6 janvier 2009
"emprunté" àhttp://www.generation-nt.com
Rappels sur le RAIDRAID 1
Copie miroir
Capacité = Capacité du plus petit élément de la grappeAccepte défaillance de n-1 élémentsCoûts élevés
Kevin CORNILLEAUIR3 6 janvier 2009
"emprunté" àhttp://www.generation-nt.com
Rappels sur le RAIDRAID 1/0 ou RAID 10
Concaténation et copie miroir Au moins 4 disquesBonne tolérance aux pannesBonnes performances lors de la reconstructionCapacité = n*c/2Coûteux
Kevin CORNILLEAUIR3 6 janvier 2009
Rappels sur le RAIDRAID 0+1
Concaténation et copie miroir Au moins 4 disques1 disque défectueux => défaut de la grappeReconstruction longue et coûteuseIntérêt : sauvegarde instantanéeCapacité = n*c/2
Kevin CORNILLEAUIR3 6 janvier 2009
"emprunté" àhttp://www.generation-nt.com
Rappels sur le RAIDRAID 5
Protection des données par calcul de parité répartie
Au moins 3 disquesCapacité = (n-1)*cBonnes performances en lecturePénalité en écritureAccepte défaillance de n-1 éléments
Meilleurs performances pour 5, 9 et 14 disques
Kevin CORNILLEAUIR3 6 janvier 2009
"emprunté" àhttp://www.generation-nt.com
Démonstration de la technologie RAID
Démonstration de la technologie RAIDCe que nous venons de faire...
Kevin CORNILLEAUIR3 6 janvier 2009
Les technologies employéesLa technologie SCSI
Small Computer System Interface
Interface parallèle très utilisée pour les périphériques de stockage
Jusqu'à 640 Mo/s
Longueur jusque 20m
On lui préfère aujourd'hui des liaisons FC
Kevin CORNILLEAUIR3 6 janvier 2009
Connecteurs SCSI 25-50 broches "emprunté" àhttp://fr.wikipedia.org
Les technologies employéesLe protocole Fibre Channel
Kevin CORNILLEAUIR3 6 janvier 2009
Protocole indépendant du support (fibre/cuivre)
Conçu pour les superordinateurs, il est devenu le standard des réseaux SAN
Les technologies employéesLe protocole Fibre Channel
Kevin CORNILLEAUIR3 6 janvier 2009
3 topologies :point à point : les périphériques sont reliés directement entre eux.en boucle (Arbitred Loop ou FC-AL) : tous les périphériques sont reliés (max. 126).La boucle est réalisée par un élément hub. switchée ou commutée (Fabric) : on utilise dans ce cas un switch Fibre Channel (max. théorique 16 millions).
Les technologies employéesLe protocole Fibre Channel
Kevin CORNILLEAUIR3 6 janvier 2009
Composé de 5 couches
Interface avec les applications
Bas-niveau : transport des données
Les technologies employéesLa media Fibre Channel
2 types de fibremultinodemononode
Coeur de l'ordre de la dizaine de microns
Débit de 1 à 8 Gbit/s
Sur plusieurs kilomètres (répéteurs possibles)
Support des protocoles de type canal d'entrée/sortie et réseau
Kevin CORNILLEAUIR3 6 janvier 2009
Fibre optiqueimage sous licence Creative Commons"emprunté" àHustvedt, http://commons.wikimedia.org
Les technologies employéesLe switch Fibre Channel
Kevin CORNILLEAUIR3 6 janvier 2009
Rôle similaire au switch ethernet
Chaque device fibre est appelé noeud
Chaque noeud possède un numéro d'identification unique appelé World Wide Nameet permettant son identification dans le réseau
Des solutionsPrésentation des NAS et SAN
Les solutions SAN et NASPrésentation
Répondent aux aspects suivant :
performance
sécurité et intégrité
souplesse de gestion
économie
Kevin CORNILLEAUIR3 6 janvier 2009
NASPrésentation
Network Attached Storage
Périphérique du réseau de stockage
Fournit un gros volume de stockage à des clients réseaux hétérogènes
Kevin CORNILLEAUIR3 6 janvier 2009
NASPrésentation
Généralement composés de DD
Plusieurs interfaces :SCSIFCSAS, SATA, IDE
Technologie RAID employée pour la fiabilisation
Un OS spécifique (par exemple NASLite)
Un NAS peut être intégré à un SAN
Kevin CORNILLEAUIR3 6 janvier 2009
Le choix est fait en fonction du rapport coût/performance recherché
NASPrincipe de fonctionnement
Ressource directement disponible sur le réseau ethernet
Intègre le support de systèmes de fichiers réseau tels que CIFS (Common Internet File System), NFS (Network File System) ou AFP (AppleShare File Protocol)
Joue le rôle de serveurs de fichiers partagés
Kevin CORNILLEAUIR3 6 janvier 2009
SANPrésentation
Storage Area Network : réseau dédié au stockage
S'appuie sur le protocole FC
Composé :d'un ou plusieurs fabricsde plusieurs baies (bandes ou disques)de serveursde hubs/bridges fibres
Utilisation du support fibre OU cuivre
Kevin CORNILLEAUIR3 6 janvier 2009
SANRéseau de stockage "type"
Kevin CORNILLEAUIR3 6 janvier 2009
SANLa baie de stockage
Kevin CORNILLEAUIR3 6 janvier 2009
SANLa baie de stockage
Schéma de câblage d'une baie SAN
Câblage fibre
Redondance des éléments et des accès
Kevin CORNILLEAUIR3 6 janvier 2009
Schéma de câblaged'une baie EMC² Clariion
SANLa baie de stockage
Kevin CORNILLEAUIR3 6 janvier 2009
SANPrincipe de fonctionnement
Le SAN fournit un accès bas niveau aux disques.Volumes directement accessibles en mode bloc depuis les systèmes de fichiers des serveurs.
Un serveur "voit" l'espace de stockage comme son propre disque dur.
/!\ Importance de la configuration des LUNs, du masking et du zoning .
Kevin CORNILLEAUIR3 6 janvier 2009
SANLe zoning
Mise en relation logique de 2 éléments au sein du réseauGéré à l'intérieur d'un fabric par le switch
Utilisé notamment pour éviter les risques de collisions de trames fibres
On isole les cartes fibres les unes des autres.
Kevin CORNILLEAUIR3 6 janvier 2009
Dans cet exemple : pas de zoning
SANLe zoning
Kevin CORNILLEAUIR3 6 janvier 2009
Host 1
Baie disque
Host 2 Host 3
LIBRAIRIE
Switch A
1 21212
Switch B
A B
SANLe zoning
Kevin CORNILLEAUIR3 6 janvier 2009
Host 1
Baie disque
Host 2 Host 3
LIBRAIRIE
Switch A
1 21212
Switch B
A B
Réalisation du zoning minimum pour le serveur 1
SANLe masking
Kevin CORNILLEAUIR3 6 janvier 2009
Gestion des autorisations d'accès aux LUNsGéré au niveau de la baie
par des logiciels embarqués sur la baie de disque et/ou installés sur les serveurs
Permet d’autoriser ou non la visibilité des LUNs aux hosts
On administre généralement des ensembles dans lesquels on ajoute le/les serveur(s) et le/les LUN(s) auxquels ils ont accès.
SANExemple de fonctionnement
La baie est opérationnelle
Détection/correction d'erreurs à la volée effectués sur les I/O de chaque disque (polynôme de Reed Solomon, au niveau des secteurs)
Le micro-logiciel exécute à intervales réguliers une série d'autotests
Si le taux d'erreurs détecté dépasse un seuil le disque est mis en faute
Kevin CORNILLEAUIR3 6 janvier 2009
SANExemple de fonctionnement
Le disque est reconstruit sur le spare (quelques heures)Une nouvelle pièce est commandée
Lorsque le disque est remplacé, il est à nouveau reconstruit à partir du spareAu bout de quelques heure, le spare redevient inutilisé
Kevin CORNILLEAUIR3 6 janvier 2009
SANLes avantages du SAN
Mutualisation des espaces de stockagePas de baie "dédiée" à un serveur et donc pas de limitation de l’espace disponible dans cette baie
Réseau dédié performant (2Gb/s, 4Gb/s et 8Gb/s)
EvolutivitéAjout de périphérique de stockage possible sans limitation théorique
Support d'environnements hétérogènesDivers logiciels et devices peuvent cohabiter au sein d'un SAN/!\ Vérification nécessaire grâce aux matrices de compatibilité
Kevin CORNILLEAUIR3 6 janvier 2009
SANLes inconvénients du SAN
Relativement complexe à mettre en œuvre, l'administration nécessite de bonnes connaissancesSollicitation de prestataires souvent nécessaire
L’environnement est mutualisé, une modification implique facilement plusieurs serveurs et/ou baies de stockage
Coût du matériel importantSwitch, cartes fibres, etc.
Kevin CORNILLEAUIR3 6 janvier 2009
RécapitulatifComparaison des différentes architectures de stockage
Kevin CORNILLEAUIR3 6 janvier 2009
BibliographieQuelques références, pour aller plus loin...
Logiciels de stockage de donnéespar Guy Chesnot (2000), Vuibert Solutions de stockagepar Jacques Péping (1998), Eyrolles Linux Administration, Tome 1 & 2par Jean-François Bouchaudy (2007), Eyrolles
Linux Magazine , n°106
http://fr.wikipedia.org
Kevin CORNILLEAUIR3 6 janvier 2009
Merci