Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

17
Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems A. Choudhary, M. Kandemir, J. NoG. Memik, X. Shen, W. Liao, H. Nagesh, S. More, V. Taylor, R. Thakur, and R. Stevens Center for Parallel and Distributed Computing Department of Electrical and Computer Engineering Northwestern University Introduction Contexte Analyse Conclusion Approche Expérimentation Présentation d’article 04/02/04 B. Ben Hedia Metacomputing Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems A.Choudhary, M. Kandemir, J. NoG. Memik, X. Shen, W. Liao, H. Nagesh, S. More, V. Taylor, R. Thakur, and R. Stevens Center for Parallel and Distributed Computing Department of Electrical and Computer Engineering Northwestern University

description

B. Ben Hedia. Metacomputing. 04/02/04. Présentation d’article. Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems Choudhary, M. Kandemir, J. NoG. Memik, X. Shen, W. Liao, H. Nagesh, S. More, V. Taylor, R. Thakur, and R. Stevens - PowerPoint PPT Presentation

Transcript of Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Page 1: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Data Management for Large-Scale Scientific Computations

in High Performance Distributed Systems

A. Choudhary, M. Kandemir, J. NoG. Memik, X. Shen, W. Liao, H. Nagesh, S. More, V. Taylor, R.

Thakur, and R. Stevens

Center for Parallel and Distributed ComputingDepartment of Electrical and Computer

EngineeringNorthwestern University

Introduction Contexte Analyse ConclusionApproche Expérimentation

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Data Management for Large-Scale Scientific Computations

in High Performance Distributed Systems

A.Choudhary, M. Kandemir, J. NoG. Memik, X. Shen, W. Liao, H. Nagesh, S. More, V. Taylor, R.

Thakur, and R. Stevens

Center for Parallel and Distributed ComputingDepartment of Electrical and Computer

EngineeringNorthwestern University

Page 2: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Introduction

Recherche : Département de l’énergie Accélération stratégique de calcul Programme d’alliance académique

stratégique

Article : Gestion de données Calcul à grand échelle Système disturbé, grande performance

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 3: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Systèmes de gestion des données

Systèmes classiques : Systèmes de gestion des fichiers Systèmes de gestion des Bases des données

(DBMS)

Limites (SGF): Utilisation des pointeurs Fonctions propres à chaque système

(portabilité) Codage bas niveau, optimisation impossible

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 4: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Systèmes de gestion des données

Limites (DBMS ): Performance (vis-à-vis de quelque

architectures) Logique de consistance, intégration de

sémantique: obstacle devant la grande performance

DBMS: types des données, modèles de manipulation

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 5: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

L’approche des auteurs

Avantages des SGFs Avantages des DBMS Architectures parallèles

d’E/S

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

MDMS active

HSS

Inte

rface

Util

isate

ur

simple

Environnement de programmation

Page 6: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

L’environnement

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

MDMS: Meta-Data Management SystemHSS: Hierarchical Storage System

Page 7: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Le MDMS

C’est Quoi ? : Middleware Interfaces communes Communication (Application,HSS avec

MDMS) Performance d’E/S Active (pas simplement un entrepôt de

données)Fonctionnalités:

Sauvegarde les informations concernant :- Dispositifs de stockages ASDs (App, HSS)- « storage patterns », « access patterns »- « suspended access patterns »- Contexte A(user, application)

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 8: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Le MDMS

Outils : « user directives », communication avec

l’application:- Layout directives: contrôle de HSS par

l’application- Access pattern directives: conseil de HSS du

seq. d’ E/S « common access (sharing) directives » « individual directives »: informations sur l’E/S

(accès au données):Implémentation : « user directives », tables relationnelles, OR-DBMS:

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 9: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Le MDMS

Exemple de directives :

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

access P(- , -)

organize P(BLOCK,*) storage DISK(4)

associate (R1,R2) with Tacess T(BLOCK,*) storage DISK(4)

Page 10: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Le HSS

C’est Quoi ? : Système de gestion de stockage

hiérarchique HPSS, FPS, PIOFPS

Fonctionnalités: Maintenir les sauvegardes liées à la mise à

jours de méta données dans MDMS Traite les demandes d’optimisation d’E/S.D’où l’architecture de communication

suivante:

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 11: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Le HSS

Architectures d’E/S moderne: Augmenter le parallélisme d’E/S: augmenter

le nbre des unités de stockages Améliorer la politique d’accès

Bande magnétique: Run-time dédié: activer automatiquement,

ou par le compilateur:- La partie du fichier qui contient les

données- Transfert de la bande vers le disque- Extraction des données

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 12: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

L’interface Utilisateur

But : Simple Réduire le nombre des appels des fonctions

d’E/S Optionnelles

Fonctions :

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 13: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Architecture

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 14: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Résultats

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 15: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Points forts

Clarté : Pas besoin de connaissances extérieures Approche expliquée de façon structurée et

simple

Mise en valeur de l’approche : Besoin légitime Les composants MDMS et HSS Interface utilisateur simple

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 16: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Points faibles

Manque d’approfondissement : Article accessible mais peu de détails

techniques Implémentation de l’approche ? Comparaison par rapport à d’autre

approches ? Le HSS, quel HSS utilisé ? Et pourquoi ?

Présentation d’article04/02/04

B. Ben Hedia Metacomputing

Page 17: Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems

Introduction Contexte Analyse ConclusionApproche Expérimentation

Conclusion

Un environnement de programmation flexible et simple

Supporté par le département d’énergie (fonctionnel)

Plus une introduction à un nouvel environnement de programmation qu’une description technique exhaustive

Présentation d’article04/02/04

B. Ben Hedia Metacomputing