Post on 15-Jan-2016
description
31 Janvier 2006 Youssef ROUMMIEH
1
XML Data Integration in OGSA Grids
XML Data Integration in OGSA Grids
Carmela Comito & Domenico TaliaDEIS, University of Calabria, Italy
Présenté par :
ROUMMIEH Youssef
Master 2 Recherche : Système d’informationGrille de donnée
Le 31 janvier 2006
31 Janvier 2006 Youssef ROUMMIEH
2
XML Data Integration in OGSA Grids
Intégration de donnée : But
BD1 BD2 BDn
Système intégration de donnéeVue uniforme de donnée
(Virtuel)
Utilisateur
31 Janvier 2006 Youssef ROUMMIEH
3
XML Data Integration in OGSA Grids
Problématique d’intégration
BD à intégrer auront été développées indépendamment hétérogènesHétérogénéité des modèles de données (OO,
Relationnel, etc.)Hétérogénéité des schémas
◊ Conflits de type (date)◊ Conflits de description (adresse)◊ Conflits structurels (personne)
Hétérogénéité sémantique◊ Conflits de nommage (nom du même concept est différent)◊ Conflits de nommage de valeurs (valeur d’un concept est
différent)
31 Janvier 2006 Youssef ROUMMIEH
4
XML Data Integration in OGSA Grids
Plan Introduction
Intégration de données sur les grilles Les approches existantes pour intégrer les données Problématique de ces approches
Structure décentralisée d’intégration de donnée XML Modèle intégration Algorithme reformulation pour les requêtes XPath
Système d’intégration de donnée de Grille (GDIS) Évaluation Conclusion
31 Janvier 2006 Youssef ROUMMIEH
5
XML Data Integration in OGSA Grids
Introduction Intégration de donnée sur les grilles
Larges volumes de données, hétérogènes, distribués, et dynamiques
Bénéficier de l’infrastructure de grille basé sur OGSA Deux approches principales
Fédération◊ Les schémas sont fusionnés en schéma fédéré ◊ Allocation de ressource est statique ne peut pas profiter
d’évolutions des circonsatnces Mediator/wrapper
◊ Vue globale multi-sources/vue mono-source◊ Coordination de médiateurs a fait centralement SDs ne peuvent
pas changer souvent
31 Janvier 2006 Youssef ROUMMIEH
6
XML Data Integration in OGSA Grids
Introduction Approches centralisées ne bénéficient de la nature
dynamique et distribuée de ressources de la grille SI décentralisé qui conserve la sémantique
OGSA prévoit un ensemble d’outils permettant de gérer l’accès aux donnés
Intégration de schéma en établissant les connections sémantiques GDMS : wrapper/mediator basé sur un schéma global Hyper : donnée relationnelle dans les systèmes P2P
Approche proposée : Structure pour intégrer les sources de données XML hétérogènes distribués sur le grille
31 Janvier 2006 Youssef ROUMMIEH
7
XML Data Integration in OGSA Grids
Modèle d’Intégration
Grille environnement dynamique et distribuéArchitecture centralisé n’est pas convenableApproche proposée :
◊ Intégrer les SS d’une manière décentralisée◊ Basé sur le schéma mappings => correspondances
entre les schémas sources◊ collection de schémas locaux◊ Connections sémantique entre les nœuds reliés
A6
A0
A2
A1
A3
A4
A5
31 Janvier 2006 Youssef ROUMMIEH
8
XML Data Integration in OGSA Grids
Modèle d’Intégration
Chaque schéma source est relié directement au petit nombre d’autres schémas. accessible de tous les autres schémas qui appartiennent
à sa « fermeture transitive »
Graphe de sources reliés sémantiquement Aucune distinction entre sources de données et
médiateur
A B CMappings point-to-point
Mappings transitives
Mappings point-to-point
31 Janvier 2006 Youssef ROUMMIEH
9
XML Data Integration in OGSA Grids
Modèle d’Intégration Hétérogénéités structurales association de paths
dans les différentes schémas
Basé sur les mappings path-to-path exprimé dans la langage de query XPath.
Schéma source(XML)
- E1 (A1)
Schéma dest(XML)
- E2 (A2)
MappingsPath E1~Path E2
MappingsPath E2~Path E1
31 Janvier 2006 Youssef ROUMMIEH
10
XML Data Integration in OGSA Grids
Modèle d’Intégration .
‘n’ = label, ‘.’= nœud courant, ‘/’=child axis, ‘//’=descendant axis, ‘[]’ = prédicat
Schéma de mappings sur S= ensemble de règles de mappings sur S
. RM = label de la règle
SS = schéma source PS = expression path dans le schéma source SD = schéma destination PD = expression path dans le schéma destination CM = cardinalité de mappings : 1-1, 1-N, N-1, N-N
Règles mappings documents XMAP associé au SS
][///. qqqqqqnq
DDCSSM PSPSR M ,,:
31 Janvier 2006 Youssef ROUMMIEH
11
XML Data Integration in OGSA Grids
Schémas XML pour XMAP
31 Janvier 2006 Youssef ROUMMIEH
12
XML Data Integration in OGSA Grids
Algorithme pour reformuler la requête Xpath Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
1. identifier les expressions path dans Q
Q=/Artist[style=″Cubism″]/artefact/title
P1=/Artist/style
P2=/Artist/artefact/title
P
1
/Artist[style=″Cubism″] /artefact/title/Artist id
Nameartefact
category
ArtistS1
codefirst-namelast-namekind
painter
InfoS2
Painting
Sculptor
XMAP
artefact
Title
title
Style
style
School
31 Janvier 2006 Youssef ROUMMIEH
13
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
1. identifier les expressions path dans Q2. Chercher les paths candidats dans le
schéma relié à SChercher les paths correspondants dans toutes
les sources sémantiquement relié à S.
31 Janvier 2006 Youssef ROUMMIEH
14
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
2. Chercher les paths candidats dans le schéma relié à SQ=/Artist[style=″Cubism″]/artefact/title
P1=/Artist/style
P2=/Artist/artefact/title
P
1
/Artist[style=″Cubism″] /artefact/title/Artist
P◊1,2=/Info/kind/Painter/School,
/Info/kind/Sculptor/Style
P◊2,2=/Info/Kind/Painter/Painting/Title,
/Info/kind/Sculptor/artefact
Candidate setS◊
2
2
id
Nameartefact
category
ArtistS1
codefirst-namelast-namekind
painter
InfoS2
Painting
Sculptor
XMAP
artefact
Title
title
Style
style
School
31 Janvier 2006 Youssef ROUMMIEH
15
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
1. identifier les expressions path dans Q2. Chercher les paths candidats dans le
schéma relié à S3.Pruning de schémas candidate
au moins un path candidate pour chaque path dans Q
aucune de ces paths candidates n’a été déjà utilisée
31 Janvier 2006 Youssef ROUMMIEH
16
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
3.Pruning de schémas candidate
idstyleNameartefact
titlecategory
ArtistS1
codefirst-namelast-namekind
painter
Title
InfoS2
PaintingSchool
SculptorartefactStyle
XMAP
Q=/Artist[style=″Cubism″]/artefact/title
P1=/Artist/style
P2=/Artist/artefact/title
P
1
/Artist[style=″Cubism″] /artefact/title/Artist
P◊1,2=/Info/kind/Painter/School,
/Info/kind/Sculptor/StyleP◊
2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact
Candidate setS◊
22
P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style
P*2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact
destination setS*2
3
31 Janvier 2006 Youssef ROUMMIEH
17
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
1. identifier les expressions path dans Q 2. Chercher les paths candidats dans le schéma
relié à S 3.Pruning de schémas candidate 4. Construction des requêtes reformulées
Estimer les contraintes de cardinalités◊ 1-1 ou N-1 simple requête sur le schéma de destination◊ 1-N plus d’une requête sur le schéma de destination
Vérifier les conditions de jointureComposition les requêtes XPath
31 Janvier 2006 Youssef ROUMMIEH
18
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
4. Construction de la requête reformulées
idstyleNameartefact
titlecategory
ArtistS1
codefirst-namelast-namekind
painter
Title
InfoS2
PaintingSchool
SculptorartefactStyle
XMAP
Q=/Artist[style=″Cubism″]/artefact/title
P1=/Artist/style
P2=/Artist/artefact/title
P
1
/Artist[style=″Cubism″] /artefact/title/Artist
P◊1,2=/Info/kind/Painter/School,
/Info/kind/Sculptor/StyleP◊
2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact
Candidate setS◊
2
2
P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style
P*2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact
destination setS*2
3
QR1=/Info/kind/Painter[School=″Cubism″]/Painting/TitleQR2=/Info/kind/Sculptor[style=″Cubism″]/artefact
4
31 Janvier 2006 Youssef ROUMMIEH
19
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
1. identifier les expressions path dans Q 2. Chercher les paths candidats dans le schéma
relié à S 3.Pruning de schémas candidate 4. Construction de la requête reformulées 5. Invocation récursive de l’algorithme
Sur les requêtes reformulées pour produire les requêtes qui correspondent à chaque mappings transitives.
31 Janvier 2006 Youssef ROUMMIEH
20
XML Data Integration in OGSA Grids
Input : query Q, Schema S, mapping M (XMAP de S)Output : ensemble de query reformulés Q*
5. Invocation récursive de l’algorithme
idstyleNameartefact
titlecategory
ArtistS1
codefirst-namelast-namekind
painter
Title
InfoS2
PaintingSchool
SculptorartefactStyle
XMAP
Q=/Artist[style=″Cubism″]/artefact/title
P1=/Artist/style
P2=/Artist/artefact/title
P
1
/Artist[style=″Cubism″] /artefact/title/Artist
P◊1,2=/Info/kind/Painter/School,
/Info/kind/Sculptor/StyleP◊
2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact
Candidate setS◊
2
2
P*1,2=/Info/kind/Painter/School, /Info/kind/Sculptor/Style
P*2,2=/Info/Kind/Painter/Painting/Title,/Info/kind/Sculptor/artefact
destination setS*2
3
QR1=/Info/kind/Painter[School=″Cubism″]/Painting/TitleQR2=/Info/kind/Sculptor[style=″Cubism″]/artefact
4
31 Janvier 2006 Youssef ROUMMIEH
21
XML Data Integration in OGSA Grids
Grid Data Integration System (GDIS)
Architecture d’intégration de donnée décentralisée basé sur le service
Réconciliation de sources de données hétérogènes Approche basé sur wrapper/mediator
Médiateur décentralisé XMAP sémantiqueWrapper syntactique
Basé sur OGSA en étendant OGSA-DAI et OGSA-DQPSpécifier les mappings sémantiquesExécuter l’algorithme de reformulation de la requête XMAP
31 Janvier 2006 Youssef ROUMMIEH
22
XML Data Integration in OGSA Grids
Architecture GDIS
31 Janvier 2006 Youssef ROUMMIEH
23
XML Data Integration in OGSA Grids
Évaluation Article bien structuré, parfois il présente des ambiguïtés L’exemple donné pour illustrer l’algorithme n’est pas détaillé Points fortes :
L’utilisateur peut retrouver les données en soumettant une simple requête XPath Ajouter une source dans le système établir des connections avec un petite
nombre de schémas Pruning dans la 3ème étape de l’algorithme permet d’éliminer une partie des
schémas candidates sans les tester Les prototypes du logiciel de l'algorithme XMAP et le système GDIS sont
développés actuellement Points faibles :
Changement dans un source changement dans tous les mappings reliés à ce source
Le modèle d’intégration proposée ne résoudre que les hétérogénéités structurales sur les BD XML
Les BDRs sont supportées dans la version courant de OGSA-DQP
31 Janvier 2006 Youssef ROUMMIEH
24
XML Data Integration in OGSA Grids
Évaluation
/S1/Artist[style=« Cubism »]/name ~ Select name from Artist where style =« Cubism »
31 Janvier 2006 Youssef ROUMMIEH
25
XML Data Integration in OGSA Grids
Conclusion
Intégration de la donnée dans le grilleConcevoir une structure pour intégrer des
donnée sources XML hétérogènesUn algorithme du reformulation de la
requête est proposé le formalisme d’intégration XML est
exposé comme un Service de la Grille dans l'architecture GDIS.
31 Janvier 2006 Youssef ROUMMIEH
26
XML Data Integration in OGSA Grids