AntistoÐqish Ontologi¸n - iit.demokritos.gr · • DiaforetikoÐ ìroi qrhsimopoioÔntai gia thn...
Transcript of AntistoÐqish Ontologi¸n - iit.demokritos.gr · • DiaforetikoÐ ìroi qrhsimopoioÔntai gia thn...
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
AntistoÐqish Ontologi¸n
BasÐlhc Sphliìpouloc 1,2
1Tm ma Mhqanik¸n Plhroforiak¸n kai Epikoinwniak¸n Susthm�twn,
Ergast rio Teqnht c NohmosÔnhc, Panepist mio AigaÐou2InstitoÔto Thlepikoinwni¸n kai Plhroforik c, Ergast rio TeqnologÐac
Gn¸sewn kai LogismikoÔ, E.K.E.F.E. Dhmìkritoc
6 DekembrÐou 2006
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Perieqìmena
Eisagwg
AntistoÐqish - Sugq¸neush
DiadikasÐa AntistoÐqishc
Sumper�smata
ErgasÐa
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
TÐ eÐnai OntologÐa?
Mia morf anapar�stashc gn¸shc sqetik c me mia jematik perioq , h opoÐa eÐnai:
• Formalistik
• Υπάρχει πληθώρα διαθέσιμων γλωσσών οντολογιών,βασισμένες σε διαφορετικές θεωρίες (π.χ. Λογική Πρώτης
Τάξης, Description Logics, Frames)• ΄Ενα υποσύνολο των γλωσσών οντολογιών υποστηρίζουνμηχανισμούς συμπερασμού (π.χ OWL-DL)
• Koin¸c apodekt kai diamoirazìmenh
• Δίνει την δυνατότητα για επαναχρησιμοποίησηυπάρχουσας γνώσης
• Ενισχύει την διαλειτουργικότητα μεταξύ εφαρμογών (π.χ.πράκτορες λογισμικού, δικτυακές εφαρμογές)
• Shmasiologikìc Istìc
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Qarakthristik� OntologÐac
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
O Idanikìc Kìsmoc kai h Pragmatikìthta
O idanikìc kìsmoc:
• MÐa gl¸ssa anapar�stashc ontologi¸n
• AnuparxÐa epikaluptìmenhc gn¸shc apì tic up�rqousecontologÐec
• Oi up�rqousec ontologÐec den exelÐssontai
• 'Uparxh miac koin c kai pagkìsmiac ontologÐac poukalÔptei ìlec thc gnwstikèc perioqèc
• K�je gnwstik perioq montelopoieÐtai apì ènaepanaqrhsimopoioÔmeno komm�ti thc koin c ontologÐac
O pragmatikìc kìsmoc:
• O idanikìc kìsmoc den up�rqei!
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Probl mata pou Qr zoun Antimet¸pishc
Phg tou probl matoc:
• 'Idioi ìroi qrhsimopoioÔntai gia thn anapar�stashstoiqeÐwn thc ontologÐac (ènnoiec, idiìthtec, sqèseic,stigmiìtupa) me diaforetik shmasÐa
• DiaforetikoÐ ìroi qrhsimopoioÔntai gia thnanapar�stash stoiqeÐwn thc ontologÐac me koin shmasÐa
• Diaforetikèc sqèseic metaxÔ twn stoiqeÐwn thc ontologÐac(p.q. diaforetikèc taxonomÐec), montelopoioÔn thn Ðdiaperioq
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
AntistoÐqish Ontologi¸n I
AntistoÐqish dÔo ontologi¸n eisìdou O1 kai O2 eÐnai h eÔreshgia k�je stoiqeÐo thc O1 to antÐstoiqo stoiqeÐo thc O2 pou èqeith “plhsièsterh” shmasÐa.
• MetaxÔ zeug¸n stoiqeÐwn upologÐzetai mia metrik omoiìthtac.
• H metrik omoiìthtac eÐnai mia sun�rthsh, me tèssera eÐdhplhjukìthtac (1:1, 1:n, n:1, n:m)
• Hmi-autìmatopoihmènec kai pl rwc automatopoihmènecproseggÐseic
• Sunep c antistoÐqish
EÐdh antistoÐqishc metaxÔ stoiqeÐwn:
• IsodunamÐa (≡)• Pio genikì (w) - Ligìtero Genikì (v)• Epik�luyh (u)
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
AntistoÐqish Ontologi¸n II
• Pìte mia mèjodoc eÐnai Shmasiologik ?
• Den up�rqei koin� apodektìc orismìc
• ProseggÐseic:• Εντοπισμός συνολοθεωρητικών αντιστοιχίσεων (≡, w, v)• Χρήση της δομής των οντολογιών εισόδου - Πώς;• Χρήση εξωγενούς δομημένης πληροφορίας (π.χ. WordNet)• Χρήση τεχνικών αυτόματου συμπερασμού (π.χ. Description
Logics, First Order Logics)
• Koinìc paronomast c: Prosèggish tou no matoc twnstoiqeÐwn thc ontologÐac
• Orismìc sugkekrimènwn eid¸n shmasiologÐac kai kat�pìso qrhsimopoioÔntai apì k�je prosèggish
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Sugq¸neush Ontologi¸n
Sugq¸neush dÔo ontologi¸n eisìdou O1 kai O2 eÐnai hparagwg mÐa nèac ontologÐac O3, h opoÐa perikleÐei ìlh thnplhroforÐa twn ontologi¸n O1 kai O2.
• An den up�rqoun epikalÔyeic metaxÔ twn O1 kai O2,sugq¸neush eÐnai h ènwsh touc
• Sthn pr�xh kurÐwc mac endiafèroun oi peript¸seic meepikalÔyeic
• H koin plhroforÐa den prèpei na epanalamb�netai sthnO3
• Qr sh antistoiqÐsewn
• Qr sh endi�meshc ontologÐac
• KurÐwc hmi-autìmatec proseggÐseic
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqishc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
OmalopoÐhsh Ontologi¸n Eisìdou
Eswterik anapar�stash twn ontologi¸n:
• Koin gl¸ssa ontologÐac (p.q. OWL, DAML+OIL,RDF(S))
• Η προσέγγιση MAFRA [1] μετατρέπει τις οντολογίες στηνγλώσσα RDF(S))
• Anaparast�seic �llou tÔpou:• Η προσέγγιση Virtual Documents [2] μετατρέπει τιςοντολογίες σε RDF γράφο, τον οποίο ορίζουν οι ίδιοι
• Η προσέγγιση GMO [3] μετατρέπει τις οντολογίες σεδιμερείς κατευθυνόμενους γράφους
• Η προσέγγιση IF-Map [4] μετατρέπει τις οντολογίες σεεκφράσεις Prolog
• Η προσέγγιση OMEN [5] μετατρέπει τις οντολογίες σε έναΠιθανοτικό Δίκτυο (Bayesian Net)
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqishc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Epilog Qarakthristik¸n
• Epilègontai ta qarakthristik� twn ontologi¸n eisìdoupou ja qrhsimopoihjoÔn
• EÐte giatÐ h prosèggish apl¸c ta agnoeÐ, eÐte giatÐ den tajewreÐ qr sima
• OrÐzontai exwgeneÐc phgèc plhroforÐac (p.q. WordNet,WWW)
• OrÐzetai tuqìn up�rqon sÔnolo apì antistoiqÐec (OMEN[5])
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqishc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Epilog StoiqeÐwn twn Ontologi¸n
• Epilègontai ta zeÔgh twn stoiqeÐwn twn ontologi¸n gia taopoÐa upologÐzetai h metaxÔ touc omoiìthta
• To b ma autì ephre�zei �mesa thn poluplokìthta toualgorÐjmou
• Sun jwc epilègontai ìla ta zeÔgh
• H prosèggish QOM [6] apoteleÐ exaÐresh
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqhshc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Upologismìc Omoiìthtac I
• UpologÐzetai h omoiìthta metaxÔ twn zeug¸n stoiqeÐwnpou epilèqjhsan sto prohgoÔmeno b ma
• Pollaplèc metrikèc omoiìthtac eÐnai dunatìn naupologistoÔn
• Oi metrikèc axiopoioÔn ta qarakthristik� twn ontologi¸neisìdou pou epilèqjhsan sthn Epilog Qarakthristik¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Upologismìc Omoiìthtac II
TÔpoi metrik¸n:
• Basismènoi se sÔgkish twn alfarijmhtik¸n pouperigr�foun ta stoiqeÐa twn ontologi¸n
• Επέκταση ακρωνυμίων ή συντομογραφιών καιλημματοποίηση
• Απαλοιφή προκαθορισμένων λέξεων• Χρήση εξωτερικών μαντείων (π.χ. WordNet)• Συμπερίληψη των αλφαριθμητικών που περιγράφουν ταστοιχεία της γειτνίασης
• Basismènoi sthn dom twn ontologi¸n:• Στην ίδια τη δομή και τις σχέσεις μεταξύ των στοιχείων(π.χ. Αν οι πατέρες δύο εννοιών έχουν ήδη αντιστοιχιθεί)
• Το πεδίο τιμών των ιδιοτήτων
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqishc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Sun�jroish Omoiìthtac - Prosèggish No matoc
• 'Olec oi metrikèc sunajroÐzontai se mÐa
• H sun�jroish mporeÐ na epiteuqjeÐ qrhsimopoi¸ntac thmetrik me th megalÔterh mikrìterh tim (COMA++ [7])
• Me th qr sh bar¸n, mèsou ìrou, sigmoid function (QOM[6])
• Ta b�rh sun jwc kajorÐzontai apì ton qr sth (Cupid [8])
• Teqnikèc mhqanik c m�jhshc èqoun qrhsimopoihjeÐ (APFEL[9])
• Stìqoc eÐnai h prosèggish tou no matoc twn stoiqeÐwn kaioi metrikèc den eÐnai o mìnoc trìpoc
• Teqnikèc An�kthshc PlhroforÐac kai OmadopoÐhshc èqounefarmosteÐ (HCONE-merge [10])
• Teqnikèc Mhqanik c M�jhshc:• Πιθανοτικά Δίκτυα (Bayesian Nets) (OMEN [5], BayesOWL[11])
• Κατηγοριοποιητές Naive Bayes (GLUE [12])
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqishc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Aposaf nish No matoc B�sh Sun�jroishc Omoiìthtac
Prosèggishc No matoc
• Epitugq�netai me th swst axiopoÐhsh tou b matocSun�jroish Omoiìthtac - Prosèggish No matoc
• Ephre�zetai apì th plhjukìthta twn antistoiq sewn
• Up�rqoun dÐaforec proseggÐseic:• Χρήση κατωφλίου (AnchorPROMPT [13])
• Epilog tou qr sth, prokajorismèno• MegistopoieÐ to f-measure se pollaplèc qr seic (NOM
[14])
• Επιλογή του χρήστη (iPROMPT [13])• Μέγιστες n τιμές (COMA++ [7])• Μέγιστη τιμή +− δ• Προκαθορισμένο Ποσοστό (NOM [14])• Relaxation Labeling (GLUE [12])
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqishc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
'Elegqoc Sunèpeiac
• Oi paragìmenec antistoiqÐseic eÐnai dunatìn na apaiteÐtaina eÐnai sunep c metaxÔ touc
• Den up�rqei koin� apodektìc orismìc
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
DiadikasÐa AntistoÐqishc Ontologi¸n
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Epanalhptikì B ma
• Se k�je epan�lhyh upologÐzontai xan� ìlec oiantistoiqÐseic mèroc aut¸n (NOM [14], HCONE-merge[10])
• Oi antistoiqÐseic thc prohgoÔmenhc epan�lhyhcqrhsimopoioÔntai sthn trèqousa
• SthrÐzetai sth diaÐsjhsh ìti antistoiqÐseic k�poiwngeitonik¸n stoiqeÐwn, ephre�zoun thn omoiìthta twnupoloÐpwn
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Sumper�smata - KateujÔnseic
• Automatopoihmènec mèjodoi eÐnai aparaÐthtec
• Oi up�rqousec proseggÐseic mporoÔn na montelopoihjoÔnk�tw apì mia eniaÐa diadikasÐa
• Belti¸seic mporoÔn na gÐnoun se ìla ta b mata thcGenik c DiadikasÐac AntistoÐqishc
• Automatopoihmènoc sunduasmìc twn metrik¸n omoiìthtacb�sh twn qarakthristik¸n twn ontologi¸n eisìdou
• AnagkaÐa eÐnai h meÐwsh thc qronik c poluplokìthtac twnalgorÐjmwn antistoÐqishc
• Den up�rqei koin� apodektìc orismìc gia to pìte miamèjodoc eÐnai Shmasiologik
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Stìqoc I
• UlopoÐhsh nèac mejìdou pou suneisfèrei sto b maProsèggish No matoc, thc Genik c DiadiadikasÐac
• Χρήση τεχνικών Ομαδοποίησης και Ανάκτησης Πληροφορίας• Μετασχηματισμός των οντολογιών εισόδου σε virtual
documents - terms πίνακα• Ενα v-doc αναπαριστά ένα στοιχείο της οντολογίας (π.χ.μια έννοια)
• Πιθανοτικά Θεματικά Μοντέλα (Probabilistic Topic Models)για τον εντοπισμό θεματικών ενοτήτων (topics)
• Η ομοιότητα υπολογίζεται βάση της συνεισφοράς των topicsστα v-dovs (π.χ. Kullback Divergence)
• Πρόβλημα η έλλειψη όρων (κοινών και μη)• Qr sh exwgen¸n phg¸n plhroforÐac (p.q. WordNet,
WWW)• Qr sh ìrwn apì th geitnÐash tou stoiqeÐou
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Stìqoi II & III
• Entopismìc sqèsewn upagwg c metaxÔ stoiqeÐwn twnontologi¸n eisìdou
• Χρηση των διανυσμάτων χαρακτηριστικών που έχουνεξαχθεί από τα Πιθανοτικά Θεματικά Μοντέλα
• Χρήση τεχνικών Επιβλεπόμενης Μηχανικής Μάθησης• Θετικά παραδείγματα οι ίδιες οι οντολογίες εισόδου
• MeÐwsh thc poluplokìthtac tou algorÐjmou antistoÐqishc• Με το να μην εξετάζονται για ομοιότητα, τα ζεύγηστοιχείων που θα οδηγήσουν σε μη συνεπή αντιστοίχιση
• Βήμα Επιλογή Στοιχείων της Γενικής Διαδικασίας
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Stìqoc IV
• Block Mapping• Πληθυκότητα αντιστοίχισης n:m• Τα Πιθανοτικά Θεματικά Μοντέλα ορίζουν ένα καινούργιον-χώρο, όπου ν τα topics
• Τα v-docs τοποθετούνται στον v-χώρο• ΄Εκτος από 1:1 και 1:n αντιστοιχίσεις, εντοπισμός n:m• Κριτήριο η απόσταση των v-docs στον ν-χώρο και χρήσηπ.χ. k-means αλγόριθμου
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
Peir�mata
• Qr sh twn ontologi¸n apì ton diejn diagwnismì OntologyAlignment Evaluation Initiative (OAEI) 2006
• Ευρύ φάσμα ζευγών οντολογιών, όπου κάθε ένα εστιάζει σεδιαφορετικά χαρακτηριστικά τους
• Στόχος είναι να εντοπιστούν τα δυνατά σημεία, αλλά και οιαδυναμίες των αλγορίθμων
• Κοινά αποδεκτό golden standard
• Sthn paroÔsa f�sh èqei gÐnei h metatrop twn ontologi¸neisìdou se virtual documents - terms pÐnaka
• Χρήση των Πιθανοτικών Θεματικών Μοντέλων pLSA καιLDA
• Χρήση όρων από σχόλια, ονόματα, ιδιότητες στοιχείων καιτης γειτνίασης τους
• Χρήση του WordNet για επιπλέον όρους
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
AporÐec Sqìlia??
AntistoÐqish Ontologi¸n
BasÐlhc Sphliìpouloc 1,2
1Tm ma Mhqanik¸n Plhroforiak¸n kai Epikoinwniak¸n Susthm�twn,
Ergast rio Teqnht c NohmosÔnhc, Panepist mio AigaÐou2InstitoÔto Thlepikoinwni¸n kai Plhroforik c, Ergast rio TeqnologÐac
Gn¸sewn kai LogismikoÔ, E.K.E.F.E. Dhmìkritoc
6 DekembrÐou 2006
Euqarist¸!
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
N. Silva, B. Motik, R. Volz: MAFRA - A Mapping Frameworkfor Distributed Ontologies. In Proceedings of EKAW, 2002.
Y. Qu, W. Hu, G. Cheng: Constructing Virtual Documents forOntology Matching. In Proceedings of WWW, 2006.
V. D. Blondel, A. Gajardo, M. Heymans, P.Senellart, P. VanDooren. A Measure of Similarity between Graph Vertices:Applications to Synonym Extraction and Web Searching.SIAM Review, 46(4) (2004) 647-666.
Y. Kalfoglou, M. Schorlemmer: IF-Map: an ontology mappingmethod based on Information Flow theory Journal on dataSemantics, 2003.
P. Mitra, N. Noy, A. R. Jaiswal: Ontology Mapping Discoverywith Uncertainty. In Proceedings of ISWC, 2005.
M. Ehrig, S. Staab: QOM - Quick Ontology Mapping InProceedings of ISWC, 2004.
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
D. Aumuller, H. H. Do, S. Massmann, and E. Rahm. Schemaand ontology matching with COMA++. In Proceedings of theInternational Conference on Management of Data (SIGMOD),Software Demonstration, 2005.
J. Madhavan, P. Bernstein, E. Rahm: Generic SchemaMatching with Cupid. In Proceedings of VLDB, 2001.
M. Ehrig, S. Staab, Y. Sure: Bootstrapping OntologyAlignment Methods with APFEL. In Proceedings of ISWC,2005.
K. Kotis, G. A. Vouros, K. Stergiou: Towards AutomaticMerging of Domain Ontologies: The HCONE-merge approachJournal of Web Semantics, (2006).
Pan R, Ding Z, Yu Y, Peng Y (2005). A Bayesian NetworkApproach to Ontology Mapping. In Proceedings of ISWC2005. Galway, Ireland.
Eisagwg AntistoÐqish - Sugq¸neush DiadikasÐa AntistoÐqishc Sumper�smata ErgasÐa
A. Doan, J. Madhavan, P. Domingos, A. Halevy: Learning tomap ontologies on the semantic web. Proceedings of WWW,2002
N. Noy and M. Musen: The PROMPT Suite: Interactive toolsfor ontology merging and mapping. International Journal ofHuman-Computer Studies, 2003.
M. Ehrig, Y. Sure: Ontology Mapping: An IntegratedApproach In Proceedings of ESWS, 2004.
S. Melnik, H. Garcia-Molina, E. Rahm: Similarity Flooding: AVersatile Graph Matching Algorithm. In Proceedings of ICDE,2002.