(12) Ontology Engineering - Semantic Web Technologien, WS2010/11
-
Upload
harald-sack -
Category
Technology
-
view
2.166 -
download
0
description
Transcript of (12) Ontology Engineering - Semantic Web Technologien, WS2010/11
Die nichtkommerzielle Vervielfältigung, Verbreitung und Bearbeitung dieser Folien ist zulässig (Lizenzbestimmungen CC-BY-NC).
VorlesungDr. Harald Sack
Hasso-Plattner-Institut für SoftwaresystemtechnikUniversität Potsdam
Wintersemester 2010/11
Semantic Web Technologien
Blog zur Vorlesung: http://web-flakes.blogspot.com/
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
2
Nächste Vorlesung:
Rules
&
the Se
mantic
Web
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
3 Wiederholung•SPARQL ist nur für RDF vorgesehen
•OWL Konzepte sind als Abfragesprache nicht ausreichend
•Konjunktive Abfragen, Regeln und Datalog
•SWRL („OWL + Datalog“) ist unentscheidbar
•Entscheidbare SWRL Fragmente:
•Description Logic Rules
•SWRL Fragment, das mit OWL 2 ausgedrückt werden kann
•DL-safe Rules
•SWRL Fragment in dem Variablen nur konkrete Werte (Konstanten) annehmen können
•DL-safety lässt sich erzwingen
3. Wissensrepräsentation und OWL3.7 Regeln mit SWRL/RIF / 3.7.4 Regeln für OWL mit SWRL
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
4 1. Einführung
2. Semantic Web BasisarchitekturDie Sprachen des Semantic Web - Teil 1
3. Wissensrepräsentation und LogikDie Sprachen des Semantic Web - Teil 2
4. Ontology Engineering
5. Linked Data und Semantic Web Anwendungen
Semantic Web Technologien Vorlesungsinhalt
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
5
4. Ontology Engineering
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
6
Ontolo
gical
Engine
ering
Michelangelo vs. The Flying Spaghetti Monster...
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
7
Semantic Web Technologien Vorlesungsinhalt
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
8
„Zur Methode wird nur der getrieben, dem die Empirie lästig wird.“
-- Johann Wolfgang von Goethe, aus „Maximen und Reflexionen”
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
9
4. Ontology Engineering4.1 Ontologien - Wiederholung
Was ist (eine) Ontologie?•Philosophie: Theorie des Seins, versucht das Sein
als solches zu erklären, durch Aufstellen eines Systems von universellen Kategorien und deren intrinsischer Beziehungen
•künstliche Intelligenz (KI): „explizite Spezifikation einer (intensionalen) Konzeptualisierung“
•wissensbasierte Systeme: System aus Konzepten/Vokabularien als Grundbaustein eines informationsverarbeitenden Systems
•in Bezug auf Problemlösen unterscheidet man:
•Task Ontologien, zur Beschreibung des Problemlöseprozesses und
•Domain Ontologien, zur Beschreibung des Bezugsrahmens (Wissensgebiet) in dem dieser Prozess stattfindet
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
10 Was ist (eine) Ontologie?
"An ontology is an explicit, formal specification of a shared conceptualization. The term is borrowed from philosophy, where an Ontology is a systematic account of Existence. For AI systems, what ‘exists’ is that which can be represented.“
(Thomas R. Gruber, 1993)
Konzeptualisierung: abstraktes Modell (Domäne, identifizierte relevante Begriffe, Beziehungen)
Explizit: Bedeutungen aller Begriffe definiert
Formal: maschinenverstehbar
Gemeinsam: Konsens bzgl. Ontologie
tomgruber.org
4. Ontology Engineering4.1 Ontologien - Wiederholung
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
11
4. Ontology Engineering4.1 Ontologien - Wiederholung
Was ist (eine) Ontologie?
allgemeine, bereichsübergreifende Ontologien (beschreibt sehr generelle Konzepte wie z.B. Zeit, Raum,Vorgang unabhängig von einer bestimmten Domäne oder Problemstellung.)
Domain Ontology Task Ontology
spezielle, auf eine konkret fokussierte Domäne oderAufgabe zugeschnittene Ontologie, die in der Regel eine Domain und/oder Task Ontologie spezialisieren.
Application Ontology
(nach Guarino,1998)
grundlegende Konzepte bezogen auf eine allgemeine Aktivität oder Aufgabe.
grundlegende Konzepte bezogen auf eine generische Domäne.
Top-Level Ontology(Upper Ontology,
Foundation Ontology)
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
12
4. Ontology Engineering4.1 Ontologien - Wiederholung
Ontologien und das Semantic Web
•Semantic Web basiert auf der Interoperabilität von Metadaten
•Zwischen unterschiedlichen Metadaten besteht eine semantische Lücke (Semantic Gap), die mit Hilfe von Ontologien überbrückt werden soll
•Problem der ,semantischen Lücke‘:
•unterschiedliche Ontologien können zur Repräsentation identischer Sachverhalte eingesetzt werden
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
13
4. Ontology Engineering4.1 Ontologien - Wiederholung
Semantische Lücke - ein einfaches Beispiel
•einfaches Beispiel
A
C
B
Initialzustand Endzustand
A
C
B
Welt
Modellierung 1:Objekteblock Ablock Bblock Ctable Thand H
Relationenon(X,Y)clear(X)holding(X)handEmpty
Modellierung 2:Objekteblock Ablock Bblock C
Relationenon(X,Y)clear(X)onTable(X)holding(X)handEmpty
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
14
4. Ontology Engineering4.1 Ontologien - Wiederholung
Modellbildung und Ontologie
•hinter den Modellen steckt eine Ontologie
Modellierung 1:Objekteblock Ablock Bblock Ctable Thand H
Relationenon(X,Y)clear(X)holding(X)handEmpty
⊤
entity relation
table block hand binary unary
handEmptyclear
holding
on
table T hand A
block A
block B
block C
Axiom: on(X,Y) ⋀ on(Y,Z) → above(X,Z)
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
15
4. Ontology Engineering4.1 Ontologien - Wiederholung
Modellbildung und Ontologie
•hinter den Modellen steckt eine Ontologie
⊤
entity relation
block binary unary
handEmptyclear
holding
onblock A
block B
block C
Modellierung 2:Objekteblock Ablock Bblock C
Relationenon(X,Y)clear(X)onTable(X)holding(X)handEmpty
onTable
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
16
4. Ontology Engineering4.1 Ontologien - Wiederholung
Ontology Engineering
•Ontologien sollen die Interoperabilität von Metadaten herstellen
•Daher benötigen wir
•Methoden zum effizienten Entwurf und Design von Ontologien (Ontology Design)
•Methoden zum effizienten Vergleich von Ontologien (Ontology Mapping)
•Methoden zur effizienten Kombination verschiedener Ontologien (Ontology Merging)
•Zur Unterstützung können automatisierte Verfahren herangezogen werden, zum
•Ableiten von Ontologien aus einer Menge von Informationsressourcen (Ontology Learning)
•Bevölkern von Ontologien mit Individuen aus Informationsressourcen
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
17
Semantic Web Technologien Vorlesungsinhalt
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
18
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.1 Allgemeines Vorgehen
Methoden des Ontologieentwurfs•Eine Methodologie des Ontologie-Entwurfs beschreibt alle Aktivitäten die zur
Konstruktion einer Ontologie notwendig sind
•Warum benötigt man eine formale Methodologie?
•Entwicklung von konsistenten Ontologien
•Effiziente Entwicklung komplexer Ontologien
•Verteilte Entwicklung von Ontologien
•Unterscheide (nach Fernandez-Lopez et. al., 1997)
•Ontology management activities
•Ontology development oriented activities
•Ontology support activities
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
19 Ontology Management Activities•Scheduling
•Identifikation der durchzuführenden Aufgaben
•Arrangement/Planung der durchzuführenden Aufgaben
•Identifikation der benötigten Ressourcen (Zeit, Speicherplatz, etc…)
•Control
•Garantiert korrekte Abwicklung der durchzuführenden Aufgaben
•Quality Assurance
•Qualitätssicherung aller im dem Entwicklungsprozess anfallender Produkte (Ontologien, Software, Dokumentation)
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.1 Allgemeines Vorgehen
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
20 Ontology Development Oriented Activities1.Pre-Development
2.Development
3.Post-Development
1.Pre-Development
•Environment Study
•Auf welchen Plattformen soll die Ontologie laufen?
•Für welche Anwendungen ist die Ontologie bestimmt?
•Feasibility Study
•Kann die Ontologie tatsächlich erstellt werden?
•Ist es überhaupt sinnvoll, die geplante Ontologie zu erstellen?
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.1 Allgemeines Vorgehen
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
21 Ontology Development Oriented Activities2.Development
•Specification
•Warum wird die Ontologie erstellt, was ist der beabsichtigte Nutzen und wer sind die End-Anwender?
•Conceptualization
•Strukturiert Domain-Wissen in konzeptuellem Modell
•Formalization
•Formalisiert konzeptuelles Modell in semi-berechenbarem Modell
•Implementation
•Konstruktion eines berechenbaren Modells in einer Ontologiesprache
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.1 Allgemeines Vorgehen
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
22 Ontology Development Oriented Activities3.Post-Development
•Maintenance
•Update und Korrektur der Ontologie (falls nötig)
•Use / Reuse
•Einsatz der Ontologie in den geplanten Anwendungen oder auch in anderen Ontologien
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.1 Allgemeines Vorgehen
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
23 Ontology Support Activities•Knowledge Acquisition
•Wissen von Experten (semi)automatisch gewinnen (Ontology Learning)
•Evaluation•Technische Überprüfung der Ontologien in jeder Stufe der Entwicklung
•Integration•Wiederverwendung bereits existierender Ontologien (Ontology Reuse)
•Merging•Konstruktion einer neuen Ontologie aus bereits existierenden innerhalb einer bestimmten
Domain
•Alignment•Abbildungsvorschriften (Mapping) zwischen den beteiligten Ontologien
•Documentation •Jede Stufe der Ontologie-Entwicklung wird akkurat dokumentiert
•Configuration Management•Verwaltet alle Versionen der Dokumentation und der entwickelten Ontologie
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.1 Allgemeines Vorgehen
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
24 Management Development Oriented Support
scheduling
control
quality assurance
environment study feasibility study
conceptualizationspecification
formalization implementation
maintenance use / reuse
knowledge acquisition
evaluation
documentation merging
alignmentconfigurationmanagement
integration
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.1 Allgemeines Vorgehen
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
25
Semantic Web Technologien Vorlesungsinhalt
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
26
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Methode nach Uschold und King•Prozessbasierte Entwicklung
identifypurpose capture coding integrating documen-
tationevaluation
Building
1 2 3 4
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Methode nach Uschold und King
Identifiziere Zweck und Anwendungsgebiet
•Warum wird die Ontologie benötigt?
•Beabsichtigte Verwendung?
•(use / reuse / share / used as part of KB / …)
•Identifiziere relevante Begriffe
identifypurpose capture coding integrating documen-
tationevaluation
Building
1
Bsp.: Reise-Ontologie•Aufbau eines gemeinsamen Wissensmodell über das Wissensgebiet Reisen, das in Reisebüros genutzt werden soll•Ontologie könnte auch für andere Anwendungsgebiete genutzt werden, z.B. um einen Katalog für Unterkünfte oder Transportmöglichkeiten zu entwickeln•relevante Begriffe z.B.: Orte, Typen von Orten, Unterkünfte, Arten von Unterkünften (Hotel / Motel / Camping / …), Bahn, Busse, U-Bahn,...
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
28 Methode nach Uschold und King
Ontologie Aufbau
•Ontology Capture
•Identifiziere Schlüsselkonzepte (Klassen) und Beziehungen (Relationen) des betreffenden Wissensgebiets und gebe diese in textueller Form an
•Identifikation der Ontologiekonzepte
•Bottom-up / Top-down / Middle-Out
2
Bsp.: Reise-Ontologie• Transportmittel ist eine Klasse. Jeder Transport besitzt einen Startpunkt• Bus ist eine Klasse. Bus ist ein bestimmtes Transportmittel.• Stadtbus ist eine Klasse. Ein Stadtbus ist ein Bus, dessen Start- und Zielpunkt sowie dessen Zwischenstops in derselben Stadt liegen.
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
29 Methode nach Uschold und King
Ontologie Aufbau
•Ontology Capture
•Bottom-up Identifikation der Ontologiekonzepte
•erhöhter Gesamtaufwand
•schwierig, Gemeinsamkeiten zwischen verwandten Konzepten zu finden
•erhöhtes Risiko von Inkonsistenzen→ dann Überarbeitung notwenig (noch mehr Aufwand)
Bsp.: Reise-Ontologie• Transportmittel sollen in einer Bottom-up Strategie konzeptualisiert werden
2
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
30 Methode nach Uschold und King
Ontologie Aufbau
•Ontology Capture
•Bottom-up Identifikation der Ontologiekonzepte
LondonUnderground
LondonLocal Bus
LondonTaxi
ParisUnderground
ParisLocal Bus
ParisTaxi
London Transportmittel Paris TransportmittelU-Bahn Stadtbus Taxi
Transportmittel
is-subClass-of
2
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
31 Methode nach Uschold und King
Ontologie Aufbau
•Ontology Capture
•Top-down Identifikation der Ontologiekonzepte
•bessere Kontrolle des Detaillierungsgrades
•möglicherweise werden aber abstrakte Kategorien gar nicht benötigt
•geringere Stabilität des Modells → dann Überarbeitung notwendig (mehr Aufwand)
Bsp.: Reise-Ontologie• Transportmittel sollen in einer Top-down Strategie konzeptualisiert werden
2
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
32 Methode nach Uschold und King
Ontologie Aufbau
•Ontology Capture
•Top-Down Identifikation der Ontologiekonzepte
object
concrete object abstract object
is-subClass-of
U-Bahn Stadtbus Taxi Transportmit Taxi
Transportmit Bus
Transportmit U-Bahn
nutztnutzt
nutzt
2
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
33 Methode nach Uschold und King
Ontologie Aufbau
•Ontology Capture
•Middle-Out Identifikation der Ontologiekonzepte
•Starte mit Kern / Grundbegriffe, dann Spezialisierung / Generalisierung
•ausbalanciert (bzgl. Detaillierungs-/Abstraktionsgrad)
• stabiler als die beiden anderen Verfahren
Bsp.: Reise-Ontologie• Transportmittel sollen in einer Middle-Out Strategie konzeptualisiert werden
2
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Methode nach Uschold und King
Ontologie Aufbau
•Ontology Capture
•Middle-Out Identifikation der Ontologiekonzepte
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
34
U-Bahn Bus Taxi
Transportmittel
is-subClass-of
Stadtbus Shuttle-Bus Reisebus
2
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Methode nach Uschold und King
Ontologie Aufbau
•Ontologie Aufbau
•Coding
•Alle an der Entwicklung Beteiligten müssen sich auf eine gemeinsame Struktur der Wissensbasis geeinigt haben
•Integration of Existing Ontologies
•Entscheidung, ob und wie bereits existierende Ontologien genutzt werden sollen
•Kann parallel zu den vorhergehenden Aktivitäten stattfinden
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
35
2
identifypurpose capture coding integrating documen-
tationevaluation
Building
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
Methode nach Uschold und King
Evaluation
•Technische Überprüfung der Ontologien und der damit assoziierten Software in jeder Stufe der Entwicklung
Documentation
•Einrichten der eventuell unterschiedlichen Dokumentationsrichtlinien
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
36
3
identifypurpose capture coding integrating documen-
tationevaluation
Building
4
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.2 Uschold und King
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
37
Semantic Web Technologien Vorlesungsinhalt
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
38
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Ontology Development 101•Am Beispiel einer Ontologie für Weinbau und Nahrungsmittel
(Noy, McGuinness, 2000)
A sharedontology on
wine and food
Ontology Development 101•Am Beispiel einer Ontologie für Weinbau und Nahrungsmittel
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
39 (Noy, McGuinness, 2000)
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Ontology Development Process
•in der Praxis iterativer Prozess, der sich beständig wiederholt und die Ontologie verbessert
•es gibt immer unterschiedliche Vorgehensweisen bei der Modellierung einer Ontologie
•in der Praxis entscheidet immer die angestrebte Anwendung überdas Vorgehen bei der Modellierung
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
40
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
„There is no one correct way to model a domainthere are always viable alternatives.“
Beurteile Fachgebiet und Fokus
•Welches Fachgebiet soll die Ontologie abdecken?
•Wozu soll die Ontologie genutzt werden?
•Welche Arten von Fragen sollen die in der Ontologie repräsentierten Informationen beantworten können?
•Wer wird die Ontologie nutzen und pflegen?
•Formulierung von Kompetenzfragen
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
41
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
Im Ontologie Lifecycle können sich diese Fragenauch verändern...
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Beurteile Fachgebiet und Fokus
Kompetenzfragen (Wine Ontology)
•Welche Eigenschaften des Weins sollen bei der Modellierung berücksichtigt werden?
•Ist ein Bordeau ein Weißwein oder ein Rotwein?
•Passt Cabernet Sauvignon gut zu Fischgerichten?
•Welcher Wein passt am besten zu gegrilltem Fleisch?
•Welche Eigenschaften eines Weins beeinflussen seine Eignung zu einem bestimmten Gericht?
•Ändert sich das Bouquet eines Weins mit unterschiedlichen Jahrgängen?
•...
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
42
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Wiederverwendbarkeit berücksichtigen
•Warum soll man Wiederverwendbarkeit berücksichtigen?
•um Aufwand zu sparen
•um mit Werkzeugen von anderen Ontologien verwendet werden auch auf die eigene zugreifen zu können
•um Ontologien wiederzuverwenden, wenn sie durch erfolgreichen Einsatz validiert wurden
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
43
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Wenn keine passende Ontologie existiert oder der Aufwandzur Anpassung zu groß wird, dann erschaffe eine Neue!
Terminologie entwickeln
•Von welchen Begriffen soll die Rede sein?
•Welche Eigenschaften haben diese Begriffe?
•Was wollen wir über diese Begriffe aussagen?
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
44
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
Example: Wine Ontology•wine, grape, winery, location,... •a wine‘s color, body, flavor, sugar content,... •subtypes of wine: white wine, red wine, Bordeaux wine,...•types of food: seafood, fish, meat, vegetables, cheese,...•...
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Klassen und Klassenhierarchien entwickeln
•Klassen sind Konzepte in der betreffenden Domain
•Klasse der Weine
•Klasse der Weinbaubetriebe
•Klasse der Rotweine
•Klassen sind Sammlungen von Objekten mit gleichartigen Eigenschaften
•Wähle top-down / bottom-up / middle-out Ansatz zur Modellierung der Klassenhierarchien
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
45
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Definiere Properties
•Properties in einer Klassendefinition beschreiben Attribute von Instanzen
•jeder Wein hat eine Farbe, Restzuckergehalt, Produzent, etc,...
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
46
determinescope
considerreuse
enumerateterms
defineclasses
definepropertiess
defineconstraints
createinstances
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Definiere Beschränkungen auf Properties
•Property constraints (Restriktionen) beschreiben bzw. beschränken die Menge der möglichen Property-Werte
•Der Name eines Weines ist ein String
•Weinproduzent ist eine Instanz von Winzer
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
47
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
Definition von Klasseninstanzen
•Erzeuge die Instanzen der Klassen
•Jede Klasse wird zum direkten Typen für ihre Instanzen
•Jede Superklasse eines direkten Typs ist Typ der Instanz
•Zuweisung von Property-Werten für Instanzen entsprechend Constraints
•„das Glas spanischen Rotweins, das xy gestern abend zum Abendessen getrunken hat“
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
48
determinescope
considerreuse
enumerateterms
defineclasses
defineproperties
defineconstraints
createinstances
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.3 Ontology 101
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
49
Semantic Web Technologien Vorlesungsinhalt
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
50
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.4 Weitere Methoden
Methode nach Grüninger und Fox (1995)
•Formaler Ansatz des Ontologie-Entwurfs
•Inspiriert durch den Entwurf wissensbasierter Systeme (Prädikatenlogik)
1 2 3 4
MotivatingScenarios
FormalTerminology
InformalCompetencyQuestions
FormalCompetencyQuestions
FormalAxioms
Complete-ness
Theorems
5 6
(1) Identifikation des Hauptanwendungsszeniarios
(2) Kompetenzfragen um Spielraum/Fachgebiet der Ontologie festzulegen
(3) Extraktion der Terminologie/Konzepte/Relationen, Etc. (4) Formale Kompetenzfragen (mit eigens entwickelter Terminologie)
(5) Bestimmung der wichtigsten Axiome
(6) Überprüfung der Vollständigkeit
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
51 METHONTOLOGY•Lebenszyklus-Modell basierend auf entwickelten Prototypen
Fernandez-Lopez/Gomez-Perez, 1999
specifi-cation
concep-tualization
formali-zation
implemen-tation
mainte-nance
control
quality assurance
developmentactivities
managementactivities
supportactivities
knowledge acquisition
integration
evaluation
documentation
configuration
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.4 Weitere Methoden
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
On-To-Knowledge
FeasibilityStudy
OntologyKickoff
Ontology
Refinement MaintenanceEvaluation
project setting ontology development
(Staab et al., 2001)
•identifyproblem andopportunityareas
•select mostpromisingfocus areaand targetsolution
•requirementspecification
•analyzeinput sources
•developbaseline taxonomy
•conceptelicitation with domain experts
•developbaselinetaxonomy
•conceptualizeand formalize
•add relationsand axioms
•identifyproblem andopportunityareas
•select mostpromisingfocus areaand targetsolution
•manage organizationalmaintenanceprocess
4. Ontology Engineering4.2 Methoden des Ontologieentwurfs / 4.2.4 Weitere Methoden
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
53
Semantic Web Technologien Vorlesungsinhalt
•Ontologie-Entwurf ist sehr aufwändig bzgl. Zeit und Ressourcen
•kann das Verfahren (teil-)automatisiert werden?
•Ontologien können (automatisch) „gelernt“ werden
•Ontology Learning definiert Menge von Methoden und Techniken
•zum grundlegenden Aufbau einer neuen Ontologie
•zur Erweiterung oder Anpassung einer bereits existierenden Ontologie
•in einer (teil-)automatisierten Weise aus unterschiedlichen Ressourcen
•auch Ontology-Generation, Ontology-Mining, Ontology-Extraction,…
•Automatisierung benötigt Hilfestellung
•Natural Language Processing (NLP)
•Data Mining
•Machine Learning techniques (ML)
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
54
4. Ontology Engineering4.3 Ontology Learning
•Als Datengrundlage für das Ontology Learning können herangezogen werden:
•Strukturierte Daten
•Semi-strukturierte Daten
•Unstrukturierte Daten
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
55
4. Ontology Engineering4.3 Ontology Learning
XML
HTMLXML
HTML
Machine Learning
Natural Language Processing
+Machine Learning
Ontology Learning - Prinzipielles Vorgehen (I)
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
56
…
Dokumentenkorpus
(1) Term- extraktion <dog> <dogs>
<cat> <siamese cat>
Terme Ontologie
(2) Konzep- tualisierung
pet
dog
siamese cat
cat
(3) Evaluation und Nachbesserung
4. Ontology Engineering4.3 Ontology Learning
Semi-automatischer Prozess
Ontology Learning - Prinzipielles Vorgehen (II)
• Natural Language Processing:
(1) Tokenizer / Sentence Splitter
(2) Morphologische Analyse
• Stemming (Grundform) / Lemmatizer
(3) POS-Tagger
• Syntaktische Kategorien (Verb, Hauptwort, Präposition, etc...)
(4) Regular Expression Matching
(5) Chunks
• Erfassung größerer zusammenhängender Gebilde in Sätzen
(6) Syntactic Parser
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
57
4. Ontology Engineering4.3 Ontology Learning
Ontology Learning - Layer Cake
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
58
4. Ontology Engineering4.3 Ontology Learning
Termeriver, country, nation, city, capital, ...
Multilinguale Synonyme{country, nation, Land}
Konzeptformungc:=country:=<description(c), uri(c)>
Konzepthierarchiecapital ⊑c city , city ⊑c InhabitedGeoEntity
RelationenflowThrough(dom:river, range:GeoEntity)
RelationenhierarchiecapitalOf ⊑R locatedIn
Axiomenschematariver ⊓ mountain = ∅
Generelle Axiome∀x(country(x)→∃y capitalOf(y,x) ∧ ∀z (capitalOf(z,x)→y=z)
Ontology Learning Tasks•welche Aufgaben im Ontologie-Entwurf können (teil-)automatisiert werden?
Ontology Learning Tasks
• Ontology creation
• Ontology schema extraction
• Extraction of ontology instances
• Ontology integration and navigation
• Ontology update
• Ontology enrichment
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
59
4. Ontology Engineering4.3 Ontology Learning
Ontology Learning Tasks
•Ontology creation
•Entwurf von Grund auf (from the scratch) durch einen Experten
•Maschinelles Lernen (machine learning, ML) unterstützt den Experten beim Entwurf durch
•Vorschlag von geeigneten Relationen zwischen den Konzepten
•Überprüfung der Integrität/Konsistenz der entworfenen Ontologie
•Ontology schema extraction
•Extraktion von Schemata aus Web-Dokumenten / Texten
•ML benutzt Eingabedaten und Meta-Ontologien, um fertige Domain-Ontologien (ggf. mit Hilfe des Experten) zu erzeugen
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
60
4. Ontology Engineering4.3 Ontology Learning
Ontology Learning Tasks
•Extraction of ontology instances
•Extraktion von Ontologie Instanzen aus semi-strukturierten und unstrukturierten Daten, um vorgegebene Ontologie-Schemata mit Instanzen zu füllen
•nutzt Techniken aus den Bereichen Information Retrieval und Data Mining
•Ontology integration and navigation
•Umbau (Rekonstruktion) von existierenden Wissensbasen und Navigation in vorhandenen Wissensbasen,
•z.B. Übersetzung einer Wissensbasis aus FOL nach OWL
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
61
4. Ontology Engineering4.3 Ontology Learning
Ontology Learning Tasks
•Ontology update
•Erweiterung, Umbau und Veränderung von bereits bestehenden Ontologien, z.B. zur Anpassung an veränderte Domain
•betrifft Teilbereiche von Ontologien, die speziell so angelegt wurden, dass diese verändert werden können
•Ontology enrichment
•(auch Ontology tuning) betrifft automatische Aktualisierung kleinerer Teilbereiche bereits existierender Ontologien
•verändert nicht wichtige (bedeutende) Konzepte und Relationen, sondern präzisiert diese
•anders als bei Ontology update sind Teilbereiche von Ontologien betroffen, die an sich nicht verändert werden können sollten
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
62
4. Ontology Engineering4.3 Ontology Learning
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
63
Semantic Web Technologien Vorlesungsinhalt
Ontology Mapping
•um sich zu verstehen, müssen zwei Parteiendieselbe formale Spezifikation einer gemeinsamen Konzeptualisierung verwenden
•sich aber auf dieselbe Ontologie zu einigen ist nicht immer einfach (unterschiedlicher Anwendungszweck, unterschiedliche Sichtweisen, unterschiedliche Meinungen…)
•Parteien mit unterschiedlichen Ontologien (zur einer identischen Domain) können sich nicht verstehen
•Ontologien müssen aufeinander abgebildet werden(= Ontology Mapping / Ontology Matching / Ontology Alignment )
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
64
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
Ontology Mapping
•ist ein Prozess, in dem zwei Ontologien semantisch auf der konzeptionellen Ebene miteinander in Beziehung gesetzt werden (Schema Matching).
•Dabei werden Instanzen der Start-Ontologie OS entsprechend der ermittelten semantischen Beziehungen in Instanzen der Ziel-Ontologie OT mit Hilfe einer Abbildung M: OS → OT transformiert.
•Die Abbildung M kann dabei
•injektiv (nicht umkehrbar) oder auch
•bijektiv sein
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
65
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
Heterogenität von Ontologien
•Syntaktische Heterogenität:
•Ontologien liegen in unterschiedlichen Ontologie-Beschreibungssprachen vor(Bsp: in OWL DL und F-Logic)
•Kann auf konzeptioneller Ebene gelöst werden, meist unter Erhaltung der Bedeutung
•Terminologische Heterogenität:
•Namensuntertschiede bei der Bezeichnung von Entitäten in unterschiedlichen Ontologien (Bsp.: ,Artikel‘ und ,Publication‘)
•Kann durch die verwendung unterschiedlicher (natürlicher) Sprachen hervorgerufen werden
•Konzeptionelle (semantische) Heterogenität•Ontologien modellieren dieselbe Domäne, aber auf unterschiedliche Weise
•Unterschiede in Vollständigkeit, Granularität, Perspektive
•Semiotische (pragmatische) Heterogenität
•Unterschiede in der Interpretation einer zu modellierenden Domäne durch den Menschen (schwierig)
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
66
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
Ontology Mapping
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
67
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
Ontology Mapping•Ontology Mapping ist kein “neues” Problem…
•dieselben Probleme treten bei der Datenintegration z.B. in föderierten Datenbanken auf
•Föderierte Datenbanken verwalten lokale Schemata für jede einzelne beteiligte Datenbank
•Datenintegration (Schema Matching) erfolgt entweder über
•bilaterale Abbildungen oder über
•globale Schemata zu denen jeweils eine Abbildung zu jedem lokalen Schema existiert (Abbildung erfolgt über view)
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
68
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
Ontology Mapping Process•prinzipieller Ablauf
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
69
OS1
OS2
importontologies
findsimilarities
specifymapping / merging
mappingM(OS1)
mergedontology
1 2 3
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
Schema-Based Matching Techniques
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
70
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
Structure-LevelElement-Level
Syntactic External Syntactic External Semantic
String-Based
• Name similarity
• Description similarity
Language-Based
• Tokenization
• Lemmati-zation
• Morphology
LinguisticResources
• Lexicons
• Thesauri
Constraint-Based
• Type similarity
• Key properties
AlignmentReuse
• Entire schema or
• Ontology fragments
Upper Levelvs
Domain specificOntolo-gies
Data Analysis & Statistics
• Frequency
• Distribution
Graph-Based
• Graph homo-morphism
• Path, children,
Taxonomy-Based
• Taxonomy structure
RepositoryOfStructures
• Structuremetadata
Model-Based
• DL reasoner
• SAT Solver
Linguistic Internal Relational
Terminological Structural Semantic
Schema-Based Matching Techniques
Extensional
Schema-Based Matching Techniques
Kind of Input
Basic Techniques
Granularity /Input Interpretation
Euzenat, Shvaiko: Ontology Matching, Springer 2007
Ontology Merging
•ist ein Prozess, in dem aus zwei oder mehr Start-Ontologien eine neue Ontologie erzeugt werden soll.
•die neue Ontologie vereinheitlicht und ersetzt die originalen Start-Ontologien.
•Union ApproachDie neue Ontologie ist die Vereinigung aller Entitäten der Start-Ontologien, wobei Konflikte aus unterschiedlichen Repräsentation identischer Konzepte der Start-Ontologien aufgelöst wurden.
•Intersection Approach (extensional)Die neue Ontologie besteht nur aus den Teilen der Start-Ontologien, die überlappen.
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
71
4. Ontology Engineering4.4 Ontology Mapping und Ontology Merging
4.Ontology Engineering
4.1.Ontologien - eine kurze Wiederholung
4.2.Methoden des Ontologie-Entwurfs
4.2.1.Allgemeines Vorgehen
4.2.2.Methode von Uschold und King
4.2.3.Ontology 101
4.2.4.Weitere Methoden des Ontologie-Entwurfs
4.3.Ontology Learning
4.4.Ontology Mapping und Ontology Merging
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
72
Semantic Web Technologien Vorlesungsinhalt
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
73
Joseph Wright of Derby:The Alchymist, In Search of the Philosopher’s Stone, 1771
Linked
Data
&
Semant
ic Web
Applic
ations
Nächste Vorlesung:
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
74
Literatur
» A. Gomez-Perez et al.Ontological Engineering, Springer, 2004.
» J. Euzenat, P. Shvaiko: Ontology Matching, Springer, 2007.
4. Ontology Engineering
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
75
Literatur
» S. Staab, S. Studer (Eds.)Handbook on Ontologies, 2nd ed,Springer, 2009.
4. Ontology Engineering
Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
76
Materialien
□Bloghttp://web-flakes.blogspot.com/
□Materialien-Webseitehttp://www.hpi.uni-potsdam.de/meinel/lehre/lectures_classes/semanticweb_ws1011.html
□bibsonomy - Bookmarkshttp://www.bibsonomy.org/user/lysander07/swt1011_12
3. Wissensrepräsentation und Logik3.7 Regeln mit SWRL / RIF