Post on 28-Jan-2016
Introducción a Ontologías
Stefan Schulz
Medical Informatics
Research Group
UniversityMedical Center
Freiburg, Germany
Propósito
Aclarar la diferencias entre
Terminologías / tesauros
Ontologías
Precisar las bases semánticas de
representaciones OWL / lógica descriptiva
Promover práctica buenas de ingeniería ontológica
mediante ejercicios prácticos usando Protégé en el
contexto de biomedicina
Systematized Nomenclature of MedicineClinical Terms (SNOMED CT)
SNOMED Términos Clínicos®
• Sistema de codificación para todo la historia clínica
• Estándar terminológico global
• Manutención / desarrollo : IHTSDO (International Health Terminology
Standards Development Organisation):
Miembros: US, UK, AU, NZ, CA, DK, SE, NL, LV, ES
SNOMED CT como vocabulario controlado
Términos clínicos (inclusive sinónimos e
traducciones) conectados con conceptos
(portadores de significado)
311 000conceptos
~750 000 términos ingleses,
~400 000 castellanos
SNOMED CT como ontología
taxonomías de clases:C1 isa C2 significa
x: instanceOf(x, C1) instanceOf(x, C2)
teoría la cual ofrece formulaciones
precisas y matemáticas de las
propiedades y relaciones de ciertas
entidades
SNOMED CT : Jerarquías taxonómicas
SNOMED CT como ontología
Restricciones: lógica descriptiva.C1 – Rel – C2 significa:x: instanceOf(x, C1)
y: instanceOf(C2) Rel(x,y)
C1 ⊑ Rel.C2
Relaciones (Atributos): Associated morphology
Finding site
(50 tipos)
SNOMED CT como ontología
definierte vs. primitive Konzepte
conceptos definidos conceptos primitivos ⊑
Lo que terminología y ontologias biomédica tienen en común
Nodos, enlaces, jerarquias Definiciones formales o informales
domain or region of DNA [GENIA]: A substructure of DNA molecule which is supposed to have a particular function, such as a gene, e.g., c-jun gene, promoter region, Sp1 site, CA repeat. This class also includes a base sequence that has a particular function.
Peptides [MeSH]: Members of the class of compounds composed of AMINO ACIDS joined together by peptide bonds between adjacent amino acids into linear, branched or cyclical structures. OLIGOPEPTIDES are composed of approximately 2-12 amino acids. Polypeptides are composed of approximately 13 or more amino acids. PROTEINS are linear polypeptides that are normally synthesized on RIBOSOMES.
19429009|chronic ulcer of skin|116680003|is a|=64572001|disease| {116676008|associated morphology|= 405719001|chronic ulcer| 363698007|finding site|= 39937001|skin structure|}
etiquetas / termos legibles pare usuarios
• Benign neoplasm of heart• Benign tumor of heart• Benign tumour of heart• Benign cardiac neoplasm• Gutartiger Herzumor• Gutartige Neubildung am
Herzen• Gutartige Neubildung:
Herz• Gutartige Neoplasie des
Herzens• Tumeur bénigne
cardiaque• Tumeur bénigne du cœur• Neoplasia cardíaca
benigna• Neoplasia benigna do
coração• Neoplasia benigna del
corazón• Tumor benigno do
corazón
clases, conceptos,
descriptores, categorias…
Terminologías Ontologías
Conjunto de términos
que representan el
sistema de conceptos de
un domino particular
(ISO 1087)
La ontología es el estudio de lo que hay. Una ontología es una teoría la cual ofrece formulaciones precisas y matemáticas de las propiedades y relaciones de ciertas entidades (Stanford Encyclopedia of Philosophy)
bla bla bla
Terminologías tratan de conceptos y lenguaje
humano
Terminologías Ontologías
bla bla bla
Conjunto de términos
que representan el
sistema de conceptos de
un domino particular
(ISO 1087)
La ontología es el estudio de lo que hay. Una ontología es una teoría la cual ofrece formulaciones precisas y matemáticas de las propiedades y relaciones de ciertas entidades (Stanford Encyclopedia of Philosophy)
entidades de lenguaje
(términos)
„benign neoplasm of heart“ „gutartige Neubildung des Herzmuskels”“neoplasia cardíaca benigna”
Conceptos)
Ejemplo: UMLS (mrconso table)
C0153957|ENG|P|L0180790|PF|S1084242|Y|A1141630||||MTH|PN|U001287|benign neoplasm of heart|0|N||
C0153957|ENG|P|L0180790|VC|S0245316|N|A0270815||||ICD9CM|PT| 212.7|Benign neoplasm of heart|0|N||
C0153957|ENG|P|L0180790|VC|S0245316|N|A0270817||||RCD|SY|B727.| Benign neoplasm of heart|3|N||
C0153957|ENG|P|L0180790|VO|S1446737|Y|A1406658||||SNMI|PT| D3-F0100|Benign neoplasm of heart, NOS|3|N||
C0153957|ENG|S|L0524277|PF|S0599118|N|A0654589||||RCDAE|PT|B727.|Benign tumor of heart|3|N||
C0153957|ENG|S|L0524277|VO|S0599510|N|A0654975||||RCD|PT|B727.| Benign tumour of heart|3|N||
C0153957|ENG|S|L0018787|PF|S0047194|Y|A0066366||||ICD10|PS|D15.1|Heart|3|Y||
C0153957|ENG|S|L0018787|VO|S0900815|Y|A0957792||||MTH|MM|U003158|Heart <3>|0|Y||
C0153957|ENG|S|L1371329|PF|S1624801|N|A1583056|||10004245|MDR|LT|10004245|Benign cardiac neoplasm|3|N||
C0153957|GER|P|L1258174|PF|S1500120|Y|A1450314||||DMDICD10|PT| D15.1|Gutartige Neubildung: Herz|1|N||
C0153957|SPA|P|L2354284|PF|S2790139|N|A2809706||||MDRSPA|LT| 10004245|Neoplasia cardiaca benigna|3|N||
términos
Shared Term Meanings
Unified Medical Language System, Bethesda, MD: National Library of Medicine: http://umlsinfo.nlm.nih.gov/
Ejemplo : UMLS
C0153957|A0066366|AUI|PAR|C0348423|A0876682|AUI | |R06101405||ICD10|ICD10|||N||
C0153957|A0066366|AUI|RQ |C0153957|A0270815|AUI |default_mapped_ from|R03575929||NCISEER|NCISEER|||N||
C0153957|A0066366|AUI|SY |C0153957|A0270815|AUI |uniquely_mapped_ to |R03581228||NCISEER|NCISEER|||N||
C0153957|A0270815|AUI|RQ |C0810249|A1739601|AUI |classifies | R00860638||CCS|CCS|||N||
C0153957|A0270815|AUI|SIB|C0347243|A0654158|AUI | |R06390094 || ICD9CM|ICD9CM||N|N||
C0153957|A0270815|CODE|RN|C0685118|A3807697|SCUI |mapped_to | R15864842||SNOMEDCT|SNOMEDCT||Y|N||
C0153957|A1406658|AUI|RL |C0153957|A0270815|AUI |mapped_from | R04145423||SNMI|SNMI|||N||
C0153957|A1406658|AUI|RO |C0018787|A0357988|AUI |location_of | R04309461||SNMI|SNMI|||N||
C0153957|A2891769|SCUI|CHD|C0151241|A2890143|SCUI|isa |R19841220|47189027|SNOMEDCT|SNOMEDCT|0|Y|N||
Shared Term Meanings
Shared Term Meanings
Relaciones Semanticas
Example: UMLS
C0153957|A0066366|AUI|PAR|C0348423|A0876682|AUI | |R06101405||ICD10|ICD10|||N||
C0153957|A0066366|AUI|RQ |C0153957|A0270815|AUI |default_mapped_ from|R03575929||NCISEER|NCISEER|||N||
C0153957|A0066366|AUI|SY |C0153957|A0270815|AUI |uniquely_mapped_ to |R03581228||NCISEER|NCISEER|||N||
C0153957|A0270815|AUI|RQ |C0810249|A1739601|AUI |classifies | R00860638||CCS|CCS|||N||
C0153957|A0270815|AUI|SIB|C0347243|A0654158|AUI | |R06390094 || ICD9CM|ICD9CM||N|N||
C0153957|A0270815|CODE|RN|C0685118|A3807697|SCUI |mapped_to | R15864842||SNOMEDCT|SNOMEDCT||Y|N||
C0153957|A1406658|AUI|RL |C0153957|A0270815|AUI |mapped_from | R04145423||SNMI|SNMI|||N||
C0153957|A1406658|AUI|RO |C0018787|A0357988|AUI |location_of | R04309461||SNMI|SNMI|||N||
C0153957|A2891769|SCUI|CHD|C0151241|A2890143|SCUI|isa |R19841220|47189027|SNOMEDCT|SNOMEDCT|0|Y|N||
Shared Term Meanings
Shared Term Meanings
Relaciones Semanticas
Relaciones semánticas en terminologías / tesauros
Son informales
Significado depende del contexto y está relacionado con lenguaje humano
el dedo es parte del manoEl mano tiene parte pulgaraspirina trata dolor de cabeza Murcia está localizada en EspañaObama es presidente Donald es un pato“Higado” traducción de “liver”España puede ser Campeón 2010
el gorila es un prímateel trigo es un alimentoel trigo es una plantapolen causa alergias Lmo-2 interactúa con elf-2Neumonía tiene síntoma fiebre
Ontologías formales tratan de lo que existe en el mundo
Terminology Ontología
Set of terms
representing the system
of concepts of a
particular subject field.
(ISO 1087)
bla bla bla
La ontología es el estudio de lo que hay. Una ontología es una teoría la cual ofrece formulaciones precisas y matemáticas de las propiedades y relaciones de ciertas entidades (Stanford Encyclopedia of Philosophy)
Instanciación
Tipos de Entidades
El tipo neoplasia benigno del corazón
Entidades
neoplasia benigno del corazón del paciente 12345
instance-of
Relaciones e definiciones
Taxonomías: relaciona tipos and subtipos: Tumor of Heart subClassOf Tumor equivalente con: Todas las instancias de Tumor of Heart son instancias de Tumor
(sin excepciones)
Relaciones: instance_of relaciona individuales con tipos, todas las otras relacionan
individuales (e.g. part_of) o son derivados de ellos (e.g. is_a)
Definiciones: describen lo que es siempre verdadero para todos los individuales que instancian un tipo
Tumor of Heart subClassOf has_location some Heart : Todas las instancias de Tumor of Heart están localizadas en algun Heart
Jerarquías, Tipos, Clases, Individuales
Dominio
Jerarquías, Tipos, Clases, Individuales
Dominio
Ontology Type 1
Jerarquías, Tipos, Clases, Individuales
Dominio
Ontology
Is_a Is_a Is_a
Type 1
Subtype 1.2
Subtype 1.1
Subtype 1.3
Jerarquías, Tipos, Clases, Individuales
Dominio
OntologyInflammatory
Disease
Jerarquías, Tipos, Clases, Individuales
Dominio
Ontology
Is_a Is_a
Gastritis PancreatitisHepatitis
InflammatoryDisease
Is_a
Jerarquías, Tipos, Clases, Individuales
Dominio
OntologyInflammatory
DiseaseIs_a Is_a
Gastritis PancreatitisHepatitis
Is_a
Jerarquías, Tipos, Clases, Individuales
Dominio
OntologyInflammatory
DiseaseIs_a Is_a
Gastritis PancreatitisHepatitis
Is_a
Jerarquías, Tipos, Clases, Individuales
Dominio
Relaciones y Definiciones
Ontology
Liver
hasLocation
InflammatoryDisease
Hepatitis
Is_a
Hepatitis
Dominio
Relaciones y Definiciones
Ontology
Liver
hasLocation
InflammatoryDisease
Hepatitis
Is_a
Hepatitis
Dominio
Relaciones y Definiciones
Ontology
Liver
hasLocationHepatitis
InflammatoryDisease
Is_a
Dominio
Relaciones y Definiciones
Ontology
Liver
hasLocationHepatitis
InflammatoryDisease
Is_a
Viral HepatitisPopulation of Virus
Population
Is_a causedby
Dominio
Compromiso ontológico
Dominio
Cuales son los objetos que pertenecen al dominio representado?
Cuales dominios deben estar excluidos ?
Compromiso ontológico
Mouse
Ficcion? Realidad?
Otros ejemplos ?
Lenguajes para ontologías formales
x: instanceOf(x, Hepatitis) instanceOf(x, Inflammation) y: instanceOf(y, Liver) hasLocation(x,y)
“Every hepatitis is an inflammatory disease that is located in some liver” “Every inflammatory disease that is located in some liver is an hepatitis”
Lenguaje natural:
Lógica de primer orden:
Lógica descriptiva:Hepatitis equivalentTo Inflammation and hasLocation some Liver
OWL – Ontology Web Language e Protégé
Clases Relaciones Individuos
Ejercicio 1
modeliza en Protege como clases e instancias e incluyendo enlaces jerárquicos :
Body partOrganLiverRespiratory TractLungCell
Living BeingAnimalHuman
CountrySpainSouth AfricaDurban
Spanish TeamXaviCasillas…
Relaciones
Importante: relaciones (object properties) en OWL solamente entre individuos
Dominio y rango especifican restricciones
Características algébricas: transitividad, reflexividad
Ejercicio 2
Añade las relaciones part of y has part (relación inversa)
Expresa que Durban es una parte de Sudáfrica Es posible, expresar de la misma manera que el
pulmón es parte del aparejo respiratorio ?
Restricciones
part-of (Durban, Sudáfrica) es una expresión correcta, pero no:part-of (Pulmón, Aparejo respiratorio)
Cuantificación:cada instancia de Pulmón es parte de una instancia de Aparejo respiratorio:
FOL:x: instanceOf(x, Pulmon) y: instanceOf(y, AparejoResp) part-of (x,y)
DL (Manchester Syntax) Pulmon subClassOf part-of some AparejoResp
Restricciones
Ejercicio 3
Completa las clases en la mini-ontologia con restricciones
Ejercicio 3
Completa las clases en la mini-ontologia con restricciones
Constructores de la lógica descriptiva
Constructor DL Significado Ejemplo
⊓ and
E ⊓ F E and F
Intersección entre E y F
Acid ⊓ Organic Molecule
some
r.G r some G
Restricción existencial de la relación r por G
part-of.Liver
⊑ subClassOf
A ⊑ B A subClassOf B
B subsume A
Liver ⊑ Organ
equivalentTo
C D C equivalentTo D
C y D son equivalentes
Organic Acid Acid
⊓ Organic Molecule
not A not A
Negación de A Base ⊑ Acid
only
r.G r only G
Restricción de valor de la relación r por G
Hand ⊑ has-Laterality.
(Left ⊔ Right) ⊔ or
A ⊔ B A or B
Unión de A con B
Dialectos de la lógica descriptiva
Diferentes conjuntos de operadores y propiedades. Ej: EL: {SubClassOf, equivalent To, and, some}(dialecto de SNOMED CT)
Diferentes grados de complejidad computacional Padrones OWL:
OWL EL OWL QL OWL RL
Razonadores, e.g. HermiT, Pellet, Fact++:OWL QL
Ejercicio 4a: ontología para neumonía
Modeliza el siguiente dominio: La neumonía es una enfermedad infecciosa que afecta el tejido del
pulmón. Los pulmones son órganos localizados en el tórax. Hay un pulmón derecho y un pulmón izquierdo El pulmón derecho tiene tres lobos: lobo superior, medio, inferior. E
pulmón izquierdo apenas dos, superior y inferior Otros órganos son corazón, riñón, y hígado. La neumonía puede ser adquirida en el hogar o en el hospital La neumonía viral es una neumonía causada por virus La neumonía bacteriana es una neumonía causada por bacterias Hay tambien otras causas de la neumonia. Las neumonias pueden ser agudas o cronicas.
¿Qué relaciones y clases de nivel superior son necesarias?
Ejercicio 4b: ontología para neumonía
Define clases e confiere su consistencia neumonía viral crónica neumonía bacteriana adquirida en el hospital neumonía bacteriana aguda en el lobo inferior derecho neumonía bacteriana aguda en el pulmón derecho * neumonía bacteriana aguda e crónica * neumonía bacteriana en el hígado *neumonía aguda en el lobo medio del pulmón izquierdo
Examina los siguientes queries Todas las estructuras anatómicas que tienen tejido pulmonar Todas las estructuras anatómicas que no tienen tejido pulmonar Todo lo que está localizado en el tórax
¿ Cuales son las modificaciones necesarias para impedir la definición de clases inconsistentes
¿ Cuales son las modificaciones necesarias para evitar resultados falsos ?
Ejercicio 4c : ontología para neumonía
Intenta expresar lo siguiente conocimiento neumonías bacterianas son tratados con antibióticos hay neumonías bacterianas resistentes a penicilina neumonías lobares normalmente son bacterianas la embolia pulmonar predispone para neumonía bacteriana la neumonía viral es una enfermedad frecuente la neumonía viral unilateral es una enfermedad rara la neumonía típica tiene como síntomas fiebre y dolor
Ejercicio 4d : ontología para neumonía
Inspecciona las clases e relaciones de la ontología de nivel superior BioTop (purl.org/biotop/biotop.owl) .
Reconstruye tu ontología utilizando clases y relaciones del BioTop
(importando la ontología externa)
OWL – What can sensibly be expressed
Only suitable to represent shared, uncontroversial
meaning of a domain vocabulary
Supports universal statements about instances of
a type:
All Xs are Ys
For all Xs there is some Y
Properties of types are properties of all entities that
instantiate these types (strict inheritance)
Context dependent knowledge „Allergic Rhinitis is a common disorder (in Europe)“
Probabilistic knowledge „95% of people infected with viral hepatitis recover “ “Smoking is a cardiovascular risk factor”
Default / canonic knowledge „Adult humans have 32 teeth“
Meta-classes (instances of instances), e.g. Clyde subClassOf Elephant subClassOf Species
(“punning” not expressible in description logics) Non quantified relations between classes
Treats(Aspirin, Headache)
Ontology Knowledge Representation
OWL – What cannot be expressed
Continuum of knowledge
Universally accepted assertions
Consolidated but context-dependent facts
Hypotheses, beliefs, statistical associations
Domain Knowledge
Consolidated but context-dependent facts
Hypotheses, beliefs, statistical associations
Ontology !
Domain Knowledge
Universally accepted assertions