Design and Analysis of Quality Information for Data Warehouses
description
Transcript of Design and Analysis of Quality Information for Data Warehouses
![Page 1: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/1.jpg)
DESIGN AND ANALYSIS OF QUALITY INFORMATION FOR DATA WAREHOUSES
Manfred Jeusfeld, Christoph Quix, Matthias Jarke.
![Page 2: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/2.jpg)
AGENDA
Introducción Definiciones Presentación del modelo Instanciación y especialización Conclusiones Criticas
![Page 3: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/3.jpg)
INTRODUCCIÓN
Un Data Warehouse (DW) pueden definirse como repositorios de datos, alimentados por numerosas fuentes.
![Page 4: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/4.jpg)
INTRODUCCIÓN
En la propuesta se presenta un modelo para evaluar la calidad en un DW.
El modelo permite a diferentes interesados (stakeholders) definir objetivos de calidad.
Esos objetivos se traducen en consultas ejecutables sobre los metadatos.
![Page 5: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/5.jpg)
DEFINICIONES
Objeto Medible: Objeto al que se le puede asociar un objetivo de calidad.
Objetivo de Calidad: es un requerimiento abstracto, relacionado con un objeto y tiene un interesado (stakeholder), una dimensión y un propósito.
Consulta de Calidad: opera sobre las medidas de calidad para comprobar si un objetivo de calidad es actualmente cumplido.
![Page 6: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/6.jpg)
DEFINICIONES
Dimensión de Calidad: Se utiliza para definir objetivos de calidad.
Medida de Calidad: Es la actividad documentada para medir la calidad asociada a algún objeto medible.
Métrica: Unidad de medición de la calidad.
![Page 7: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/7.jpg)
DEFINICIONES
Dominio de Calidad: especifica los valores permitidos para los resultados obtenidos de una medición de calidad.
Rango de Calidad: Es un rango de valores esperados de la medición de calidad.
![Page 8: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/8.jpg)
META MODELO DE CALIDAD
Usando un enfoque de meta modelado, puede ser construido parte del esquema de la base de metadatos del DW.
Esto permite a los stakeholders representar sus objetivos de calidad explícitamente y la base de metadatos mantiene la relación entre valores de calidad y objetos medibles.
![Page 9: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/9.jpg)
META MODELO DE CALIDAD
![Page 10: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/10.jpg)
ESPECIALIZACIÓN E INSTANCIACIÓN DEL MODELO
Codificación de los objetivos de calidad: A modo de ejemplo se define el objetivo de
incrementar la disponibilidad de los datos para una determinada relación.
Codificación de las medidas de calidad:Para ello se plantea la medición del porcentaje de
valores nulos por tuplas de una relación.
![Page 11: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/11.jpg)
ESPECIALIZACIÓN E INSTANCIACIÓN DEL MODELO
Codificación de un objetivo de calidad
![Page 12: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/12.jpg)
ESPECIALIZACIÓN E INSTANCIACIÓN DEL MODELO
Codificación de medidas de calidad
![Page 13: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/13.jpg)
ESPECIALIZACIÓN E INSTANCIACIÓN DEL MODELO Consulta de Calidad
Su propósito es mediar entre el objetivo de calidad y la medida de calidad.
Permite verificar si se cumple un objetivo de calidad.
Para formularlas se utiliza ConceptBase.
ConceptBase es un sistema orientado al manejo de bases de metadatos.
Fue propuesto por Jark y Jeusfeld entre otros.
![Page 14: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/14.jpg)
ESPECIALIZACIÓN E INSTANCIACIÓN DEL MODELO
Consulta de Calidad. Ejemplos:
QualityQuery TooManyNullValues isA Source,Relation with
constraint
c: $ exists m/MeasureNullValues
(this hasMeasure m) and
not (m in MeasureNullValues^exprange) $
end
![Page 15: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/15.jpg)
ESPECIALIZACIÓN E INSTANCIACIÓN DEL MODELO Consulta de Calidad. Ejemplos:QualityQuery BetterOnNullvalues isA Source,Relation
with constraint c: $ exists m1,m2/MeasureNullValues (this hasMeasure m1) and (this hasMeasure m2) and (m2 after m1) and exists v1,v2/[0;100] (m1 qualityvalue v1) and (m2 qualityvalue v2) ==> (v1 > v2) $end
![Page 16: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/16.jpg)
CONCLUSIONES Se presento un meta modelo de calidad para
DW que puede ser usado tanto para diseñar como para analizar medidas de calidad.
Las principales ventajas que remarcan los autores son: Los objetivos de calidad pueden ser formulados
desde las diferentes perspectivas de stakeholders.
Las consultas de calidad son consultas ejecutables en la meta database. La respuesta es la evidencia para un stakeholder para decidir si la calidad es apropiada o no.
Las medidas de calidad son explícitamente guardaos en la meta database.
![Page 17: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/17.jpg)
CRÍTICAS (POSITIVAS)
El área de trabajo en el que profundiza es relevante.
La redacción es clara, esta bien estructurado y se complementa con imágenes.
El modelo presentado podría aplicarse no solo en DW sino también en Bases Relacionales.
Menciona posibles trabajos a futuro y mejoras.
![Page 18: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/18.jpg)
CRÍTICAS (NEGATIVAS)
No es auto contenido.
No presenta experimentos reales y los ejemplos teóricos son pocos.
![Page 19: Design and Analysis of Quality Information for Data Warehouses](https://reader036.fdocuments.in/reader036/viewer/2022062518/56813ffe550346895dab2d1d/html5/thumbnails/19.jpg)
PREGUNTAS??