24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

34
Asegurando la Calidad del Dato en mi Proyecto de BI Mary Arcia MCTS SQL Server SQL PASS Venezuela [email protected] Moderador: David Sanchez

Transcript of 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Page 1: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Asegurando la Calidad del

Dato en mi Proyecto de BIMary Arcia

MCTS SQL Server

SQL PASS Venezuela

[email protected]

Moderador: David Sanchez

Page 2: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Gracias a nuestros auspiciadores

Database Security as Easy as A-B-C

http://www.greensql.com

Hardcore Developer and IT Training

http://www.pluralsight.com

SQL Server PerformanceTry PlanExplorer today!

http://www.sqlsentry.com

Page 3: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Próximos SQL Saturday

24 de Enero de 2015 https://www.sqlsaturday.com/346/register.aspx

18 de Abril de 2015 https://www.sqlsaturday.com/368/register.aspx

9 de Mayo de 2015 https://www.sqlsaturday.com/373/register.aspx

6 de Diciembre de 2014 https://www.sqlsaturday.com/351/register.aspx

Page 4: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

4

Capítulo Global PASS en Español

4

Reuniones semanales todos los miércoles a

las 12PM UTC-5 (Hora de Colombia)

https://www.facebook.com/SpanishPASSVC

Page 5: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

5

Asistencia Técnica

Si requiere asistenciadurante la sesión debe usar la sección de preguntas que esta en el menú de la derecha.

Use el botón de Zoom para ajustar su pantalla al tamaño deseado

Escriba sus preguntas en la sección de preguntas que esta en el menú de la derecha

Page 6: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Mary es Especialista de Business Intelligence en Grupo de Desarrollo GD,

Caracas, Venezuela

Lleva +12 años trabajando en proyectos de Business Intelligence y

Administracion de Bases de Datos.

Colaborador activo de eventos SQL Server para LATAM (IT Woman PASS

LATAM, 24 Horas de PASS en español)

Coordinador del Cápítulo de PASS en Venezuela.

Page 7: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

7

o Qué es la Calidad del Dato

o Cinco estilos de BI que impactan la calidad del dato

o Procesos para asegurar la Calidad del Dato

o Qué es Data Quality Services

o Proyectos de Data Quality Services

7

Agenda

Page 8: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

CALIDAD DE DATOS EN

BUSINESS INTELLIGENCE

Page 9: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

9

Qué es calidad de datos

Se refiere a los procesos, técnicas, algoritmos y operaciones

encaminados a mejorar la calidad de los datos existentes en las

empresas y organizaciones.

Según el TDWI

Se define como la medida de correspondencia y exactitud

entre los datos de un sistema de información y su valor y

significado en el mundo real.

9

Page 10: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

10

Etapas de Madurez de los datos

10

Conocimiento

Información

Datos

• Información Consolidada para la toma de decisiones

• Datos combinados y agregados para responder preguntas sencillas del negocio

• Aplicaciones ERP, CRM y otros sistemas que guardan la transaccionabilidad

Soporte aDecisiones estratégicas

Soporte aOperativa Del negocio

Page 11: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

1111

Problemas de la mala calidad de los datos

Calidad de Dato Problema Ejemplo

Formato Tenemos un formateo consistente

en los estándares?

Nro de teléfono:

(xxx)-xxx-xxxx,

58+ xxx.xxx.xx.xx, xxx-xxxx

Estandarización Son los elementos de dato

definidos y se comprenden sus

valores?

Código de Género:

M, F, U,

0, 1, 2

Consistencia Representan los valores lo mismo?

Tienen el mismo significado?

Consumos representados en

Bs, $, reales o pesos

Completitud Se encuentra completa toda la data

que necesitamos?

20% de los apellidos de los

clientes están en blanco, 50%

de las direcciones no tienen

código postal

Page 12: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

1212

Problemas de la mala calidad de los datos (cont)

Calidad de Dato Problema Ejemplo

Exactitud Representa la data la realidad

exacta? Son las fuentes

verificables?

Los clientes no se encuentran

en las direcciones registradas.

Los proveedores listados como

activos no lo están desde hace

6 años

Validez Se encuentran los valores entre los

rangos aceptables?

Los límites de crédito de los

clientes no corresponden a su

perfil

Duplicidad Los datos aparecen varias veces? Los clientes Maria Alejandra

Pérez y Marialejandra Pérez

son lo mismo

Page 13: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

13

Características de nuestros sistemas de BI …

o Datos extraídos de sistemas y aplicaciones dispares.

o Único punto de consulta o reporting en la organización.

o Información correcta expresada de otra forma.

o Reflejo de la realidad de lo que está pasando en la empresa.

13

Page 14: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

14

o Cuadros de Mando y Tablas de Resultados

o Reporting Empresarial

o Análisis de Cubos OLAP

o Análisis Avanzado-Predictivo

o Notificaciones y Alertas

14

Implementaciones comunes en BI y sus requisitos de

calidad de datos

Page 15: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

15

Por qué prestar atención a la calidad de los datos?

o Los datos necesitan estar accesibles y ser agregados para poder

consumirse por el BI.

Independientemente del formato donde sea que el usuario los necesite

o Las acciones que los usuarios emprenden están influenciadas por la

precisión de los datos en los informes.

o La confianza en los datos es un aspecto crítico entre los equipos de IT y los

usuarios de BI

La confianza debe ganarse y los datos no son la excepción

15

Page 16: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

16

o Los conocimientos empresariales obtenidos a través del BI se convierten en

útiles con mayor rapidez.

o Los directivos, responsables y usuarios de negocio pueden actuar

inmediatamente ante nuevos patrones y tendencias con una granularidad y

precisión mas elevada.

o Identificar sobrecostes y oportunidades para ahorrar y reducir gastos.

o Se incrementa la auditabilidad y visibilidad del dato para futuras revisiones y

monitoreo.

o El ROI sobre el BI es directo e inmediato.

16

Por qué prestar atención a la calidad de los datos? (Cont)

Page 17: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

17

Qué podemos hacer para asegurar la calidad de los datos

17

1. Descubrir

2. Perfilar

3. Limpiar

4. Match

5. Consolidar

6. Monitorizar

Identificar y medir la calidad de los datos

Definir reglas y objetivos

de la calidad de los datos

Diseñar los procesos de

mejora de la calidad de los

datos

Matcheo de información y

estadísticas

Implementar los

procesos de mejora

de calidad

Monitorear la calidad

de los datos vs los

objetivos

Page 18: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

DEMOVisualizando Datos de mala calidad

Page 19: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

DATA QUALITY SERVICES

Page 20: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

20

Data Quality Services (DQS) es una solución

basada en el conocimiento de la calidad de datos

que permite a los administradores de datos y

profesionales de IT la mejora de la calidad de sus

datos fácilmente.

20

Qué es Data Quality Services

Page 21: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

2121

En qué nos apoya Data Quality Services?

Conocimiento

Limpieza

Consolidación

Aporte de Valor

Page 22: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

2222

Arquitectura Básica de DQS

CLIENTE SERVIDOR

Data Quality Services Client

Componente IntegrationServices

DQS_MAIN

DQS_PROJECT

DQS_STAGING

Page 23: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

BASES DE CONOCIMIENTO

Page 24: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

2424

Bases de Conocimiento

Bases de Conocimiento

Dominios Compuestos

Dominios

Reglas de matching

ValoresReglas y

RelacionesDominio

Referencias Externas

Page 25: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

DEMOConstruyendo una base de conocimiento

Page 26: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

PROYECTOS DE DQS

Page 27: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

2727

Proyectos de Matching

Creación de Reglas

Matching Exportación

Política de comportamiento del

motor DQS

Lógica DifusaAgrega Metadatos

Datos que quedan en el modelo

SQL Server, Excel, DQS

Page 28: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

2828

Proyectos de Cleansing

Limpieza de datos

Información Extra

Base de Conocimiento

en la NubePartiendo de la Base

de Conocimiento

Sobre las decisiones que toma Consumir datos

Page 29: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

DEMOReglas y proyectos de matching

Page 30: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

30

o Qué es la calidad de los datos

o Implementaciones de BI y sus requisitos de calidad de datos

o Qué es Data Quality Services

o Desarrollo de Bases de Conocmiento

o Proyectos de Data Quality Services

30

Resumen

Page 31: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

31

o Al adoptar un enfoque de calidad de datos en toda la empresa, los estrategas y arquitectos

de la solución de BI pueden diseñar e implementar estilos de BI con mucha mayor

confianza.

o Data Quality Services es una herramienta que permite velar por la integridad de los datos

basada en una base de conocimiento diseñada a partir de valores y reglas de negocio y con

el propósito de conseguir datos de mayor calidad de una manera fácil e intuitiva para el

trabajo en conjunto entre equipo de IT y usuarios de negocio.

o El despliegue exitoso de la calidad de datos ayuda a una organización a maximizar los

retornos sobre sus inversiones de BI, mediante la mejora de su capacidad para aprovechar

el BI impulsando la ventaja competitiva y el liderazgo de mercado.

31

Conclusiones

Page 32: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Preguntas?

Page 33: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Patrones de busquedas aceleradas con Lookup entre periodos con IntegrationServices

Expositor: Ricardo Estrada

A continuación …

Page 34: 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

Gracias por participar