Implementando el Modelo Multidimensional

80
Business Intelligence

Transcript of Implementando el Modelo Multidimensional

Page 1: Implementando el Modelo Multidimensional

Business Intelligence

Page 2: Implementando el Modelo Multidimensional

Agenda

• Analysis Services.

• Desarrollo de un proyecto de Analysis Services con BIDS.

• Dimensiones.

• Tipos de dimensiones.

• Propiedades de dimensiones.

• Procesamiento de Dimensiones.

• Medidas y grupos de medidas.

• Funciones de agregaciones.

• Otras Propiedades.

• Seguridad OLAP.

• Modos de Almacenamiento.

• Minería de datos.

Page 3: Implementando el Modelo Multidimensional

Analysis Services

• ¿Qué es Analysis Services?

•Componentes de SQL Server Analysis Services.

•Alcance de SQL Server Analysis Services.

•Modelo lógico de una solución de BI (UDM).

•Vista de Análisis Multidimensional.

Page 4: Implementando el Modelo Multidimensional

¿Qué es Analysis Services?

Es un conjunto de componentes fáciles de

usar, integrados y escalables que le

permiten a los usuarios un mejor acceso a

los datos de su negocio y una forma mas

eficiente de realizar análisis y

proyecciones.

Page 5: Implementando el Modelo Multidimensional

¿Qué es Analysis Services?

Microsoft SQL Server Analysis Services

(SSAS) ofrece funciones de procesamiento

analítico en línea (OLAP) y minería de

datos para aplicaciones de Business

Intelligence (BI).

Page 6: Implementando el Modelo Multidimensional

Componentes de SQL Server Analysis Services

Proyecto

Data Source

Data Source View

Dimensiones

Medidas

Relaciones entre Medidas y Dimensiones

Medidas Calculadas ,Scripts,Indicadores y

Acciones

Particiones y Agregaciones

Perspectivas y Translaciones

Roles

Page 7: Implementando el Modelo Multidimensional

Alcance de SQL Server Analysis Services

Tableros de

Control

Reportes

sofisticados

Herramientas de

BI

Hojas de Cálculo

Reportes Ad-Hoc

SQL Server

Teradata

SQL Server

OracleDB2

SQL ServerLOB

DW

Data mart

Una sola versión de la verdad

Enriquecimiento de datos y análisis avanzado

Tiempo-Real y alto rendimiento

Misión crítica

Analysis Services

Excel 2007

Report

Builders

2.0

Reporting

Services

2008

+ herramientas de terceros

Page 8: Implementando el Modelo Multidimensional

Alcance de SQL Server Analysis Services

Analysis

Services

Datamart

Y

DataWarehouse

Minería

de datos

Page 9: Implementando el Modelo Multidimensional

Modelo lógico de una solución de BI (Unified Dimensional Modeling)

XM

L/A

or

OD

BO

BI Applications

Reporting

Tool (1)

OLAP

Browser (2)

OLAP

Browser (1)

Reporting

Tool (1)

HerramientasFuente de Datos

DWUDM

Analysis

Services

Cache

Page 10: Implementando el Modelo Multidimensional

Desarrollo de un proyecto de AS con BIDS

• Proyecto.

•Data source.

•Data source View.

•Named Calculated.

Page 11: Implementando el Modelo Multidimensional

ProyectoContenedor de objetos de la Solución

Se define Nombre y

Locación de la

Solución

Nos permite la creación de

la Base de Datos OLAP

Page 12: Implementando el Modelo Multidimensional

DataSourceIndica la forma de acceso a la Fuente de Datos

Se define el Nombre del

Proveedor, Servidor y forma

de acceso

El origen de datos NO es

indispensable que sea SQL

Page 13: Implementando el Modelo Multidimensional

DataSource ViewSe establece la relaciones lógicas entre objetos.

Muestra todos los objetos

que se usaran en la solución.

Se puede modificar la

relación de las tablas o

vistas

Page 14: Implementando el Modelo Multidimensional

Named Calculations.Sólo afectan al data source view.

• En ocasiones, las columnas de una tabla de dimensión no proveen la información en el formato requerido para el datamart.

• Los named calculations no afectan la estructura del origen de datos.

Page 15: Implementando el Modelo Multidimensional

Creación de:

Demo

•Data Source

•Data Source View

Page 16: Implementando el Modelo Multidimensional

Dimensiones

•Tipos de Dimensiones .

•Definición de Atributos.

•Jerarquías y niveles.

Page 17: Implementando el Modelo Multidimensional

Tipos de dimensiones

• Dimensiones standard

• Dimensiones Time

• Dimensiones Parent - Child

• Dimensiones snowflake

Page 18: Implementando el Modelo Multidimensional

Dimensión standardTipo default de dimensión.

Propiedades:

• Name: Nombre de la dimensión.

• KeyColumns: Columna(s) de clave para la

dimensión.

• NameColumn: Columna que proporciona el

valor mostrado en la dimensión al consultar

datos.

Propiedades:

• Name: Nombre de la dimensión.

Propiedades:

• Name: Nombre de la dimensión.

• KeyColumns: Columna(s) de clave para la

dimension.

Page 19: Implementando el Modelo Multidimensional

Creación de una dimensiónstandard

Demo

Page 20: Implementando el Modelo Multidimensional

Dimensiones Parent – ChildRelaciones recursivas

• Se basan en relaciones recursivas existentes en una tabla de dimensión.

• Otros ejemplos son: Jerarquías de mando, organigramas, etc.

Page 21: Implementando el Modelo Multidimensional

Creación de una dimensiónParent - child

Demo

Page 22: Implementando el Modelo Multidimensional

Dimensión Timepropiedades especiales

• La mayoría de soluciones de BI utilizan una dimensión para almacenar intervalos de tiempo.

• SSAS le otorga propiedades especiales a las dimensiones Time, para permitir el uso de funciones MDX de búsqueda avanzada.

Page 23: Implementando el Modelo Multidimensional

Creación de unadimensión Tiempo

Demo

Page 24: Implementando el Modelo Multidimensional

Dimensión Snowflakepropiedades especiales

• Relación entre 2 tablas para formar una dimensión

Page 25: Implementando el Modelo Multidimensional

Creación de unadimensión Snowflake

Demo

Page 26: Implementando el Modelo Multidimensional

Atributos y DimensionesCada atributo proviene de una columna de la tabla de dimensión.

• La dimensión captura todo lo quepodamos conocer acerca de una entidada través de los atributos.

• Cada atributo proviene de una columna de la tabla de dimensión.

Creamos una dimensión en

base a una tabla ,vista

Page 27: Implementando el Modelo Multidimensional

Jerarquías y nivelesCada jerarquía estas formada por niveles

• Las jerarquías son una sencilla vía para navegar a través de los atributos

• Una jerarquía puede encadenar múltiples atributos para describir drill-down

Page 28: Implementando el Modelo Multidimensional

•Miembro All

•Default member

•Attribute relationship

Propiedades de Dimensiones

Page 29: Implementando el Modelo Multidimensional

El miembro “All” y el default member.Propiedades de los atributos

El miembro ALL se agrega por defecto a los miembros de todo atributo.

• La propiedad AttributeAllMemberName de la dimensión permite personalizar el nombre del miembro All.

• La propiedad DefaultMember indica qué miembro se utiliza en un atributo, cuando las consultas no lo especifican de forma explícita

Page 30: Implementando el Modelo Multidimensional

Atributte RelationshipLas relaciones entre atributos se establecen de acuerdo a la granularidad y de uno a muchos

El sentido de la flecha indica el nivel de granularidad

Page 31: Implementando el Modelo Multidimensional

Miembro “all”, defaultmember y attributerelationship

Demo

Page 32: Implementando el Modelo Multidimensional

Procesamiento de dimensiones

•Tipos de Procesamientos.

Page 33: Implementando el Modelo Multidimensional

Procesamiento de DimensionesProcesar las dimensiones nos permite ver la información

Siempre que se modifique

atributo o jerarquía de la

dimensión se debe usar FULL

PROCESS

PROCESS UPDATE en caso se

haya modificado la información

Permite cargar la información de

las dimensiones.

Page 34: Implementando el Modelo Multidimensional

Procesamiento de dimensiones

Demo

Page 35: Implementando el Modelo Multidimensional

Medidas y grupos de medidas

•Medidas.

•Funciones de agregación.

•Grupos de medidas.

•Role playing

•Relaciones entre medidas.

Page 36: Implementando el Modelo Multidimensional

MedidasRepresenta todo lo que el usuario desea medir (cantidades, montos)

Generalmente es una

tabla con valores

numéricos

Page 37: Implementando el Modelo Multidimensional

Funciones de AgregaciónSe debe de establecer el nivel de agregación de cada medida

Por defecto siempre es SUM

Los nombres de las medidas

deben ser significativos al usuario

Page 38: Implementando el Modelo Multidimensional

Grupos de MedidasPermiten alojar medidas desde múltiples tabla de hechos en un mismo cubo

• Permiten alojar medidas desde múltiples tabla de hechos en un mismo cubo

• Pueden ser agrupadas en Perspectivas, orientadas a las necesidades del negocio

Page 39: Implementando el Modelo Multidimensional

Demo

•Medidas.•Grupos de medidas.•Funciones de Agregación.

Page 40: Implementando el Modelo Multidimensional

Relaciones entre medidas y dimensionesPueden ser Regular, Fact, Referenced, Many to Many

•Todo Grupo de Medidas por lo menos debe estar relacionado a una dimensión

•Nos indica el nivel de granularidad entre la dimensión y la medida.

Page 41: Implementando el Modelo Multidimensional

Relaciones entre medidas y dimensionesREGULAR

•Los campos a relacionarse

deben estar contenidos en la

FACT

• Se relaciona directamente

entre la FACT y la Dimensión

Page 42: Implementando el Modelo Multidimensional

Role Playing DimensionCaso especial

• En ocasiones, una dimensiónparticipa múltiples veces en el mismocubo, desempeñando distintos roles.

Page 43: Implementando el Modelo Multidimensional

Role Playingejemplo

Page 44: Implementando el Modelo Multidimensional

1era OpciónRole playing

Page 45: Implementando el Modelo Multidimensional

1era OpciónRole playing

Page 46: Implementando el Modelo Multidimensional

2da OpciónRole playing

Page 47: Implementando el Modelo Multidimensional

2da OpciónRole playing

Page 48: Implementando el Modelo Multidimensional

3era OpciónRole playing

Page 49: Implementando el Modelo Multidimensional

3era OpciónRole playing

Page 50: Implementando el Modelo Multidimensional

Relaciones entre medidas y dimensionesREFERENCE

La granularidad de la

dimensión intermedia es

mayor a la dimensión

que se referencia

Representa a una

dimensión de tipo

SNOWFLAKE

Se relaciona

utilizando una

dimensión intermedia.

Page 51: Implementando el Modelo Multidimensional

Relaciones entre medidas y dimensionesFACT

Se usa cuando se

necesita ver el detalle

de cada registro

Dimensiones

degeneradas

Page 52: Implementando el Modelo Multidimensional

Relaciones entre medidas y dimensionesMANY TO MANY

Estas relaciones se

implementan a través

de una tabla de

hechos intermedia.

Page 53: Implementando el Modelo Multidimensional

Demo

•Tipos de relaciones

Page 54: Implementando el Modelo Multidimensional

•Calculations.

•Scripts.

•KPI.

•Actions.

•Particiones y agregaciones.

•Perspectivas.

•Translations.

Otras Propiedades

Page 55: Implementando el Modelo Multidimensional

CalculationsRepresentan cálculos adicionales a las medidas existentes (Expresiones MDX)

KPI FrameworkManejo de indicadores claves del negocioActionsPermite visualizar los detalles de la información analizada por EXCEL, Reporting, etc.ParticionesNos permite mejorar el tiempo de proceso del cuboAgregacionesNos permite mejorar el tiempo de respuesta del cubo

PerspectivasNos permite focalizar las necesidades del consumidor de la solución

TraduccionesNos permite modificar el idioma de la solución

Page 56: Implementando el Modelo Multidimensional

Demo

•Calculations.

•KPI’s.

•Actions.

•Particiones.

•Agregaciones.

•Perspectivas.

•Traducciones.

Page 57: Implementando el Modelo Multidimensional

•Roles y funciones.

Roles de Seguridad

Page 58: Implementando el Modelo Multidimensional

Roles o FuncionesNos permite establecer el acceso a la base de datos y a la seguridad del cubo

Nos permite

establecer el acceso

a la base de datos y a

la seguridad del cubo

Page 59: Implementando el Modelo Multidimensional

Roles o FuncionesSeguridad a la Base de Datos

Solo el administrador debe

de tener acceso a la Base

de Datos

A los consumidores de la

solución se les da acceso

de READ

Page 60: Implementando el Modelo Multidimensional

Funciones y roles

Demo

Page 61: Implementando el Modelo Multidimensional

Modos de Almacenamiento

•MOLAP

•ROLAP

•HOLAP

Page 62: Implementando el Modelo Multidimensional

Modo de almacenamiento

El modo de almacenamiento (MOLAP, ROLAP y HOLAP) define la manera en que se almacenan en disco las particiones de un cubo.

Es completamente transparente a los clientes.

Page 63: Implementando el Modelo Multidimensional

modos de almacenamiento

Demo

Page 64: Implementando el Modelo Multidimensional

Mineria de Datos

Conceptos Generales.

Page 65: Implementando el Modelo Multidimensional

¿Qué es minería de Datos?

• La minería de Datos nos da el acceso a la información que necesitamospara tomar decisiones inteligentes acerca de problemas difíciles del negocio.

Page 66: Implementando el Modelo Multidimensional

¿Qué hace la Minería de Datos?

Explora

Nuestra DataEncuentra

Patrones

Realiza

Predicciones

Page 67: Implementando el Modelo Multidimensional

70

Visión DM SQL Server 2008

SQL 2008

OLAP

Reports (Adhoc)

Reports (Static)

Data Mining

Conocimiento del Negocio

Easy Difficult

Usabilidad

Va

lor

Re

lati

vo

de

l N

eg

oc

io

Page 68: Implementando el Modelo Multidimensional

Posibles Problemas a Resolver

1. Análisis de CHURN._ ¿Qué clientes se pueden ir con la competencia?

2. Ventas Cruzadas._ ¿Qué productos le gusta comprar a los clientes?

3. Detección de Fraude._ ¿Este patrón de comportamiento se sale de los límites normales?

4. Administración de Riesgo._ ¿El préstamo debería ser aprobado para este cliente?

5. Segmentación de Clientes._ ¿Quiénes son mis clientes?

6. Anuncios Dirigidos._ ¿Qué anuncios deberían ser mostrados para un cliente específico?

7. Pronosticar Ventas._ ¿Cuántos vinos venderemos la próxima semana en esta tienda? ¿Cuál será el inventario del próximo mes?

Page 69: Implementando el Modelo Multidimensional

72

Algoritmos de Mineria de Datos

Decision Trees Clustering Time Series

Sequence

ClusteringAssociation

Naïve Bayes

Neural Net

Detección de patrones de

comportamiento dentro de

documentos para

detección de fraudes

Text Mining

Page 70: Implementando el Modelo Multidimensional

Tareas en Data Mining

• Clasificación

• Regresión

• Segmentación

• Asociación

• Pronósticos

• Análisis de Texto

Page 71: Implementando el Modelo Multidimensional

• Clasificación

• Regresión

• Segmentación

• Asociación

• Pronósticos

• Análisis de Texto

Tareas en Data Mining

• Preguntas típicas de Negocio– ¿Qué tipo de tarjeta de membresía

debería ofrecer?

– ¿Qué clientes responderán a mi correo directo?

– ¿Es esta transacción fraudulenta?

– ¿Perderé a este cliente?

– ¿Será este producto defectuoso?

• Algoritmos– Preferidos

• Árboles de decisión

• Naïve Bayes

• Redes Neuronales

– Además• Clustering

• Sequence Clustering

• Reglas de Asociación

Page 72: Implementando el Modelo Multidimensional

• Preguntas Típicas de Negocio– ¿Cuántos Ingresos obtendré de

este cliente?

– Cuanto tiempo estará este activo en servicio?

• Algoritmos– Preferidos

• Árboles de decisión

• Redes Neuronales

– Además• Clustering

• Sequence Clustering

• Clasificación

• Regresión

• Segmentación

• Asociación

• Pronósticos

• Análisis de Texto

Tareas en Data Mining

Page 73: Implementando el Modelo Multidimensional

• Preguntas Típicas de Negocio

– Describe mi Cliente

– ¿Cómo puedo diferenciar mis clientes?

– ¿Cómo puedo organizar mis datos de tal forma que tenga sentido?

• Algoritmos

– Preferidos• Clustering

• Sequence Clustering

– Además• Redes Neuronales

• Clasificación

• Regresión

• Segmentación

• Asociación

• Pronósticos

• Análisis de Texto

Tareas en Data Mining

Page 74: Implementando el Modelo Multidimensional

• Preguntas Típicas de Negocio

– Análisis de Canasta de

mercado/Venta Cruzada

– ¿Qué Ítems se compran juntos?

– ¿Qué productos debería

recomendar a mi cliente?

• Algoritmos

– Preferidos

• Reglas de Asociación

• Árboles de Decisión (Catálogos

pequeños)

– Además

• Clustering, Sequence Clustering,

Naïve Bayes, Redes Neuronales

• Clasificación

• Regresión

• Segmentación

• Asociación

• Pronósticos

• Análisis de Texto

Tareas en Data Mining

Page 75: Implementando el Modelo Multidimensional

• Preguntas Típicas de Negocio

– Cual es el ingreso proyectado

para todos los productos?

– ¿Cuáles serán los niveles de

inventario para el próximo

mes?

• Algoritmos

– Series de Tiempo

• Clasificación

• Regresión

• Segmentación

• Asociación

• Pronósticos

• Análisis de Texto

Tareas en Data Mining

Page 76: Implementando el Modelo Multidimensional

• Análisis de Datos no-estructurados

– Extracción de términos y/o frases

claves

– Conversión a datos estructurados

– Alimentar otros algoritmos

• Classification

• Segmentation

• Association

• Preguntas Típicas de Negocio

– ¿Cómo manejar los datos del call

center?

– ¿Cómo clasificar el correo?

– Qué puedo hacer con la

retroalimentación del Web?

• Clasificación

• Regresión

• Segmentación

• Asociación

• Pronósticos

• Análisis de Texto

Tareas en Data Mining

Page 77: Implementando el Modelo Multidimensional

Algorithm Matrix

Time Series

Sequence

Clustering

Neural Nets

Naïve Bayes

Logistic

Regression

Linear

Regression

Decision

Trees

Clustering

Association

Rules

Page 78: Implementando el Modelo Multidimensional

¿Qué determina a futuro que los graduados vayan a ingresar a la universidad?

Page 79: Implementando el Modelo Multidimensional

¿Qué determina a futuro que los graduados vayan a ingresar a la universidad?

Asistir Universidad

55% Si

45% No

Asistir Universidad

79% Si

21% No

Asistir Universidad

94% Si

6% No

Asistir Universidad

69% Si

31% NoAsistir Universidad

35% Si

65% No

Observando el árbol nosotros podremos decir que los estudiantes con un

IQ mayor a 100 y con estimulo familiar tienen un 94% de probabilidad de

continuar sus estudios en la universidad.

Gonzalo apaza

Alain rojas

Luis Cabrel

Carlos Anchante

Carlos valderrama

Page 80: Implementando el Modelo Multidimensional

Minería de Datos

Demo