Microsoft Sql Server 2000 Analysis Services Ruben Alonso Cebrian ralonso@informatica64.com Código:...

Post on 03-Mar-2015

1 views 0 download

Transcript of Microsoft Sql Server 2000 Analysis Services Ruben Alonso Cebrian ralonso@informatica64.com Código:...

Microsoft Sql Server 2000 Analysis Services

Ruben Alonso Cebrianralonso@informatica64.com

Código: HOL-SQL05

Agenda– Introducción a Data Warehousing y sistemas OLAP– Características de un Data Warehouse– Componentes de un sistema de almacén de datos– Bases de datos OLAP– Diseño de un almacén de datos– Plataforma de Microsoft de BI– Instalación– Elementos de una base de datos OLAP de Microsoft SQL Server 2000– Orígenes de datos– Cubos– Gestión de Cubos en Análisis Manager– Dimensiones– Asistente para dimensiones– Modos de almacenamiento– Almacenamiento y agregado de datos– Examinar Datos– Asistentes del gestor de análisis de Sql Server 2000– Arquitectura de los servicios de análisis– Introducción a Datamining– Microsoft Excel Add-in para Sql Server Analysis Services– Microsoft Office Business Scorecards Accelerator

Introducción a Datawarehouse

Datos brutos frente a información de negocio

Captura de datos en brutoDerivando la información de negocio de los datos en brutoDevolución de datos en información valiosa

Sistema de Soporte de Decisiones

Proceso en tiempo real de transacciones del negocioContienen estructuras de datos optimizados para ediciónProvee de capacidades de soporte de decisión limitado

Sistemas de fuentes de datos OLTPSistema

transaccional de negocio

Características

• Proveen de datos para el proceso de análisis del negocio• Integran datos desde sistemas de fuentes de datos heterogéneos• Combinan datos validados frente a las reglas de negocio• Organiza información no volátil• Los datos se almacenan en estructuras que son optimizadas para extracción y consulta.

Características de un Datawarehouse

Característica de base de datos

Base de datos OLTP Base de datos OLAP

Orientación del sistema Ejecución y procesamiento de transacciones diarias Generación de información estratégica e histórica

Usuarios Oficinistas, contadores, personal informático, clientes, jefes de departamentos operativos

Gerentes, ejecutivos, juntas directivas, analistas de información.

Tipo de diseño de base de datos Modelo de datos entidad-relación y/o sistemas de base de datos orientados a aplicaciones OLTP

Base de datos multidimensionales, esquemas relacionales del tipo estrella, con objetivos estratégicos en la información

Nivel de detalle de los datos Se almacenan con el mayor detalle ya que se trata de las transacciones específicas

Datos agregados en distintos niveles, no interesa el detalle sino el resumen de los datos

Características del Hardware y configuración

Servidores de pequeños a medianos, sistemas de alta redundancia, configurados para tener recuperaciones ante fallos y optimizados para realizar transacciones puntuales en línea y con multitud de usuarios

Servidores de grandes a gigantes, optimizados para almacenar grandes volúmenes de datos y responder a consultas complejas que involucran mucha información y con pocos usuarios

Operaciones normales Mucha lectura y escritura: actualizaciones, inserciones, sistemas de seguridad con alta redundancia, consultas.

Básicamente, lectura de los datos: consultas complejas de los usuarios

Volúmenes de datos La información es siempre la actual, el volumen de datos no responde a la cantidad de transacciones que se almacenen. De 100 MB a 1 o 2 GB.

Se almacena información histórica, creciendo los Datawarehouse constantemente. Los volúmenes se miden en Gigabytes a Terabytes.

Componentes de un sistema de almacén de datos

Acceso a los datos por parte de los usuarios

Orígenes de datos (Data source)

Área de preparación de datos (Staging area)

Almacén de datos (Data Warehouse)

Componentes de un sistema de almacén de datos

Almacén de datos

Acceso a datos

Acceso a datosde usuariosOrigenes de

datos

Entrada de datos

Área depreparación

Centro departamental

Componentes de un sistema de almacén de datos

Herramientas de análisis y reporting

ERP

CRM ETL ETL

OLTP Área intermedia Área presentación Acceso a datos

Aplicación 1

Aplicación 2

Aplicación N

DataWarehouse

Cubos

Analysis Services

DTS herramienta ETL

• Conjunto de servicios para extracción, transformación y carga (herramienta ETL)• Modelo de objetos e interfaces gráficos• Pueden ser utilizados desde entornos de desarrollo que soporten COM• Incluyen asistentes que facilitan las tareas• Diseñador de paquetes• Permiten operar con los datos:

– Importación– Exportación– Transporte– Transformación

• Los datos pueden proceder de:– Cualquier fuente Ole Db– Cualquier fuente ODBC– Ficheros planos

El diseñador de paquetes

Diseñador de paquetes

• Conexiones

Proveedor OLE DB para SQL Server

Data Link

Controlador ODBC para Oracle (MS)

dBase 5

Microsoft Access

Archivo HTML (origen)

Microsoft Excel

Paradox 5.xArchivo de texto (origen)

Archivo de texto (destino)

Otras conexiones

Diseñador de paquetes

• Tareas

Transformar datos

Consulta controlada por datos

Inserción masiva

Ejecutar SQL

Copia de objetos de SQL Server

Transferencia de base de datos

Transferencia de mensajes de error

Transferencia de Inicios de sesión

Transferencia de trabajos

Transferencia de proced. almacenados

Diseñador de paquetes

• Tareas

Secuencia de comandos ActiveX

Propiedades dinámicas

Ejecutar paquete

Ejecutar proceso (.exe o .bat)

FTP

Cola de mensajes

Enviar correo

Procesar Analysis Services

Extracción de datos (consultas de predicción)

Bases de datos OLAP

Características:

1º- Tienen un esquema optimizado para la ejecución de consultas de usuario rápidas

2º- Poseen un robusto motor de cálculo para la realización de análisis numérico

3º- Es un modelo conceptual e intuitivo de datos, que no necesita de complejos desarrollos de aplicaciones de informes

4º- Proporciona una visión multidimensional de los datos, permitiendo una visión de los datos flexible, análisis y navegación

Diseño de un almacén de datos

Esquema de estrella

Componentes de la tabla de hecho

•Tabla de hecho

•Tabla de dimensiones

• Medidas

• Claves secundarias

Granularidad de tabla de hecho

• Nivel más bajo de detalle almacenado en cada una de las dimensiones asociadas con la tabla de hecho

Diseño de un almacén de datos

Tabla de hechos

Tabla de dimensiones

Employee_DimEmployee_DimEmployee_DimEmployee_Dim

EmployeeKeyEmployeeKey

EmployeeID...EmployeeID...

Time_DimTime_DimTime_DimTime_Dim

TimeKeyTimeKey

TheDate...TheDate...

Product_DimProduct_DimProduct_DimProduct_Dim

ProductKeyProductKey

ProductID...ProductID...

Customer_DimCustomer_DimCustomer_DimCustomer_Dim

CustomerKeyCustomerKey

CustomerID...CustomerID...

Shipper_DimShipper_DimShipper_DimShipper_Dim

ShipperKeyShipperKey

ShipperID...ShipperID...

Sales_FactSales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKey

TimeKeyEmployeeKeyProductKeyCustomerKeyShipperKey

Sales AmountUnit Sales ...Sales AmountUnit Sales ...

Esquema de estrella

Diseño de un almacén de datos

Esquema de estrella

Diseño de un almacén de datos

Esquema de copo de nieve

Plataforma de Microsoft de Business Intelligence

Gestión de Proyectos

Análisis de Sitios Web

Análisis de ventas al por menor y finanzas

Visualización

Colaboración Análisis de datos

Análisis Geoespacial

Instalación

Instalación

Instalación

Elementos de una base de datos OLAP Sql Server 2000

Conjunto de información almacenada. Sql Server 2000 gestiona conexiones a diversos orígenes de datos. Algunos de los proveedores disponibles son Microsoft Jet, Sql Server, Oracle, ODBC , etc.

Orígenes de datos

Atributo estructural del cubo conformada por jerarquías de categorías y niveles que describen los datos de la tabla de hechos. Los niveles están conformados por conjuntos similares de miembros.

Dimensiones

Conjunto de datos que normalmente se construye a partir de un subconjunto de un almacén de datos y se organiza y resume en una estructura multidimensional definida por un conjunto de dimensiones y medidas

Cubos

Permiten analizar los datos para encontrar patrones y realizar predicciones a partir de esos patrones

Modelos de Minería de datos

Definen a los grupos o usuarios que van a poder acceder a los datos y realizar consultas sobre los mismos

Funciones de base de datos

Orígenes de datos

Cubos

• Tabla de Hechos– Claves externas– Medidas

• Dimensiones

Producto

Id

Nombre

Tamaño

Cliente

Id

Nombre

Provincia

Tiempo

Fecha

Año

Mes

Día

Tabla deTabla de

HechosHechos

1998

2000

1999 Barcelon

a Madrid

Sevilla

Producto 1

Producto 2

Producto 3

Estructura de datos multidimensional que se define mediante un conjunto de dimensiones y medidas.

Un cubo es la unidad fundamental de almacenamiento y análisis de las bases de datos multidimensionales, y se define o compone mediante dimensiones y medidas.

Gestión de Cubos en Analysis Manager

Gestión de Cubos en Analysis Manager

Asistente

Tabla de hechos

Medidas

Dimensiones

Recuento

Fin del asistente

Editor de cubos

Dimensiones• Agregaciones

– Son sumas precalculadas de los datos para acelerar el tiempo de respuesta• Jerarquías y niveles• Miembros• Dimensiones virtuales

Dimensiones lógicas creadas a partir de las

propiedades de dimensiones físicas

Miembros y propiedades

Miembros y propiedades

Dimensión virtual

Dimensión virtual

Dimensión virtual

Medidas y Miembros calculados

• Medidas– Conjunto de valores de una columna de la tabla de hechos del cubo

• Miembros calculados– Medidas calculadas mediante una fórmula MDX

Miembros calculados

Miembros calculados

Asistente para dimensiones

Modos de almacenamientoTres modos de almacenamiento:

Multidimensional OLAP (MOLAP)

Relacional OLAP (ROLAP)

Híbrido OLAP (HOLAP)

Almacenamiento y agregado de datos

Almacenamiento y agregado de datos

Almacenamiento y agregado de datos

Almacenamiento y agregado de datos

Examinar datos

Modelos de minería de datos

• Uso de métodos automatizados para obtener tendencias y pautas a partir de los datos del DW

• Se componen de– Escenarios (entidades a analizar)

• Ej: un cliente y sus ventas– Atributos (información sobre los escenarios)

• Ej: edad, número de hijos, total ventas, …• Una vez elegidos los escenarios y atributos, procesamos el modelo

• En Analysis Services disponemos de dos proveedores, diseñados para obtener agrupaciones eficazmente

– Microsoft Decision Trees• Árbol de clasificación, con diversas

ramificaciones– Microsoft Cluster

• Agrupación de escenarios

Modelos de minería de datos

Modelos de minería de datos

Modelos de minería de datos

Modelos de minería de datos

Modelos de minería de datos

Funciones de base de datos

Funciones de base de datos

Herramientas cliente OLAP

• SQL Server 2000 Reporting Services

• Microsoft Excel

• Microsoft Data Analyzer

• Herramientas desarrolladas– AddIn para Excel– Aplicaciones asp o asp.net– Webparts para Sharepoint

• Herramientas de terceros

Microsoft Excel Add-in para SQL Server Analysis Services

Definición:Definición:

Herramienta de inteligencia empresarial que permite a los empleados usar Microsoft Office Excel para tener acceso a información relevante y crear rápidamente informes personalizados

Características:Características:

• Administrador de metadatos del cubo: Recupera y comparte la información del cubo OLAP

• Administrador de consultas: Consolida y ejecuta consultas, devuelve los resultados y realiza reescritura en los cubos

• Interfaz de usuario del generador de informes: Interfaz tipo “Panel de tareas” usada para generar informes y establecer conexiones con orígenes de datos

• Administrador de metadatos de informes: Mantiene el diseño del informe y permite interacciones con el informe, como enfocar, eliminar, ampliar o contraer, y realizar una obtención de detalles ascendente o descendente.

• Administrador de informes: Crea y administra fórmulas y presenta los resultados de las consultas en celdas de Excel

Microsoft Excel Add-in para SQL Server Analysis Services

• Permite a los usuarios tener acceso y analizar datos de varios cubos de Analysis Services.• Crear informes detallados personalizados directamente en Microsoft Office Excel 2003 o Microsoft Excel 2002• Mejorar el análisis de datos así como acortar los ciclos de informes y mejorar la capacidad de su compañía para responder a sus clientes• Visibilidad en Excel de las tendencias del negocio• Mayor velocidad y calidad en el proceso de toma de decisiones• Análisis de datos funcional que acorta los ciclos de elaboración de informes y ahorra recursos• Mayor flexibilidad con informes detallados, actualizables y muy personalizados• Acceso a información relevante de diversos orígenes de datos

Microsoft Excel Add-in para SQL Server Analysis Services

Microsoft Excel Add-in para SQL Server Analysis Services

Microsoft Excel Add-in para SQL Server Analysis Services

Microsoft Office Business Scorecards Accelerator

Definición: Sistema de inteligencia empresarial consistente en una aplicación basada en Web que permite a una compañía:

• Simplificar la medición y administración de métricas de desempeño clave.• Definir, visualizar y administrar indicadores de rendimiento y estrategias de toda la organización.• Mayor rapidez, calidad y relevancia de la toma de decisiones.• Mayor capacidad de medir, controlar y administrar el rendimiento empresarial.

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Microsoft Office Business Scorecards Accelerator

Próximas Acciones

• 17/09/2005. HOL – Windows Server 2003. IPSec• 18/09/2005. Evento – Windows Update Services• 20/10/2005. Contramedidas Hacker.• 21/10/2005: Gira Seguridad Technet.• 17/09/2005. HOL – Windows Server 2003. IPSec• 18/09/2005. Evento – Windows Update Services• 20/10/2005. Contramedidas Hacker.• 21/10/2005: Gira Seguridad Technet.• 20/10/2005. Contramedidas Hacker.• 21/10/2005: Gira Seguridad Technet.

Boletín quincenal TechNews

Contactos

• Informática 64– http://www.informatica64.com– i64@informatica64.com– +34 91 665 99 98

• Profesor– ralonso@informatica64.com