#SQLSat247
Guillermo Taylor F.
MVP – SQL Server
@guillermotaylor
SQL Server Tabular Mode vs SQL Server Multidimensional Mode – Pros & Cons
Visiten mi blog en http://mastergt68.wordpress.com
Hoy vamos a hablar de…
¿BISM? Significado y contextualización. Historia y visión de BISM. Evolución. ¿Por qué es importante esto para “Self-Service BI”?
Mejor dicho, ¿para qué estamos en esta session?
Aspectos importantes del modelo tabular. Pros & Cons de los modelos (Tabular vs Multidimensional) Caminos a elegir y que considerar para ambos modelos
Analysis Services con SQL Server 2012
• Genera sobre fortalezas• Expandir alcance a una
amplia base de usuarios
Analysis Services VisionBI Semantic
Model
• Acoge el modelo de datos relacional
• Muy bien entendido por desarrolladores & IT Pros
• Unir modelos relacional y multidimensional
• Bajo una unificada plataforma BI
• Provee flexibilidad • Soporta necesidades
diversas para aplicaciones y soluciones BI
El Modelo Semántico BI
Unico modelo para: Reportes, datos analíticos, “scorecards”, “dashboards”. Para todos los usuarios – Personal, Equipo, Organizacional. Un modelo para herramientas de cliente, con dos maneras de
construirlo: Tabular y Multidimensional.
Tres áreas de inversion para AS en SQL Server 2012: Versión de Power Pivot para Excel. Conjunto de herramientas para profesionales BI. SQL Server Management Studio para profesionales TI.
Democratización de la información analítica
BI Equipo
Nuestro Contexto
Solución BI creada por el “power user”. El contexto
es para un equipo pequeño y se administra
en un servidor.
BI Personal BI Corporativo
Mi Contexto
Solución BI creada por el usuario. El contexto es
unicamente para el Usuario y existe como un
documento.
El Contexto de la Org.
Solución BI creada por IT, establece un contexto
corporativo y es reutilizable, escalable y además se le
hace respaldo.
PowerPivot para Excel PowerPivot para SharePoint Analysis Services
AlineadoHabilitado
Algo de historia…
En el principio, teníamos UDM…
Unified Dimensional Model desde SQL Server 2005. Única herramienta para modelos de datos en BI.
Ahora tenemos BISM
Business Intelligence Semantic Model. Igual, única herramienta para modelos de datos BI. Pero con dos “sabores”:
Tabular Multidimensional
Ahora contamos con dos técnicas para generar modelos de datos BI.
Bajo una única tecnología.
Actualmente…
Visión de BISM
Un Modelo para todas las experiencias de usuario
Herramientas de ClienteAnalíticas, Reportes, Scorecards,
Dashboards, Aplicaciones Personalizadas
Fuentes de DatosBases de datos, Aplicaciones LOB, Feeds de tipo OData,
Hojas de cálculo, Archivos de Texto
Modelo Semántico BI
Modelo de Datos
Lógica de negociosy consultas
Acceso a Datos
BI EquiposPowerPivot para
SharePoint
BI PersonalPowerPivot para
Excel
BI OrganizacionalAnalysis Services
Arquitectura de BISM
BI Semantic Model
Modelo de datos
Lógica de negociosy consultas
Acceso a datos ROLAP MOLAP xVelocityDirectQuery
MDX DAX
Multi-dimensional
Tabular
Aplicacionesde tercero
ReportingServices Excel PowerPivot
Bases de datos Aplicaciones LOB Archivos OData Feeds Servicios Cloud
SharePointInsights
Power View
Y, de nuevo, ¿Por qué esto es importante?
Niveles de BI dentro de una organización
Self-Service BINo Estructurado
Self-Service BIAdministrado
BIRudimentario
BICorporativo
Ambiente informal que valora más el descubrimiento ágil de la información
antes que el gobierno de ésta o la estandarización.
Ambiente que valora más el gobierno de laInformación y la estandarización de ésta,
además de la seguridad mientras se satisfacen necesidades de negocio.
Análisis de datos manual y/o repetitivo, a menudo desempeñado con extracciones
de datos o datos re-tecleados; puede generar “spreadmarts”.
Exposición y consume de reportes de manera estandarizada, la cual da servicio a varias unidades de negocio, a menudo
soportadas por TI o un centro BI.
CapacidadesAnalíticas del
Negocio
Gestión TI& Control
Beneficios claves de BI dentro de una organización
Self-Service BINo Estructurado
Self-Service BIAdministrado
BIRudimentario
BICorporativo
Agilidad en la toma de decisiones.Facilita el análisis de tipo “una vez”.
Exploración de datos y descubrimiento.Bastante flexibilidad para el Usuario.
Se comparten datos de manera segura.Uso de experiencia de negocios.
Facilita el uso de prototipos.Automatización y administración.
Ambiente familiar con Excel.Bastante flexibilidad para el usuario.
Única versión de la verdad.Fuentes de datos “limpias”.
Se comparten datos de manera segura.
CapacidadesAnalíticas del
Negocio
Gestión TI& Control
Retos importantes de BI dentro de una organización
Self-Service BINo Estructurado
Self-Service BIAdministrado
BIRudimentario
BICorporativo
Interpretación de datos.Modelos de datos & Habilidades análisis.Lograr planes acción mediante “insights”.
Compartir datos de manera segura.Duplicación de esfuerzos.
Fuentes de datos “cuestionables”.
Cooperación entre TI & Negocio.Soporte a reportes y modelos de éstos. Transferencias y retiros de empleados.
Organización de ambientes.Gestión del cambio (ITIL).
Soporte de ejecutivos e influyentes.
Usualmente, no repetible.Típicamente, poco eficiente.Interpretaciones de datos.
Ubicar las reglas de negocios.
Velocidad de entrega y de despliegue.Cambios de requerimientos, costosos.Adopción por los autores de reportes.
Habilidad para búsqueda & documentación
CapacidadesAnalíticas del
Negocio
Gestión TI& Control
Modo tabular en BISM
Tabular: El Nuevo modelo
Es parte de la visión BISM. Motor en memoria súper veloz: xVelocity. Impresionante tasa de compresión en tablas. Basado en el modelo relacional de datos. Programado con el nuevo lenguaje DAX.
DAX = Data Analysis Expressions.
Comparado contra OLAP Es más rápido; se siente la diferencia. Más fácil de usar y de aprender.
Ahora bien, ¿Tabular es adecuado para mi?
“Yo soy xVelocity, tu nuevo motor analítico” “No debes tener otros motores; solo xVelocity”
Ahora bien, ¿Tabular es adecuado para mi?
Tengo dos motores analíticos ahora…
¿Cuáles son sus fortalezas? ¿Cuáles son sus debilidades? ¿Bajo qué escenarios debo
seleccionar uno o el otro?
Consideraciones en SQL Server Analysis Services
Modo servidor de SSAS 0 – Multidimensional y Minería de Datos (por defecto) 1 – SharePoint 2 – Tabular
Iconos diferentes en el Explorador de Objetos. Mismo código, diferente comportamiento. Selección a nivel de instancia. Dos instancias SSAS para usar ambos en la misma máquina.
¿Qué es xVelocity?
Base de datos en memoria. Basado en metodología relacional. Base de datos orientada hacia columnas. Los datos se almacenan en un formato comprimido. Mayor información en http://
blogs.technet.com/b/dataplatforminsider/archive/2012/03/08/introducing-xvelocity-in-memory-technologies-in-sql-server-2012-for-10-100x-performance.aspx
Aproximación tradicional – Almacenamiento por filas
ID Name Address City State Bal Due
1 Bob … … … 3,000
2 Sue … … … 500
3 Ann … … … 1,700
4 Jim … … … 1,500
5 Liz … … … 0
6 Dave … … … 9,000
7 Sue … … … 1,010
8 Bob … … … 50
9 Jim … … … 1,300
1 Bob … … … 3,000
2 Sue … … … 500
3 Ann … … … 1,700
4 Jim … … … 1,500
5 Liz … … … 0
6 Dave … … … 9,000
7 Sue … … … 1,010
8 Bob … … … 50
9 Jim … … … 1,300
Tabla de Clientes
Nada especial aquí. Esta es la manera estándar en la cual los sistemas de BD han venido trabajando con tablas en disco desde mediados de 1970.Técnicamente, a esto se le llama un “almacen de registros”
Nueva aproximación – Almacenamiento por columnas
ID Name Address City State Bal Due
1 Bob … … … 3,000
2 Sue … … … 500
3 Ann … … … 1,700
4 Jim … … … 1,500
5 Liz … … … 0
6 Dave … … … 9,000
7 Sue … … … 1,010
8 Bob … … … 50
9 Jim … … … 1,300
Customers Table
ID
1
2
3
4
5
6
7
8
9
Name
Bob
Sue
Ann
Jim
Liz
Dave
Sue
Bob
Jim
Address
…
…
…
…
…
…
…
…
…
City
…
…
…
…
…
…
…
…
…
State
…
…
…
…
…
…
…
…
…
Bal Due
3,000
500
1,700
1,500
0
9,000
1,010
50
1,300
Las tablas se almacenan usando el modo “column-wise” con todos los valores desde una columna simple almacenada en un bloque simple
Almacenamiento – Columnas vs Registros
COLUMNAS
Rápido acceso a una única columna.
Se requiere de tiempo para materializar los registros.
Se requiere más CPU frente a I/O.
REGISTROS
Rápido acceso a un único registro.
No se requiere de tiempo para materializar los registros.
Se requiere más I/O frente a CPU.
¿Cuál servidor para SSAS?
Feature Multidimensional Tabular
RAM Some (16/32 Gb) A lot (64/128 Gb)
RAM Speed Important Crucial
Number of cores 4/8/16 4/8/16
Core speed Less Important Crucial
Disk speed Very Important Useless
SSD Disk Usage Strongly recommended Useless
Network speed Important Important
Concurrency Pretty good Not enough experience…
No usar el mismo servidor para ambos (PRODUCCIÓN)
Diferencias – Tabular vs Multidimensional
Principales limitaciones de Tabular
La base de datos debe caber en memoria. Características que faltan:
No hay soporte para traducciones. No existe el concepto de “Set”.
No hay disponible Scripts MDX. Relaciones planas 1:N, únicamente.
Pros & Cons – Tabular vs Multidimensional
TABULAR DISTINCT COUNT más simple. No hay agregaciones. Manejo de dimensiones es complejo. Solo se soportan las “naturalizadas”; es
decir las desnormalizadas. Se puede, pero con colecciones de
columnas; es difícil. Muchísimo mejor en cálculos a nivel de
hoja. DAX no es bueno para lógica de negocios.
MULTIDIMENSIONAL DISTINCT COUNT más complejo. Agregaciones: Diseño, U.B.O. Las herramientas ayudan en diseño. Jerarquías Padre/Hijo; generalmente se
“naturalizan”. Uso de jerarquías; uno de los pilares de
modelos (Ej: Segmentación) No es tan rápido en MDX; puede requerir
cambios a nivel del modelo de datos. Se puede, pero no es necesario.
Programación
Analysis Management Object (AMO) es el API para desarrollar objetos en Analysis Services.
El API fue creado antes del modelo tabular. Y aunque sirve para Tabular, solo tiene clases para cubos,
dimensiones, medidas, MDX scripts y otros.
Sin embargo, el API se puede usar para desarrollar modelos tabulares. La interfaz no es tan intuitiva…
Consideraciones para elegir uno o el otro
Multidimensional: El camino BI
ComplejidadModeloDatos
Requerimientos de Usuario
SSAS MultidimensionalVisual Studio
Tabular: El Camino BI
Complejidad ModeloDatos
Requerimientos de Usuario
PowerPivotfor Excel
PowerPivotfor SharePoint
SSAS Tabular
EXCEL
Visual Studio
Y entonces, ¿debo portar mis soluciones?
No necesariamente… Diferentes opciones para modelos
Columnas calculadas. Relaciones complejas en DAX.
Diferentes técnicas para cálculos. Contextos de evaluación.
OJO: Portar implica generar un nuevo proyecto.
Para cerrar…
En conclusión…
Tabular no es el nuevo UDM. Es uno de los “sabores” de BISM. Otro modelo “lado a lado” con Multidimensional.
DAX… Es fácil de aprender y de usar. ¿Nuevo en SSAS? Vaya con Tabular… ¿Nuevo proyecto? Considere Tabular como una opción…
Ojo con las limitaciones. Hay que saber DAX.
Diferentes técnicas para generar modelos.
Y entonces, ¿qué sigue?
Aprendan DAX No es fácil, pero es simple. Visiten QuickStart: Learn DAX Basics in 30 Minutes
http://social.technet.microsoft.com/wiki/contents/articles/7040.quickstart-learn-dax-basics-in-30-minutes.aspx
Aprendan diferentes técnicas para generar modelos. Dedíquenle tiempo; generen un prototipo…
No porten algo; generen un nuevo proyecto. Aprender a pensar en DAX Ejemplos en http://msftdbprodsamples.codeplex.com/releases/view/55330 &
http://social.technet.microsoft.com/wiki/contents/articles/3735.sql-server-samples-readme.aspx
Descarguen y lean…
http://msdn.microsoft.com/en-us/library/hh994774.aspx
Patrocinadores
9/13/2013 |
SQL Saturday #247 – Bogotá, Colombia39 |
Capítulos Organizadores
9/13/2013 |
SQL Saturday #247 – Bogotá, Colombia40 |
GRACIAS !!!!
Top Related