Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management...
-
Upload
moises-armijo -
Category
Documents
-
view
8 -
download
4
Transcript of Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management...
![Page 1: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/1.jpg)
![Page 2: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/2.jpg)
Minería de Datos. Algo más que el ejemplo del Tenis.
Sergio Carrillo VilaData Platform Engineer – Business IntelligenceMicrosoft Business Management Specialist
Click here to add your MVP logo or MS Cert Logo
![Page 3: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/3.jpg)
α ¿Qué es la minería de datos?β Usos de la minería de datos
α El ciclo de vida de un proyecto de Minería de Datosα Los datos para Minería de datos. Demoα Algoritmos
β Naive-Bayes. Demoβ Arboles de decisión. Demoβ Reglas de asociación. Demo
α Excel como herramienta de Minería de Datos. Demo
α Preguntas
Agenda
![Page 4: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/4.jpg)
α Proceso de analizar los datos para encontrar patrones ocultos mediante el uso de metodologías automáticas
α Análisis Predictivo
α Aumentar el valor de nuestros datos
¿Qué es la minería de datos?
![Page 5: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/5.jpg)
α Generación de Recomendacionesα Detección de Anomalíasα Administración de Riegosα Segmentación de Clientesα Previsionesα Anuncios personalizadosα …
¿Qué es la minería de datos?Usos de la minería de datos
![Page 6: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/6.jpg)
Ciclo de VidaDe un proyecto de Minería de Datos
Transformación
Actuación
Medición
Identificación
![Page 7: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/7.jpg)
α Interpretación de los datosα Vista sobre los datos
β Estadisticasβ Frecuencias
α Casosα Atributos
β Categóricos o nominalesβ Rankingsβ Intervalosβ Variables numéricas
α Estados
Los datos para la Minería
![Page 8: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/8.jpg)
DEMODatos para la minería
![Page 9: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/9.jpg)
α Es importante conocer nuestro datoβ No nos vamos a embarcar en un proyecto de mineria sin
hacerlo
α Es importante interpretar estos datosβ No juntemos peras con manzanas
α La exploración de los datos…β Puede mostrarnos anomalías en nuestro negocioβ Puede plantearnos nuevos problemas
Resumiendo
![Page 10: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/10.jpg)
α Ofrece un método sistemático para aprender basado en los datos.
α Cuenta las correlaciones que hay entre la variable que queremos predecir y el resto de variables
α Una vez que tiene calculada las correlaciones, aplica las probabilidades.
α No puede utilizar atributos continuos para predecir, en el caso de tenerlos, utilizar rangos.
α Parámetrosβ MAXIMUN_INPUT_ATTRIBUTESβ MAXIMUN_OUTPUT_ATTRIBUTESβ MAXIMUN_STATESβ MINIMUM_DEPENDENCY_PROBABILITY
AlgoritmosNaive-Bayes
![Page 11: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/11.jpg)
DEMONaive-Bayes
![Page 12: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/12.jpg)
α Naive-Bayes es un algoritmo rápidoα Solo para atributos discretosα Visualizaciones desde SSMS y BIDSα DMX como lenguaje de consulta
Resumiendo
![Page 13: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/13.jpg)
α Va dividiendo los datos recursivamente en pequeños conjuntos
α Evalúa como cada atributo va dividiendo estos conjuntos, colocando en la parte superior los mas restrictivos.
α Es un algoritmo de clasificaciónα Puede ser usado con atributos continuosα Hay que tener cuidado con el sobre entrenamientoα Algunos parámetros
β MINIMUN_SUPPORTβ SCORE_METHODβ SPLIT_METHOD
AlgoritmosArboles de decisión
![Page 14: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/14.jpg)
DEMOArboles de decisión
![Page 15: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/15.jpg)
α Es un algoritmo fácil de entenderα Riego de sobre entrenamientoα Permite el uso de atributos continuos
Resumiendo
![Page 16: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/16.jpg)
α Es un algoritmo especialmente diseñado para el analisis de asociaciones
α Detecta reglas en nuestros datosβ Si A&&B C
α Cuenta la frecuencia de combinaciones de varios estados del atributo
α No utiliza probabilidadesα Cuando una combinación es muy frecuente, pasa a
ser una reglaα Parámetros:
β (MAXIMUN | MINIMUN)_ITEMSET_SIZEβ MAXIMUN_ITEMSET_COUNT
AlgoritmosReglas de asociación
![Page 17: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/17.jpg)
DEMOReglas de Asociación
![Page 18: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/18.jpg)
α Las reglas de asociación nos permite encontrar relaciones entre los valores de los atributos
α No es necesario que tengamos los valores en una tabla, podemos utilizar más de una
Resumiendo
![Page 19: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/19.jpg)
α Add-in para Excel 2007β Da problemas para Excel 2010β Solo para versiones de 32bits
α Permite realizar modelos de forma temporalβ Crea una base de datos multidimensional en ASβ Vuelca los modelos y estructuras en esa base de datos
α Es más fácil para el usuario
Excel como herramienta MD
![Page 20: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/20.jpg)
DEMOExcel como herramienta de Minería de Datos
![Page 21: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/21.jpg)
α Desde Excel podemos crear nuestros modelos de mineria
α Tenemos accesibles casi todas la funcionalidadα Podemos explorar los datosα No necesitamos almacenes en base de datos para
nuestros datos de mineria
Resumiendo
![Page 22: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/22.jpg)
Preguntas ?
![Page 23: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/23.jpg)
No olvideis rellenar las evaluaciones!Os invitamos al Solid Quality Summit
Mas de 60 sesiones técnicas todas alrededor de SQL Server y SharePoint (Madrid 6 al 10 de Junio), mas info en mi email o
Sergio Carrillo VilaData Platform Engineer – Business Intelligence
Microsoft Business Management Specialist
Click here to add your MVP logo or MS Cert Logo
![Page 24: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/24.jpg)
Gracias!Sergio Carrillo Vila
Data Platform Engineer – Business IntelligenceMicrosoft Business Management Specialist
Click here to add your MVP logo or MS Cert Logo
![Page 25: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist.](https://reader033.fdocuments.in/reader033/viewer/2022061300/54d01c8a4979592e558b4653/html5/thumbnails/25.jpg)