Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de...

38
Inteligencia de Datos y Big Data Disertantes: Dra. Laura Lanzarini – Dr. Waldo Hasperué

Transcript of Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de...

Page 1: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Inteligencia de Datos y

Big Data

Disertantes: Dra. Laura Lanzarini – Dr. Waldo Hasperué

Page 2: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Agenda

1. Aspectos generales

2. Inteligencia de Datos en la industria.

3. Aplicaciones desarrolladas

4. Formación de RRHH

5. Conclusiones

Page 3: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Los avances tecnológicos hacen que las

capacidades para generar y almacenar

datos se incrementen día a día.

Inteligencia de Datos

La inteligencia de Datos engloba herramientas y

actividades analíticas capaces de mejorar la comprensión

de los datos extrayendo su valor y significado para

promover una mejor toma de decisiones.

Page 4: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Fuentes de Datos

Page 5: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Empresas que analizan imágenes

Pinterest incorporó VisualGraph

Empresa Vicarious : Inversores Mark Zuckerberg (Facebook), Elon Musk (cofundador de PayPal) buscan determinar las “relaciones de causa y efecto”.

2.300 millones de usuarios activos en Facebook generando muchos datos.

(Fuente: Data Never Sleeps 2019)

Detector de personas Detector de bolsos Detector de faldas

https://techcrunch.com

Page 6: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Seguimiento de sus redes sociales para saber

quién está consumiendo sus bebidas

dónde están sus clientes

qué situaciones los incitan a hablar sobre su marca

Identifica sus productos en fotografías y determina cuando enviar publicidad

Ahora buscan usar bots para generar anuncios

www.adweek.com

Page 7: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

El 90% de todos los datos fueron creados en los últimos dos años (Fuente: IBM 2017)

Monetización de los datos. Usando Big Data, Netflix ahorra mil millones de dólares al

año en la retención de clientes.

Desde 2012, el BD ha creado 8 millones de puestos de trabajo sólo en los EE.UU. y 6

millones más en todo el mundo.

Forbes - Shutterstock

Page 8: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Big Data – Las 5 Vs

VelocidadProcesamientoBatch / Streaming

ValorValor agregado

Información útilConocimiento

VeracidadAutenticidadOrigen, reputaciónDisponibilidad

VariedadEstructurado (BBDD relac.)No Estructurado (ej: Imágenes, logs, audios)Semi-estructurados (ej: HTML, XML)

VolumenTerabytes / PetabytesExabytes / Zettabytes

Ej: Twitter 12TB x día

(500 mil tweets x min)

Page 9: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Extracción de conocimiento

Fayyad (1996)

Page 10: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Extracción de conocimiento

Generalmente registrado en forma previa al proceso de KDD.

Almacena información histórica

No necesariamente centralizada

Fayyad (1996)

Page 11: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Extracción de conocimiento

Elegidos en base al problema

Medidas subjetivas y objetivas

Fayyad (1996)

Page 12: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Extracción de conocimiento

Uniformar la notación.

Datos faltantes

Fuera de los rangos esperados (outliers)

Fayyad (1996)

Page 13: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Extracción de conocimiento

Fayyad (1996)

Page 14: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Extracción de conocimiento

Inteligencia de negocios

Operaciones de negocios

Page 15: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Inteligencia de Datos en la industria

Page 16: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Obtención de Datos en una planta

PapelErrores de registro

Errores de procesamiento

Información descentralizada

Planillas de cálculoErrores de tipeoMenos errores de procesamientoInformación descentralizada

ERPErrores de tipeoSin errores de procesamientoInformación centralizada

IIoTSin errores en la carga de datosSin errores de procesamientoInformación centralizada

Captura en el centro de

producción.

Rápido procesamiento.

Información fiable y

objetiva para toda la

organización

Page 17: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Industrias que adoptaron IoT

Top 7 de las industrias que adoptaron IoT

Salud

Ciudades inteligentes

Transporte

FabricaciónEnergía

Cadena de

suministros

Agricultura

https://flespi.com

Page 18: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Siemens incorporó el análisis predictivo

Objetivo: optimizar el funcionamiento, comprender y

predecir los incidentes, sobre las turbinas industriales a gas.

5000 sensores por turbina

generando 1 dato/seg. (432

millones x dia)

Mantenimiento predictivo (Correlaciones entre datos recolectados,

datos operacionales y medidas manuales)

Big Data: proc.10 TB x seg (batch)

Alineación de datos temporales.

Uso de marcas temporales

www.decideo.com

Page 19: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Sector aeroespacial

Page 20: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Autos inteligentes

Sensor LIDAR con 32 o 64 pulsos de

láser para construir un modelo 3D del

entorno en un rango de 200 m.

Page 21: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Gemelos digitales

www.plm.automation.siemens.com

Tipos de gemelos

digitales

Producto

Producción

Rendimiento

Son una representación virtual de un producto o proceso físico.

Usados para simular, predecir y optimizar el producto y el sistema

de producción antes de invertir en prototipos y activos físicos.

Page 22: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

APLICACIONES DESARROLLADAS

Page 23: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Asignación de móviles en emergencias

médicas

Buscar imágenes de la tesis de Javier López

OBJETIVOS

Ubicación de la prestación

Tiempo de llegada

Categoría de la prestación

Afinidad médico y móvil/prestación

Uso uniforme de recursos

Page 24: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Extracción de reglas de clasificación

Características

Obtiene reglas de clasificación del tipo IF-THEN sencillas, de baja cardinalidad, con una tasa de acierto aceptable.

Se lo midió sobre 12 BBDD de repositorio y 3 BBDD reales del

Sistema Financiero Ecuatoriano.

Page 25: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Diagnóstico de alteraciones del equilibrio

Funcionando en consultorio.

Realiza un prediagnóstico

en forma automática.

Registro de software

Page 26: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Reconocimiento de voz

Voces de 30 locutores durante 20 seg. para entrenar.

Cada segmento de audio se representa por una secuencia de coef. ceptrales

Se usaron intervalos de 20 ms con superposición de 10 ms.

La red usa un sistema de votación para responder.

Voz MFCC SOM

Base de Datosde Voz

CoeficientesCesptrales

SOM Dinámico

Modelo

Modelo de Decisión

Page 27: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Detección temprana de demencia

Luis Guerra et al.(2018). The Electroencephalogram as a Biomarker Based on Signal

Processing Using Nonlinear Techniques to Detect Dementia. In: Developments and

Advances in Defense and Security. MICRADS 2018. Smart Innovation, Systems and

Technologies, vol 94. Springer.

https://doi.org/10.1007/978-3-319-78605-6_11

Page 28: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Reconocimiento de gestos dinámicos

Page 29: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Reconocimiento de Lengua de Señas

Page 30: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Reconocimiento de Lengua de Señas

Page 31: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Reconocimiento de Lengua de Señas

Page 32: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Redes Neuronales Convolucionales

Sana: 0.1

Rota:1.0

Page 33: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Expresiones faciales en pacientes con Alzheimer

Castillo-Salazar D. et al. (2020) Detection and Classification of Facial Features Through

the Use of Convolutional Neural Networks (CNN) in Alzheimer Patients. In: Human

Systems Engineering and Design II. IHSED 2019. Advances in Intelligent Systems and Computing, vol 1026. Springer.

https://doi.org/10.1007/978-3-030-27928-8_94

Page 34: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Formación de RRHH

Page 35: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Científico de Datos (Data Scientist)

Diagrama de Venn del “Científico de datos”

(Fuente: Drew Conway)

En 2012, el artículo de Harvard

Business Review citó al Data

Scientist como el "trabajo más

sexy del siglo XXI"

Page 36: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Formación de RRHH

POSGRADO

Maestría y Especialización en Inteligencia de Datos orientada a Big Data.

Cuerpo Académico: 13 doctores, 4 magisters y 2 especialistas.

Cursos de posgrado válidos para el Doctorado en Ciencias Informáticas.

GRADO

Cursos de grado – Optativas de las carreras Ingeniería en Computación,

Lic. en Informática y Lic. en Sistemas.

TESIS FINALIZADAS (2012-2020)

9 tesis de Doctorado

1 tesis de Magister

4 tesis de Especialista

15 tesinas de grado

BECARIOS Y TESISTAS

1 becario posdoctoral UNLP

2 becarios doctorales UNLP

1 becario EVC - CIN

1 becario - Fac.Informática

Tesistas de postgrado externos

Page 37: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Conclusiones

La Inteligencia de Datos como herramienta para

obtener conocimiento a partir de los datos se ha

consolidado.

La estadística y la matemática son factores centrales

para trabajar en estos temas.

Los datos deben ser utilizados no sólo para explicar la

realidad sino para anticipar situaciones o

comportamientos.

Page 38: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces

Contactos

Laura Lanzarini

[email protected]

Waldo Hasperué

[email protected]

¿Preguntas?