Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ......

96
Big Data IoT Os novos retos da era dixital

Transcript of Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ......

Page 1: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Big Data

IoT

Os novos retos da era dixital

Page 2: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Presentación

Imatia Innovations 2

Page 3: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Carlos Fernández Villar

Director de Proxectos

Imatia Innovations S.L.

[email protected]

Imatia Innovations 3

Page 4: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Introducción

¿Que é Big Data? ¿Que é IoT?

Imatia Innovations 4

Page 5: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

¿Que é IoT?

¿Que é Big Data?

Imatia Innovations 5

Page 6: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• Un pouco de historia: As tres plataformas

• A Transformación da Era Dixital

• Big Data

• Exemplos

• IoT

• Os retos do novo escenario

Imatia Innovations 6

Introducción

Page 7: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Un pouco de historia

¿Como chegamos aquí?

Imatia Innovations 7

Page 8: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

A Primeira Plataforma

Imatia Innovations 8

Page 9: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 9

A Primeira Plataforma

Page 10: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

A Segunda Plataforma

Imatia Innovations 10

Page 11: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 11

A Segunda Plataforma

Page 12: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

A Terceira Plataforma

Imatia Innovations 12

Page 13: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 13

A Terceira Plataforma

Page 14: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

A Transformación da Era Dixital

¿Que nos agarda?

Imatia Innovations 14

Page 15: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 15

Volume de datos

Producto Datos asociados ó producto

Page 16: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 16

Volume de datos

Page 17: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 17

Volume de datos

Cada minuto xenérase no mundo

Page 18: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 18

Volume de datos

Page 19: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 19

Volume de datos

Page 20: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 20

O problema dos océanos e as illas

O “Data Lake”

¿Cómo atopo a isla Xno océano de datos?

https://blogs.ca.com/2015/01/21/finding-islands-of-value-in-the-vast-ocean-of-data/

Page 21: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 21

Arquitecturas escalables

Page 22: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 22

Arquitecturas escalables

EscaladoVertical

Page 23: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 23

Arquitecturas escalables

EscaladoHorizontal

Page 24: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 24

Arquitecturas escalables Dockers

Máquinas Virtuales[Plataforma 2]

Contenedores[Plataforma 3]

Page 25: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 25

Arquitecturas escalables Microservicios

Page 26: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 26

Arquitecturas escalables Dockers vs Microservicios

Page 27: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 27

Arquitecturas escalables Hardware

Page 28: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 28

Arquitecturas escalables

Fontes: IDC, Gartner, AWS Workload Estimates

Page 29: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 29

Cloud

Page 30: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 30

CloudNube privada

Construída dentro do data center da corporación

Nube públicaProporcionada por proveedores de

servicio a coste menor que as tradicionais dos departamentos TI

Nube híbridaPrivada + Pública

Page 31: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 31

Desenrolo Open Source

Propietario[Plataforma 2]

Open Source[Plataforma 3]

Page 32: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• Empresa xeolocalización e enrutamento: • Actualmente: Calculo de rutas actuáis baseado en datos sobre estado de

tráfico• Seguinte paso: Coñecer se, por exemplo, se está programando unha

manifestación a través das redes sociais

• Empresa de venta ó consumidor: • Actualmente: Recomendacións en función do perfil do consumidor• Seguinte paso: Análise do estado de ánimo, coñecer se o consumidor acaba

de iniciar unha relación para recomendar un regalo.

• Empresa financieira:• Estudio de prediccións efectivas sobre datos directos e indirectos en tempo

real.

Imatia Innovations 32

Utilidade

Page 33: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• Empresa do sector do entretenemento:• Análise na evolución dos gustos dos consumidores

• Empresa do sector da saúde:• O análise das búsquedas realizadas por usuarios en Internet pode

proporcionar datos cruciales de cara a avisos e evolución de pandemias. Por exemplo, a pandemia de Gripe A, no 2008, predecida por Google Flue Trends.

• Mundo online:• Os sitios web terán no futuro un aspecto totalmente distinto dependendo da

persoa que o esté mirando.

Imatia Innovations 33

Utilidade

Page 34: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• Empresa aeronáutica:• Un avión despega 4 veces ó día e voa una media de 10 horas.

• Para unha flota de 120 avións, aforrar un minuto de tempo de espera equivale a un beneficio de máis de $8M en fuel e máis de $2M en persoal ó ano.

• ¿Que se necesita para obter isto?• Preve-los incidentes

• Axusta-la loxística

• Axusta-lo voo

• Ademáis do beneficio económico Mellora na experiencia do cliente

Imatia Innovations 34

Utilidade

Page 35: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Big Data

Información vs Dato

Imatia Innovations 35

Page 36: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• Volume

Imatia Innovations 36

Definición

As 3 V’s:

A 4ª V:

• Veracidade

Valor• Variedade

• Velocidade

Page 37: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 37

Definición

Page 38: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 38

Ferramentas

http://hadoop.apache.org

Page 39: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 39

Ferramentas

Page 40: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• HDFS: Hadoop Distributed File System• Almacén para calquera tipo de ficheiro

• Os datos pártensen en fragmentos e replícanse tan pronto son escritos• Estabilidade e alta disponibilidade

• Xestión automática por parte de Hadoop

• YARN: Yet Another Resource Negotiator• Xestiona os recursos asociados ós procesos do cluster Hadoop

• Executa os frameworks de procesamento

• Map/Reduce• Framework de procesamento distribuído

Imatia Innovations 40

Compoñentes principales

Page 41: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• Escalable• Engadir máis nodos ó cluster engade capacidade de procesamento

• O incremento de carga penaliza rendemento pero non xenera erro de sistema.

• Tolerante a erros:• Cando un nodo do cluster falla:

• O sistema segue funcionando

• O Master reasigna o traballo a outros

• Ó esta-los datos replicados non hai perda de datos

• Ó recupera-lo nodo, este volverá ó clúster automáticamente.

Imatia Innovations 41

Características

Page 42: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 42

Ecosistema Hadoop

Proxecto Descrición

Spark Framework de procesamento en memoria e streaming

Hbase Base de datos NoSQL construída sobre HDFS

Hive Motor de procesamento SQL deseñado para cargas de traballo batch

Sqoop Framework para movemento de datos entre HDFS e RBDMSs

Flume / Kafka Proxectos para inxesta de datos en streaming

Solr Funcionalidade para búsqueda de texto

Hue Interfaz de usuario web para Hadoop

Sentry Ferramenta de autorización para securizar Hadoop

Page 43: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 43

Ecosistema HadoopOs datos distribúense no cluster cando son cargados

O procesamento lévase a onde están os datos almacenados

Os nodos son pezas hardware estándar (“commodityhardware”)

A capacidade ampliase mediante escalado horizontal (máisservidores) en lugar de vertical (máis potencia no servidor)

Simplifica a programación distribuída de forma que o programador se centre nos requerimentos funcionais

Page 44: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 44

Ecosistema Hadoop

Page 45: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 45

Ecosistema Hadoop

Page 46: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 46

Ecosistema Hadoop

ArquitecturaTípica

Business Intelligence

Page 47: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 47

Ecosistema Hadoop

ArquitecturaHadoop

Business Intelligence

Page 48: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 48

Ecosistema Hadoop

Trabajo colaborativoArquitectura

tradicional

Page 49: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 49

Ecosistema Hadoop

Trabajo colaborativoHadoop como EDH

Enterprise Data Hub

Page 50: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

A resposta é…

Imatia Innovations 50

A resposta definitiva

42

Page 51: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Para poder ter una resposta satisfactoria é imprescincible pregunta-la cuestión adecuada

Imatia Innovations 51

A importancia da pregunta

Page 52: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• “Necesitamos bos desarrolladores” Non, necesitamos expertos en Hadoop.

• Infraestímase a complexidade de Hadoop. Hadoop é un sistema complexo que require “amor e afecto”.

• “Commodity hardware” non significa hardware barato.

• Hadoop non é “remedio de santo”.

• Por regla xeral, será necesario extende-las utilidades de Hadoop e os componentes do seu ecosistema para adaptalo ás necesidades concretas.

Imatia Innovations 52

Axiomas sobre Hadoop

Page 53: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Hortonworks: http://es.hortonworks.com/

Cloudera: http://es.cloudera.com/

MapR: https://www.mapr.com/

Imatia Innovations 53

Para cacharrear

Page 54: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Exemplos

Big Data aplicado

Imatia Innovations 54

Page 55: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 55

A nova empresa:Google como modelo de paralelización

1.000.000.000 consultas diarias

900 ms de tempo de resposta medio

Page 56: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 56

A nova empresa: Facebook como exemplo colaborativo

1.200.000.000 usuarios activos

900.000.000 obxectos interactivos

250.000.000 fotos novas ó día

Page 57: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 57

A nova empresa: Amazon como exemplo predictivo

137.000.000 clientes

895.000.000 productos

Recomendacións en tempo real

Page 58: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 58

A nova empresa: Spotify - Números

600 GB de datos comprimidos de usuarios por día

150 GB de datos de servicios por día

4 TB de datos xenerados en Hadoop cada día

190 nodos no cluster Hadoop(en breve 690)

4 PB de capacidade de almacenamento(28 PB en breve)

Page 59: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 59

A nova empresa: Spotify – Arquitectura Big Data

Hadoop: Ecosistema Big Data

http://hadoop.apache.org

Kafka: Data collection

https://kafka.apache.org

Sqoop: Data dumping

https://sqoop.apache.org

Hive: Data management

https://hive.apache.org

Pig: Task scheduler

Luigi scheduler: Task scheduler

http://luigi.readthedocs.io/en/stable/index.html

Kafka

Sqoop

Page 60: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 60

A nova empresa: Spotify – Enfoque Open Source

https://github.com/Spotify/

https://labs.spotify.com/

Page 61: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 61

A nova empresa: Netflix – Enfoque Open Source

https://github.com/Netflix/

Page 62: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 62

Smart Government• Obxectivos:

• Visión holística da cidade• Coñecemento global dos activos administrados.• Tomas de decisión basada en información obxectiva.

• Solución:• Converxencia entre:

• Administración Electrónica• Smart City• Terceira plataforma

• Centralización da información• Fomento da colaboración interdepartamental• Garante da integridade entre os datos procedentes de distintas fontes. • Coherencia e calidade.• Establecemento do territorio e o cidadán como centro neurálxico da

información.

Page 63: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 63

Smart Government

Page 64: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 64

Smart Government

ArquitecturaOrientada

aMicroservicios

Page 65: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 65

Smart Government

InfraestructuraBasada

enDocker

Page 66: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 66

Smart Government

Page 67: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 67

Smart GovernmentHadoop: Ecosistema Big Data

http://hadoop.apache.org

Sqoop: Captura datos BBDD externas

https://sqoop.apache.org

Flume: Captura streams externos

https://flume.apache.org

Kafka: Captura de eventos

https://kafka.apache.org

Spark: Análise datos

https://spark.apache.org

Hive: Consulta contra HDFS

https://hive.apache.org

Pig: Organizador de tareas

https://pig.apache.org

Page 68: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 68

Smart Government

Sqoop:

Captura datos BBDD externashttps://sqoop.apache.org

Page 69: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 69

Smart Government

http://193.144.33.111:8087/cycloanalytics

Spark:

Análise datoshttps://spark.apache.org

Page 70: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 70

Smart Government¿Que resultado queremos obter?

¿Que datos de partida necesitamos? ¿Témolos todos?

¿Cómo os conseguimos?

¿Como relacionamos os datos de partida?

¿Que ferramentas utilizamos?

¿Como imos presenta-lo resultado?

Detección de picos de consumo eléctrico

Se existen e en que momentos existen picos de consumoque se saen da media

1) Datos de consumo eléctrico2) Mapa de poboación

1) Relación entre a densidade de poboación e o consumo

Flume > CapturaSpark / Hive > Cruces + Detección de anomalíashttp://techblog.netflix.com/2015/02/rad-outlier-detection-on-big-data.html

Mapa de calorGráfica

Page 71: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 71

Smart Government Detección de picos de consumo eléctrico

Page 72: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 72

Smart Government¿Que resultado queremos obter?

¿Que datos de partida necesitamos? ¿Témolos todos?

¿Cómo os conseguimos?

¿Como relacionamos os datos de partida?

¿Que ferramentas utilizamos?

¿Como imos presenta-lo resultado?

Ubicación óptima dun novo colexio

A necesidade ou non dun novo colexioe a súa ubicación.

1) Ubicación dos colexios actuais2) Mapa de poboación por idades3) Ubicación de lugares de interés cercanos:

colexios, pabellóns deportivos, lugares de recreo, etc4) Mapa de densidade de tráfico5) …

1) Proximidade na ubicación2) Homoxeneidade na cobertura3) Ponderación por cercanía4) Ponderación por densidade

Sqoop > CapturaSpark > CrucesVoronoi > Áreas de influencia

Simulación de posibles ubicacións sobre mapa

Page 73: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 73

Smart Government Ubicación óptima dun novo colexio

Page 74: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 74

Smart Government

https://developers.google.com/analytics/

Relación electrónica co cidadán

¿Que resultado queremos obter?

¿Que datos de partida necesitamos? ¿Témolos todos?

¿Cómo os conseguimos?

¿Como relacionamos os datos de partida?

¿Que ferramentas utilizamos?

¿Como imos presenta-lo resultado?

Personalización da páxina de acceso ó Concello

Page 75: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 75

Smart Government Outros casos de uso

• Prediccións de tráfico• Prediccións de accidentes de tráfico / intervencións de bombeiros• Predicción actividade comercial• Predicción intervencións policiais• Detección do “estado de ánimo da cidadanía” en función do perfil social• Rutas óptimas para servicios sociais a domicilio• Rutas óptimas para inspeccións técnicas• Detección de zonas conflictivas• Cálculo do momento óptimo para a realización de obras de mantenemento• Optimización de procesos administrativos• Xestión e reserva de recursos públicos: Piscinas, Pabellóns deportivos• Recomendacións de eventos personalizadas• Cálculo máis obxectivo sobre o valor dos inmuebles• Detección de activos susceptibles de cobro de taxas

Page 76: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 76

Smart Government

É máis importante a pregunta que a ferramenta

Page 77: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Creación dun equipo experto baixo a coordinación dun

“científico do dato”:

Imatia Innovations 77

Thinking outside the box: O uso de Big Data na campaña de Obama 2012

https://enga.ge/dl/Inside_the_Cave.pdf

The “Cave”

Page 78: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

O Data Lake:1. Rexistro de votantes:

• Datos non normalizados• Diferentes estructuras e requerimentos en cada estado• Algúns con información de afiliación política e outros non• Non centralizada

2. Rexistro de voluntarios3. Lista de contactos dos votantes

• Quen foi visitado• Quen respondeu ás enquisas e como

Imatia Innovations 78

Thinking outside the box: O uso de Big Data na campaña de Obama 2012

Page 79: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

“The Life of Julia”

• Video que se envía ás contas de Facebook de potenciales votantes

• Mentras se ve o video, recopílase información dos contactos, asociando os seus nomes con rexistros de votantes, xénero e estado de residencia.

• Ó finaliza-lo video propónse compartilo con 4 persoas…

¿Que información nos da isto?

Imatia Innovations 79

Thinking outside the box: O uso de Big Data na campaña de Obama 2012

Page 80: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Coñecemento personalizado dos targets

• O target neste caso é o votante

• Búscase sobre todo o votante indeciso

• Convencelo nos medios nos que habitualmente se moven• Anuncios nas pausas publicitarias de The Walking Dead

• Encontros online con lectores da revista Reddit

Imatia Innovations 80

Thinking outside the box: O uso de Big Data na campaña de Obama 2012

Page 81: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

E ata George Clooney entra en xogo…

• Información detectada: • George Clooney desperta un alto interés na poboación femenina entre 40 e 49

anos dos estados da Costa Oeste. • ¿Qué ten de especial ese grupo? • Que é o máis probable para entregar diñeiro en efectivo.

• Acción: • Organizar un concurso entre os donantes no que o premió é unha cea con

Obama e… George Clooney

• Resultado: • Importante incremento nas donacións da Costa Oeste

• Seguinte acción: • Repeti-lo proceso na Costa Leste. • ¿Con quen? Análise Big Data Sarah Jessica Parker

Imatia Innovations 81

Thinking outside the box: O uso de Big Data na campaña de Obama 2012

Page 82: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

• Premisa: • É moi difícil atopar taxi en Singapur cando chove• ¿Por que? Resposta obvia: Porque hai máis demanda

• Caso de estudio Singapore-MIT Alliance for Research and Technology:

• Comparación / Análise: • 2 meses de tempo atmosférico • 830 millóns de rexistros GPS • 80 millóns de viaxes en taxi • Flota de 16.000 taxis

• Resultado: • Cando chove a maior parte dos conductores non collen a ningún pasaxeiro

• Conclusión: • A compañía propietaria quita $800 do salario do conductor despois dun accidente ata

que se determine o causante (o que pode levar meses)• A probabilidade de accidente medra nos días de choiva• O conductor entón decide que non vale a pena saca-lo taxi á rúa.

Imatia Innovations 82

Thinking outside the box: ¿Por que é tan difícil atopar taxi en Singapur cando chove?

Page 83: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

O Internet das Cousas

O todo conectado

Imatia Innovations 83

Page 84: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 84

IoT: Definición

Interconexión de calquera producto con calquera outro do seu

redor

Protocolo HTTP

Page 85: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 85

IoT: Aplicación• Na vida cotidiana:

• Domótica: O electrodoméstico conectado

• Automoción: O coche intelixente

• Wearables

• A Smart City:• Cidades máis eficiente

• O mundo empresarial

• Saúde:• O ser humano como “thing”

Page 86: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 86

IoT: Consideracións• Volume:

• Poderíanse chegar a trazar de 50 a 100 trillóns de obxectos.

• Un ser humano pode estar rodeado de 1000 a 5000 obxectos trazables.

• Arquitectura escalable

• Variabilidade:• Complexidade de datos• Fontes diversas

• Velocidade:• A información do obxecto debe ser

transmitida e procesada en tempo real

• Xeoposicionamento:• A información de “onde” é crucial

¿Big Data?

Page 87: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 87

IoT: PlataformasPlataforma Enlace

Kaa https://www.kaaproject.org/

Predix https://www.ge.com/digital/predix

Oracle Integrated Cloud https://cloud.oracle.com/integration

Carriots https://www.carriots.com/

Salesforce https://www.salesforce.com

Cisco IoT Cloud http://www.cisco.com/c/en/us/solutions/service-provider/iot-cloud-connect/index.html

Watson IoT http://www.ibm.com/internet-of-things/

Thingworx https://www.thingworx.com/

Microsoft Azure IoT Services https://azure.microsoft.com/en-us/suites/iot-suite/

AWS IoT https://aws.amazon.com/es/iot/

Page 88: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 88

IoT: DispositivosDispositivo Enlace

Arduino https://create.arduino.cc/iot/

http://www.survivingwithandroid.com/2015/06/internet-of-things-with-android-and-arduino.html

https://www.youtube.com/watch?v=9znRbMTimvc

Raspberry Pi https://diyhacking.com/best-raspberry-pi-iot-project

https://www.youtube.com/watch?v=wkABFP3I96c

Page 89: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 89

IoT Open Sourcehttp://www.postscapes.com/internet-of-things-award/open-source/

Learning Internet of Things:http://it-ebooks.info/book/4918/

Documentación

Page 90: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 90

Libelium:• Empresa que fabrica sensores:

• Calidade da auga na que se crían as lubinasnunha piscifactoría

• Actividade dos volcáns• Nivel de osíxeno en sangue nun humano• Plazas de parking libres en Dubai ou

Santander• MySignals

• “Maletín” de medición de constantes vitales• Ecosistema eHealth

Exemplo

http://www.libelium.com/http://www.my-signals.com/

Page 91: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Os retos do novo escenario

…E daquí en diante, ¿que?

Imatia Innovations 91

Page 92: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 92

Transformación de roles e perfiles

Autosuficiente

Móvil

Esixente

Non espera polo departamento TI

Compite con outros proveedores de servicios externos

Conversión a Service Provider

Intermediario de Servicios

O novo usuario TI O novo departamento TI

Page 93: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 93

Transformación de roles e perfiles

Novos roles:

• Big Data

• Business Intelligence

• Data visualization

• Data scientist

Page 94: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 94

O valor da información vs o valor do dato

O dato por si mesmo NON ten valor

A información obtida do dato é o que ten valor

Page 95: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Imatia Innovations 95

Riscos e ética

• O problema do “Gran Hermano”

• Máquina vs Humano: O emprego do futuro

Page 96: Big Data IoT - notasdeclase.files.wordpress.com · ¿Que é Big Data? ¿Que é IoT? ... •Map/Reduce •Framework de ... Hbase Base de datos NoSQL construída sobre HDFS Hive Motor

Gracias!