Data Science meets Developers - Jonne Heikkinen, Solita

26
DATA SCIENCE MEETS DEVELOPERS Jonne Heikkinen, Data Scientist

Transcript of Data Science meets Developers - Jonne Heikkinen, Solita

Page 1: Data Science meets Developers - Jonne Heikkinen, Solita

DATA SCIENCE MEETSDEVELOPERSJonne Heikkinen, Data Scientist

Page 2: Data Science meets Developers - Jonne Heikkinen, Solita

Jonne Heikkinen@jonneheikkinen

~5 vuotta alalla

M.Sc. Comp sci

R&D, asiakasanalytiikka, suosittelukoneet, konenäkö, NLP

Data scientist @ solita

Page 3: Data Science meets Developers - Jonne Heikkinen, Solita

”Data science is about extracting knowledge from

data.

Page 4: Data Science meets Developers - Jonne Heikkinen, Solita

KONEIHMINEN

vs.

PÄÄTÖKSENTEKIJÄ

Page 5: Data Science meets Developers - Jonne Heikkinen, Solita

PÄÄTÖKSENTEKIJÄ:KONE

Page 6: Data Science meets Developers - Jonne Heikkinen, Solita

PÄÄTÖKSENTEKIJÄ:KONE

1 Mitä on koneoppiminen?

Page 7: Data Science meets Developers - Jonne Heikkinen, Solita

1 Mitä on koneoppiminen?

2 Mitä ongelmia koneoppimisella voidaan ratkaista?

PÄÄTÖKSENTEKIJÄ:KONE

Page 8: Data Science meets Developers - Jonne Heikkinen, Solita

1 Mitä on koneoppiminen?

2 Mitä ongelmia koneoppimisella voidaan ratkaista?

3 Koneoppiminen tuotantoratkaisuksi?

PÄÄTÖKSENTEKIJÄ:KONE

Page 9: Data Science meets Developers - Jonne Heikkinen, Solita

1 Mitä on koneoppiminen?

2 Mitä ongelmia koneoppimisella voidaan ratkaista?

3 Koneoppiminen tuotantoratkaisuksi?

4 Miksi ohjelmistokehittäjän stackki on kultaa?

PÄÄTÖKSENTEKIJÄ:KONE

Page 10: Data Science meets Developers - Jonne Heikkinen, Solita
Page 11: Data Science meets Developers - Jonne Heikkinen, Solita

MACHINE LEARNING

SINCE 1959

Page 12: Data Science meets Developers - Jonne Heikkinen, Solita

DATA

ML-WORKFLOW

LEARN MODEL

Page 13: Data Science meets Developers - Jonne Heikkinen, Solita

SupervisedUnsuper-

vised

Machine learning

Reinforce-ment

SUB-CATEGORIES

Page 14: Data Science meets Developers - Jonne Heikkinen, Solita

SOVELLUSKOHTEET

› Suosittelukoneet (Netflix, Amazon).

› Ennustaminen. Asiakaspoistuma, huolto.

› Tunnistaminen. Facial, speech, fraud etc.

› Täysin uudet palvelut, jotka perustuvat ML

Page 15: Data Science meets Developers - Jonne Heikkinen, Solita

PALVELUT:TOUCHPOINTIT,

LIIKETOIMINNAN-KEHITYS

1. Kerää javastaanottaa

2. Rikastaa

3. Varastoija jalostaa

4. Machine learning

6. Julkaiseehyödynnettäväksi

OPERATIIVISET JÄRJESTELMÄT,SENSORIDATAN LÄHTEET &

DIGITAALISET PALVELUT

ULKOISET TIETOLÄHTEET

Page 16: Data Science meets Developers - Jonne Heikkinen, Solita

4. Machine learning

Page 17: Data Science meets Developers - Jonne Heikkinen, Solita

VA

AD

ITT

U T

EK

NIN

EN

O

SA

AM

INE

N

DATAN MÄÄRÄ

DATA EI MAHDU MUISTIIN

Page 18: Data Science meets Developers - Jonne Heikkinen, Solita

4. Machine learning

Page 19: Data Science meets Developers - Jonne Heikkinen, Solita

PREPARE DATA

FEATURE SELECTI

ON

TRAIN MODEL

EVALUATE

ML-WORKFLOW

Page 20: Data Science meets Developers - Jonne Heikkinen, Solita

Measurement-device 1..n

timestamp event … var_n Activity

Truck total_hours

time_from_maintentance

acceleration_magnitude

... feature_m Activity

RAW DATA

FEATURESPREPROCESSING, E.G., HANDLE

MISSING VALUES

n > m

Page 21: Data Science meets Developers - Jonne Heikkinen, Solita

TRAIN MODEL

Page 22: Data Science meets Developers - Jonne Heikkinen, Solita

VALIDOINTI

1/4 1/4 1/4 1/4

1/4 1/4 1/4 1/4

1/4 1/4 1/4 1/4

1/4 1/4 1/4 1/4

Fold 1

Fold 2

Fold 3

Fold4

Testidata

Opetusdata60% 40%

Holdout K-fold

Page 23: Data Science meets Developers - Jonne Heikkinen, Solita

SA

AV

UT

ET

TU

HY

ÖT

Y

KÄYTETTY AIKA

STATISTICAL RIGOR

QUICK ’N DIRTY

Page 24: Data Science meets Developers - Jonne Heikkinen, Solita

SUMMMM:

› Data engineerin rooli on avainasemassa, kun tehdään koneoppimisratkaisuita tuotantoon.

› Rakentavat ja ylläpitävät skaalautuvia älykkäitä järjestelmiä.

› Implementoivat yhdessä menetelmätieteiden asiantuntijoiden kanssa ratkaisuja tuotantoon.

› Analyysi ilman, että se menee käyttöön: 0 pistettä.

Page 25: Data Science meets Developers - Jonne Heikkinen, Solita

1 Ota joku oma datasetti, jonka tunnet hyvin.

2 Choose your weapon.

3 Pyörittele, kokeile, testaa.

4 Esim. kaggle–skabat.

MITEN LIIKKEELLE

Page 26: Data Science meets Developers - Jonne Heikkinen, Solita