Intro au Big Data & Machine Learning

Post on 15-Apr-2017

360 views 0 download

Transcript of Intro au Big Data & Machine Learning

BigData&MachineLearningEricDaoudAttoyan

SéminaireMEA– Jeudi19Mai2016

Introduction

• Quisuis-je?• MEAdepuisSeptembre2016• IngénieurGénéralisteECAMLyonPromo2015• MastèreSpécialisé« SystèmesInformatiquesOuverts »,CentraleParisPromo2016

• Quefais-je?• Stagedefind’étudeschezManoMano• IngénierieInformatique• MachineLearning• Moteursderecommandations

BigData&MachineLearning 2

Plan

1. Qu’est-cequeleBig Data?2. Qu’est-cequeleMachineLearning?3. Exemplesd’applications

BigData&MachineLearning 3

Qu’estcequeleBig Data?

BigData&MachineLearning 4

Définition

« La notion de big data est un concept s'étant popularisé en 2012 pourtraduire le fait que les entreprises sont confrontées à des volumes dedonnées à traiter de plus en plus considérables et présentant un fortenjeu commercial et marketing. »

BigData&MachineLearning 5

Larègledes3V

BigData&MachineLearning 6

Lesacteurs

• Transformationvenueàlabasedes« .com »

• Maismaintenanttouchebeaucoupplusdesecteurs

BigData&MachineLearning 7

Petitsondage

Le Big Data implique de traiter beaucoup de données rapidement, lesentreprises ont donc besoin d’infrastructures très puissantes.Pour faire de tels calculs, choisiriez vous :

a) Un ordinateur très très puissantb) Beaucoup d’ordinateurs normaux

BigData&MachineLearning 8

Petitsondage

Le Big Data implique de traiter beaucoup de données rapidement, lesentreprises ont donc besoin d’infrastructures très puissantes.Pour faire de tels calculs, choisiriez vous :

a) Quelques ordinateurs très très puissantsb) Beaucoup d’ordinateurs normauxà Algorithme« Map Reduce »

BigData&MachineLearning 9

L’algorithmeMap Reduce

BigData&MachineLearning 10

Map Reduce pourcompterlesoccurencesdesmotsd’untexte

BigData&MachineLearning 11

Qu’estcequeleMachineLearning?

BigData&MachineLearning 12

Définition

« Machine learning is the science of getting computers to act withoutbeing explicitly programmed. In the past decade, machine learning hasgiven us self-driving cars, practical speech recognition, effective websearch, and a vastly improved understanding of the human genome »

BigData&MachineLearning 13

Processus

BigData&MachineLearning 14

Différentsproblèmes

• ApprentissageSupervisé• ApprentissageNonSupervisé• ApprentissageparRenforcement• ApprentissageProfond

BigData&MachineLearning 15

ApprentissageSupervisé

A partir d’un set de données d’entrainement, l’algorithme vaapprendre un modèle qui lui permettra de faire des prédictionsultérieurement.

Exemple : Filtrage Spam

BigData&MachineLearning 16

ApprentissagenonSupervisé

Aucun set de données d’entrainementn’est fourni. L’algorithme doit trouver lemeilleur modèle lui même.

Exemple : Trouver des groupes d’acheteurssimilaires sur un site d’e-commerce

BigData&MachineLearning 17

ApprentissageSupervisévs.NonSupervisé

BigData&MachineLearning 18

ApprentissageparRenforcement

« Apprendre, à partir d'expériences, ce qu'il convient de faire endifférentes situations. Agent autonome au sein d'un environnement,qui doit prendre des décisions en fonction de son état courant. Enretour, l'environnement procure à l'agent une récompense, qui peutêtre positive ou négative »

Exemple : Un robot qui apprend à jouer aux échecs contre un êtrehumain

BigData&MachineLearning 19

ApprentissageProfond(DeepLearning)

Apprentissage supervisé avec un réseaude neurones. une machine virtuellecomposée d'unités qui effectuentchacune de petits calculs simples. Lesrésultats de la première couche deneurones vont servir d'entrée au calculdes autres.

Exemple : Reconnaissance d’image

BigData&MachineLearning 20

QuelquesExemples

BigData&MachineLearning 21

GoogleDeepMind

BigData&MachineLearning 22

Lapublicitéciblée

BigData&MachineLearning 23

LaVoitureAutonome

BigData&MachineLearning 24

LesMoteursdeRecommandations

BigData&MachineLearning 25

Aquoiçasert?

• Deplusenplusdechoixpourl’utilisateur,quelquesoitlecontenu• Guider,fairedécouvrir, vendreplus…

BigData&MachineLearning 26

Deuxapproches

• ContentBased Filtering• Sebasesurlecontenudesproduitsappréciésparl’utilisateur• Exemple:BobaimeleRock,luiproposerdeschansonsdeRock

• CollaborativeFiltering• Rapprochedesutilisateursetpropose lecontenuquel’unaaiméetpasl’autre

• Exemple:BobetJoesontsimilaires.BobaadoréledernieralbumdesArcticMonkeys. RecommandercetalbumàJoequinel’apasencoreécouté.

BigData&MachineLearning 27

Deuxapproches

BigData&MachineLearning 28

Conclusion

• Domainepasnouveau,maisenpleinessorgrâceàl’explosiondesdonnéesetdelapuissancedecalcul• Beaucoupd’applicationsenliendirectaveclesutilisateurs• Domaineenvogue,quineconnaîtpaslacrise• Lemeilleurresteencoreàvenir!

BigData&MachineLearning 29

Mercidevotre attention!Big Data&MachineLearning

EricDaoudAttoyanSéminaireMEA– Jeudi19Mai2016

Références

• https://fr.coursera.org/learn/machine-learning• http://fr.slideshare.net/xamat/recommender-systems-machine-learning-summer-school-2014-cmu• https://deepmind.com• https://www.google.com/selfdrivingcar/• http://www.lemonde.fr/sciences/article/2016/02/04/la-lecon-d-un-maitre-de-l-intelligence-artificielle_4859368_1650684.html• https://hbr.org/2012/10/big-data-the-management-revolution/ar• http://static.googleusercontent.com/media/research.google.com/en//archive/mapreduce-osdi04.pdf• https://fr.wikipedia.org/wiki/Apprentissage_automatique

BigData&MachineLearning 31