cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

29
1 L. Carraro Introduction à la régression cours n°1 ENSM.SE – axe MSA

Transcript of cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

Page 1: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

1L. Carraro

Introduction à la régressioncours n°1

ENSM.SE – axe MSA

Page 2: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

2L. Carraro

Présentation• Objectifs

– Comprendre la problématique générale de la régression.– Savoir mettre en œuvre la régression linéaire dans un

cas simple, mais réaliste.• Evaluation

– TP le 21 novembre : 20%– Etude critique le 23 novembre : 20%– TP le 12 décembre : 20%– Examen avec documents : 40%

Page 3: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

3L. Carraro

Calendrier• mardi 8 novembre (8h15-11h30) :introduction, régression, moindres carrés• mercredi 9 novembre (8h15-11h30) :analyse de variance (ANOVA), modèle probabiliste• lundi 21 novembre (8h15-11h30) :TP sur les données de taille• mardi 22 novembre (8h15-11h30) :ANOVA complète, résidus

Page 4: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

4L. Carraro

Calendrier (suite)• mercredi 23 novembre (8h15-11h30)étude critique• mardi 29 novembre (8h15-11h30)prévision + régression non paramétrique• lundi 12 décembre (8h15-9h45)TP régression non paramétrique• vendredi 16 décembre (8h15-9h45)examen

Page 5: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

5L. Carraro

Problématique de la régression

Lien entre une réponse yet des prédicteurs x1,…, xp

… dans un contexte incertain

… à partir d’expériences

… dans un but prédictif

Page 6: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

6L. Carraro

Classification

• réponse quantitative/qualitative

• régression paramétrique/non paramétrique

• régression linéaire/non linéaire

• prédicteurs contrôlés/non contrôlés

Page 7: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

7L. Carraro

Exemple 1 : Société de crédit

Variables

Client

• âge

• sexe

• situation

• nombre de voitures

• revenus

• ...

Modèle

StatistiqueScore

Aide à la décision :

acceptation ou rejet

du client

But : cibler au mieux un client potentiel

Page 8: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

8L. Carraro

Exemple 2 : Société d’autoroute

Variables

trafic• date

• heure

• station de mesure

• débit

• type de véhicule

• vitesse instantanée

• ...

Modèle

Statistique

Indicateurs du

trafic

Aide à la prévision :

optimiser le trafic, la

gestion des sections à péage

But : prévoir le trafic sur une section d’autoroute de son réseau

Page 9: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

9L. Carraro

Exemple 3 : Calcination de la chaux

Variables

four

• température

• pression

• ...

Modèle

Statistiquequantité produite

aide à la production :

maximiser la plus-value

But : optimiser la réaction

Page 10: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

10L. Carraro

Aspects formels

• L'espérance conditionnelle commeespérance

• L'espérance conditionnelle commeprojection

• L'espérance conditionnelle linéaire• Cas gaussien• Prédicteurs qualitatifs

Page 11: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

11L. Carraro

Exemple 1Récupération de cartons dans la

grande distribution• Réponse = tonnage de cartons annuel• Prédicteur = CA HT

+ surface commerciale + prestataire + catégorie• 102 observations

Page 12: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

12L. Carraro

exemple 1

0 20000 40000 60000 80000

02

00

40

06

00

80

01

00

01

20

0

CA en keuros

cart

ons e

n tonnes

Page 13: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

13L. Carraro

cartons = β0 + βCA CA

0 20000 40000 60000 80000

02

00

40

06

00

80

01

00

01

20

0

CA en keuros

cart

ons e

n tonnes

Page 14: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

14L. Carraro

exemple 1 – différents modèles

0 20000 40000 60000 80000

02

00

40

06

00

80

01

00

01

20

0

CA en keuros

cart

ons e

n tonnes

degré 1degré 2degré 3

Page 15: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

15L. Carraro

0 20000 40000 60000 80000

-4000

400

CA

résidus

cartons ~ CA - degré 1

0 20000 40000 60000 80000

-4000

400

CA

résidus

cartons ~ CA - degré 2

0 20000 40000 60000 80000

-4000

400

CA

résidus

cartons ~ CA - degré 3

comportementnon satisfaisant

Page 16: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

16L. Carraro

Questions/objectifs

• Estimer "au mieux" l'équation de la droite• Utilité de la variable CA ?• Effet des autres variables ?• Validation• Précision des résultats• Prévisions et contrôles• …

Page 17: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

17L. Carraro

Les moindres carrés

• Notations

• Equation normale

• Interprétation géométrique

• Un premier indicateur de validation

Page 18: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

18L. Carraro

0 200 400 600 800

-200

200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 1

0 200 400 600 800

-300

0200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 2

0 200 400 600 800

-300

0200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 3

Page 19: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

19L. Carraro

0 200 400 600

-20

0200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 1

0 200 400 600 800

-30

00

200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 2

0 200 400 600 800

-30

00

300

tonnage cartons estimé

résid

us

cartons ~ CA - degré 3

Page 20: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

20L. Carraro zoom sur le modèle de degré 1

0 200 400 600

-20

00

20

04

00

tonnage cartons estimé

résid

us

cartons ~ CA - degré 1

Page 21: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

21L. Carraro exemple 1après transformation logarithmique

8.0 8.5 9.0 9.5 10.0 10.5 11.0

12

34

56

7

log(CA) en keuros

log(c

art

ons)

en tonnes

Page 22: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

22L. Carraro

exemple 1 transformé – modèles

8.0 8.5 9.0 9.5 10.0 10.5 11.0

12

34

56

7

log(CA) en keuros

log(c

art

ons)

en tonnes

degré 1degré 2degré 3

Page 23: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

23L. Carraro

8 9 10 11 12

-3-1

13

log(CA)

résidus

log(cartons) ~ log(CA) - degré 1

8 9 10 11 12

-3-1

13

log(CA)

résidus

log(cartons) ~ log(CA) - degré 2

8 9 10 11 12

-3-1

13

log(CA)

résidus

log(cartons) ~ log(CA) - degré 3

Page 24: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

24L. Carraro

2 3 4 5 6

-20

12

log(tonnage cartons) estimé

résid

us

log(cartons) ~ log(CA) - degré 1

3 4 5 6 7

-20

2

log(tonnage cartons) estimé

résid

us

log(cartons) ~ log(CA) - degré 2

3 4 5 6

-20

2

log(tonnage cartons) estimé

résid

us

log(cartons) ~ log(CA) - degré 3

Page 25: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

25L. Carraro

Zoom sur le modèle de degré 1

8 9 10 11 12

-3-1

13

log(CA)

résid

us

log(cartons) ~ log(CA) - degré 1

2 3 4 5 6

-20

2

log(tonnage cartons) estimé

résid

us

Page 26: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

26L. Carraro

Et les autres variables ?

8 9 10 11 12

-3-2

-10

12

3

log(CA)

résid

us

log(cartons) ~ log(CA) - degré 1

prestataire 0prestataire C

Page 27: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

27L. Carraro

Variable surface

0 2000 4000 6000 8000 10000 12000

-2-1

01

2

surface

résidus

log(cartons) ~ log(CA) - degré 1

Page 28: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

28L. Carraro

Variable prestataire

prestataire C prestataire O

-2-1

01

2

log(cartons) ~ log(CA) - degré 1résidus

Page 29: cours1www - Carraro · Title: cours1 Author: Laurent Carraro Created Date: 1/16/2006 6:20:28 PM

29L. Carraro

Variable catégorie

hyper super

-2-1

01

2

log(cartons) ~ log(CA) - degré 1résidus