chapitre ACP (1).ppt

45
1 M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric Lombardot Chapitre 7 : Chapitre 7 : Analyse factorielle 7.1. Principe et conditions d’application 7.2. ACP 7.3. AFC

Transcript of chapitre ACP (1).ppt

1M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

7.2. ACP

7.3. AFC

2M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Principe et historique :

L’analyse factorielle est une méthode descriptive (par opposition aux méthodes explicatives que nous avons vu auparavant). Il n’y a plus de variables explicatives et à expliquer. On étudie l’ensemble des corrélations entre variables quantitatives pour l’ACP et qualitatives pour l’AFC.

Historiquement, il s’agit de l’un des + anciennes méthodes d’analyse des données (Spearman, début 20ème). Mais les applications informatiques ont considérablement modifié les conditions et modalités d’application, en rendant notamment possible le traitement d’un très grand nombre de données. C’est enfin la méthode la plus connue et la plus utilisée en sciences sociales.

3M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

Exemples d’utilisation marketing de l’analyse factorielle :

• Dans la segmentation de marché, pour identifier les variables fondamentales à partir desquelles seront formés des groupes de clients. Par exemple, les acheteurs de voitures neuves seront ainsi regroupés en 5 segments selon leur sensibilité au prix, à la commodité, à la performance, au confort et au luxe.

• En recherche produit, pour déterminer les caractéristiques d’1 marque qui influencent le choix des consommateurs. Les marques de dentifrice peuvent par exemple être évaluées selon des critères de protection contre les caries, la blancheur des dents, de goût, de rafraîchissement d’haleine ou de prix.

7.1. Principe et conditions d’application

4M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

• Lors d’études publicitaires, pour comprendre dans le marché cible les habitudes du consommateur moyen. Ceux qui achètent des plats surgelés peuvent aussi être de grands amateurs de télévision par câble, regarder beaucoup la télévision, etc.

• Lors d’études de prix, pour identifier les caractéristiques de sensibilité au prix des consommateurs, ces derniers pouvant être « ordonnés », « économes » ou « tournés vers le foyer ».

5M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Objectifs et conditions d’utilisation :

L’objectif principal est la structuration des variables, c’est-à-dire la réduction des colonnes de la matrices des données : on veut résumer l’information.

Pour ce faire, on remplace les variables initiales par un nombre plus restreint de variables dites « composites » (ou « facteurs »), obtenues par « regroupement » des variables initiales les plus corrélées entre elles.

Cela nécessite :

1. Un nombre d’individu supérieur à 15

2. Qu’il y ait plus d’individus que de variables

6M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Exemple : on mesure 40 variables d’attitudes sur 800 ménagères. Faut-il vraiment garder les 32 000 valeurs de la BDD ou ne peut-on pas résumer cette information par 1, 2 ou 3 variables de synthèse ? N’y-a-t-il pas redondances entre certaines variables initiales ? Ne peut-on pas en éliminer certaines qui n’apportent qu’1 information marginale et peu intéressante ?

• Avoir moins de variables permet de faciliter l’interprétation et pouvoir dégager des implications managériales concrètes.

• L’analyse factorielle peut aussi servir de phase intermédiaire de calcul avant d’utiliser d’autres méthodes.

7M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Une autre utilisation fréquente de l’analyse factorielle concerne la démarche psychométrique de mesure de concepts non observables.

Par exemple, si l’on souhaite développer, ou même reprendre une échelle de mesure d’attitude ou une échelle mesurant un trait de personnalité en particulier, il est en toute rigueur nécessaire de s’assurer de la validité et de la fiabilité de cet instrument. On réalise pour cela une analyse factorielle.

S’il s’agit d’une échelle de mesure que l’on a créée, on mènera une analyse factorielle « exploratoire », s’il s’agit d’une échelle de mesure que l’on reprend de la littérature (qui a déjà fait l’objet de validations antérieures), on mènera une analyse factorielle « confirmatoire ».

8M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Exemple d’analyse factorielle exploratoire : l’image d’un magasin a été évaluée par un échantillon d’individus à partir d’une série d’items sur une échelle sémantique. On va analyser et regrouper ces items pour faire ressortir les facteurs fondamentaux.

Exemple d’analyse factorielle confirmatoire : s’assurer des bonnes qualités de l’échelle d’attitude en 4 items que l’on a repris de la littérature.

9M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Approche R et Q de l’ACP :

Lorsque l’on part d’une matrice de données (individus/variables), 2 types d’analyse factorielle peuvent être menés :

• l’approche R (celle que nous allons traiter) : les facteurs sont des combinaisons linéaires de variables initiales

• l’approche Q (rare) : les facteurs sont des combinaisons linéaires d’individus. Cela permet de regrouper les individus qui ont des réponses analogues sur les variables sur lesquelles portent l’analyse.

Dans les 2 cas, les techniques de calcul sont identiques.

10M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Types de variables de l’ACP :

L’ACP consiste à regrouper des variables quantitatives (âge en années, salaire en euros, etc. ou en marketing, échelles de proportion ou d’intervalle). Ces variables sont :

• Au moins centrées : dans ce cas l’analyse factorielle repose sur la matrice des variances-covariances on accordera alors beaucoup d’importance aux variables les plus dispersées

• Ou centrées-réduites : dans ce cas l’analyse factorielle repose sur la matrice des corrélations r entre variables

11M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Dans le cas particulier de variables toutes mesurées sur des échelles à même nombre d’échelon, les données sont utilisées « telles quelles ». L’analyse factorielle reposera alors sur la matrice des corrélations, comme si les données étaient centrées-réduites.

Remarque :

En marketing, on réalise beaucoup d’ACP avec des BDD mesurant des scores. Pour ces échelles (d’intervalle ou de ratio), seules des variables mesurées sur un même nombre d’échellons peuvent être analysées simultanément, sinon, il faut au préalable centrer et réduire les données.

Dans tous les cas, avec l’ACP, les données sont au moins centrées.

12M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Les variables sont-elles factorisables ?

Avant de réaliser une analyse factorielle, il faut s’interroger sur sa pertinence, d’un point de vue théorique bien sûr, mais ensuite d’un point de vue statistique. Statistiquement, on peut, de manière assez peu formelle, vérifier à l’aide de la matrice des corrélations que les coefficients sont assez élevés dans l’ensemble. On peut également mener une démarche plus rigoureuse, à l’aide de 2 tests, disponibles sous SPSS

• le test de sphéricité de Barlett.

• le test MSA (Measure of Sampling Adequacy - appelé aussi test de Kaiser, Meyer et Olkin) qui peut être effectué pour chaque variable ou directement pour l’ensemble.

13M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

L’analyse en composante principale (ACP) consiste à résumer l’information contenue dans un tableau à 2 entrées, généralement les « individus » en lignes et les « variables » (quantitatives) en colonnes, en remplaçant les variables initiales par 1 plus petit nombre de nouvelles variables.

L’analyse factorielle des correspondances (AFC) est une généralisation de l’A.C.P. adaptée au traitement de données qualitatives qui se présentent sous la forme d’un tableau de contingence (dont on peut sommer les effectifs en lignes et en colonne). Elle permet de visualiser les relations pouvant exister entre les modalités de 2 caractères (par exemple, la couleur des yeux et des cheveux).

14M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Variables

1 2 3 p

1

2

3 xij

Scoreindividu isur var. j

Ind

ivid

us

ou o

bje

ts

n

Présentation des BDD utilisées, pour l’ACP : en ligne, les individus et en colonne, les variables

A chaque case du tableau correspond le score d’1 individu sur 1 variable.

15M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

Présentation des BDD utilisées, pour l’AFC :

Soient X et Y deux variables qualitatives ayant respectivement xn et ym modalités. Exemple : X : boissons consommées et Y : région d’habitation

Le tableau de contingence K formé à partir de ces deux variables aura autant :

• de lignes que la variable X a de modalités (n) (exemple : coca, jus de fruit, bière, vin, whisky, etc)

• et autant de colonnes que la variable Y a de modalités (m) (exemple : Ile-de-France, Bretagne, etc.).

16M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.1. Principe et conditions d’application

ki j,

Kn m( , )

y y yj m1

x

x

x

i

n

1

X possèden modalités

(types de boissons)

Y possèdem modalités(les régions)

Nombre d’individus qui consomment la boisson xi et qui habitent la région yi.

Les individus n’apparraissent qu’au travers de leurs effectifs. Chaque chiffre correspond à 1 individu.

17M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Pour simplifier la démarche, nous pouvons la décomposer en 4 étapes (après avoir supprimé de l’analyse les éventuelles données aberrantes) :

1. Formulation du problème

2. Vérification des corrélations

3. Détermination du nombre d’axes à retenir

4. Interprétation des axes factoriels

18M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Etape 1 : Formuler le problème

Il s’agit de déterminer les objectifs de l’analyse factorielle qui va être menée. Les variables considérées pour l’analyse doivent être choisies sur la base de recherches préalables (être justifiées, que ce soit par la littérature ou par une phase qualitative par exemple). On utilise des données quantitatives brutes ou des échelles d’intervalles ou de ratio (ayant même nombre d’échelons ou étant standardisées). Le nombre d’individus est généralement 4 à 5 fois + grand que le nombre de variables. Si l’échantillon est petit, ce rapport est + faible et les résultats doivent être interprétés avec prudence.

19

Exemple : BDD SPSS « caractéristiques des dentifrices »

Il s’agit d’1 étude qui porte sur les avantages fondamentaux recherchés par les consommateurs lors de l’acaht d’un dentifrice. Le sondage est réalisé dans 1 centre commercial auprès d’1 échantillon de 30 personnes, qui ont donné leur avis sur les affirmations suivantes, sur 1 échelle de 1 (en total désaccord) à 7 (entièrement d’accord) même nombre d’échelons

V1 : Il est important d’utiliser 1 dentifrice qui prévient la formation des caries.

V2 : Un dentifrice doit rendre les dents brillantes.

V3 : Un dentifrice doit renforcer les gencives.

V4 : Un dentifrice doit raffraîchir l’haleine.

V5 : La prévention des caries n’est pas un avantage important du dentifrice (sic).

V6 : Un dentifrice doit avant tout donner de belles dents

20M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Etape 2 : Vérification des corrélations

Le processus de l’ACP repose sur une matrice des corrélations (ou des covariances, selon que les données sont réduites ou non). Pour que l’analyse soit pertinente, il est nécessaire que les variables soient corrélées. Des variables qui sont fortement corrélées avec le(s) même(s) facteur(s) sont supposées être également fortement corrélées entre elles.

Une première méthode consiste à examiner la matrice des corrélations.

Analyse Factorisation Analyse factorielle

Puis menu « caractéristiques » cliquez sur « matrice des corrélations – coefficients »

21M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Matrice de corrélation

1,000 -,053 ,873 -,086 -,858 ,004

-,053 1,000 -,155 ,572 ,020 ,640

,873 -,155 1,000 -,248 -,778 -,018

-,086 ,572 -,248 1,000 -,007 ,640

-,858 ,020 -,778 -,007 1,000 -,136

,004 ,640 -,018 ,640 -,136 1,000

caries

brillance

gencives

haleine

prévention caries

belles dents

Corrélationcaries brillance gencives haleine

préventioncaries belles dents

De nombreux coefficients de corrélation (r) sont assez forts (>0,4 en v.a.) ce qui laisse supposer que l’analyse est pertinente.

Les corrélations entre V1, V2, V3 et V5 sont relativement fortes : on peut s’attendre à ce que ces variables soient corrélées aux mêmes groupes de facteurs. Il en est de même pour V2, V4 et V6.

22M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Pour être + rigoureux, il est utile de réaliser un test de sphéricité de Barlett et une mesure de l’indice d’adéquation de Kaiser-Meyer-Olkin. Dans le même menu « caractéristiques » cliquez sur « matrice des corrélations – indice KMO et test de Barlett »

Indice KMO et test de Bartlett

,660

111,314

15

,000

Mesure de précision de l'échantillonnage deKaiser-Meyer-Olkin.

Khi-deux approché

ddl

Signification

Test de sphéricité deBartlett

23M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Le test de sphéricité de Barlett teste l’hypothèse nulle H0 selon laquelle les variables ne sont pas corrélées dans la population ( est-il possible de mener 1 ACP ?). Dans une matrice identité, tous les termes de la diagonales sont égaux à 1, et tous les autres à 0. CE test s’appuie sur 1 transformation du khi-2 du déterminant de la matrice des corrélations. Une valeur élevée au vu du nombre de ddl (ou plus simplement 1 probabilités associée faible c-a-d < 5%) permet de rejeter H0.

Dans le tableau précédent, la valeur du khi-2 est de 111,314 pour 15 ddl, soit une probabilité d’erreur de 0,000 H0 est rejetée, il est pertinent de poursuivre l’analyse.

24M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Le test de Kaiser-Meyer-Olkin (KMO) compare les grandeurs des coefficients de corrélation observés aux grandeurs des coefficients de corrélation partielle. De petites valeurs de cet indice indiquent que les corrélations entre paires de variables ne peuvent pas être expliquées par d’autres variables et que l’analyse factorielle peut ne pas être pertinente ( est-il intéressant de mener 1 ACP ?).

On estime généralement qu’une valeur > 0,5 est satisfaisante. La valeur du test KMO que nous avons obtenue est de 0,660, ce qui est suffisament élevé. L’analyse factorielle apparaît donc bien appropriée pour l’analyse de la matrice des corrélations (même nombre d’échelons pour chaque échelle).

25M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Etape 3 : Détermination du nombre d’axes à retenir

Il est possible de calculer autant de composantes principales (ou « axes » ou « facteurs ») qu’il y a de variables, mais dans ce cas nous n’aboutirions à aucune synthèse de l’information. Rappel : le but est résumer l’information. Un petit nombre de facteurs doit donc être extrait. + on retient d’axes, plus la variance restituée est importante, mais moins l’analyse est synthétique et donc délicate à interprétée. En outre, le premier facteur est celui qui restitue le maximum de la variance totale des variables originales (ce qui fonde la différence entre les individus). Le deuxième facteur est celui qui restitue le maximum de variance restante, etc. Rapidement, l’ajout d’un axe supplémentaire présente un intérêt limité en terme d’apport d’information.

26

Rotation des axes factoriels (1/3) :

Avant de poursuivre la démarche de détermination du nombre optimal d’axes à retenir (et lancer l’analyse), précisons qu’il est préférable de réaliser une rotation des axes factoriels. Cette rotation n’affecte ni les communalités, ni le pourcentage de la variance totale expliquée, mais modifie le % de variance correspondant à chaque facteur (et donc les valeurs propres).

Le tableau des corrélations entre variables et facteurs (la matrice factorielle ou matrice des composantes) est au cœur de l’analyse factorielle. Il présente des coefficients qui expriment les variables centrées standardisées en fonction des facteurs. Ces coefficients (ou poids factoriels ou loadings) représentent les corrélations existantes entre les facteurs et les variables. Un coefficient élevé (en v.a.) indique que le facteur et la variable sont étroitement corrélés, ou encore que la variable apporte beaucoup de sens au facteur. Or, cette matrice factorielle, sans rotation, permet rarement d’aboutir à des facteurs pouvant être interprétés, puisqu’ils son corrélés avec plusieurs variables.

27

Matrice des composantesa

,928 ,253

-,301 ,795

,936 ,131

-,342 ,789

-,869 -,351

-,177 ,871

caries

brillance

gencives

haleine

prévention caries

belles dents

1 2

Composante

Méthode d'extraction : Analyse en composantes principales.

2 composantes extraites.a.

Par exemple, si l’on retient 2 facteurs, il ressort que le facteur 1 est corrélé avec 5 variables (v.a. > 0,3) et le facteur 2 avec 4. Il serait très difficile avec 1 telle matrice d’interpréter les résultats…

La rotation permet de transformer la matrice factorielle en une matrice + simple et + facile à interpréter. L’objectif est que les facteurs aient 1 coefficient non nul ou significatif pour quelques variables. Dans le même temps, on voudrait que chaque variable ait une corrélation non nulle ou significative avec seulement quelques facteurs (1 seul si possible). La rotation maximise les saturations les plus fortes et minimise les plus faibles. 2 grans types sont utilisés en sciences sociales :

Rotation des axes factoriels (2/3) :

28

- La rotation orthogonale (dont les plus fréquemment employées sont VARIMAX et QUARTIMAX ) est utilisée lorsque l’on pense déterminer des facteurs indépendants les uns des autres. Cette solution est préférable car elle indique que chaque facteur apporte une information unique, non partagée par un autre facteur. Cependant, cette solution est rarement possible en Sciences Sociales, car il existe généralement des liens conceptuels entre les facteurs.

-La rotation oblique (OBLIMIN) permet une corrélation entre les facteurs. Comme elle correspond mieux à la réalité, c’est elle qui est généralement utilisée en Sciences Sociales. C’est aussi celle que nous avons retenue pour notre exemple.

Sous SPSS, menu « rotation » choisir Oblimin directe, avec delta = 0

Rotation des axes factoriels (3/3) :

29M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Pour savoir combien d’axes retenir, plusieurs méthodes existent et sont complémentaires :

• La détermination a priori : il arrive que le chargé d’étude sache à l’avance combien d’axes retenir, s’il s’agit par exemple d’une étude très « classique ».

Dans ce cas là, sous SPSS, dans le menu « extraction », on peut spécifier directement le nombre d’axes à retenir.

30M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

• L’examen des valeurs propres : si le nuage de points initial n’avait pratiquement aucune direction privilégiée, la variance restituée par le premier facteur serait d’environ 100/p (où p est le nombre initial de variables). Pour conserver un facteur, il faut que la variance qu’il restitue soit nettement supérieure à cette restitution « au hasard ». Le seuil communément admis pour retenir un facteur est de deux fois la quantité 100/p. Le point de départ de l’analyse étant la matrice des corrélations, les facteurs retenus sont ceux dont les valeurs propres sont supérieures à 1. Cette règle de décision est également appelée « règle de Kaiser ». Cependant, cette méthode n’est pas satisfaisante lorsque le nombre de variables est inférieur à 20 (comme ici). La valeur « 1 » est plus un seuil en dessous duquel il ne faut pas descendre, mais qui ne signifie pas qu’une fois franchit l’axe ne doit nécessairement être retenu.

31M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Variance expliquée totale

2,731 45,520 45,520 2,731 45,520 45,520 2,453

2,218 36,969 82,488 2,218 36,969 82,488 1,765

,442 7,360 89,848 ,442 7,360 89,848 1,806

,341 5,688 95,536 ,341 5,688 95,536 1,839

,183 3,044 98,580 ,183 3,044 98,580 2,360

8,521E-02 1,420 100,000 8,521E-02 1,420 100,000 2,508

Composante1

2

3

4

5

6

Total% de la

variance == % cumulés Total% de la

variance == % cumulés Total

Valeurs propres initiales Sommes des carrés chargées Sommedes

carréspour larotation

a

Méthode d'extraction : Analyse des principaux composants.

Lorsque les composantes sont corrélées, les sommes des carrés chargés ne peuvent pas êtreadditionnés pour obtenir une variance totale.

a.

Dans notre exemple, si l’on retient les valeurs propres > 1, alors nous devons retenir 2 axes factoriels.

32M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

• L’examen de la courbe des valeurs propres : la variance restituée par chaque facteur va en diminuant. Cette règle de décision consiste à chercher le premier facteur dont l’élimination consiste à une perte d’information minimum. L’examen de la courbe des valeurs propres (fournie par SPSS) conduit à la recherche d’un point d’inflexion et à l’élimination des facteurs situés après ce point. Il est démontré de façon expérimentale que le point où commence le changement de concavité est révélateur du nombre de facteurs.

Cette méthode peut aboutir à retenir + de facteurs qu’avec la méthode des valeurs propres.

33M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Graphique des valeurs propres

Numéro de composant

654321

Va

leu

r p

rop

re

3,0

2,5

2,0

1,5

1,0

,5

0,0

Le test de coude montre un net décrochement à partir de 3 facteurs. Il inciterait donc à retenir 3 axes factoriels.

34

Variance expliquée totale

2,731 45,520 45,520 2,731 45,520 45,520 2,453

2,218 36,969 82,488 2,218 36,969 82,488 1,765

,442 7,360 89,848 ,442 7,360 89,848 1,806

,341 5,688 95,536 ,341 5,688 95,536 1,839

,183 3,044 98,580 ,183 3,044 98,580 2,360

8,521E-02 1,420 100,000 8,521E-02 1,420 100,000 2,508

Composante1

2

3

4

5

6

Total% de la

variance == % cumulés Total% de la

variance == % cumulés Total

Valeurs propres initiales Sommes des carrés chargées Sommedes

carréspour larotation

a

Méthode d'extraction : Analyse des principaux composants.

Lorsque les composantes sont corrélées, les sommes des carrés chargés ne peuvent pas êtreadditionnés pour obtenir une variance totale.

a.

M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

• Le minimum de variance totale restituée : le chercheur fixe à l’avance un seuil de variance qu’il veut restituer. Il retient ensuite le nombre d’axes nécessaires pour atteindre ce seuil. Si, dans les sciences « dures » un seuil de 95 % est fixé, un seuil de 60 % est généralement accepté en marketing et plus largement en sciences sociales.

2 facteurs = 82,488% de variance

restituée

35

Variance expliquée totale

2,731 45,520 45,520 2,731 45,520 45,520 2,453

2,218 36,969 82,488 2,218 36,969 82,488 1,765

,442 7,360 89,848 ,442 7,360 89,848 1,806

,341 5,688 95,536 ,341 5,688 95,536 1,839

,183 3,044 98,580 ,183 3,044 98,580 2,360

8,521E-02 1,420 100,000 8,521E-02 1,420 100,000 2,508

Composante1

2

3

4

5

6

Total% de la

variance == % cumulés Total% de la

variance == % cumulés Total

Valeurs propres initiales Sommes des carrés chargées Sommedes

carréspour larotation

a

Méthode d'extraction : Analyse des principaux composants.

Lorsque les composantes sont corrélées, les sommes des carrés chargés ne peuvent pas êtreadditionnés pour obtenir une variance totale.

a.

M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

• Le minimum de variance totale restituée : le chercheur fixe à l’avance un seuil de variance qu’il veut restituer. Il retient ensuite le nombre d’axes nécessaires pour atteindre ce seuil. Si, dans les sciences « dures » un seuil de 95 % est fixé, un seuil de 60 % est généralement accepté en marketing et plus largement en sciences sociales.

2 facteurs = 82,488% de variance

restituée

36M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Etape 4 : Interprétation des axes factoriels

Une fois les vérifications préalables opérées, le choix de rotation réalisé (oblimin) et le nombre d’axes factoriels déterminé (2), il reste à interpréter les axes factoriels. Ces variables composites sont les dimensions « latentes » du phénomène étudié. Pour l’interprétation, il est nécessaire de revenir aux items initiaux et de déterminer leur importance dans la formation des facteurs (et éventuellement de supprimer certains items de l’analyse). Les deux indicateurs utilisés sont les coefficients de corrélation et les communalités.

Il est parfois nécessaire à ce stade de fixer sous SPSS le nombre d’axes factoriels (2) que l’on souhaite retenir, s’il ne s’agit pas de la solution proposée par défaut par le logiciel.

37M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

• Les coefficients de corrélation entre variables initiales et facteurs (également appelés poids factoriels ou loadings) : plus la corrélation entre 1 variable et 1 facteur est élevée, plus ctte variable apporte du sens au facteur. Idéalement pour l’interprétation, une variable contribue fortement à un facteur (valeur > à 0,5 ou 0,6 en v.a.) et faiblement aux autres facteurs (valeurs < 0,3 en v.a).

Remarque : puisqu’une rotation a été effectuée, on s’intéresse maintenant directement aux poids factoriels après rotation.

Sous SPSS : matrice des types

38M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Matrice des typesa

,962 8,529E-05

-3,37E-02 ,848

,931 -,120

-7,47E-02 ,852

-,937 -,110

,108 ,888

caries

brillance

gencives

haleine

prévention caries

belles dents

1 2

Composante

Méthode d'extraction : Analyse en composantes principales.

Méthode de rotation : Oblimin avec normalisation de Kaiser.

La rotation a convergé en 3 itérations.a.

Le facteur 1 oppose caries/gencives à prévention caries (qui est codée dans l’autre sens).

Le facteur 2 est représenté par les variables brillance, haleine et belles dents.

Un dentifrice semble a priori être acheté pour 2 raisons principales : soit « santé » (caries/gencives) soit pour des attentes plus « sociales » (brilance/belles dents ou haleine fraîche).

39M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

• Les communalités : elles évaluent la qualité de représentation des variables par les facteurs ( les variables sont-elles bien représentées dans la solution factorielle retenue ?). Les variables qui présentent des communalités faibles (moins de 0,5) sont supprimées de l’analyse (c’est-à-dire que moins de la moitié de la variance initiale de la variable est conservée par la solution factorielle).

Qualité de représentation

1,000 ,926

1,000 ,723

1,000 ,894

1,000 ,739

1,000 ,878

1,000 ,790

caries

brillance

gencives

haleine

prévention caries

belles dents

Initial Extraction

Méthode d'extraction : Analyse des principaux composants.

Les différentes variables sont bien représentées par les facteurs.

40M2 Marketing Université Paris 1 Panthéon-Sorbonne Cours de M. Eric

Lombardot

Chapitre 7 :Chapitre 7 : Analyse factorielle

7.2. ACP

Il est fréquent, lorsque l’on mène 1 ACP de faire un tri dans les variables. On élimine celles qui ne répondent pas aux critères de corrélation et de qualité de représentation. On les supprime dans ce cas 1 par 1, en « re-faisant tourner » l’analyse à chaque fois, jusqu’à obtention d’1 solution satisfaisante.

L’analyse peut être complétée par 1 représentation graphique des différentes variables.

41

Diagramme de composantes dans l'espace après rotation

Composante 1

1,0,50,0-,5-1,0

Co

mp

osa

nte

2

1,0

,5

0,0

-,5

-1,0

belles dents

prévention caries

haleine

gencives

brillance

caries

rès rotation

Représentation graphique des variables :

42

En plus du simple diagramme permettant d’interpréter les axes factoriels, il est possible de représenter graphiquement les individus (colonne 1).

Création de 2 nouvelles variables à partir des facteurs :

Analyse > Factorisation > Analyse Factorielle

Facteurs > Enregistrer dans les variables

Création du graphe de dispersion :

Graphes > Diagramme de dispersion > Définir

REGR Factor Score 1 vers l’axe X

REGR Factor Score 2 vers l’axe Y

N° d’individu vers « Etiqueter les observations par »

Options : « Afficher le diagramme avec les étiquettes »

43REGR factor score 2 for analysis 1

3210-1-2

RE

GR

fa

cto

r sc

ore

1

fo

r a

na

lysi

s

1

2,0

1,5

1,0

,5

0,0

-,5

-1,0

-1,530,00

29,00

28,00

27,00

26,00

25,00

24,00

23,00

22,00

21,00

20,00

19,00

18,00

17,0016,00

15,00

14,00

13,00

12,00

11,00

10,00

9,00

8,00

7,00

6,00

5,00

4,00

3,00

2,00

1,00

44

Dans notre exemple, ceci présente peu d’intérêt. Cependant, si l’on avait été renseigné sur la marque consommée par ces différents individus, ce graph complémentaire aurait été beaucoup plus intéressant. Ajoutons 1 colonne « conso » censée représentée la marque de dentifrice consommée par l’individu interrogée. On code (affichage des variables valeurs)

1:Sanogyl

2:parogencyl

3:fluocaril

4:tonigencil

5:colgate

6:signal

7:rembrandt

8:ultrabrite

On réalise un nouveau graph, mais cette fois on va étiqueter les observations par marque consommée.

Remarque : on peut de la même manière faire apparaître les variables de notre choix sur la graph.

45REGR factor score 2 for analysis 1

3210-1-2

RE

GR

fa

cto

r sc

ore

1

fo

r a

na

lysi

s

1

2,0

1,5

1,0

,5

0,0

-,5

-1,0

-1,5signal

parogencyl

tonigencil

ultrabrite

fuocaril

ultrabrite

parogencyl

colgate

ultrabrite

signal

fuocaril

colgate

rembrandt

ultrabriteultrabrite

signal

sanogyl

rembrandt

colgate

rembrandt

tonigencil

colgate

rembrandt

ultrabrite

rembrandt

signal

sanogyl

rembrandt

colgate

rembrandt

Marques généralistes Marques

santé

Marques sociales