Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg...

25
Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain. (Mark Knopfler) 14.11.2006

Transcript of Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg...

Page 1: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Multivariate Analysemethoden

Günter MeinhardtJohannes Gutenberg Universität Mainz

Why worry?There must be sunshine after rain.(Mark Knopfler)

14.11.2006

Page 2: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Thema

Verfahren Multidimensionale Skalierung

Multidimensionale Skalierung

Problem:

Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum)

Möglichkeiten:

Faktorenanalyse MultidimensionaleSkalierung

Page 3: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Verfahren MDS - Faktorenanalyse

Faktorenanalyse

Vorgehen

Man lässt nur die Ähnlichkeit der Objekte beurteilen (ohne dendirekten Bezug auf konkrete Eigenschaften) und probiert die Anordnung („Konfiguration“) der Objekte in einem latenten Raum derart, dass die Ähnlichkeitsurteile möglichst gut repro-duziert werden.

MDS

Vorgehen

Man lässt Personen Eigenschaftsausprägungen von Objekten einschätzen (Item-Schätzskalen). Man faktorisiert die Skalenund betrachtet die Koordinaten der Objekte auf den neuen (unabhängigen) Dimensionen (= latenter Wahrnehmungsraum).

Page 4: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Latente Variable

Faktorenanalyse

Beispiel:Das Abschneiden im Abitur mit Deutsch, Mathe, Physik, Latein und Geographiewird erklärt aus latenten Variablen Memory, Induction, Perceptual Speed, Space,Verbal Comprehension.

Man möchte Objekte (Personen) in einem Raum latenter Dimensionen(Fähigkeiten, Traits) anordnen. Gegeben ist ein Set von Beobachtungen(Messvariablen)

1 1 2 2k k k kr rb b b= + + +x w w wK

( )1 2, , , px x xK

Problem: Finde latente Variablen

( )1 2, , , rw w wK

r p, so dass jede Variable xk eine Linearkombination der wl ist:

Verfahren MDS - Faktorenanalyse

Page 5: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Latente Variable

Multidimensionale Skalierung

Beispiel:Man lässt Filmschauspieler paarweise nach Ähnlichkeit/Unähnlichkeit bewerten.Die MDS soll den latenten Wahrnehmungsraum liefern, auf dem die Schauspielerangeordnet werden können, so dass die Ähnlichkeitsurteile reproduziert werden.

Man möchte Objekte (Personen) in einem Raum latenter Dimensionenanordnen. Gegeben ist ein Set von Beobachtungen über die (sensorischen)Distanzen der Objekte: (Distanzmatrix)

1 2

1

2 21

1 2

1 2

0

0

0

0

j n

j j j

n n n nj

o o o o

o

o d

o d d

o d d d

=D

L L

M M M O

L

M M M M M O

L LProblem: Finde latente Variablen

( )1 2, , , rw w wK

r n, so dass die Distanzen zwischen den Objekten auf den Koordinatenreproduziert werden.

Verfahren MDS - Faktorenanalyse

Page 6: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Faktorenanalyse MultidimensionaleSkalierung

Verfahren MDS - Faktorenanalyse

Demo - Beispiel mit Excel und Statistica

Page 7: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Vorteile • relevante Eigenschaften dürfen unbekannt sein (keine Verzerrung durch Vorauswahl)• kann bereits bei Rangdaten eingesetzt werden (Ergeb- nisse sind mit metrischer MDS quasi identisch)Nachteile

MDS

Verfahren MDS

• Aggregation über Personen ist problematisch (Bezug verschiedene latente Dimensionen beim Urteil)• Großer Interpretationsfreiraum beim Untersucher bei der inhaltlichen Benennung der Dimensionen (vage)• MDS- Lösung ist nicht algorithmisch (Keine Garantie die beste Lösung gefunden zu haben)• MDS Lösung ist von weiteren Parametern abhängig (Distanzmodell, Anzahl der Dimensionen)

Page 8: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Städte-Beispiel

MDS

Verfahren MDS

207220376366526668217634268Stuttgart167405309466609228437437Nürnberg

578482639782400584438München243287422189569496Köln

164307193378517Kassel154352282677Hannover

495294820Hamburg555337Frankfurt

847Berlin Basel

Stutt.Nürn-berg

Mün-chen

KölnKasselHanno-ver

Ham-burg

Frank-furt

BerlinBasel

Distanzen von Städten in km

Page 9: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

MDS

Verfahren MDS

Rangreihe der Distanzen von Städten

682019334173911Stuttgart32316283892525Nürnberg

36294043223727München10132443531Köln

21552132Kassel1181242Hannover

301444Hamburg3417Frankfurt

45Berlin Basel

Stutt.Nürn-berg

Mün-chen

KölnKasselHanno-ver

Ham-burg

Frank-furt

BerlinBasel

Städte-Beispiel

Page 10: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Verfahren MDS

MDS - KonfigurationStädte-Beispiel

Page 11: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Verfahren MDS

MDS – Konfiguration nach Rotation und SpiegelungStädte-Beispiel

Page 12: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Anwendung Die MDS ist ein exploratives Verfahren und nicht zur strengen Hypothesenprüfung geeignet

Probleme

MDS

Verfahren MDS

• Auffinden der Konfiguration (relative Lage der Objekte zueinander im Wahrnehmungsraum, wenn nur die Distanzen bekannt sind• Bestimmung der Dimensionalität• Bestimmung der MetrikKommentar • Die Konfiguration ist unabhängig von Rotation und Spiegelung• Es finden fast nur nichtmetrische MDS Prozeduren Verwendung (Kruskal)

Page 13: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Ablauf 1. Messung von Ähnlichkeiten

MDS

Verfahren MDS

2. Wahl des Distanzmodells

3. Ermittlung der Konfiguration

4. Zahl und Interpretation der Dimensionen

5. Aggregation von Personen

Page 14: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Methoden

Rangreihe

Verfahren MDS - 1. Messung von Ähnlichkeiten

• Rangreihungsmethode• Ankerpunktmethode• Ratingverfahren

Es werden „n über 2“ Paare geordnet von „unähnlichstes Paar“ zu „ähnlichstes Paar“ (bei grossem n kaum möglich)

Ankerpunkt Jedes Objekt ist einmal Vergleichsobjekt (Anker) für alle anderen Objekte. Es werden soviele Rangreihen wie Objekte erstellt. Man erhält eine asymmetrische quadra-trische Distanzmatrix, die in eine symmetrische überführt werden kann.

Rating Man bildet ale möglichen Paare und lässt diese, randomisiert dargeboten, auf einer Ratingskala nach Ähnlichkeit bewerten.

Probleme: Ties (Rangbindungen), Reliabilität der Ränge

Page 15: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

EuklidischeMetrikp = 2

Verfahren MDS - 2. Distanzmodell

Objektdistanz

l

0.00 1.00 2.00 3.00 4.00

0.00

1.00

2.00

3.00

4.00

k

1

1

m pp

kl kv lvv

d x x=

æ ö÷ç= - ÷ç ÷ç ÷è øå

kld

a

b

1x

2x

1 1

2 2

1 4 3

3 2 1k l

k l

a x x

b x x

= - = - =-

= - = - =

2 23 1 10 3.16kld = + = =

Page 16: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Minkowski-Metriken

Verfahren MDS - 2. Distanzmodell

Wahlkriterium

p = 2 Euklidische Metrik: Abstand der Objekte ist die Länge der Verbindungslinie.City-Block Metrik: Abstand der Objekte ist die Summe der einzelnen Koordinatendistanzen

p = 1

Supremum Metrik: Abstand der Objekte ist die größte der auftretenden Koordinatendistanzen

p =

Metrik muss nach inhaltlichen Gesichtspunkten gewähltSein, Abstände werden in diesem Sinne interpretiert.

1

1

m pp

kl kv lvv

d x x=

æ ö÷ç= - ÷ç ÷ç ÷è øå

Page 17: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Konfigurationermitteln

Verfahren MDS - 3. Konfiguration ermitteln

p = 2

Ausgehend von den Unähnlichkeiten u ist ein möglichst niedrig dimensionierter Raum zu finden, in dem die Distanzen d möglichst der Monotoniebeziehung

genügen.

ShephardDiagramm

Wenn dann kl ij kl iju u d d> >

Shepard D iagram D istances d and D -H ats vs. D issimilarity u

0 1 2 3 4 5 6 7 8

D iss im ilarity u

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

1.8

2.0

2.2

2.4

2.6

Distances/D

-Hats

Page 18: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Konfigurationermitteln

Verfahren MDS - 3. Konfiguration ermitteln

Unähnlichkeiten u

Koordinaten x1, x2

645Butter412Becel3

3Homa2Rama1

BecelHomaRama

410Butter431Becel372Homa223Rama1x2x1

Start-Konfiguration

3; 2

2; 7

1; 3

10; 4

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8 9 10 11 12

X1

X2

Homa 2

Rama 1

Butter 4

Becel 3

669.181+1=823;4458.564+9=732;4124.11+16=172;3547.349+4=531;4212.24+1=51;3335.11+25=261;2

u(k,l)Rg[d(k,l)]d(kl)Objekte(k,l)2

kv lvx x-å

Page 19: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Konfigurationermitteln

Verfahren MDS - 3. Konfiguration ermitteln

Start-Konfiguration

Shephard - Diagramm

0123456789

10

0 1 2 3 4 5 6 7

Dissimilarity u(k,l)

d(k,l)

Distance d(k,l)

Disparity d(k,l)^

Abweichung von Distanz d und Disparität̂d

Gütemaß”Stress” ( )

2

,

ˆ

StressFaktor

kl klk l

d d-=

å

Page 20: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Konfigurationermitteln

Verfahren MDS - 3. Konfiguration ermitteln

IterativeOptimierung

Wahrnehmungsraum

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8 9 10 11 12

X1

X2

Homa 2

Rama 1

Butter 4

Becel 3

Alte Koordinaten

Neue Koordinaten^

Page 21: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Konfigurationermitteln

Verfahren MDS - 3. Konfiguration ermitteln

IterativeOptimierung

Wahrnehmungsraum

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8 9 10 11 12

X1

X2

Homa 2

Becel 3

Rama 1

Butter 4

Für jeden Iterationsschritt wird Stress bewertet. Iterationenso lange, bis Stress sich nicht mehr vermindert.(Stress ist Führungsfunktion für nichtlineare Optimierung.)

Gütemaß”Stress”

Neue Koordinaten

Shephard Diagramm

Stress berechnen

Page 22: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Verfahren MDS - 4. Dimensionen - Interpretation

• Je mehr Dimensionen, desto geringer wird Stress• Lösungen mit einer geringeren Anzahl von Dimensi- onen sind einfacher zu interpretieren• Stress darf nicht 0 werden (uneindeutige Lösung)

Regeln

Trade-Off

Trade-Off von Stress und Interpretierbarkeit

Anzahl

• An Interpretierbarkeit orientieren, ggf. Achsen rotieren• Stress soll niedrig sein – Anhaltswerte nach Kruskal• Die Daten sollen einen gewissen Verdichtungsgrad Q haben, Q soll möglichst groß sein (Tabelle)Durch Erhöhung der Anzahl der Dimensionen wird trivialerweise eine Repräsentierbarkeit erreicht. Gleichzeitig strebt aber die Datenver-dichtung gegen 1. Erhöhung der Anzahl der Objekte n führt zu besserer Verdichtung, aber auch zu schlechterer Urteilspräzision.

Page 23: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Verfahren MDS - 4. Dimensionen - Interpretation

Q - Tabelle

Trade-Off

Verdichtung Q

Trade-Off von hohem Q- Wert & niedrigem Stress-Wert

2 Anzahl der Ähnlichkeiten

Anzahl der Koordinaten

n

Qn m

æö÷ç ÷ç ÷ç ÷çè ø= =

×

23131.832.75121.672.5111.52.25101.33291.171.75811.57D = 3 D = 2n

Page 24: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Verfahren MDS - 4. Dimensionen - Interpretation

Stress-Güte

Richtwert

Stressmaße

Werte zwischen gut und ausgezeichnet ergeben einen relativ glatten Anstieg im Shephard Diagramm

( )2

,1 2

k,l

ˆ

SMkl kl

k l

kl

d d

d

-=

å

å

( )

( )

2

,2 2

k,l

ˆ

SMkl kl

k l

kl

d d

d d

-=

-

å

å

00perfekt0.150.025ausgezeichnet0.10.05gut0.20.1ausreichend0.40.2geringSM2 SM1Güte

Page 25: Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain.

Methoden derPsychologie

Verfahren MDS - 5. Aggregation

• Über die Ähnlichkeitsdaten wird aggregiert• Über die Konfigurationen wird aggregiert• Über spezielle Rechenverfahren werden MDS Analysen über die Ähnlichkeitsdaten mehrerer Personen (replicated MDS) durchgeführt

Diskussion

Anzahl Die MDS als klassisches Verfahren dient der Ermittlung der Konfiguration einer Person. Aggregationen werdendurchgeführt:

Vor-und Nachteile der Techniken abwägen