Einführung in Statistik und SPSS LVA Human Factors (SS 04) 23.03.2004 Mag. Katharina Mallich.

Post on 06-Apr-2015

107 views 0 download

Tags:

Transcript of Einführung in Statistik und SPSS LVA Human Factors (SS 04) 23.03.2004 Mag. Katharina Mallich.

Einführung in Einführung in Statistik und SPSS Statistik und SPSS

LVA Human Factors (SS 04)

23.03.2004

Mag. Katharina Mallich

23.03.2004 Einführung in Statistik und SPSS 2/ 33

Grundlegendes

• SPSS: Statistical Package for the Social Sciences• Programm zur statistischen Datenanalyse• hier verwendet: SPSS 10 (deutsch)• Einloggen an den Uni-PCs (z.B. im NIG)• Berechnungen auch im Excel möglich• Literatur:

– Ponocny-Seliger, E. & Ponocny, I. (2001). Statistik for You. Skriptum erhältlich im NIG-Shop.

– Bühl, A. & Zöfel, P. (2000). SPSS. Einführung in die moderne Datenanalyse unter Windows. München: Addison-Wesley.

23.03.2004 Einführung in Statistik und SPSS 3/ 33

Anlegen eines Datenfiles

Leere Datenmaske: Spalten (= Variablen)

und Zeilen (= Untersuchungspersonen)Spss.lnk

23.03.2004 Einführung in Statistik und SPSS 4/ 33

Anlegen eines Datenfiles

• für jede Variable muss ein Name und ein Typ definiert werden

• Name: Doppelklicken auf „var“ (man gelangt zur VariablenansichtVariablenansicht) und unter Name den Variablennamen eingeben, z.B. „fb_nr“ (max. 8 Zeichen, keine Sonderzeichen)

• Typ: handelt es sich um Zahlen („numerisch“), Wörter („string“) oder anderes?

23.03.2004 Einführung in Statistik und SPSS 5/ 33

Datenmaske: Variablenansicht

23.03.2004 Einführung in Statistik und SPSS 6/ 33

Datenmaske: Variablenansicht

• Wertelabels:z.B. Schulbildung

• Variablenlabel:Benennung der Variablen, z.B. Name „fb_nr“ Variablenlabel „Fragebogennummer“

• Dezimalstellen, Spaltenformat, ...

Daten eingeben (z.B. auf einer Skala von 1 bis 5)

23.03.2004 Einführung in Statistik und SPSS 7/ 33

Datenmaske: Datenansicht

Gruppe: z.B. 1 = Nutzung von sms

2 = keine Nutzung von sms

23.03.2004 Einführung in Statistik und SPSS 8/ 33

Speichern

• Datenfile speichern unter „Datei“ „Speichern unter“:daten.sav

• Berechungen speichern unter:output01.spo

• Syntax wird gespeichert unter:syntax01.sps

23.03.2004 Einführung in Statistik und SPSS 9/ 33

Erste Berechnungen und Hinweise

Datenmodifikation:• Berechnen einer neuen Variable

z.B. Mittelwert einer SkalaSPSS: unter „Transformieren“ „Berechnen“ anklicken, neue Zielvariable benennen, s.u.

• Umkodierenvon Variablen:SPSS: „Trans-formieren“ „Umkodieren“ „in andereVariablen“

23.03.2004 Einführung in Statistik und SPSS 10/ 33

DatenansichtDatenansicht

23.03.2004 Einführung in Statistik und SPSS 11/ 33

Erste Berechnungen und Hinweise

Datenselektion: Fälle auswählenwenn z.B. Unterschiede in der „Performance“ der Gesamtstichprobe auftreten und man wissen will, ob die Unterschiede auch „nur“ in der männlichen oder weiblichen Stichprobe vorhanden sind.

SPSS:„Daten“ „Fälle auswählen“ „Falls Bedingungzutrifft“ „Falls“... „weiter“ „ok“

23.03.2004 Einführung in Statistik und SPSS 12/ 33

Erste Berechnungen und Hinweise

Datenselektion: Fälle auswählen

Ausgewählt wurde „Geschlecht (sex) = 1 (männlich).

Nun erfolgen sämtliche Berechnungen nur für die Männer.

Will man wieder mit der Gesamtstichprobe rechnen:

SPSS: „Daten“ „Fälle auswählen“ „Alle Fälle“ „ok“

23.03.2004 Einführung in Statistik und SPSS 13/ 33

Voraussetzungen f. d. Anwendung statistischer Tests

Skalenniveau• Nominalskala: bestehenden Namen werden Messwerte

zugeordnet, keine Rangfolge, nicht vergleichbar, z.B. Geschlecht (männlich = 1, weiblich = 2), Schulbildung, ...

• Ordinal-/ Rangskala: Information über eine Rangordnung ist gegeben, d.h. je größer ein Wert desto ausgeprägter die Eigenschaft, z.B. Rauchverhalten (1 = Nicht-Raucher, 2 = mäßiger Raucher, 3 = starker Raucher), Windstärke, ...

• Intervallskala: neben Ranginformation auch Informationen über Messwertdifferenzen, gleiche numerische Differenzen bedeuten gleiche inhaltliche Differenzen, z.B. Reaktionszeiten, Testscores, Temperatur, ...

• Verhältnisskala: die Messwerte erlauben Verhältnisangaben (A ist doppelt so groß wie B), z.B. Längenangaben, Gewicht, ...

23.03.2004 Einführung in Statistik und SPSS 14/ 33

Voraussetzungen f. d. Anwendung statistischer Tests

Normalverteilung (bei intervallskalierten Variablen):

macht Aussagen über die Verteilung der Messwerte, z.B. symmetrisch, links-,rechtsschief, bimodal, etc.

SPSS: „Grafiken“ „Histogramm“ „Normalverteilungskurve“

bzw. Kolmogorov-Smirnof-Test:

„Analysieren“ „Nichtparametrische

Tests“ „K-S bei einer Stichprobe“

Testverteilung „normal“.

Ergebnis: Asymptotische Signifikanz (2-seitig) muss > .05 sein.

23.03.2004 Einführung in Statistik und SPSS 15/ 33

Voraussetzungen f. d. Anwendung statistischer Tests

Abhängigkeit bzw. Unabhängigkeit von Stichproben:

• abhängig (gepaart):wenn jedem Wert der einen Stichprobe eindeutig und sinnvoll ein Wert einer anderen Stichprobe zugeordnet werden kann, z.B. Messung zu mehreren Zeitpunkten (Computerkenntnisse vor und nach einer Schulung)

• unabhängig:wenn keine Zuordnungen möglich sind, z.B. einmalige Testung mehrerer Versuchspersonen (Vp)

23.03.2004 Einführung in Statistik und SPSS 16/ 33

Intervallskalierte, normalverteilte Variablen

Ordinalskalierte oder nicht normalverteilte intervallskalierte Variablen

Übersicht über gängige Mittelwertstests

Anzahl d. Stichpr.

Abhängigkeit (parametrischer) Test

2 unabhängig t-Test

2 abhängig t-Test für abhängige Stichproben

> 2 unabhängig einfache Varianzanalyse

> 2 abhängig einfache Varianzanalyse mit Messwiederholungen

Anzahl d. Stichpr.

Abhängigkeit (nicht parametrischer) Test

2 unabhängig U-Test (Man-Whitney)

2 abhängig Wilkoxon-Test

> 2 unabhängig H-Test (Kruskal-Wallis)

> 2 abhängig Friedman-Test

23.03.2004 Einführung in Statistik und SPSS 17/ 33

Deskriptivstatistiken

• dienen der beschreibenden Darstellung der Variablen• z.B. Häufigkeitstabellen, statische Kennwerte (M, SD, ...),

grafische Darstellungen, Kreuztabellen (bei > 2 Variablen)• SPSS: „Analysieren“ „Deskriptive Statistiken“

„Häufigkeiten“: ...

23.03.2004 Einführung in Statistik und SPSS 18/ 33

Analytische Statistik

• Signifikanztests: dienen der Untersuchung, ob signifikante Unterschiede zwischen 2 Stichproben/ Gruppen/Messzeit-punkten/ etc. bestehen.

• Wann ist ein Unterschied signifikant?Wenn die Irrtumswahrscheinlichkeit p ≤ .05 ist.p > .05 nicht signifikant p ≤ .05 signifikantp ≤ .01 hoch signifikant p ≤ .001 höchst signifikant

• Hypothesen können ein- oder zweiseitig formuliert sein:einseitig: Junge Vpn erreichen eine höhere Performance als ältere.

• zweiseitig: Es bestehen Unterschiede in der Performance zwischen jungen und alten Vpn.

23.03.2004 Einführung in Statistik und SPSS 19/ 33

Analytische Statistik - Mittelwertvergleiche

VARIANZANALYSEN:– einfaktoriell: eine uV, mehrere aVs

– univariat: mehrere uVs, eine aV

– multivariat: mehrere uVs, mehrere aVs

– mit Messwiederholungen: mehrere Messzeitpunkte ...

Übungsbeispiel - Univariate Varianzanalyse:

Untersucht wird der Einfluss von Alter (uV) und Geschlecht (uV) auf den Ausgangswert M1 eines Merkfähigkeitstests (aV).

SPSS: „Analysieren“ „Allgemeines Lineares Modell“ „Univariat“

23.03.2004 Einführung in Statistik und SPSS 20/ 33

Analytische Statistik - Mittelwertvergleiche

23.03.2004 Einführung in Statistik und SPSS 21/ 33

Analytische Statistik - Mittelwertvergleiche

M1 eintragen als abhängige Variable, Alter und Geschlecht als uVs (Faktoren).

Unter „Optionen“:

23.03.2004 Einführung in Statistik und SPSS 22/ 33

Analytische Statistik - Mittelwertvergleiche

Nach dem Start

der Berechnungen

erscheint der Output.

hier: Deskriptives.

23.03.2004 Einführung in Statistik und SPSS 23/ 33

Analytische Statistik - Mittelwertvergleiche

Output: Prüfung auf Signifikanz

Ergebnis: Es besteht ein höchst signifikanter Einfluss des Alters auf die Merkleistung: F2,21 = 29.80, p ≤ .001.

Keinen Effekt

üben Geschlecht

F1,21 = .10, p = .76

und die Wechsel-

wirkung Alter *

Geschlecht

F2,21 = .51, p = .61

auf M1 aus.

23.03.2004 Einführung in Statistik und SPSS 24/ 33

Analytische Statistik - Mittelwertvergleiche

Die „geschätztenRandmittel“ helfen

bei der Interpretation!

• Geschlecht: keinenennenswerten Mittel-wertunterschiede, daja nicht signifikant.

• Alter: Je älter dieProbanden sind, desto geringer ihre Werte bei der Merkfähigkeit. Besonders wenig Punkte erreichten die über 50-Jährigen. Das Alter spielt somit eine entscheidende Rolle bei der Merkfähigkeit!

23.03.2004 Einführung in Statistik und SPSS 25/ 33

Analytische Statistik - Mittelwertvergleiche

Übungsbeispiel -

univariate ANOVA mit Messwiederholungen:

Untersucht wird, ob im Laufe von 4 Testzeitpunkten (uV, MH-Faktoren) Veränderungen im Merkfähigkeitstest (aV) auftreten.

SPSS: „Analysieren“ „Allgemeines Lineares Modell“ „Messwiederholungen“.

Es erscheint ein Fenster,

in dem man die Faktoren

definieren kann:

„hinzufügen“

23.03.2004 Einführung in Statistik und SPSS 26/ 33

Analytische Statistik - Mittelwertvergleiche

Die 4 MW-Variablen ins Feld „Innersubjektfaktoren“ klicken, Alter und Geschlecht zu den Zwischensubjektfaktoren (uVs).

23.03.2004 Einführung in Statistik und SPSS 27/ 33

Analytische Statistik - Mittelwertvergleiche

Unter „Optionen“:

Es können auch Post-Hoc-

Tests (z.B. Bonferroni)

durchgeführt werden.

danach:

Starten

der Berechnungen

23.03.2004 Einführung in Statistik und SPSS 28/ 33

Analytische Statistik - Mittelwertvergleiche

Output:

• Deskriptive Statistiken(wie bei univariater ANOVA) sowie füralle Messzeitpunktegetrennt nach Alterund Geschlecht:

• Signifikanzprüfung:siehe „multivariateTests“ (nächste Folie)

23.03.2004 Einführung in Statistik und SPSS 29/ 33

Analytische Statistik - Mittelwertvergleiche

23.03.2004 Einführung in Statistik und SPSS 30/ 33

Analytische Statistik - Mittelwertvergleiche

Ergebnis:Pillai Spur betrachten

Der Faktor ZEIT hat einen höchst signifikanten Einfluss auf die Merkfähigkeit (F3,19 = 133.37, p ≤ .001).

Wechselwirkungen der ZEIT mit Alter (F6,40 = 1.15, p = .36)

oder Geschlecht der Vpn (F3,19 = .75, p = .54) bestehen

keine.

Die „Tests der

Zwischensubjekt-

effekte“ zeigen

mögliche Haupteffekte auf (hier: wie vorhin das Alter).

23.03.2004 Einführung in Statistik und SPSS 31/ 33

Analytische Statistik - Mittelwertvergleiche

Die „geschätzten Randmittel“ verdeutlichen einen Anstieg der Merkfähigkeit zu jedem der 4 Testzeitpunkte. Die besten Ergebnisse werden beim 4. Zeitpunkt erreicht.

Möglicherweise findet eine

Schulung statt, auf welche

diese Unterschiede zurück-

zuführen sind.

23.03.2004 Einführung in Statistik und SPSS 32/ 33

Analytische Statistik - Zusammenhänge

Neben Mittelwertsvergleichen können auch Zusammen-hänge untersucht werden.

• Korrelationen: z.B. Besteht ein Zusammenhang zwischen der PC-Nutzung und Rückenschmerzen?SPSS: „Analysieren“ „Korrelation“ „Bivariat“Die Stärke eines Zusammenhang sagt aber nichts über die Kausalität aus!!

• Regressionsanalyse: soll die Art eines Zusammenhang aufdecken, es soll eine aV aus den Werten einer/ mehrerer uVs vorhergesagt werden SPSS: „Analysieren“ „Regression“ „Linear“

23.03.2004 Einführung in Statistik und SPSS 33/ 33

Analytische Statistik - Hinweis

• Bei t-Tests und Regressionsanalysen heißen die Prüfgrößen „t“ (nicht „F“ wie bei den ANOVAs). Auch hierbei muss wieder geschaut werden, ob „t“ signifikant ist („Sig.“ oder „Signifikanz“).

• Neben den bisherigen Analysen gibt es noch eine Menge weiterer komplexer statistischer Verfahren wie Diskriminanz-, Faktoren- oder Clusteranalysen und verschiedene Zusatzmodule.

Viel Erfolg bei Euren AuswertungenViel Erfolg bei Euren Auswertungen !!! !!!