B0 analisis multivariado ii

59
Análisis multivariante Modesto Escobar

Transcript of B0 analisis multivariado ii

Page 1: B0   analisis multivariado ii

Análisis multivariante

Modesto Escobar

Page 2: B0   analisis multivariado ii

©RMEM

Introducción

• Variable y caso• Estudios de una variable: descripción• Estudios con dos variables: comparación y asociación• Estudios con más de dos variables:

• Asociación

• Control

• Interacción

• Factorización

• Representación espacial

• Distancia

• Clasificación

Page 3: B0   analisis multivariado ii

©RMEM

Asociación

Dos variables se consideran asociadas cuando existe variación conjunta de sus valores.

Page 4: B0   analisis multivariado ii

©RMEM

Variación conjunta de valores

PNB per cápita. 1995. PPA

400003000020000100000

Esp

era

nza

de

vid

a a

l na

ce

r (a

ño

s) 1

99

5/

80

75

70

65

Suecia

Rus ia

Rep ública Checa

Portugal

Luxemburgo

Islandia

Grecia

Georgia

ESPAÑA

Dinamarca

+

+

Page 5: B0   analisis multivariado ii

©RMEM

Matriz de correlaciones

Correlaciones

,106

,212 ,349

-,136 ,289 ,321

,474 ,121 ,090 ,923**

,130 ,054 ,662** ,116 -,027

-,331 -,225 -,854** -,906** -,025

,003 ,354 ,520** ,848** ,764** ,398* -,740**

1) Población x1000

2) Habitantes por Km2

3) Habitantes en ciudades (%)

4) Esperanza de vida femenina

5 )Esperanza de vida masculina

6) Alfabetización (%)

7) Mortalidad infantil (muertes por 1000 nacimientos vivos)

8) Producto interior bruto per-capita

(1) (2) (3) (4) (5) (6) (7) (8)

La correlación es significat iva al n ivel 0 ,01 (bi lateral ).**.

La correlación es signi ficante al nivel 0,05 (bi lateral ).*.

Page 6: B0   analisis multivariado ii

©RMEM

Control

• Consiste en mantener constantes los valores de una tercera variable que pudieran estar deformando las relaciones entre otras dos variables.

Page 7: B0   analisis multivariado ii

©RMEM

Correlaciones parciales

- - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - -

Controlling for.. PIB_CAP

POBLAC DENSIDAD URBANA ESPVIDAF ESPVIDAM ALFABET MORTINF

POBLAC 1,0000 ,1211 ,2526 -,2610 -,3192 ,1450 ,4896

DENSIDAD ,1211 1,0000 ,2008 -,0213 ,1054 -,1063 ,0910

URBANA ,2526 ,2008 1,0000 -,2612 -,2403 ,5808 ,2950

ESPVIDAF -,2610 -,0213 -,2612 1,0000 ,8039 -,4507 ,6494

ESPVIDAM -,3192 ,1054 -,2403 ,8039 1,0000 -,5546 ,8089

ALFABET ,1450 -,1063 ,5808 -,4507 -,5546 1,0000 ,4548

MORTINF ,4896 -,0910 ,2950 -,6494 -,8089 ,4548 1,0000

Page 8: B0   analisis multivariado ii

©RMEM

Interacción

• Hay interacción cuando la asociación entre dos variables depende de los valores de una tercera.

Page 9: B0   analisis multivariado ii

©RMEM

Representación de la interacción

Coeficiente intelectual

Nivel de estudios

Clase social

Page 10: B0   analisis multivariado ii

©RMEM

Factorización

• Consiste en la creación de una(s) nueva(s) variable(s) en función de una combinación lineal de otras variables.

Page 11: B0   analisis multivariado ii

©RMEM

Factorización

...

6265254243232221212

6165154143132121111

XaXaXaXaXaXaZ

XaXaXaXaXaXaZ

+++++=

+++++=

Page 12: B0   analisis multivariado ii

©RMEM

Representación espacial

• Expresión de las variables en un conjunto reducido de dimensiones con el fin de comprender la pauta de distribución de una serie de datos.

Page 13: B0   analisis multivariado ii

©RMEM

Representación espacial de variables

Gráfico de saturaciones en espacio factorial rotado

intere s por lo que hFactor 2

intere s por lo que d

,81,0

intere s por lo que h

-,2

0,0

ir a un mitin

intere s por lo que h,2

,6,8

,4intere s cuestiones i

inter es activ idad si

ir a reun. polit. o

,6

,8

1,0

,4,6

votar en elecciones

Factor 3Factor 1

firma r una petic ion

,2,4

intere s por lo que o

ir a manifestacion

0,0,2

i r a una huelga

Page 14: B0   analisis multivariado ii

©RMEM

Distancia

• Medida de cuán semejantes puedan ser dos individuos en un conjunto de variables.

Page 15: B0   analisis multivariado ii

©RMEM

Representación geométrica de la distancia

0

1

2

3

4

5

6

7

8

9

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Variable 1

Var

iab

le 2

Caso Y

∑=

−I

iii YX

1

)( Caso X

11 YX −

22 YX −

222

211 )()( YXYX −+−

Page 16: B0   analisis multivariado ii

©RMEM

Clasificación

• Técnica de agrupación de objetos homogéneos. Puede aplicarse tanto a las variables como a los casos.

Page 17: B0   analisis multivariado ii

©RMEM

Conglomerados* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

B2 7 -+ B3 8 -+-----+ A3 3 -+ +-------+ B4 9 -------+ +---------------------------------+ A1 1 -+---+ I I B1 6 -+ +---------+ I A2 2 -----+ I A4 4 -+-------+ I A5 5 -+ +---------------------------------------+ B5 10 ---------+

Page 18: B0   analisis multivariado ii

©RMEM

Clasificación de los análisis multivariantes

• Payne y 0’Muircheartaigh• Sánchez Carrión• Castelló i Vila• Martínez Arias

Page 19: B0   analisis multivariado ii

©RMEM

Payne y 0’Muircheartaigh

• Búsqueda de estructuras• Descubrimiento de regularidades en los datos.

• Ajuste de modelos• Prueba de que un determinada relación hipotética

se ajusta a los datos.

Page 20: B0   analisis multivariado ii

©RMEM

Sánchez Carrión

• Ajuste de modelos

• Búsqueda de estructuras• Técnicas de reducción• Técnicas de agrupaciones

Page 21: B0   analisis multivariado ii

©RMEM

Castelló y Vila

• Modelos de dependencia• Modelos de independencia

• Semejanza entre variables• Semejanza entre casos• Semejanza entre objetos

Page 22: B0   analisis multivariado ii

©RMEM

Martínez Arias

• Medidas de dependencia• Número y tipo de variables dependientes• Número y tipo de variables independientes

• Medidas de interdependencia• Número de variables• Tipo de variables

Page 23: B0   analisis multivariado ii

©RMEM

Métodos de dependencia

• Regresión lineal (1 cuant./p cuant.)• Análisis de varianza (p cuant./1 ó más cual./cuant.)• Análisis discriminante (1cual./p cuant.)• Correlaciones canónicas (p cuant./q cuant.)• AID (1 cuant./p cual.)• CHAID (1 cual./p cual.)• Regresión logística/Probit (1 dicot/p cuant.)• Kaplan-Meier/Cox (1 tiempo/0 ó p cuant.)

Page 24: B0   analisis multivariado ii

©RMEM

Métodos de interdependencia

• Análisis de conglomerados (Cuant.)• Escalamiento multidimensional (Ord./Cuant.)• Análisis factorial (Cuant.)• Modelos lineales-logarítmicos (Cual.)• Análisis de correspondencias (Cual.)

Page 25: B0   analisis multivariado ii

©RMEM

Modelos de relación entre tres variables

• Correlación espuria• Intervención.• Multicausalidad• Aparente no correlación• Confirmación

Page 26: B0   analisis multivariado ii

©RMEM

Correlación espuria

Edad (VC)

A. Liberal (VD)Estado civil (VI)

Page 27: B0   analisis multivariado ii

©RMEM

Condiciones de la espuriedad

• Existe relación bivariada.• Al controlar desaparece en cada una de las

condiciones de la variable de control.• La variable independiente es consecuencia

de la de control

Page 28: B0   analisis multivariado ii

©RMEM

Ejemplo de espuriedad (I)Tabla de contingencia Posición ante el aborto * Estado civil

% de Estado civil

24,1% 18,8% 12,1% 19,5%

70,4% 76,5% 79,8% 75,3%

5,5% 4,7% 8,1% 5,3%

100,0% 100,0% 100,0% 100,0%

No

NC

Posición ante el aborto

Total

Soltero Casado Viudo

Estado civil

Total

Pruebas de chi-cuadrado

10,856 4 ,028

.067

Chi-cuadrado de Pearson

V de Cramer

Valor glSig. asintótica

(bilateral)

Page 29: B0   analisis multivariado ii

©RMEM

Ejemplo de espuriedad (II)

Pruebas de chi-cuadrado

1,429 4 ,839

,033

5,974 4 ,201

,074

Chi-cuadrado de Pearson

V. de Cramer

Chi-cuadrado de Pearson

V. de Cramer

EDAD

<=45

>45

Valor glSig. asintótica

(bilateral)

Tabla de contingencia Posición ante el aborto * Estado civil * EDAD

% de Estado civil

27,1% 25,0% 28,6% 6,7% 13,2% 8,7%

66,9% 70,6% 66,7% 91,1% 81,8% 82,5%

6,0% 4,4% 4,8% 2,2% 5,0% 8,7%

100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

No

NC

Posición anteel aborto

Total

Soltero Casado Viudo

Estado civil

Soltero Casado Viudo

Estado civil

<=45 >45

EDAD

Page 30: B0   analisis multivariado ii

©RMEM

Ejemplo de espuriedad (III)

Edad

Opinión sobre abortoEstado civil

Page 31: B0   analisis multivariado ii

©RMEM

Ejemplo de espuriedad (III)

Page 32: B0   analisis multivariado ii

©RMEM

Intervención

Práctica religiosa

Opinión ante el abortoGénero

Page 33: B0   analisis multivariado ii

©RMEM

Ejemplo de intervención (I)

Pruebas de chi-cuadrado

9,446 2 ,009

,09

Chi-cuadrado de Pearson

V de Cramer

Valor glSig. asintótica

(bilateral)

Tabla de contingencia Posición ante el aborto * SEXO

% de SEXO

23,3% 16,2% 19,6%

71,7% 78,3% 75,1%

5,0% 5,5% 5,3%

100,0% 100,0% 100,0%

No

NC

Posición ante el aborto

Total

Varón Mujer

SEXO

Total

Page 34: B0   analisis multivariado ii

©RMEM

Ejemplo de intervención (II.a)Tabla de contingencia Posición ante el aborto * SEXO * Práctica religiosa

% de SEXO

39,1% 33,6% 36,8%

60,9% 66,4% 63,2%

100,0% 100,0% 100,0%

15,0% 13,4% 14,1%

85,0% 86,6% 85,9%

100,0% 100,0% 100,0%

11,8% 3,8% 5,7%

88,2% 96,2% 94,3%

100,0% 100,0% 100,0%

No

Posición anteel aborto

Total

No

Posición anteel aborto

Total

No

Posición anteel aborto

Total

Práctica religiosa

No practicante

Practicante

Muy practicante

Varón Mujer

SEXO

Total

Page 35: B0   analisis multivariado ii

©RMEM

Ejemplo de intervención (II.b)

Pruebas de chi-cuadrado

,880 1 ,348

,06

,320 1 ,572

,02

3,051 1 ,081

,14

Chi-cuadrado de Pearson

V de Cramer

Chi-cuadrado de Pearson

V de Cramer

Chi-cuadrado de Pearson

V de Cramer

Práctica religiosa

Nada practicante

Practicante

Muy practicante

Valor glSig. asintótica

(bilateral)

Page 36: B0   analisis multivariado ii

©RMEM

Ejemplo de intervención (III)

Práctica religiosa

Posición ante abortoSexo

Page 37: B0   analisis multivariado ii

©RMEM

Condiciones de la intervención

• Existe relación bivariada.• Al controlar desaparece en cada una de las

condiciones de la variable de control.• La variable independiente influye en la de

control

Page 38: B0   analisis multivariado ii

©RMEM

Multicausalidad

Afición a salir

Asistencia al cineAfición al cine

Page 39: B0   analisis multivariado ii

©RMEM

Condiciones de la multicausalidad

• No existe relación entre la variable independiente y la de control

• Existe originalmente asociación entre independiente y dependiente.

• Al menos una de las asociaciones condicionadas es superior a la bivariada.

Page 40: B0   analisis multivariado ii

©RMEM

Ejemplo de multicausalidad (I)Tabla de contingencia Asistencia al cine * Afición al cine

% de Afición al cine

72,5% 32,5% 52,5%

27,5% 67,5% 47,5%

100,0% 100,0% 100,0%

No

Asistenciaal cine

Total

Sí No

Afición al cine

Total

Pruebas de chi-cuadrado

128,321 1 ,000

,40

Chi-cuadrado de Pearson

V de Cramer

Valor glSig. asintótica

(bilateral)

Page 41: B0   analisis multivariado ii

©RMEM

Ejemplo de multicausalidad (II)Tabla de contingencia Afición al cine * Afición a salir

% de Afición a salir

50,0% 50,0% 50,0%

50,0% 50,0% 50,0%

100,0% 100,0% 100,0%

No

Aficiónal cine

Total

Sí No

Afición a salir

Total

Pruebas de chi-cuadrado

,000 1 1,000

,00

Chi-cuadrado de Pearson

V de Cramer

Valor glSig. asintótica

(bilateral)

Page 42: B0   analisis multivariado ii

©RMEM

Ejemplo de multicausalidad (III)Tabla de contingencia Asistencia al cine * Afición al cine * Afición a salir

% de Afición al cine

80,0% 40,0% 50,0% 10,0%

20,0% 60,0% 50,0% 90,0%

100,0% 100,0% 100,0% 100,0%

No

Asistencia al cine

Total

Sí No

Afición al cine

Sí No

Afición al cine

Sí No

Afición a salir

Pruebas de chi-cuadrado

100,000 1 ,000

,41

38,095 1 ,000

,44

Chi-cuadrado de Pearson

V de Cramer

Chi-cuadrado de Pearson

V de Cramer

Afición a salir

No

Valor glSig. asintótica

(bilateral)

Page 43: B0   analisis multivariado ii

©RMEM

Aparente no correlación

Asociado

Asociado a A. sindicalAsociado a A. religiosa

Page 44: B0   analisis multivariado ii

©RMEM

Condiciones de la aparente no corr.

• No existe originalmente asociación entre independiente y dependiente.

• Cuando se controla por la tercera variable, al menos una de las asociaciones condicionadas es significativa.

Page 45: B0   analisis multivariado ii

©RMEM

Ej. Aparente no correlación (I)

Pruebas de chi-cuadrado

,011 1 ,917

,00

Chi-cuadrado de Pearson

V de Cramer

Valor glSig. asintótica

(bilateral)

Tabla de contingencia: Sindical*Religiosa

% de Una asociaci¢n religiosa o parroquial

7,6% 7,2% 7,3%

92,4% 92,8% 92,7%

100,0% 100,0% 100,0%

No

Sindical

Total

Sí No

Religiosa

Total

Page 46: B0   analisis multivariado ii

©RMEM

Ej. Aparente no correlación (II)

Pruebas de chi-cuadrado

,

5,564 1 ,018

,11

Chi-cuadrado de Pearson

Chi-cuadrado de Pearson

V de Cramer

ASOCIADO

No

Valor gl Sig. asintótica

Tabla de contingencia: Sindical* Religiosa* ASOCIADO

% de Una asociaci¢n religiosa o parroquial

7,6% 19,6%

100,0% 92,4% 80,4%

100,0% 100,0% 100,0%

No

Sindical

Total

No

Religiosa

Sí No

Religiosa

No Sí

ASOCIADO

Page 47: B0   analisis multivariado ii

©RMEM

Confirmación

Diversas

VotoClase

Page 48: B0   analisis multivariado ii

©RMEM

Condiciones de la confirmación

• Las asociaciones condicionadas son significativamente mayores que cero.

• Ninguna de ellas es mayor que la correlación originaria.

Page 49: B0   analisis multivariado ii

©RMEM

La tabla original de dos dimensiones

Tabla de contingencia DIPLOMA * S EXO

369 698 1067

81.3% 67.6% 71.8%

85 335 420

18.7% 32.4% 28.2%

454 1033 1487

100.0% 100.0% 100.0%

Recuento

% de SEXO

Recuento

% de SEXO

Recuento

% de SEXO

Licen

Dip l.

DIPLOMA

Total

Varón Mujer

SEXO

Total

Page 50: B0   analisis multivariado ii

©RMEM

Prueba de significación

Pruebas de chi-cuadrado

29.239 1 .000Chi-cuadrado de Pearson

Valor glSig. asint .(bilateral)

Medidas simétricas

.140 .000

.140 .000

1487

Phi

V de Cramer

Nominal pornominal

N de casos válidos

ValorSig.

aproximada

Page 51: B0   analisis multivariado ii

©RMEM

La tabla de tres dimensionesTabla de contingencia DIPLOMA * SEXO * Residencia

314 604 918

80.3% 67.0% 71.1%

77 297 374

19.7% 33.0% 28.9%

391 901 1292

100.0% 100.0% 100.0%

30 46 76

85.7% 64.8% 71.7%

5 25 30

14.3% 35.2% 28.3%

35 71 106

100.0% 100.0% 100.0%

Recuento

% de SEXO

Recuento

% de SEXO

Recuento

% de SEXO

Recuento

% de SEXO

Recuento

% de SEXO

Recuento

% de SEXO

Licen

Dipl.

DIPLOMA

Total

Licen

Dipl.

DIPLOMA

Total

Residencia

Salamanca

Resto

Varón Mujer

SEXO

Total

Page 52: B0   analisis multivariado ii

©RMEM

La tabla de tres dimensiones (I)

Tabla de contingencia DIPLOMA * SEXO * Residencia

314 604 918

80.3% 67.0% 71.1%

77 297 374

19.7% 33.0% 28.9%

391 901 1292

100.0% 100.0% 100.0%

Recuento

% de SEXO

Recuento

% de SEXO

Recuento

% de SEXO

Licen

Dip l.

DIPLOMA

Total

Residencia

Salamanca

Varón Mujer

SEXO

Total

Page 53: B0   analisis multivariado ii

©RMEM

La tabla de tres dimensiones (II)

Tabla de contingencia DIPLOMA * SEXO * Residencia

30 46 76

85.7% 64.8% 71.7%

5 25 30

14.3% 35.2% 28.3%

35 71 106

100.0% 100.0% 100.0%

Recuento

% de SEXO

Recuento

% de SEXO

Recuento

% de SEXO

Licen

Dipl.

DIPLOMA

Total

Residencia

Resto

Varón Mujer

SEXO

Total

Page 54: B0   analisis multivariado ii

©RMEM

Significación de dos tablasPruebas de chi-cuadrado

23.346 1 .000

5.059 1 .025

Chi-cuadrado de Pearson

Chi-cuadrado de Pearson

Residencia

Salamanca

Resto

Valor glSig. asint .(bilateral)

Medidas simétricas

.134 .000

.134 .000

1292

.218 .025

.218 .025

106

Phi

V de Cramer

Nominal pornominal

N de casos válidos

Phi

V de Cramer

Nominal pornominal

N de casos válidos

Residencia

Salamanca

Resto

ValorSig.

aproximada

Page 55: B0   analisis multivariado ii

©RMEM

Otro ejemplo (Act. Empresa)

Tabla de contingencia Actitud ante la empresa * S alud mental

% de Salud mental

52,9% 30,8% 39,5%

47,1% 69,2% 60,5%

100,0% 100,0% 100,0%

Negativa

Positiva

Actitud antela empresa

Total

Mala Buena

Salud mental

Total

Pruebas de chi-cuadrado

105,693 1 ,000

2150

Chi-cuadrado de Pearson

N de casos válidos

Valor glSig. asint .(bilateral)

Page 56: B0   analisis multivariado ii

©RMEM

Otro ejemplo (Espuria)

Tabla de contingencia Acti tud ante la empresa * S alud mental * Satisfacciónlaboral

% de Salud mental

66,7% 66,7% 66,7%

33,3% 33,3% 33,3%

100,0% 100,0% 100,0%

20,0% 20,0% 20,0%

80,0% 80,0% 80,0%

100,0% 100,0% 100,0%

Negativa

Positiva

Actitud antela empresa

T otal

Negativa

Positiva

Actitud antela empresa

T otal

Satisfacción laboral

Mala

Buena

Mala Buena

Salud mental

Total

Page 57: B0   analisis multivariado ii

©RMEM

Significación

Pruebas de chi -cuadrado

,000 1 1,000

900

,000 1 1,000

1250

Chi-cuadrado de Pearson

N de casos válidos

Chi-cuadrado de Pearson

N de casos válidos

Satisfacción laboral

Mala

Buena

Valor glSig. asint.(bilateral)

Page 58: B0   analisis multivariado ii

©RMEM

Relaciones causales

Educación padre

Clase del hijoClase del padre

Educación del hijo

Page 59: B0   analisis multivariado ii

©RMEM

Descomposición de las relaciones

• Causales• Directas• Indirectas

• Espurias