Varianza, Desviaci on, Covarianza, Correlaci...

30
Varianza, Desviaci´on, Covarianza, Correlaci´ on Miguel Raggi Mar´ ıa Luisa P´ erez [email protected] [email protected] Probabilidad y Estad´ ıstica Escuela Nacional de Estudios Superiores UNAM 20 de abril de 2020 Miguel Raggi Mar´ ıa Luisa P´ erez [email protected] Escue Varianza,Desviaci´on,Covarianza,Correlaci´on 20 de abril de 2020 1/1

Transcript of Varianza, Desviaci on, Covarianza, Correlaci...

Page 1: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Varianza, Desviacion, Covarianza, Correlacion

Miguel Raggi Marıa Luisa [email protected] [email protected]

Probabilidad y EstadısticaEscuela Nacional de Estudios Superiores

UNAM

20 de abril de 2020

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 1 / 1

Page 2: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Indice:

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 2 / 1

Page 3: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Midiendo que tan “esparcidos” estan los datos

Supongamos que tenemos una variable aleatoria X : Ω→ R.

Ya calculamos su promedio.

Pero no es lo mismo que las calificaciones de un grupo de alumnossean todas de 5 a que la mitad de los alumnos tengan 10 decalificacion y la otra mitad tengan 0.

La varianza es una medida de que tan “lejos del promedio” estan losdatos.

¿Como medimos eso?

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 3 / 1

Page 4: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Varianza: Introduccion

Queremos medir que tanto se alejan los valores que toma X de supropio promedio.

Digamos que su promedio (esperanza) se llama µ := E(X).

¿Que expresion mide la distancia entre dos numeros reales?

Consideramos X − µ. ¿Que es eso?

Vamos a querer finalmente tomar algo como “el promedio delalejamiento”

P: ¿Cuanto vale E(X − µ)?

R: Pues 0, claro, porque E(X − µ) = E(X)− E(µ) = µ− µ = 0.

Pero entonces algo tenemos que hacer con X − µ para que no secancelen los positivos con los negativos.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 4 / 1

Page 5: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Varianza

En vez de tomar X − µ, tomamos (X − µ)2.

(X − µ)2 es una variable aleatoria que en cada punto ω de Ω mide“cuanto se aleja X(ω) del promedio µ”.

Queremos un numero que represente “en total, cuanto se aleja X”:

Tomamos el promedio de (X − µ)2.

La varianza o segundo momento de una variable aleatoria X : Ω→ Rse define como

Var(X) := E((X − µ)2).

donde µ = E(X).

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 5 / 1

Page 6: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Ejemplo

Ejemplo. Determinar la varianza de las siguientes calificaciones de ungrupo de alumnos en los siguientes casos:

Si todos tienen 5 de calificacion.

Solucion. Es 0.

Si la mitad tiene 10 y la otra mitad tiene 0.

Solucion. 12 (10− 5)2 + 1

2 (0− 5)2 = 25.

Si la mitad de las calificaciones es de 6 y la otra mitad es 4.

Solucion. 12 (6− 5)2 + 1

2 (4− 5)2 = 1.

Cuando la mitad de las calificaciones es de 7 y la otra mitad es de 3.

Solucion. 12 (7− 5)2 + 1

2 (3− 5)2 = 4.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 6 / 1

Page 7: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Ejemplo

Ejemplo. Supongamos que Ω = a, b, c, que P (a) = 12 , P (b) = 1

3 yP (c) = 1

6 , y que X es una variable aleatoria definida en Ω porX(a) = 3, X(b) = 4 y X(c) = 7.

¿Cuanto vale el promedio de X?

E(X) = 3 · 12 + 4 · 13 + 7 · 16 = 32 + 4

3 + 76 = 4.

¿Cuanto vale Y = X − µ?

Y (a) = X(a)− µ = 3− 4 = −1, Y (b) = 0 y Y (c) = 3.

¿Cuanto vale E(Y )?

−1 · 12 + 0 · 13 + 3 · 16 = −12 + 0

3 + 36 = 0.

¿Cuanto vale la varianza de X?

Lo que queremos es E(Y 2).Y 2(a) = (−1)2 = 1, Y 2(b) = 0 y Y 2(c) = 9.V ar(X) = E((X − µ)2) = 1

2 (−1)2 + 130 + 1

632 = 2

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 7 / 1

Page 8: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Propiedades de la Varianza

Propiedad

Si X es una variable aleatoria, entonces

Var(X) = E(X2)− E(X)2.

En otras palabras, la varianza es la diferencia entre el promedio delcuadrado de la variable y el promedio de la variable, al cuadrado.

Demostracion: Sea µ = E(X).

Var(X) = E((X − µ)2)

= E(X2 − 2Xµ+ µ2)

= E(X2)− 2µ2 + µ2

= E(X2)− µ2.

Usualmente es mas sencillo utilizar esta forma de calcular la varianza.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 8 / 1

Page 9: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Propiedades

P: Si c es una constante, ¿cuanto vale Var(cX) en terminos deVar(X)?

R: Pues c2Var(X):

Var(cX) = E((cX)2)− (E(cX))2

= E(c2X2)− (cE(X))2

= c2(E(X2)− E(X)2)

= c2Var(X).

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 9 / 1

Page 10: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Propiedades de la Varianza

Problema

Si X, Y son variables aleatorias, ¿cuanto vale Var(X + Y )?

Solucion:

Var(X + Y ) = E[(X + Y )2

]− E(X + Y )2

= E[X2 + Y 2 + 2XY

]− (E(X) + E(Y ))2

= E(X2) + E(Y 2) + 2E(XY )

−E(X)2 − E(Y )2 − 2E(X)E(Y )

= Var(X) + Var(Y ) + 2(E(XY )− E(X)E(Y ))

= Var(X) + Var(Y ) + 2Cov(X,Y ).

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 10 / 1

Page 11: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Propiedades de la Varianza

Propiedad

Si X es una variable aleatoria y c, d constantes, ocurre queVar(cX) = c2X y Var(X + d) = Var(X).

Si “recorres” una variable aleatoria, pues su promedio se recorretambien, ası que X − µ no cambia.

Entonces de estas propiedades podemos deducir que:

Var(cX + d) = c2Var(X).

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 11 / 1

Page 12: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Desviacion Estandar

Si multiplicamos una variable aleatoria por una constante, la varianzase multiplica por la constante al cuadrado.

Eso no nos gusta:

Si una variable aleatoria esta medida en pesos y tiene cierta varianza,al medirla en dolares su varianza se multiplica por ∼ 192 = 361 !!

En otras palabras, la varianza se mide en “pesos cuadrados” o“dolares cuadrados”, etc.

Nos gustarıa una medida que si todo lo multiplicas por una constante,esa medida se multiplique por esa misma constante (que se mida en“pesos”, “dolares”, etc.)

¿Que hacemos?

Pues sacar raız cuadrada.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 12 / 1

Page 13: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Desviacion Estandar

Definicion

Dada una variable aleatoria X, la desviacion estandar se define como

σ(X) :=√

Var(X) =√E(X2)− E(X)2.

Ejemplo: Encontrar la desviacion estandar de la variable aleatoria Xdefinida ası: Ω = a, b, c y que P (a) = 1

2 , P (b) = 13 y P (c) = 1

6 . X esuna variable aleatoria que X(a) = 3, X(b) = 4 y X(c) = 7.

Solucion: Ya habıamos sacado que la varianza era 2, ası queσ(X) =

√2 ∼ 1.41.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 13 / 1

Page 14: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Ejemplo

Ejemplo. Determinar la desviacion estandar de las siguientescalificaciones de un grupo de alumnos en los siguientes casos:

Si todos tienen 5 de calificacion.

Solucion. Es σ = 0.

Si la mitad tiene 10 y la otra mitad tiene 0.

Solucion. σ =√

12 (10− 5)2 + 1

2 (0− 5)2 =√

25 = 5.

Si la mitad de las calificaciones es de 6 y la otra mitad es 4.

Solucion. σ =√

12 (6− 5)2 + 1

2 (4− 5)2 =√

1 = 1.

Cuando la mitad de las calificaciones es de 7 y la otra mitad es de 3.

Solucion. σ =√

12 (7− 5)2 + 1

2 (3− 5)2 =√

4 = 2.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 14 / 1

Page 15: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Desviacion Estandar

Ejemplo. Se lanza una moneda 10 veces y se cuenta el numero desoles. ¿Cual es la probabilidad de quedar dentro de una desviacionestandar del promedio?

Solucion: El promedio es de 5 soles.Calculemos la varianza:

Var(X) = 1210

((100

)· 02 +

(101

)· 12 + · · ·+

(1010

)· 102

)− 52 = 3/2.

Entonces σ(X) =√3√2

.

¿Cual es la probabilidad de que 3.78 ∼ 5−√3√2< X < 5 +

√3√2∼ 6.22?

Como los valores de X son enteros, la respuesta es

P [X ∈ 4, 5, 6] =1

210

((10

4

)+

(10

5

)+

(10

6

))∼ 0.656.

Nota. Despues veremos que en general, para este tipo dedistribuciones, la probabilidad de quedar a a menos de una desviacionestandar es alrededor de 2/3.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 15 / 1

Page 16: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

EjemploEjemplo. Sea X la variable aleatoria que representa la suma de dosdados que se tiran. ¿Cual es la desviacion estandar?

Solucion. σ(X) =√E(X2)− E(X)2 y E(X) = 7.

Para calcular E(X2) usemos la linealidad de la esperanza.

X = A+B con A y B las variables aleatorias que denotan el primerdado y el segundo dado, respectivamente.

Entonces X2 = A2 + 2AB +B2 y

E(X2) = E(A2) + 2E(AB) + E(B2)

= 2

(12 + 22 + · · ·+ 62

6+

1 · 1 + 1 · 2 + · · ·+ 6 · 636

)= 2

(91

6+

(1 + 2 + · · ·+ 6)(1 + 2 + 3 + · · ·+ 6)

62

)= 2

(91

6+

212

36

)∼ 54.83.

σ(X) ∼√

54.83− 49 =√

5.83 ∼ 2.41.Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 16 / 1

Page 17: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Ejemplo

Ejemplo. Sea X la variable aleatoria que representa la suma de dosdados que se tiran. ¿Cual es la probabilidad de quedar dentro de unadesviacion estandar del promedio?

Solucion. Ya tenemos que σ(X) ∼ 2.41 y que E(X) = 7.

Entonces la respuesta es:

P [7− 2.41 ≤ X ≤ 7 + 2.41] = P [X ∈ 5, 6, 7, 8, 9]

=4 + 5 + 6 + 5 + 4

36=

24

36=

2

3.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 17 / 1

Page 18: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Propiedad

Corolario. Sean X y Y variables aleatorias en un espacio Ω y sea cuna constante. Entonces

σ(cX) = |c|σ(X).

σ(X + c) = σ(X).

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 18 / 1

Page 19: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Covarianza y Correlacion: Introduccion

La covarianza y correlacion miden que tanto se parecen dos variablesaleatorias X y Y .

La correlacion simplemente es la covarianza “normalizada” (es decir,multiplicada para que este entre -1 y 1 siempre)

La correlacion funciona ası:

Es 1 si, y solo si, X es multiplo positivo de Y (mas constante).Es positiva si, y solo si, X y Y tienden a crecer o decrecer juntas.Si son independientes entonces la correlacion es 0 (pero norecıprocamente).Es negativa si, y solo si, X y Y tienden a crecer o decrecerinversamente.Es -1 si, y solo si, una es un multiplo negativo de la otra (masconstante).

La correlacion se utiliza mucho en las ciencias: mide que tanto tienenque ver dos variables.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 19 / 1

Page 20: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Covarianza: Definicion

Definicion

Dadas dos variables aleatorias X y Y en el mismo espacio, definimos lacovarianza como sigue:

Cov(X,Y ) := E(XY )− E(X)E(Y )

P: ¿Cuanto es Cov(X,X)?

R: E(X2)− E(X)2 = Var(X).

P: Si X y Y son independientes, ¿cuanto es Cov(X,Y )?

R: Pues 0.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 20 / 1

Page 21: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Correlacion

Definicion

Sean X y Y dos variables aleatorias. La correlacion entre X y Y es lacovarianza normalizada entre X y Y :

Corr(X,Y ) :=Cov(X,Y )

σ(X)σ(Y )

Notas:

P: ¿Cual es la correlacion entre una variable y sı misma?

R: Pues Corr(X,X) = E(X2)−E(X)2

σ(X)2= 1

P: Si dos variables son independientes, ¿cuanto es su correlacion?

R: Pues E(XY ) = E(X)E(Y ), ası que la correlacion es 0.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 21 / 1

Page 22: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

EjemploEjemplo. Sean X y Y variables aleatorias en Ω = a, b definidas porX(a) = 1 y X(b) = 5, Y (a) = 2 y Y (b) = 3. Calcular Cov(X,Y ) yCorr(X,Y ) si P (a) = 0.3.

Solucion. E(X) = 1× 0.3 + 5× 0.7 = 3.8 yE(Y ) = 2× 0.3 + 3× 0.7 = 2.7.

XY (a) = 2 y XY (b) = 15, ası queE(XY ) = 2× 0.3 + 15× 0.7 = 11.1.

Entonces Cov(X,Y ) = 11.1− 2.7× 3.8 = 0.84.

E(X2) = 1× 0.3 + 25× 0.7 = 17.8 yE(Y 2) = 4× 0.3 + 9× 0.7 = 7.5.

σ(X) =√

17.8− 14.4 ∼√

3.36 ∼ 1.83 yσ(Y ) =

√7.5− 7.3 ∼

√0.21 ∼ 0.46.

Corr(X,Y ) =0.84

1.83× 0.46∼ 1.

No es casualidad que haya salido correlacion 1; cualesquiera dosvariables en un espacio de dos elementos estan relacionadaslinealmente.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 22 / 1

Page 23: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

EjemploEjemplo. Supongamos que se lanza un dado 3 veces. Digamos que Xes la suma de los dos primeros y Y la de los dos segundos. ¿Cualesson la covarianza y la correlacion de X y Y ?

Solucion. E(X) = 7 y E(Y ) = 7.

E(XY ) es mas difıcil: Si los 3 dados caen (A,B,C), entonces XYsera (A+B)(B + C) = B2 +BA+BC +AC.

Pero con la linealidad de la esperanza, es mas facil:E(XY ) = E(B2) + E(BA) + E(BC) + E(AC) (vemos A, B y Ccomo variables aleatorias).

E(B2) = 12+22+32+42+52+62

6 = 916 ,

E(BA) = E(BC) = E(AC) = 1·1+1·2+···+6·636 = 212

36 .

Cov(X,Y ) = 916 + 3 · 21236 − 7 · 7 ∼ 2.92.

Tenemos σ(X) = σ(Y ) y ya sabıamos que σ(X)2 ∼ 5.83

Corr(X,Y ) ∼ 2.92

2.412∼ 0.5.

En este caso tenemos que X y Y estan medianamente relacionadas,lo cual resulta natural, en vista de que comparten el segundo dado.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 23 / 1

Page 24: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Propiedades de la Correlacion

No esta definida si una de las variables aleatorias es constante, puesσ(c) = 0. En este caso usualmente dices simplemente queCorr(X, c) = 0, pues X y c son independientes.Siempre esta entre -1 y 1.Corr(aX + b, Y ) = Corr(X,Y ). ¿Por que?

Corr(aX + b, Y ) =E((aX + b)Y )− E(aX + b)E(Y )

σ(aX + b)σ(Y )

=aE(XY ) + bE(Y )− aE(X)E(Y )− bE(Y )

aσ(X)σ(Y )

=aE(XY ) + bE(Y )− aE(X)E(Y )− bE(Y )

aσ(X)σ(Y )

=aE(XY )− aE(X)E(Y )

aσ(X)σ(Y )

= Corr(X,Y )

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 24 / 1

Page 25: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Correlacion Intuitiva

¿Estan correlacionadas?

La temperatura de manana y la cantidad de helados vendidos manana.

La cantidad de comida que como esta semana y mi peso la proxima.

La cantidad de papel que se usa hoy en todo morelia y mi pesomanana.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 25 / 1

Page 26: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Correlacion y Causalidad

Correlacion: Cuando dos (o mas) eventos tienden a suceder juntos.

Ejemplo: Hay correlacion entre no fumar y vivir mas.

Causalidad: Cuando al alterar un evento, tiende a alterar otro.

Ejemplo: Esta enfermedad provoca dolor de cabeza.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 26 / 1

Page 27: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Correlacion no implica causalidad!

Los humanos tendemos a confundir los dos conceptos anteriores.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 27 / 1

Page 28: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Posibilidades

Puede haber varias razones por las cuales dos eventos A y B estenrelacionados: A causa B, B causa A o un tercer factor, C, causa ambos.Clasifica (i.e. ¿por que estan mal?):

La gente que toma mas medicinas tiende a morirse mas joven.

La gente que juega videojuegos mas violentos tiende a ser masviolenta.

Cuando los molinos de viento van mas rapido, el viento va masrapido. Entonces los molinos afectan al viento!

Desde 1950 el nivel de CO2 en la atmosfera ha aumentado mucho, ytambien el nivel de obesidad. Entonces la obesidad causa CO2.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 28 / 1

Page 29: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Si consideras suficientes cosas, seguro encuentras dos con relacion espuria:http://www.tylervigen.com/spurious-correlations

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 29 / 1

Page 30: Varianza, Desviaci on, Covarianza, Correlaci onichi.fismat.umich.mx/cursos/Probabilidad-5-VarianzayCor... · 2020. 4. 20. · Varianza, Desviaci on, Covarianza, Correlaci on Miguel

Correlacion vs Dependencia

Sabemos que si dos variables son independientes, entonces su correlaciones 0; sin embargo, es posible que dos variables tengan correlacion 0 y queno sean independientes.

Ejemplo. Sean X, Y y Z definidas en Ω = a, b, c, d como sigue:

X(a) = X(b) = 0 y X(c) = 1 = X(d).Y (a) = −1 = Y (c) y Y (b) = 1 = Y (d).Z = XY .

Entonces X y Z son dependientes pero Corr(X,Z) = 0.

Miguel Raggi Marıa Luisa Perez [email protected] [email protected] (Probabilidad y Estadıstica Escuela Nacional de Estudios Superiores UNAM)Varianza, Desviacion, Covarianza, Correlacion 20 de abril de 2020 30 / 1