ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1...

22
ESTAD ´ ISTICA DESCRIPTIVA Y AN ´ ALISIS DE DATOS CON LA HOJA DE C ´ ALCULO EXCEL Organiza: INSTITUTO C ´ ANTABRO DE ESTAD ´ ISTICA http://www.icane.es Responsable: Francisco Parra Rodr´ ıguez Jefe de Servicio de Estad´ ısticas Econ´ omicas y Sociodemogr´ aficas parra [email protected] Colabora: M a Paz Moral Zuazo Analista de coyuntura moral [email protected], [email protected] (Sesi´ on 3) Estad´ ıstica Descriptiva con EXCEL CEARC, Marzo 2010 1 / 22

Transcript of ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1...

Page 1: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

ESTADISTICA DESCRIPTIVA Y ANALISIS DE

DATOS CON LA HOJA DE CALCULO EXCEL

Organiza:INSTITUTO CANTABRO DE ESTADISTICA

http://www.icane.es

Responsable: Francisco Parra RodrıguezJefe de Servicio de Estadısticas Economicas y Sociodemograficas

parra [email protected]

Colabora: Ma Paz Moral ZuazoAnalista de coyuntura

moral [email protected], [email protected]

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 1 / 22

Page 2: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

ESQUEMA DE LA SEMANA: SESION 3

1 Introduccion

2 Descripcion grafica de datos de una variable cualitativa

3 Descripcion grafica de datos de una variable cuantitativa

4 Descripcion numerica de un conjunto de datos

5 Medidas de desigualdad

6 Analisis de dos variables. Correlacion

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 2 / 22

Page 3: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

EJEMPLOS DE HISTOGRAMAS

0

0.02

0.04

0.06

0.08

0.1

1000 1500 2000 2500

Frecu

enci

a r

ela

tiva

djclose

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 3 / 22

Page 4: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

EJEMPLOS DE HISTOGRAMAS

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

2 4 6 8 10 12 14 16

Densid

ad

bwghtlbs

bwghtlbsN(7.4187,1.2721)

Estadístico para el contraste de normalidad:Chi-cuadrado(2) = 290.610, valor p = 0.00000

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0 2 4 6 8 10 12 14 16

Densid

ad

bwghtlbs

bwghtlbsN(7.4187,1.2721)

Estadístico para el contraste de normalidad:Chi-cuadrado(2) = 290.610, valor p = 0.00000

Media = 7.4187 Mediana = 7.5000Mınimo = 1.4375 Maximo = 16.938Desviacion tıpica=1.2721 C.V.= 0.17147

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 4 / 22

Page 5: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

ESQUEMA DE LA SEMANA: SESION 3

3. DESCRIPCION NUMERICA DE DATOS (II)

3.3 Medidas de dispersion.3.4 Medidas de forma.

4. MEDIDAS DE DESIGUALDAD

4.1 Medidas de concentracion.4.2 Curva de Lorenz: calculo e interpretacion.4.3 Indice de Gini: calculo e interpretacion.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 5 / 22

Page 6: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

3. DESCRIPCION NUMERICA DE DATOS

Descripcion numerica. Objetivo

Utilizar medidas numericas que den idea de determinadas caracterısticasde la distribucion. Por ejemplo:

Posicion.I Basada en suma de cantidades: mediaI Basada en la ordenacion de los datos: mediana

DispersionI Basada en suma de cantidades: varianza, desviacion tıpica, coeficiente

de variacionI Basada en la ordenacion de los datos: rango intercuartılico

FormaI Asimetrıa de la distribucionI Apuntamiento de la distribucion

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 6 / 22

Page 7: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

Resumen

Media decribe la posicion de los datos. Centro de gravedad.

x =x1 + x2 + . . . + xN

N

La desviacion tıpica mide la dispersion de los datos alrededor de lamedia.

Sx =

√(x1 − x)2 + (x2 − x)2 + . . . + (xN − x)2

NFuncion desvestp

S∗x =

√(x1 − x)2 + (x2 − x)2 + . . . + (xN − x)2

N − 1Funcion desvest

Coeficiente de variacion: para comparar distintos conjuntos de datos.

CV =Sx

|x |

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 7 / 22

Page 8: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

3.4 Medidas de forma

Las medidas de forma reflejan otras caracterısticas del histograma.

El coeficiente de asimetrıa

La asimetrıa de una distribucion se refiere a si los datos se distribuyen deforma simetrica alrededor de la media o no. El coeficiente de asimetrıa sedefine:

Coef. de asimetrıa =1

N

N∑i=1

(x1 − x)3 + (x2 − x)3 + . . . + (xN − x)3

S∗3x

Interpretacion: si el coeficiente de asimetrıa es

Cero, la distribucion es simetrica respectro a la media.

Positivo, la distribucion es asimetrica a la derecha.

Negativo, la distribucion es asimetrica a la izquierda.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 8 / 22

Page 9: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

3.4 Medidas de forma: ejemplos de asimetrıa

0

0.05

0.1

0.15

0.2

0 5 10 15 20 25 30 35 40

Frecu

enci

a r

ela

tiva

huswage

0

0.05

0.1

0.15

0.2

-2 -1 0 1 2 3

Frecu

enci

a r

ela

tiva

lwage

Caso 1 Caso 2Media 7.5 1.2

C.V. 0.56 0.60Asimetrıa 2.3 -0.7

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 9 / 22

Page 10: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

3.4 Medidas de forma: la curtosis

Las medidas de forma reflejan otras caracterısticas del histograma.

El coeficiente de apuntamiento o curtosis

El apuntamiento o curtosis de una distribucion se refiere a lo picuda oplana que es. El coeficiente de apuntamiento o curtosis se define:

Coef. de curtosis =1

N

N∑i=1

(x1 − x)4 + (x2 − x)4 + . . . + (xN − x)4

S∗4x

Interpretacion: se compara con una distribucion de referencia. Si es

Tres, la distribucion es la normal (mesocurtica).

Mayor que 3, la distribucion es mas apuntada que la normal(leptocurtica).

Menor que 3, la distribucion es mas plana que la normal (platicurtica).

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 10 / 22

Page 11: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

3.4 Medidas de forma: ejemplos de curtosias

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

-5 0 5 10 15 20 25 30 35 40

Densid

ad

huswage

huswageN(7.4822,4.2306)

Estadístico para el contraste de normalidad:Chi-cuadrado(2) = 340.874, valor p = 0.00000

0

0.5

1

1.5

2

2.5

0 0.2 0.4 0.6 0.8 1 1.2

Densid

ad

bmktshr

bmktshrN(0.61011,0.19644)

Estadístico para el contraste de normalidad:Chi-cuadrado(2) = 187.003, valor p = 0.00000

Caso 1 Caso 2Media 7.5 0.6

C.V. 0.56 0.32Asimetrıa 2.3 0.1

Exc. curtosis 11.5 -0.8

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 11 / 22

Page 12: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4. Medidas de desigualdad

4.1 Medidas de concentracion de una distribucion.

4.2 Curva de Lorenz: calculo e interpretacion.

4.3 Indice de Gini: calculo e interpretacion.

Bibliografıa:

Martın Pliego, J. (2004), Introduccion a la Estadıstica Economica yEmpresarial, 2a ed., Prentice Hall. Capıtulo 6.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 12 / 22

Page 13: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4.1 Medidas de concentracion

En Estadıstica se entiende por concentracion de una distribucion el gradode equidad en el reparto de los valores de una variable entre el colectivoestudiado.Consideramos dos estadısticos que miden el grado de concentracion de unadistribucion:

Un grafico: curva de Lorenz.

Un ındice: ındice de Gini.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 13 / 22

Page 14: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

Ejemplo. (Fuente:Martın Pliego, 1994, pag. 190.)

Supongase que dos padres de familia, cada uno de ellos con cuatro hijos,deciden repartir su patrimonio de la siguiente forma:

Padre A Padre B

Primer hijo 600 7200

Segundo hijo 3000 7800

Tercer hijo 1800 8400

Cuarto hijo 600 6600

Total 6000 30000

¿Cual de los dos repartos es mas equitativo?

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 14 / 22

Page 15: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

Ejemplo. (Martın Pliego, 1994)

Padre A Padre B Padre A Padre B(terminos absolutos) (terminos relativos)

Primer hijo 600 7200 10 % 24 %

Segundo hijo 3000 7800 50 % 26 %

Tercer hijo 1800 8400 30 % 28 %

Cuarto hijo 600 6600 10 % 22 %

Total 6000 30000 100 100

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 15 / 22

Page 16: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4.2. Curva de Lorenz: ejemplo

X = cantidad a heredar.

Dos conjuntos de datos: Familia A y familia B.

1. Reparto de familia A

Tres clases, k = 3: x1 = 600, x2 = 1800, x3 = 3000.

ni = no de hijos que recibe la cantidad xi , i = 1, 2, 3.

fi= proporcion de hijos que recibe la cantidad xi , i = 1, 2, 3.

Fi = proporcion de hijos que recibe una cantidad igual o menor quexi , i = 1, 2, 3.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 16 / 22

Page 17: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4.2. Curva de Lorenz: ejemplo

Tabla de frecuencias de la familia A

xi ni porcion de la herencia fi Fi

600 2 0,5 0,5

1800 1 0,25 0,75

3000 1 0,25 1

Total 4 1 -

La clase x1 = 600 tiene asignada x1 × n1 = 600× 2 = 1200 euros.

x2 = 1800 tiene asignada x2 × n2 = 1800 euros.

x3 = 3000 tiene asignada x2 × n2 = 3000 euros.

Total a repartir = 1200 + 1800 + 3000 = 6000 euros.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 17 / 22

Page 18: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4.2. Curva de Lorenz: ejemplo

Tabla de frecuencias de la familia A (cont.)xi ni porcion de la herencia fi Fi

600 2 600×26000 = 0, 2 0,5 0,5

1800 1 1800×16000 = 0, 3 0,25 0,75

3000 1 3000×16000 = 0, 5 0,25 1

Suma 4 1 1 -

xi × ni= cantidad asignada a la clase xi , i = 1, 2, 3.

M =∑3

i=1 xi × ni= total a repartir o masa total.

qi = Porcion de herencia que recibe la clase xi =xi × ni

M, i = 1, 2, 3.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 18 / 22

Page 19: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4.2. Curva de Lorenz: ejemplo

Tabla de frecuencias de la familia Axi ni qi fi porcion acumulada Fi

600 2 0,2 0,5 0,2 0,5

1800 1 0,3 0,25 0,2+0,3=0,5 0,75

3000 1 0,5 0,25 0,2+0,3+0,5=1 1

Suma 4 1 1 - -

Qi= Porcion de la herencia acumulada hasta clase i , i = 1, 2, 3.Si reparto equitativo: qi = fi y Qi = Fi , ∀i = 1, 2, 3.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 19 / 22

Page 20: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

Curva de Lorenz para reparto de herencias

���������������

25 %

50 %

75 %

100 %

25 % 50 % 75 % 100 %!!

!!!!

!!%%%%%

v��������

v

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 20 / 22

Page 21: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4.3 Indice de Gini

El ındice de Gini es una medida de concentracion de la distribucion.

Mide el area que hay entre la bisectriz y la curva de Lorenz.

Se define:

IG =(F1 − Q1) + (F2 − Q2) + · · ·+ (FK−1 − QK−1)

(F1 + F2 + · · ·+ FK−1)=

∑K−1i=1 (Fi − Qi )∑K−1

i=1 Fi

Si IG=1, la concentracion es maxima.

Si IG=0, la curva de Lorenz coincide con la diagonal y laconcentracion es mınima.

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 21 / 22

Page 22: ESTAD ISTICA DESCRIPTIVA Y ANALISIS DE DATOS CON LA HOJA ... · ESQUEMA DE LA SEMANA: SESION 3 1 Introducci on 2 Descripci on gr a ca de datos de una variable cualitativa 3 Descripci

4.3. Indice de Gini: ejemplo

Tabla de frecuencias de la familia Axi ni qi fi Qi Fi Fi − Qi

600 2 0,2 0,5 0,2 0,5 0,3

1800 1 0,3 0,25 0,2+0,3=0,5 0,75 0,25

3000 1 0,5 0,25 0,2+0,3+0,5=1 1 0

Suma 4 1 1 - -

IG =0, 3 + 0, 25

0, 5 + 0, 75= 0, 4

(Sesion 3) Estadıstica Descriptiva con EXCEL CEARC, Marzo 2010 22 / 22