Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca...

42
Pr´ actica 1 Intro MATLAB Descrip. datos Rep. Gr´ afica Medidas de posici´ on Medidas de dispersi´ on Descrip. 2 variables Estad´ ıstica Descriptiva 1 con MATLAB/Octave Ingenier´ ıa de Telecomunicaciones Departamento de Estad´ ıstica Universidad Carlos III de Madrid Curso 2009/2010 1 Consultar ficheros Descriptiva 1 y Descriptiva 2 1 / 42

Transcript of Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca...

Page 1: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Estadıstica Descriptiva1 conMATLAB/Octave

Ingenierıa de Telecomunicaciones

Departamento de Estadıstica

Universidad Carlos III de Madrid

Curso 2009/2010

1Consultar ficheros Descriptiva 1 y Descriptiva 21 / 42

Page 2: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Resumen de la practica

1 Introduccion entorno MATLAB/Octave

2 Descripcion de un conjunto de datos

3 Representacion grafica

4 Medidas de posicion

5 Medidas de dispersion

6 Descripcion conjunta de dos variables

2 / 42

Page 3: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Resumen

1 Introduccion entorno MATLAB/Octave

2 Descripcion de un conjunto de datos

3 Representacion grafica

4 Medidas de posicion

5 Medidas de dispersion

6 Descripcion conjunta de dos variables

3 / 42

Page 4: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ventana Principal de MATLAB

Command WindowWorkspace

Command History

Current Directory

4 / 42

Page 5: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Directorio actual de Trabajo (Current Directory):

Especificar la ruta: C:/.../

por ejemplo: C:/practica1/

Aquı se guardan las funciones *.m creadas

Espacio de Trabajo (Workspace).

Aquı aparecen las variables o funciones cargadas.

Ventana de comandos (Command Window).

Consola sobre la que se escriben los comandos.

Historial de comandos (Command History).

Aquı se guardan los comandos escritos en la consola.

Ficheros practica 1

Para esta practica descarga de la pagina web los ficherosinternet.mat, AlumnosIndustriales.mat y histg.m del siguienteenlace

5 / 42

Page 6: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Resumen

1 Introduccion entorno MATLAB/Octave

2 Descripcion de un conjunto de datos

3 Representacion grafica

4 Medidas de posicion

5 Medidas de dispersion

6 Descripcion conjunta de dos variables

6 / 42

Page 7: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

Los datos sobre el numero de averıas de 40 centrales se recogen en lasiguiente tabla (incompleta):

Central Electrica No Averıas

1 12 33 24 2...

...39 140 2

7 / 42

Page 8: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

En MATLAB, introducimos los datos sobre el command window

>> averias=[ 1; 3; 2; 2; 0; 3; 1; 0; 2; 1; 0; 1; 0; 3; 0; 2;

0; 2; 1; 1; 1; 0; 2; 3; 0; 0; 0; 0; 1; 1; 4; 0;

3; 1; 0; 2; 1; 1; 1; 2 ]

El resultado es el vector columna averias

averias =

1322...

8 / 42

Page 9: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

El comando tabulate, calcula las frecuencias absolutas (Count) yrelativas (en %) (Percent)

>> tabulate(averias)

Value Count Percent0 13 32.50%1 13 32.50%2 8 20.00%3 5 12.50%4 1 2.50%

9 / 42

Page 10: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıasPara trabajar con la tabla como una matriz, la guardamos con elnombre de tabla. De este modo podemos manejar sencillamente suselementos.

>> tabla = tabulate(averias)

Por ejemplo, podemos expresar las frecuencias relativas entre 0 y 1,en lugar de en %

>> tabla(:,3) = tabla(:,3)/100

tabla =

0 13.0000 0.32501.0000 13.0000 0.32502.0000 8.0000 0.20003.0000 5.0000 0.12504.0000 1.0000 0.0250

10 / 42

Page 11: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

Podemos calcular las frecuencias acumuladas con el comando cumsum

>> abs_acum = cumsum(tabla(:,2))

ans =

13

26

34

39

40

>> rel_acum = cumsum(tabla(:,3))

ans =

0.3250

0.6500

0.8500

0.9750

1.0000

11 / 42

Page 12: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

La tabla final de frecuencias se puede construir, juntando lascolumnas de las frecuencias acumuladas (abs acum y rel acum a latabla anterior)

>> tabla=[ tabla abs_acum rel_acum ]

tabla =

0 13.0000 0.3250 13.0000 0.32501.0000 13.0000 0.3250 26.0000 0.65002.0000 8.0000 0.2000 34.0000 0.85003.0000 5.0000 0.1250 39.0000 0.97504.0000 1.0000 0.0250 40.0000 1.0000

12 / 42

Page 13: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

¿Cuantas centrales tienen menos de 2 averıas ?

No Averias Frec Abs Frec Rel Frec Abs Acum Frec Rel Acum

0 13 0.325 13 0.325

1 13 0.325 26 0.6502 8 0.200 34 0.8503 5 0.125 39 0.9754 1 0.025 40 1

13 / 42

Page 14: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

¿Que porcentaje de centrales tiene 3 o menos averıas?

No Averias Frec Abs Frec Rel Frec Abs Acum Frec Rel Acum

0 13 0.325 13 0.325

1 13 0.325 26 0.650

2 8 0.200 34 0.850

3 5 0.125 39 0.9754 1 0.025 40 1

14 / 42

Page 15: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: averıas

¿Que cantidad de averıas es tal que al menos el 50 % de las centralestiene una cantidad de averıas inferior o igual a esa?

No Averias Frec Abs Frec Rel Frec Abs Acum Frec Rel Acum

0 13 0.325 13 0.325

1 13 0.325 26 0.650 ≥50 %

2 8 0.200 34 0.8503 5 0.125 39 0.9754 1 0.025 40 1

15 / 42

Page 16: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Resumen

1 Introduccion entorno MATLAB/Octave

2 Descripcion de un conjunto de datos

3 Representacion grafica

4 Medidas de posicion

5 Medidas de dispersion

6 Descripcion conjunta de dos variables

16 / 42

Page 17: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Representacion graficaVariables cuantitativas

Algunos graficos son diferentes en funcion de que las variablessean discretas o continuas.

Se utilizan con frec. absolutas o relativas y acumuladas.

Diagrama de barrasGrafico de tarta, de sectores o pictogramaHistograma

17 / 42

Page 18: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Representacion graficaVariables cuantitativas

Ejemplo: averıas en centrales electricas

Diagrama de barras:

En MATLAB utilizamos el comando bar

>> bar(tabla(:,2))

obtenemos el diagr. de barras defrec. absolutas

1 2 3 4 50

2

4

6

8

10

12

14

18 / 42

Page 19: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Representacion graficaVariables cuantitativas

Ejemplo: averıas en centrales electricas

Diagrama de tarta, sectores o pictograma:

En MATLAB utilizamos el comando pie

>> pie(tabla(:,2))

33%

33%

20%

13%

3%

19 / 42

Page 20: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Representacion graficaVariables cuantitativas

Ejemplo: alturas de alumnos

Histograma:

La variable alturas, recoge los datos sobre la altura de 28 alumnosen una clase.

alturas = [ 156; 159; 153; 157; 162; 156; 162;

153; 158; 152; 153; 159; 154; 153;

150; 162; 163; 160; 162; 156; 164;

168; 152; 151; 159; 147; 165; 149 ]

Comando hist

>> hist(alturas)

145 150 155 160 165 1700

1

2

3

4

5

6

20 / 42

Page 21: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Podemos seleccionar el numero de clases o intervalos que deseemos

>> hist(alturas, 5) % 5 clases o intervalos

145 150 155 160 165 1700

1

2

3

4

5

6

7

8

21 / 42

Page 22: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Supongamos que en la clase se incorpora un nuevo alumno que mide2.10 metros

Creamos una nueva variable alturas2

>> alturas2 = [alturas; 210];>> hist(alturas2,5)

140 150 160 170 180 190 200 2100

1

2

3

4

5

6

7

8

9

10

El nuevo alumno es un dato atıpico22 / 42

Page 23: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Diagrama para frec. acum.

Ejemplo: averıas centrales electricas

Nos centramos en las frecuencias absolutas y absolutas acumuladasDe la variable tabla representamos las columnas 2 y 4

>> bar([tabla(:,2) tabla(:,4)])

1 2 3 4 50

5

10

15

20

25

30

35

40

Frec. Abs

Frec. Abs Acum.

23 / 42

Page 24: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Resumen

1 Introduccion entorno MATLAB/Octave

2 Descripcion de un conjunto de datos

3 Representacion grafica

4 Medidas de posicion

5 Medidas de dispersion

6 Descripcion conjunta de dos variables

24 / 42

Page 25: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Medidas de posicionmedia, mediana

Ejemplo: alturas de alumnos

Volviendo al ejemplo anterior alturas2

La media x , comando mean:

>> mean(alturas2)ans =

156.9643

La mediana xmed , comando median:

>> median(alturas2)ans =

156.5000

25 / 42

Page 26: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Resumen

1 Introduccion entorno MATLAB/Octave

2 Descripcion de un conjunto de datos

3 Representacion grafica

4 Medidas de posicion

5 Medidas de dispersion

6 Descripcion conjunta de dos variables

26 / 42

Page 27: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Medidas de dispersionvarianza, desviacion tıpica y rango

Miden la “dispersion” de las observaciones dentro del conjunto dedatos respecto de alguna medida de posicion.

Varianza:

VARx = S2x =

1

n

n∑i

(xi − x)2

Desviacion tıpica:

DTx = Sx =√

S2x

Rango o amplitud:

Rangox = max(xi )− mın(xi )

27 / 42

Page 28: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

En MATLAB

Comando var

>> var(x)

Comando std

>> std(x)

Comando range

>> range(x)

O tambien con los comandos max y min, es decir:max(x)-min(x).

28 / 42

Page 29: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Resumen

1 Introduccion entorno MATLAB/Octave

2 Descripcion de un conjunto de datos

3 Representacion grafica

4 Medidas de posicion

5 Medidas de dispersion

6 Descripcion conjunta de dos variables

29 / 42

Page 30: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: longitud/pesoSe ha medido la longitud (X en mm) y el peso (Y en gr) de unamuestra de 117 tornillos producidos por una maquina, la informacionse representa en la siguiente tabla:

nij

X / Y 40-60 60-80 80-100 100-200

140-160 4 0 0 0160-180 14 60 2 0180-200 0 20 16 1

>> tornillos = [ 4 0 0 014 60 2 00 20 16 1 ]

30 / 42

Page 31: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: longitud/pesoSe ha medido la longitud (X en mm) y el peso (Y en gr) de unamuestra de 117 tornillos producidos por una maquina, la informacionse representa en la siguiente tabla:

nij

X / Y 40-60 60-80 80-100 100-200

140-160 4 0 0 0160-180 14 60 2 0180-200 0 20 16 1

>> tornillos = [ 4 0 0 014 60 2 00 20 16 1 ]

31 / 42

Page 32: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Podemos calcular la tabla de frecuencias relativas, simplemente

fij =nij

n

>> frec_relat = tornillos/117

X / Y 40-60 60-80 80-100 100-200

140-160 0.0342 0 0 0160-180 0.1197 0.5128 0.0171 0180-200 0 0.1709 0.1368 0.0085

32 / 42

Page 33: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Podemos calcular las distribuciones marginales sumando por filas ypor columnas:

Por filas (1) y por columnas (2):

>> sum(tornillos,1) >> sum(tornillos,2)ans = ans =

18 80 18 1 47637

X / Y 40-60 60-80 80-100 100-200 Total

140-160 4 0 0 0 4160-180 14 60 2 0 76180-200 0 20 16 1 37

Total 18 80 18 1 117

33 / 42

Page 34: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: internet

En una encuesta realizada por dos empresas de servicios de internetsobre 95 hogares con conexion a internet, se han analizado lassiguientes variables:

MB: MB’s descargados al dıa.

Tiempo de Conexion: tiempo medio de conexion diario enhoras.

ISP: Internet Service Provider (proveedores 1 y 2).

Momento: momento principal de conexion (Manana=1,Tarde=2, Noche=3).

Los datos se encuentran en el fichero internet.mat

34 / 42

Page 35: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: internet

Tabla de datos (incompleta):

MB Tiempo conexion ISP Momento

163 1,1 1 1170 3,5 1 1169 3 1 3173 2 1 2160 1,1 1 1

......

......

183 8,1 2 1175 5,6 2 3173 3 2 1

35 / 42

Page 36: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: Internet

Para importar el fichero en MATLAB:

File → Open o tambien File → Import data

Una vez importados los datos, en el workspace tenemos creadala matriz internet

Para nombrar las variables:

>> MB = internet(:,1);>> tiempo_conexion = internet(:,2);>> ISP = internet(:,3);>> momento = internet(:,4);

36 / 42

Page 37: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: Internet

Con el comando crosstab, podemos trabajar con tablas dedoble entrada, por ejemplo, para las variables cualitativasmomento e ISP, podemos crear la matriz de tamano 3× 2. En laque las filas representan las tres categorıas de la variablemomento (1= manana, 2 = tarde y 3 = noche) y las columnaslos dos tipos de proveedores ISP

>> crosstab(momento,ISP)ans =

3 1011 2518 28

ISPMOMENTO 1 2

manana 3 10tarde 11 25noche 18 28

37 / 42

Page 38: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: InternetHistograma por grupos

El fichero histg.m permite representar graficamente unhistograma por grupos.

Guardaremos el fichero en el directorio C:/practica1/

>> histg(MB,ISP)

155 160 165 170 175 180 185 190 195 2000

0.05

0.1

0.15

0.2

0.25

0.3

ISP 1ISP 2

38 / 42

Page 39: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: InternetAnalisis por grupos

El comando grpstats permite calcular estadısticas por grupos.

GRPSTATS(X,GROUP) calcula la media de los grupos.

[MEANS,SEM,COUNTS,GNAME] = GRPSTATS(X,GROUP), calculalas medias (MEANS), desviaciones tıpicas (SEM), el numero deelementos en cada grupo (COUNTS), y el nombre de cada grupo(GNAME)

39 / 42

Page 40: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: InternetAnalisis por grupos

>> [MEANS,SEM,COUNTS,GNAME]=grpstats(MB,ISP)

MEANS =

165.3125

179.3492

SEM =

0.7834

0.6345

COUNTS =

32

63

GNAME =

’1’

’2’

40 / 42

Page 41: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: Internetgrafico de dispersion

Con la funcion plot, podemos representar un grafico dedispersion de dos variables cuantitativas, por ejemplo, para lasvariables MB y tiempo conexion:

>> plot(MB,tiempo_conexion)

155 160 165 170 175 180 185 190 1950

2

4

6

8

10

12

¿Existe una relacion lineal entre MB y tiempo conexion? ¿existedependencia lineal?

41 / 42

Page 42: Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1

Practica 1

Intro MATLAB

Descrip. datos

Rep. Grafica

Medidas deposicion

Medidas dedispersion

Descrip. 2variables

Ejemplo: Internetcovarianza y correlacion

El comando cov, calcula la matriz de covarianzas

>> cov(MB,tiempo_conexion)ans =

67.6847 13.817213.8172 4.7746

COV (X , Y ) =

(S2

x Sx,y

Sx,y S2y

)

El comando corrcoef, calcula el coefficiente de correlacion.

>> corrcoef(MB,tiempo_conexion)ans =

1.0000 0.76860.7686 1.0000 CORR(X , Y ) =

(rx,x rx,y

rx,y ry ,y

)donde rx,y =

Sx,y

SxSy.

42 / 42