Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7....

124
EYGDD *.* - Curso Completo Estad´ ıstica y Gesti´ on de Datos http://eygdd.wordpress.com Prof. Milton A. Ram´ ırez Klapp [email protected] Instituto Profesional AIEP Escuela de Negocios y Tecnolog´ ıa Primavera de 2008

Transcript of Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7....

Page 1: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıstica y Gestion de Datoshttp://eygdd.wordpress.com

Prof. Milton A. Ramırez [email protected]

Instituto Profesional AIEPEscuela de Negocios y Tecnologıa

Primavera de 2008

Page 2: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Part I

Preliminar

Page 3: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıstica

Definicion

Estadıstica

Caracterısticas Generales

La Estadıstica es una rama de la Matematica que se refiere a larecoleccion, agrupacion, clasificacion, estudio e interpretacion de los datosobtenidos en un estudio determinado.

La Estadıstica se subdivide en dos ramas que pasaremos a revisar a

continuacion:

Estadıstica Descriptiva.Inferencia Estadıstica.

Page 4: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıstica

Campo de Aplicacion

Campo de Aplicacion

A ver

Ciencias de la Salud.

Nutricion.

Computacion.

Meteorologıa.

Demografıa.

Deporte.

Sociologıa.

Educacion del Transito.

etc.

Page 5: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıstica

Estadıstica Descriptiva

Estadıstica Descriptiva

Que es

La Estadıstica Descriptiva se define como un conjunto de tecnicas y metodoscuyo proposito es describir alguna caracterıstica de interes en base a lainformacion contenida en una muestra.

La metodologıa que se emplea para recabar informacion de interes en nuestros

estudios contempla las siguientes etapas:

1 Seleccion y determinacion de la muestra (saber con certeza sobre quetratara el estudio).

2 Obtencion de los datos.3 Clasificacion y organizacion de los datos recogidos en la etapa anterior.4 Estudio descriptivo de los datos a traves de tabulaciones y calculo de

estadıgrados tanto de tendencia central como de dispersion.5 Representacion Grafica de los datos.6 Conclusiones.

Con estos elementos nos vamos a entretener durante este semestre.

Page 6: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıstica

Inferencia Estadıstica

Inferencia Estadıstica

Nada mas que por cultura general

La Inferencia Estadıstica se dedica a la generacion de modelosmatematicos que permitan hacer predicciones o inferencias respecto alcomportamiento estadıstico de una poblacion a partir de los datosrecogidos en una muestra.

En este ambito lo que se hace es tratar de deducir cuales serıan losparametros estadısticos de una poblacion en base a una ciertaprobabilidad de exito o de fracaso (segun como se mire).

Otras aristas del estudio se refieren al establecimiento de ciertas hipotesis,a partir de las cuales podemos obtener respuestas sı o no con un ciertomargen de error prefijado.

Page 7: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Conceptos Fundamentales

Poblacion

Poblacion

Que es

La poblacion estadıstica corresponde al conjunto de elementos dereferencia sobre el cual se realizaran las observaciones.

Tambien se le conoce como universo o colectivo.

El tamano de una poblacion corresponde a la cantidad de elementos queesta posee, y su valor lo representaremos mediante el sımbolo N. Por logeneral, N es un numero grande.

Por ejemplo

La poblacion de todas las mujeres chilenas nacidas a la fecha.

La poblacion del parque automotriz en Sudamerica.

La poblacion de todas las personas del mundo que sean mayores de 18anos.

Page 8: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Conceptos Fundamentales

Muestra

Muestra

Que es

Corresponde a una parte de la poblacion (subconjunto).

El tamano de la muestra se denota con el sımbolo n, y se cumple quen < N

Por ejemplo

Si la poblacion fuera igual a todas las mujeres chilenas nacidas a la fecha,una posible muestra serıan las mujeres que estan embarazadas

Si la poblacion fuera el parque automotriz en Sudamerica, una muestraserıa los vehıculos que tienen placa patente de la ciudad de Buenos Aires.

Si la poblacion fuera igual a todas las personas del mundo que seanmayores de 18 anos, una posible muestra serıan todas las personas quetengan dos hijos y sean mayores de 50 anos.

Page 9: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Conceptos Fundamentales

Variable

Variable

Veamos

Las variables representan las caracterısticas de los casos, entes u objetosque forman la poblacion.

Distinguiremos dos tipos de variables:

X Cualitativas (cualidades)X Cuantitativas (cantidades)

Se diferencian entre sı porque a una no se le puede atribuir valoresnumericos y a la otra sı.

A continuacion pasaremos a revisarlas.

Page 10: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Conceptos Fundamentales

Variable

Variables Cualitativas

Cualitativa, cualidad

Son aquellas que no toman valores numericos y solo describen cualidades.

Por ejemplo

Raza.

Color de pelo.

Estado civil.

Sexo.

Page 11: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Conceptos Fundamentales

Variable

Variables Cuantitativas

Cuantitativa, cantidad

Son aquellas a las cuales podemos asignarles un valor numerico.

Se clasifican en:

Variables cuantitativas discretas.Variables cuantitativas continuas.

Ejemplos

Estatura.

Edad.

Potencia del motor de un automovil.

Cantidad de DVDs que hay en un videoclub.

Page 12: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Conceptos Fundamentales

Variable

Variables Cuantitativas Discretas

Discreto, conteo

Son variables cuantitativas que suelen emplearse para hacer conteos oenumeraciones.

Toman valores enteros (sin decimales).

Ejemplos

Cantidad de alumnos presentes en una sala.

Cantidad de alumnos ausentes en una sala.

Cantidad de manzanas que caben en un kilo.

Numero de clientes que espera ser atendido en la caja de unsupermercado.

Page 13: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Conceptos Fundamentales

Variable

Variables Cuantitativas Continuas

Continuo, medicion

Son aquellas variables cuantitativas que puede tomar cualquier valor enun intervalo dado.

Pensemos en cosas que puedan ser traducidas a numeros decimales.

Ejemplos

Peso corporal (es posible que uno pueda pesar 80.7 kilos)

Estatura (se puede medir 1.82 metros)

Tiempo de espera (podrıa ser de 1 hora con 27 minutos, donde en estecaso los minutos serıan los decimales)

Page 14: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Part II

Frecuencia

Page 15: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Introduccion

Introduccion al concepto de Frecuencia

La frecuencia es uno de los terminos mas usados en estadıstica.

Esta constituye un elemento esencial a la hora de analisis datosmuestrales.

Es un concepto relacionado con la cantidad de veces que se repite undeterminado valor en una variable (cualitativa o cuantitativa).

Existen diversos tipos de frecuencias:

X frecuencia absolutaX frecuencia relativaX frecuencia relativa porcentual

Page 16: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Introduccion

Frecuencia Absoluta

Frecuencia Absoluta

Es el numero de veces que se repite un valor particular de cierta variable.

Si la variable en cuestion toma un numero k de valores, la frecuencia sedenota con el sımbolo fi donde i es un ındice que puede tomar valoresentre 1 y k.

Page 17: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Introduccion

Frecuencia Absoluta

Frecuencia Relativa

Es denotada por f ri y se define como el cuociente entre la frecuencia

absoluta y el numero de observaciones.

Esto es:

f ri =

fin

i = 1, . . . , k.

Page 18: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Introduccion

Frecuencia Absoluta

Frecuencia Relativa Porcentual

Se denota por f ri % y se define como:

f ri % = f r

i × 100, i = 1, . . . , k.

Ademas, como f ri = fi

nla expresion anterior se puede escribir como

f ri % =

fin× 100 i = 1, . . . , k.

Page 19: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencia segun el tipo de Variable

Para calcular la frecuencia se debe tener presente el tipo de variable quese desea analizar, pues a partir de dicho analisis se realiza la agrupacionde datos respectivos.

Recordemos que los tipos de variable que existen son:

X cualitativaX cuantitativa discretaX cuantitativa continua

Lo que veremos a continuacion es justamente como hacer los calculos decada tipo de frecuencia a traves de ejemplos que ayudaran a clarificar losconceptos que vimos anteriormente.

Page 20: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cualitativas

Calculo de Frecuencias para Variables Cualitativas

Vamos viendo

La presentacion de datos cualitativos suele hacerse indicando los atributosconsiderados y sus frecuencias de aparicion.

Ejemplo

Supongase que los datos siguientes representan las marcas extranjeras deautomoviles preferidas en una muestra de 40 personas.

A C C J C F B F J A C C J F A B F F A CJ J B F C J C J C B A F C J J C J A F C

En donde A significa aleman, C coreano, J japones, F frances y Bbrasileno.

Se pide representar los datos en una tabla que contenga las frecuenciasabsolutas y relativas e interpretar algunas de ellas.

Page 21: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cualitativas

Ejemplo (Cont.)

Solucion

En primer lugar, definamos la variable con la que estamos trabajando.Sea X :“Variable cualitativa o atributo que representa la marca extranjerade automovil preferida.”

En este caso la muestra consta de n = 40 observaciones.

Por lo tanto: la suma de las frecuencias debe ser igual a 40.

Para tabular los datos en una tabla de frecuencias, se coloca en laprimera columna los valores de i , donde i varıa entre 1 y k, donde kcorresponde al numero de valores que toma la variable. En este casok = 5 ya que tenemos los valores X = A, X = C , X = J, X = F y X = B.

Page 22: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cualitativas

Ejemplo (Cont.)

Solucion

En la columna siguiente se presentan los valores que toma la variable.Como se trata de una variable cualitativa, ella representa una cualidad ypor lo tanto se denota con una letra en un orden arbitrario, como porejemplo, A, C, J, F y B para mantener la notacion original del ejercicio.

En la tercera columna se colocan las frecuencias absolutas de cada uno delos valores que toma la variable, la que se obtiene contando el numero deveces que aparece una respectiva cualidad en la muestra.

Finalmente en la ultima columna se presenta la frecuencia relativa la quese obtiene la dividir la frecuencia absoluta por el numero total deobservaciones (n = 40), es decir: f r

i = fin.

Page 23: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cualitativas

Ejemplo (Cont.)

Solucion

Luego, la tabla de frecuencias queda de la siguiente manera:

i Marca Frecuencia(fi) Frec. Relativa(f ri )

1 A 6 6/40 = 3/20

2 C 12 12/40 = 3/10

3 J 10 10/40 = 1/4

4 F 8 8/40 = 1/5

5 B 4 4/40 = 1/10

Total 40 1

Page 24: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cualitativas

Ejemplo (Cont.)

Solucion

Interpretemos algunos valores particulares de la tabla:

X f1 representa el total de veces que el valor A se repite en la muestra.Como el valor X = A se repite 6 veces y como a la A le asignamosarbitrariamente el valor i = 1 se tiene que f1 = 6. Lo mismo ocurrecon el resto de los valores.

X Veamos el caso de f r4 , es decir la frecuencia relativa del cuarto valor

que toma la variable. Que f r4 = 3

10significa que un quinto de las

preferencias de la gente se la lleva los vehıculos de nacionalidadfrancesa.

Page 25: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cualitativas

Ejemplo (Cont.)

Solucion

X f r2 = 1

10significa que los tres decimos de la gente prefiere los automoviles

coreanos.

X f r4 % significa interpretar la frecuencia porcentual del cuarto valor quetome la variable. La expresion para calcularlo es

f r4 % = f r

4 × 100

=1

5× 100

= 20

Esto significa que el 20% de las preferencias de la gente se las llevan losautomoviles de origen frances. J

Page 26: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Discretas

Calculo de Frecuencias para Variables CuantitativasDiscretas

Veamos

Para presentar los datos cuantitativos discretos se indica el numeroconsiderado y su frecuencia de aparicion.

Es similar al caso cualitativo.

Ejemplo

Supongase que los datos siguientes representan el numero de vehıculosque llega a una estacion de servicio en 30 perıodos de 5 minutos.

3 4 3 2 1 1 0 0 3 4 5 5 4 4 33 2 3 4 1 1 1 2 0 2 1 3 2 3 1

Agrupense los datos en una tabla que contenga las frecuencias y lasfrecuencias relativas.

Page 27: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Discretas

Ejemplo (Cont.)

Solucion

Sea X : “Variable que denota el numero de vehıculos que llega a unaestacion de servicio en un intervalo de tiempo de 5 minutos”.

Al igual que en el problema anterior, la construccion de la tabla defrecuencias se realiza de la siguiente forma: La primera columnarepresenta los valores de i , donde i = 1, . . . , k, con k = numero devalores que toma la variable. Para este ejemplo k = 6.

En la columna siguiente se colocan los valores que toma la variable (0, 1,2, 3, 4 y 5). En la tercera columna las frecuencias absolutas para cadauno de los valores de la variable, la que se obtiene al contar el numero deveces que aparece cada valor en la muestra.

Finalmente en la ultima columna se presenta la frecuencia relativa la quese obtiene: f r

i = fin

Page 28: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Discretas

Ejemplo (Cont.)

Solucion

La tabla de frecuencias queda de la siguiente manera:

i xi Frecuencia(fi) Frec. Relativa(f ri )

1 0 3 3/30 = 1/10

2 1 7 7/30

3 2 5 5/30 = 1/6

4 3 8 8/30 = 4/15

5 4 5 5/30 = 1/6

6 5 2 2/30 = 1/15

Total 30 1

X f4 = 8 significa que en 8 periodos de 5 minutos llegaron exactamente 3vehıculos.

X f r5 = 1

6significa que en la sexta parte de los vehıculos que se consideraron

llegaron exactamente 4 vehıculos. J

Page 29: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Calculo de Frecuencias para Variables CuantitativasContinuas

Veamos

En este caso cuando se dispone de cierto numero de valores referidos a unavariable continua, es conveniente agruparlos en intervalos de clase o categorıas.

Para seleccionar el numero k de intervalos de clases, o simplemente el numero k

de clases, existen diversas formas.

1 Una de ellas es considerar tal numero k de clases no menor de 5 ni mayorde 15. No menor de 5 para evitar la perdida de informacion que seproducirıa al reunir en una clase un grupo de datos muy diferentes; y, nomayor de 15 para de esta forma tener un facil manejo y con el propositode asegurar una compactacion de la informacion.

2 Otra forma de seleccionar el numero de k de clases es empleando la Reglade Sturges, en donde k = 1 + 3.3× log n, siendo n el tamano de lamuestra.

En general, las clases se eligen de modo que la amplitud de cada una de ellassea igual para todas las categorıas o intervalos de clases.

Page 30: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Calculo de Frecuencias para Variables CuantitativasContinuas

Veamos

Antes de ver un ejemplo es necesario definir el concepto de Marca de Clase. Sedenota por mi y corresponde al punto medio del intervalo de clase. Ella es larepresentante de la clase pues se atribuye el valor de la frecuenciacorrespondiente a dicha clase.

Ejemplo

Supongase que los datos a continuacion representan el precio aproximado de lalibra de cobre, en centavos de dolar para una muestra de 30 dıas, los que hansido ordenados convenientemente.

70 71 71 72 73 73 73 75 76 76 77 78 78 78 7878 79 79 80 81 81 82 83 84 84 84 84 87 89 91

Se pide agrupar los datos en una tabla de frecuencias.

Page 31: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Solucion

A continuacion se presenta paso a paso la forma de realizar una tabla de

frecuencias para una variable cuantitativa continua:

1 Se determina el rango o recorrido r , el que se define como ladiferencia entre los valores maximo y mınimo de la variablepresentes en la muestra.

2 Se determina el numero k de clases o categorıas, empleando Reglade Sturges.

3 Se obtiene la amplitud o tamano a del intervalo, dividiendo el rangopor el numero de clases.

4 Se seleccionan los lımites de clase que definen los intervalos, demanera que las clases sean de la misma magnitud y que cadaobservacion se clasifique sin ambiguedad en una sola clase.

5 Se cuenta el numero de observaciones en cada clase, es decir, sedeterminan las frecuencias absolutas de cada clase.

Page 32: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 1 - Valor del Rango

El rango o recorrido lo obtenemos de la siguiente manera:

r = xmax − xmin = 91− 70 = 21

xmax corresponde al maximo valor observable de la variable X (91) y xmin

al mınimo valor de X (70).

Page 33: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 2 - Numero de Clases

Como el valor de n = 30, aplicando la Regla de Sturges se llega a que

k = 1 + 3.3× log n

= 1 + 3.3× log 30

= 5.87 ≈ 6

Cabe destacar que el valor de k tiene que ser un numero entero (sindecimales).

El sımbolo ≈ significa aproximado o aproximadamente. Entonces5.87 ≈ 6 se lee 5.87 es aproximadamente 6.

Page 34: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 3 - Amplitud o Tamano del Intervalo

Se calcula dividiendo el rango por el numero de clases.

Si a denota la amplitud del intervalo entonces

a =r

k

=21

6= 3.5 ≈ 4

Page 35: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

En primer lugar obtenemos el primer intervalo de clase, cuyo lımiteaparente inferior es igual al mınimo valor que toma la variable en lamuestra. En este caso este lımite inferior vale xmin = 70.

Para obtener el lımite aparente superior del primer intervalo de clase,sumamos al lımite aparente inferior la amplitud menos 1. En este casoserıa xmin + (a− 1) = 70 + 4− 1 = 73.

Por lo tanto, nuestro primer intervalo (o clase) aparente es [70, 73[.

Por notacion, [70, 73[ se interpreta como el intervalo que contiene a todosaquellos numeros que sean mayores o iguales que 70 y menores que 73.Esta explicacion es valida para todos los intervalos que construyamos,salvo que hay que reemplazar por los valores numericos que correspondan.

Page 36: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Ojo

En este caso restamos una unidad, pero si la amplitud del intervalo declase se hubiese presentado con un decimal hubiesemos tenido que restar0.1.

Si se hubiese presentado con dos decimales tendrıamos que haber restado0.01.

Con tres decimales restamos 0.001 y ası sucesivamente.

Page 37: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

Tengamos presente que tenemos que construir un total de 6 intervalos, yaque k = 6 por la regla de Sturges.

Determinemos el lımite inferior del segundo intervalo. Este es igual allımite aparente inferior del intervalo anterior mas la amplitud. Es decir70 + 4 = 74.

El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso73 + 4 = 77.

Con esto, nuestro segundo intervalo (o clase) aparente es [74, 77[.

Page 38: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

Determinemos el lımite inferior del tercer intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir74 + 4 = 78.

El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso77 + 4 = 81.

Con esto, nuestro tercer intervalo (o clase) aparente es [78, 81[.

Page 39: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

Determinemos el lımite inferior del cuarto intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir78 + 4 = 82.

El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso81 + 4 = 85.

Con esto, nuestro cuarto intervalo (o clase) aparente es [82, 85[.

Page 40: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

Determinemos el lımite inferior del quinto intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir82 + 4 = 86.

El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso85 + 4 = 89.

Con esto, nuestro quinto intervalo (o clase) aparente es [86, 89[.

Page 41: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

Determinemos el lımite inferior del sexto y ultimo intervalo. Este es igualal lımite aparente inferior del intervalo anterior mas la amplitud. Es decir86 + 4 = 90.

El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso89 + 4 = 93.

Con esto, nuestro sexto intervalo (o clase) aparente es [90, 93[.

Page 42: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

Una vez que se obtienen los intervalos o clases aparentes, se tienen queconstruir los intervalos o clases reales.

Esto se debe a que existe una diferencia numerica entre el lımite inferioraparente de un intervalo con el lımite superior aparente de otro intervalo,lo que le quita el caracter de continuo a la variable X :“Variable quedescribe el precio diario aproximado de la libra de cobre en centavos dedolar”.

Determinando las clases reales, recobramos lo continuo de X .

Page 43: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 4 - Lımites de cada Clase o Intervalo

Para la formacion de los intervalos de clase real, a cada uno de los lımitesinferiores de las clases aparentes se le debe restar 0.5, en caso que losdatos estan presentados sin decimales.

En nuestro caso, como los datos los tenemos sin decimales, tendremosque el lımite real inferior asociado con el primer intervalo sera igual a70− 0.5 = 69.5.

De igual forma, para obtener el lımite real superior de cada intervalo declase se debe sumar 0.5, en caso que los datos vengan sin decimales.

En este caso, el lımite real superior asociado con el primer intervalo esigual a 73 + 0.5 = 73.5.

Page 44: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Ojo

Si los datos se presentan con un decimal, para obtener el lımite realinferior de cada intervalo de clase se debe restar 0.05 al lımite aparenteinferior.

Si estan presentados con dos decimales se debe restar 0.005.

Si estan con 3 decimales, restaremos 0.0005 y ası sucesivamente.

Para el caso de los lımites reales superiores en vez de restar, sumamos 0.5o 0.05 o 0.005 segun como se presenten los datos.

Page 45: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Paso 5 - Conteo de la Frecuencia Absoluta de cada ClaseLa tabla de frecuencias nos queda de la siguiente forma:

i Clase Aparente Clase Real fi f ri mi

1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5

2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5

3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5

4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5

5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5

6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5

Total 30 1

Page 46: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Observacion

Se entiende por lımite de clase a los numeros que aparecen en losextremos de cada clase, con lo cual los lımites de la izquierda y de laderecha corresponden a los lımites de clase inferior y superiorrespectivamente.

Al respecto tambien se definen los lımites de clase aparentes oaproximados y los lımites reales o verdaderos de clase.

En los lımites aparentes se consideran los valores tal como aparecen en lamuestra, esto es, tal como fueron aproximados, ya sea al numero enteromas proximo.

En el caso de los lımites reales , estos se determinan de tal modo quereflejen la forma como fueron redondeados los datos, por lo que estossiempre contienen como mınimo un decimal que termina en cinco.

Page 47: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Ejemplo (Cont.)

Algunas Interpretaciones

X f2 = 4 significa que durante cuatro dıas el precio aproximado de la librade cobre fluctuo entre los 74 y 77 centavos de dolar. (Revisando lasclases aparentes).

X Viendo las clases reales, podrıamos decir que f2 = 4 durante 4 dıas lalibra de cobre tuvo un precio mayor o igual que los 73.5 centavos de dolary menor que 77.5 centavos de dolar.

X f r6 = 1

30significa que en la treintava parte de las observaciones el valor

diario del precio de la libra de cobre vario entre los 90 y 93 centavos dedolar.

X En terminos porcentuales, se ve que en el f r6 % = 1

30× 100 = 3.33 por

ciento de las observaciones, el valor diario del precio de la libra de cobreoscilo entre los 90 y 93 centavos de dolar. J

Page 48: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Calculo de Frecuencia segun el tipo de Variable

Calculo de Frecuencias para Variables Cuantitativas Continuas

Palabras al cierre. . .

Observacion

En caso que la muestra contenga una gran variedad de datos numericosque en principio se puedan clasificar de discretos deberemos trabajarloscomo si fueran continuos y agruparlos en clases para ası evitar que latabla de frecuencia quede demasiado grande.

Se recomienda que la cantidad total de valores que pueda asumir lavariable no exceda el valor de k = 10.

Page 49: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Introduccion

Introduccion a los Graficos

La representacion grafica de los datos es un complemento que permiteapreciar visualmente como se presenta la informacion.

Existe una gran variedad de graficos para representar los datos, lo quenaturalmente depende del tipo de variable que se esta estudiando.

Page 50: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Introduccion

Tipos de Grafico segun la clasificacion de la variable enestudio

Dependiendo si la variable que estamos analizando es cualitativa,cuantitativa discreta o cuantitativa continua, tendremos los siguientestipos de grafico:

Tipo de Variable Grafico(s) Asociado(s)Cualitativa Torta, Barra.

Cuantitativa Discreta Varas.

Cuantitativa Continua Histograma, Polıgono de frecuencias, Ojiva.

Page 51: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para variables Cualitativas

Grafico de Torta (o Sectorial)

Grafico de Torta

A cada frecuencia porcentual se le asocia un angulo de la circunferencia.

Si f ri % representa la frecuencia porcentual asociada con el i−esimo valor

de la variable cualitativa, entonces los grados que le corresponden en elgrafico quedan determinados por la expresion

αo

i =f ri %

100%× 360o

Page 52: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para variables Cualitativas

Grafico de Torta (o Sectorial)

Grafico de Torta (Cont.)

Por ejemplo

Consideremos la tabla de frecuencias del ejemplo de la nacionalidad deauto extranjero preferido por la gente:

i Marca Frecuencia(fi) Frec. Relativa(f ri ) f r

i %

1 A 6 6/40 = 3/20 15

2 C 12 12/40 = 3/10 30

3 J 10 10/40 = 1/4 25

4 F 8 8/40 = 1/5 20

5 B 4 4/40 = 1/10 10

Total 40 1 100

Page 53: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para variables Cualitativas

Grafico de Torta (o Sectorial)

Grafico de Torta (Cont.)

Por ejemplo, para i = 3 (es decir, X = J) le hacemos corresponder

αo

3 =f r3 %

100%× 360o = 25

100× 360o = 90o.

Para i = 5 tendremos αo

5 =f r5 %

100%× 360o = 10

100× 360o = 36o y ası

sucesivamente.

El grafico que resulta se muestra en la siguiente lamina.

Page 54: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para variables Cualitativas

Grafico de Torta (o Sectorial)

Grafico de Torta (Cont.)

Page 55: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para variables Cualitativas

Grafico de Barras

Grafico de Barras

Esta formado por una serie de rectangulos cuyas bases estan sobre el ejehorizontal y cuyas alturas son proporcionales a las frecuencias.

Las dimensiones de las bases de los rectangulos son arbitrarias pero debenser iguales.

Los rectangulos no tienen frontera vertical comun, pero por convenciontienen que estar a una misma distancia.

Page 56: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para variables Cualitativas

Grafico de Barras

Grafico de Barras (Cont.)Ejemplo

Consideremos nuevamente las preferencias por marcas extranjeras devehıculos, de acuerdo a un sondeo realizado a 40 personas queparticiparon de una muestra.

El grafico de barras es el siguiente:

Page 57: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Grafico para Variable Cuantitativa Discreta

Grafico de Varas

Grafico de Varas

Consiste en una serie de segmentos de recta situadas sobre el ejehorizontal y cuyas longitudes son proporcionales a las frecuencias.

Los segmentos de recta tienen forma de varas. De ahı el nombre.

Page 58: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Grafico para Variable Cuantitativa Discreta

Grafico de Varas

Grafico de Varas (Cont.)Ejemplo

Consideremos la variable X :“Numero de vehıculos que llega a una estacion deservicio en intervalos de 5 minutos” que esta asociada con el ejemplo deconstruccion de tablas de frecuencia para variables cuantitativas discretas. Sugrafico de varas es el siguiente:

Page 59: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Histograma

Histograma

El Histograma representa datos que se encuentran agrupados en clases ocategorıas.

Consiste en una serie de rectangulos con fronteras verticales comunes, endonde las bases de los rectangulos son iguales a las amplitudes o anchurasde clase y las alturas son proporcionales a las frecuencias.

Se “parece” a un grafico de barras con la diferencia que los rectangulosvan unidos entre sı.

Por ejemplo

Consideremos el ejemplo dado para el caso de creacion de tablas defrecuencias en variables cuantitativas continuas que estaba relacionadocon la variacion del precio de la libra de cobre, expresada en centavos dedolar.

Page 60: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Histograma

Histograma (Cont.)

El histograma asociado con el ejemplo anterior es el que se muestra acontinuacion:

Page 61: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Polıgono de Frecuencias

Polıgono de Frecuencias

Proporciona una representacion suavizada de un conjunto de valores.

Para construir este grafico, hay que unir los puntos medios situados sobrelos techos de rectangulos del histograma, en donde tales puntos medioscorresponden a las marcas de clase.

El polıgono de frecuencias se completa agregando dos segmentos derecta: uno antes de la primera clase y el otro despues de la ultima claseasignandoles artificialmente el valor cero en cada tipo de frecuencia. Estodebido a que “antes” y “despues” de recogidos los datos no se registraronobservaciones con esos valores.

Page 62: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Polıgono de Frecuencias

Polıgono de FrecuenciasEjemplo

Considerando el mismo ejemplo de la variacion del precio de la libra de cobre encentavos de dolar, el polıgono de frecuencias serıa el siguiente:

Page 63: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Ojiva

Ojiva

La Ojiva representa las frecuencias acumuladas y ademas proporciona unadescripcion visual de como se acumulan los valores de la variable.

Los puntos que unen cada uno de los segmentos de recta que forman elpolıgono son aquellos que tienen como coordenadas el lımite real superiorde clase en la abscisa y el valor de la frecuencia acumulada en laordenada (que tambien puede ser la frecuencia relativa acumulada o lafrecuencia porcentual acumulada).

Page 64: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Ojiva

Ojiva(Cont.)Ejemplo

Construyamos una nueva columna a la tabla de frecuencias del ejemplo de lalibra de cobre donde registremos los valores de la frecuencia acumulada:

i Clase Aparente Clase Real fi f ri mi Frec. Acum.

1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5 7

2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5 11

3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5 21

4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5 27

5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5 29

6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5 30

Total 30 1

Page 65: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Ojiva

Ojiva(Cont.)Ejemplo (Cont.)

De esta manera, el grafico de ojiva es el siguiente:

Page 66: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Graficos para Variables Cuantitativas Continuas

Ojiva

Ojiva (Cont.)

Algunas observaciones

La gracia que tiene este tipo de grafico es que permite ver cuantasobservaciones son menores o iguales a un cierto valor especificado.

Por ejemplo, a partir de la ojiva exhibida en la lamina anterior quedurante 21 dıas el valor del precio de la libra de cobre fue aumentandohasta alcanzar un valor aproximado de 81.5 centavos de dolar.

Page 67: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Part IV

Estadıgrafos

Page 68: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Generalidades

Introduccion

En la primera parte del curso aprendimos a tabular los datos procedentesde una muestra a traves de lo que denominamos tablas de frecuencia, lascuales tenıan su particular forma de construccion dependiendo del tipo devariable en estudio.

Posterior a ello se procedio a hacer graficos, cuya unica finalidad erapresentar de un modo amigable y resumido la informacion contenida en latabla, facilitando con ello la lectura de los datos procedentes de lamuestra.

Page 69: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Generalidades

Introduccion (Cont.)

En esta etapa del curso seguiremos describiendo la informacion de una

muestra de una manera mas fina, tratando de responder a las siguientes

preguntas:

1 ¿Alrededor de que valor se agrupan los datos?2 En el caso que efectivamente se agrupen alrededor de un valor

dado:

¿como lo hacen?¿muy concentrados?¿muy dispersos?

Para ello, el concepto de estadıgrafo sera de vital importancia.

Page 70: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Generalidades

Estadıgrafos

Los estadıgrafos son medidas descriptivas que resumen los datos en formacuantitativa.

Estos pueden ser de dos clases:

1 Estadıgrafos de posicion o de tendencia central:

1 Media aritmetica.2 Mediana.3 Moda.4 Percentiles, deciles, quintiles, cuartiles.

2 Estadıgrafos de variabilidad o de dispersion de los datos:

1 Rango.2 Varianza.3 Desviacion estandar (o desviacion tıpica).4 Coeficiente de Variacion.

Page 71: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Generalidades

Estadıgrafos (Cont.)

Observacion

El calculo de cada estadıgrafo va a depender del tipo de variable queestemos considerando.

En la siguiente tabla se muestra si es posible o no obtener el estadıgrafopara los diferentes tipos de variable:

Estadıgrafo Variable Cualitativa Variable CuantitativaMedia Aritmetica χ X

Mediana χ XModa X X

Percentiles χ XRango χ X

Varianza χ XDesviacion Estandar χ XCoef. de Variacion χ X

Page 72: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Generalidades

Caracterizacion de los elementos de una muestra

Vamos a formalizar la notacion que hemos estado empleando paradesignar los elementos que conforman una muestra.

En forma somera hemos denotado por n al tamano de esta y por xmax ypor xmin al valor maximo y mınimo presente en ella, respectivamente.

Ahora veremos como individualizar al resto de los elementos que lacomponen.

Para ello emplearemos la notacion de subındice, donde si X representa auna variable asociada a una muestra de tamano n, entonces el valor decada observacion la denotaremos por xi , i = 1, n.

Page 73: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Generalidades

Caracterizacion de los elementos de una muestra (Cont.)

Por ejemplo

Consideremos la siguiente muestra que representa la edad de un grupo de10 personas:

5 10 34 23 12 19 21 27 54 37

Podemos decir entonces que n = 10, xmax = 54 y que xmin = 5.

Ademas: x1 = 5, x2 = 10, x3 = 34, x4 = 23, x5 = 12, x6 = 19, x7 =21, x8 = 27, x9 = 54, x10 = 37.

Esto quiere decir que la primera edad observada fue de 5 anos, la segundafue igual a 10 anos, la quinta edad fue de 12 y ası sucesivamente.

Page 74: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media Aritmetica

La medida de tendencia central de mayor uso teorico y practico es lamedia aritmetica, que tambien suele llamarse promedio o simplementemedia.

En caso que estemos en presencia una variable cuantitativa discreta, lamedia aritmetica del conjunto de valores es igual a la suma de todos losdatos dividida por el tamano de la muestra.

En caso que la muestra este relacionada con una variable cuantitativacontinua, deberemos considerar en el calculo del promedio los valores delas marcas de cada intervalo.

El promedio lo simbolizaremos por X .

La media aritmetica la vamos a presentar con una cifra decimal extra enrelacion a como vengan presentados los datos de la muestra. Si porejemplo los valores muestrales tienen un decimal, el promedio lodejaremos con 2 decimales y ası sucesivamente.

Page 75: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media AritmeticaCaso de Variables Cuantitativas Discretas

Si tenemos una variable cuantitativa discreta que toma un total de kvalores de la forma x1, x2, . . . , xk cuyas frecuencias absolutas denotamospor f1, f2, . . . , fk , la media esta dada por la suma de los productos entrelos diferentes k valores observados y su respectiva frecuencia absoluta,dividido por el total de la muestra.

Formalmente:

X =x1f1 + x2f2 + · · ·+ xk fk

f1 + f2 + · · ·+ fk

=

k∑i=1

xi fi

k∑i=1

fi

=

k∑i=1

xi fi

n

Page 76: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media Aritmetica

Caso de Variables Cuantitativas Discretas: X =

k∑i=1

xi fi

n

Por ejemplo

Sea X : “Variable que denota el numero de vehıculos que llega a unaestacion de servicio en un intervalo de 5 minutos”.

Los datos estan reflejados en la siguiente tabla de distribucion defrecuencias:

i Valor = xi fi xi × fi1 0 3 0× 3 = 0

2 1 7 1× 7 = 7

3 2 5 2× 5 = 10

4 3 8 3× 8 = 24

5 4 5 4× 5 = 20

6 5 2 5× 2 = 10

Total 30 71

Page 77: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media Aritmetica

Caso de Variables Cuantitativas Discretas: X =

k∑i=1

xi fi

n

Por ejemplo (cont.)

Es decir:k∑

i=1

xi fi = 71.

Como k = 6, n = 30 yk∑

i=1

xi fi se concluye que X =71

30= 2.4

Esto significa que en los 30 intervalos de tiempo que se consideraron,cada 5 minutos entraron 2.4 autos a la estacion de servicio. J

Page 78: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media AritmeticaCaso de Variables Cuantitativas Continuas

En caso que tener una variable cuantitativa continua donde sus datosesten agrupados en k clases o categorıas y cuyas frecuencias de aparicionlas denotemos por fi , i = 1, k y cuyas marcas de clase por mi , i = 1, n,entonces la media aritmetica viene dada por la siguiente expresion:

X =m1f1 + m2f2 + · · ·+ mk fk

f1 + f2 + · · ·+ fk

=

k∑i=1

mi fi

k∑i=1

fi

=

k∑i=1

mi fi

n

Page 79: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media Aritmetica

Caso de Variables Cuantitativas Continuas: X =

k∑i=1

mi fi

n

Por ejemplo

Los datos que a continuacion se presentan tabulados representan el precioaproximado de la libra de cobre, en centavos de dolar para una muestrade 30 dıas, los que han sido ordenados convenientemente:

i Int. Clase Real fi mi mi × fi1 [69.5, 73.5[ 7 71.5 71.5× 7 = 500.5

2 [73.5, 77.5[ 4 75.5 75.5× 4 = 302

3 [77.5, 81.5[ 10 79.5 79.5× 10 = 795

4 [81.5, 85.5[ 6 83.5 83.5× 6 = 501

5 [85.5, 89.5[ 2 87.5 87.5× 2 = 175

6 [89.5, 93.5[ 1 91.5 91.5× 1 = 91.5

Total 30 2365

Page 80: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media Aritmetica

Caso de Variables Cuantitativas Continuas: X =

k∑i=1

mi fi

n

Por ejemplo

Como k = 6, n = 30 yk∑

i=1

mi fi = 2365 se concluye que X = 236530

= 78.8

Esto significa que el promedio del valor de la libra de cobre expresada encentavos de dolar es de 78.8. J

Page 81: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Promedio o Media Aritmetica

Promedio o Media Aritmetica

Observacion

La media se interpreta como aquel valor en donde los demas valorestienden a agruparse en torno a el.

La media de un conjunto de datos es como el “punto de equilibrio” deellos, haciendo una analogıa con el concepto fısico de centro de gravedadpara una distribucion de masas.

Page 82: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

Mediana

La mediana es un estadıgrafo cuyo proposito es el dividir la distribucionde frecuencias en dos partes iguales, de tal manera que pasa adesempenar el rol del termino central de la muestra.

Para ello es obligatorio que el conjunto de datos que componen lamuestra esten ordenados.

Da lo mismo si los datos se ordenan de menor a mayor o de mayor amenor. Para unificar criterios lo haremos de menor a mayor.

La denotaremos por Me.

Es posible que el valor que tome la mediana no este dentro de la muestrainicial.

Page 83: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

MedianaMediana para Variables Cuantitativas Discretas

Cuando la variable en juego es cuantitativa discreta se distinguen 2 casos:n es par o n es impar.

Si suponemos que la muestra inicial la hemos ordenado y sus valores los

denotamos genericamente por x1, x2, . . . , xn entonces:

1 Si n es par: Me =x( n

2 )+ x( n

2+1)

2, es decir, el promedio aritmetico

de los dos terminos centrales de la muestra.2 Si n es impar: Me = x( n+1

2 )

Page 84: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

MedianaMediana en el caso de Variables Cuantitativas Discretas: Me =

x( n

2 )+x

( n2

+1)2

si n es parMe = x( n+1

2 ) si n es impar

Por ejemplo

Consideremos la siguiente muestra correspondiente al numero deduraznos en mal estado presentes en 6 cajas: 0,5,3,1,8,2.

Para hallar la mediana de la muestra, debemos ordenar los valores. Deeste modo obtenemos: 0,1,2,3,5,8.

Si definimos por X a la variable relacionada con el total de duraznos enmal estado presentes en cada caja, entonces los elementos de la muestraseran x1 = 0, x2 = 1; x3 = 2, x4 = 3, x5 = 5 y x6 = 8.

Por otro lado: n = 6 y por lo tanto deberemos aplicar la formula valida

para muestras de tamano par. Esta nos dice que Me =x( n

2 )+x

( n2

+1)2

.

Page 85: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

MedianaMediana en el caso de Variables Cuantitativas Discretas: Me =

x( n

2 )+x

( n2

+1)2

si n es parMe = x( n+1

2 ) si n es impar

Por ejemplo (Cont.)

Recordando que x1 = 0, x2 = 1; x3 = 2, x4 = 3, x5 = 5 y x6 = 8 tendremosque x( n

2 )= x( 6

2 )= x3 = 2. Por otro lado x( n

2+1) = x( 6

2+1) = x4 = 3.

Luego: Me =x( n

2 )+ x( n

2+1)

2=

x3 + x4

2=

2 + 3

2=

5

2= 2.5

Esto significa que el 50% del total de las cajas consideradas en la muestratienen menos de 2.5 duraznos en mal estado y que el 50% restantesobrepasa esa cantidad. J

Page 86: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

MedianaMediana en el caso de Variables Cuantitativas Discretas: Me =

x( n

2 )+x

( n2

+1)2

si n es parMe = x( n+1

2 ) si n es impar

Otro ejemplo

Supongamos que ahora tenemos 7 cajas con duraznos donde la cantidad defruta en mal estado en cada caja es 0,2,3,6,7,7,9.

Esto es: x1 = 0, x2 = 2, x3 = 3, x4 = 6, x5 = 7, x6 = 7 y x7 = 9.

Claramente los datos estan ordenados en forma creciente y n = 7 es impar.

Luego, para hallar la mediana aplicaremos la formula para muestras de tamanoimpar.

Lo que hay que hacer es encontrar el valor que ocupa la posicionx( n+1

2 ) = x( 7+12 ) = x4 = 6.

Luego: Me = x4 = 6.

Esto quiere decir la mitad de las cajas contienen menos de 6 duraznos en malestado y que mas de la mitad sobrepasa ese valor. J

Page 87: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

MedianaMediana para Variables Cuantitativas Continuas

En este caso es necesario contar con la columna que contenga las frecuenciasacumuladas de cada intervalo (de clase o real da lo mismo).

La frecuencia absoluta de cada intervalo la denotaremos por Fi , i = 1, k.

Sean:

1 LIj : lımite inferior del primer intervalo tal que Fj ≥ n2. Diremos que ese

intervalo contiene a la mediana.2 j : ındice asociado con el intervalo que contiene la mediana.3 fj : frecuencia absoluta del intervalo que contiene a la mediana.4 F(j−1): frecuencia acumulada del intervalo anterior al de la mediana.

5 a: amplitud del intervalo que contiene a la mediana. Recordemos quea = r

ko bien a = ls − li donde ls y li denotan los lımites superior e inferior

del intervalo, respectivamente.

De esta manera, la expresion analıtica para calcular el valor de la mediana paradatos agrupados es

Me = LIj +

(n2− F(j−1)

Fj − F(j−1)

)× a

Page 88: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

MedianaMediana para Variables Cuantitativas Continuas: Me = LIj +

( n2−F(j−1)

Fj−F(j−1)

)× a

Por ejemplo

Consideremos la tabla de frecuencias del precio de la libra de cobre expresada encentavos de dolar. A dicha tabla le agregaremos la columna de las frecuenciasacumuladas, que las denotaremos por Fi :

i Int. Clase Real fi mi Fi

1 [69.5, 73.5[ 7 71.5 72 [73.5, 77.5[ 4 75.5 113 [77.5, 81.5[ 10 79.5 214 [81.5, 85.5[ 6 83.5 275 [85.5, 89.5[ 2 87.5 296 [89.5, 93.5[ 1 91.5 30

Total 30

El tamano de la muestra n = 30. Luegon

2= 15. El intervalo cuya frecuencia

absoluta acumulada es inmediatamente superior a 15 es [77.5, 81.5[ ya que 21es el primer valor de las frecuencias absolutas acumuladas que es mayor o iguala 15.

Page 89: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Mediana

MedianaMediana para Variables Cuantitativas Continuas: Me = LIj +

( n2−F(j−1)

Fj−F(j−1)

)× a

Ejemplo (Cont.)

Mirando la tabla se observa que este intervalo ocupa la posicion asociada con elındice 3. Luego, el valor de j = 3.

Por otro lado:

LIj = LI3 = 77.5F(j−1) = F(3−1) = F2 = 11Fj = F3 = 21a = 81.5− 77.5 = 4

Luego:

Me = LIj +

(n2− F(j−1)

Fj − F(j−1)

)×a = 77.5+

(15− 11

21− 11

)×4 = 77.5+

4

10×4 = 79.1

Esto significa que en menos de la mitad de los valores observados, el precio de lalibra de cobre no sobrepaso los 79.1 centavos de dolar. J

Page 90: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Moda

ModaModa en Variables Cualitativas y Cuantitativas Discretas

La moda corresponde al valor de la variable que ocupa la mayorfrecuencia absoluta.

Para el caso de variables cualitativas y cuantitativas discretas, basta conobservar la tabla de frecuencias y ver cual es el valor que tiene la mayorfrecuencia absoluta.

La denotaremos por Mo.

Si existe empate entre diferentes valores con las frecuencias absolutasmayores, diremos que la muestra no tiene moda.

Page 91: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Moda

ModaModa en Variables Cualitativas

Por ejemplo

Consideremos la nacionalidad de auto preferida por la gente en unamuestra que consto de 40 personas. En este caso A significa aleman, Ccoreano, J japones, F frances y B brasileno.

La tabla de frecuencias se muestra a continuacion:

i Marca fi1 A 6

2 C 12

3 J 10

4 F 8

5 B 4

Total 40

La mayor frecuencia absoluta es igual a 12. Luego, los automoviles debandera coreana son los preferidos por la gente que participo en laencuesta. J

Page 92: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Moda

ModaModa en Variables Cuantitativas Discretas

Por ejemplo

Recordando el ejemplo del numero de automoviles que llegan a la estacionde servicio en 30 intervalos de 5 minutos y su tabla de frecuencias:

i Valor = xi fi1 0 3

2 1 7

3 2 5

4 3 8

5 4 5

6 5 2

Total 30

Por simple inspeccion se tiene que la maxima cantidad de vehıculos quellegaron a la estacion de servicio en un intervalo de 5 minutos es igual a8. J

Page 93: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Moda

ModaModa en Variables Cuantitativas Continuas

Se construye la tabla de distribucion de frecuencias y se ubica el intervalo quecontenga la mayor frecuencia absoluta. Sea LIj el lımite inferior de ese intervalo.

Si denotamos por fj a la frecuencia absoluta de ese intervalo, entonces:

f(j−1) correspondera a la frecuencia del intervalo anterior al que contienela moda.fj+1 sera la frecuencia absoluta del intervalo que viene inmediatamente acontinuacion del intervalo modal.

Sean ademas:

∆1 = fj − f(j−1)

∆2 = fj − fj+1

Entonces:

Mo = LIj +

(∆1

∆1 + ∆2

)× a

Page 94: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Moda

ModaModa en Variables Cuantitativas Continuas: Mo = LIj +

(∆1

∆1+∆2

)× a

Por ejemplo

Determinemos la moda del ejemplo del precio de la libra de cobre. Recordemosla tabla de frecuencias relacionada a ese problema:

i Int. Clase Real fi mi Fi

1 [69.5, 73.5[ 7 71.5 72 [73.5, 77.5[ 4 75.5 113 [77.5, 81.5[ 10 79.5 214 [81.5, 85.5[ 6 83.5 275 [85.5, 89.5[ 2 87.5 296 [89.5, 93.5[ 1 91.5 30

Total 30

El intervalo de clase que tiene la mayor frecuencia absoluta (10) es [77.5, 81.5[.

El lımite inferior de este intervalo es igual a 77.5 y esta asociado con el ındice 3.Luego j = 3 y en consecuencia LIj = LI3 = 77.5. La amplitud a del intervalo es81.5− 77.5 = 4.

Page 95: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Moda

ModaModa en Variables Cuantitativas Continuas: Mo = LIj +

(∆1

∆1+∆2

)× a

Ejemplo (Cont.)

Ademas:

fj = f3 = 10f(j−1) = f(3−1) = f2 = 4.f(j+1) = f(3+1) = f4 = 6

Esto nos conduce a que

∆1 = fj − f(j−1) = f3 − f2 = 10− 4 = 6∆2 = fj − f(j+1) = f3 − f4 = 10− 6 = 4

Por lo tanto:

Mo = LIj +

(∆1

∆1 + ∆2

)× a = 77.5 +

6

6 + 4× 4 = 77.5 +

6

10× 4 = 79.9,

lo que significa que el valor del precio de la libra de cobre que mas serepitio en la muestra fue de 79.9 centavos de dolar. J

Page 96: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Estadıgrafos de PosicionIntroduccion

Tambien conocidos como estadıgrafos de posicion, son aquellos que daninformacion acerca del orden en la estructura de la muestra.

De comienzos del curso conocemos dos: el valor maximo y el mınimo.

A contar de ahora asumiremos que la muestra de datos se encuentraordenada en orden creciente. Esto es: x1 ≤ x2 ≤ · · · ≤ xn.

De esta manera: xmin = x1 y xmax = xn.

Centraremos nuestra atencion en describir algunos valores de localizacionque permiten dividir la muestra en varias partes iguales con el objetivo deir viendo como se concentran los datos que se alojan en ella.

Page 97: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

EstadıgrafosPercentil

Los percentiles son numeros que dividen a la muestra en 100 partesiguales.

En total tenemos 99 percentiles y denotaremos por Pk al percentil deorden k, con k = 1, 99.

El percentil Pk divide a la muestra en dos partes:

una a la izquierda de Pk que contiene al k% inferior de lasobservaciones.una a la derecha de Pk que contiene al (100− k)% de lasobservaciones.

Entre dos percentiles consecutivos esta contenido un 1% de la muestra.

El calculo de cada percentil se hara dependiendo del tipo de variable queeste en juego.

Page 98: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de PercentilesVariable Cuantitativa Discreta

Sea Lk la posicion del percentil que andamos buscando.

Explıcitamente: Lk =n × k

100Entonces:

Pk =

xdLke , si Lk no es un numero entero

xLk + xdL(k+1)e

2, si Lk es entero

Por notacion: dLke corresponde al numero entero que es inmediatamentemayor que Lk .

Page 99: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de PercentilesVariable Cuantitativa Continua

Al igual que en el calculo de la mediana, requerimos contar con la columnacorrespondiente a la frecuencia acumulada de cada intervalo.

La frecuencia absoluta de cada intervalo la denotaremos por Fi , i = 1, k.

Si buscamos el percentil de orden m, definamos:

1 LIj : lımite inferior del primer intervalo tal que Fj ≥ m×n100

. Diremos que eseintervalo contiene al percentil que andamos buscando.

2 j : ındice asociado con el intervalo que contiene al percentil.3 fj : frecuencia absoluta del intervalo que contiene al percentil.4 F(j−1): frecuencia acumulada del intervalo anterior al percentil.

5 a: amplitud del intervalo que contiene al percentil. Recordemos quea = r

k.

De esta manera, la expresion analıtica para calcular el percentil de orden m es

Pm = LIj +

(m×n100

− F(j−1)

Fj − F(j−1)

)× a, m = 1, 99

Page 100: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Algunos Percentiles de interesCuartiles, Deciles, Quintiles

Existen percentiles que son ampliamente utilizados y que llevan nombrepropio. Entre ellos destacan los cuartiles, quintiles y deciles.

Los cuartiles dividen la muestra en 4 partes iguales. Se denotan porQ1, Q2, Q3.

Los quintiles dividen la muestra en 5 partes iguales. Se denotan porC1, C2, C3, C4.

Los deciles dividen la muestra en 10 partes iguales. Se denotan porD1, D2, D3, D4, D5, D6, D7, D8, D9.

Page 101: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Algunos Percentiles de interesRelaciones entre ellos

Me = P50 = Q2 = D5

C4 = P80 = D8

C1 = D2 = P20

etc.

Page 102: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Algunos Percentiles de interes

Observacion

La forma de calcularlos se basa en buscar la equivalencia con el percentilcorrespondiente (esto siempre se puede hacer).

Luego aplicar la formula correspondiente como si se tratara de unpercentil de orden k ya sea si la variable en juego es cuantitativa discretao continua.

Page 103: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.

Pk =

xdLke , si Lk no es un numero entero

xLk + xdL(k+1)e

2, si Lk es entero

Por ejemplo

Determinar los valores de Q3, D7 y P42 para los elementos de la siguientemuestra: 4, 7, 8, 10, 15, 20, 24, 24, 25, 25.

En primer lugar la muestra tiene un total de n = 10 valores que sonx1 = 4, x2 = 7, x3 = 8, x4 = 10, x5 = 15, x6 = 20, x7 = 24, x8 = 24, x9 = 25 yx10 = 25.

Por otro lado, en virtud de la equivalencia existente entre los estadıgrafosexistentes podemos afirmar que el problema se reduce a encontrar los percentilesP75, P70 y P42.

Page 104: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.

Pk =

xdLke , si Lk no es un numero entero

xLk + xdL(k+1)e

2, si Lk es entero

Hallar P75,P70 y P42 para la muestra4, 7, 8, 10, 15, 20, 24, 24, 25, 25

Para Q3 = P75 consideramos k = 75 y calculamos

Lk =k × n

100=

75× 10

100= 7.5.

Como 7.5 no es un numero entero, diremos que P75 = xdLke = xd7.5e = x8 = 24.

Luego P75 = 24. Se interpreta como que el 75% de las observaciones estan pordebajo del valor 24 y que el 25% restante lo sobrepasan.

Page 105: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.

Pk =

xdLke , si Lk no es un numero entero

xLk + xdL(k+1)e

2, si Lk es entero

Hallar P75,P70 y P42 para la muestra4, 7, 8, 10, 15, 20, 24, 24, 25, 25

Para el caso de D7 = P70 consideramos k = 75 y calculamos

Lk =k × n

100=

70× 10

100= 7. Como Lk = L70 = 7 es entero, deberemos

calcular el valor de Lk+1 = L(70+1) = L71 = 71×10100

= 7.1 ⇒ dL71e = 8

De esta manera: P70 =xLk + xL(k+1)

2=

x7 + x8

2=

24 + 24

2= 24

Page 106: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.

Pk =

xdLke , si Lk no es un numero entero

xLk + xdL(k+1)e

2, si Lk es entero

Hallar P75,P70 y P42 para la muestra4, 7, 8, 10, 15, 20, 24, 24, 25, 25

Finalmente para encontrar el valor de P42 hacemos k = 42, con lo cualLk = 42×10

100= 4.2.

Como 4.2 no es un numero entero se sigue queP42 = xdLke = xd4.2e = x5 = 15.

Por lo tanto: P42 = 15. J

Page 107: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de Percentiles de orden k , k = 1, 99

Variable Cuantitativa Continua: Pk = LIj +

(k×n100

−F(j−1)

Fj−F(j−1)

)× a, k = 1, 99, Fj ≥ k×n

100

Por ejemplo

Encontrar los valores de Q1, D3 y P45 para los datos de una muestra cuyatabla de frecuencia es

i Int. Clase Real fi Fi

1 [45, 55[ 6 62 [55, 65[ 10 163 [65, 75[ 19 354 [75, 85[ 11 465 [85, 95[ 4 50

Total 50

Es necesario precisar que, en virtud de la equivalencia existente cuartiles,quintiles y deciles con los percentiles, nuestro problema se reduce a hallarQ1 = P25, D3 = P30 y P45.

Page 108: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de Percentiles de orden k , k = 1, 99

Variable Cuantitativa Continua: Pk = LIj +

(k×n100

−F(j−1)

Fj−F(j−1)

)× a, k = 1, 99, Fj ≥ k×n

100

Hallar Q1 = P25,D3 = P30 y P45

Para Q1 = P25 deberemos encontrar el intervalo cuya frecuenciaacumulada sea inmediatamente superior a k×n

100, con k = 25 y n = 50. Es

decir, mayor o igual que 25×50100

= 12.5.

Dicho intervalo es [55, 65[ cuyo lımite inferior es 55 y cuyo ındiceasociado j = 2 y cuya amplitud vale a = 65− 55 = 10.

Ası: Fj = F2 = 16, F(j−1) = F(2−1) = F1 = 6.

Luego Q1 = P25 = 55 + 50/4−616−6

× 10 = 61.5.

Esto se interpreta como que el 25% de los datos es menor o igual que61.5 y que el 75% restante es mayor que ese numero.

Page 109: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Calculo de Percentiles de orden k , k = 1, 99

Variable Cuantitativa Continua: Pk = LIj +

(k×n100

−F(j−1)

Fj−F(j−1)

)× a, k = 1, 99, Fj ≥ k×n

100

Hallar Q1 = P25,D3 = P30 y P45

En forma analoga se concluye que:

D3 = P30 = 55 +30×50

100− 6

16− 6× 10 = 64 (segundo intervalo)

P45 = 65 +45×50

100− 16

35− 16× 10 = 68.4 (tercer intervalo) J

Page 110: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Diagrama de CajasBox and Whisker Plot

Presentacion visual que describe al mismo tiempo varias caracterısticas

importantes de un conjunto de datos tales como:

centrodispersionalejamiento de la simetrıaidentificacion de valores extremos (puntos atıpicos), es decir, devalores que se alejan de una manera poco usual del resto de losdatos.

Sus ingredientes principales son los 3 cuartiles. Recordemos que lamediana es el cuartil de orden 2 o bien Q2.

Page 111: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Diagrama de CajasReglas de Construccion

1 Calcular la mediana y los otros dos cuartiles, con los cuales se formara la caja,que tiene la mediana como eje central y como lados los dos cuartiles. Estoscuartiles reciben tambien los nombres de “bisagras”. La altura (anchura) de lacaja no interesa.

2 Calculamos el rango intercuartılico RIC = Q3 − Q1.

3 Calculamos el paso P = 1.5× RIC .

4 Determinamos las cercas internas que estan a un paso de los cuartiles o

bisagras. Tenemos la

Cerca Interna Inferior CIi = Q1 − PCerca Interna Superior CIs = Q3 + P

Si la cerca interna inferior da menor que el valor mınimo de la muestra, esta sehace igual al valor mınimo; igualmente, si la cerca interna superior da mayor queel valor maximo, esta se hace igual a dicho valor.

5 “Valores extremos” son los ubicados entre las dos cercas y merecen especialatencion, ya que pueden ser valores atıpicos, que en algunos casos nopertenecen realmente a la distribucion general de donde provienen los datos.

Page 112: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Diagrama de Cajas

Por ejemplo

Imaginemos que tenemos una variable a partir de cuya tabla de

frecuencias se pueda extraer la siguiente informacion:

Primer Cuartil Q1 = 7.0Segundo Cuartil Q2 = Me = 7.8Tercer Cuartil Q3 = 8.8Recorrido Intercuartılico RIC = Q3 − Q1 = 8.8− 7.0 = 1.8Paso P = 1.5× RIC = 1.5× 1.8 = 2.7Cerca Interna Inferior CIi = Q1 − P = 7.0− 2.7 = 4.3Cerca Interna Exterior CIe = Q3 + P = 8.8 + 2.7 = 11.5

Page 113: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Construir el Diagrama de Cajas con los siguientes datos:Q1 = 7.0, Q2 = 7.8, Q3 = 8.8, RIC = 1.8, P = 2.7, CIi = 4.3, CIe = 11.5

La grafica queda de esta manera

CIi = 4.3 CIe = 11.5Q1 = 7.0

Q2 = Me = 7.8

Q3 = 8.8

RIC = Q3 - Q1 = 1.8

Page 114: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Tendencia Central

Medidas de Localizacion: Cuartiles, Deciles, Percentiles

Diagrama de CajasInterpretacion

La mitad de los datos es inferior a 7.8

La mitad de los datos toman valores entre 7.0 y 8.8

La primera mitad de los datos (antes del primer cuartil) son menores que7.0

La cuarta parte de los datos (25%) toman valores entre 7.0 y 7.8

El 25% de los datos toman valores entre 7.8 y 8.8

Despues del tercer cuartil, el 25% de los datos son mayores que 8.8

La mayorıa de los datos se concentran entre 7.0 y 8.8

Los valores que sean menores que 4.3 o superiores a 11.5 son atıpicos.

J

Page 115: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Estadıgrafos de DispersionIntroduccion

Las medidas de tendencia central no proporcionan suficiente informacionpara una adecuada descripcion de los datos, porque no toman en cuentala variabilidad o dispersion de los mismos.

Luego, para completar la interpretacion que pueda deducirse y para evitarfalsas interpretaciones, es necesario acompanar el valor medio con uncoeficiente que mida el grado de dispersion de la distribucion de lavariable.

Dentro de los estadıgrafos de dispersion que vamos a estudiar seencuentran el rango, varianza, desviacion estandar y coeficiente devariacion porcentual.

Page 116: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Rango

Estadıgrafos de DispersionRango

El rango es igual a la diferencia entre los valores maximos y mınimospresentes en una muestra.

Este posee la ventaja de su independencia respecto de la media detendencia central y de la facilidad de su calculo; sin embargo tiene ladesventaja que para su calculo se toman solo dos valores del conjunto.

Se denota por r y es igual a r = xmax − xmin.

Page 117: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Varianza

Estadıgrafos de DispersionVarianza

Corresponde al promedio de los cuadrados de las distancias entre cadaobservacion y la media aritmetica del conjunto de observaciones.

Se denota por S2.

En el caso de variables cuantitativas discretas que puedan tomar k valoresdistintos x1, . . . , xk con frecuencias absolutas f1, . . . , fk :

S2 =

k∑i=1

(xi − X

)2 × fi

n − 1, n 6= 1

Para el caso de variables cuantitativas continuas donde las marcas declase m1, . . . , mk tienen frecuencias absolutas f1, . . . , fk :

S2 =

k∑i=1

(mi − X

)2 × fi

n − 1, n 6= 1

Page 118: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Varianza

Estadıgrafos de Dispersion - Varianza en caso discreto

S2 =

k∑i=1

(xi−X)2×fi

n−1, n 6= 1

Por ejemplo

Encontrar la varianza para los siguientes valores: 3,4,6,7.

En primer lugar encontremos la media aritmetica de ellos: X = 3+4+6+74

= 5.0

A la tabla de frecuencias le vamos a agregar el dato de (xi − X )2 × fi :

i xi fi (xi − X )2 × fi1 3 1 (3− 5.0)2 × 1 = 42 4 1 (4− 5.0)2 × 1 = 13 6 1 (6− 5.0)2 × 1 = 14 7 1 (7− 5.0)2 × 1 = 4

Total 4 10

De acuerdo a esto tenemos quek∑

i=1

(xi − X

)2× fi = 10. Por lo tanto

S2 =

k∑i=1

(xi−X)2×fi

n−1= 10

3= 3.3 J

Page 119: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Varianza

Estadıgrafos de Dispersion - Varianza en caso continuo -Ejemplo

S2 =

k∑i=1

(mi − X

)2 × fi

n − 1, n 6= 1

Consideremos la siguiente tabla de frecuencias:

i Int. Clase Real mi fi mi × fi(mi − X

)2× fi

1 [5.2, 6.1[ 5.65 3 16.95 (5.65− 7.87)2 × 3 = 14.792 [6.1, 7.0[ 6.55 5 32.75 (6.55− 7.87)2 × 5 = 8.713 [7.0, 7.9[ 7.45 9 67.05 (7.45− 7.87)2 × 9 = 1.594 [7.9, 8.8[ 8.35 7 58.45 (8.35− 7.87)2 × 7 = 1.615 [8.8, 9.7[ 9.25 5 46.25 (9.25− 7.87)2 × 5 = 9.526 [9.7, 10.6[ 10.15 3 30.45 (10.15− 7.87)2 × 3 = 15.60

Total 32 251.9 51.81X = 251.9

32= 7.87

Page 120: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Varianza

Estadıgrafos de Dispersion - Varianza en caso continuo -Ejemplo

S2 =

k∑i=1

(mi − X

)2 × fi

n − 1, n 6= 1

Como X = 7.87 yk∑

i=1

(mi − X )2 × fi = 51.81 se concluye que

S2 =

k∑i=1

(mi − X

)2 × fi

n − 1=

51.81

31= 1.67 J

Page 121: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Desviacion Estandar

Estadıgrafos de DispersionDesviacion Estandar

La desviacion estandar — denotada por S — corresponde a la raız cuadradapositiva de la varianza. Es decir:

S = +√

S2

Para efectos de estudio se prefiere trabajar con la desviacion estandar en lugarde la varianza, ya que es compatible con la dimensionalidad de los datos.

Se interpreta de la siguiente manera: “Es la distancia media que existe entretodas las observaciones respecto del valor central, esto es, de la media”.

En el ejemplo anterior de varianza en el caso discreto se tiene queS = +

√S2 =

√3.3 = 1.82 y en el caso del ejemplo continuo es igual a

S =√

1.67 = 1.29 J

Page 122: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Coeficiente de Variacion Porcentual

Estadıgrafos de DispersionCoeficiente de Variacion Porcentual

El coeficiente de variacion porcentual — denotado por CV% es util paracomparar el grado de dispersion entre dos o mas distribuciones expresadasen distintas unidades de medida, puesto que las varianzas o lasdesviaciones estandar no permiten efectuarlas.

Representa el porcentaje de variacion de la desviacion estandar de unconjunto de observaciones en relacion a la media de tal conjunto deobservaciones. Esto es

CV% =S

X× 100

Este indicador deja de tener utilidad cuando el valor de la mediaaritmetica se aproxima a cero.

Page 123: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Coeficiente de Variacion Porcentual

Estadıgrafos de DispersionCoeficiente de Variacion Porcentual

Por ejemplo

En el caso discreto cuando tenıamos S = 1.82 y X = 5.0 se concluye queCV% = S

X× 100 = 1.82

5.0× 100 = 36, lo que significa que la desviacion

estandar de los datos presenta un 36% de variacion en relacion al valor dela media.

Queda de ejercicio hacer el calculo para el ejemplo del caso continuopresentado anteriormente. J

Page 124: Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7. 25. · Estad´ıstica Caracter´ısticas Generales La Estad´ıstica es una rama

EYGDD *.* - Curso Completo

Estadıgrafos de Dispersion

Coeficiente de Variacion Porcentual

Por su atencion muchas gracias. . .

♠♠♠♠♠♠ ♠♠♠ ♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠ ♠♠♠♠♠♠♠♠ ♠♠♠ ♠♠♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠♠♠♠♠♠