(Guia-taller Estadística Descriptiva 2012

download (Guia-taller Estadística Descriptiva 2012

of 25

Transcript of (Guia-taller Estadística Descriptiva 2012

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    1/25

    GUIA TALLER DE

    ESTADISTICA

    DESCRIPTIVA

    U N I V E R S I D A D D E

    L O S L L A N O S

    E S C U E L A D E C I E N C I A S

    B A S I C A S E I N G E N I E R I A

    P R O G R A M A D E

    A D M I N I S T R A C I O N D E

    E M P R E S A S

    P R O G R A M A D E E C O N O M I A

    Ing. OSCAR BUENDIA P.

    RECOPILACION DE FUNDAMENTOS TEORICOS Y TALLER

    DE APLICACIONES Y TRABAJO INDEPENDIENTE

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    2/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    ESTADSTICA DESCRIPTIVA

    La estadstica descriptiva tiene como propsito describir y resumir un conjunto de datos,para ello, se emplean dos tipos de mtodos: mtodos grficos y mtodos numricos. Paraintroducir los mtodos grficos y numricos se recurre a la construccin de lasDistribuciones de Frecuencia, mtodo utilizado para organizar y resumir datos. Una tabla defrecuencias est formada por las categoras o valores de una variable y sus frecuenciascorrespondientes; esta tabla se crea por medio de la tabulacin y agrupacin, se trabaja conuna sola variable; sin embargo, cuando el conjunto de datos es mayor, resulta laboriosotrabajar directamente con los valores individuales observados y entonces se lleva a cabo,

    por lo general, algn tipo de agrupacin como paso preliminar, antes de iniciar cualquierotro tratamiento de los datos. Las reglas para proceder a la agrupacin son diferentes segnsea la variable, atributo, discreta o continua, para una variable discreta suele resultarconveniente hacer una tabla en cuya primera columna figuren todos los valores de lavariable Xi representados en el material, y en la segunda, la frecuencia n i con que haaparecido cada valor de X en las observaciones.

    Notacin y/o simbologa estndar a manejar:

    La letra X mayscula representar a la variable con la que estamos trabajando. La letraX mayscula con subndices, X1, X2, X3, servir para representar un valor concreto dela variable X en el sujeto 1, 2, 3,... Cuando queramos referirnos a un valor concretocualquiera de la variable X escribiremos Xi. Denotaremos por Xn el ltimo valor quetoma la variable.

    El nmero de elementos que componen la muestra ser n (N si est considerando unapoblacin).

    Se llama frecuencia absoluta de un valor Xi, y se simboliza por ni(en alguna literatura larepresentan por fi) al nmero de veces que se repite el valor Xi en la muestra. La sumade las frecuencias debe ser igual al nmero de elementos que componen la muestra,esto es,

    ni= = n1+ n2+ n3+ + nn= n

    La frecuencia relativa es la fraccin del total de observaciones que presentaron un valorXi en particular y se simboliza por hi. Para su clculo se hace el cociente entre lafrecuencia absoluta y el nmero total de datos, es decir

    =

    La frecuencia relativa puede denotar un porcentaje o una probabilidad de seleccin; lasuma de las frecuencias relativas debe ser igual (o aproximadamente igual) a 1, esto es,

    hi = = h1+ h2+ h3+ + hk= 1

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    3/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    La frecuencia absoluta acumulada (Fi o Ni) es la suma de los distintos valores de lafrecuencia absoluta tomando como referencia un individuo dado. Cabe mencionar que laltima frecuencia absoluta acumulada es igual al nmero de casos, es decir,

    F1= f1F2= f1+ f2= F1+ f2F3= f1+ f2+ f3= F2+ f3.

    .

    .Fn= f1+ f2+ f3+ + fn-1+ fk= Fk-1+ fk= n

    La frecuencia relativa acumulada es el resultado de dividir cada frecuencia absolutaacumulada (Fi) por el nmero total de datos; se suele representar con la notacin Hi;cabe mencionar que la ltima frecuencia relativa acumulada es igual a 1; es decir,

    TABULACION PARA VARIABLE DISCRETA

    De esta manera, la distribucin de frecuencias para una VARIABLE DISCRETA estardada de la siguiente manera:

    Xi ni hi Ni HiX1 nn1 Hh1 N1 H1X2 Nn2 Hh2 N2 H2X3 Nn3 Hh3 N3 H3

    Xn nnn hhn Nn Hnni = n hi = 1

    Ejemplo:

    El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respectode la dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos, yha obtenido los siguientes datos:

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    4/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    Determinar:a. Cul es la poblacin objeto de estudio?b. Qu variable estamos estudiando?c. Qu tipo de variable es?d. Construir la tabla de frecuencias.e. Cul es el nmero de familias que tiene como mximo 2 hijos?

    f. Cuntas familias tienen ms de 1 hijo, pero como mximo 3?g. Qu porcentaje de familias tiene ms de 3 hijos?

    Solucin:a. La poblacin objeto de estudio es el conjunto de familias de un determinado pas.b. La variable que estamos estudiando es el nmero de hijos por familiac. El tipo de variable es discreta ya que el nmero de hijos solo puede tomar determinadosvalores enteros (es imposible tener medio o un cuarto de hijo).d. Para construir la tabla de frecuencias tenemos que ver cuntas familias tienen undeterminado nmero de hijos. Podemos ver que el nmero de hijos, toma los valoresexistentes entre 0 hijos, los que menos y, 6 hijos los que ms; de esta manera se tiene:

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    5/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    e. El nmero de familias que tienen dos o menos hijos es: 2 + 4 + 21 = 27.f. El nmero de familias que tienen ms de un hijo pero tres como mximo es: 21 + 15 = 36.g. Por ltimo el porcentaje de familias que tiene ms de tres hijos, son aquellos que tienen4; 5 y 6 es decir: 6 + 1 + 1 = 8.h. El porcentaje ser el tanto por uno multiplicado por cien es decir, la frecuencia relativa dedichos valores multiplicado por 100: (0,12 + 0,02 + 0,02)* 100 = 0,16*100 = 16%.

    TABLAS DE FRECUENCIA PARA VARIABLES CONTINUAS

    Cuando nos encontramos con una distribucin con un gran nmero de datos, o conVARIABLES CONTINUAS se suelen agrupar los datos en intervalos de clase para facilitarla comprensin de los datos; sin embargo, este proceso presenta un problema no deseableen estadstica: se pierde informacin sobre la distribucin de los datos. La agrupacin dedatos en intervalos de clase consiste en formar grupos de valores consecutivos de la

    variable y poner cada uno de estos grupos en cada fila en lugar de poner una solapuntuacin. Cabe mencionar que la tabla de frecuencias para variables continuas presentala misma estructura que las descritas anteriormente para variables discretas, aadiendo unpar de elementos que se describirn a continuacin.

    En primer lugar se debe definir la cantidad de intervalos a emplear; se recomienda que elnmero de intervalos (m) debe variar entre 5 y 15. Para determinar el nmero de intervalosexisten varios mtodos:

    Por la experiencia del investigador. Por frmulas:

    m =

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    6/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    m = 1+ 3,3Log n(Frmula de Sturgess)

    Una vez establecida la cantidad de intervalos en los cuales se van agrupar los datos, sedebe determinar la longitud de cada uno de ellos, la cual depender del criterio establecidopara presentar la informacin. La longitud puede variar de intervalo a intervalo, sin embargo,se acostumbra a trabajar con intervalos de igual amplitud. Para determinar la amplitud delos intervalos (C) se recurre a la siguiente frmula:

    C =

    R es el rango y se obtiene por diferencia entre Xmxy Xmn, m es el nmero de intervalos.

    Para operar se emplea la marca de clase (,el punto medio de un intervalo (denotada enalgunos libros por m). Las marcas de clase pueden obtenerse de 3 maneras:

    1. Definirla como la semisuma de los valores extremos del intervalo, esto es sumar losextremos, y dividir entre 2.2. Se obtiene la primera marca de clase por el mtodo anterior y si la amplitud (C) esconstante, se le suma a la primera marca de clase obtenida y as sucesivamente.3. Se divide la amplitud de cada intervalo (C) por dos y se le suma al lmite inferior del

    intervalo o se le resta al lmite superior del intervalo.

    INTERVALO ni hi Ni HiX1 - X2 nn1 Hh1 N1 H1X2X3 Nn2 Hh2 N2 H2X3 X4 Nn3 Hh3 N3 H3

    Xn-1- Xn nnn hhn

    EjemploUn nuevo hotel va a abrir sus puertas en cierta ciudad. Antes de decidir el precio de sushabitaciones, el gerente investiga los precios por habitacin de 40 hoteles de la misma

    categora de esa ciudad. Los datos obtenidos en miles de pesos fueron:

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    7/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    Se pide:a. Cul es la poblacin objeto de estudio?b. Qu variable estamos estudiando?c. Qu tipo de variable es?d. Qu problema plantea la construccin de la tabla de frecuencias?e. Cuntos hoteles tienen un precio entre 3,25 y 3,75?f. Cuntos hoteles tienen un precio superior a 4,75?g. Qu porcentaje de hoteles cuestan como mucho 4,25?

    REPRESENTACIN GRFICA DE LA INFORMACIN

    Las grficas proporcionan datos en un diagrama de dos dimensiones. En el eje horizontal se puedemostrar los valores de la variable (las caractersticas que se estn midiendo), y en el eje vertical sesealan las frecuencias de las clases mostradas en el eje horizontal.

    1. GRFICO CIRCULAR O DE SECTORES

    Permite apreciar de un solo golpe de vista la posicin y magnitud de los valores de la variable. Elrea de cada sector es proporcional a la frecuencia que representa.

    Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntoscon respecto al total, es decir, cuando se est usando una escala categrica, convieneutilizar una grfica llamada de pastel o circular. Si se desea resaltar una de las categoras

    que se presentan, es vlido tomar esa "rebanada" de la grfica y separarla de las dems

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    8/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    Hay que tomar algunas precauciones al utilizar este tipo de grficos. Por un lado, comparardos grficos circulares (por ejemplo, si se quisieran comparar las proporciones dematrculas en licenciatura por reas de conocimiento en licenciatura para dos aos distintos)resulta muy difcil y, por tanto, no es muy aconsejable. En ocasiones existen categorascon pocas frecuencias(por ejemplo, dos o tres con frecuencias relativas menores al 1%cada una), haciendo que la grfica resulte "pesada" y las etiquetas se encimen. Una posiblesolucin es juntarlas en una sola categora (por ejemplo, la tpica "otras" o "varias"), peroentonces habra que ponderar si se hace una grfica extra con dichas observacionesnicamente, haciendo la anotacin pertinente, o simplemente se ignoran por no resultarsignificativas.

    2. DIAGRAMA DE BARRAS

    Se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una VARIABLEDISCRETA. En el eje de abscisas, situaremos los diferentes valores de la variable. En eleje de ordenadas la frecuencia. Levantaremos barras o columnas SEPARADAS dealtura correspondiente a la frecuencia adecuada.

    3. HISTOGRAMAS

    Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar. La diferencia:es para VARIABLES CONTINUAS. Si la amplitud del intervalo es la misma, elevaremos

    columnas UNIDAS, a altura la frecuencia correspondiente. Si la amplitud del intervalo esdiferente,el rea del rectngulo columna ser proporcional a la frecuencia representada.

    En el eje horizontal (o de las abscisas) se representan los intervalos de los datos,marcndose de manera continua las fronteras entre cada uno de los stos. De esta manera,el histograma est compuesto rectngulos, cuyo nmero coincide con la cantidad deintervalos considerados, el ancho de la base de cada uno de esos rectngulos es la mismasiempre y coincide con las fronteras de los intervalos, y la altura corresponde a la frecuenciade cada intervalo. Es importante observar que resulta difcil utilizar este tipo derepresentacin cuando existen intervalos abiertos o cuando los intervalos no son igualesentre s.

    EXCEL no permite crear histogramas automticamente, como un grfico circular o debarras, pero si se pueden crear (vea Estadstica y muestreo, Ciro Martnez).

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    9/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    4. POLGONO DE FRECUENCIAS

    Se forma al unir las marcas de clase de los intervalos, bsicamente con el fin decomparar el comportamiento de dos o ms variables.

    5. OJIVAS

    Se parecen a los polgonos de frecuencias, pero son bien diferentes; se usan paragraficar las frecuencias acumuladas.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    10/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    En resumen:

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    11/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    REDUCCIN DE DATOS

    La reduccin de datos tiene por objetivo, como su nombre lo indica, reducir toda la seriede datos a un solo valor que represente alguna caracterstica de esta serie da datos.Este valor representativo se denomina estadstico, el cual puede ser de dos clases:

    Parmetro cuando el estadstico se obtiene a partir de informacin poblacional, lo cuales muy poco frecuente.

    Estadgrafo, cuando se refiere a una muestra, que es lo ms comn.Los estadsticos permiten medir principalmente 4 caractersticas de los conjuntos de datos:

    1. Tendencia central2. Dispersin3. Apuntamiento4. Simetra o forma

    MEDIDAS DEPOSICIN O TENDENCIA CENTRAL

    Describen cmo los datos recolectados u observados se agrupan en torno a un valor centralrepresentativo. Expresndolo de otra forma, Una de las caractersticas ms sobresalientesde la distribucin de datos es su tendencia a acumularse hacia el centro de la misma; estacaracterstica se denomina tendencia central. Las medidas de posicin o de tendenciacentral nos permiten determinar la posicin de un valor respecto a un conjunto de datos, elcual consideraremos como representativo o tpico para el total de las observaciones.

    Las medidas de tendencia central tienden a localizarse en el centro de la informacin, sonde gran importancia en el manejo de las tcnicas estadsticas, sin embargo, suinterpretacin no debe hacerse aisladamente de las medidas de dispersin, ya que la

    representatividad de ellas est asociada con el grado de concentracin de la informacin.

    Las principales medidas de tendencia central pueden ser de 2 clases:

    Tendencia central: moda, mediana, media aritmtica, media geomtrica No centrales o de posicin: cuartiles, deciles, percentiles.

    La frmula de clculo de cada una de ellas depende de cmo se encuentren presentadoslos datos: agrupados (tabulados) o sin agrupar (sin tabular). Por datos agrupadosentenderemos los presentados en una tabla de frecuencias (variable discreta o continua),mientras que por datos sin agrupar se entender los que se encuentran enlistados.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    12/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    TENDENCIA CENTRAL

    1. MODA.

    Es el valor de la variable que ms se repite, es decir, que tiene la mayor frecuenciaabsoluta. Tiene la ventaja de que no se ve afectada por valores atpicos. Tambin esposible que pueda haber ms de una moda (distribuciones bimodales, trimodales etc.) oque no haya moda.

    2. MEDIANA.

    Busca determinar el valor que tiene aquella observacin que divide la cantidad deobservaciones en dos mitades iguales. Por lo tanto es necesario atender a laordenacin de los datos, y debido a ello, este clculo depende de la posicin relativa delos valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor amayor (o viceversa).

    ESTIMACIN PARA DATOS SIN AGRUPAR

    Hay que tener en cuenta la cantidad de datos que se recolectaron; es decir, si se tieneun nmero de datos IMPAR o si por el contrario, el nmero de datos es PAR.

    A. Nmero impar de observaciones: La mediana es el valor del dato central as, lamediana puede expresarse como:

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    13/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    B. Nmero impar de observaciones: La mediana est determinado por el valor de lasemisuma (promedio aritmtico) de los valores de los dos datos centrales, es decir:

    ESTIMACIN DATOS AGRUPADOS

    VARIABLE DISCRETA

    En el caso de variables discretas donde cada categora es el valor de la variable, se

    puede tomar como un caso de intervalo de amplitud 1 y en este caso el clculo de lamediana funciona exactamente como lo visto para datos sin agrupar; sin embargo, existe unpar de reglas prcticas basadas en las frecuencias absolutas que pueden ser de utilidad:

    VARIABLE CONTINUA

    Cuando trabajamos con variables agrupadas por intervalos es imposible determinar conprecisin los valores que toman los datos, ya que esa informacin se ha perdido enprivilegio del agrupamiento interval. Por lo tanto, en este caso, debemos buscar otro mtodopara determinar el valor de la mediana. Consideremos como Ij x al lmite inferior del j-simointervalo, de manera anloga como Sj x al lmite superior del j-simo intervalo.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    14/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    3. MEDIA ARITMTICA (si es muestral, si es poblacional)

    Es la medida de posicin ms empleada, la ms conocida y sencilla de calcular, de gran

    estabilidad en el muestreo y sus frmulas admiten tratamientos algebraicos. Tambin se leconoce como promedio aritmtico o simplemente como la media de un conjunto deobservaciones.

    Para datos sin agrupar o tabular:

    =

    Para datos agrupados:

    =

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    15/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    PROPIEDADES DE LA MEDIA

    1. La suma de las diferencias de los datos con respecto a la media aritmtica es igual acero.

    2. La suma de las diferencias cuadrticas de los datos, con respecto a la media

    aritmtica es mnima; es mnima para ; quiere decir que para cualquier otroparmetro p, diferente a la media aritmtica hacer mayor la expresin

    3. La media aritmtica de una constante es igual a la constante.

    4. Si a cada uno de los resultados de una variable le sumamos o le restamos unaconstante C, la media aritmtica de la nueva variable queda alterada en esa

    constante.

    5. Si cada uno de los datos se multiplica por una constante K, entonces la mediaaritmtica queda multiplicada por esa constante.

    6. Empleando las dos propiedades anteriores, podemos calcular la media de unacombinacin lineal de variables, esto es, una transformacin de variables. La media

    aritmtica de la nueva variable es:

    7. La media de una muestra es igual a la media ponderada de las sub-muestras,tomndose como ponderacin los tamaos de las sub-muestras.

    RELACIN MODA-MEDIANA-MEDIA

    Las distribuciones simtricas que slo contienen una moda, siempre tienen el mismo valorpara la media, la mediana y la moda. En tales casos, no es necesario escoger la medida detendencia central, pues ya est hecha la seleccin.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    16/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    MEDIDAS DE DISPERSIN

    Una vez localizado el centro de la distribucin de un conjunto de datos, el siguiente paso esbuscar una medida de la variabilidad o dispersin de los datos; como se mencionanteriormente, las medidas de tendencia central tienen como objetivo sintetizar los datos enun valor representativo; como complemento, las medidas de dispersin nos dicen que tanrepresentativas son estas medidas de tendencia central como sntesis de la informacin; deesta manera, las medidas de dispersin cuantifican la separacin, dispersin, la variabilidadde los valores de la distribucin respecto al valor central como la media aritmtica. Cuantomenor es la dispersin, tanto mayor ser la precisin del sistema de medicin. Si losestadgrafos de posicin se relacionan con el concepto de exactitud, los de dispersin serelacionan con la precisin de las tcnicas.

    IMPORTANCIA DE LAS MEDIDAS DE DISPERSIN.

    1. Proporcionan informacin adicional que permite juzgar la confiabilidad de la medida detendencia central. Si los datos se encuentran ampliamente dispersos, la posicin centrales menos representativa de los datos.

    2. Ya que existen problemas caractersticos para datos ampliamente dispersos, debemosser capaces de identificarlos antes de abordar esos problemas.

    3. Cuando se desea comparar las dispersiones de diferentes muestras. Si no se deseatener una amplia dispersin de valores con respecto al centro de distribucin o estopresenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitarescoger distribuciones que tengan las dispersiones ms grandes.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    17/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    MEDIDAS DE DIISPERSIN

    1. VARIANZA (S2, 2).

    La varianza de una poblacin (denotada por S2; es la letra griega sigma) de Nobservaciones x1, x2, x3,, xN, cuya media aritmtica es m, se define como el promedio delos cuadrados de las desviaciones con respecto a su media.

    Para DST:

    Para DT:

    S2=

    NOTA: cuando se trabaja con muestras pequeas (n30) se divide por n 1.

    Propiedades de la varianza.

    1. Es siempre un valor no negativo, que puede ser igual o distinta de 0. Ser 0 solamente

    cuando:

    2. La varianza de una constante vale 0.3. Si a todos los valores de la variable se le suma una constante la varianza no se

    modifica.

    SE OBTIENE A

    PARTIR DE LA

    DEFINICION

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    18/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    4. Si todos los valores de la variable se multiplican por una constante la varianza quedamultiplicada por el cuadrado de dicha constante.

    5. Si en una distribucin obtenemos una serie de subconjuntos disyuntos, la varianza de ladistribucin inicial se relaciona con la varianza de cada uno de los subconjuntosmediante la expresin

    En donde:

    Nies el nmero de elementos del subconjunto

    es la varianza de cada subconjunto

    Cabe mencionar que para la varianza, las unidades son el cuadrado de las unidades de losdatos originales. Estas unidades no son intuitivamente claras o fciles de interpretar. Poresta razn, tenemos que hacer un cambio significativo en la varianza para calcular unamedida til de la desviacin, que sea menos confusa. Esta medida se conoce como ladesviacin estndar, y es la raz cuadrada de la varianza. La desviacin estndar,entonces, est en las mismas unidades que los datos originales.

    2. DESVIACIN ESTNDAR (S si es muestral, si es poblacional)

    Tambin recibe el nombre de desviacin tipo, desviacin tpica o desvo tpico. Como semencion anteriormente, la desviacin estndar de la poblacin (o de la muestra) essimplemente la raz cuadrada de la varianza. Como la varianza es el promedio de lasdistancias al cuadrado que van desde las observaciones a la media, la desviacin estndares la raz cuadrada del promedio de las distancias al cuadrado que van desde lasobservaciones a la media. La desviacin estndar est en las mismas unidades que las quese usaron para medir los datos.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    19/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    La desviacin estndar slo puede utilizarse en el caso de que las observaciones se hayanmedido con escalas de intervalos o razones.

    A mayor valor de la desviacin estndar, mayor dispersin de los datos con respecto a sumedia. Es un valor que representa los promedios de todas las diferencias individuales de lasobservaciones respecto a un punto de referencia comn, que es la media aritmtica. Seentiende entonces que cuando este valor es ms pequeo, las diferencias de los valoresrespecto a la media, es decir, los desvos, son menores y, por lo tanto, el grupo deobservaciones es ms homogneo que si el valor de la desviacin estndar fuera msgrande. O sea que a menor dispersin mayor homogeneidad y a mayor dispersin, menorhomogeneidad.

    3. COEFICIENTE DE VARIACIN (CV).

    Es una medida que permite compara dispersiones de variables con diferente unidad demedida o de diferentes poblaciones.

    CV =

    x 100

    Criterio de interpretacin del CV:

    VALOR CV MUESTRA

    0 - 10% HOMOGNEA CONFIABLE

    10 20%TIENDE A

    HOMOGNEA

    SE ACEPTACON

    RESERVA

    ! HETEROGNEANO ES

    CONFIABLE

    TALLER

    1. Consulte acerca del origen, historia y desarrollo de la estadstica.

    2. Consulte acerca del operador sumatoria y sus propiedades ().

    3. La revista Forbes (febrero de 1997) public las siguientes cifras acerca de lascondiciones y estilos de vida en varias ciudades norteamericanas:

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    20/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    a. Identifique los diferentes tipos de variables presentes.b. Consulte qu son variables nominales y ordinales e identifquelas.c. Determine la tendencia de cada variable utilizando la moda

    4. Consulte hacer de qu es muestreo, razones para tomar una muestra, clases demuestreo y criterios para seleccionar el tipo de muestreo.

    5. Un laboratorio produce un antibitico que garantiza el control de como mnimo el 87%de la poblacin de la bacteria Streptococcus aureum. El INVIMA mont en diciembre de2004 en Bogot un ensayo para comprobar la calidad del medicamento haciendo unaprueba de campo con 100 pacientes y obtuvo los siguientes resultados de porcentaje decontrol de la bacteria al final del tratamiento:

    98 94 95 86 86 94 85 80 93 8579 80 84 85 90 90 90 96 94 8685 86 87 90 74 79 79 85 86 9085 85 90 85 80 80 80 85 86 90

    96 74 79 70 85 86 90 90 80 8586 90 94 94 96 85 80 93 74 8093 74 79 96 85 74 85 85 90 8594 96 96 98 74 70 70 86 86 8680 85 86 85 90 74 80 86 85 9096 80 80 85 90 74 86 85 90 85

    4.1 Determine qu tipo de variable es y por qu.

    4.2 Elabore la tabla de distribucin de frecuencias y pngale el ttulo correspondiente

    aplicando los parmetros tcnicos vistos en clase.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    21/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    4.3 Elabore la grfica correspondiente para cada una de las cuatro frecuencias (absoluta,absoluta acumulada, relativa y relativa acumulada) con su respectivo ttulo.

    4.4 Indique cul es la moda en esta serie de datos e interprtela.

    4.5 Calcule la media aritmtica aplicando la frmula para datos tabulados e interprtela

    4.6 Calcule e interprete la varianza y la desviacin Standard e interprtelas.

    4.7 Calcule el coeficiente de variacin y determine la confiabilidad de la media obtenida.

    4.8 Con base en los resultados obtenidos de procesar la informacin, el INVIMA deberaautorizar la salida al mercado de este medicamento o impedirlo. Sustente su respuesta.

    6. FEDEARROZ ha recibido en enero de 2005 la siguiente informacin acerca de laproductividad en Toneladas por hectrea de arroz de la variedad Oryzica 3 en losprincipales departamentos productores:

    DEPARTAMENTO REND. PROMEDIO

    Tolima 7,8 Ton./HHuila 7,5

    Valle del Cauca 8,1Meta 6,5Casanare 6,0Cesar 7,3Crdoba 7,5Cundinamarca 7,0Sucre 7,3Magdalena 6,8Santander 5,8

    5.1 Determine qu tipo de variable estadstica es y por qu.5.2 Indique qu tipo de medida de posicin debe calcular para determinar el promedionacional de produccin de arroz Oryzica 3 a nivel nacional con la informacin disponibley por qu debe usarla.

    5.3 Calcule e interprete el promedio nacional de rendimiento de la variedad de arrozOryzica 3 e interprtelo.

    5.4 Estime las medidas de dispersin que correspondan e interprtelas.

    5.5 Se puede usar el coeficiente de variacin para determinar la confiabilidad delpromedio obtenido? Si es posible, calclelo e interprtelo.

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    22/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    7. El Vicepresidente Financiero de una Compaa de Bucaramanga est analizando lasvariaciones en el IPC (ndice de Precios al Consumidor) durante los ltimos meses enoctubre de 2004 para hacer proyecciones sobre la variacin de sus costos deproduccin con base en el IPC publicado por el Gobierno y encuentra la siguienteinformacin mensual:

    4,50 3,96 3,91 4,01 4,06 3,92 5,34 4,214,01 3,96 3,91 3,87 3,91 3,76 3,75 3,813,18 3,29 3,10 3,05 3,12 3,00 2,94 2,901,95 1,96 2,01 1,75 1,32 1,46 1,28 1,330,94 0,98 0,76 1,02 0,64 0,72 0,58 0,63

    0,38 0,34 0,27 0,24 0,26 0,19 0,21 0,20

    4,06 4,10 3,98 3,82 3,61 3,85 3,243,77 3,44 3,90 3,71 3,65 3,45 3,402,91 2,89 2,82 2,51 2,80 2,26 2,061,16 1,05 1,06 1,05 1,08 1,04 1,010,67 0,59 0,61 0,53 0,41 0,48 0,400,28 0,17 0,15 0,17 0,15 0,16 0,15

    6.1 Elabore la tabla de distribucin de frecuencias correspondiente con su ttulo.

    6.2 Grafique las 4 frecuencias bsicas.

    6.3 Calcule la media aritmtica e interprete.

    6.4 Calcule la media geomtrica y la tasa de crecimiento del IPC.

    6.5 Proyecte el IPC ESPERADO a 6 meses y a 12 meses despus (teniendo en cuenta sise trata de un crecimiento o de un decremento).

    6.6 Calcule e interprete las medias de dispersin.

    6.7 Seale si la tasa calculada es confiable o no y sustente su opinin.

    8. CORMACARENA est realizando un estudio de biodiversidad forestal maderable en unrea de 1,5 Km2en la Sierra de la Macarena, jurisdiccin del municipio de La Macarena(Meta) en enero de 2005 y obtiene la siguiente informacin:

    # ESPECIE

    1 Cedro amargo2 Flor morado3 Cedro Rojo

    4 Flor morado5 Flor amarillo

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    23/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    6 Ocobo7 Mo8 Flor morado9 Flor morado10 Cedro amargo11 Ocobo12 Flor amarillo13 Flor morado14 Cedro amargo15 Flor morado

    16 Cedro rojo17 Ocobo18 Acacia19 Cedro amargo20 Acacia

    7.1 Determine qu tipo de variable es y por qu.

    7.2 Elabore la tabla de distribucin de frecuencias y pngale el ttulo correspondienteaplicando los parmetros tcnicos vistos en clase.

    7.3 Elabore la grfica correspondiente para cada una de las cuatro frecuencias (absoluta,absoluta acumulada, relativa y relativa acumulada) con su respectivo ttulo.

    7.4 Indique cul es la moda en esta serie de datos e interprtela.

    7.5 Calcule la media aritmtica aplicando la frmula (si es posible) para datos tabulados einterprtela

    7.6 Calcule e interprete la varianza y la desviacin Standard (si es posible) e interprtelas.

    8. En la revista Forbes, de mayo 24 de 1997 se publicaron las edades de los ejecutivosdiferentes empresas y se obtuvo la siguiente tabla:

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    24/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    8.1 Construya la distribucin de frecuencias correspondiente8.2 Grafique las frecuencias (emplee EXCEL)8.3 Calcule las medidas de tendencia central e interprtelas (EXCEL)8.4 Calcule e interprete las medidas de dispersin (EXCEL)8.5 Concluya acerca de la confiabilidad del estudio.

    9. Consulte en qu consisten las medidas de posicin, explquelas y establezca qudiferencia hay con respecto a las de tendencia central.

    10. Janna Vice usa dos mquinas diferentes para fabricar papeleras para lasfotocopipadoras de Kodak y al evaluar las mquinas encuentra la siguiente informacinen cuanto al tamao de las papeleras hechas por cada mquina:

    Mquina 1: 12,2; 11,9; 11,8; 12,1; 11,9; 12,4; 11,3; 12,3 pulgadasMquina 2: 12,2; 11,9; 11,5; 12,1; 12,2; 11,9; 11,8 pulgadas

    La empresa debe usar la mquina que presente mayor homogeneidad de tamao de laspapeleras, cul debera usar? (use EXCEL)

    11. Resuelva en:

    CIRO MARTNEZ, CAP 3 ejercicios 71, 74, 85, 88, 93

    CAP 4 ejercicios 2, 5, 6, 8, 12, 14, 24, 27

  • 5/21/2018 (Guia-taller Estadstica Descriptiva 2012

    25/25

    UNIVERSIDAD DE LOS LLANOS

    FACULTAD DE CIENCIAS HUMANAS

    DEPARTAMENTO DE CIENCIAS BSICAS

    ESTADSTICA DESCRIPTIVA

    RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

    BIBLIOGRAFA CONSULTADA

    Estadstica para Administracin y EconomaLevinPrentice Hall

    Estadstica y MuestreoCiro Martnez BencardinoEcoe Ediciones

    Estadstica para Administracin y EconomaWilliam Mendenhall & James Reinmuth

    Grupo Editorial Iberoamrica

    Probabilidad y EstadsticaGeorge CanavosMc Graw Hil.

    Estadstica aplicada a los negocios y a la economa

    Allen WebsterMc Graw Hill