Referencia LLinas 12 -Metodos Estadisticos

download Referencia LLinas 12 -Metodos Estadisticos

of 46

Transcript of Referencia LLinas 12 -Metodos Estadisticos

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    1/125

    Área de Ciencias Básicas

    ESPECIALIZACION ENESTADISTICA APLICADA

    Universidad del Norte

    Gúıa resumida sobre

    Métodos Estad́ısticosTeoŕıa y práctica

    Dr. rer. nat Humberto LLinás SolanoProfesor de la Universidad del Norte

    Barranquilla - Colombia

    2005

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    2/125

    Contenido

    1 Estad́ıstica descriptiva 41.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   41.2 Medidas estad́ısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . .   61.3 Análisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . .   9 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   11

    2 Probabilidad 202.1 Experimentos, espacios muestrales y eventos . . . . . . . . . . . . . . .   202.2 Técnicas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . .   202.3 Introducción a la probabil idad . . . . . . . . . . . . . . . . . . . . . . .   222.4 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   27 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   27

    3 Distribuciones de probabilidad 313.1 Variables aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . .   313.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . .   32 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   33

    4 Distribuciones especiales 364.1 La distribución uniforme (discreta) . . . . . . . . . . . . . . . . . . . .   364.2 La distribució n b i n o m i a l . . . . . . . . . . . . . . . . . . . . . . . . . .   364.3 La distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . .   374.4 La distribución hipergeométrica . . . . . . . . . . . . . . . . . . . . . .   394.5 Las distribuciones binomial negativa y geométrica . . . . . . . . . . . .   414.6 La distribución uniforme (continua) . . . . . . . . . . . . . . . . . . . .   424.7 La distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . .   424.8 Las distribuciones gamma y exponencial . . . . . . . . . . . . . . . . .   454.9 Resumen de las distribuciones especiales . . . . . . . . . . . . . . . . .   48

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    3/125

    CONTENIDO 2  

    Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   49

    5 Distribuciones conjuntas 54

    5.1 Vectores aleatorios discretos . . . . . . . . . . . . . . . . . . . . . . . .   545.2 Vectores aleatorios continuos . . . . . . . . . . . . . . . . . . . . . . .   56 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   57

    6 Distribuciones muestrales 616.1 Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   616.2 Distribuciones muestrales de algunos estad́ısticos . . . . . . . . . . . .   626.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   63 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   66

    7 Intervalos de confianza 71

    7.1 Estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   717.2 Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . .   727.3 Intervalos de confianza para algunos parámetros . . . . . . . . . . . . .   727.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   747.5 Determinación del tamaño de una muestra . . . . . . . . . . . . . . . .   77 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   78

    8 Pruebas de hipótesis 848.1 Conceptos de la prueba de hipótesis . . . . . . . . . . . . . . . . . . .   848.2 Pruebas para algunos parámetros poblacionales . . . . . . . . . . . . .   868.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   91

    Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   94

    A Gúıa rápida para trabajar con Statgraphics 97A.1 Análisis de un solo conjunto de datos . . . . . . . . . . . . . . . . . . .   97A.2 Análisis simultáneo de dos o más conjuntos de datos . . . . . . . . . .   97A.3 Gráficos de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . .   98A.4 Diagramas de presentacíon . . . . . . . . . . . . . . . . . . . . . . . .   98A.5 Variables numéricas multidimensionales . . . . . . . . . . . . . . . . . .   99A.6 Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . . .   99A.7 Inferencias basadas en una sola muestra . . . . . . . . . . . . . . . . .   99A.8 Inferencias basadas en dos muestras . . . . . . . . . . . . . . . . . . .   100A.9 Bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . .   100

    B Gúıa rápida para trabajar con SPSS 101B.1 Definición de las var iables . . . . . . . . . . . . . . . . . . . . . . . . .   101

    B.1.1 Transformación de una variable . . . . . . . . . . . . . . . . . .   102B.1.2 Recodificación de una Variable . . . . . . . . . . . . . . . . . .   103B.1.3 Filtrado de datos . . . . . . . . . . . . . . . . . . . . . . . . .   103

    B.2 Análisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . .   104B.3 Inferencia sobre una o más poblaciones . . . . . . . . . . . . . . . . . .   105

    C Uso de la calculadora en la estad́ıstica 106

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    4/125

    Contenido 3  

    D Apéndice de tablas 108D.1 La función de distribución binomial . . . . . . . . . . . . . . . . . . . .   108D.2 La función de distribución de Poisson . . . . . . . . . . . . . . . . . . .   110D.3 La función de distribució n n o r m a l . . . . . . . . . . . . . . . . . . . . .   112D.4 La función gamma incompleta . . . . . . . . . . . . . . . . . . . . . .   114D.5 Valores cŕıticos para la distribución  t   de Student . . . . . . . . . . . . .   115D.6 Valores cŕıticos para la distribución chi-cuadrada . . . . . . . . . . . . .   116D.7 Valores cŕıticos para la distribución F . . . . . . . . . . . . . . . . . . .   118D.8 Algunos números aleatorios uniformemente distribuidos . . . . . . . . .   122

    Bibliograf́ıa & Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    5/125

    CAPÍTULO 1

    Estad́ıstica descriptiva

    1.1 Introducción

    1.  ¿Por qué usted necesita conocer estad́ıstica?Tres razones fundamentales:

    (a) Presentar y describir la información en forma adecuada.

    (b) Inferir conclusiones sobre poblaciones grandes basándose solamente en lainformación obtenida de subconjuntos de ellas.

    (c) Utilizar modelos para obtener pronósticos confiables.

    2.   TérminosPoblación, muestra, datos, parámetro, estad́ıstico, Censo.

    3.   Métodos estadı́sticos.Métdos estad́ısticos = estad́ıstica descriptiva + estad́ıstica inferencial.

    4.  Organización de datos.Por el tipo de dato, de acuerdo a escalas de medidas, mediante tablas y medianterepresentaciones gráficas.

    5.  Organización de datos de acuerdo al tipo.Existen dos tipos de datos: categóricos (o cualitativos) y numéricos (cuantita-tivos). Estos últimos se clasifican a su vez en discretos y continuos.

    6.  Organización de datos de acuerdo a escalas de medidas.Nominal, ordinal, de intervalo y de razón. Ver   LLinás [11] o  Weimer [23] paramayores detalles.

    7.  Organización de datos mediante tablas.Se necesita concepto: Frecuencias absoluta, relativa, acumulada y acumuladarelativa. Dos tipos de tablas:

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    6/125

    1.1 Introducción 5 

    (a)  Tablas de frecuencias agrupadas .Tablas con datos + frecuencias.

    Ejemplo 1.1.1   La tabla de frecuencias (no agrupada) para el conjunto de datos 3 5 7 6 4 3 7 6 6 7 5 7 es 

    Dato 3 4 5 6 7  Frecuencia 2 1 2 3 4

    (b)   Tablas de frecuencias no agrupadas .Intervalos de clase, ĺımites de clase, fronteras de clase, Marcas de clase, ampli-tud w. Para hallar número de clases c: Regla de Sturges (c = (3, 3) log n + 1)o  c =

     √ n.

    Ejemplo 1.1.2 (Datos con un solo lugar decimal)   Forme una distribuciónde frecuencias considerando los siguientes datos:

    8,9 10,2 11,5 7,8 10,0 12,2 13,5 14,1 10,0 12,2  6,8 9,5 11,5 11,2 14,9 7,5 10,0 6,0 15,8 11,5  

    SOLUCION:

    Paso 1. El rango  R  es 9,8.

    Paso 2. Por regla de Sturges, c =  5   (aproximar al entero más cercano).

    Paso 3.   w =   Rc

      = 2  (aproximar al entero siguiente).

    Paso 4. Como la unidad de medida es 0,1 (por tener los datos un sólo lugar decimal) y como el “punto medio” de cada unidad de medida es 0,05, entonces,

    Frontera inf. de primera clase   =  dato menor  −   0,05   =   5, 95.

    En consecuencia, la tabla es 

    Clase Cuenta Frecuencia Marcas de clase  X

    5,95 - 7,95   ||||   4 6,957,95 - 9,95   ||   2 8,95

    9,95 - 11,95   ||||| |||   8 10,9511,95 - 13,95   |||   3 12,9513,95 - 15,95   |||   3 14,95

    8.  Organización de datos mediante representaciones gráficas.Hay gráficas de varios tipos, entre los cuales se encuentran los siguientes: eldiagrama circular o de pastel, el pictograma, el diagrama de barras, el diagrama decaja y bigote, el histograma, el poĺıgono (de frecuencia o de frecuencias relativas),la ojiva (o poĺıgono de frecuencias acumuladas o poĺıgono de frecuencias relativasacumuladas) y el diagrama de tallo y hojas.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    7/125

    1.2 Medidas estad́ısticas 6  

    9.   Histograma

    Fronteras

         F    r    e    c .

        r    e     l .     (    e    n     %     )

    5 ,95 7, 95 9, 95 11, 95 1 3, 95 15 ,950

    10

    20

    30

    40

    Fronteras

       F  r  e  c .  r  e   l .   (  e  n   %   )

    (a) Histograma de frecuencias relativas

    Fronteras

         F    r    e    c .

        a    c    u    m .

    5, 95 7, 95 9, 95 11, 95 13 ,95 15 ,950

    4

    8

    12

    16

    20

    Fronteras

       F  r  e  c .  a  c  u  m .

    (b) Histograma de frecuencias acumu-ladas

    10.   Poĺıgono y ojiva.

    Marcas de clase

         F    r    e    c    u    e    n    c     i    a    s

    4,95 6,95 8,95 10,95 12,95 14,95 16,950

    2

    4

    6

    8

    Marcas de clase

           F     r     e     c     u     e     n     c       i     a     s

    (c) Poĺıgono de frecuencias

    Fronteras superiores

         F    r    e    c .

        a    c    u    m .

    5, 95 7, 95 9, 95 11, 95 13 ,95 15 ,950

    4

    8

    12

    16

    20

    Fronteras superiores

       F  r  e  c .  a  c  u  m .

    (d) Ojiva

    1.2 Medidas estad́ısticas

    1.  Medidas de tendencia central o de centralización.La media aritmética (ponderada), la mediana, la moda, el rango medio (promedio

    de los datos mayor y menor), la media geométrica, la media armónica y la mediacuadrática. En  LLinás [11] se hace una descripción completa de estas medidas.

    2.  Medidas de colocación o de posición relativa.La mediana, los percentiles, deciles y . En  LLinás   [11] se hace una descripcióncompleta de estas medidas.

    3.  Medidas de dispersión o de variabilidad.El rango (diferencia entre datos mayor y menor), el rango intercuartil (diferenciaentre el tercer y el primer cuartil), la varianza, la desviación estándar y el coeficientede varianción de Pearson (desviación estándar dividida entre la media, multiplicadapor 100 por ciento). En LLinás [11] se explican con detalles todas estas medidas.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    8/125

    1.2 Medidas estad́ısticas 7  

    4.   Aplicaciones de la desviación estándar poblacional.Se utilizan dos reglas:

    (a)  Regla de Tchebychev (v´ alida para cualquier poblaci´ on).Por lo menos el  100(1 − 1/k 2)% de los valores de la población se encuentranen el intervalo   [µ − kσ;   µ + kσ ].

    k    1,5 2 2,5 3 3,5 4

    100(1 − 1/k 2)%   55,6% 75% 84% 88,9% 91,18% 93,7%

    (b)   Regla empı́rica (v´ alida s´ olo para poblaciones de forma acampanada).El 68% de los datos de la población se encuentran en   [µ  −  σ;   µ  +  σ ]  y el95% de los datos en  [µ − 2σ;   µ + 2σ ].

    Ejemplo 1.2.1   Un inspector de control de calidad selecciona aleatoriamente 14 clavos 

    de una caja de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm,son

    2, 54 2, 55 2, 50 2, 60 2, 51 2, 52 2, 70 2, 40 2, 36 2, 53 2, 54 2, 52 2, 51 2, 55.

    Si el inspector decide excluir los clavos que est án fuera del intervalo  x ± 2s, entonces,a lo más el 25% estarán fuera del intervalo. ¿Se verifica la regla de Tchebychev?    ◭

    5.   Coeficiente de variación de Pearson.

    CV   =

    desviación estándar de los datos

    media aritmética de los datos

    · 100%.

    Ejemplo 1.2.2   Los siguientes datos representan el promedio de millas por gaĺondiario por cinco dı́as para un determinado auto: 20, 25, 30, 15, 35. Por consiguiente,el tama˜ no relativo de la “dispersión media alrededor de la media” con relación a la media es 31,6%.   ◭

    Ejemplo 1.2.3   El gerente de operaciones de un servicio de paqueteŕıa desea adquirir una nueva flota de autos. Cuando los paquetes se guardan con eficiencia en el inte-rior de los autos (durante la preparación de las entregas), se deben considerar dos restricciones principales: el peso (en libras) y el volumen (en pies cúbicos) de cada  paquete. Ahora, en una muestra de 200 paquetes, el peso promedio es 26 libras conuna desviación estándar de 3,9 libras. Además, el volumen promedio de cada paquete es 8,8 pies cúbicos con una desviación estándar de 2,2 pies cúbicos. Por consiguiente,

    con relación a la media, el volumen de un paquete es mucho más variable que su peso.¿Por qué?    ◭

    Ejemplo 1.2.4   Un inversionista potencial piensa adquirir acciones en una de dos compa˜ ńıas A o B, listadas en la Bolsa de Valores de Nueva York. Si ninguna de las compa˜ ńıas ofrece dividendos a sus clientes y ambas tienen igual clasificación (segúnvarios servicios de inversión) en términos de crecimiento potencial, el posible inver-sionista quizás considere la volatilidad (variabilidad) de ambas acciones para ayudar en la decisión de inversión. En los últimos meses, el precio promedio de las acciones enla compa˜ ńıa A fue de 50 dólares con una desviación estándar de 10 dólares. Además,durante el mismo periodo, el precio promedio de las acciones en la compa˜ ńıa B fue de 12 dólares con una desviación estándar de 4 dólares. Entonces, en relación con la media, el precio de las acciones B es mucho m ás variable que el de las acciones A.   ◭

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    9/125

    1.2 Medidas estad́ısticas 8  

    6.   Medidas de formas.Coeficiente de sesgo y medida de curtosis.

    7.   Simetrı́a y asimetŕıa.Una distribución de frecuencias será simétrica o asimétrica según lo sea su repre-sentación gráfica.1

    Si una distribucón no es simétrica, se dice que es asimétrica a la derecha (positi-vamente) o a la izquierda (negativamente).2

    En la figura 1.1 se ilustra el caso en que la distribuci ón de frecuencias tiene unasola moda.

    (e) Distribución simétrica (f) Distribución asimétrica a la derecha

    (g) Distribución asimétrica a la izquierda

    Fig. 1.1: Comparación de tres distribuciones unimodales cuya forma difiere.

    8.   Coeficiente de sesgo  Ap.Se define como:

    Ap   =  Media aritmética  −  Moda

    Desviación estándar  .

    Cuando   Ap   =   0, se dice que la distibución es simétrica; cuando   Ap   < 0, sedice que la distribución es   sesgada negativamente   o   a la izquierda   y

    1En cualquier distribución simétrica, la media coincide con la mediana.2En las medidas asimétricas unimodales la mediana está entre la media y la moda.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    10/125

    1.3 Análisis exploratorio de datos 9  

    cuando Ap > 0, se dice que la distribución es  sesgada positivamente  o  a laderecha.

    9.   Relación emṕırica entre media, mediana y moda.Para distribuciones campanoides, unimodales y moderadamente asimétricas secumple aproximadamente la relación emṕırica

    Media  −  Moda ≈   3(Media aritmética  −  Mediana),

    Con lo anterior, el coeficiente de asimetŕıa de Pearson la podemos calcular tambiéna través de la fórmula

    Ap   =  3(Media aritmética  −  Mediana)

    Desviación estándar  .

    10.   Medidas de curtosis o apuntamiento.Se aplican a distribuciones campaniformes, es decir, unimodales simétricas o conligera asimetŕıa.

    1.3 Análisis exploratorio de datos

    Muchos autores presentan el diagrama de tallo y hoja como técnica del análisis ex-ploratorio de datos. Consiste en desarrollar un resumen de cinco n´ umeros  y construir undiagrama de caja y bigotes .

    1.  Resumen de cinco números.Consiste en cinco cantidades que se emplean para resumir los datos: valor ḿınimo,primer cuartil (Q1), Mediana (Q2), tercer cuartil (Q3) y valor máximo.

    2.   Situaciones para reconocer la simetŕıa de los datos.Si la distribución es simétrica:

    •  La distancia de  Q1  a la mediana es igual a la distancia de la mediana a  Q3.•  La distancia del valor ḿınimo a   Q1   es igual a la distancia de   Q3  al valor

    máximo.

    •  La mediana y el rango medio son iguales. (Estas medidas son iguales a lamedia de los datos.)

    3.   Situaciones para reconocer la no simetŕıa de los datos.Si la distribucíon no es simétrica:

    •   En las distribuciones sesgadas a la derecha, la distancia de Q3 al valor máximoexcede la distancia del valor mı́nimo a   Q1. Además, la mediana es menorque el rango medio.

    •   En las distribuciones sesgadas a la izquierda, la distancia del valor mı́nimo aQ1  excede la distancia de  Q3  al valor máximo. Además, el rango medio esmenor que la mediana.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    11/125

    1.3 Análisis exploratorio de datos 10  

    Diagrama de caja y bigotes

    Salarios mensuales2200 2400 2600 2800 3000

     Valor atípico(moderado)

     Valores atípicos(extremos)

    1,5 R.I1,5 R.I

    Mediana

    Media

    +

    2,200 2,400 2,600 2,800 3,000

    ++

    Primer Tercercuartil cuartil

    3 R.I

    Fig. 1.2: Diagrama de caja y bigotes

    4.  Diagrama de caja y bigotes.(R.I. significa el rango intercuartil, los segmentos horzontales son los llamadosbigotes y los valores que están por fuera de los bigotes se llaman valores at́ıpicos).

    5.  Diagramas de cajas múltiples (o comparativos).La figura 1.3 contiene los diagramas de caja de las calificaciones en un examende matemáticas para quince estudiantes de primer curso de primaria, quince de

    segundo y quince de tercero.

    Calificaciones

    Primero

    Segundo

    Tercero

    40 50 60 70 80 90 100Calificaciones

    Fig. 1.3: Diagrama de caja y bigotes de las calificaciones en un examen

    En el diagrama puede apreciarse que no hay valores at́ıpicos en ninguno de los tresgrupos. Los estudiantes del tercer curso consiguieron la mejor mediana, pero suscalificaciones tienen una variabilidad considerablemente mayor que la de los otrosgrupos. Otro hecho que llama la atencíon es la gran cantidad de calificaciones

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    12/125

    Cap. 1. Ejercicios 11

    bajas obtenidas por los estudiantes de primer curso. Finalmente, podemos afirmarque las distribuciones de frecuencias de los tres conjuntos de datos están sesgadasa la izquierda.

     Ejercicios

    1. Diga si la afirmación dada es verdadera o falsa. Justifique siempre su respuesta. En casoque sea falso, dé un contraejemplo.

    (a) Si la desviacíon estándar de un conjunto de datos es 0, entonces, los datos son iguales.

    (b) No existen datos de tal forma que sean iguales el rango y la varianza.

    (c) Existen datos con desviación estándar negativa.

    (d) En una distribución simétrica, la media, la mediana y la moda son iguales.

    (e) La desviación estándar está dada por las mismas unidades que la media.(f) Toda informacíon numérica proporciona datos cuantitativos.

    (g) Toda información no numérica ofrece datos cuantitativos.

    (h) Cuando todos los datos son categóricos, la moda es la única medida de tendenciacentral que se puede utilizar.

    (i) Si el primer cuartil en el primer examen de estad́ıstica fue de 3,0, entonces, este valorindica que el 25% de los estudiantes ganaron el examen.

    2. Clasifique los datos siguientes en cuantitativos (numéricos) y cualitativos (categóricos).En caso de ser numérico, como discretos o continuos:

    (a) Estaturas en cent́ımetros de cuatro jugadores de fútbol.

    (b) Las temperaturas promedios diarias en el último mes.

    (c) Clasificación étnica de  30 empleados.

    (d) Números telefónicos de ciertas personas.

    (e) Distancia (en metros) recorrido por un atleta en una temporada.

    (f) Peso perdido (en kilogramos) por 10  personas debido a una dieta.

    (g) Fecha de cumpleaños de determinadas personas.

    (h) Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.

    3. Se clasifićo a los estudiantes de un programa universitario de acuerdo a con el semestreque cursa y su preferencia deportiva. Los resultados están registrados en la siguiente tabla.

    Primero Segundo Tercero CuartoFútbol 15 14 5 9Beisbol 12 22 6 6Voleivol 5 5 9 5Basquétbol 26 7 6 7Natación 7 8 4 2

    (a) ¿Qué porcentaje de los estudiantes de primer semestre prefieren el fútbol?

    (b) ¿Qué porcentaje de los aficionados a la natación son de segundo semestre?

    (c) ¿Qué porcentaje del total de los estudiantes prefieren el basquétbol?

    (d) ¿Qué porcentaje de los estudiantes son de cuarto semestre?

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    13/125

    Cap. 1. Ejercicios 12  

    (e) ¿Qué porcentaje del total de estudiantes son de tercer o cuarto semestre?

    (f) ¿Qué porcentaje prefiere la natación, el voleibol o el beisbol?

    4. Los siguientes datos representan las cuentas telefónicas mensuales, en miles de pesos, de25 residentes de un pequeño pueblo:

    21,48 21,15 25,12 23,47 27,81 19,80 36,05 28,50 26,6620,35 30,22 25,49 20,80 23,83 25,35 23,48 25,81 21,0726,83 30,96 33,38 20,77 19,98 35,87 22,02

    (a) ¿Qué porcentaje del grupo pagó más de 21.000 pesos?

    (b) ¿Qué porcentaje pagó más de 22.000 pesos pero menos de 27.000 pesos?

    5. Los datos que se indican a continuación representan el costo (en miles de pesos) de laenerǵıa eléctrica durante un determinado mes del año para una muestra aleatoria de 50

    apartamentos en cierta ciudad importante:128 144 168 109 167 141 149 206 175 123153 197 127 82 96 171 202 178 147 102135 191 137 129 158 108 119 183 151 114111 148 213 130 165 157 185 90 116 172143 187 166 139 149 95 163 150 154 130

    (a) Obtenga una tabla de frecuencias con 7 intervalos de clase.

    (b) Grafique el correspondiente histograma de frecuencias, el poĺıgono de frecuenciasrelativas y la ojiva con frecuencias acumuladas relativas.

    (c) ¿Alrededor de qué cantidad parece concentrarse el costo mensual de enerǵıa eléctrica?

    (d) Según su opinión, ¿cuál de las gráficas representa mejor la distribución de los costosde energı́a eĺectrica?

    6. Responda las siguientes preguntas. Justifique sus respuestas.

    (a) ¿Qué escala de medida se requiere para la mediana? ¿Y para la moda?

    (b) ¿En qué condiciones coinciden la media, la mediana y la moda de una muestra?

    (c) ¿En qué caso será demasiado grande la diferencia entre la media y la mediana?

    7. Una empresa de servicio eléctrico de una ciudad le realiza la lectura del contador de luz aun usuario, obteniendo los siguientes datos:

    Fecha Lectura

    Agosto 27 00553 KwhAgosto 30 00571 Kwh

    Septiembre 4 00605 Kwh

    El recibo de pago le llegó al usuario con lectura de 00638 Kwh, realizada el 9 de septiembre,pero la empresa no dejó constancia de lectura, hecho que motivó el reclamo del usuarioalegando que le estaban cobrando de más. ¿Tiene la razón el usuario? Explique.

    8. Los neumáticos de cierta marca tiene una duración de vida con media de 29.000 kilómetrosy desviación t́ıpica de 3.000 kilómetros.

    (a) Encontrar un intervalo en el que se pueda garantizar que se encuentra por lo menosel  75%  de los tiempos de vida de los neumáticos de esta marca.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    14/125

    Cap. 1. Ejercicios 13  

    (b) Usando la regla imṕırica y suponiendo que la población tiene forma acampanada,encontrar un intervalo en el cual se estime que se encuentra aproximadamente el  95%de los tiempos de vida de los neumáticos de esta marca.

    9. Los valores de presión sangúınea se reportan a veces a los 5 mm Hg más cercanos (100,105, 110, etc.). Suponga que los valores reales de presión sanguı́nea para nueve individuosseleccionados al azar son:

    130,0 113,7 122,0 108,3 131,5 133,2 118,6 127,4 138,4

    (a) ¿Cuál es la mediana de los valores reportados de presi ón sangúınea?

    (b) Suponga que la presión del octavo individuo es 127,6 en lugar de 127,4 (un peque ñocambio en su valor). ¿Cómo afectaŕıa esto a la mediana de los valores reportados?¿Qué dice esto sobre la sensibilidad de la mediana para redondear o agrupar los datos?

    10. La propagación de grietas por fatiga en diversas partes de aeronaves ha sido objeto de

    profundo estudio en años recientes. Los datos que aparecen a continuación constan detiempo de propagación (horas de vuelo/104) para llegar a un tamaño de grieta dado enagujeros sujetadores que se usan en aeronaves militares:

    0,915 0,937 0,983 1,007 0,736 0,863 0,865 0,9131,132 1,140 1,153 1,253 1,394 1,011 1,064 1,109

    (a) Calcule los valores de la media y mediana muestrales.

    (b) ¿En cuánto se puede reducir la observación muestral más grande, sin afectar el valorde la mediana?

    11. Una manifestación interesante de la variación surge cuando se efectúan los análisis deemisión de gases en los veh́ıculos automotores. Los requisitos de costo y tiempo del

    procedimiento federal de prueba (PFT) en cierto pais evitan la difusi ón de su uso en losprogramas de inspección vehicular. Como resultado, muchas agencias han desarrolladoanálisis menos costosos y más rápidos con la esperanza de reproducir los resultados.Según un art́ıculo de una prestigiosa revista, se dice que la eceptación del PFT comopatrón de excelencia ha conducido a la creencia de que las mediciones repetidas en elmismo veh́ıculo darán resultados idénticos (o casi). Los autores del art́ıculo aplicaron elPFT a siete veh́ıculos caracterizados como “grandes emisores”. Los resultados de uno deesos veh́ıculos son los siguientes:

    HC (g/mi) 32,2 32,5 13,8 18,3CO (g/mi) 232 236 118 149

    (a) Calcule las desviaciones estándar muestrales de las observaciones de HC y CO. ¿Parece

     justificada la creencia general?(b) Compare los coeficientes de variación de cada conjunto de datos para determinar

    cuáles presentan mayor o menor variación.

    12. Un taller de mecánica acepta una orden por 10.000 ruedas de 2 pulgadas de diámetro.Las especificaciones de tamaño del producto podrán ser mantenidas sólo si el diámetromedio es de 2 pulgadas y la desviación estándar es muy pequeña. En este caso, ¿cuál esel margen de tolerancia permitido para la desviación estándar?

    13. A continuación se presentan algunas medidas estad́ısticas (mediana, primer y tercer cuartil)y una tabla de frecuencia agrupada, para las edades de un grupo de personas que hayen una sala de concierto. A partir de estos datos, responder las preguntas que aparecenabajo. Mediana = 20, primer cuartil = 17,5 y tercer cuartil = 23.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    15/125

    Cap. 1. Ejercicios 14

    Frecuencia Frecuencia Frec. acum.Edades Frecuencia relativa acumulada relativa

    11,5 - 14,5 2 0,0500 2 0,0500

    14,5 - 17,5 8 0,2000 10 0,250017,5 - 20,5 11 0,2750 21 0,525020,5 - 23,5 10 0,2500 31 0,775023,5 - 26,5 8 0,2000 39 0,975026,5 - 29,5 1 0,0250 40 1,0000

    (a) ¿Cuál era el número exacto de personas que hab́ıan en la sala del concierto?

    (b) ¿Cuál es la media aproximada de las personas que asistieron al concierto?

    (c) ¿Qué edad tienen el 77,5% de las personas?

    (d) ¿Qué porcentaje de personas tienen una edad entre 11,5 y 20,5?

    (e) ¿Qué porcentaje de personas tienen una edad mayor de 23,5?

    (f) ¿Cuántas personas tienen una edad entre 17,5 y 20,5?(g) ¿Cuántas personas tienen una edad mayor que 14,5?

    (h) ¿Qué interpretación tiene el valor de la mediana y el de los cuartiles?

    14. Los siguientes datos representan los rendimientos porcentuales anuales en cuentas demercado de dinero de una muestra de 15 bancos comerciales en el área metropolitana deuna ciudad a una determinada fecha:

    Nombre del Banco Rendimiento Nombre del banco RendimientoBanco su cuenta 3,10 Banco el Pais 2,28The Bank 2,63 Banco la Clave 3,01Mein Bank 2,79 Banco del Norte 2,53

    Your Bank 3,25 Banco del Sur 2,00El Banco del pueblo 1,90 Banco Nacional 3,05Aero Bank 2,79 Nuestro Banco 2,02Union Bank 2,90 Banco el dinero 3,05Bank del cliente 2,73

    (a) Proporcione el resumen de cinco números.

    (b) Construya el diagrama de caja y bigotes y describa la forma.

    (c) Si alguien le dijera:“los rendimientos del mercado de dinero no vaŕıan mucho de unbanco a otro”, con base en estos datos, ¿qué diŕıa?

    15. Una de las metas de toda administracíon es ganar lo más posible en relación con el

    capital invertido en la empresa. Una medida del éxito en alcanzarla es el retorno sobrela aportación, que es la relación de la ganancia neta entre el valor de las acciones. Acontinuación se muestran los porcentajes de ganancia sobre las acciones para 25 empresas.

    11,4 15,8 52,7 17,3 12,3 9,0 19,6 22,9 41,65,1 17,3 31,1 6,2 19,2 14,7 9,6 8,6 11,2

    16,6 5,0 30,3 12,8 12,2 14,5 9,2

    Forme el resumen de cinco números, trace un diagrama de caja y bigotes y determine sihay valores at́ıpicos. ¿Cómo podŕıa un analista financiero usar esta información?

      16. Considere la variable  anchura  que contiene el conjunto de datos que encontramos en elarchivo calles.sf3  y que corresponde al ancho de 112 calles de Madrid (España).

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    16/125

    Cap. 1. Ejercicios 15  

    (a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 0 y la última frontera superior sea 40. A partir de ella, responda lassiguientes preguntas:

    i. ¿Cuántas calles tienen un ancho entre 5 y 25 kilómetros?

    ii. ¿Qué porcentaje de calles tienen un ancho entre 10 y 30 kilómetros?

    iii. ¿Cuántas calles tienen un ancho mayor de 20 kilómetros?

    iv. ¿Qué porcentaje de calles tienen un ancho mayor 25 kilómetros?

    v. ¿Cuántas calles tienen un ancho menor de 15 kilómetros?

    vi. ¿Qué porcentaje de calles tienen un ancho menor de 35 kilómetros?

    (b) Con 8 clases (en donde la primera frontera inferior sea 0 y la última frontera superiorsea 40), construir los histogramas de frecuencias absolutas y de frecuencias absolutasacumuladas, los poĺıgonos de frecuencia y de frecuencias relativas y las ojivas de fre-cuencias acumuladas y de frecuencias relativas acumulada. A partir de estos gráficos,responda las siguientes preguntas:

    i. ¿Aproximadamente cuántas calles tienen un ancho mayor que 16,9 kilómetros?

    ii. ¿Aproximadamente cuántas calles tienen un ancho menor que 12,5 kilómetros?

    iii. ¿Qué porcentaje aproximado de calles tienen un ancho mayor de 7,7 kilómetros?

    iv. ¿Qué porcentaje aproximado de calles tienen un ancho menor de 13,8 kilómetros?

    (c) Estudie la simetŕıa de la distribución de los datos.

    (d) ¿Existen valores at́ıpicos? ¿Cuántos? ¿Cuáles?

    (e) ¿Existe alguna transformación que mejora la simetŕıa? ¿Y la presencia de valoresat́ıpicos? Indique en caso positivo la transformación seleccionada.

      17. En el archivo de datos   autos.sf3   mostramos las distancias recorridas (dadas en millaspor galón) de 154 modelos de automóviles sacados al mercado entre los años 1978 y

    1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses(origen=3). Tambíen aparecen los respectivos cilindrajes de los autos, las potencias, etc.

    (a) Construya un diagrama de caja y bigotes para los datos de la distancia recorrida y apartir de él, responda las siguientes preguntas: ¿Entre cuáles valores vaŕıa la distanciarecorrida? ¿Cuánto recorre el 50% central de los autos? ¿Hay valores at́ıpicos? ¿Essimétrica o asimétrica la distribución de los datos? En caso de ser asimétrica, ¿esasimétrica a la izquierda o a la derecha? ¿Cuáles son los valores de la media y de lamediana?

    (b) Estudie el grado de simetŕıa de los datos de la distancia recorrida de cuatro manerasdiferentes (compare sus respuestas):

    i. Utilizando las medidas estad́ısticas (media, mediana, moda, sesgo, etc. )

    ii. Construyendo un histograma de frecuencias con 5 clases.iii. Construyendo un un histograma con 13 clases. ¿Porqúe este histograma resulta

    más adecuado que el que construyó con 5 clases?

    iv. Construyendo un gráfico de simetŕıa con la opción graphical options  . . . symmetry plot   de Statgraphics.

     18. Se han medido los diámetros (en miĺımetros) de 50 tornillos y se han obtenido los resultadosque mostramos en el archivo  tornillos.sf3.

    (a) Forme la tabla de frecuencias con 6 clases para los datos y, a partir de ella, respondalas siguientes preguntas:

    i. ¿Cuántos tornillos tienen un diámetro entre 29 y 32 miĺımetros?

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    17/125

    Cap. 1. Ejercicios 16  

    ii. ¿Qué porcentaje de tornillos tienen un diámetro entre 30 y 34 miĺımetros?

    iii. ¿Cuántos tornillos tienen un diámetro mayor de 32 miĺımetros?

    iv. ¿Qué porcentaje de tornillos tienen un diámetro mayor 34 miĺımetros?

    v. ¿Cuántos tornillos tienen un diámetro menor de 31 miĺımetros?

    vi. ¿Qué porcentaje de tornillos tienen un diámetro menor de 33 miĺımetros?

    (b) Con 6 clases, construir los histogramas de frecuencias absolutas y de frecuenciasabsolutas acumuladas, los poĺıgonos de frecuencia y de frecuencias relativas y lasojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir deestos gráficos, responda las siguientes preguntas:

    i. ¿Aproximadamente cuántos tornillos tienen un diámetro mayor que 34,4 mil ı́metros?

    ii. ¿Aproximadamente cuántos tornillos tienen un diámetro menor que 32,2 miĺımetros?

    iii. ¿Qué porcentaje aproximado de tornillos tienen un diámetro mayor de 31,6miĺımetros?

    iv. ¿Cuántos tornillos tienen un diámetro menor de 32,8 miĺımetros?

    (c) Estudie la simetŕıa de la distribución de los datos.

      19. Los datos del archivo  fotocopia.sf3 muestran el gasto en fotocopias (en miles de pesos)de 70 estudiantes universitarios durante un determinado año.

    (a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 0 y la última frontera superior sea $ 1.400.000. A partir de ella, respondalas siguientes preguntas:

    i. ¿Cuántos estudiantes han gastando entre $ 175.000 y $ 525.00 en el año?

    ii. ¿Qué porcentaje de estudiantes han gastando entre $ 700.000 y $ 1.225.000 enel año?

    iii. ¿Cuántos estudiantes han gastando más de $ 1.050.000 en el año?

    iv. ¿Qué porcentaje de estudiantes han gastando más de $ 350.000 en el año?v. ¿Cuántos estudiantes han gastando menos de $ 875.000 en el año?

    vi. ¿Qué porcentaje de estudiantes han gastando menos de $ 525.000 en el año?

    (b) Con 8 clases (en donde la primera frontera inferior sea 0 y la última frontera superiorsea $ 1.400.000), construir los histogramas de frecuencias absolutas y de frecuenciasabsolutas acumuladas, los poĺıgonos de frecuencia y de frecuencias relativas y lasojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir deestos gráficos, responda las siguientes preguntas:

    i. ¿Aproximadamente cuántos estudiantes han gastando más de $ 767.810 en elaño?

    ii. ¿Aproximadamente cuántos estudiantes han gastando menos de $ 391.821 en el

    año?iii. ¿Qué porcentaje aproximado de estudiantes han gastando más de $ 601.583 en

    el año?

    iv. ¿Cuántos estudiantes han gastando menos de $ 1.104.220 en el año?

    (c) Estudie la simetŕıa de la distribución de los datos.

    (d) ¿Existen valores at́ıpicos? ¿Cuántos? ¿Cuáles?

    (e) Realice una transformación logaŕıtmica de los datos e interprete los resultados. Co-mente las diferencias con los datos sin transformar.

     20. En el archivo de datos doscientos.sf3 proporcionamos las sesenta y nueve mejores marcasde todos los tiempos en la prueba de 200 metros lisos masculinos (las marcas se dan ensegundos), aśı como el nombre del atleta y la fecha en que se consiguió la marca.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    18/125

    Cap. 1. Ejercicios 17  

    (a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 19,2 segundos y la última frontera superior sea 20,2 segundos. A partirde ella, responda las siguientes preguntas:

    i. ¿Cuántos atletas han recorrido entre 19,325 y 19,7 segundos?

    ii. ¿Qué porcentaje de atletas han recorrido entre 19,45 y 19,95 segundos?

    iii. ¿Cuántos atletas han recorrido más de 19,7 segundos?

    iv. ¿Qué porcentaje de atletas han recorrido más de 19,45 segundos?

    v. ¿Cuántos atletas han recorrido menos de 19,95 segundos?

    vi. ¿Qué porcentaje de atletas han recorrido menos de 19,825 segundos?

    (b) Con 8 clases (en donde la primera frontera inferior sea 19,2 segundos y la última fron-tera superior sea 20,2 segundos.), construir los histogramas de frecuencias absolutasy de frecuencias absolutas acumuladas, los poĺıgonos de frecuencia y de frecuenciasrelativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada.A partir de estos gráficos, responda las siguientes preguntas:

    i. ¿Aproximadamente cuántos atletas han recorrido más de 19,818 segundos?

    ii. ¿Qué porcentaje aproximado de atletas han recorrido más de 19,845 segundos?

    iii. ¿Qué porcentaje aproximado de atletas han recorrido más de 19,782 segundos?

    iv. ¿Aproximadamente cuántos atletas han recorrido menos de 20,03 segundos?

    (c) Estudie la simetŕıa de la distribución de los datos.

    (d) ¿Se detecta algo peculiar en la distribución de estos datos?

    (e) ¿Se detecta algún valor potencialmente at́ıpico? ¿Cuál es?

     21. En el archivo de datos Cavendish.sf3 presentamos 29 medidas de la densidad de la tierraobtenidas por Henry Cavendish en 1798 empleando una balanza de torsión. La densidadde la tierra se proporciona como un múltiplo de la densidad del agua.

    (a) Utilice los diagramas de tallo y hojas y de cajas para determinar si existe algún valorat́ıpico.

    (b) Proponga, razonando la respuesta, un valor para la densidad de la tierra.

      22. En el archivo de datos   autos.sf3   mostramos las distancias recorridas (dadas en millaspor galón) de 154 modelos de automóviles sacados al mercado entre los años 1978 y1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses(origen=3). Tambíen aparecen los respectivos cilindrajes de los autos, las potencias, etc.

    (a) Considere por separado los conjuntos de distancias recorridas de los modelos de cadauno de los cinco años.

    i. Analice gráfica y numéricamente cada uno de estos conjuntos.

    ii. Utilizando la opción  Plot   . . .  Exploratory Plots   . . .  Multiple Box-and-Whishker Plot  . . . Data=distancia . . . Level codes=year   . . . obtenga los diagramas de cajas(múltiples) de los cinco conjuntos de distancias recorridas con respecto a cadauno de los años. ¿Qué se observa? ¿Conoce alguna razón que pueda explicarlo que resulta de los análisis numéricos y de la observación de los diagramas decajas?

    (b) Ahora, construya el diagrama de caja múltiple de la distancia recorrida de los au-tomóviles según su cilindrada.

    i. Teniendo en cuenta cada uno de los diagramas, responda las preguntas formu-ladas en la parte (a).

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    19/125

    Cap. 1. Ejercicios 18  

    ii. Compare entre śı los distintos diagramas y responda las siguientes preguntas:¿Dónde es más fuerte la asimetŕıa? ¿Dónde es menor? ¿Dónde no existe? ¿Vaŕıabastante los valores de la media y de la mediana para los diferentes grupos?

    (c) Construya el diagrama de caja múltiple de la potencia de los automóviles según suorigen y responda las preguntas formuladas en el inciso anterior.

      23. En el archivo de datos   gemelos.sf3   mostramos los resultados de tests de inteligenciarealizados a parejas de gemelos monozigóticos. Los gemelos monozigóticos se formanpor la división en dos de un mismo óvulo ya fecundado y, por tanto, tienen la mismacarga genética. Al mismo tiempo, por razones obvias, es muy frecuente que compartan elentorno vital y es dif́ıcil separar ambos factores. En el conjunto de datos, los datos de lacolumna A corresponden al gemelo criado por sus padres naturales, los de la columna B alcriado por un familiar u otra persona. Mediante la opción Compare   . . .  Two Samples   . . .Two Sample Comparison   . . .  Sample 1=A   . . .  Sample 2=B   . . .  Ok , resuelva lo siguiente:

    (a) Compare la simetŕıa de los datos de la columna A y B.

    (b) Construya un diagrama de caja múltiple para los datos de la columna A y B y describasus interesantes propiedades.

    (c) ¿Cómo interpreta el coeficiente de variación de ambos conjuntos de datos?

      24. En 1893 Lord Rayleigh investigó la densidad del nitrógeno empleando en su obtencióndistintas fuentes. Previamente hab́ıa comprobado la gran discrepancia existente entre ladensidad del nitrógeno producido tras la eliminación del ox́ıgeno del aire y el nitrógenoproducido por la descomposición de ciertos compuestos qúımicos. Los datos del archivoRayleigh.sf3  muestran esta diferencia de forma clara. Esto llevó a Lord Rayleigh a in-vestigar detenidamente la composición del aire libre de ox́ıgeno y al descubrimiento de unnuevo elemento gaseoso, el argón.

    (a) Analice numérica y gráficamente estos datos. Preste especial atención a los diagramasde tallo y hojas y al diagrama de cajas. ¿Hay alguna peculiaridad de la población depesos que se manifieste en un diagrama y no en el otro?

    (b) Realice diagramas de cajas dividiendo los datos en los pesos obtenidos a partir de airey los obtenidos a partir de compuestos qúımicos del nitrógeno. ¿Qué se observa?

     25. Una de las medidas de seguridad de los reactores nucleares frente a desajustes en el procesode generación de enerǵıa o de extracción de ésta es el disparo del reactor. Esta medidaconsiste en la detención del proceso de fusión mediante la inserción en el núcleo del reactorde venenos neutrónicos. El número de disparos no previstos de un reactor en un periodo esun indicador de problemas de comportamiento y de fiabilidad en la planta. En el archivode datos disparos.sf3 proporcionamos, para dos años diferentes (1984 y 1993), el número

    de disparos no previstos en sesenta y seis reactores nucleares de los Estados Unidos deNorteamérica.

    (a) Analice numérica y gráficamente, por separado, el número de disparos de reactor encada uno de los dos años considerados.

    (b) Compare gŕaficamente las distribuciones de ambas variables ¿Se aprecian diferenciasimportantes entre ellas? ¿Qué conclusiones le merece esta comparación?

      26. Sea una variable X  que presenta los valorees  x1,  x2,  x3,  x4,  x5   con frecuencias absolutasn1  = 1,  n2  = 2,  n3  = 8,  n4  = 5  y  n5  = 6.

    (a) Representar la variable  X   mediante digramas de barras horizontales.

    (b) Hacer la representación con barras horizontales apiladas.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    20/125

    Cap. 1. Ejercicios 19  

    (c) Representar la variable X  mediante digramas de barras verticales.

    (d) Representar la variable X  mediante un diagrama de barras varticales con la ĺınea basesituada a la altura del punto 4.

    (e) Representar la variable X mediante un diagrama de barras horizontales con rectángulosde error representados por ĺıneas y definidos por la variable  Y  cuyos valores son 1,5;2,5; 3,5; 3 y 2.

      27. La encuesta de población activa elaborada por una empresa referente al cuarto trimestrede 1.970 presenta para el número de activos por ramas los siguientes datos:

    RAMA DE ACTIVIDAD MILES DE ACTIVOSAgricultura, caza y pesca 3706,3Fabriles 3437,8Construcción 1096,3Comercio 1388,3

    Transporte 648,7Otros servicios 2454,8

    (a) Realizar un gráfico de sectores con porcentajes del número de activos por ramas.

    (b) Realizar el gráfico conlas etiquetas de las ramas de actividad sobre los sectores.

    (c) Desplazar el sector relativo a la rama con menor número de activos.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    21/125

    CAPÍTULO 2

    Probabilidad

    2.1 Experimentos, espacios muestrales y eventos

    1.  Experimentos determińısticos y aleatorios.

    (a)   Experimento: cualquier acción que genera observaciones.

    (b)   Experimento determińıstico: al repetirse bajo las mismas condiciones,genera siempre los mismos resultados (como, por ejmplo, las leyes f́ısicas).

    (c)  Experimento aleatorio (o  estocástico): Al repertirse bajo las mismas

    condiciones, no genera siempre los mismos resultados.

    2.   Espacio muestral, evento y evento elemental.

    (a)   Espacio muestral   Ω: Conjunto de todos los posibles resultados de unexperimento aleatorio.

    (b)   Evento: cualquier subconjunto de  Ω.

    (c)   Evento elemental: evento con un solo elemento.

    2.2 Técnicas de conteo

    Conteo por enumeración de elementos, conteo a través de diagramas de árbol, teoremafundamental del conteo, principio de adición, conteo de permutaciones y el conteo decombinaciones.

    1.   Permutación.Arreglo ordenado de una cantidad finita de objetos distintos.

    2.   Situaciones especiales (relacionadas con permutaciones).

    •  Permutaciones sin repetición de  n objetos tomados todos a la vez.•  Permutaciones sin repetición de  n objetos tomados de  k  en  k  (k  ≤ n).

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    22/125

    2.2 Técnicas de conteo 21

    •  Permutaciones circulares.•  Permutaciones con repetición de n  objetos tomados de k  en k  (k  es cualquier

    número natural).•   Permutaciones de   n  objetos de los cuales hay   n1  de un primer tipo,  n2  deun segundo tipo,  . . .,  nk de un  k -ésimo tipo, donde n1+ n2+ · · ·+ nk =  n.

    •  Maneras de hacer una partición de un conjunto.Sólo ilustraremos la primera.

    3.   Permutaciones sin repetición de  n  objetos tomados todos a la vez.El número de permutaciones de un conjunto de  n  elementos distintos es igual1 an! := 1 · 2 · · · (n − 1) · n, siendo  0! := 1.

    Ejemplo 2.2.1  Suponga que una empresa dispone de ocho máquinas atornilladoras  y de ocho espacios en el área de producción. Entonces, hay   8! =  40.320  maneras de ordenar las ocho máquinas en los ocho espacios disponibles.   ◭

    4.  Combinación.Cualquier escogencia de   k   objetos de un conjunto de   n   objetos distintos, sinimportar el orden en que los  k  objetos son escogidos (una combinación puede sercon repetición o sin repetición).

    5.   Fórmula para calcular el número de combinaciones.El número de combinaciones de   k   objetos seleccionados, sin repetición, de unconjunto de  n elementos, es2

    nk 

     :=

      n!

    k !(n − k )!,   siendo

    n0

     :=  1.

    Y el número de combinaciones de  k   objetos seleccionados con repetición, de unconjunto de  n elementos, es

    n + k − 1

     =

      (n + k − 1)!

    k !(n − 1)!  ,   siendo

    n

    0

     :=  1.

    Ejemplo 2.2.2 (Combinaciones tomadas de 2 en 2, sin repetición)  Hay 10 posi-bles formas de escoger dos letras de un total de 5, cuando el orden no importa y la 

    selección es sin repetición.   ◭

    Ejemplo 2.2.3 (Combinaciones tomadas de 2 en 2, con repetición)  Hay 15 posi-bles formas de escoger dos letras de un total de 5, cuando el orden no importa y la selección es con repetición.   ◭

    1El śımbolo “!” se conoce con el nombre de  factorial. Cuando escribamos, por ejemplo,   5!leeremos “5 factorial”. Algunos valores factoriales son los siguientes:

    1! =   1,   2! =   2 · 1   =   2,   3! =   3 · 2 · 1   =   6,   4! =   4 · 3 · 2 · 1   =   24, etc.

    2Los númerosn

    k

     se conocen con el nombre de  coeficiente binomial.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    23/125

    2.3 Introducción a la probabilidad 22  

    2.3 Introducción a la probabilidad

    En general, hay 4 formas de calcular o estimar la probabilidad, a saber, mediantelos siguientes métodos (que se relacionan todos entre śı): axiomático, de la fre-cuencia relativa, clásico y subjetivo.

    Sólo explicaremos brevemente los métodos empı́rico y clásico.

    6.   Propiedades de la probabilidad.

    (a)   P(∅) = 0  y  P(Ω) = 1.(b) Si los eventos A,  B  y  C  son mutuamente excluyentes,3 entonces, P(A ∪ B ∪

    C) = P(A) + P(B) + P(C).

    (c)   P(A) = 1 − P(A), siendo  A el complemento de  A.

    (d)   0 ≤ P(A) ≤ 1.(e)   P(A) = P(A ∩ B) + P(A ∩ B).(f)   Teorema de adición para 2 eventos  o  fórmula de Silvester:

    P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

    (g)   Teorema de adición para 3 eventos  o  fórmula de Silvester:

    P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C).

    7.   Método empı́rico.Utiliza datos que se han observado emṕıricamente, registra la frecuencia con queha ocurrido algún evento en el pasado y estima la probabilidad de que el eventoocurra nuevamente con base en estos datos históricos.

    8.   Frecuencia relativa de un evento.Supongamos que un experimento aleatorio se repite   n   veces y que un eventoA  asociado con estas   n  repeticiones ocurre exactamente   k   veces. Entonces, lafrecuencia relativa del evento  A es  fn =

      kn

    .

    Ejemplo 2.3.1   La tabla  2.1  muestra experimentos hechos por tres investigadores:

    Obsérvese que en cada una de las investigaciones, la frecuencia relativa del número de caras es aproximadamente 0,5, que es la probabilidad de obtener una cara.   ◭

    9.   Probabilidad emṕırica.Sea A  un evento asociado con un experimento. Entonces, la probabilidad  P(A) esaproximadamente igual a la frecuencia relativa de  A  si efectuamos el experimentomuchas veces.

    Al usar esta definición, tener en cuenta:

    •  Esta probabilidad es solo una estimación del valor real.3Es decir, todas las posibles intersecciones son vaćıas.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    24/125

    2.3 Introducción a la probabilidad 23  

    FrecuenciaHecho Número de Número relativa

    por Lanzamientos de caras de caras

    Buffon 4.040 2.048 0,5069K. Pearson 12.000 6.019 0,5016K. Pearson 24.000 12.012 0,5005

    Fig. 2.1: Lanzamientos de una moneda realizada por 3 investigadores

    •  A mayor número de experimentos mejor será la estimación.•   Los experimentos deben repetirse siempre bajo las mismas condiciones.

    10.  Probabilidad (clásica) un evento elemental.Sea  Ω  un espacio muestral finito y no vaćıo. Entonces,

    P(evento elemental) =  1

    Número de elementos de  Ω.   (2.1)

    Ejemplo 2.3.2   Consideremos el experimento de lanzar una moneda. Entonces, la  probabilidad de obtener cara, simbolizado por  P(C), y la de obtener sello, simbolizado  por  P(S), está dado por  P (C) = P(S) =   1

    2  = 0, 5. Estas probabilidades las interpreta-

    mos de la siguiente manera: En un gran número de lanzamientos aparecerá una cara aproximadamente en la mitad de los lanzamientos y sello en la otra mitad. O también podemos decir: si la moneda se lanza repetidamente, entonces, el 50% (que resulta de multiplicar 0,5 por 100) de las veces resultará cara y en el otro 50%, sello.   ◭

    11.  Probabilidad (clásica) de un evento.Sea  Ω  finito, no vaćıo y supongamos que (2.1) se cumple para cada evento ele-mental de  Ω. Entonces, para cada evento  A de  Ω, tenemos

    P(A) =  Número de elementos de  A

    Número de elementos de  Ω.   (2.2)

    Ejemplo 2.3.3   Dos dados no falsos se lanzan. Sea   B   el evento de obtener por lo menos un 11. Entonces, la probabilidad de que la suma sea por lo menos un 11 es P(B) =   3

    36  =   1

    12.

    Ejemplo 2.3.4   En la primera época del desarrollo de un yacimiento de petróleo, una empresa estimó en 0,1 la probabilidad de que las reservas económicamente recuper-ables excedieran los 2.000 millones de barriles. La probabilidad de que las reservas excediesen los 1.000 millones de barriles se estimó en 0,5. Dada esta información, la  probabilidad estimada de que las reservas se encuentren entre 1.000 y 2.000 millones de barriles es  0, 5 − 0, 1 =  0, 4.   ◭

    Ejemplo 2.3.5   Un estante tiene 6 libros de matemáticas y 4 de fı́sica. Si todos los libros de matemáticas son diferentes y los libros de f́ısica también, entonces, la  probabilidad de que 3 libros determinados de matemáticas estén juntos es   P(A) =8!3!10!

      = 0, 0666.   ◭

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    25/125

    2.3 Introducción a la probabilidad 24

    Ejemplo 2.3.6  Una caja de doce lapiceros tiene dos que est án defectuosos. Se ex-traen tres lapiceros sin reemplazo. Entonces, la probabilidad de que dos salgan defec-tuosos es  P(A) =   10

    220  = 0, 045.   ◭

    12.   Probabilidad condicional de  A  dado  B.

    Se define como  P(A/B) =   P(A∩B)P(B)

      si  P(B) > 0.

    Ejemplo 2.3.7  Una persona lanza una moneda tres veces. Entonces, la probabilidad 

    de obtener 3 caras dado que salió por lo menos una cara es   1/87/8

      =   17

    .   ◭

    13.  Teorema de multiplicación para 2 eventos.Si   A   y   B  son dos eventos de un espacio muestral   Ω = ∅   y si   P(B ∩ A)   > 0,entonces,

    P(B∩

    A) =   P(B/A) P(A)  o por

      P(B∩

    A) =   P(A/B) P(B).

    Ejemplo 2.3.8   Supongamos que una caja tiene diez bolas, de los cuales tres estándefectuosas. Se sacan dos bolas, una detrás de la otra y sin reemplazo. Sean   A   el evento “la primera bola sacada está defectuosa” y  B  el evento “la segunda bola sacada está defectuosa”. Entonces, la probabilidad de sacar una bola defectuosa seguida de otra defectuosa es 

    P(A ∩ B) =   P(A) P(B/A) =   310 ·  2

    9.   ◭

    14.  Teorema de multiplicación para 3 eventos.Si  P(A1 ∩ · · · ∩ A3) > 0, entonces,

    P(A1 ∩ · · · ∩ A3) =   P(A1) · P(A2/A1) · P(A3/A1 ∩ A2).

    Como podemos observar claramente, en este teorema hemos considerando que  A1  es el evento

    que primero sucede, luego sucede  A2; posteriormente,  A3.

    Ejemplo 2.3.9   Una caja contiene 6 fichas rojas, 4 blancas y 5 azules. Halle la  probabilidad de que se extraigan en el orden roja (R), blanca (B) y azul (A) si las fichas no se reemplazan es  P (R ∩ B ∩ A) = 0, 044.   ◭

    15.  Teorema de la probabilidad total.Si los eventos  A1,  A2,  . . .,  An forman una partición

    4 de un espacio muestral  Ω y

    si P(Ai) > 0 para todo i  =  1, . . . , n, entonces, para cada evento  B  de  Ω, se tieneque

    P(B) =   P(B/A1) P(A1) +   P(B/A2) P(A2) + · · · +   P(B/An) P(An).Ejemplo 2.3.10   La caja  I  contiene 3 fichas rojas(R) y 2 azules (A), en tanto que la caja  II  contiene 2 fichas rojas y 8 azules. Se lanza una moneda no falsa de tal forma que si cae cara, entonces, se saca una ficha de la caja  I  y, por el contrario, si cae sello,se saca una ficha de la caja   II. Supongamos que quien lanza la moneda no revela si resulta cara o sello (de tal forma que la caja de la cual se sac ó una ficha no se revela).

    4Es decir, todas las posibles intersecciones son vaćıas y la unión de todos los eventos son igualesa  Ω .

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    26/125

    2.3 Introducción a la probabilidad 25  

    Fig. 2.2: Diagrama para la situación del ejemplo 2.3.10

    Entonces, la probabilidad de haber sacado una ficha roja es 

    P(R) =   P(R/I) P(I) +   P(R/II) P(II) =   0,4.   ◭

    Ejemplo 2.3.11   Un editor env́ıa propaganda de un libro de estad́ıstica al 70% de aquellos profesores que están a cargo de esa materia. El 40% de aquellos que recibieronla propaganda se decidieron a utilizar el libro, inclusive, el 20% de los que no recibieronla propaganda también utilizarán el libro. Entonces, la probabilidad de utilizar el libro es 0,34 (se aplica el teorema de la probabilidad; también se puede calcular la  probabilidad con ayuda del diagrama de árbol que aparece en la figura  2.3).

    Fig. 2.3: Diagrama para la situación del ejemplo 2.3.11  ◭

    16.  Regla o teorema de Bayes.Sea   A1, A2, . . . , An  una partición

    5 de un espacio muestral   Ω. Entonces, paracada evento  B  con  P(B) > 0  y para todo  k  =  1, . . . , n, se tiene

    P(Ak/B) =  P(B/Ak) P(Ak)

    P(B/A1) P(A1) +   P(B/A2) P(A2) + · · · +   P(B/An) P(An) .

    Para poder aplicar la regla de Bayes, recomendamos dibujar siempre un diagramade árbol.

    5Es decir, todas las posibles intersecciones son vaćıas y la unión de todos los eventos son igualesa  Ω .

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    27/125

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    28/125

    2.4 Independencia 27  

    la enfermedad es (por el teorema de Bayes):

    P(A/B) =  P(A ∩ B)

    P(B)

      =  0, 085

    0, 265

      =   0, 3207.   ◭

    2.4 Independencia

    1.   Independencia.A,  B  son (estocásticamente)  independientes, si y sólo si P(A/B) = P(A) y sondependientes en cualquier otro caso. Es decir, el evento A  es independiente delevento B  si la probabilidad de  A no se ve afectada por la ocurrencia o no de  B.

    2.  Teorema de multiplicación para eventos independientes.Dos eventos  A,  B  de un espacio muestral  Ω = ∅  son independientes si y sólo si

    P(A ∩ B) =   P(A)P(B).

    3.  Teorema de independencia.Sean A,  B  eventos de un espacio muestral  Ω = ∅. Entonces, las siguientes cuatroproposiciones son equivalentes:

    (a)   A y  B son independientes. (b)   A y  B  son independientes.

    (c)   A y  B son independientes. (d)   A y  B  son independientes.

     Ejercicios

    1. Una universidad realiza tres tipos de pruebas a 100 aspirantes y obtiene los siguientesresultados: 2 fracasaron en las tres pruebas; 7, en la primera y en la segunda; 8, en lasegunda y en la tercera; 10, en la primera y en la tercera; 25, en la primera; 30, enla segunda; 25, en la tercera. Determine el número de aspirantes que conforman lossiguientes eventos:

    (a) Fracasaron exactamente en una prueba.

    (b) Aprobaron las tres pruebas.

    (c) Fracasaron en la primera y en la tercera, pero no en la segunda.

    (d) Fracasaron en la segunda y en la tercera, pero no en la primera.

    (e) Fracasaron en al menos una prueba.(f) Aprobaron al menos una prueba

    (g) Aprobaron la segunda o la tercera, pero no la primera.

    2. Un equipo de f́utbol ha determinado contratar un futbolista de talla internacional para elpróximo campeonato. Sean A, B  y  C  eventos que representan el hecho de que el futbolistacontratado ha jugado en el Real Madrid, en el Milan y en el Bayern de Munich, respecti-vamente. Utilice las operaciones de unión, intersección y complemento para describir, entérminos de  A,  B  y  C, dibuje un diagrama de Venn y sombree la región correspondientea cada uno.

    (a) Por lo menos el futbolista ha jugado en uno de los tres equipos mencionados ante-riormente.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    29/125

    Cap. 2. Ejercicios 28  

    (b) El futbolista ha jugado en los tres equipos mencionados anteriormente.

    (c) El futbolista ha jugado en el Real Madrid y no en el Milan.

    (d) El futbolista sólo ha jugado en el Bayern de Munich.(e) El futbolista ha jugado exactamente en uno de los tres equipos mencionados ante-

    riormente.

    3. Los estudiantes de un curso de estad́ıstica se clasifican como estudiantes de administra-ción, econoḿıa o ingenieŕıa; como repitente o no repitente y también como hombre omujer. Encuentre el número total de clasificaciones posibles para los estudiantes de dichocurso.

    4. Supongamos que 7 personas se quieren organizar en una fila. ¿De cuántas manerasdiferentes pueden hacerlo?

    5. La mayor accionista de una determinada empresa decide que en el futuro se divida el pre-supuesto de publicidad entre tres agencias. Seis son las agencias que se están considerando

    para este trabajo. ¿Cuántas son las posibles elecciones de tres agencias?

    6. Las placas para autos en Barranquilla antes teńıan dos letras y cuatro números. El sistemade nomenclatura cambió y ahora son de tres letras y tres números. Con el sistema actual,¿aumentó o disminuyó el número de placas que se pueden emitir? ¿En qué porcentaje?

    7. En una comunidad el 30% de las personas son fumadoras, 55% son bebedoras y 20%tanto fumadoras como bebedoras. Calcule la probabilidad de que una persona elegida alazar (a) fume pero no beba, (b) ni fume ni beba, (c) fume o no beba. Interprete siempresus resultados.

    8. Para un control de calidad se seleccionan aleatoriamente dos abanicos sin reemplazo de unlote. Si uno de los dos abanicos está defectuoso, todo el lote se rechaza. Si una muestrade 200 abanicos contiene cinco defectuosos calcule la probabilidad de que la muestra sea

    rechazada.

    9. La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas enaquellos que fuma o no fuman y aquellos que tiene problemas de salud.

    Problemas Fuman No fumanŚı 0,15 0,09No 0,18 0,58

    (a) ¿Cuál es la probabilidad de que un adulto de esta poblaci ón elegido al azar tengaproblemas de salud?

    (b) ¿Cuál es la probabilidad de que un adulto de esta poblaci ón elegido fume?

    (c) ¿Cuál es la probabilidad de que un adulto de esta población elegido al azar que nofume tenga problemas de salud?

    10. En cierta empresa, 31% de los empleados son europeos, 42% son asiáticos y 27% sonlatinoamericanos. De los empleados europeos, 34% son mujeres; de los asiáticos, 42%son mujeres; mientras que de los latinoamericanos, 72% son mujeres.

    (a) ¿Cuál es la probabilidad de que un empleado seleccionado al azar sea una (mujer)europea? ¿(Hombre) asiático?

    (b) ¿Cuál es la probabilidad de que un empleado seleccionado al azar sea una mujer?¿Hombre?

    (c) Si un empleado seleccionado al azar es una mujer, ¿cuál es la probabilidad de que seaeuropea? ¿Asiática? ¿Latinoamericana?

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    30/125

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    31/125

    Cap. 2. Ejercicios 30  

    15. Suponga que las proporciones de fenotipos sangúıneos en determinada población son lossiguientes:   A   :  35%,   B   :  28%,   AB   :  13%  y   O   :  24%. Supongamos que los fenotipos dedos personas seleccionadas al azar son independientes entre śı. ¿Cuál es la probabilidad

    de que ambos fenotipos sean  O?

    16. Se clasifican muestras de hule de espuma de tres proveedores de acuerdo a si cumplen ono con las especificaciones. Los resultados de 100 muestras se resumen a continuaci ón:

    Proveedor Śı cumple No cumple1 17 32 18 103 50 2

    Si  A  denota el evento de que una muestra es del proveedor 1 y si  B  denota el evento deque una muestra cumple con las especificaciones, determine si  A  y  B   son independientes.¿Son independientes  A  y  B?

    17. Se seleccionó una muestra de 570 encuestados en una cierta ciudad para recoger in-formación acerca del comportamiento de los consumidores. Entre las preguntas estaba:“¿Disfruta usted comprando ropa?” De 270 hombres, 165 respondieron que śı. De 300mujeres, 224 respondieron que sı́.

    (a) Suponga que el participante elegido es mujer. ¿Cuál es la probabilidad de que nodisfrute comprando ropa?

    (b) Suponga que el participante elegido disfruta comprando la ropa. ¿Cuál es la proba-bilidad de que la persona sea hombre?

    (c) Los eventos disfrutar comprando ropa y sexo del participante, ¿son estad́ısticamenteindependientes? Explique.

    18. Una compañ́ıa de seguros estima que el 30% de los accidentes de automóvil son debidosal estado de embriaguez del conductor y que el 20% provocan heridos. Además, el 40% delos accidentes que dan lugar a heridos son debidos al estado de embriaguez del conductor

    (a) ¿Cuál es la probabilidad de que un accidente elegido al azar haya sido causado por elestado de embriaguez del conductor y haya dado lugar a heridos?

    (b) ¿ Son los sucesos debido al estado de embriaguez del conductor” y “da lugar a heridos”independientes?

    (c) Si un accidente elegido al azar es causado por el estado de embriaguez del conductor,¿cuál es la probabilidad de que haya dado lugar a heridos?

    (d) ¿Cuál es la probabilidad de que un accidente elegido al azar haya sido provocado porel estado de embriaguez del conductor y no haya dado lugar a heridos?

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    32/125

    CAPÍTULO 3

    Distribuciones de probabilidad

    3.1 Variables aleatorias discretas

    1.  Variable aleatoria.X :  Ω −→ R. Se clasifica en discreta o continua.

    2.  Variable aleatoria discreta.Tiene una cantidad o finita o (infinita) enumerable de valores.

    3.   Función de probabilidad  f  de  X.

    Una función  f : R −→ [0, 1 ]  tal quef(x) =

      P(X =  x),   si  x =  x1, x2, . . .;0,   de otra forma.

    Es claro que:

    (a)   f(x) ≥ 0  para todo valor  x  real.

    (b) x∈R

    f(x) =  1.

    (c) La gráfica de  f  es un histograma de probabilidad.

    4.   Función de distribución acumulada de X

    .Una función  F : R −→ [0, 1 ]  definida porF(t) =   P(X ≤ t) =

    x;x≤t

    f(x),   para todo t  real.

    5.   Propiedades de  F.

    (a)   0 ≤ F(t) ≤ 1.(b) F es creciente y escalonada.

    (c)   F(−

    ∞) = 1  y  F(

    ∞) = 0.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    33/125

    3.2 Variables aleatorias continuas 32  

    6.  Comentarios generales.

    (a)   P(X =  a) no siempre es cero.

    (b)   P(a < X ≤ b) = F(b) − F(a).(c)   P(a ≤ X ≤ b) = F(b) − F(a).(d)   P(a ≤ X ≤ b) = P(a < X ≤ b).

    7.   ¿Cómo se calcula   f  a partir de  F?Si a− es el valor máximo posible de X  que es estrictamente menor que  a, entonces,

    f(a) =   F(a) − F(a−)

    8.   Esperanza y varianza.

    E(X) = k

    xk · f(xk), V (X) = k

    (xk − µ )2 · f(xk).

    9.  Propiedades de la esperanza y varianza.

    (a)   E(aX + b) =   aE(X) +   b.

    (b)   V (aX + b) =   a2V (X).

    (c)   V (X) =   E(X2) −

    E(X)2

    .

    3.2 Variables aleatorias continuas1.  Variable aleatoria.

    X :  Ω −→ R. Se clasifica en discreta o continua.2.  Variable aleatoria continua.

    Tiene una cantidad infinita no enumerable de valores.

    3.   Función de densidad   f  de  X.Una función  f : R −→ [0,∞) que cumple las dos condiciones:

    (a)   P(a

     ≤ X

     ≤ b) =

    b

    a f(x) dx, para todo  a y  b reales.(b) El área bajo toda la gráfica de  f  es 1, es decir,

    ∞−∞ f(x) dx =  1.

    La gráfica de  f  es una curva.

    4.   Función de distribución acumulada de  X.Una función  F : R −→ [0, 1 ]  definida por

    F(t) =   P(X ≤ t) =t 

    −∞f(x) dx,   para todo  t  real.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    34/125

    Cap. 3. Ejercicios 33  

    5.   Propiedades de  F.

    (a)   0

     ≤ F(t)

     ≤ 1.

    (b) F es creciente y continua.

    (c)   F(−∞) = 1  y  F(∞) = 0.6.  Comentarios generales.

    (a)   P(X =  a) siempre es cero.

    (b)   P(a < X ≤ b) = F(b) − F(a).(c)   P(a ≤ X ≤ b) = F(b) − F(a).(d)   P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b).

    7.   ¿Cómo se calcula   f  a partir de  F?f(x) = F ′(x), para todo valor de  x  en donde exista la derivada.

    8.   Esperanza y varianza.

    E(X) =

    ∞ −∞

    x · f(x) dx, V  (X) =∞ −∞

    (x − µ )2 · f(x) dx.

    9.  Propiedades de la esperanza y varianza.  Las mismas que en el caso discreto.

     Ejercicios1. ¿Son las siguientes afirmaciones verdaderas o falsas? Justifique cada respuesta.

    (a) Toda variable aleatoria es un número.

    (b) Si f  es la función de probabilidad de una variable aleatoria discreta  X  y 0 es un posiblevalor de  X, entonces,  f(0) = 0.

    (c) Para cualquier variable aleatoria discreta X  se cumple que  P(X =  1) = 1, en donde 1es un posible valor de  X.

    (d) Si   F   es la función de distribución acumulada de una variable aleatoria   X   discreta,entonces, F  es una función escalonada.

    (e) Si   X  es una variable aleatoria discreta con función de distribución acumulada   F, en-

    tonces, se cumple que  P(3 ≤ X < 5) = F(5) − F(3).(f) Si  f  es la función de densidad de una variable aleatoria continua  X, entonces,  f(x) =

    P(X =  x), para todo número real  x.

    (g) Para cualquier variable aleatoria continua X  se cumple que  P (X =  1) = 1.

    (h) Si   F  es la función de distribución acumulada de una variable aleatoria   X   continua,entonces, F  es una función escalonada

    (i) Si   X  es una variable aleatoria continua con función de distribución acumulada   F,entonces, se cumple que  P ( 4 ≤ X < 8) = F(8) − F( 4).

    (j) Si  X  es cualquier variable aleatoria y si la variable aleatoria  X + 4  tiene esperanza 1,entonces, la esperanza de  X  es 5.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    35/125

    Cap. 3. Ejercicios 34

    2. Una pizzeŕıa, que atiende pedidos por correo, tiene cinco ĺıneas telefónicas. Sea   X   lavariable aleatoria que representa al número de ĺıneas en uso en un momento especı́fico.Supongamos que la función de probabilidad  f de  X  está dada en la siguiente tabla:

    Valor  x  de  X   0 1 2 3 4 5f(x)   0,20 0,25 0,10 0,15 0,09 0,21

    Calcule la probabilidad de cada uno de los siguientes eventos:

    (a)   A =  “a lo sumo 2 ĺıneas están en uso”.

    (b)   B =  “menos de 4 ĺıneas están en uso”.

    (c)   C =  “por lo menos 3 l ı́neas están en uso”.

    (d)   D =  “entre 2 y 4 (ambos inclusive) ĺıneas están en uso”.

    (e)   E =  “entre 2 y 5 (ambos inclusive) l ı́neas no están en uso”.

    (f)   F =  “por lo menos 3 ĺıneas no están en uso”.

    3. La funcíon de probabilidad de la variable aleatoria  X  que representa al número de imper-fecciones por 4 metros de un papel especial en rollos continuos de ancho uniforme, estádada por

    x   0 1 2 3 4

    f(x)   0,21 0,28 0,10 0,25 0,16

    Determine la funcíon de distribución acumulada de  X  y represéntela gráficamente.

    4. Una fabricante de lapiceros tiene un programa de control de calidad que incluye la in-spección de lapiceros recibidos para revisar que no tengan defectos. Supongamos que, encierto d́ıa, él recibe lapiceros en lotes de cinco y se seleccionan dos lapiceros de un lote

    para inspeccionarlos. Podemos representar los posibles resultados del proceso de selecciónpor pares. Por ejemplo, el par   (3, 4)  representa la selección de los lapiceros 3 y 4 parainspeccionarlos.

    (a) Haga una lista de los resultados diferentes.

    (b) Supongamos que los lapiceros 3 y 4 son los únicos defectuosos de un lote de cinco yse van a escoger dos lapiceros al azar. Defina la variable aleatoria  X  como el númerode de lapiceros defectuosos observado entre los inspeccionados. Encuentre la funcíonde probabilidad de  X.

    (c) Encuentre la función de distribución acumulada F  de  X  y represéntela gráficamente.

    5. Al invertir en unas acciones particulares, una persona puede tener una ganancia en un añode $8.000.000 con probabilidad de 0,4 o tener una pérdida de $2.000 con probabilidad de0,6. ¿Cuál es la ganancia esperada de esta persona? Interprete su respuesta.

    6. El número total de horas, medidas en unidades de 10 horas, que una familia utiliza unalavadora en un peŕıodo de 6 meses es una variable continua  X  con función de densidad

    f(x) =

    x,   si  0 < x < 1,

    2 − x   si  1 ≤ x < 2,0,   de otro modo.

    (a) Haga un bosquejo de la gráfica de  f.

    (b) ¿Cuál es la probabilidad de que en un peŕıodo de 6 meses, una familia utilice sulavadora menos de 15 horas? ¿Entre 5 y 12 horas?

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    36/125

    Cap. 3. Ejercicios 35  

    7. Suponga que la temperatura de reacción (en grados cent́ıgrados) de cierto proceso qúımicoes una variable aleatoria continua X  con función de densidad

    f(x) = 1 − x,   si  −k  ≤ x ≤ k,0,   de otra manera.

    (a) Halle el valor de  k  para que  f  sea en realidad una densidad y, luego, trace la gráficade  f.

    (b) Calcule la probabilidad de que la temperatura de reacción sea estrictamente positiva.

    (c) Calcule la probabilidad de que la temperatura de reacción se encuentre entre 0 y 1/2grados cent́ıgrados.

    (d) Calcule probabilidad de que la temperatura de reacción sea menor que  −1/4 gradoscent́ıgrados o mayor que 1/4 grados cent́ıgrados.

    8. Un maestro universitario nunca termina su clase antes de que suene la campana y siempretermina su clase por lo menos 2 minutos después de que suena la campana. Sea   X   eltiempo (en minutos) que transcurre entre la campana y el término de la clase, y supongaque la función de densidad de  X  es

    f(x) =

    kx2,   si  0 ≤ x ≤ 2,0,   de otra manera.

    (a) Encuentre el valor de  k  y luego grafique  f.

    (b) ¿Cuál es la probabilidad de que la clase termine por lo menos 1 minuto después deque suene la campana?

    (c) ¿Cuál es la probabilidad de que la clase continúe entre 60 y 90 segundos después de

    que suene la campana?(d) ¿Cuál es la probabilidad de que la clase continúe por lo menos 90 segundos después

    de que suene la campana?

    9. Un vendedor recibe un salario anual de 12.000.000 de pesos, más un 5% del valor delas ventas que realiza. Las ventas anuales pueden representarse mediante una variablealeatoria con media 20.000.000 de pesos y desviación t ı́pica de 2.000.000 de pesos. Hallela media y la desviación del ingreso anual de este vendedor.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    37/125

    CAPÍTULO 4

    Distribuciones especiales

    1.   Distribuciones especiales discretas :Uniforme discreta, de Bernoulli, binomial, de Poisson, hipergeométrica, binomialnegativa, geométrica, etc.

    2.   Distribuciones especiales continuas :Uniforme continua, normal, gamma, exponencial,   t   de Student, Chi-cuadrada,   Fde Weibull, etc.

    4.1 La distribución uniforme (discreta)1.   Definición.

    Una variable aleatoria discreta  X  con los valores enteros sobre el intervalo   [a, b ]tiene  distribución uniforme discreta  sobre el conjunto de los números en-teros que están en el intervalo   [a, b ], cuando se tiene que   P(X   =   x) =   1

    b−a+1,para todo  x  entero que está en el intervalo  [a, b ]. Además,

    E(X) = a + b

    2  y   V (X) =

      (b − a + 1)2 −   1

    12  .

    4.2 La distribución binomial1.   Experimento de Bernoulli.

    Aquél con sólo dos resultados posibles: “éxito” y “fracaso” y en donde un éxitoocurre con probabilidad  p, siendo  0 < p < 1.

    2.   Experimento binomial.Es un experimento de Bernoulli que se ejecuta   n   veces, de tal manera que lasdiferentes ejecuciones se efectúen independientemente unas de las otras.

    3.   Distribución binomial.Si se realiza  n veces un experimento de Bernoulli con probabilidad de éxito p y si

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    38/125

    4.3 La distribución de Poisson 37  

    X denota al número total de éxitos obtenidos, entonces, la probabilidad de que seobtengan k   éxitos es

    P(X =  k ) = nk pk (1 − p)n−k, k  =  0 , 1, 2 , . . . , n.La correspondiente distribución de  X  se conoce con el nombre de  distribuciónbinomial con parámetros  n y  p. Además,  E(X) = np  y  V (X) = np(1 − p).

    Fig. 4.1: Distribución binomial para varios  n pero fijo  np =  3.

    Ejemplo 4.2.1   Una moneda no falsa es lanzada 10 veces. Consideraremos el evento “cara” como un éxito y “sello” como un fracaso. Es claro que   p   =   0, 5,   n   =   10   y las condiciones básicas que caracterizan a la distribución binomial se satisfacen. Por consiguiente,

    (a) La probabilidad de tener éxito exactamente 7 veces es 0,1172.

    (b) La probabilidad de tener a lo más 7 éxitos es 0,945.

    (c) La probabilidad de tener por lo menos 3 éxitos es 0,945 y la probabilidad de ningún éxito es 9.766  ×10−4.

    4.3 La distribución de Poisson

    1.  Experimento y proceso de Poisson.

    Consideremos las siguientes variables aleatorias:

    (a) El número de part́ıculas emitidas por cierta sustancia radioactiva en un de-terminado lapso de tiempo.

    (b) El número de llamadas que llegan a una central telefónica en cierto intervalode tiempo.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    39/125

    4.3 La distribución de Poisson 38  

    (c) El número de órdenes de devolución de piezas que recibe una empresa enuna semana.

    (d) El número de veces que falla una pieza de un equipo durante un peŕıodo detres meses.

    (e) El número de huelgas anuales en un empresa.

    Cada una de estas variables aleatorias está asociada a unos procesos llamadosprocesos de Poisson.

    2.   Distribución de Poisson.Consideremos un proceso de Poisson con parámetro  λ > 0 (es decir, λ es el númeropromedio de ocurrencias por unidad de tiempo) y sea   X   el “número de eventosque ocurren en un intervalo de tiempo   [0, t ]”. Entonces, la probabilidad de queocurran  k  eventos en el intervalo   [0, t ]  está dada por

    P(X =  k ) =  1

    k ! e−λλk, k  =  0 , 1, 2 , 3, . . . .

    siendo   e   la base del logaritmo natural. La correspondiente distribución de   X   seconoce con el nombre de  distribución de Poisson   con parámetro  λ.   E(X) =V (X) = λ.

    Fig. 4.2: Distribuciones de Poisson para varios valores del parámetro  λ.

    Ejemplo 4.3.1   Los sábados por la ma˜ nana, los clientes entran en una peque˜ na tienda de un centro comercial suburbano a una tasa esperada de 0,50 por minuto. Halle la  probabilidad de que el número de clientes que entran en un intervalo especı́fico de 10 minutos es (a) 3, (b) a lo más 3.SOLUCION:Las hipótesis del proceso de Poisson parecen ser razonables en este contexto. Damos  por sentado que los clientes no llegan en grupos (o podemos contar al grupo entero como un solo cliente) y que la entrada de un cliente no aumenta ni disminuye la 

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    40/125

    4.4 La distribución hipergeométrica 39  

     probabilidad de que llegue otro. Para obtener  λ, observamos que auna tasa media de 0,50 por minuto durante un periodo de 10 minutos, podemos esperar  λ  = (0,50)(10) =5 entradas. Sea  X  la variable aleatoria que representa al número de clientes que entran

    en un intervalo espećıfico de 10 minutos. Por tanto, (a)   P(X   =   3) =   0, 1403   y (b)P(X ≤ 3) = 0, 2650.   ◭

    Ejemplo 4.3.2  La distribución de Poisson ha resultado ser muy útil en problemas de ĺıneas de espera o   colas. Los clientes llegan a una máquina fotocopiadora a una tasa media de 2 cada 5 minutos. En la práctica, se pueden representar los procesos de llegada de esta clase mediante una distribución de Poisson. Asumiendo que éste es el caso,

    (a) La probabilidad de que no haya llegadas en un peŕıodo de cinco minutos es 0,135.

    (b) La probabilidad de que haya 1 llegada es 0,271.

    (c) La probabilidad de que haya estrictamente más de dos llegadas es 0,323.   ◭

    3.  Teorema de aproximación de la binomial a la Poisson.Sea   X   una variable aleatoria binomial con parámetros   n   y   p. Si   n   es grande(n ≥ 100),  p  pequeña ( p ≤ 0,01) y  np  tiene un tamaño moderado (np ≤ 20),entonces, la distribución binomial con parámetros n y p puede aproximarse bien porla distribución de Poisson con parámetro  λ  =  np. Es decir, bajo estas condicionesse cumple que

    b(k ; n; p)  ≈   p(k ; np), k  =  0, 1, 2, 3, . . .

    o, que es equivalente,

    B(k ; n; p)  ≈   P(k ; np), k  =  0 , 1, 2 , 3, . . . .

    Ejemplo 4.3.3   Una cierta compa˜ nı́a electrónica produce 15.000 unidades de un tipo especial de tubo al vaćıo. Se ha observado que, en promedio, 3 tubos de 300 sondefectuosos. La compa˜ ńıa empaca los tubos en cajas de 600. ¿Cuál es la probabilidad de que en una caja de 600 tubos hayan (a) 5 tubos defectuosos, (b) por lo menos 3 defectuosos y (c) a lo más 1 defectuoso? SOLUCION:Sea  X  la variable aleatoria que representa al número de tubos defectuosos. Entonces,X es una variable binomial con parámetros  n  =  600  y  p  =  0,01. Aplicando el teorema de aproximación, tenemos (a)  P(X =  5)0, 161, (b)  P(X ≥ 3) = 0, 938  y (c)  P (X ≤ 1) =0, 017

    .  ◭

    4.4 La distribución hipergeométrica

    1.   Experimento hipergeométrico.

    En general, un   experimento hipergeométrico   con parámetros   n,   M  y   Nestá basado en las siguientes suposiciones (véase la figura 4.3):

    (H1) La poblacíon o conjunto donde deba hacerse el muestreo es una poblaci ónfinita con  N elementos.

  • 8/9/2019 Referencia LLinas 12 -Metodos Estadisticos

    41/125

    4.4 La distribución hipergeométrica 40