LIBRO EA

133
ASIGNATURA ESTADÍSTICA APLICADA – ESTADÍSTICA INFERENCIAL DOCENTE TITULAR: MG. CARMEN BARRETO R. AÑO 2013

Transcript of LIBRO EA

  • ASIGNATURA

    ESTADSTICA APLICADA ESTADSTICA INFERENCIAL

    DOCENTE TITULAR: MG. CARMEN BARRETO R.

    AO 2013

  • CONTENIDO

    Pg.1. DISTRIBUCIONES CONTINUAS IMPORTANTES 1

    1.1. LA DISTRIBUCIN NORMAL 1

    1.2. FUNCIN DE DENSIDAD DE PROBABILIDAD DE LA DISTRIBUCIN 1NORMAL GENERAL

    1.3. GRFICO DE LA DISTRIBUCIN NORMAL GENERAL 2

    1.4. PROPIEDADES DE LA DISTRIBUCIN NORMAL GENERAL 2

    1.5. DISTRIBUCIN NORMAL ESTNDAR 3

    1.6. FUNCIN DE DENSIDAD DE PROBABILIDAD DE LA DISTRIBUCIN 3

    NORMAL ESTNDAR

    1.7. GRFICO DE LA DISTRIBUCIN NORMAL ESTNDAR 4

    1.8. CALCULO DIRECTO EN LA DISTRIBUCIN NORMAL ESTNDAR 4

    1.9. PROPIEDADES PARA EL CALCULO DE OTRAS AREAS BAJO LA CURVA 7 NORMAL ESTANDAR1.10. CALCULO INVERSO EN LA DISTRIBUCION NORMAL ESTANDAR 121.11. ESTANDARIZACION DE UNA VARIABLE ALEATORIA NORMAL 181.12. APLICACIONES DE LA DISTRIBUCION NORMAL ESTANDAR 241.13. DISTRIBUCIN T STUDENT 31

    1.14. DISTRIBUCIN CHI CUADRADO 37

    2. INTERVALOS DE CONFIANZA Y TAMAO DE MUESTRA

    2.1. INTRODUCCIN 41

    2.2. DEFINICIN 42

    2.3. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONALHACIENDO 43

    2.4. TAMAO DE MUESTRA CUANDO EL PARMETRO ES LA MEDIA 52

    EL POBLACIONAL USANDO MUESTREO ALEATORIO SIMPLE 2.5. INTERVALOS DE CONFIANZA PARA LA PROPORCIN POBLACIONAL 552.6. TAMAO DE MUESTRA CUANDO EL PARAMETRO ES LA 61

    PROPORCION PROBLACION USANDO EL MUESTREO ALEATORIO SIMPLE3. PRUEBA DE HIPTESIS 66

    3.1. INTRODUCCIN 66

  • 3.2. DEFINICIONES GENERALES 66

    3.3. PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONAL 71

    3.4. PRUEBA DE HIPTESIS PARA LA PROPORCIN POBLACIONAL 86

    3.5. PRUEBA DE INDEPENDENCIA CHI CUADRADO 96

    4. REGRESIN Y CORRELACIN LINEAL SIMPLE

    4.1. REGRESIN LINEAL SIMPLE 106

    4.2. CORRELACIN LINEAL SIMPLE 120

    5. REFERENCIAS BIBLIOGRFICAS 132

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    CAPITULO I

    DISTRIBUCIONES CONTINUAS IMPORTANTES

    1.1. DISTRIBUCIN NORMAL GENERALLa distribucin de probabilidad continua ms importante en todo el campo de laestadstica, es con toda seguridad la distribucin normal, debido a que en la prcticamuchos fenmenos, industriales, cientficos, o de la vida diaria pueden describirsepor esta distribucin. A la distribucin normal frecuentemente se le llama distribucingaussiana. La curva normal puede considerarse como modelo terico para analizarsituaciones reales.

    1.2. FUNCIN DE DENSIDAD DE PROBABILIDADUna variable aleatoria contina X, se dice que est distribucin normalmente, conmedia u )( y varianza 02 , si su funcin de densidad de probabilidadest dado por:

    x;e

    21)x(f

    2x21

    Donde:

    .....1415.3 y ...7182.2e

    1.3. GRFICO DE LA DISTRIBUCIN NORMAL GENERAL

    fig. 1: La Distribucin Normal

    ____________________________________________ 1Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    - m

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    La distribucin normal se emplea tanto que ha menudo se emplea la siguiente notacin

    abreviada: X ),,( 2n para indicar que la variable aleatoria X se distribuye normalmente

    con media y varianza 2.

    1.4. PROPIEDADES DE LA DISTRIBUCION NORMAL GENERALa) La distribucin normal es simtrica y tiene forma de campana, se extiende de a . b) En la distribucin normal la media est en la mitad y divide el rea en dosmitades y la media, la mediana y la moda tienen el mismo valor.c) El rea total bajo la curva normal es el 100%.

    d) Existe una distribucin normal diferente para cada combinacin de media y

    desviacin estndar.

    e) La probabilidad de que una variable aleatoria tenga un valor entre dos puntos

    es igual al rea bajo la curva normal entre los dos puntos, tal como se muestra en la

    fig. 2.

    P(a x b) = rea bajo la curva normal entre a y b.

    fig. 2

    f) En la fig. 3 muestra el rea bajo la curva normal de 1, 2 y 3 desviacionesestndar de la media.

    ____________________________________________ 2Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    a b-

    -

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    fig. 3

    1.5. DISTRIBUCIN NORMAL ESTNDARDado que existe una distribucin normal diferente para una combinacin de media ydesviacin estndar, sera intil intentar elaborar las tablas suficientes para calcularprobabilidades, adems de la complejidad de la funcin de densidad (frmula),existe sin embargo, una alternativa sencilla que evita estos problemas. Para ello sepuede convertir esta escala real a una relativa o estandarizada, mediante la variablenormalizada.En donde:

    1.6. FUNCIN DE DENSIDAD DE PROBABILIDADUna variable aleatoria contina Z , se dice que est distribucin normalmente, conmedia 0m = y varianza 2 1s = , si su funcin de densidad de probabilidad est dadopor:

    Donde:

    ____________________________________________ 3Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    1m - s3m - s

    68.0%

    95.5%

    99.7%

    1m + s2m - s

    21 z21f (z) e ; z

    2-

    = - < < p

    2m + s 3m + s0

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Adems:

    X : Algunos valores de inters : Media : Desviacin estndar

    La distribucin de una variable normal con media cero y varianza 1, se denota: Zn(0,1) y se lee: Distribucin Normal con media cero y varianza 1.

    1.7. GRFICO DE LA DISTRIBUCIN NORMAL ESTNDAR

    fig. 4

    1.8. CALCULO DIRECTO EN LA DISTRIBUCIN NORMAL ESTANDAR MANEJO DE TABLAS ESTADSTICAS .a) Uso de la Tabla I

    fig. 5: Area bajo la curva normal que se muestra en la Tabla I

    ____________________________________________ 4Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    0 Z

    xZ

    0

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Ejemplo 1:Obtener el rea para Z < 1.35

    1 35P[ Z . ] ?

    En primer lugar se debe localizar al valor 1.3 en el lado izquierdo de la Tabla I yluego el 0.05 (5 es el ltimo dgito) en su parte superior. El rea bajo la curva sepuede leer en la informacin de la fila Z = 1.3 y la columna 0.05. El valor es 0.9115.

    Luego: P(Z < 1.35) = 0.9115

    Observe la tabla:TABLA N 1

    rea bajo una curva normal entre - y Z = 1.35Z 0.00 0.01 0.02 0.03 0.04 0.05 .... 0.09

    -3.4-3.3

    .

    .

    .0.0...

    0.91.01.11.21.3...

    3.4

    ____________________________________________ 5Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    0.9115

    0.9115

    1.350-

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Ejemplo 2:Obtener el area para Z < -2.58

    En primer lugar se debe localizar al valor -2.5 en el lado izquierdo de la Tabla I yluego el 0.08 (8 es el ltimo dgito) en su parte superior. El rea bajo la curva sepuede leer en la informacin de la fila Z = -2.5 y la columna 0.08. El valor es 0.0049

    Luego: P(Z

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    b) Uso de la Tabla N II

    fig. 6: rea bajo la curva normal que se muestra en la Tabla II

    Ejemplo 3:Obtener el rea para -1.96 Z 1.96. Cabe indicar que los puntos son simtricos.En primer lugar se debe localizar al valor 1.9 en el lado izquierdo de la Tabla II yluego 0.06 (6 es el ltimo dgito) en su parte superior. El rea bajo la curva se puedeleer en la informacin de la fila Z = 1.9 y la columna 0.06. El valor es 0.95.

    Luego:

    95.0]96.1Z96.1[P

    1.9. PROPIEDADES PARA EL CALCULO DE OTRAS AREAS BAJO LA CURVA NORMAL ESTANDAR

    En esta sesin daremos propiedades para el clculo de reas bajo la curva normalestndar para utilizarlas posteriormente en aplicaciones pertinentes de dichadistribucin.

    ____________________________________________ 7Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    -Z 0 Z

    0.95

    -1.96 1.960

  • Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    a) [ ] [ ]O OP Z Z 1 P Z Z = - 30)

    Varianza poblacional desconocida se estima a travs de la muestra. Es decir si

    Poblacin normal.

    Para el nivel de confianza 1 = 0.90 El error estndar de la media muestral es:

    x

    s 16s 1.78n 81

    = = =

    c) Haremos uso de la estadstica Z descrita en el Caso I ii

    d) Hallando el intervalo de confianza:

    ___________________________________________________________________________ 48Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    s 16 soles.=

    OZ 1.645=

    2 2s 16 soles entonces s 256 soles= =

    2 2( s )s @

    x 250 soles=

  • Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    1 0

    2 0

    1

    2

    1

    2

    s 16L x Z 250 1.645n 81s 16L x Z 250 1.645n 81

    L 250 1.645 1.78L 250 1.645 1.78

    L 250 2.93 247.07 solesL 250 2.93 252.93 soles

    = - = -

    = + = +

    = -

    = -

    = - =

    = + =

    e) Interpretacin: Con una seguridad del 90% el gasto medio mensual de consumo mensual vara entre 247.07 soles y 252.93 soles.

    Ejemplo 19:Con el fin de medir el rendimiento de una mquina (N de unidades producidas), se tomauna muestra y se obtiene los siguientes resultados: 20, 24, 22, 22, 21, 27, 25. Si sabeque el rendimiento sigue una distribucin normal. Encontrar un intervalo de confianza del99% para el rendimiento medio.

    Solucin:a) Se desea estimar:

    : Tiempo medio poblacional de ejecucin en milisegundos de un programa.

    b) Anlisis:

    n=7 (n

  • Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    x

    s 23s 8.69n 7

    = = =

    c) Haremos uso de la estadstica t:

    d) Hallando el intervalo de confianza:

    1 0

    2 0

    1

    2

    1

    2

    s 2.45L x t 23 3.707n 7s 2.45L x t 23 3.707n 7

    L 23 3.707 0.93L 23 3.707 0.93

    L 23 3.45 19.55 20 unidadesL 23 3.45 26.45 26unidades

    = - = -

    = + = +

    = - =@ -

    = - = @= + = @

    e) Interpretacin: El rendimiento medio de la mquina vara entre 20 y 26 unidades con unaconfianza del 99%.

    Ejemplo 20:En una empresa distribuidora de productos informticos trabajan 500 personas. Unestudio realizado sobre un tamao de muestra de 30 trabajadores demostr que el sueldoanual promedio era $450, con una desviacin estndar de $50. Estime el sueldo anualpromedio de todos los trabajadores de la empresa con un nivel de confianza del 95%.

    Solucin:a) Se desea estimar:

    : Sueldo anual promedio de todos los trabajadores.

    ___________________________________________________________________________ 50Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    b) Anlisis:

    n=30

    Varianza poblacional desconocida 22 s es estima a travs de la muestra. Es decir

    Poblacin normal. Se tiene una poblacin finita de tamao N=500, entonces El error estndar de la

    media muestral x es:

    86.8150030500

    3050

    1NnN

    nss x

    c) Haremos uso de la estadstica Z descrita en el Caso I - ii:

    d) Hallando el intervalo de confianza:

    e) Interpretacin:

    El sueldo anual promedio de todos los trabajadores vara entre $432.63 y $467.37 conuna confianza del 95%.

    ___________________________________________________________________________ 51Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    450$x

    50$s

    2 2s 50 $ entonces s 250$= =

    1 0

    2 0

    1

    2

    1

    2

    s N n 45 500 30L x Z 450 1.96N 1 500 1n 30

    s N n 45 500 30L x Z 450 1.96N 1 500 1n 30

    L 450 1.96 8.86L 450 1.96 8.86

    L 450 17.37 $432.63 solesL 450 17.37 $467.63 soles

    - -= - = -

    - -

    - -= + = +

    - -

    = - = -

    = - == + =

  • Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    2.4. TAMAO DE MUESTRA CUANDO EL PARAMETRO ES LA MEDIAPOBLACIONAL USANDO EL MUESTREO ALEATORIO SIMPLE

    2.4.1. CALCULO DEL TAMAO MUESTRAL USANDO EL MUESTREO ALEATORIOSIMPLE

    Caracterstica de la Poblacin Tamao de la muestraTamao de la poblacin infinita o desconocido.

    2

    2221

    eZ

    n

    Tamao de la poblacin finita.

    )1N(eZNZ

    n 22222

    21

    Donde:

    n Tamao de la muestra.N Tamao de la poblacin.

    Z1-/2

    Valor correspondiente a la distribucin de Gauss

    Z0.975 = 1.96 para = 0.05 y Z0.995 = 2.576 para = 0.01. (Utilizar

    Tabla II). Valor de la varianza poblacional. En caso de no conocerse se

    estima por la varianza muestral (s2) a travs de una muestra

    pilotoe Error que se prev cometer.

    fig. 13Ejemplo 21:Una muestra de 1225 familias revel un gasto semanal de promedio de 250 soles y unadesviacin estndar de 30 soles. Cul deber ser el tamao mnimo de la muestra paraun error mximo semanal de 4 soles, para un nivel de confianza del 99%?Solucin:

    La desviacin estndar se ha obtenido a travs de una muestra entonces:

    ___________________________________________________________________________ 52Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    xmL1 L2

    e

  • Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    s=30 soles.

    Para el nivel de confianza 1 = 0.99 0.975Z 2.576= e = 4 soles. La poblacin es infinita o desconocida.

    La formula a utilizar ser la siguiente:

    2 21 2

    2

    Z sn

    e =

    2 2

    2(2.5.76) (30)n

    (4)

    =

    n 373.3 373 familias= @Ejemplo 22:Una muestra aleatoria de los salarios en soles por hora para nueve trabajadores es:

    10.5, 11, 9.5, 12, 10, 11.5, 13, 9, 8.5.El muestro se realiz sobre una poblacin distribuida normalmente y se desea calcular unintervalo de confianza para el salario promedio de los trabajadores. Hallar el tamaomnimo que debe tener la muestrea para que con un nivel de confianza del 95%, el errorde estimacin no supere a los 0.3 soles, en una poblacin de 600 trabajadores.Solucin:La desviacin estndar es desconocida y se ha obtiene a travs de la muestra:

    s 1.47 soles hora=

    Para el nivel de confianza 1 = 0.95 0.95Z 1.96= e = 0.3 soles. La poblacin es finita de tamao N=600 trabajadores.

    La formula a utilizar ser la siguiente:

    2 21 2

    2 2 21 2

    Z s Nn

    Z s e (N 1)-a

    -a

    =

    + -

    ___________________________________________________________________________ 53Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    2 2

    2 2 2(1.96) (1.47) 600n

    (1.96) (1.47) (0.3) (600 1)

    = + -

    n 56.9 57 trabajadores.= @

    Ejemplo 23:Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los niosutilizan la Internet. Por estudios anteriores se sabe que la desviacin estndar de dichotiempo es de 2.5 horas, con un nivel de confianza del 95% Qu tamao de muestra sedebera elegir si el error de estimacin puntual no es superior a media hora, si sepoblacin de 500 nios de un colegio X?Solucin:La desviacin estndar es conocida se ha obtenido a travs de la poblacin.

    .horas5.2

    Para el nivel de confianza 1 = 0.95 96.1Z 975.0 .horas5.0e La poblacin es infinita o desconocida.La formula a utilizar ser la siguiente:

    )1N(eZNZ

    n 22221

    2221

    )1500(5.05.296.15005.296.1n 222

    22

    .nios81n

    ___________________________________________________________________________ 54Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    2.5. INTERVALOS DE CONFIANZA PARA LA PROPORCION POBLACIONAL

    2.5.1. INTRODUCCIONMuchas veces las decisiones dependen de parmetros que son binarios, parmetroscon solo dos posibles categoras dentro de las cuales pueden clasificarse lasrespuestas. En este caso el parmetro de inters es la proporcin poblacional oporcentaje de la poblacin que cumple cierta caracterstica. Por ejemplo unaempresa distribuidora de computadoras puede estar interesada en estimar elporcentaje de clientes que pagan al crdito. Una empresa productora de softwareinformticos puede estar interesa en estimar el porcentaje software defectuosos, oque porcentaje de clientes compran software estadsticos.

    Donde:

    P: Proporcin poblacional de xitos o proporcin de elementos de la poblacin quetienen cierta caracterstica.

    poblacinladeelementosdeNmeroticacaracterisciertatienenquepoblacinladeelementosdeNmero

    NXP

    Q: Proporcin poblacional de fracasos o proporcin de elementos de la poblacinque no tienen cierta caractersticas.

    poblacinladeelementosdeNmeroticacaracterisciertatienennoquepoblacinladeelementosdeNmero

    NXQ

    '

    Adems:

    P1Qentonces1QP Generalmente la proporcin poblacional se desconoce y tiene que ser estimado a travs de la proporcin muestral. Entonces:

    p: Proporcin muestral de xitos o proporcin de elementos de la muestra quetienen cierta caracterstica.

    ___________________________________________________________________________ 55Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    muestraladeelementosdeNmeroticacaracterisciertatienenquemuestraladeelementosdeNmero

    nxp

    q: Proporcin muestral de fracasos o proporcin de elementos de la muestra queno tienen cierta caracterstica.

    muestraladeelementosdeNmeroticacaracterisciertatienennoquemuestraladeelementosdeNmero

    nxq

    '

    Adems:

    p1qentonces1qp

    2. DEFINICIONEs el rango dentro del cual se encuentra la proporcin poblacional con un nivel deconfianza dado.

    L1 P L2 fig. 14

    Para hallar los intervalos de confianza para la proporcin poblacional usaremos laestadstica Z para muestras grandes (n 30). Entonces los lmites de confianzasern:

    ___________________________________________________________________________ 56Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    1 - /2 /2

    1LPLP 2|

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    nqpZpsZpL 0p01

    nqpZpsZpL op02

    2.5.2. ERROR ESTNDAR DE LA PROPORCINSi el tamao de la muestra es suficientemente grande (n 30). Si el muestreo es cono sin sustitucin en una poblacin infinita (o con sustitucin en una poblacin finitade tamao N), el error estndar es:

    n)P1(P

    p

    que se estima por:

    n)p1(psp

    Si el muestreo es sin sustitucin en una poblacin finita de tamao N elerror estndar para la proporcin poblacional esta dado por:

    1NnN

    nQP

    P

    que se estima por

    1NnN

    nqpsp

    Donde:

    1NnN

    es el factor de correccin para poblacin finita.

    ___________________________________________________________________________ 57Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Ejemplo 24:En una poblacin, nadie es indiferente respecto a una iniciativa propuesta por elalcalde: cada habitante adulto o bien est a favor, o bien en contra de la iniciativa.Se desea conocer el porcentaje P de las personas que estn en contra. Entre 50habitantes adultos elegidos al azar, 15 afirmaron que estaban en contra (y los 35restantes a favor). Hallar el intervalo de confianza al 95% para la proporcin real depersonas que estan en favor de la iniciativa propuesta por el alcalde.

    Solucin: Se desea estimar la proporcin real de personas a favor de la iniciativa propuesta

    por el alcalde. Observamos que la proporcin muestral de personas a favor de la iniciativa

    propuesta por el alcalde es:35p 0.7 q 0.350

    = = =

    Para un nivel de confianza del 99% el valor de Z0 = 1.96 El error estndar de la proporcin muestral es:

    pp q 0.7 0.3s 0.06

    n 50

    = = =

    Los lmites de confianza para P son:

    1 0

    2 0

    p qL p Z 0.3 1.96 0.06 0.3 0.12 0.18n

    p qL p Z 0.3 1.96 0.06 0.3 0.12 0.42n

    = - = - = - =

    = + = + = + =

    Interpretacin: Se tiene una confianza del 95% que el porcentaje de personas queestn a favor de la iniciativa de la propuesta por el alcalde varia entre el 18% y 42%.

    Ejemplo 25:Se desea conocer la opinin de los alumnos de la Uladech en relacin con laaceptacin o no de la pena de muerte para los terroristas en el Per. Para ello se ha

    ___________________________________________________________________________ 58Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    tomado una muestra aleatoria simple de tamao 500. Si las respuestas afirmativashan sido 100, encontrar un intervalo de confianza aproximado del 95%.

    Solucin: Se desea estimar la proporcin de alumnos de la Uladech que estn de acuerdo

    con la pena de muerte para los terroristas en el Per.

    Observamos tambin que la proporcin muestral de personas que estn a favorde la pena de muerte es:

    80.0q20.0500100

    nxp .

    Para un nivel de confianza del 95% el valor de Z0 = 1.96.

    El error estndar de la proporcin muestral es:

    02.0s

    50080.020.0

    nqps

    p

    p

    Los lmites de confianza para P son:

    24.002.096.120.0n

    qpZpL

    16.002.096.120.0n

    qpZpL

    02

    01

    Interpretacin: Se tiene una confianza del 95% que el porcentaje de estudiantes dela Uladech que afirman estar de acuerdo con la pena de muerte vara entre el 16% y24%.

    ___________________________________________________________________________ 59Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Ejemplo 26:Se desea estimar el porcentaje de aprobados de un curso de Auditoria de unapoblacin de 500 alumnos. Para este fin, se uso una muestra de 35 alumnos querevel un 80% de aprobados. Estime la verdadera proporcin de aprobados delcurso completo dentro de una confiabilidad del 99%.

    Solucin: Se desea estimar la proporcin de aprobafdos en el curso de Auditoria Observamos que N = 500 y n = 35

    Observamos tambin que la proporcin muestral de alumnos aprobados en laasignatura de Auditoria est dada por:

    p 0.8= .

    Para un nivel de confianza del 99% el valor de Zo=2.576.

    El error estndar de la proporcin muestral es:

    p

    p

    p

    p q N nsn N 1

    0.80 0.20 500 35s500 500 1

    s 0.07

    -=

    -

    -=

    -

    =

    Los lmites de confianza para P son:

    1 0 p

    2 0 p

    L p Z s 0.8 2.576 0.07 0.8 0.18 0.62

    L p Z s 0.8 2.576 0.07 0.8 018 0.98

    = - = - = - =

    = + = + = + =

    Se tiene una confianza del 99% que el porcentaje de alumnos aprobados en elcurso de Auditoria vaia entre el 62% y 98%.

    ___________________________________________________________________________ 60Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    2.6. TAMAO DE MUESTRA CUANDO EL PARAMETRO ES LA PROPORCIONPROBLACION USANDO EL MUESTREO ALEATORIO SIMPLE

    2.6.1. CALCULO DEL TAMAO MUESTRAL USANDO EL MUESTREOALEATORIO SIMPLE.

    Caracterstica de la Poblacin Tamao de la muestraTamao de la poblacin infinita o desconocido.

    2

    221

    eQPZ

    n

    Tamao de la poblacin finita.

    )1N(eQPZNQPZ

    n 222/1

    221

    Donde:

    n Tamao de la muestra.N Tamao de la poblacin.

    Z1-/2

    Valor correspondiente a la distribucin de Gauss

    Z0.975 = 1.96 para = 0.05 y Z0.995 = 2.576 para = 0.01.

    (Utilizar Tabla II).P Proporcin poblacional de xitos. En caso de no conocerse se

    estima por la proporcin muestral (p) a travs de una muestra

    piloto. En el caso ms desfavorable se considera P=0.5Q Proporcin poblacional de fracasos.e Error que se prev cometer.

    fig. 15

    Ejemplo 27:En una poblacin, nadie es indiferente respecto a una iniciativa propuesta por elalcalde: cada habitante adulto o bien est a favor, o bien en contra de la iniciativa.

    ___________________________________________________________________________ 61Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    L1 L2

    e

    P p-

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Se desea conocer el porcentaje P de las personas que estn en contra con unaconfianza del 95%. Entre 50 habitantes adultos elegidos al azar, 15 afirmaron queestaban en contra (y los 35 restantes a favor). Cual es el numero mnimo deencuestados necesario para que el error cometido en la estimacin sea, comomucho, de 0.05?

    Solucin: La proporcin poblacional de personas que estn en contra de la iniciativa

    propuesta por el alcalde no se conoce entonces se estima por la proporcin

    muestral, y est dada por:

    x 15p 0.3 q 0.7n 50

    = = = =

    Para el nivel de confianza 1 = 0.95 el valor de 96.1Z 975.0 . e = 0.05 La poblacin es infinita o desconocida.Como el valor de p se ha calculado a travs de la muestra, la formula a utilizar serla siguiente:

    Ejemplo 28:En una compaa que tiene 400 empleados se desea estimar que porcentaje de susempleados tienen tarjeta de crdito. Se estima que este porcentaje pudiese estarcerca del 70%. Tomando una confianza del 99%, Cuntos empleados debo tomarcomo muestra para estimar este valor? Se desea un error mximo del 3%.

    Solucin: La proporcin poblacional estimada (obtenida a travs de una muestra) de

    empleados que tienen tarjeta de crdito est dada por:

    ___________________________________________________________________________ 62Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    21 2

    2

    Z p qn

    e-a =

    2

    2(1.96) 0.3 0.7n

    (0.05)

    =

    n 322.6 323 encuestados= @

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Para un nivel de confianza del 95% el valor de 96.1Z 975.0 e = 0.03 La poblacin es infinita o desconocida.

    La formula a utilizar ser la siguiente:

    2

    2(1.96) 0.7 0.3n

    (0.03)

    =

    n 896.3 896 empleados= @

    Ejemplo 29:Se desea estimar el porcentaje de aprobados de un curso de Estadstica de 500alumnos. Para este fin, se uso una muestra de 35 alumnos que revel un 80% deaprobados. Cuntos alumnos se debe tomar en la muestra si se desea unaprecisin del 2% con una confiabilidad del 99%.

    Solucin: La proporcin poblacional estimada (obtenida a travs de la muestra) de alumnos

    aprobados en el curso de Estadstica, est dada por: p 0.8 q 0.2= =

    Para un nivel de confianza del 99% el valor de 576.2Z 995.0 . e = 0.02 La poblacin es finita N=500.

    La formula a utilizar ser la siguiente:

    21 2

    2 21 / 2

    Z p q Nn

    Z p q e (N 1)-a

    -a

    =

    + -

    ___________________________________________________________________________ 63Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    2

    221

    eqpZ

    n

    p 0.7 q 0.3= =

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    2

    2 2(2.576) 0.80 0.20 500n

    (2.576) 0.80 0.20 (0.02) (500 1)

    = + -

    n 420.9 421 alumnos.= @

    7. Se desea estimar la proporcin de personas p que tienen un aparato DVD ensu hogar, en una poblacin de 10000 familias. Para eso debemos tomar unamuestra de tamao de manera que con una confiabilidad del 99% y margen de errorde 0.05, el intervalo que construiremos contenga al valor desconocido de laproporcin poblacional p. Indica el tamao de muestra que se debe tomar.

    Solucin: La proporcin poblacional de personas que tienen un aparato DVD en su casa

    es desconocido, entonces consideramos P=0.5. P 0.5 Q 0.5= =

    Para un nivel de confianza del 99% el valor de 576.2Z 995.0 . e = 0.05 La poblacin es finita N=10000

    La formula a utilizar ser la siguiente:

    21 2

    2 21 / 2

    Z P Q Nn

    Z P Q e (N 1)-a

    -a

    =

    + -

    2

    2 2(2.576) 0.50 0.50 10000n

    (2.576) 0.50 0.50 (0.05) (1000 1)

    = + -

    n 622.3 622 personas.= @

    ___________________________________________________________________________ 64Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    AUTOEVALUACIN 02

    1. Tomada al azar una muestra de 500 personas de una determinada comunidad,se encontr que 300 lean la prensa regularmente. Halla con una confianza del90%, un intervalo para estimar la proporcin de lectores entre las personas de lacomunidad.

    2. Se realiz un estudio sobre la utilizacin del agua en una pequea ciudad.Adems se sabe que el nmero de galones de agua que utilizan se distribuyenormalmente.Para ello se consider una muestra de 10 casas. El nmero degalones de agua que utilizan por da (1 galn = 0.0037854 m3) fue el siguiente: 175,180, 179, 185, 174, 180, 190, 191, 192, 179. Con base a esta informacin:a) Hallar un intervalo de confianza para el 90%. b) Si el recurso de agua en la ciudad permite una utilizacin media de 160 galones

    por da Podria pensarse que hay un problema de escasez de agua en la ciudad?

    3. En una comunidad autnoma se sabe que la desviacin tpica del nmero de dasque dura un ontrato temporal es igual a 57 das. Indica el nmero mnimo de contratos en los que se han mirado su duracin para que el intervalo con un nivel de confianza del 95% que da la duracin media de un contrato de ese tipo tenga una amplitud no mayor de 10 das.

    4. Tomada al azar una muestra de 600 personas de una determinada comunidad deuna poblacin de 10000 personas, se encontr que 400 lean la prensa diariaregularmente. Cuntos individuos ha de tener la muestra, a un nivel de confianzadel 95%, con un error mximo del 5%?

    5. Se extrajo una muestra aleatoria de 172 estudiantes de contabilidad y se les pidique evaluasen unas determinadas condiciones de trabajo en una escala de 1 (noimportante) a 5 (extremadamente importante). La seguridad en el trabajo recibiuna calificacin media de 4.38 con una desviacin estndar muestral de 0.70.Calcular un intervalo de confianza del 99% para la media poblacional.

    ___________________________________________________________________________ 65Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    CAPITULO III

    PRUEBA DE HIPTESIS

    3.1. INTRODUCCIONEl propsito de anlisis estadstico es reducir el nivel de incertidumbre en el procesode decisiones. Los gerentes pueden tomar mejores decisiones solo si tienensuficiente informacin a su disposicin. La prueba de hiptesis es una alternativaanaltica muy efectiva para obtener esta valiosa informacin. Por ejemplo el gerentede sistemas de una empresa desea determinar si el tiempo de vida medio decomputadoras de la marca COMPAQ es mayor de 10 aos ( 10 ). Un productor desoftware de computador desea certificar que la proporcin de sus productos que sondefectuosos es menor del 3% ( 03.0p ). El gerente de una empresa desea saber sila implementacin de un nuevo programa de capacitacin mejora la productividad desus vendedores respecto al nmero de clientes que desean tener una tarjeta decrdito ( 30 ).Las ilustraciones de esta naturaleza son virtualmente ilimitadas en diferentesescenarios productivos, de negocios, econmicos, financieros, laborales, etc. Si sepueden obtener respuestas a estas preguntas y a muchas otras con algn grado degaranta la toma de decisiones se vuelve ms segura y es menos probable queconduzca a un error costoso.

    3.2. DEFINICIONES GENERALESA continuacin daremos a conocer algunas definiciones generales que se usan parallevar a cabo una prueba de hiptesis:

    a) Hiptesis estadstica: Es una suposicin o afirmacin respecto de unparmetro poblacional. Por ejemplo:- El nmero promedio de ingenieros de sistemas que se insertan al mercado

    laboral es de al menos 3 de ellos.- El 20% de las familias chimbotanos tienen Internet en su hogar.- El sueldo medio de los trabajadores de la Uladech es de S/. 800.00 mensuales.

    Todas estas hiptesis tienen algo en comn, las poblaciones de inters son tangrandes que no es factible estudiar todos sus elementos. Como ya sabemos, unaalternativa a estudiar la poblacin entera es tomar una muestra de la poblacin de

    ___________________________________________________________________________ 66Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    inters. De esta manera podemos probar una afirmacin para determinar si laevidencia soporta o no la afirmacin.

    b) Prueba de hiptesis: Es un procedimiento basada en la evidencia muestral yen la teora de la probabilidad que se lleva acabo para decidir si se acepta o rechazaun hiptesis estadstica planteada.

    c) Tipos de hiptesis: Cualquier investigacin estadstica implica la existencia dehiptesis o afirmaciones de las poblaciones que se estudian. Hay dos tipos dehiptesis: la hiptesis nula y la hiptesis alternativa.

    c.1.) Hiptesis nula (Ho): Es aquella que establece que el parmetro tienedeterminado valor y se formula con la intencin de rechazarla.

    La hiptesis nula es una afirmacin que ser aceptada si los datos de la muestra nonos proveen de evidencia convincente de que es falsa, es decir, si se acepta lahiptesis nula decimos que la evidencia no es suficiente para rechazarla pero nopodemos afirmar que es verdadera.

    c.2) Hiptesis alternativa: Es una hiptesis diferente a la hiptesis nula, es la quesuponemos que es verdadera y deseamos establecer. La hiptesis alterna es laafirmacin que se acepta si se rechaza la hiptesis nula. Esta hiptesis, tambinllamada hiptesis de investigacin. La hiptesis alterna es aceptada si la evidenciaproporcionada por la muestra es suficiente para afirmar que la Ho es falsa.

    d) Tipos de errores: Al realizar una prueba de hiptesis no sabemos si en unadeterminada accin (rechazo o aceptacin de la hiptesis nula) cometemos un erroro no. Error Tipo I: Consiste en rechazar la hiptesis nula cuando es verdadera.

    Error Tipo II: Consiste en aceptar la hiptesis nula cuando es falsa.

    Si Ho es la hiptesis nula (sometida a prueba) y H1 es la hiptesis alternativa,entonces estas hiptesis junto con las dos posibilidades de decisin podemosesquematizarla en la siguiente tabla:

    ___________________________________________________________________________ 67Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    DECISINESTADO DE LA NATURALEZA

    Ho verdadera Ho falsa

    Aceptar Ho1 -

    Decisin correcta

    Error Tipo I

    Rechazar Ho

    Error Tipo I 1-

    Decisin correcta

    Es obvio quien toma las decisiones, quiere reducir al mximo las probabilidades decometer cualquiera de estos dos tipos de errores, esto no es fcil, pues lasprobabilidades de cometer error tipo I y II son inversamente proporcionales, paracualquier prueba dada. De ah que, cuanto menor es el riesgo de cometer un errortipo I, tanto mayor es la probabilidad de cometer un error tipo II y viceversa. Sinembargo dada la regla de decisin, es posible reducir ambos tipos de errores enforma simultnea, aumentando el tamao de la muestra.

    e) Nivel de significacion (): Se denomina nivel de significacin de una prueba dehiptesis a la probabilidad de cometer un error tipo I.

    El nivel de significancia es simbolizado por , y tambin es conocido como nivel deriesgo. Este ltimo trmino es ms apropiado porque es el riesgo que se toma derechazar una hiptesis verdadera.

    = P[error tipo I] = P [Rechazar Ho / Ho es verdadera] = P[error tipo I] = P [Aceptar H1 / H1 es falsa]

    No hay un nivel de significancia para todos los estudios, se puede utilizar cualquiervalor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de 0.05 es aplicado aproyectos de investigacin, el nivel 0.01 a control de calidad, y 0.10 a sondeospolticos. Usted como investigador debe decidir el nivel de significancia antes decolectar la muestra de datos.

    Los niveles de significacin ms usados son: = 0.05 y 0.01. Estos dos nmerosson usados tan frecuentemente que cuando Ho es rechazada en = 0.05,podemos decir que el resultado es significativo y cuando Ho es rechazada en = 0.01, decimos que el resultado es altamente significativo.

    ___________________________________________________________________________ 68Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    NOTA: La probabilidad de cometer un error tipo II se representa por , es decir:

    = P[error tipo II] = P[Aceptar Ho / Ho falsa] = P[error tipo II] = P[Rechazar H1 / H1 es verdadera]

    fig. 16

    R.A. : Regin de aceptacin.R.R. : Regin de rechazo.

    f) Tipos de prueba: Prueba de cola izquierda: Si la regin de rechazo est a la izquierda del

    punto crtico C.

    fig. 17

    ___________________________________________________________________________ 69Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    R.A. R.R.C

    1- 1-

    R.R. C R.A.

    1-

    0f ( / H )q 1f ( / H )q

    0f ( / H )q

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Prueba de cola derecha: Si la regin de rechazo est a la derecha del juntocrtico C.

    fig. 18 Prueba bilateral: Si la regin de aceptacin es un intervalo cerrado entre los

    puntos crtico C1 y C2.

    fig. 19

    g) Pasos de una prueba de hiptesis:1. Formulacin de la hiptesis nula y alternativa de acuerdo al problema.2. Especificacin del nivel de significacin.3. Seleccin de la estadstica de prueba.4. Establecimiento de los criterios de decisin.5. Realizacin de clculos.6. Decisin.

    ___________________________________________________________________________ 70Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    R.R.CR.A.

    1-

    R.A.C1/2

    R.R./2

    C2 R.R.

    1-

    0f ( / H )q

    0f ( / H )q

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    3.3. PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONALLa media poblacional es un parmetro de decisin muy importante. Es de intersconocer si una media poblacional ha aumentado, disminuido o ha permanecidoinalterado, o tambin podemos estar interesados en determinar si una mediapoblacional es significativamente mayor o menor que un valor supuesto.

    3.3.1. PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL USANDO LAESTADISTICA Z

    CASO I: Uso de la estadstica Z.i) Muestra grande (n 30), varianza poblacional conocida, poblacin normal o no. ii) Muestra grande (n 30), varianza poblacional desconocida (2 s2) y poblacin

    normal o no. iii) Muestra pequea (n < 30), varianza poblacional conocida y poblacin normal.

    1. Formulacin de hiptesis: a) Ho: o b) Ho: o c) Ho: = o

    H1: < o H1: > o H1: o

    2. Nivel de significancia:

    3. Estadstica de prueba:

    Para i y iii

    )1,0(nn/

    xZ 0

    Para ii

    )1,0(nn/s

    xZ 0

    ___________________________________________________________________________ 71Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

  • R.A.: Zk < Z1 - , se acepta HO.R.R.: Zk > Z1 - , se rechaza HO.

    Z1-

    1 -

    0

    Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    4. Establecimiento de los criterios de decisin: Prueba de cola izquierda :

    Prueba de cola derecha:

    ___________________________________________________________________________ 72Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    R.A.: ZK > - Z1- , se acepta HO. R.R.: ZK < - Z1- , se rechaza HO.

    0-Z

    1-

    1-

    R.R R.A.

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Prueba bilateral :

    .

    5. Clculos: Obtencin del valor experimental.

    Para i y iii

    n/x

    Z 0k

    Para ii

    n/sxZ 0k

    6. Decisin:Se compara el valor experimental con el valor crtico.Si Zk R.A., se acepta HO.Si Zk R.R., se rechaza HO.

    ___________________________________________________________________________ 73Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    R.A.: -Z1 /2 < Zk < Z1 - /2 ,se acepta H0.R.R.: Zk < -Z1 - /2 O Zk > Z1 /2 ,se rechaza H0.

    /2/2

    1-

    R.R.R.A.R.R.0-Z1- /2 Z1- /2

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    NOTA: Si se tiene una poblacin finita de tamao N se corrige la estadsticade prueba de la siguiente manera:

    a) Para i y iii: b) Para ii:

    1NnN

    n

    xZ 0

    1NnN

    nsxZ 0

    Ejemplo 30:El gerente de una empresa selecciona aleatoriamente entre sus trabajadores unamuestra de 169 y anota el nmero de horas de trabajo que cada uno de ellos haperdido por causa de accidentes laborales en el ao 2001. A partir de la informacinobtenida determina, en esos 169 trabajadores, un nmero medio de horas perdidaspor accidentes laborales en el 2007 de 36,5 horas y una desviacin estndar de 10horas.a) Podramos rechazar, con un nivel de significacin del 1% la hiptesis de que elnmero medio de horas perdidas a causa de accidentes laborales en esa empresadurante el ao 2007 fue de 35 horas?b) Y para un nivel de significacin del 5%?

    Solucin: Utilizamos Caso I - iia) 1. Formulacin de la hiptesis :

    H0 : = 35H1 : 35

    2. Nivel de significancia : = 0.01

    3. Estadstica de prueba:Anlisis: n=169

    (n>30) Varianza poblacional desconocida (se obtiene a travs de la muestra)

    ___________________________________________________________________________ 74Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    x 36.5=

    s 10=

    2s 10 s 100= =

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Poblacin no normal Usar Estadstica Z Caso I - ii

    4. Establecimiento de los criterios de decisin:

    5. Clculos :

    0k

    x 36.5 35Z 1.95s / n 10 / 169

    - m -= = =

    6. Decisin :Zk=1.95

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    la dispersin que estaba establecida en 1.5 .us = por da Se debe efectuar elcambio tecnolgico. A un nivel de significancia del 5%.

    Solucin: Utilizamos Caso I - ii1. Formulacin de la hiptesis:

    H0 : = 45H1 : > 45

    2. Nivel de significancia: = 0.05

    3. Estadstica de prueba :Anlisis: n=35

    (n>30) Varianza poblacional conocida.

    =1.5 2= 2.25 Poblacin no normal Usar Estadstica Z Caso I - i

    0xZ n(0,1)/ n- m

    = s

    4. Establecimiento de los criterios de decisin :

    ___________________________________________________________________________ 76Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    1.645

    0.05

    1 - =0.95

    R.A.: ZK

    < 1.645, se acepta HO.

    R.R.: ZK

    > 1.645, se rechaza HO.

    0R.A. R.R.

    x 46.5=

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    5. Clculos:

    6. Decisin :ZK = 0.17 < 1.645, entonces aceptamos Ho.No se debe efectuar el cambio tecnolgico.

    Ejemplo 32:Tiendas Metro, una cadena de tiendas de artculos de consumo extendida por todoel pas, afirmaba en Radio Programas del Per que no abren tienda en ningunalocalidad a menos que la renta media de la vecindad sea de 1200 dlares comomnimo. Una encuesta de 200 familias en una localidad determinada da una rentamedia de 1182 dlares, con una desviacin estndar de 157 dlares. Deben abrirla tienda si se cumplen todos los dems criterios de emplazamiento deseable a unnivel de significancia del 1%?

    Solucin:1. Formulacin de la hiptesis:

    H0 : 1200H1 : < 1200

    2. Nivel de significancia : = 0.01

    3. Estadstica de prueba:Anlisis: n=200

    (n>30) Varianza poblacional desconocida (se obtiene a travs de la muestra)

    Poblacin no normal Usar Estadstica Z Caso I - ii

    0xZ n(0,1)s / n

    - m=

    ___________________________________________________________________________ 77Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    0k

    x 46.5 45Z 0.17/ n 1.5 / 35- m -

    = = =s

    x 1182=

    s 157=

    2s 157 s 24649= =

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    4. Establecimiento de los criterios de decisin:

    5. Clculos:

    6. Decisin:Zk = -1.62 > -2.326, entonces aceptamos Ho.La renta media de la vecindad es de 1200 dlares como mnimo.

    3.3.2. PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL USANDO LACASO II: Uso de la estadstica t.La muestra es pequea (n< 30), varianza poblacional desconocida 2 2( s )s @ ypoblacin normal.

    1. Formulacin de hiptesis estadstica:a) HO: o b) HO: o c) HO: = o

    H1: < o H1: > o H1: o

    2. Nivel de significancia:

    3. Estadstica de prueba:

    ___________________________________________________________________________ 78Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    -2.326 = 0.01

    R.A.: ZK -2.326, se acepta H

    O.

    R.R.: ZK

    < -2.326, se rechaza HO.

    1- = 0.99

    0R.R.

    R.A.

    0k

    x 1182 1200Z 1.62s / n 157 / 200

    - m -= = = -

    1n0 tn/s

    xt

  • R.A.: tk < t

    1-, n-1, se acepta H

    o.

    R.R.: tk > t1-, n-1, se rechaza Ho.

    t1-, n-1

    1 -

    0

    Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Donde: (n-1) son los grados de libertad.

    4. Establecimiento de los criterios de decisin:

    Prueba de cola izquierda :

    Prueba de cola derecha:

    ___________________________________________________________________________ 79Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    R.A.: tK > - t

    1- , n-1, se acepta H

    O.

    R.R.: tK < - t1- , n-1, se rechaza HO.

    0-t1-, n-1

    1-

    R.A.R.R..

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Prueba bilateral :

    5. Clculos:

    n/sx

    t 0k

    6. Decisin:Se compara el valor experimental con el valor crtico Si t k RA. , aceptamos Ho.Si t k R.R. , rechazamos Ho.

    NOTA: Si se tiene una poblacin finita de tamao N se corrige laestadstica de prueba. As:

    1NnN

    nsxt 0k

    ___________________________________________________________________________ 80Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    1 /2,n 1t -a -- 1 / 2,n 1t -a -

    R.A.: t1 - /2, n-1 < tk < t1 - /2, n-1 , se acepta HO . R.R.: tk < - t1 - /2, n-1 o tk > t1 - /2, n-1 , se rechaza HO.

    /2/2

    1-

    R.A. R.R.R.R.

    0

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Ejemplo 33:En una ciudad se quiere hacer un estudio rpido para valorar el consumo de aguaen los domicilios particulares durante los meses de mayor sequa. Para ello seseleccionaron al azar 15 domicilios y se midieron sus consumos en metros cbicosdurante el mes de agosto y su obtuvo un consumo medio muestral de 3m7.18x yuna desviacin estndar muestral de 3m6s . Se sabe adems que el consumo deagua se distribuye normalmente. En vista de estos datos. Hay suficiente evidenciaestadstica al nivel de 0.05, a favor de la hiptesis de que el consumo medio de losparticulares durante el mes de agosto es mayor que 18 m3?

    Solucin:

    1. Formulacin de la hiptesis: H0 : = 18 H1 : > 18

    2. Nivel de significancia: = 0.05

    3. Estadstica de prueba:Anlisis: n=15

    (n

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    4. Establecimiento de los criterios de decisin:

    5. Clculos:

    0k

    x 18.7 18t 0.45s / n 6 / 15

    - m -= = =

    6. Decisin:tk=0.45 < 1.761, entonces aceptamos Ho. El consumo medio de agua de losparticulares en el mes de agosto no es mayor de 18m3.

    Ejemplo 34:Una Marca discogrfica preocupada por el creciente desarrollo de los Vendedoresinformales de msica en CD emprende una investigacin sobre esta variante de laEconoma informal, la Gerencia cree que mantienen una venta media de 50 CD`s enun fin de semana. Para realizar la investigacin se entrevistaron 20 vendedoresdesplegados en la Av. Abancay de la Ciudad de Lima, registrando el siguienteresultado:

    Ventas de CD's (copias): 55 51 50 51 71 65 60 55 50 5059 50 77 76 53 57 66 72 46 47

    Que tan cierta es la sospecha de la Gerencia, a un nivel de significancia del 5%?

    ___________________________________________________________________________ 82Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2

    R.A.: tk 1.761, se acepta H

    O.

    R.R.: tk > 1.761, se rechaza H

    O.

    1.761

    =0.05

    1 - = 0.95

    0

    R.A R.R

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Solucin: Caso II 1. Formulacin de Hiptesis :

    H0 : = 50H1 : 50

    2. Nivel de significancia : = 0.05

    3. Estadstica de prueba :Anlisis:

    n=20 (n 2.093, se acepta H

    O.

    -2.093 2.093=0.025 =0.025

    1- =0.95

    R.R R.A R.R

    0

    1n0 tn/s

    xt

    2s 9.64 s 92.93= =

    19t t

    x 58.55=

    s 9.64=

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    5. Clculos :

    6. Decisin: tk = 3.97 R.R., por lo tanto se rechaza Ho. No es cierta la sospecha delgerente, la venta media de CDs en el mercado informal es mayor.

    Ejemplo 35:Para determinar el rendimiento anual de ciertos valores, un grupo deinversionistas tom una muestra de n =10 de esta clase de valores. La media ydesviacin estndar resultaron: . Se sabe adems que elrendimiento sigue una distribucin normal Existe evidencia para decir que elverdadero rendimiento anual promedio es igual o mayor 8.5%? con = 0.1?

    Solucin:1. Formulacin de la hiptesis:

    H0 : 8.5 H1 : < 8.5

    2. Nivel de significancia : = 0.1

    3. Estadstica de prueba:Anlisis: n=10

    (n

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    4. Establecimiento de los criterios de decisin:

    5. Clculos:

    6. Decisin:Zk = -3.16

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    3.4. PRUEBA DE HIPOTESIS PARA LA PROPORCION POBLACIONAL3.4.1. INTRODUCCIONMuchas decisiones en el rea econmico financiero dependen de la proporcin oporcentaje de la poblacin que se ajusta a alguna caracterstica. Por ejemplo ungeente de una empresa puede estar interresado en conocer si el porcentaje detrabajadores que opinan que el clima laboral es el adecuado, un candidato polticopuede estar interesado en conocer si ms del 60% de la poblacin votara por el, losanalistas econmicos pueden estar interesados en conocer el porcentaje depersonas desempleadas en el pas, etc.Podran mencionarse muchos ejemplos msEl procedimiento para la prueba de hiptesis para la proporcin poblacional essimilar al sealado por la media poblacional.Se presentan los siguientes casos, en muestras grandes (n 30). CASO I: Poblacin infinita, cualquiera que sea el tipo de muestreo. Poblacin finita, si el muestreo es con reemplazamiento.

    Pasos de una prueba de Hiptesis para la proporcin poblacional:

    1. Formulacin de hiptesis estadstica:a) Ho: P P b) Ho: P Po c) Ho: P = Po

    H1: P < Po H1: P > Po H1: P Po

    2. Nivel de significancia:

    3. Estadstica de prueba:

    )1,0(n

    nQPPpZ

    00

    0

    ___________________________________________________________________________ 86Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • R.A.: ZK > - Z1- , se acepta HO. R.R.: ZK < - Z1- , se rechaza HO.

    0-Z

    1-

    1-

    R.R R.A.

    R.A.: Zk < Z1 - , se acepta HO.R.R.: Z

    k > Z

    1 - , se rechaza HO.

    Z1-

    1 -

    0

    R.A. R.R.

    Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    4. Establecimiento de los criterios de decisin: Prueba de cola izquierda :

    Prueba de cola derecha:

    ___________________________________________________________________________ 87Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Prueba bilateral :

    .

    5. Realizacin de clculos:

    6. Decisin

    Se acepta o se rechaza Ho.

    Caso II: Poblacin finita, cuando el muestreo es sin reemplazamiento.Se siguen todos los pasos del Caso I, pero se incorpora el factor de correccin parapoblacin finita, entonces la Estadstica de Prueba ser:

    )1,0(n

    1NnN

    nQP

    PpZ00

    0

    ___________________________________________________________________________ 88Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    R.A.: -Z1 /2 < Zk < Z1 - /2 ,se acepta H0.R.R.: Zk < -Z1 - /2 O Zk > Z1 /2 ,se rechaza H0.

    /2/2

    1-

    R.R.R.A.R.R.0-Z1- /2 Z1- /2

    nQPPpZ

    00

    0k

  • R.A.: ZK > - 2.326 , se acepta HO.

    R.R.: ZK < - 2.326 , se rechaza HO.

    0-2.326

    1- =0.99

    R.R R.A.

    =0.01

    Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Ejemplo 36:Usted ha estado trabajando para una empresa de publicidad en Lima durante 5aos. Ahora usted est planeado iniciar su propia compaa, pero teme perdermuchos clientes. Usted decide irse, slo si por lo menos el 30% de las cuentas queusted maneja se irn con usted y le seguirn a su nuevo negocio. Como prueba,usted descubre que 14 de las 54 cuentas que tom como muestra expresan sudeseo de irse con usted si deja la compaa. A un nivel de significancia del 5%Debera usted comenzar su propia empresa?

    Solucin:1. Formulacin de hiptesis estadstica:

    Ho : P 0.3H1 : P < 0.3

    2. Nivel de significancia: = 0.01

    3. Estadstica de prueba:

    )1,0(n

    nQPPpZ

    00

    0

    4. Establecimiento de los criterios de decisin:

    ___________________________________________________________________________ 89Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    5. Realizacin de clculos: x: Nmero de cllientes de la muestra que prefieren irse con la otra compaia=14n: Nmero de clientes de la muestra que hay en cartera = 54

    Donde:

    Adems:

    6. Decisin:Zk = -0.64 > -2.326; por lo tanto se acepta Ho. Si debera comenzar mi propiacompaia.

    Ejemplo 37:Preocupados por la opinin que los ciudadanos tienen sobre la evolucin econmicadel pas, el gobierno ha realizado una encuesta sobre 1000 de sus ciudadanos,obteniendo que solo 80 de ellos afirman que la evolucin econmica es buena. Si elgobierno afirmara que el 11.5% de la poblacin opina que la situacin econmica esbuena Es compatible esta afirmacin con el resultado muestral obtenido para unasignificacin del 5%?

    Solucin:1. Formulacin de hiptesis estadstica:

    Ho: P = 0.115H1: P 0.115

    ___________________________________________________________________________ 90Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    o oP 0.3 Q 0.3= =

    0k

    0 0

    p P 0.26 0.3Z 0.64P Q 0.3 0.7

    n 54

    - -= = = -

    xpn14p 0.2654

    =

    = =

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    2. Nivel de significacin: = 0.01

    3. Estadstica de prueba:

    )1,0(n

    nQPPpZ

    00

    0

    4. Establecimiento de los criterios de decisin:

    5. Realizacin de clculos:x: Nmero de personas en la muestra que afirman que la evolucin econmica

    es buena = 80n: Nmero de personas de la muestra encuestadas = 1000

    Donde:

    Adems:

    ___________________________________________________________________________ 91Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    R.A.: -2.576 < Zk < 2.576 ,se acepta H0.R.R.: Zk < -2.576 O Zk > 2.576 ,se rechaza H0.

    /2/2

    1- = 0.99

    R.R.R.A.R.R.0-2.576 2.576

    0.05 0.05

    xpn80p 0.08

    1000

    =

    = =

    o oP 0.115 Q 0.885= =

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    6. Decisin: Zk = -3.5 RR; por lo tanto se rechaza Ho. No es compatible la afirmacin con elresultado de la muestra obtenido. El porcentaje de personas que opinan que laevolucin econmica es buena es diferente de 11.5%.

    Ejemplo 38:Su empresa ha determinado en el pasado que exactamente el 53% de las personasque estn en su rea de mercado prefieren su producto. Se invierten en varios milesde dlares en un programa publicitario para incrementar su participacin en elmercado. Luego una muestra de 600 personas revela que 400 prefieren su producto.A un nivel de significancia del 5%. El dinero fue bien invertido?

    1. Formulacin de la hiptesis:H0 : P = 0.53H1 : P > 0.53

    2. Nivel de significancia: = 0.05

    3. Estadstica de prueba :

    )1,0(n

    nQPPpZ

    00

    0

    ___________________________________________________________________________ 92Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    0k

    0 0

    p P 0.08 0.115Z 3.5P Q 0.115 0.885

    n 1000

    - -= = = -

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    4. Establecimiento de los criterios de decisin :

    5. Clculos:

    x: Nmero de personas de la muestra que prefieren el producto = 300n: Nmero de personas de la muestra = 600

    Donde:xpn400p 0.67600

    =

    = =

    Adems:

    o oP 0.53 Q 0.47= =

    0k

    0 0

    p P 0.67 0.53Z 7P Q 0.53 0.47

    n 600

    - -= = =

    6. Decisin :ZK = 7>1.645, entonces rechazamos Ho. El dinerio fu bien invertido.

    ___________________________________________________________________________ 93Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    1.645

    0.05

    1 - =0.95

    R.A.: ZK

    < 1.645, se acepta HO.

    R.R.: ZK

    > 1.645, se rechaza HO.

    0R.A. R.R.

  • R.A.: Zk < 1.96 , se acepta HO.

    R.R.: Zk > 1.96 , se rechaza HO.

    1.96=0.05

    1 - =0.95

    0

    R.A. R.R.

    Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    Ejemplo 39:El contador de Tiendas La Positiva afirma que es 5% el porcentaje de clientesmorosos. Para comprobar esta hiptesis el gerente seleccion una muestra aleatoriade 40 observaciones y encontr que el porcentaje muestral de clientes morosos esdel 10% . En el nivel de significacin de 0.05.a) Plantee las hiptesis adecuadas.b) Cul es su decisin respecto a la afirmacin del fabricante?

    Solucin:a) Ho : P = 0.05

    H1 : P > 0.05

    b) Cul es su decisin respecto a la afirmacin del fabricante?1. Formulacin de hiptesis estadstica:

    Ho : P = 0.05H1 : P > 0.05

    2. Nivel de significancia: = 0.05

    3. Estadstica de prueba:

    4. Establecimiento de los criterios de decisin:

    ___________________________________________________________________________ 94Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    0

    0 0

    p PZ n(0,1)P Q

    n

    -=

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL

    5. Realizacin de clculos: p: proporcin de clientes morosos en la muestra = 0.10n: Nmero de clientes de la muestra = 40Adems:

    6. Decisin:Zk = 1.67 RA; por lo tanto se acepta Ho. El contador est diciendo la verdad.

    ___________________________________________________________________________ 95Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    95.0Q05.0P oo

    0k

    0 0

    p P 0.1 0.05Z 1.67P Q 0.05 0.95

    n 40

    - -= = =

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    3.5. PRUEBA DE INDEPENDENCIA CHI CUADRADO3.5.1. INTRODUCCIONLa prueba de independencia chi cuadrado es un procedimiento de contrastacin quese utiliza para determinar la independencia o relacin entre dos variablescategricas., como por ejemplo el nivel educativo y el nivel de consumo de Internetde las personas, el rendimiento acadmico y el nivel socioeconmico de laspersonas, marca de computadoras y el precio, etc.

    3.5.2. CONTRASTACION DE HIPOTESISPasos a seguir:1. Formulacin de Hiptesis:H0 : No existe relacin entre las categoras.H1 : Existe relacin entre las categoras.

    2. Nivel de signficancia:

    3. Estadstica de prueba:

    Donde: )1k()1r(v grados de libertad.r = Nmero de filas.k = Nmero de columnas.4. Establecimiento de los criterios de decisin:

    ___________________________________________________________________________ 96Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    r

    1i

    2v

    k

    1j ij

    2ijij2 X

    e)ef(

    X

    1

    2,1 v X

    0

    R.A. R.R.

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    Si 2 v,12o XX ; se acepta Ho.

    Si 2 v,12o XX ; se rechaza Ho.

    5. Clculos:

    6. Decisin:Se acepta o rechaza Ho.

    Ejemplo 40:Se ha realizado una encuesta en una ciudad con objeto de estudiar las posiblesrelaciones entre el nivel educativo de las personas y el nivel de consumo de Internet.Los resultados para 1509 personas seleccionadas al azar han sido:

    Niveleducativo

    Nivel de consumoBajo Medio Alto Total

    Superior 31 200 600 831Secundaria 28 100 400 528

    Primaria 50 50 50 150Total 109 350 1050 1509

    Determinar si el nivel educativo y el nivel de consumo de Internet de las personas serelacionan. Use =0.05Solucin:1. Formulacin de Hiptesis:H0 : No existe relacin entre el nivel educativo y el nivel de consumo de Internet delas personas.H1 : Existe relacin entre el nivel educativo y el nivel de consumo de Internet de laspersonas.

    2. Nivel de signficancia: = 0.05

    3. Estadstica de prueba:

    ___________________________________________________________________________ 97Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    2r kij ij2

    ki 1 j 1 ij

    (f e )X

    e= =

    -=

    3

    1i

    22

    3

    1j ij

    2ijij2 X

    e)ef(

    X

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    Donde: r = 3 y k = 3; entonces v = (3-1) x (3-1) = 4 grados de libertad.

    4. Establecimiento de los criterios de decisin:

    R.A.: Si 49.9X2o ; se acepta Ho.R.R.: Si ; se rechaza Ho.

    5. Clculos:Hallando los valores esperados eij:

    Nivel educativo Nivel de consumoBajo Medio Alto fi.

    Superiore11=60 e12=193 e13=578

    f11=31 f12 =200 f13 =600f1. = 831

    Secundariae21=38 e22=122 e23=367

    f21=28 f22 =100 f23=400 f2.= 528

    Primariae31=11 e32=35 e33=104

    f31=50 f32= 50 f33= 50f3. =150

    Total f.1 =109 f2. =350 f3. =1050 n=1509Hallando el valor experimental 20X :

    ___________________________________________________________________________ 98Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    1 - = 0.9505.0

    9.49 0

    R.A. R.R.

    nff

    e j..iij

    601509

    109831n

    ffe 1..111

    1931509

    350831n

    ffe 2..112

    5781509

    1050831n

    ffe 3..113

    381509

    109528n

    ffe 1..221

    1221509350528

    nffe 2..222

    3. .131

    f f 150 109e 11n 1509

    = = = 351509350150

    nff

    e 2..332

    10415091050150

    nff

    e 3...333

    3671509

    1050528n

    ffe 3..223

    49.9X2o

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    6. Decisin: ; por lo tanto rechazamos H0.

    En nivel educativo y el nivel de consumo de Internet de las personas se relacionan.

    Ejemplo 41:Para introducir cierto producto en el mercado, una empresa desea conocer comoseria aceptado por los posibles compradores, para ello se ha obtenido una muestraaleatoria de 2200 consumidores habituales de esa lnea de productos, a los que seles pregunta por su edad y por el grado de aceptacin del producto a introducir en elmercado, el resultado se recoge en la tabla siguiente:

    OpininEdad en aos

    20 - 34 35 - 59 60 a ms TotalFavorable 500 200 100 800

    Desfavorable 300 600 500 1400Total 800 800 600 2200

    Determinar si existe relacin entre la edad y la opinin sobre la aceptacin del producto, de los consumidores, con = 0.05.

    Solucin:1. Formulacin de Hiptesis:H0 : No existe relacin entre la edad de las personas y la opinin sobre la

    aceptacin del producto, de los consumidores.H1 : Existe relacin entre la edad de las personas y la opinin sobre la aceptacin

    del producto, de los consumidores.

    2. Nivel de signficancia: = 0.05

    ___________________________________________________________________________ 99Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    104)10450(

    35)3550(

    11)1150(

    367)367400(

    122)122100(

    38)3828(

    578)578600(

    193)193200(

    60)6031(X

    2222

    2222220

    2863813431014X20

    197X20

    49.9197X20

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    3. Estadstica de prueba:

    Donde: r = 2 y k = 3; entonces v = (2-1) x (3-1) = 2 grados de libertad.

    4. Establecimiento de los criterios de decisin:

    R.A.: Si ; se acepta Ho.R.R. Si ; se rechaza Ho.

    5. Clculos:Hallando los valores esperados eij:

    OpininEdad en aos

    20 - 34 35 - 59 60 a ms fi. Favorable e11=291 e12=291 e13=218

    f11=500 f12=200 f13=100f1. = 800

    Desfavorable e21=509 e22=509 e23=381f21=300 f22=600 f23=500

    f2.= 1400

    Total 109 350 1050 2200

    Hallando el valor experimental 20X :

    ___________________________________________________________________________ 100Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    1 - = 0.9505.0

    5.99 0

    R.A. R.R.

    22 3ij ij2 2

    2i 1 j 1 ij

    (f e )X X

    e= =-

    =

    nff

    e j..iij

    1. .111

    f f 800 800e 291n 2200

    = = = 1. .212f f 800 800e 291

    n 1200

    = = = 1. .313f f 800 600e 218

    n 2200

    = = =

    2. .121

    f f 1400 800e 509n 2200

    = = = 2. .222f f 1400 800e 509

    n 2200 = = =

    2. .323

    f f 1400 600e 381n 2200

    = = =

    2oX 5.992oX 5.99>

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    3.5.3. COEFICIENTE DE CONTINGENCIA CHI CUADRADO

    El coeficiente de contingencia chi cuadrado o coeficiente de contigencia C dePearson: Es una medida estadstica que se utiliza para medir el grado de relacin oasociacin entre dos variables categricas. Su valor vara entre 0 y 1, perodifcilmente llega a 1. C no tiene a 1 como lmite superior (LS), su lmite superior oCmax se relaciona con el nmero de categoras. Para una tabla superior construida

    con igual nmero de filas y columnas el lmite superior es k

    1k . De este modo

    para una tabla 3 x 3 el lmite superior es 2/3 = 0.82; para una tabla 4 x 4, 3/4 = 0.87, etc. Cuando el nmero de columnasy filas difiere, por ejemplo, 3 x 4 el lmite superior de C se deduce con un valor kigual nmero ms pequeo.

    El coeficiente de contingencia se expresa as:

    20

    20

    XCn X

    =+

    ___________________________________________________________________________ 101Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    Si C > 0.30 se considera que es adecuado

    2 2 2 2 2 220

    (500 291) (200 291) (100 218) (300 509) (600 509) (500 381)X291 291 218 509 509 381- - - - - -

    = + + + + +

    20X 150 28 64 86 16 37= + + + + +

    20X 381=

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    Ejemplo 42: Calculando el coeficiente C de Pearson para el Ejemplo 40:

    197C 0.34197 1509

    = =+

    C = 0.34 > 0.3 es adecuado.

    El valor mximo que puede tomar C en este caso es:

    82.032

    313

    k1k

    Grficamente podemos observar :

    0 C= 0.34 0.41 0.82

    En conclusin el grado de asociacin entre el nivel educativo y el nivel de consumode internet de las personas es adecuado.

    Ejemplo 43: Calculando el coeficiente C de Pearson para el Ejemplo 41:

    381C 0.38381 2200

    = =+

    C = 0.38 > 0.3 es adecuado.

    El valor mximo que puede tomar C en este caso es:

    82.032

    313

    k1k

    Grficamente podemos observar :

    ___________________________________________________________________________ 102Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    0 C= 0.38 0.41 0.82

    En conclusin el grado de asociacin entre la edad y la opinin sobre la aceptacinde los productos, de los consumidores es adecuado.

    AUTOEVALUACIN 03

    1. En un artculo de la revista Caretas, se debata la creciente tendencia a que losempleados demanden a sus empresas por incumplir las promesas en relacin conlos beneficios sanitarios propuestos y conclua, que el juicio medio se entablaba por100000 dlares. Cuarenta y dos juicios dieron una media de 115000 dlares. Si sesupone una desviacin estndar de 10000 dlares. Est respaldada la hiptesis alnivel de significacin del 1%?

    2. Las puntuaciones en un test que mide la variable creatividad siguen, en lapoblacin general de adolescentes, una distribucin Normal de media 11,5. En uncentro escolar que ha implantado un programa de estimulacin de la creatividad unamuestra de 30 alumnos ha proporcionado las siguientes puntuaciones: 11, 9, 12, 17,8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.A un nivel de confianza del 95% Puede afirmarse que el programa es efectivo?

    3. Cierta marca de focos (bombillas) son anunciados con una vida de 750 horas. Suprecio es bastante asequible por lo que el cliente potencial ha estado evaluando sucompra, previo convenio de compra, y solo dar marcha atrs a su decisin sise demuestra en forma concluyente que la vida real promedio es menor a laanunciada. Se seleccion una muestra aleatoria de 50 focos y se determin que lavida media es de 738.44 horas con una desviacin estndar de 38.20 horas Quconclusin seria la adecuada con un nivel de significacin del 5%?.

    4. El gerente de ventas de una compaa afirma que sus vendedores vendensemanalmente en promedio $ 1,500. Al nivel de significacin del 5% pruebe lahiptesis del gerente versus la hiptesis del presidente de los vendedores que afirma

    ___________________________________________________________________________ 103Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    que el promedio de las ventas semanales es mayor, si una muestra de 36vendedores ha dada una media igual $1510 y una varianza igual a 900$2 en unasemana.

    5. En una agencia de viajes por experiencia se conoce que el porcentaje depersonas que viajan a Europa es del 44%. Sin embargo, de los primeros 100pasajeros de este ao, 46 han viajado a Europa. Ha cambiado el porcentaje esteao a un nivel de significancia del 5%?

    6. Un artculo publicado en Fortune afirma que casi la mitad de todos los contadorescontinan sus estudios acadmicos despus de obtener la licenciatura. Un artculopublicado en Accounting Horizons indica que 150 de 500 recin graduados planeancontinuar sus estudios. Los datos publicados en Accounting Horizons sonconsistentes con los publicados en Fortune con =0.05?

    7. La cantidad de huspedes que debe a un hotel para que ste sea rentable debeser en promedio de 200 al mes (o ms). Se estudiaron hoteles similares en la zona,registrando los 365 das del ao se detect que tienen una demanda promedio de195 personas al mes aproximadamente, con una desviacin estndar de 5 personas.Con un nivel de significancia de 0.01 determine la veracidad para la hiptesisplanteada.

    8. Tradicionalmente el 35% de todos los crditos otorgados por el Banco de Crditodel Per han sido para los grupos minoritarios. Durante el ao pasado, el banco hahecho esfuerzos para incrementar su proporcin. De 150 crditos actualmente encurso, 56 estn identificados claramente por haber sido otorgados a las minoras.El banco ha tenido xito por atraer ms clientes de la minora? Pruebe la hiptesisa un nivel de significancia del 5%.

    9. Un poltico supone que menos del 60% de los votos de su territorio sonfavorables. Con el fin de verificar su conjetura selecciona una muestra representativacompuesta de 200 votantes y aplica una encuesta, obtenindose 100 respuestas asu favor. Probar que estos resultados confirman la creencia del poltico, es decir quelos votos favorables de su territorio son menos del 60%. Use = 0.05.

    ___________________________________________________________________________ 104Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL

    10.Se les pregunta a 500 personas con empleo cul es su opinin, es el problemams acuciante en Espaa, obtenindose el siguiente resultado:

    OcupacinLaboral

    Problema que ms preocupaTotalParo Dficit

    Asalariados 236 86 322Profesionales

    Libres53 125 178

    Total 289 211 500

    a) Determinar si existe relacin entre la ocupacin laboral y el problema que mspreocupa. Use 0.05a =b) Hallar e interpretar el coeficiente de contingencia chi cuadrado.

    11.La siguiente tabla corresponde a una muestra aleatoria de 850 clientes delBanco de Crdito del Per que opinan sobre la evaluacin de la calidad de losservicios y la calificacin de la oportunidad de los servicios:

    Evaluacin de lacalidad de los

    servicios

    Calificacin de oportunidad de losservicios Total

    Oportuna DemoradaBuena 300 50 350

    Regular 200 50 250Mala 100 150 250Total 600 250 850

    a) Determinar si la evaluacin de la calidad y calificacin oportuna de los serviciosse relacionan. Use = 0.05b) Calcular e interpretar el coeficiente de contingencia chi cuadrado.

    ___________________________________________________________________________ 105Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL

    CAPITULO IV

    REGRESIN Y CORRELACIN LINEAL SIMPLE

    4.1. REGRESIN LINEAL SIMPLE4.1.1. INTRODUCCINCuando se estudian dos caractersticas simultneamente sobre una muestra, sepuede considerar que una de ellas influye sobre la otra de alguna manera. Elobjetivo principal de la regresin es descubrir el modo en que se relacionan

    Por ejemplo, en una tabla de ingresos semanales y consumos semanales en solesde 10 familias se puede suponer que la variable ingresos semanales influye sobrela variable consumos semanales en el sentido de que cosnumos semanales altosvienen explicados por valores altos de ingresos semanales. De las dos variables aestudiar, que vamos a denotar con X e Y, vamos a llamar a la X VARIABLEINDEPENDIENTE o EXPLICATIVA, y a la otra, Y, le llamaremos VARIABLEDEPENDIENTE o EXPLICADA.

    En la mayora de los casos la relacin entre las variables es mutua, y es difcil saberqu variable influye sobre la otra. El ejemplo dado es un ejemplo claro dondedistinguir entre variable explicativa y explicada . En este caso un ingreso semanalbajo tender a tener un consumo semanal bajo, y un ingreso alto indicar tal vezque las familias tienen un consumo semanal alto. Sin embargo, a la hora dedeterminar qu variable explica a la otra, est claro que el ingreso semanal explicala consumo semanal y no al contrario, pues las familias primero obtienen susingresos semanales, y luego consumen semanalmente. Por tanto, X = ingresossemanales (variable explicativa o independiente) Y = consumos semanales (variableexplicada o dependiente) El problema de encontrar una relacin funcional entre dosvariables es muy complejo, ya que existen infinidad de funciones de formas distintas.El caso ms sencillo de relacin entre dos variables es la relacin LINEAL, es decirque (es la ecuacin de una recta) donde son nmeros, que esel caso al que nos vamos a limitar.

    Cabe recalcar la regresin estudia la mejor relacin funcional entre las variabledependiente y una o un conjunto de variables independientes o explicativas.

    ___________________________________________________________________________ 106Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    0 1 y x 0 1 yb b

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL

    4.1.2. DEFINICIN Una funcin de regresin es lineal simple cuando las variaciones en la variableindependiente provocan variaciones proporcionales en la variable dependiente. Y = f (X)Donde: Y : Variable dependiente X : Variable independiente

    Por ejemplo: Podemos estar interesados en predecir el consumo promedio de unconjunto de familias en base al ingreso de las mismas.

    Entonces: Y: Consumo ; X : Ingreso

    Hacer anlisis de regresin lineal simple consiste en estimar la funcin de regresinpoblacional (F.R.P.) que responde a la siguiente expresin:

    F.R.P. : Yi = 0 + 1 Xi + Ei ..................... (1)

    Donde:Y : Variable dependienteX : Variable independiente0: Intercepto1: Coeficiente pendienteEi : Error aleatorio.

    Con base en la funcin de regresin muestral (F.R.M.)

    F.R.M. .............................. (2)

    4.1.3. ELECCIN DE UNA RELACIN FUNCIONALAc veremos el tipo de funcin matemtica que mejor ha de representar ladependencia entre las variables, dos son los mtodos empleados:a) Una consideracin analtica del fenmeno que nos ocupa (estudios anteriores).b) Un examen del diagrama de dispersin en forma grfica de los datos observados,en esta forma es fcil tener una idea si existe o no existe regresin, si es lineal ocurvilnea, esto puede permitir ahorrar tiempo y dinero, evitando trabajos estriles.Ver fig. 20.

    ___________________________________________________________________________ 107Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    i 0 1 i i y x e= b +b +

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL

    Diagrama de dispersin

    fig. 20

    4. EL MTODO DE LOS MNIMOS CUADRADOS ORDINARIOS (M.C.O)El mtodo de los mnimos cuadrados ordinarios brinda los siguientes coeficientes de regresin estimados:

    ...........................(8)

    ............................(9)

    4.1. Caracteristicas de los coeficientes de regresion estimados Son expresados nicamente en trminos de cantidades observables. Son estimadores puntuales, es decir dada la muestra cada estimador

    proporcionar un solo valor del parmetro poblacional relevante.

    4.2. Interpretacion de los coeficientes de regresion estimados : Es el efecto medio o promedio sobre la variable dependiente de todas

    las variables omitidas en el modelo de regresin.

    : Es el promedio de los incrementos de y debido a los aumentos unitarios de x o es el promedio de las disminuciones de y debido a los aumentos unitarios de x.

    ___________________________________________________________________________ 108Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    0b

    1b

    ( )i i i i

    1 22i i

    n( x y ) ( x )( y )n x x

    -b =

    -

    0 1 y xb = -b

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL

    fig. 21

    4.3. Coeficiente de determinacin: r2

    Consideremos ahora la bondad de ajuste de la lnea de regresin ajustada alconjunto de datos.

    fig. 22De la fig. 22 se desprende claramente que si todas las observaciones coinciden conla lnea de regresin, obtendramos el ajuste perfecto lo que raras veces ocurre.Generalmente tiende a haber algunas ei positivos (encima de la lnea de regresin)y ei negativos (debajo de la lnea de regresin) con la esperanza de que los errosaleatorios localizados alrededor de la lnea de regresin sean los ms pequeosposibles.

    El Coeficiente de Determinacin (r2) es una medida resumen que nos dice que tanexactamente la lnea de regresin estimada se ajusta a los datos observados.

    ___________________________________________________________________________ 109Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL

    El coeficiente de determinacin se expresa de la siguiente manera:

    El coeficiente de determinacin muestral es ampliamente utilizado como una medidade la bondad de ajuste de una lnea de regresin. Es decir el r2 mide la proporcino porcentaje de la variacin de la variacin total en y explicada por el modelode regresin.Sus propiedades son:1. Es una cantidad positiva2. Sus lmites son: 0 r2 1

    * Si r2 = 1, quiere decir que el ajuste es perfecto.* Si r2 = 0, quiere decir que no hay relacin entre la variable dependiente y la variable independiente.

    3. Cunto ms se acerca r2 a 1, tanto ms alto ser el grado de linealidad entre lasvariables.

    4. Si r2 0.75 hay seguridad en las predicciones con la ecuacin de regresin linealestimada.

    Ejemplo 44:Se desea estudiar la posible relacin entre los gastos mensuales en materialinformtico (Y) y los ingresos globales mensuales (X) en soles de una empresa,para ello se recoge una muestra aleatoria de 6 datos, los cuales se adjuntan en lasiguiente tabla:

    Ingresos globales (X)

    Gastos en materialinformtico

    (Y)200 2500500 3500

    1000 45002000 55003000 65005000 8500

    Se pide:a) Graficar el diagrama de dispersin de las variables dadas y comentar. b) Estimar la lnea de regresin de los gastos en material informtico sobre los

    ingresos globales.

    ___________________________________________________________________________ 110Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3

    ( )( )( ) ( )

    2

    22 22 2

    n xy x yr

    [n x x ][n y y ]

    - =- -

  • Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL

    c) Graficar la lnea de regresin estimada sobre el diagrama de dispersin. d) Interpretar el coeficiente