LIBRO EA
-
Upload
maximo-cisneros-pianto -
Category
Documents
-
view
96 -
download
6
Transcript of LIBRO EA
-
ASIGNATURA
ESTADSTICA APLICADA ESTADSTICA INFERENCIAL
DOCENTE TITULAR: MG. CARMEN BARRETO R.
AO 2013
-
CONTENIDO
Pg.1. DISTRIBUCIONES CONTINUAS IMPORTANTES 1
1.1. LA DISTRIBUCIN NORMAL 1
1.2. FUNCIN DE DENSIDAD DE PROBABILIDAD DE LA DISTRIBUCIN 1NORMAL GENERAL
1.3. GRFICO DE LA DISTRIBUCIN NORMAL GENERAL 2
1.4. PROPIEDADES DE LA DISTRIBUCIN NORMAL GENERAL 2
1.5. DISTRIBUCIN NORMAL ESTNDAR 3
1.6. FUNCIN DE DENSIDAD DE PROBABILIDAD DE LA DISTRIBUCIN 3
NORMAL ESTNDAR
1.7. GRFICO DE LA DISTRIBUCIN NORMAL ESTNDAR 4
1.8. CALCULO DIRECTO EN LA DISTRIBUCIN NORMAL ESTNDAR 4
1.9. PROPIEDADES PARA EL CALCULO DE OTRAS AREAS BAJO LA CURVA 7 NORMAL ESTANDAR1.10. CALCULO INVERSO EN LA DISTRIBUCION NORMAL ESTANDAR 121.11. ESTANDARIZACION DE UNA VARIABLE ALEATORIA NORMAL 181.12. APLICACIONES DE LA DISTRIBUCION NORMAL ESTANDAR 241.13. DISTRIBUCIN T STUDENT 31
1.14. DISTRIBUCIN CHI CUADRADO 37
2. INTERVALOS DE CONFIANZA Y TAMAO DE MUESTRA
2.1. INTRODUCCIN 41
2.2. DEFINICIN 42
2.3. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONALHACIENDO 43
2.4. TAMAO DE MUESTRA CUANDO EL PARMETRO ES LA MEDIA 52
EL POBLACIONAL USANDO MUESTREO ALEATORIO SIMPLE 2.5. INTERVALOS DE CONFIANZA PARA LA PROPORCIN POBLACIONAL 552.6. TAMAO DE MUESTRA CUANDO EL PARAMETRO ES LA 61
PROPORCION PROBLACION USANDO EL MUESTREO ALEATORIO SIMPLE3. PRUEBA DE HIPTESIS 66
3.1. INTRODUCCIN 66
-
3.2. DEFINICIONES GENERALES 66
3.3. PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONAL 71
3.4. PRUEBA DE HIPTESIS PARA LA PROPORCIN POBLACIONAL 86
3.5. PRUEBA DE INDEPENDENCIA CHI CUADRADO 96
4. REGRESIN Y CORRELACIN LINEAL SIMPLE
4.1. REGRESIN LINEAL SIMPLE 106
4.2. CORRELACIN LINEAL SIMPLE 120
5. REFERENCIAS BIBLIOGRFICAS 132
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
CAPITULO I
DISTRIBUCIONES CONTINUAS IMPORTANTES
1.1. DISTRIBUCIN NORMAL GENERALLa distribucin de probabilidad continua ms importante en todo el campo de laestadstica, es con toda seguridad la distribucin normal, debido a que en la prcticamuchos fenmenos, industriales, cientficos, o de la vida diaria pueden describirsepor esta distribucin. A la distribucin normal frecuentemente se le llama distribucingaussiana. La curva normal puede considerarse como modelo terico para analizarsituaciones reales.
1.2. FUNCIN DE DENSIDAD DE PROBABILIDADUna variable aleatoria contina X, se dice que est distribucin normalmente, conmedia u )( y varianza 02 , si su funcin de densidad de probabilidadest dado por:
x;e
21)x(f
2x21
Donde:
.....1415.3 y ...7182.2e
1.3. GRFICO DE LA DISTRIBUCIN NORMAL GENERAL
fig. 1: La Distribucin Normal
____________________________________________ 1Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
- m
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
La distribucin normal se emplea tanto que ha menudo se emplea la siguiente notacin
abreviada: X ),,( 2n para indicar que la variable aleatoria X se distribuye normalmente
con media y varianza 2.
1.4. PROPIEDADES DE LA DISTRIBUCION NORMAL GENERALa) La distribucin normal es simtrica y tiene forma de campana, se extiende de a . b) En la distribucin normal la media est en la mitad y divide el rea en dosmitades y la media, la mediana y la moda tienen el mismo valor.c) El rea total bajo la curva normal es el 100%.
d) Existe una distribucin normal diferente para cada combinacin de media y
desviacin estndar.
e) La probabilidad de que una variable aleatoria tenga un valor entre dos puntos
es igual al rea bajo la curva normal entre los dos puntos, tal como se muestra en la
fig. 2.
P(a x b) = rea bajo la curva normal entre a y b.
fig. 2
f) En la fig. 3 muestra el rea bajo la curva normal de 1, 2 y 3 desviacionesestndar de la media.
____________________________________________ 2Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
a b-
-
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
fig. 3
1.5. DISTRIBUCIN NORMAL ESTNDARDado que existe una distribucin normal diferente para una combinacin de media ydesviacin estndar, sera intil intentar elaborar las tablas suficientes para calcularprobabilidades, adems de la complejidad de la funcin de densidad (frmula),existe sin embargo, una alternativa sencilla que evita estos problemas. Para ello sepuede convertir esta escala real a una relativa o estandarizada, mediante la variablenormalizada.En donde:
1.6. FUNCIN DE DENSIDAD DE PROBABILIDADUna variable aleatoria contina Z , se dice que est distribucin normalmente, conmedia 0m = y varianza 2 1s = , si su funcin de densidad de probabilidad est dadopor:
Donde:
____________________________________________ 3Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
1m - s3m - s
68.0%
95.5%
99.7%
1m + s2m - s
21 z21f (z) e ; z
2-
= - < < p
2m + s 3m + s0
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Adems:
X : Algunos valores de inters : Media : Desviacin estndar
La distribucin de una variable normal con media cero y varianza 1, se denota: Zn(0,1) y se lee: Distribucin Normal con media cero y varianza 1.
1.7. GRFICO DE LA DISTRIBUCIN NORMAL ESTNDAR
fig. 4
1.8. CALCULO DIRECTO EN LA DISTRIBUCIN NORMAL ESTANDAR MANEJO DE TABLAS ESTADSTICAS .a) Uso de la Tabla I
fig. 5: Area bajo la curva normal que se muestra en la Tabla I
____________________________________________ 4Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
0 Z
xZ
0
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Ejemplo 1:Obtener el rea para Z < 1.35
1 35P[ Z . ] ?
En primer lugar se debe localizar al valor 1.3 en el lado izquierdo de la Tabla I yluego el 0.05 (5 es el ltimo dgito) en su parte superior. El rea bajo la curva sepuede leer en la informacin de la fila Z = 1.3 y la columna 0.05. El valor es 0.9115.
Luego: P(Z < 1.35) = 0.9115
Observe la tabla:TABLA N 1
rea bajo una curva normal entre - y Z = 1.35Z 0.00 0.01 0.02 0.03 0.04 0.05 .... 0.09
-3.4-3.3
.
.
.0.0...
0.91.01.11.21.3...
3.4
____________________________________________ 5Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
0.9115
0.9115
1.350-
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Ejemplo 2:Obtener el area para Z < -2.58
En primer lugar se debe localizar al valor -2.5 en el lado izquierdo de la Tabla I yluego el 0.08 (8 es el ltimo dgito) en su parte superior. El rea bajo la curva sepuede leer en la informacin de la fila Z = -2.5 y la columna 0.08. El valor es 0.0049
Luego: P(Z
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
b) Uso de la Tabla N II
fig. 6: rea bajo la curva normal que se muestra en la Tabla II
Ejemplo 3:Obtener el rea para -1.96 Z 1.96. Cabe indicar que los puntos son simtricos.En primer lugar se debe localizar al valor 1.9 en el lado izquierdo de la Tabla II yluego 0.06 (6 es el ltimo dgito) en su parte superior. El rea bajo la curva se puedeleer en la informacin de la fila Z = 1.9 y la columna 0.06. El valor es 0.95.
Luego:
95.0]96.1Z96.1[P
1.9. PROPIEDADES PARA EL CALCULO DE OTRAS AREAS BAJO LA CURVA NORMAL ESTANDAR
En esta sesin daremos propiedades para el clculo de reas bajo la curva normalestndar para utilizarlas posteriormente en aplicaciones pertinentes de dichadistribucin.
____________________________________________ 7Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-Z 0 Z
0.95
-1.96 1.960
-
Universidad Catlica Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
a) [ ] [ ]O OP Z Z 1 P Z Z = - 30)
Varianza poblacional desconocida se estima a travs de la muestra. Es decir si
Poblacin normal.
Para el nivel de confianza 1 = 0.90 El error estndar de la media muestral es:
x
s 16s 1.78n 81
= = =
c) Haremos uso de la estadstica Z descrita en el Caso I ii
d) Hallando el intervalo de confianza:
___________________________________________________________________________ 48Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
s 16 soles.=
OZ 1.645=
2 2s 16 soles entonces s 256 soles= =
2 2( s )s @
x 250 soles=
-
Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
1 0
2 0
1
2
1
2
s 16L x Z 250 1.645n 81s 16L x Z 250 1.645n 81
L 250 1.645 1.78L 250 1.645 1.78
L 250 2.93 247.07 solesL 250 2.93 252.93 soles
= - = -
= + = +
= -
= -
= - =
= + =
e) Interpretacin: Con una seguridad del 90% el gasto medio mensual de consumo mensual vara entre 247.07 soles y 252.93 soles.
Ejemplo 19:Con el fin de medir el rendimiento de una mquina (N de unidades producidas), se tomauna muestra y se obtiene los siguientes resultados: 20, 24, 22, 22, 21, 27, 25. Si sabeque el rendimiento sigue una distribucin normal. Encontrar un intervalo de confianza del99% para el rendimiento medio.
Solucin:a) Se desea estimar:
: Tiempo medio poblacional de ejecucin en milisegundos de un programa.
b) Anlisis:
n=7 (n
-
Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
x
s 23s 8.69n 7
= = =
c) Haremos uso de la estadstica t:
d) Hallando el intervalo de confianza:
1 0
2 0
1
2
1
2
s 2.45L x t 23 3.707n 7s 2.45L x t 23 3.707n 7
L 23 3.707 0.93L 23 3.707 0.93
L 23 3.45 19.55 20 unidadesL 23 3.45 26.45 26unidades
= - = -
= + = +
= - =@ -
= - = @= + = @
e) Interpretacin: El rendimiento medio de la mquina vara entre 20 y 26 unidades con unaconfianza del 99%.
Ejemplo 20:En una empresa distribuidora de productos informticos trabajan 500 personas. Unestudio realizado sobre un tamao de muestra de 30 trabajadores demostr que el sueldoanual promedio era $450, con una desviacin estndar de $50. Estime el sueldo anualpromedio de todos los trabajadores de la empresa con un nivel de confianza del 95%.
Solucin:a) Se desea estimar:
: Sueldo anual promedio de todos los trabajadores.
___________________________________________________________________________ 50Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
b) Anlisis:
n=30
Varianza poblacional desconocida 22 s es estima a travs de la muestra. Es decir
Poblacin normal. Se tiene una poblacin finita de tamao N=500, entonces El error estndar de la
media muestral x es:
86.8150030500
3050
1NnN
nss x
c) Haremos uso de la estadstica Z descrita en el Caso I - ii:
d) Hallando el intervalo de confianza:
e) Interpretacin:
El sueldo anual promedio de todos los trabajadores vara entre $432.63 y $467.37 conuna confianza del 95%.
___________________________________________________________________________ 51Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
450$x
50$s
2 2s 50 $ entonces s 250$= =
1 0
2 0
1
2
1
2
s N n 45 500 30L x Z 450 1.96N 1 500 1n 30
s N n 45 500 30L x Z 450 1.96N 1 500 1n 30
L 450 1.96 8.86L 450 1.96 8.86
L 450 17.37 $432.63 solesL 450 17.37 $467.63 soles
- -= - = -
- -
- -= + = +
- -
= - = -
= - == + =
-
Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
2.4. TAMAO DE MUESTRA CUANDO EL PARAMETRO ES LA MEDIAPOBLACIONAL USANDO EL MUESTREO ALEATORIO SIMPLE
2.4.1. CALCULO DEL TAMAO MUESTRAL USANDO EL MUESTREO ALEATORIOSIMPLE
Caracterstica de la Poblacin Tamao de la muestraTamao de la poblacin infinita o desconocido.
2
2221
eZ
n
Tamao de la poblacin finita.
)1N(eZNZ
n 22222
21
Donde:
n Tamao de la muestra.N Tamao de la poblacin.
Z1-/2
Valor correspondiente a la distribucin de Gauss
Z0.975 = 1.96 para = 0.05 y Z0.995 = 2.576 para = 0.01. (Utilizar
Tabla II). Valor de la varianza poblacional. En caso de no conocerse se
estima por la varianza muestral (s2) a travs de una muestra
pilotoe Error que se prev cometer.
fig. 13Ejemplo 21:Una muestra de 1225 familias revel un gasto semanal de promedio de 250 soles y unadesviacin estndar de 30 soles. Cul deber ser el tamao mnimo de la muestra paraun error mximo semanal de 4 soles, para un nivel de confianza del 99%?Solucin:
La desviacin estndar se ha obtenido a travs de una muestra entonces:
___________________________________________________________________________ 52Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
xmL1 L2
e
-
Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
s=30 soles.
Para el nivel de confianza 1 = 0.99 0.975Z 2.576= e = 4 soles. La poblacin es infinita o desconocida.
La formula a utilizar ser la siguiente:
2 21 2
2
Z sn
e =
2 2
2(2.5.76) (30)n
(4)
=
n 373.3 373 familias= @Ejemplo 22:Una muestra aleatoria de los salarios en soles por hora para nueve trabajadores es:
10.5, 11, 9.5, 12, 10, 11.5, 13, 9, 8.5.El muestro se realiz sobre una poblacin distribuida normalmente y se desea calcular unintervalo de confianza para el salario promedio de los trabajadores. Hallar el tamaomnimo que debe tener la muestrea para que con un nivel de confianza del 95%, el errorde estimacin no supere a los 0.3 soles, en una poblacin de 600 trabajadores.Solucin:La desviacin estndar es desconocida y se ha obtiene a travs de la muestra:
s 1.47 soles hora=
Para el nivel de confianza 1 = 0.95 0.95Z 1.96= e = 0.3 soles. La poblacin es finita de tamao N=600 trabajadores.
La formula a utilizar ser la siguiente:
2 21 2
2 2 21 2
Z s Nn
Z s e (N 1)-a
-a
=
+ -
___________________________________________________________________________ 53Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad CatlicaLos ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
2 2
2 2 2(1.96) (1.47) 600n
(1.96) (1.47) (0.3) (600 1)
= + -
n 56.9 57 trabajadores.= @
Ejemplo 23:Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los niosutilizan la Internet. Por estudios anteriores se sabe que la desviacin estndar de dichotiempo es de 2.5 horas, con un nivel de confianza del 95% Qu tamao de muestra sedebera elegir si el error de estimacin puntual no es superior a media hora, si sepoblacin de 500 nios de un colegio X?Solucin:La desviacin estndar es conocida se ha obtenido a travs de la poblacin.
.horas5.2
Para el nivel de confianza 1 = 0.95 96.1Z 975.0 .horas5.0e La poblacin es infinita o desconocida.La formula a utilizar ser la siguiente:
)1N(eZNZ
n 22221
2221
)1500(5.05.296.15005.296.1n 222
22
.nios81n
___________________________________________________________________________ 54Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
2.5. INTERVALOS DE CONFIANZA PARA LA PROPORCION POBLACIONAL
2.5.1. INTRODUCCIONMuchas veces las decisiones dependen de parmetros que son binarios, parmetroscon solo dos posibles categoras dentro de las cuales pueden clasificarse lasrespuestas. En este caso el parmetro de inters es la proporcin poblacional oporcentaje de la poblacin que cumple cierta caracterstica. Por ejemplo unaempresa distribuidora de computadoras puede estar interesada en estimar elporcentaje de clientes que pagan al crdito. Una empresa productora de softwareinformticos puede estar interesa en estimar el porcentaje software defectuosos, oque porcentaje de clientes compran software estadsticos.
Donde:
P: Proporcin poblacional de xitos o proporcin de elementos de la poblacin quetienen cierta caracterstica.
poblacinladeelementosdeNmeroticacaracterisciertatienenquepoblacinladeelementosdeNmero
NXP
Q: Proporcin poblacional de fracasos o proporcin de elementos de la poblacinque no tienen cierta caractersticas.
poblacinladeelementosdeNmeroticacaracterisciertatienennoquepoblacinladeelementosdeNmero
NXQ
'
Adems:
P1Qentonces1QP Generalmente la proporcin poblacional se desconoce y tiene que ser estimado a travs de la proporcin muestral. Entonces:
p: Proporcin muestral de xitos o proporcin de elementos de la muestra quetienen cierta caracterstica.
___________________________________________________________________________ 55Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
muestraladeelementosdeNmeroticacaracterisciertatienenquemuestraladeelementosdeNmero
nxp
q: Proporcin muestral de fracasos o proporcin de elementos de la muestra queno tienen cierta caracterstica.
muestraladeelementosdeNmeroticacaracterisciertatienennoquemuestraladeelementosdeNmero
nxq
'
Adems:
p1qentonces1qp
2. DEFINICIONEs el rango dentro del cual se encuentra la proporcin poblacional con un nivel deconfianza dado.
L1 P L2 fig. 14
Para hallar los intervalos de confianza para la proporcin poblacional usaremos laestadstica Z para muestras grandes (n 30). Entonces los lmites de confianzasern:
___________________________________________________________________________ 56Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
1 - /2 /2
1LPLP 2|
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
nqpZpsZpL 0p01
nqpZpsZpL op02
2.5.2. ERROR ESTNDAR DE LA PROPORCINSi el tamao de la muestra es suficientemente grande (n 30). Si el muestreo es cono sin sustitucin en una poblacin infinita (o con sustitucin en una poblacin finitade tamao N), el error estndar es:
n)P1(P
p
que se estima por:
n)p1(psp
Si el muestreo es sin sustitucin en una poblacin finita de tamao N elerror estndar para la proporcin poblacional esta dado por:
1NnN
nQP
P
que se estima por
1NnN
nqpsp
Donde:
1NnN
es el factor de correccin para poblacin finita.
___________________________________________________________________________ 57Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Ejemplo 24:En una poblacin, nadie es indiferente respecto a una iniciativa propuesta por elalcalde: cada habitante adulto o bien est a favor, o bien en contra de la iniciativa.Se desea conocer el porcentaje P de las personas que estn en contra. Entre 50habitantes adultos elegidos al azar, 15 afirmaron que estaban en contra (y los 35restantes a favor). Hallar el intervalo de confianza al 95% para la proporcin real depersonas que estan en favor de la iniciativa propuesta por el alcalde.
Solucin: Se desea estimar la proporcin real de personas a favor de la iniciativa propuesta
por el alcalde. Observamos que la proporcin muestral de personas a favor de la iniciativa
propuesta por el alcalde es:35p 0.7 q 0.350
= = =
Para un nivel de confianza del 99% el valor de Z0 = 1.96 El error estndar de la proporcin muestral es:
pp q 0.7 0.3s 0.06
n 50
= = =
Los lmites de confianza para P son:
1 0
2 0
p qL p Z 0.3 1.96 0.06 0.3 0.12 0.18n
p qL p Z 0.3 1.96 0.06 0.3 0.12 0.42n
= - = - = - =
= + = + = + =
Interpretacin: Se tiene una confianza del 95% que el porcentaje de personas queestn a favor de la iniciativa de la propuesta por el alcalde varia entre el 18% y 42%.
Ejemplo 25:Se desea conocer la opinin de los alumnos de la Uladech en relacin con laaceptacin o no de la pena de muerte para los terroristas en el Per. Para ello se ha
___________________________________________________________________________ 58Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
tomado una muestra aleatoria simple de tamao 500. Si las respuestas afirmativashan sido 100, encontrar un intervalo de confianza aproximado del 95%.
Solucin: Se desea estimar la proporcin de alumnos de la Uladech que estn de acuerdo
con la pena de muerte para los terroristas en el Per.
Observamos tambin que la proporcin muestral de personas que estn a favorde la pena de muerte es:
80.0q20.0500100
nxp .
Para un nivel de confianza del 95% el valor de Z0 = 1.96.
El error estndar de la proporcin muestral es:
02.0s
50080.020.0
nqps
p
p
Los lmites de confianza para P son:
24.002.096.120.0n
qpZpL
16.002.096.120.0n
qpZpL
02
01
Interpretacin: Se tiene una confianza del 95% que el porcentaje de estudiantes dela Uladech que afirman estar de acuerdo con la pena de muerte vara entre el 16% y24%.
___________________________________________________________________________ 59Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Ejemplo 26:Se desea estimar el porcentaje de aprobados de un curso de Auditoria de unapoblacin de 500 alumnos. Para este fin, se uso una muestra de 35 alumnos querevel un 80% de aprobados. Estime la verdadera proporcin de aprobados delcurso completo dentro de una confiabilidad del 99%.
Solucin: Se desea estimar la proporcin de aprobafdos en el curso de Auditoria Observamos que N = 500 y n = 35
Observamos tambin que la proporcin muestral de alumnos aprobados en laasignatura de Auditoria est dada por:
p 0.8= .
Para un nivel de confianza del 99% el valor de Zo=2.576.
El error estndar de la proporcin muestral es:
p
p
p
p q N nsn N 1
0.80 0.20 500 35s500 500 1
s 0.07
-=
-
-=
-
=
Los lmites de confianza para P son:
1 0 p
2 0 p
L p Z s 0.8 2.576 0.07 0.8 0.18 0.62
L p Z s 0.8 2.576 0.07 0.8 018 0.98
= - = - = - =
= + = + = + =
Se tiene una confianza del 99% que el porcentaje de alumnos aprobados en elcurso de Auditoria vaia entre el 62% y 98%.
___________________________________________________________________________ 60Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
2.6. TAMAO DE MUESTRA CUANDO EL PARAMETRO ES LA PROPORCIONPROBLACION USANDO EL MUESTREO ALEATORIO SIMPLE
2.6.1. CALCULO DEL TAMAO MUESTRAL USANDO EL MUESTREOALEATORIO SIMPLE.
Caracterstica de la Poblacin Tamao de la muestraTamao de la poblacin infinita o desconocido.
2
221
eQPZ
n
Tamao de la poblacin finita.
)1N(eQPZNQPZ
n 222/1
221
Donde:
n Tamao de la muestra.N Tamao de la poblacin.
Z1-/2
Valor correspondiente a la distribucin de Gauss
Z0.975 = 1.96 para = 0.05 y Z0.995 = 2.576 para = 0.01.
(Utilizar Tabla II).P Proporcin poblacional de xitos. En caso de no conocerse se
estima por la proporcin muestral (p) a travs de una muestra
piloto. En el caso ms desfavorable se considera P=0.5Q Proporcin poblacional de fracasos.e Error que se prev cometer.
fig. 15
Ejemplo 27:En una poblacin, nadie es indiferente respecto a una iniciativa propuesta por elalcalde: cada habitante adulto o bien est a favor, o bien en contra de la iniciativa.
___________________________________________________________________________ 61Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
L1 L2
e
P p-
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Se desea conocer el porcentaje P de las personas que estn en contra con unaconfianza del 95%. Entre 50 habitantes adultos elegidos al azar, 15 afirmaron queestaban en contra (y los 35 restantes a favor). Cual es el numero mnimo deencuestados necesario para que el error cometido en la estimacin sea, comomucho, de 0.05?
Solucin: La proporcin poblacional de personas que estn en contra de la iniciativa
propuesta por el alcalde no se conoce entonces se estima por la proporcin
muestral, y est dada por:
x 15p 0.3 q 0.7n 50
= = = =
Para el nivel de confianza 1 = 0.95 el valor de 96.1Z 975.0 . e = 0.05 La poblacin es infinita o desconocida.Como el valor de p se ha calculado a travs de la muestra, la formula a utilizar serla siguiente:
Ejemplo 28:En una compaa que tiene 400 empleados se desea estimar que porcentaje de susempleados tienen tarjeta de crdito. Se estima que este porcentaje pudiese estarcerca del 70%. Tomando una confianza del 99%, Cuntos empleados debo tomarcomo muestra para estimar este valor? Se desea un error mximo del 3%.
Solucin: La proporcin poblacional estimada (obtenida a travs de una muestra) de
empleados que tienen tarjeta de crdito est dada por:
___________________________________________________________________________ 62Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
21 2
2
Z p qn
e-a =
2
2(1.96) 0.3 0.7n
(0.05)
=
n 322.6 323 encuestados= @
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Para un nivel de confianza del 95% el valor de 96.1Z 975.0 e = 0.03 La poblacin es infinita o desconocida.
La formula a utilizar ser la siguiente:
2
2(1.96) 0.7 0.3n
(0.03)
=
n 896.3 896 empleados= @
Ejemplo 29:Se desea estimar el porcentaje de aprobados de un curso de Estadstica de 500alumnos. Para este fin, se uso una muestra de 35 alumnos que revel un 80% deaprobados. Cuntos alumnos se debe tomar en la muestra si se desea unaprecisin del 2% con una confiabilidad del 99%.
Solucin: La proporcin poblacional estimada (obtenida a travs de la muestra) de alumnos
aprobados en el curso de Estadstica, est dada por: p 0.8 q 0.2= =
Para un nivel de confianza del 99% el valor de 576.2Z 995.0 . e = 0.02 La poblacin es finita N=500.
La formula a utilizar ser la siguiente:
21 2
2 21 / 2
Z p q Nn
Z p q e (N 1)-a
-a
=
+ -
___________________________________________________________________________ 63Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
2
221
eqpZ
n
p 0.7 q 0.3= =
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
2
2 2(2.576) 0.80 0.20 500n
(2.576) 0.80 0.20 (0.02) (500 1)
= + -
n 420.9 421 alumnos.= @
7. Se desea estimar la proporcin de personas p que tienen un aparato DVD ensu hogar, en una poblacin de 10000 familias. Para eso debemos tomar unamuestra de tamao de manera que con una confiabilidad del 99% y margen de errorde 0.05, el intervalo que construiremos contenga al valor desconocido de laproporcin poblacional p. Indica el tamao de muestra que se debe tomar.
Solucin: La proporcin poblacional de personas que tienen un aparato DVD en su casa
es desconocido, entonces consideramos P=0.5. P 0.5 Q 0.5= =
Para un nivel de confianza del 99% el valor de 576.2Z 995.0 . e = 0.05 La poblacin es finita N=10000
La formula a utilizar ser la siguiente:
21 2
2 21 / 2
Z P Q Nn
Z P Q e (N 1)-a
-a
=
+ -
2
2 2(2.576) 0.50 0.50 10000n
(2.576) 0.50 0.50 (0.05) (1000 1)
= + -
n 622.3 622 personas.= @
___________________________________________________________________________ 64Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
AUTOEVALUACIN 02
1. Tomada al azar una muestra de 500 personas de una determinada comunidad,se encontr que 300 lean la prensa regularmente. Halla con una confianza del90%, un intervalo para estimar la proporcin de lectores entre las personas de lacomunidad.
2. Se realiz un estudio sobre la utilizacin del agua en una pequea ciudad.Adems se sabe que el nmero de galones de agua que utilizan se distribuyenormalmente.Para ello se consider una muestra de 10 casas. El nmero degalones de agua que utilizan por da (1 galn = 0.0037854 m3) fue el siguiente: 175,180, 179, 185, 174, 180, 190, 191, 192, 179. Con base a esta informacin:a) Hallar un intervalo de confianza para el 90%. b) Si el recurso de agua en la ciudad permite una utilizacin media de 160 galones
por da Podria pensarse que hay un problema de escasez de agua en la ciudad?
3. En una comunidad autnoma se sabe que la desviacin tpica del nmero de dasque dura un ontrato temporal es igual a 57 das. Indica el nmero mnimo de contratos en los que se han mirado su duracin para que el intervalo con un nivel de confianza del 95% que da la duracin media de un contrato de ese tipo tenga una amplitud no mayor de 10 das.
4. Tomada al azar una muestra de 600 personas de una determinada comunidad deuna poblacin de 10000 personas, se encontr que 400 lean la prensa diariaregularmente. Cuntos individuos ha de tener la muestra, a un nivel de confianzadel 95%, con un error mximo del 5%?
5. Se extrajo una muestra aleatoria de 172 estudiantes de contabilidad y se les pidique evaluasen unas determinadas condiciones de trabajo en una escala de 1 (noimportante) a 5 (extremadamente importante). La seguridad en el trabajo recibiuna calificacin media de 4.38 con una desviacin estndar muestral de 0.70.Calcular un intervalo de confianza del 99% para la media poblacional.
___________________________________________________________________________ 65Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
CAPITULO III
PRUEBA DE HIPTESIS
3.1. INTRODUCCIONEl propsito de anlisis estadstico es reducir el nivel de incertidumbre en el procesode decisiones. Los gerentes pueden tomar mejores decisiones solo si tienensuficiente informacin a su disposicin. La prueba de hiptesis es una alternativaanaltica muy efectiva para obtener esta valiosa informacin. Por ejemplo el gerentede sistemas de una empresa desea determinar si el tiempo de vida medio decomputadoras de la marca COMPAQ es mayor de 10 aos ( 10 ). Un productor desoftware de computador desea certificar que la proporcin de sus productos que sondefectuosos es menor del 3% ( 03.0p ). El gerente de una empresa desea saber sila implementacin de un nuevo programa de capacitacin mejora la productividad desus vendedores respecto al nmero de clientes que desean tener una tarjeta decrdito ( 30 ).Las ilustraciones de esta naturaleza son virtualmente ilimitadas en diferentesescenarios productivos, de negocios, econmicos, financieros, laborales, etc. Si sepueden obtener respuestas a estas preguntas y a muchas otras con algn grado degaranta la toma de decisiones se vuelve ms segura y es menos probable queconduzca a un error costoso.
3.2. DEFINICIONES GENERALESA continuacin daremos a conocer algunas definiciones generales que se usan parallevar a cabo una prueba de hiptesis:
a) Hiptesis estadstica: Es una suposicin o afirmacin respecto de unparmetro poblacional. Por ejemplo:- El nmero promedio de ingenieros de sistemas que se insertan al mercado
laboral es de al menos 3 de ellos.- El 20% de las familias chimbotanos tienen Internet en su hogar.- El sueldo medio de los trabajadores de la Uladech es de S/. 800.00 mensuales.
Todas estas hiptesis tienen algo en comn, las poblaciones de inters son tangrandes que no es factible estudiar todos sus elementos. Como ya sabemos, unaalternativa a estudiar la poblacin entera es tomar una muestra de la poblacin de
___________________________________________________________________________ 66Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
inters. De esta manera podemos probar una afirmacin para determinar si laevidencia soporta o no la afirmacin.
b) Prueba de hiptesis: Es un procedimiento basada en la evidencia muestral yen la teora de la probabilidad que se lleva acabo para decidir si se acepta o rechazaun hiptesis estadstica planteada.
c) Tipos de hiptesis: Cualquier investigacin estadstica implica la existencia dehiptesis o afirmaciones de las poblaciones que se estudian. Hay dos tipos dehiptesis: la hiptesis nula y la hiptesis alternativa.
c.1.) Hiptesis nula (Ho): Es aquella que establece que el parmetro tienedeterminado valor y se formula con la intencin de rechazarla.
La hiptesis nula es una afirmacin que ser aceptada si los datos de la muestra nonos proveen de evidencia convincente de que es falsa, es decir, si se acepta lahiptesis nula decimos que la evidencia no es suficiente para rechazarla pero nopodemos afirmar que es verdadera.
c.2) Hiptesis alternativa: Es una hiptesis diferente a la hiptesis nula, es la quesuponemos que es verdadera y deseamos establecer. La hiptesis alterna es laafirmacin que se acepta si se rechaza la hiptesis nula. Esta hiptesis, tambinllamada hiptesis de investigacin. La hiptesis alterna es aceptada si la evidenciaproporcionada por la muestra es suficiente para afirmar que la Ho es falsa.
d) Tipos de errores: Al realizar una prueba de hiptesis no sabemos si en unadeterminada accin (rechazo o aceptacin de la hiptesis nula) cometemos un erroro no. Error Tipo I: Consiste en rechazar la hiptesis nula cuando es verdadera.
Error Tipo II: Consiste en aceptar la hiptesis nula cuando es falsa.
Si Ho es la hiptesis nula (sometida a prueba) y H1 es la hiptesis alternativa,entonces estas hiptesis junto con las dos posibilidades de decisin podemosesquematizarla en la siguiente tabla:
___________________________________________________________________________ 67Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
DECISINESTADO DE LA NATURALEZA
Ho verdadera Ho falsa
Aceptar Ho1 -
Decisin correcta
Error Tipo I
Rechazar Ho
Error Tipo I 1-
Decisin correcta
Es obvio quien toma las decisiones, quiere reducir al mximo las probabilidades decometer cualquiera de estos dos tipos de errores, esto no es fcil, pues lasprobabilidades de cometer error tipo I y II son inversamente proporcionales, paracualquier prueba dada. De ah que, cuanto menor es el riesgo de cometer un errortipo I, tanto mayor es la probabilidad de cometer un error tipo II y viceversa. Sinembargo dada la regla de decisin, es posible reducir ambos tipos de errores enforma simultnea, aumentando el tamao de la muestra.
e) Nivel de significacion (): Se denomina nivel de significacin de una prueba dehiptesis a la probabilidad de cometer un error tipo I.
El nivel de significancia es simbolizado por , y tambin es conocido como nivel deriesgo. Este ltimo trmino es ms apropiado porque es el riesgo que se toma derechazar una hiptesis verdadera.
= P[error tipo I] = P [Rechazar Ho / Ho es verdadera] = P[error tipo I] = P [Aceptar H1 / H1 es falsa]
No hay un nivel de significancia para todos los estudios, se puede utilizar cualquiervalor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de 0.05 es aplicado aproyectos de investigacin, el nivel 0.01 a control de calidad, y 0.10 a sondeospolticos. Usted como investigador debe decidir el nivel de significancia antes decolectar la muestra de datos.
Los niveles de significacin ms usados son: = 0.05 y 0.01. Estos dos nmerosson usados tan frecuentemente que cuando Ho es rechazada en = 0.05,podemos decir que el resultado es significativo y cuando Ho es rechazada en = 0.01, decimos que el resultado es altamente significativo.
___________________________________________________________________________ 68Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
NOTA: La probabilidad de cometer un error tipo II se representa por , es decir:
= P[error tipo II] = P[Aceptar Ho / Ho falsa] = P[error tipo II] = P[Rechazar H1 / H1 es verdadera]
fig. 16
R.A. : Regin de aceptacin.R.R. : Regin de rechazo.
f) Tipos de prueba: Prueba de cola izquierda: Si la regin de rechazo est a la izquierda del
punto crtico C.
fig. 17
___________________________________________________________________________ 69Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
R.A. R.R.C
1- 1-
R.R. C R.A.
1-
0f ( / H )q 1f ( / H )q
0f ( / H )q
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Prueba de cola derecha: Si la regin de rechazo est a la derecha del juntocrtico C.
fig. 18 Prueba bilateral: Si la regin de aceptacin es un intervalo cerrado entre los
puntos crtico C1 y C2.
fig. 19
g) Pasos de una prueba de hiptesis:1. Formulacin de la hiptesis nula y alternativa de acuerdo al problema.2. Especificacin del nivel de significacin.3. Seleccin de la estadstica de prueba.4. Establecimiento de los criterios de decisin.5. Realizacin de clculos.6. Decisin.
___________________________________________________________________________ 70Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
R.R.CR.A.
1-
R.A.C1/2
R.R./2
C2 R.R.
1-
0f ( / H )q
0f ( / H )q
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
3.3. PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONALLa media poblacional es un parmetro de decisin muy importante. Es de intersconocer si una media poblacional ha aumentado, disminuido o ha permanecidoinalterado, o tambin podemos estar interesados en determinar si una mediapoblacional es significativamente mayor o menor que un valor supuesto.
3.3.1. PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL USANDO LAESTADISTICA Z
CASO I: Uso de la estadstica Z.i) Muestra grande (n 30), varianza poblacional conocida, poblacin normal o no. ii) Muestra grande (n 30), varianza poblacional desconocida (2 s2) y poblacin
normal o no. iii) Muestra pequea (n < 30), varianza poblacional conocida y poblacin normal.
1. Formulacin de hiptesis: a) Ho: o b) Ho: o c) Ho: = o
H1: < o H1: > o H1: o
2. Nivel de significancia:
3. Estadstica de prueba:
Para i y iii
)1,0(nn/
xZ 0
Para ii
)1,0(nn/s
xZ 0
___________________________________________________________________________ 71Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
-
R.A.: Zk < Z1 - , se acepta HO.R.R.: Zk > Z1 - , se rechaza HO.
Z1-
1 -
0
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
4. Establecimiento de los criterios de decisin: Prueba de cola izquierda :
Prueba de cola derecha:
___________________________________________________________________________ 72Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
R.A.: ZK > - Z1- , se acepta HO. R.R.: ZK < - Z1- , se rechaza HO.
0-Z
1-
1-
R.R R.A.
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Prueba bilateral :
.
5. Clculos: Obtencin del valor experimental.
Para i y iii
n/x
Z 0k
Para ii
n/sxZ 0k
6. Decisin:Se compara el valor experimental con el valor crtico.Si Zk R.A., se acepta HO.Si Zk R.R., se rechaza HO.
___________________________________________________________________________ 73Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
R.A.: -Z1 /2 < Zk < Z1 - /2 ,se acepta H0.R.R.: Zk < -Z1 - /2 O Zk > Z1 /2 ,se rechaza H0.
/2/2
1-
R.R.R.A.R.R.0-Z1- /2 Z1- /2
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
NOTA: Si se tiene una poblacin finita de tamao N se corrige la estadsticade prueba de la siguiente manera:
a) Para i y iii: b) Para ii:
1NnN
n
xZ 0
1NnN
nsxZ 0
Ejemplo 30:El gerente de una empresa selecciona aleatoriamente entre sus trabajadores unamuestra de 169 y anota el nmero de horas de trabajo que cada uno de ellos haperdido por causa de accidentes laborales en el ao 2001. A partir de la informacinobtenida determina, en esos 169 trabajadores, un nmero medio de horas perdidaspor accidentes laborales en el 2007 de 36,5 horas y una desviacin estndar de 10horas.a) Podramos rechazar, con un nivel de significacin del 1% la hiptesis de que elnmero medio de horas perdidas a causa de accidentes laborales en esa empresadurante el ao 2007 fue de 35 horas?b) Y para un nivel de significacin del 5%?
Solucin: Utilizamos Caso I - iia) 1. Formulacin de la hiptesis :
H0 : = 35H1 : 35
2. Nivel de significancia : = 0.01
3. Estadstica de prueba:Anlisis: n=169
(n>30) Varianza poblacional desconocida (se obtiene a travs de la muestra)
___________________________________________________________________________ 74Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
x 36.5=
s 10=
2s 10 s 100= =
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Poblacin no normal Usar Estadstica Z Caso I - ii
4. Establecimiento de los criterios de decisin:
5. Clculos :
0k
x 36.5 35Z 1.95s / n 10 / 169
- m -= = =
6. Decisin :Zk=1.95
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
la dispersin que estaba establecida en 1.5 .us = por da Se debe efectuar elcambio tecnolgico. A un nivel de significancia del 5%.
Solucin: Utilizamos Caso I - ii1. Formulacin de la hiptesis:
H0 : = 45H1 : > 45
2. Nivel de significancia: = 0.05
3. Estadstica de prueba :Anlisis: n=35
(n>30) Varianza poblacional conocida.
=1.5 2= 2.25 Poblacin no normal Usar Estadstica Z Caso I - i
0xZ n(0,1)/ n- m
= s
4. Establecimiento de los criterios de decisin :
___________________________________________________________________________ 76Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
1.645
0.05
1 - =0.95
R.A.: ZK
< 1.645, se acepta HO.
R.R.: ZK
> 1.645, se rechaza HO.
0R.A. R.R.
x 46.5=
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
5. Clculos:
6. Decisin :ZK = 0.17 < 1.645, entonces aceptamos Ho.No se debe efectuar el cambio tecnolgico.
Ejemplo 32:Tiendas Metro, una cadena de tiendas de artculos de consumo extendida por todoel pas, afirmaba en Radio Programas del Per que no abren tienda en ningunalocalidad a menos que la renta media de la vecindad sea de 1200 dlares comomnimo. Una encuesta de 200 familias en una localidad determinada da una rentamedia de 1182 dlares, con una desviacin estndar de 157 dlares. Deben abrirla tienda si se cumplen todos los dems criterios de emplazamiento deseable a unnivel de significancia del 1%?
Solucin:1. Formulacin de la hiptesis:
H0 : 1200H1 : < 1200
2. Nivel de significancia : = 0.01
3. Estadstica de prueba:Anlisis: n=200
(n>30) Varianza poblacional desconocida (se obtiene a travs de la muestra)
Poblacin no normal Usar Estadstica Z Caso I - ii
0xZ n(0,1)s / n
- m=
___________________________________________________________________________ 77Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
0k
x 46.5 45Z 0.17/ n 1.5 / 35- m -
= = =s
x 1182=
s 157=
2s 157 s 24649= =
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
4. Establecimiento de los criterios de decisin:
5. Clculos:
6. Decisin:Zk = -1.62 > -2.326, entonces aceptamos Ho.La renta media de la vecindad es de 1200 dlares como mnimo.
3.3.2. PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL USANDO LACASO II: Uso de la estadstica t.La muestra es pequea (n< 30), varianza poblacional desconocida 2 2( s )s @ ypoblacin normal.
1. Formulacin de hiptesis estadstica:a) HO: o b) HO: o c) HO: = o
H1: < o H1: > o H1: o
2. Nivel de significancia:
3. Estadstica de prueba:
___________________________________________________________________________ 78Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
-2.326 = 0.01
R.A.: ZK -2.326, se acepta H
O.
R.R.: ZK
< -2.326, se rechaza HO.
1- = 0.99
0R.R.
R.A.
0k
x 1182 1200Z 1.62s / n 157 / 200
- m -= = = -
1n0 tn/s
xt
-
R.A.: tk < t
1-, n-1, se acepta H
o.
R.R.: tk > t1-, n-1, se rechaza Ho.
t1-, n-1
1 -
0
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Donde: (n-1) son los grados de libertad.
4. Establecimiento de los criterios de decisin:
Prueba de cola izquierda :
Prueba de cola derecha:
___________________________________________________________________________ 79Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
R.A.: tK > - t
1- , n-1, se acepta H
O.
R.R.: tK < - t1- , n-1, se rechaza HO.
0-t1-, n-1
1-
R.A.R.R..
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Prueba bilateral :
5. Clculos:
n/sx
t 0k
6. Decisin:Se compara el valor experimental con el valor crtico Si t k RA. , aceptamos Ho.Si t k R.R. , rechazamos Ho.
NOTA: Si se tiene una poblacin finita de tamao N se corrige laestadstica de prueba. As:
1NnN
nsxt 0k
___________________________________________________________________________ 80Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
1 /2,n 1t -a -- 1 / 2,n 1t -a -
R.A.: t1 - /2, n-1 < tk < t1 - /2, n-1 , se acepta HO . R.R.: tk < - t1 - /2, n-1 o tk > t1 - /2, n-1 , se rechaza HO.
/2/2
1-
R.A. R.R.R.R.
0
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Ejemplo 33:En una ciudad se quiere hacer un estudio rpido para valorar el consumo de aguaen los domicilios particulares durante los meses de mayor sequa. Para ello seseleccionaron al azar 15 domicilios y se midieron sus consumos en metros cbicosdurante el mes de agosto y su obtuvo un consumo medio muestral de 3m7.18x yuna desviacin estndar muestral de 3m6s . Se sabe adems que el consumo deagua se distribuye normalmente. En vista de estos datos. Hay suficiente evidenciaestadstica al nivel de 0.05, a favor de la hiptesis de que el consumo medio de losparticulares durante el mes de agosto es mayor que 18 m3?
Solucin:
1. Formulacin de la hiptesis: H0 : = 18 H1 : > 18
2. Nivel de significancia: = 0.05
3. Estadstica de prueba:Anlisis: n=15
(n
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
4. Establecimiento de los criterios de decisin:
5. Clculos:
0k
x 18.7 18t 0.45s / n 6 / 15
- m -= = =
6. Decisin:tk=0.45 < 1.761, entonces aceptamos Ho. El consumo medio de agua de losparticulares en el mes de agosto no es mayor de 18m3.
Ejemplo 34:Una Marca discogrfica preocupada por el creciente desarrollo de los Vendedoresinformales de msica en CD emprende una investigacin sobre esta variante de laEconoma informal, la Gerencia cree que mantienen una venta media de 50 CD`s enun fin de semana. Para realizar la investigacin se entrevistaron 20 vendedoresdesplegados en la Av. Abancay de la Ciudad de Lima, registrando el siguienteresultado:
Ventas de CD's (copias): 55 51 50 51 71 65 60 55 50 5059 50 77 76 53 57 66 72 46 47
Que tan cierta es la sospecha de la Gerencia, a un nivel de significancia del 5%?
___________________________________________________________________________ 82Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 2
R.A.: tk 1.761, se acepta H
O.
R.R.: tk > 1.761, se rechaza H
O.
1.761
=0.05
1 - = 0.95
0
R.A R.R
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Solucin: Caso II 1. Formulacin de Hiptesis :
H0 : = 50H1 : 50
2. Nivel de significancia : = 0.05
3. Estadstica de prueba :Anlisis:
n=20 (n 2.093, se acepta H
O.
-2.093 2.093=0.025 =0.025
1- =0.95
R.R R.A R.R
0
1n0 tn/s
xt
2s 9.64 s 92.93= =
19t t
x 58.55=
s 9.64=
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
5. Clculos :
6. Decisin: tk = 3.97 R.R., por lo tanto se rechaza Ho. No es cierta la sospecha delgerente, la venta media de CDs en el mercado informal es mayor.
Ejemplo 35:Para determinar el rendimiento anual de ciertos valores, un grupo deinversionistas tom una muestra de n =10 de esta clase de valores. La media ydesviacin estndar resultaron: . Se sabe adems que elrendimiento sigue una distribucin normal Existe evidencia para decir que elverdadero rendimiento anual promedio es igual o mayor 8.5%? con = 0.1?
Solucin:1. Formulacin de la hiptesis:
H0 : 8.5 H1 : < 8.5
2. Nivel de significancia : = 0.1
3. Estadstica de prueba:Anlisis: n=10
(n
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
4. Establecimiento de los criterios de decisin:
5. Clculos:
6. Decisin:Zk = -3.16
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
3.4. PRUEBA DE HIPOTESIS PARA LA PROPORCION POBLACIONAL3.4.1. INTRODUCCIONMuchas decisiones en el rea econmico financiero dependen de la proporcin oporcentaje de la poblacin que se ajusta a alguna caracterstica. Por ejemplo ungeente de una empresa puede estar interresado en conocer si el porcentaje detrabajadores que opinan que el clima laboral es el adecuado, un candidato polticopuede estar interesado en conocer si ms del 60% de la poblacin votara por el, losanalistas econmicos pueden estar interesados en conocer el porcentaje depersonas desempleadas en el pas, etc.Podran mencionarse muchos ejemplos msEl procedimiento para la prueba de hiptesis para la proporcin poblacional essimilar al sealado por la media poblacional.Se presentan los siguientes casos, en muestras grandes (n 30). CASO I: Poblacin infinita, cualquiera que sea el tipo de muestreo. Poblacin finita, si el muestreo es con reemplazamiento.
Pasos de una prueba de Hiptesis para la proporcin poblacional:
1. Formulacin de hiptesis estadstica:a) Ho: P P b) Ho: P Po c) Ho: P = Po
H1: P < Po H1: P > Po H1: P Po
2. Nivel de significancia:
3. Estadstica de prueba:
)1,0(n
nQPPpZ
00
0
___________________________________________________________________________ 86Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
R.A.: ZK > - Z1- , se acepta HO. R.R.: ZK < - Z1- , se rechaza HO.
0-Z
1-
1-
R.R R.A.
R.A.: Zk < Z1 - , se acepta HO.R.R.: Z
k > Z
1 - , se rechaza HO.
Z1-
1 -
0
R.A. R.R.
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
4. Establecimiento de los criterios de decisin: Prueba de cola izquierda :
Prueba de cola derecha:
___________________________________________________________________________ 87Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Prueba bilateral :
.
5. Realizacin de clculos:
6. Decisin
Se acepta o se rechaza Ho.
Caso II: Poblacin finita, cuando el muestreo es sin reemplazamiento.Se siguen todos los pasos del Caso I, pero se incorpora el factor de correccin parapoblacin finita, entonces la Estadstica de Prueba ser:
)1,0(n
1NnN
nQP
PpZ00
0
___________________________________________________________________________ 88Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
R.A.: -Z1 /2 < Zk < Z1 - /2 ,se acepta H0.R.R.: Zk < -Z1 - /2 O Zk > Z1 /2 ,se rechaza H0.
/2/2
1-
R.R.R.A.R.R.0-Z1- /2 Z1- /2
nQPPpZ
00
0k
-
R.A.: ZK > - 2.326 , se acepta HO.
R.R.: ZK < - 2.326 , se rechaza HO.
0-2.326
1- =0.99
R.R R.A.
=0.01
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Ejemplo 36:Usted ha estado trabajando para una empresa de publicidad en Lima durante 5aos. Ahora usted est planeado iniciar su propia compaa, pero teme perdermuchos clientes. Usted decide irse, slo si por lo menos el 30% de las cuentas queusted maneja se irn con usted y le seguirn a su nuevo negocio. Como prueba,usted descubre que 14 de las 54 cuentas que tom como muestra expresan sudeseo de irse con usted si deja la compaa. A un nivel de significancia del 5%Debera usted comenzar su propia empresa?
Solucin:1. Formulacin de hiptesis estadstica:
Ho : P 0.3H1 : P < 0.3
2. Nivel de significancia: = 0.01
3. Estadstica de prueba:
)1,0(n
nQPPpZ
00
0
4. Establecimiento de los criterios de decisin:
___________________________________________________________________________ 89Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
5. Realizacin de clculos: x: Nmero de cllientes de la muestra que prefieren irse con la otra compaia=14n: Nmero de clientes de la muestra que hay en cartera = 54
Donde:
Adems:
6. Decisin:Zk = -0.64 > -2.326; por lo tanto se acepta Ho. Si debera comenzar mi propiacompaia.
Ejemplo 37:Preocupados por la opinin que los ciudadanos tienen sobre la evolucin econmicadel pas, el gobierno ha realizado una encuesta sobre 1000 de sus ciudadanos,obteniendo que solo 80 de ellos afirman que la evolucin econmica es buena. Si elgobierno afirmara que el 11.5% de la poblacin opina que la situacin econmica esbuena Es compatible esta afirmacin con el resultado muestral obtenido para unasignificacin del 5%?
Solucin:1. Formulacin de hiptesis estadstica:
Ho: P = 0.115H1: P 0.115
___________________________________________________________________________ 90Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
o oP 0.3 Q 0.3= =
0k
0 0
p P 0.26 0.3Z 0.64P Q 0.3 0.7
n 54
- -= = = -
xpn14p 0.2654
=
= =
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
2. Nivel de significacin: = 0.01
3. Estadstica de prueba:
)1,0(n
nQPPpZ
00
0
4. Establecimiento de los criterios de decisin:
5. Realizacin de clculos:x: Nmero de personas en la muestra que afirman que la evolucin econmica
es buena = 80n: Nmero de personas de la muestra encuestadas = 1000
Donde:
Adems:
___________________________________________________________________________ 91Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
R.A.: -2.576 < Zk < 2.576 ,se acepta H0.R.R.: Zk < -2.576 O Zk > 2.576 ,se rechaza H0.
/2/2
1- = 0.99
R.R.R.A.R.R.0-2.576 2.576
0.05 0.05
xpn80p 0.08
1000
=
= =
o oP 0.115 Q 0.885= =
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
6. Decisin: Zk = -3.5 RR; por lo tanto se rechaza Ho. No es compatible la afirmacin con elresultado de la muestra obtenido. El porcentaje de personas que opinan que laevolucin econmica es buena es diferente de 11.5%.
Ejemplo 38:Su empresa ha determinado en el pasado que exactamente el 53% de las personasque estn en su rea de mercado prefieren su producto. Se invierten en varios milesde dlares en un programa publicitario para incrementar su participacin en elmercado. Luego una muestra de 600 personas revela que 400 prefieren su producto.A un nivel de significancia del 5%. El dinero fue bien invertido?
1. Formulacin de la hiptesis:H0 : P = 0.53H1 : P > 0.53
2. Nivel de significancia: = 0.05
3. Estadstica de prueba :
)1,0(n
nQPPpZ
00
0
___________________________________________________________________________ 92Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
0k
0 0
p P 0.08 0.115Z 3.5P Q 0.115 0.885
n 1000
- -= = = -
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
4. Establecimiento de los criterios de decisin :
5. Clculos:
x: Nmero de personas de la muestra que prefieren el producto = 300n: Nmero de personas de la muestra = 600
Donde:xpn400p 0.67600
=
= =
Adems:
o oP 0.53 Q 0.47= =
0k
0 0
p P 0.67 0.53Z 7P Q 0.53 0.47
n 600
- -= = =
6. Decisin :ZK = 7>1.645, entonces rechazamos Ho. El dinerio fu bien invertido.
___________________________________________________________________________ 93Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
1.645
0.05
1 - =0.95
R.A.: ZK
< 1.645, se acepta HO.
R.R.: ZK
> 1.645, se rechaza HO.
0R.A. R.R.
-
R.A.: Zk < 1.96 , se acepta HO.
R.R.: Zk > 1.96 , se rechaza HO.
1.96=0.05
1 - =0.95
0
R.A. R.R.
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
Ejemplo 39:El contador de Tiendas La Positiva afirma que es 5% el porcentaje de clientesmorosos. Para comprobar esta hiptesis el gerente seleccion una muestra aleatoriade 40 observaciones y encontr que el porcentaje muestral de clientes morosos esdel 10% . En el nivel de significacin de 0.05.a) Plantee las hiptesis adecuadas.b) Cul es su decisin respecto a la afirmacin del fabricante?
Solucin:a) Ho : P = 0.05
H1 : P > 0.05
b) Cul es su decisin respecto a la afirmacin del fabricante?1. Formulacin de hiptesis estadstica:
Ho : P = 0.05H1 : P > 0.05
2. Nivel de significancia: = 0.05
3. Estadstica de prueba:
4. Establecimiento de los criterios de decisin:
___________________________________________________________________________ 94Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
0
0 0
p PZ n(0,1)P Q
n
-=
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERENCIAL
5. Realizacin de clculos: p: proporcin de clientes morosos en la muestra = 0.10n: Nmero de clientes de la muestra = 40Adems:
6. Decisin:Zk = 1.67 RA; por lo tanto se acepta Ho. El contador est diciendo la verdad.
___________________________________________________________________________ 95Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
95.0Q05.0P oo
0k
0 0
p P 0.1 0.05Z 1.67P Q 0.05 0.95
n 40
- -= = =
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
3.5. PRUEBA DE INDEPENDENCIA CHI CUADRADO3.5.1. INTRODUCCIONLa prueba de independencia chi cuadrado es un procedimiento de contrastacin quese utiliza para determinar la independencia o relacin entre dos variablescategricas., como por ejemplo el nivel educativo y el nivel de consumo de Internetde las personas, el rendimiento acadmico y el nivel socioeconmico de laspersonas, marca de computadoras y el precio, etc.
3.5.2. CONTRASTACION DE HIPOTESISPasos a seguir:1. Formulacin de Hiptesis:H0 : No existe relacin entre las categoras.H1 : Existe relacin entre las categoras.
2. Nivel de signficancia:
3. Estadstica de prueba:
Donde: )1k()1r(v grados de libertad.r = Nmero de filas.k = Nmero de columnas.4. Establecimiento de los criterios de decisin:
___________________________________________________________________________ 96Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
r
1i
2v
k
1j ij
2ijij2 X
e)ef(
X
1
2,1 v X
0
R.A. R.R.
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
Si 2 v,12o XX ; se acepta Ho.
Si 2 v,12o XX ; se rechaza Ho.
5. Clculos:
6. Decisin:Se acepta o rechaza Ho.
Ejemplo 40:Se ha realizado una encuesta en una ciudad con objeto de estudiar las posiblesrelaciones entre el nivel educativo de las personas y el nivel de consumo de Internet.Los resultados para 1509 personas seleccionadas al azar han sido:
Niveleducativo
Nivel de consumoBajo Medio Alto Total
Superior 31 200 600 831Secundaria 28 100 400 528
Primaria 50 50 50 150Total 109 350 1050 1509
Determinar si el nivel educativo y el nivel de consumo de Internet de las personas serelacionan. Use =0.05Solucin:1. Formulacin de Hiptesis:H0 : No existe relacin entre el nivel educativo y el nivel de consumo de Internet delas personas.H1 : Existe relacin entre el nivel educativo y el nivel de consumo de Internet de laspersonas.
2. Nivel de signficancia: = 0.05
3. Estadstica de prueba:
___________________________________________________________________________ 97Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
2r kij ij2
ki 1 j 1 ij
(f e )X
e= =
-=
3
1i
22
3
1j ij
2ijij2 X
e)ef(
X
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
Donde: r = 3 y k = 3; entonces v = (3-1) x (3-1) = 4 grados de libertad.
4. Establecimiento de los criterios de decisin:
R.A.: Si 49.9X2o ; se acepta Ho.R.R.: Si ; se rechaza Ho.
5. Clculos:Hallando los valores esperados eij:
Nivel educativo Nivel de consumoBajo Medio Alto fi.
Superiore11=60 e12=193 e13=578
f11=31 f12 =200 f13 =600f1. = 831
Secundariae21=38 e22=122 e23=367
f21=28 f22 =100 f23=400 f2.= 528
Primariae31=11 e32=35 e33=104
f31=50 f32= 50 f33= 50f3. =150
Total f.1 =109 f2. =350 f3. =1050 n=1509Hallando el valor experimental 20X :
___________________________________________________________________________ 98Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
1 - = 0.9505.0
9.49 0
R.A. R.R.
nff
e j..iij
601509
109831n
ffe 1..111
1931509
350831n
ffe 2..112
5781509
1050831n
ffe 3..113
381509
109528n
ffe 1..221
1221509350528
nffe 2..222
3. .131
f f 150 109e 11n 1509
= = = 351509350150
nff
e 2..332
10415091050150
nff
e 3...333
3671509
1050528n
ffe 3..223
49.9X2o
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
6. Decisin: ; por lo tanto rechazamos H0.
En nivel educativo y el nivel de consumo de Internet de las personas se relacionan.
Ejemplo 41:Para introducir cierto producto en el mercado, una empresa desea conocer comoseria aceptado por los posibles compradores, para ello se ha obtenido una muestraaleatoria de 2200 consumidores habituales de esa lnea de productos, a los que seles pregunta por su edad y por el grado de aceptacin del producto a introducir en elmercado, el resultado se recoge en la tabla siguiente:
OpininEdad en aos
20 - 34 35 - 59 60 a ms TotalFavorable 500 200 100 800
Desfavorable 300 600 500 1400Total 800 800 600 2200
Determinar si existe relacin entre la edad y la opinin sobre la aceptacin del producto, de los consumidores, con = 0.05.
Solucin:1. Formulacin de Hiptesis:H0 : No existe relacin entre la edad de las personas y la opinin sobre la
aceptacin del producto, de los consumidores.H1 : Existe relacin entre la edad de las personas y la opinin sobre la aceptacin
del producto, de los consumidores.
2. Nivel de signficancia: = 0.05
___________________________________________________________________________ 99Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
104)10450(
35)3550(
11)1150(
367)367400(
122)122100(
38)3828(
578)578600(
193)193200(
60)6031(X
2222
2222220
2863813431014X20
197X20
49.9197X20
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
3. Estadstica de prueba:
Donde: r = 2 y k = 3; entonces v = (2-1) x (3-1) = 2 grados de libertad.
4. Establecimiento de los criterios de decisin:
R.A.: Si ; se acepta Ho.R.R. Si ; se rechaza Ho.
5. Clculos:Hallando los valores esperados eij:
OpininEdad en aos
20 - 34 35 - 59 60 a ms fi. Favorable e11=291 e12=291 e13=218
f11=500 f12=200 f13=100f1. = 800
Desfavorable e21=509 e22=509 e23=381f21=300 f22=600 f23=500
f2.= 1400
Total 109 350 1050 2200
Hallando el valor experimental 20X :
___________________________________________________________________________ 100Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
1 - = 0.9505.0
5.99 0
R.A. R.R.
22 3ij ij2 2
2i 1 j 1 ij
(f e )X X
e= =-
=
nff
e j..iij
1. .111
f f 800 800e 291n 2200
= = = 1. .212f f 800 800e 291
n 1200
= = = 1. .313f f 800 600e 218
n 2200
= = =
2. .121
f f 1400 800e 509n 2200
= = = 2. .222f f 1400 800e 509
n 2200 = = =
2. .323
f f 1400 600e 381n 2200
= = =
2oX 5.992oX 5.99>
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
3.5.3. COEFICIENTE DE CONTINGENCIA CHI CUADRADO
El coeficiente de contingencia chi cuadrado o coeficiente de contigencia C dePearson: Es una medida estadstica que se utiliza para medir el grado de relacin oasociacin entre dos variables categricas. Su valor vara entre 0 y 1, perodifcilmente llega a 1. C no tiene a 1 como lmite superior (LS), su lmite superior oCmax se relaciona con el nmero de categoras. Para una tabla superior construida
con igual nmero de filas y columnas el lmite superior es k
1k . De este modo
para una tabla 3 x 3 el lmite superior es 2/3 = 0.82; para una tabla 4 x 4, 3/4 = 0.87, etc. Cuando el nmero de columnasy filas difiere, por ejemplo, 3 x 4 el lmite superior de C se deduce con un valor kigual nmero ms pequeo.
El coeficiente de contingencia se expresa as:
20
20
XCn X
=+
___________________________________________________________________________ 101Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
Si C > 0.30 se considera que es adecuado
2 2 2 2 2 220
(500 291) (200 291) (100 218) (300 509) (600 509) (500 381)X291 291 218 509 509 381- - - - - -
= + + + + +
20X 150 28 64 86 16 37= + + + + +
20X 381=
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
Ejemplo 42: Calculando el coeficiente C de Pearson para el Ejemplo 40:
197C 0.34197 1509
= =+
C = 0.34 > 0.3 es adecuado.
El valor mximo que puede tomar C en este caso es:
82.032
313
k1k
Grficamente podemos observar :
0 C= 0.34 0.41 0.82
En conclusin el grado de asociacin entre el nivel educativo y el nivel de consumode internet de las personas es adecuado.
Ejemplo 43: Calculando el coeficiente C de Pearson para el Ejemplo 41:
381C 0.38381 2200
= =+
C = 0.38 > 0.3 es adecuado.
El valor mximo que puede tomar C en este caso es:
82.032
313
k1k
Grficamente podemos observar :
___________________________________________________________________________ 102Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
0 C= 0.38 0.41 0.82
En conclusin el grado de asociacin entre la edad y la opinin sobre la aceptacinde los productos, de los consumidores es adecuado.
AUTOEVALUACIN 03
1. En un artculo de la revista Caretas, se debata la creciente tendencia a que losempleados demanden a sus empresas por incumplir las promesas en relacin conlos beneficios sanitarios propuestos y conclua, que el juicio medio se entablaba por100000 dlares. Cuarenta y dos juicios dieron una media de 115000 dlares. Si sesupone una desviacin estndar de 10000 dlares. Est respaldada la hiptesis alnivel de significacin del 1%?
2. Las puntuaciones en un test que mide la variable creatividad siguen, en lapoblacin general de adolescentes, una distribucin Normal de media 11,5. En uncentro escolar que ha implantado un programa de estimulacin de la creatividad unamuestra de 30 alumnos ha proporcionado las siguientes puntuaciones: 11, 9, 12, 17,8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.A un nivel de confianza del 95% Puede afirmarse que el programa es efectivo?
3. Cierta marca de focos (bombillas) son anunciados con una vida de 750 horas. Suprecio es bastante asequible por lo que el cliente potencial ha estado evaluando sucompra, previo convenio de compra, y solo dar marcha atrs a su decisin sise demuestra en forma concluyente que la vida real promedio es menor a laanunciada. Se seleccion una muestra aleatoria de 50 focos y se determin que lavida media es de 738.44 horas con una desviacin estndar de 38.20 horas Quconclusin seria la adecuada con un nivel de significacin del 5%?.
4. El gerente de ventas de una compaa afirma que sus vendedores vendensemanalmente en promedio $ 1,500. Al nivel de significacin del 5% pruebe lahiptesis del gerente versus la hiptesis del presidente de los vendedores que afirma
___________________________________________________________________________ 103Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
que el promedio de las ventas semanales es mayor, si una muestra de 36vendedores ha dada una media igual $1510 y una varianza igual a 900$2 en unasemana.
5. En una agencia de viajes por experiencia se conoce que el porcentaje depersonas que viajan a Europa es del 44%. Sin embargo, de los primeros 100pasajeros de este ao, 46 han viajado a Europa. Ha cambiado el porcentaje esteao a un nivel de significancia del 5%?
6. Un artculo publicado en Fortune afirma que casi la mitad de todos los contadorescontinan sus estudios acadmicos despus de obtener la licenciatura. Un artculopublicado en Accounting Horizons indica que 150 de 500 recin graduados planeancontinuar sus estudios. Los datos publicados en Accounting Horizons sonconsistentes con los publicados en Fortune con =0.05?
7. La cantidad de huspedes que debe a un hotel para que ste sea rentable debeser en promedio de 200 al mes (o ms). Se estudiaron hoteles similares en la zona,registrando los 365 das del ao se detect que tienen una demanda promedio de195 personas al mes aproximadamente, con una desviacin estndar de 5 personas.Con un nivel de significancia de 0.01 determine la veracidad para la hiptesisplanteada.
8. Tradicionalmente el 35% de todos los crditos otorgados por el Banco de Crditodel Per han sido para los grupos minoritarios. Durante el ao pasado, el banco hahecho esfuerzos para incrementar su proporcin. De 150 crditos actualmente encurso, 56 estn identificados claramente por haber sido otorgados a las minoras.El banco ha tenido xito por atraer ms clientes de la minora? Pruebe la hiptesisa un nivel de significancia del 5%.
9. Un poltico supone que menos del 60% de los votos de su territorio sonfavorables. Con el fin de verificar su conjetura selecciona una muestra representativacompuesta de 200 votantes y aplica una encuesta, obtenindose 100 respuestas asu favor. Probar que estos resultados confirman la creencia del poltico, es decir quelos votos favorables de su territorio son menos del 60%. Use = 0.05.
___________________________________________________________________________ 104Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA -INFERENCIAL
10.Se les pregunta a 500 personas con empleo cul es su opinin, es el problemams acuciante en Espaa, obtenindose el siguiente resultado:
OcupacinLaboral
Problema que ms preocupaTotalParo Dficit
Asalariados 236 86 322Profesionales
Libres53 125 178
Total 289 211 500
a) Determinar si existe relacin entre la ocupacin laboral y el problema que mspreocupa. Use 0.05a =b) Hallar e interpretar el coeficiente de contingencia chi cuadrado.
11.La siguiente tabla corresponde a una muestra aleatoria de 850 clientes delBanco de Crdito del Per que opinan sobre la evaluacin de la calidad de losservicios y la calificacin de la oportunidad de los servicios:
Evaluacin de lacalidad de los
servicios
Calificacin de oportunidad de losservicios Total
Oportuna DemoradaBuena 300 50 350
Regular 200 50 250Mala 100 150 250Total 600 250 850
a) Determinar si la evaluacin de la calidad y calificacin oportuna de los serviciosse relacionan. Use = 0.05b) Calcular e interpretar el coeficiente de contingencia chi cuadrado.
___________________________________________________________________________ 105Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL
CAPITULO IV
REGRESIN Y CORRELACIN LINEAL SIMPLE
4.1. REGRESIN LINEAL SIMPLE4.1.1. INTRODUCCINCuando se estudian dos caractersticas simultneamente sobre una muestra, sepuede considerar que una de ellas influye sobre la otra de alguna manera. Elobjetivo principal de la regresin es descubrir el modo en que se relacionan
Por ejemplo, en una tabla de ingresos semanales y consumos semanales en solesde 10 familias se puede suponer que la variable ingresos semanales influye sobrela variable consumos semanales en el sentido de que cosnumos semanales altosvienen explicados por valores altos de ingresos semanales. De las dos variables aestudiar, que vamos a denotar con X e Y, vamos a llamar a la X VARIABLEINDEPENDIENTE o EXPLICATIVA, y a la otra, Y, le llamaremos VARIABLEDEPENDIENTE o EXPLICADA.
En la mayora de los casos la relacin entre las variables es mutua, y es difcil saberqu variable influye sobre la otra. El ejemplo dado es un ejemplo claro dondedistinguir entre variable explicativa y explicada . En este caso un ingreso semanalbajo tender a tener un consumo semanal bajo, y un ingreso alto indicar tal vezque las familias tienen un consumo semanal alto. Sin embargo, a la hora dedeterminar qu variable explica a la otra, est claro que el ingreso semanal explicala consumo semanal y no al contrario, pues las familias primero obtienen susingresos semanales, y luego consumen semanalmente. Por tanto, X = ingresossemanales (variable explicativa o independiente) Y = consumos semanales (variableexplicada o dependiente) El problema de encontrar una relacin funcional entre dosvariables es muy complejo, ya que existen infinidad de funciones de formas distintas.El caso ms sencillo de relacin entre dos variables es la relacin LINEAL, es decirque (es la ecuacin de una recta) donde son nmeros, que esel caso al que nos vamos a limitar.
Cabe recalcar la regresin estudia la mejor relacin funcional entre las variabledependiente y una o un conjunto de variables independientes o explicativas.
___________________________________________________________________________ 106Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
0 1 y x 0 1 yb b
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL
4.1.2. DEFINICIN Una funcin de regresin es lineal simple cuando las variaciones en la variableindependiente provocan variaciones proporcionales en la variable dependiente. Y = f (X)Donde: Y : Variable dependiente X : Variable independiente
Por ejemplo: Podemos estar interesados en predecir el consumo promedio de unconjunto de familias en base al ingreso de las mismas.
Entonces: Y: Consumo ; X : Ingreso
Hacer anlisis de regresin lineal simple consiste en estimar la funcin de regresinpoblacional (F.R.P.) que responde a la siguiente expresin:
F.R.P. : Yi = 0 + 1 Xi + Ei ..................... (1)
Donde:Y : Variable dependienteX : Variable independiente0: Intercepto1: Coeficiente pendienteEi : Error aleatorio.
Con base en la funcin de regresin muestral (F.R.M.)
F.R.M. .............................. (2)
4.1.3. ELECCIN DE UNA RELACIN FUNCIONALAc veremos el tipo de funcin matemtica que mejor ha de representar ladependencia entre las variables, dos son los mtodos empleados:a) Una consideracin analtica del fenmeno que nos ocupa (estudios anteriores).b) Un examen del diagrama de dispersin en forma grfica de los datos observados,en esta forma es fcil tener una idea si existe o no existe regresin, si es lineal ocurvilnea, esto puede permitir ahorrar tiempo y dinero, evitando trabajos estriles.Ver fig. 20.
___________________________________________________________________________ 107Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
i 0 1 i i y x e= b +b +
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL
Diagrama de dispersin
fig. 20
4. EL MTODO DE LOS MNIMOS CUADRADOS ORDINARIOS (M.C.O)El mtodo de los mnimos cuadrados ordinarios brinda los siguientes coeficientes de regresin estimados:
...........................(8)
............................(9)
4.1. Caracteristicas de los coeficientes de regresion estimados Son expresados nicamente en trminos de cantidades observables. Son estimadores puntuales, es decir dada la muestra cada estimador
proporcionar un solo valor del parmetro poblacional relevante.
4.2. Interpretacion de los coeficientes de regresion estimados : Es el efecto medio o promedio sobre la variable dependiente de todas
las variables omitidas en el modelo de regresin.
: Es el promedio de los incrementos de y debido a los aumentos unitarios de x o es el promedio de las disminuciones de y debido a los aumentos unitarios de x.
___________________________________________________________________________ 108Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
0b
1b
( )i i i i
1 22i i
n( x y ) ( x )( y )n x x
-b =
-
0 1 y xb = -b
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL
fig. 21
4.3. Coeficiente de determinacin: r2
Consideremos ahora la bondad de ajuste de la lnea de regresin ajustada alconjunto de datos.
fig. 22De la fig. 22 se desprende claramente que si todas las observaciones coinciden conla lnea de regresin, obtendramos el ajuste perfecto lo que raras veces ocurre.Generalmente tiende a haber algunas ei positivos (encima de la lnea de regresin)y ei negativos (debajo de la lnea de regresin) con la esperanza de que los errosaleatorios localizados alrededor de la lnea de regresin sean los ms pequeosposibles.
El Coeficiente de Determinacin (r2) es una medida resumen que nos dice que tanexactamente la lnea de regresin estimada se ajusta a los datos observados.
___________________________________________________________________________ 109Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL
El coeficiente de determinacin se expresa de la siguiente manera:
El coeficiente de determinacin muestral es ampliamente utilizado como una medidade la bondad de ajuste de una lnea de regresin. Es decir el r2 mide la proporcino porcentaje de la variacin de la variacin total en y explicada por el modelode regresin.Sus propiedades son:1. Es una cantidad positiva2. Sus lmites son: 0 r2 1
* Si r2 = 1, quiere decir que el ajuste es perfecto.* Si r2 = 0, quiere decir que no hay relacin entre la variable dependiente y la variable independiente.
3. Cunto ms se acerca r2 a 1, tanto ms alto ser el grado de linealidad entre lasvariables.
4. Si r2 0.75 hay seguridad en las predicciones con la ecuacin de regresin linealestimada.
Ejemplo 44:Se desea estudiar la posible relacin entre los gastos mensuales en materialinformtico (Y) y los ingresos globales mensuales (X) en soles de una empresa,para ello se recoge una muestra aleatoria de 6 datos, los cuales se adjuntan en lasiguiente tabla:
Ingresos globales (X)
Gastos en materialinformtico
(Y)200 2500500 3500
1000 45002000 55003000 65005000 8500
Se pide:a) Graficar el diagrama de dispersin de las variables dadas y comentar. b) Estimar la lnea de regresin de los gastos en material informtico sobre los
ingresos globales.
___________________________________________________________________________ 110Elaborado por : Mg. Carmen Barreto R.Fecha : Agosto 2013Versin : 3
( )( )( ) ( )
2
22 22 2
n xy x yr
[n x x ][n y y ]
- =- -
-
Universidad Los ngeles de Chimbote ESTADSTICA APLICADA - INFERNCIAL
c) Graficar la lnea de regresin estimada sobre el diagrama de dispersin. d) Interpretar el coeficiente