INTERVALOS DE CONFIANZA - Campus Virtual · VV 12. INTERVALOS DE C ... D D nn PP ªº r «» ¬¼...
Transcript of INTERVALOS DE CONFIANZA - Campus Virtual · VV 12. INTERVALOS DE C ... D D nn PP ªº r «» ¬¼...
INTERVALOS DE CONFIANZA
INTERVALOS DE CONFIANZA
Dado que los estimadores puntuales pocas veces serán
iguales a los parámetros que se desean estimar, es posible
darse mayor libertad utilizando estimadores por intervalos
que reciben el nombre de intervalos de confianza.
Definición:
Un intervalo de confianza es un intervalo estimado en el cual
se espera que se encuentre el valor del parámetro θ con una
determinada confianza.
Limite Inferior Limite Superior
CANTIDAD PIVOTAL
Un método muy útil para encontrar intervalos de confianza
se llama método del pivote. Éste consiste en determinar una
cantidad que posea las dos características siguientes:
1. Que sea una función de las medidas muestrales y el
parámetro desconocido θ, donde θ sea la única cantidad
desconocida.
2. Que su distribución de probabilidad no dependa del
parámetro θ.
Si se conoce la distribución de probabilidad de una cantidad
pivotal, se puede usar operaciones algebraicas para formar la
estimación por intervalos que se desea.
EJEMPLO
Suponga que tenemos una sola observación Y de una
distribución exponencial con media θ. Use Y para construir
un intervalo de confianza para θ con un coeficiente de
confianza del 90%.
La función de densidad de probabilidad para Y está dada por
La anterior función se puede transformar en:
donde es una función de Y y θ, y la distribución de
U no depende de θ. Por tanto, podemos emplear a U como
cantidad pivote.
1
, 0y
f y e y
, u 0u
Uf u e
U Y
EJEMPLO
La función de densidad de U aparece graficada
anteriormente. Se busca un estimador de intervalo con
coeficiente de confianza igual al 90%, encontrando dos
números a y b tales que:
0.9P a U b
EJEMPLO
Una forma elegir a y b es:
Estas dos ecuaciones dan como resultado:
Por consiguiente:
Las cantidades encontradas forman los limites de confianza
inferior y superior que se estaban buscando.
0
0.05 y 0.05
a
u u
b
P U a e du P U b e du
1 0.05 y 0.05 0.051 , 2.996a be e a b
0.051 2.996 0.051 2.996 0.9
0.92.996 0.051
YP U P
Y YP
INTERVALOS DE CONFIANZA PARA µ Y µ1-µ2
Los intervalos de confianza para la media están basados en
la suposición de que la muestra se ha seleccionado
aleatoriamente de una distribución Normal.
Casi nunca conoceremos la forma de la distribución
poblacional antes de muestrear, pero un estimador de
intervalo deberá funcionar razonablemente bien aun cuando
la población no sea Normal y el tamaño de muestra no sea lo
suficientemente grande, mientras la desviación no sea
excesiva.
INTERVALOS DE CONFIANZA PARA µ
Sea X una variable aleatoria con distribución N(µ,σ), donde
se esta interesado en la estimación del parámetro µ por
medio de un intervalo de confianza. Se pueden tener dos
casos, dependiendo si se conoce o no la varianza σ2.
Si σ2 es conocida, el desarrollo general para el intervalo es la
siguiente:
Se toma una muestra aleatoria {X1, X2,..Xn}, como X~N(µ,σ)
entonces Xi~N(µ,σ), por lo tanto:
Además conocemos la cantidad pivotal:
~ ,X Nn
~ 0,1X
Z Nn
INTERVALOS DE CONFIANZA PARA µ
Se define el nivel (1-α)% de confianza que se desea.
Ahora se debe encontrar valores de Z tales que:
Si X es Normal entonces Z se distribuye N(0,1), pero en esta
transformación la única v.a. es la media muestral, ya que µ y
σ son constantes, pero en el caso de que no se conozca σ2 se
puede estimar su valor a través del estimador insesgado S2 y
definir como cantidad pivotal a
2 2 2 2
1 %2 2 2
1 1
1
XP z Z z P z z
n
P X z X z IC X zn n n
?X
S n
INTERVALOS DE CONFIANZA PARA µ
Debe tenerse en cuenta que el estimador S2 es una variable
aleatoria y por lo tanto ya no tiene distribución Normal
La distribución probabilística de esta transformación es
conocida y no depende del parámetro µ que se desea estimar;
esto hace que sea una cantidad pivotal que se
puede utilizar cuando no se conoce la varianza de la población.
X
S n
XT
S n
INTERVALOS DE CONFIANZA PARA µ
Sea {X1, X2,..Xn} una muestra aleatoria extraída de una
población normal con media poblacional µ y varianza σ2
desconocidas, entonces la variable aleatoria:
La cantidad T sirve como cantidad pivotal para formar un
intervalo de confianza para µ, donde:
~ con -1 gl/
XT t n
S n
2 2
1 %2
1P t T t
SIC X t
n
Recuerde: Cuando “n es grande” es posible utilizar la distribución
normal
INTERVALOS DE CONFIANZA PARA µ1-µ2
Si se esta interesado en comparar las medias de dos
poblaciones normales cuando se conocen las varianzas de
cada población, su intervalo de confianza viene definido por:
“Aplica también para variables no normales siempre y
cuando los tamaños muestrales n1 y n2 sean relativamente
grandes (TLC)”
2 2
1 21 2 1 21 %
21 2
IC X X zn n
INTERVALOS DE CONFIANZA PARA µ1-µ2
Si se esta interesado en comparar las medias de dos
poblaciones normales cuando el tamaño de muestra es
pequeño y las varianzas de cada población son desconocidas,
su intervalo de confianza viene definido por:
donde:
Para construir este intervalo se requiere la suposición de que
las muestras sean independientes y que
1 21 2 1 21 % ; 2
21 2
1 1* pn n
IC X X t Sn n
2
*)1(*)1(
21
2
22
2
11
nn
SnSnS p
2 2
1 2
INTERVALOS DE CONFIANZA PARA µ1-µ2
En el caso donde las varianzas sean diferentes , el
intervalo de confianza para la diferencia de medias estará
dado por:
donde:
1 2 1 21 % ;2
1 2
1 1* pv
IC X X t Sn n
2 2
1 2
1
22 2
1 2
1 2
2 2 2 21 2 2
1 2
( ) ( )
1 1
S S
n nv
S n S n
n n
EJEMPLO
Los Directivos de una universidad afirman que las calificaciones
del SAT para estudiantes de preparatoria difieren dependiendo del
campo de estudio futuro de los estudiantes. Quince estudiantes que
deseaban especializarse en ingeniería se compararon con 15
estudiantes que deseaban especializarse en idiomas. En la
siguiente tabla se dan las medias y desviaciones de las
calificaciones de la parte verbal y de matemáticas de los exámenes
SAT para los dos grupos de estudiantes:
a) Usted que opina acerca de la afirmación que tienen las
directivas de esta Universidad?
b) Que suposiciones son necesarias para que sean validos los
métodos empleados previamente?
Verbal Matemáticas
Ingeniería
Idiomas
446 42y s
534 45y s
548 57y s
517 52y s
EJEMPLO
Suponga que se requiere evaluar la efectividad de una dieta,
para lo cual se han sometido 8 pacientes durante 5 semanas,
observando su peso al inicio y al final del tratamiento. Con
los resultados que se observan en la siguiente tabla,
considera usted que la dieta es efectiva?
Individuo Inicio Final Diferencia
1 78 74 4
2 79 76 3
3 75 74 1
4 66 69 -3
5 63 58 5
6 70 71 -1
7 66 66 0
8 67 65 2
INTERVALO DE CONFIANZA PARA OBSERVACIONES
PAREADAS
Si y Sd son la media y la desviación estándar muestral de
las diferencias observadas entre n pares de mediciones
aleatorias, y si estas diferencias siguen una distribución
normal, entonces un intervalo de confianza del (1-α)% para
puede obtenerse mediante:
d
1 2D
1; 1;2 2
1;1 %2
1
d dn D n
dD n
s sP d t d t
n n
sIC d t
n
INTERVALO DE CONFIANZA PARA LA VARIANZA
La varianza poblacional σ2 cuantifica la cantidad de
variabilidad existente en la población. Muchas veces el valor
real de σ2 es desconocido y debe calcularse. Una de las
maneras de estimar este parámetro es mediante un
intervalo al (1-α)% de confianza a partir de una muestra
aleatoria.
La variable aleatoria se distribuye Chi-cuadrado con
(n-1) grados de libertad. Como se puede observar, aunque la
función depende de σ2, su distribución no depende de este
parámetro, lo cual indica que es una cantidad pivotal,
con la cual se pueden construir intervalos de confianza.
2
2
1n S
2
1n
2
2
1n S
INTERVALO DE CONFIANZA PARA LA VARIANZA
Para construir el intervalo de confianza se deben encontrar
valores tales que:
Como la distribución Chi-cuadrado no es simétrica y la
variable solo asume valores no negativos, se debe encontrar
un par de valores (entre muchos posibles) que satisfaga la
anterior expresión, por ejemplo pueden encontrarse valores
tales que:
De alli que un intervalo al (1-α)% de confianza para σ2 es:
2 2 2
1 211
nP
2 2 2 2
1 21 1 y 1
2 2n n
P P
2 2
2
2 21 %2 1
1 1,
n S n SIC
EJEMPLO
Un experimentador desea comprobar la variabilidad de
mediciones obtenidas al usar equipo diseñado para medir el
volumen de una fuente de audio. Tres mediciones
independientes registradas por este equipo para la misma
fueente de sonido fueron 4.1, 5.2 y 10.2.
a. Que suposiciones deben de realizarse si se quiere estimar
un intervalo de confianza para σ2 ?
b. Estime σ2 con un intervalo al 90% de confianza.
c. Que puede concluir con el intervalo hallado?
OTROS PARÁMETROS Y SUS ESTIMADORES
Parámetro P:
Intervalo de Confianza para la Proporción Poblacional
PPrevalencia de una enfermedad
Porcentaje de pacientes que presentan
complicaciones en una cirugia
2
2
ˆ ˆ(1 )ˆ:
ˆ ˆ(1 )ˆ:
p pLS p Z
n
p pLI p Z
n
#ˆ :
Exitosp
n
Estimación Puntual Estimación Por Intervalo
“Requiere que el tamaño de muestra sea grande (n>30)”
EJEMPLO
El gerente de una empresa de producción asegura que
su proceso genera una proporción de unidades
defectuosas cercana al 8%, al tomar una muestra de su
producto se obtiene que de 200 unidades revisadas, un
total de 15 unidades fueron defectuosas. Con estos
resultados puede corroborarse la afirmación del
productor?. Utilice un nivel de confianza del 92%.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
PROPORCIONES
Ejemplo: Se cree que la osteoporosis está relacionada con el
genero. Para ello se elige una muestra de 100 hombres de más
de 50 años y una muestra de 200 mujeres en las mismas
condiciones. Se observan 10 hombres y 40 mujeres con algún
grado de osteoporosis.
Que se puede concluir con una confianza del 90%?
1 1 2 2
1 2 1 2 /21 %1 2
ˆ ˆ ˆ ˆ(1 ) (1 )ˆ ˆ( )
p p p pIC P P p p Z
n n
INTERVALOS BASADOS EN DISTRIBUCIONES DE
POBLACIONES NO NORMALES
El intervalo de confianza de t con una muestra para
estimar μ es consistente para desviaciones pequeñas o
incluso moderadas con respecto a la normalidad,
siempre que n sea “grande”.
Si n es pequeña y la distribución poblacional es
bastante anormal, entonces el nivel de confianza real
podría ser muy distinto del se cree se esta usando.
La técnica de remuestreo (bootstrap) ha resultado
bastante exitosa en la estimación de parámetros de una
amplia variedad de situaciones no normales.
EJERCICIOS
La agencia para la protección del medio ambiente en
conjunto con una Universidad de Florida recientemente
realizó un amplio estudio respecto al posible efecto de los
oligoelementos presentes en el agua potable en la formación
de cálculos renales. En la siguiente tabla se presentan los
datos, los cuales se obtuvieron de individuos con problemas
recurrentes de cálculos renales que viven en los estados de
las dos Carolinas y las montañas Rocallosas, respecto a la
edad, la concentración de calcio en el agua potable(medida
en partes por millón) y el habito de fumar:
EJERCICIOS
a. Construya intervalos de confianza al 95%, para el verdadero valor
promedio de la edad para ambos estados.
b. Construya intervalos de confianza al 95%, para el verdadero valor
promedio del calcio para ambos estados.
c. Construya intervalos de confianza al 95% para el verdadero valor de
la diferencia de medias para ambas variables (Calcio y Edad) y la
proporción de fumadores.
d. Construya intervalos de confianza al 95% para los verdaderos valores
de la varianza poblacional, tanto para la edad como para las
concentraciones de calcio.
n
Carolinas 467 45.1 10.2 11.3 16.6 0.78
Montañas Rocallosa 191 46.4 9.8 40.1 28.4 0.61
edadX edadScalcioY calcioS fumadoresp̂
EJERCICIO
Un fabricante farmacéutico compra materias primas de dos
proveedores diferentes. El nivel medio de impurezas es
aproximadamente el mismo para ambos proveedores, pero el
fabricante esta preocupado por la variabilidad en la cantidad
de impurezas entre un embarque y otro. Si el nivel de
impurezas tiende a variar en forma excesiva de una fuente
de abastecimiento, esto podría afectar la calidad del producto
final. Para comparar la variación en el porcentaje de
impurezas para los dos proveedores, el fabricante selecciona
diez envíos de cada uno de ellos y mide el porcentaje de
impurezas de cada envió. Las varianzas muestrales fueron
Con los datos anteriores a que conclusión se puede llegar?
2 2
1 20.273 y 0.094S S