Inferencia estadistica

33
REALIZADO POR: Ing. Shalimar Monasterio C.I.: 17.183.843 Inferencia Estadística Estimación de Parámetros-Pruebas de Hipótesis REPÚBLICA BOLIVARIANA DE VENEZUELA LA UNIVERSIDAD DEL ZULIA FACULTAD DE INGENIERÍA POSTGRADO DE INGENIERÍA TOPICOS DE PROBABILIDADES Y ESTADÍSTICA

Transcript of Inferencia estadistica

Page 1: Inferencia estadistica

REALIZADO POR:

Ing. Shalimar Monasterio

C.I.: 17.183.843

Inferencia Estadística Estimación de Parámetros-Pruebas de Hipótesis

REPÚBLICA BOLIVARIANA DE VENEZUELA

LA UNIVERSIDAD DEL ZULIA

FACULTAD DE INGENIERÍA

POSTGRADO DE INGENIERÍA

TOPICOS DE PROBABILIDADES Y ESTADÍSTICA

Page 2: Inferencia estadistica

Es fácil encontrar defectos pero

encontrar cualidades es para los

espíritus superiores que son

capaces de inspirar a todos para el

éxito

Page 3: Inferencia estadistica

INTRODUCCIÓN Inferencia Estadística

Parámetro

Estadístico

•Calcular los parámetros de la distribución de medias o proporciones muestrales de tamaño n, extraídas de una población de media y varianza conocidas. •Estimar la media o la proporción de una población a partir de la media o proporción muestral. •Utilizar distintos tamaños muestrales para controlar la confianza y el error admitido. •Contrastar los resultados obtenidos a partir de muestras. •Visualizar gráficamente, mediante las respectivas curvas normales, las estimaciones realizadas.

OB

JETI

VOS

Page 4: Inferencia estadistica

ESTIMACIÓN DE PARÁMETROS Inferencia Estadística

1.1.- Definición 1:

Estimador Insesgado: Sea un estimador puntual de un parámetro . Entonces es un

estimador insesgado de si de lo contrario se dice que es sesgado. En

palabras, un estimador insesgado es aquel cuya media o valor esperado de la distribución de

las de las estimaciones es igual al parámetro estimado.

1.2.- Definición 2 "Sesgo":

El sesgo B (Bias) de un estimador puntual está dado por

1.3.- Definición 3:

El Cuadrado Medio del Error ó Error cuadrático medio de un estimador puntual se define

como el valor esperado de . Lo denotaremos por

Demostración

Page 5: Inferencia estadistica

ESTIMACIÓN DE PARÁMETROS Inferencia Estadística

Tabla 1: Estimadores Insesgados

a) Demuestre que es un estimador sesgado de y calcule su sesgo.

a)

Solución:

Ejem

plo:

Page 6: Inferencia estadistica

Comparación de Estimadores Puntuales Inferencia Estadística

1.5.1.- Definición 1

El Estimador Insesgado con mínima varianza de un parámetro es el estimador que

tiene la varianza más pequeña de entre todos los estimadores insesgados.

1.5.2.- Definición 2

Estimador Eficiente: Si se consideran todos los estimadores insesgados posibles de algún

parámetro aquel con la varianza más pequeña recibe el nombre de estimador m'as

eficiente de Básicamente, al comparar la eficiencia relativa entre dos estimadores y

se presenta la siguiente razón:

Page 7: Inferencia estadistica

Comparación de Estimadores Puntuales Inferencia Estadística

Ejemplo

Suponga que y son estimadores insesgados del parámetro Se sabe que

y

¿ Cuál estimador es "Mejor"y en qué sentido lo es?.

Solución.

Datos: ( Insesgados ). Cuando se realiza el cociente de la eficiencia

relativa, se tiene:

E.R.

Por tanto, el estimador es "mejor" en el sentido de ser más eficiente que el estimador

Ejem

plo:

Page 8: Inferencia estadistica

Criterios para estimados Inferencia Estadística

1.6.1.- Definición 1:

Sea X una variable aleatoria con una distribución de probabilidades que depende de un

parámetro desconocido . Sea X1, …, Xn una muestra de X y sean x1, …, xn los valores

muestrales correspondientes. Si g(X1,…,Xn) es una función de la muestra que se usará para

estimar nos referimos a g como un estimador de . El valor que toma g, es decir g(X1,…,Xn),

se conoce como un estimado de y habitualmente se escribe como

1.6.2.- Definición 2:

Sea un estimado del parámetro desconocido asociado con la distribución de la variable

aleatoria X. Entonces, es un estimador insesgado para si para toda

Page 9: Inferencia estadistica

Criterios para estimados Inferencia Estadística

1.6.3.- Definición 3:

Sea un estimado insesgado de . Decimos que es un estimado insesgado de varianza

mínima de si para todos los estimados tales que , tenemos para

cualquier Es decir, entre todos los estimados insesgados de , tiene la varianza más

pequeña.

1.6.4.- Definición 4:

Sea un estimado (con base en una muestra X1,…, Xn) del parámetro . Se dice que es

un estimado consistente de , si

para toda

O equivalente, si

para toda

Page 10: Inferencia estadistica

Criterios para estimados Inferencia Estadística

1.6.5.- Teorema 1:

Sea un estimado de con base en una muestra de tamaño n. Sí , y si

, entonces es un estimado consistente de

1.6.6.- Definición 5:

Se dice que es el mejor estimado lineal insesgado de si:

a)

b) Es decir, es una función lineal de la muestra.

c) donde es cualquier otro estimado de que

satisface las relaciones a) y b) anteriores.

1.6.7.- Teorema 2:

Sea X una variable aleatoria con esperanza finita y varianza . Sea el promedio

muestral obtenido en una muestra de tamaño n. Por lo tanto, es un estimado insesgado y

consistente de

Demostración

Page 11: Inferencia estadistica

Propiedades de los estimadores Inferencia Estadística

Estimadores de Máxima Verosimilitud

Insesgado o no viciado

1.8.1.- Definición 1:

El estimado de máxima verosimilitud de , digamos , con base en una muestra aleatoria

X1,…, Xn, es el valor de que maximiza a considerando como una función de

para una muestra dada X1,…,Xn, donde L está definida por la siguiente ecuación:

Consistente

Page 12: Inferencia estadistica

Propiedades de los estimadores de Máxima Verosimilitud

Inferencia Estadística

a) El estimado ML puede ser sesgado. Muy a menudo tal sesgo puede

evitarse multiplicando por una constante apropiada.

b) En condiciones muy generales, los estimados ML son consistentes. Es

decir si los tamaños de muestra en los cuales se basan es grande, el

estimado ML estará cercano al valor del parámetro que se estima.

c) Los estimados ML poseen la notable propiedad de invarianza.

Supóngase que es el estimado ML de . Entonces puede

demostrarse que el estimado ML de es . Es decir, si el

estadístico A toma sus medidas en y el estadístico B mide en

pies y el estimado ML de A es , entonces el de B sería . Esta

propiedad no la tienen los estimados insesgados.

Page 13: Inferencia estadistica

Propiedad asintótica de los estimadores de Máxima Verosimilitud Inferencia Estadística

Método de Mínimos Cuadrados

Si es un estimado ML para el parámetro , definido sobre una muestra aleatoria X1,…, Xn de

una variable aleatoria X, entonces para n suficientemente grande, la variable aleatoria tiene

aproximadamente la distribución

1.11.1.- Definición 1:

Supóngase que se tiene , donde , son constantes (desconocidas) y X

(conocida). Sea (x1,Y1),…, (xn,Yn) una muestra aleatoria de Y. Los estimados de mínimos

cuadrados de los parámetros y son los valores y que minimizan

Page 14: Inferencia estadistica

Coeficiente de Correlación Inferencia Estadística

El coeficiente de correlación muestral está definido como sigue:

Se nota que para propósitos de cálculo es más fácil evaluar r como se presenta a

continuación:

Page 15: Inferencia estadistica

Inferencia Estadística Estimación por Intervalo de Confianza

Considerar

Lo anterior se interpreta de la siguiente manera: es igual a la probabilidad que el

intervalo aleatorio contenga a , donde el valor de z se halla en tablas

denotado como .

Page 16: Inferencia estadistica

Inferencia Estadística Estimación por Intervalo de Confianza

La longitud L del intervalo de confianza antes considerado puede escribirse como

Así, L es una constante. Además, resolviendo la ecuación anterior para n da:

Por lo tanto, podemos determinar n (para de modod que el intervalo de

confianza tenga una longitud prefijada.

Page 17: Inferencia estadistica

Inferencia Estadística Distribución t de Student

Esta dada por:

para -

Y se denomina distribución t con v grados de libertad.

Corolario

Sean X1, X2, ….., Xn variables aleatorias independientes que son todas normales con media y

desviación estándar . Sea

n

x

n

xxxxxX

n

i

i

nn 11321 ....

, y

Entonces la variable alaetoria tiene una distribución t con v = n-1 grados de libertad.

Page 18: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Metodología

•Enunciar la hipótesis . •Elegir un nivel de significación α y construir la zona de aceptación. A la zona de rechazo la llamaremos región crítica, y su área es el nivel de significación. •Verificar la hipótesis extrayendo una muestra cuyo tamaño se ha decidido en el paso anterior y obteniendo de ella el correspondiente estadístico (media o proporción). •Decidir. Si el valor calculado en la muestra cae dentro de la zona de aceptación se acepta la hipótesis y si no se rechaza. M

etod

olog

ía

Page 19: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Posibles errores

Ho verdadera Ho falsa

DECISIÓN:Mantener Ho Decisión correcta Decisión incorrecta

Error de tipo II

DECISIÓN:Rechazar Ho Decisión incorrecta

Error de tipo I Decisión correcta

a = p(rechazar H0|H0 cierta) b = p(aceptar H0|H0 falsa) Potencia =1-b = p(rechazar H0|H0 falsa) Detalles a tener en cuenta: 1.- a y b están inversamente relacionadas. 2 .- Sólo pueden disminuirse las dos, aumentando n.

Page 20: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Posibles errores

4.1.1.- Definición 1:

La función de operación característica (función OC) de la Dócima anterior está definida

como

Es decir, es la probabilidad de aceptar Ho considerada como una función de .

La función de potencia definida por

Luego . Usaremos la función OC para describir propiedades de la dócima

aunque esto se podría hacer fácilmente mediante la función de potencia.

Page 21: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Distribución Normal con Varianza Conocida

Las siguientes propiedades de se establecen fácilmente:

a)

b)

c) para todo (luego L una función estrictamente decreciente de

d) para y, por tanto, la gráfica tiene un punto de inflexión.

e) El aumento de n hace que la curva tenga más pendiente.

Page 22: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Distribución Normal con Varianza Conocida

Caso 1: Si se da n y especificamos el nivel de significancia de la prueba (es decir, la probabilidad

de un error del tipo I) con algún valor , podemos obtener el valor de C al resolver la siguiente

ecuación

Definiendo K en la relación , podemos escribir lo anterior como

Donde puede obtenerse de la tabla de distribución normal. Entonces, rechazamos Ho si

Page 23: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Distribución Normal con Varianza Conocida

Caso 2: Si se va a determinar n y C, debemos especificar dos puntos sobre la gráfica de la curva

OC: 1- , el nivel de significación y , la probabilidad de un error tipo II para

. Luego se debe resolver las ecuaciones siguientes para n y C:

Estas ecuaciones pueden resolverse para C y n como se indicó anteriormente. Se obtiene

Donde y ya se han definido.

Page 24: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Prueba de Bondad de Ajuste

Se desea probar la hipótesis Ho: pi=pio, i=1,2,…k donde pio es un valor específ ico. La prueba

sería:

Rechazar Ho siempre que

Donde C es una constante que se va a determinar.

4.3.1.- Teorema 3:

Si n es suficientemente grande, y si pi=pio, la distribución de tiene en forma aproximada la

distribución x-cuadrada con (k-1) grados de libertad.

Demostración

Page 25: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Respecto a la Media de una Población

Caso 1.

Tamaño de muestra grande. Supongamos la situación, donde una compañía de servicios

públicos desea estimar el consumo promedio de energía eléctrica para una población

determinada de clientes. Supongamos que la compañía tiene la sospecha de que el consumo

de energía eléctrica se encuentra relativamente aproximado a 2000 kilowatios-hora; y quiere

comprobar la veracidad de esta suposición.

Para este caso específico, estamos ante el problema de probar las hipótesis:

Page 26: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Respecto a la Media de una Población

Caso 2.

Los datos provienen de una distribución normal con varianza poblacional conocida. Si

consideramos de nuevo los datos del ejemplo 5, se quiere estimar la conductividad térmica

promedio a 100 grados Farenheit y una potencia de entrada de 550 W y desviación estándar

poblacional conocida 0.30 Btu/hr-ft-grados Farenheit. Vamos a considerar el caso de que los

investigadores quisieran comprobar que esta conductividad térmica promedio es mayor de 40

Btu/hr-ft-grados Farenheit, a partir de los datos de la muestra de tamaño 10 obtenida.

Por lo tanto, las hipótesis nula y alterna podrían plantearse como sigue:

Page 27: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Respecto a la Media de una Población

Caso 3.

Los datos provienen de una distribución normal pero con varianza poblacional desconocida.

Considerando los datos del ejemplo 6, supongamos que la longitud promedio de una piraña es

28 cm., puede considerarse que el río que se encuentra bajo estudio está contaminado?

Las hipótesis a considerar en este caso corresponden a:

(El río no está contaminado)

(El río si lo está)

Page 28: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Estimación de la Varianza

de una Población

Sea una muestra aleatoria de una distribución normal con parámetros y

Entonces la variable aleatoria:

Para construir un intervalo de confianza para , nótese que:

La anterior expresión se puede expresar como:

Con el anterior intervalo se puede también probar la hipótesis nula versus

la alternativa , donde se rechaza la hipótesis nula si el valor cae fuera de

este intervalo de confianza. Además, para probar esta hipótesis se puede hacer uso también

del estadístico:

el cual rechaza si o si .

Page 29: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Estimación de la diferencia entre las medias de dos poblaciones

Con el anterior intervalo se puede también probar la hipótesis nula

versus la alternativa , donde se rechaza la hipótesis nula si el valor

cae fuera de este intervalo de confianza. Además, para probar esta hipótesis se puede hacer

uso del estadístico:

el cual rechaza si

Caso 1: Muestras independientes y Varianzas Conocidas

Page 30: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Estimación de la diferencia entre las medias de dos poblaciones

Caso 2: Muestras independientes y Varianzas Desconocidas pero iguales

Con el anterior intervalo se puede también probar la hipótesis nula

versus la alternativa , donde se rechaza la hipótesis nula si el valor

cae fuera de este intervalo de confianza. Además, para probar esta hipótesis se puede hacer

uso del estadístico:

el cual rechaza si

=

Page 31: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Estimación de la diferencia entre las medias de dos poblaciones

Caso 3: Muestras pareadas

Con el anterior intervalo se puede también probar la hipótesis nula

versus la alternativa , donde se

rechaza la hipótesis nula si el valor cae fuera de este intervalo de confianza. Además, para

probar esta hipótesis se puede hacer uso del estadístico:

el cual rechaza si

Page 32: Inferencia estadistica

Inferencia Estadística Prueba de Hipótesis: Estimación de la diferencia entre las medias de dos poblaciones

Caso 5: Inferencia sobre el cociente de varianzas

Supóngase que se tiene interés en dos poblacionales normales independientes, donde las

medias y varianzas de la población, y , son desconocidas. Se desea probar la

hipótesis sobre la igualdad de las dos varianzas, , por ejemplo. Supóngase

que para ello se tienen disponibles dos muestras aleatorias; una de tamaño tomada de la

población 1, y otra de tamaño provenientes de la población 2, y sean y las varianzas

muestrales. Para probar la hipótesis bilateral

Recuerde que:

Además, la cola inferior de una F se calcula mediante

Page 33: Inferencia estadistica

CONCLUSIÓN

La Inferencia Estadística es la técnica mediante la cual se puede llegar a conclusiones o generalizaciones acerca de parámetros de una población basándose en el estadístico de una muestra de población, cubriendo de esta manera su objetivo principal de extraer las conclusiones útiles sobre la totalidad de todas las observaciones posibles basándose en la información recolectada. Como se mencionó en el trabajo se puede hablar dentro de la inferencia de los procesos de estimación y contraste Hipótesis que permitan no rechazar o rechazar una hipótesis previamente emitida, sobre el valor de un parámetro desconocido de la población, permitiendo en la investigación que se desarrollen y apliquen la validez estadística y aumentando la factibilidad de ejecución de la misma por reducir tiempos y costos.