Inferencia Estadistica.pdf

17
Universidad del Golfo Inferencia Estadística 2015 Mtro. Raymundo Hernández David 1 Inferencia Estadística 2.1 Muestreo probabilístico. 2.2. Intervalos característicos y de confianza. 2.3. Estimación de la media y de una proporción. 2.4. Contrastes de hipótesis. Tipos de muestreo Inferencia estadística Estudia como sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos. Muestreo probabilístico Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de muestreo : Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra. Muestreo aleatorio sistemático Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra. Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A

Transcript of Inferencia Estadistica.pdf

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 1

Inferencia Estadíst ica

2.1 Muestreo probabilístico.

2.2. Intervalos característicos y de confianza.

2.3. Estimación de la media y de una proporción.

2.4. Contrastes de hipótesis.

Tipos de muestreo

Inferencia estadística

Estudia como sacar conclusio nes generales para toda la población a parti r del estudio de una muestra, y el grado de f iabi l idad o signif icación de los resultados obtenidos.

Muestreo probabi l íst ico

Consiste en e leg ir una muest ra de una poblac ión a l azar . Podemos dis t inguir var ios t ipos de muestreo :

Muestreo aleatorio simple

Para obtener una muestra, se numeran los e lementos de la poblac ión y se se lecc ionan a l azar los n e lementos que cont iene la muestra.

Muestreo aleatorio sistemático

Se e l ige un indiv iduo a l azar y a par t i r de é l , a in tervalos constantes, se e l igen los demás hasta completar la muestra.

Por ejemplo s i tenemos una poblac ión formada por 100 e lementos y queremos extraer una muestra de 25 elementos, en pr imer lugar debemos establecer e l in tervalo de selecc ión que será igual a 100/25 = 4. A

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 2

cont inuación e leg imos e l e lemento de ar ranque, tomando aleator iamente un número entre e l 1 y e l 4, y a par t i r de é l obtenemos los restantes e lementos de la muest ra.

2, 6, 10, 14, . . . , 98

Muestreo aleatorio estrat if icado

Se d iv ide la poblac ión en c lases o est ratos y se escoge, a leator iamente, un número de individuos de cada est rato proporc ional a l número de componentes de cada estrato.

En una fábr ica que consta de 600 t rabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la secc ión A, 150 en la B, 150 en la C y 100 en la D.

Un muestreo puede hacerse con o s in reposic ión, y la poblac ión de par t ida puede ser inf in i ta o f in i ta .

En todo nuestro estudio vamos a l imitarnos a una población de part ida inf ini ta o a muestreo con reposición .

Si consideremos todas las posib les muest ras de tamaño n e n una poblac ión, para cada muestra podemos calcular un estadístico (media, desviación t ípica, proporción, . . . ) que var iará de una a otra.

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 3

Así obtenemos una d is t r ibuc ión del estadíst ico que se l lama distribución muestral .

Intervalos característicos

P[Μ - K < X < Μ + K] = P

Hal lar e l in tervalo caracter ís t ico de una d is t r ibuc ión normal N(0, 1) cor respondiente a la probabi l idad p = 0.9.

E l nivel de conf ianza (p) se designa mediante 1 - α .

E l nivel de signif icación se designa mediante α.

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 4

El valor cr ít ico (k) como z α / 2 .

P(Z>z α / 2 ) = α/2 P[ -z α / 2 < z < z α / 2 ] = 1- α

Valores cr ít icos

1 - α α/2 z α / 2

0 .90 0.05 1.645

0.95 0.025 1.96

0.99 0.005 2.575

En una d is t r ibuc ión N(μ, σ ) e l intervalo caracter ís t ico correspondiente a una probabi l idad p = 1 - α es:

(μ - z α / 2 · σ , μ + z α / 2 · σ )

1 - α α/2 z α / 2 Intervalos característicos

0.90 0.05 1.645 (μ - 1.645 · σ , μ + 1.645 · σ)

0 .95 0.025 1.96 (μ - 1.96 · σ , μ + 1.96 · σ )

0 .99 0.005 2.575 (μ - 2.575 · σ , μ + 2.575 · σ )

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 5

Teorema central del l ímite

Si una poblac ión t iene media μ y de sviac ión t íp ica σ, y tomamos muestras de tamaño n (n>30, ó cualquier tamaño s i la poblac ión es "normal" ) , las medias de estas muest ras s iguen aproximadamente la d is t r ibuc ión:

Consecuencias:

1.Permite aver iguar la probabi l idad de que la media de una muest ra concreta esté en un c ier to in tervalo.

2.Permite calcular la probabi l idad de que la suma de los e lementos de una muest ra esté, a pr ior i , en un c ier to in tervalo.

3. Infer i r la media de la poblac ión a par t ir de una muestra.

Las bolsas de sal envasadas por una máquina t ienen μ = 500 g y σ = 35 g . Las bolsas se empaquetaron en cajas de 100 unidades.

1.Calcular la probabi l idad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g .

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 6

2.Calcular la probabi l idad de que una caja 100 de bolsas pese más de 51 kg.

Estimación de parámetros

Es e l procedimiento ut i l i zado para conocer las car acter ís t icas de un parámetro poblac ional , a par t i r del conocimiento de la muest ra.

Con una muest ra a leator ia, de tamaño n, podemos efectuar una est imación de un valor de un parámetro de la poblac ión; pero también necesi tamos prec isar un:

Intervalo de confianza

Se l lama as í a un in tervalo en e l que sabemos que está un parámetro, con un n ivel de conf ianza específ ico.

Nivel de confianza

Probabi l idad de que e l parámetro a est imar se encuentre en el in tervalo de conf ianza.

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 7

Error de estimación admisible

Que estará re lac ionado con e l radio del in tervalo de conf ianza.

Est imación de la media de una poblac ión

Intervalo de confianza para la media

El intervalo de conf ianza , para la media de una poblac ión, con un nivel de conf ianza de 1 - α , s iendo x la media de una muest ra de tamaño n y σ la desviac ión t íp ica de la poblac ión, es:

El error máximo de estimación es:

Cuanto mayor sea el tamaño de la muest ra, n, menor es el error .

Cuanto mayor sea el nivel de conf ianza , 1-α, mayor es el error .

Tamaño de la muestra

S i aumentamos el nivel de conf ianza , aumenta el tamaño de la muestra .

S i disminuimos el error , tenemos que aumentar el tamaño de la muestra .

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 8

El t iempo que tardan las cajeras de un supermercado en cobrar a los c l ientes s igue una ley normal con media desconocida y desviac ión t íp ica 0,5 minutos. Para una muestra a leator ia de 25 c l ientes se obtuvo un t iempo medio de 5,2 minutos.

1.Calcula e l in tervalo de conf i anza a l n ive l del 95% para e l t iempo medio que se tarda en cobrar a los c l ientes.

2. Indica e l tamaño muest ra l necesar io para est imar d icho t iempo medio con un e l er ror de ± 0,5 minutos y un n ivel de conf ianza del 95%.

n ≥ 4

Estimación de una proporción

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 9

Si en una población , una determinada caracter ís t ica se presenta en una proporc ión p , la proporc ión p' , de individuos con d icha caracter ís t ica en las muestras de tamaño n, se d is t r ibuirán segú n:

Intervalo de confianza para una proporción

El error máximo de estimación es:

En una fábr ica de componentes e lect rónicos, la proporc ión de componentes f inales defectuosos era del 20%. Tras una ser i e de operac iones e invers iones dest inadas a mejorar e l rendimiento se anal izó una muestra a leator ia de 500 componentes, encont rándose que 90 de e l los eran defectuosos. ¿Qué nivel de conf ianza debe adoptarse para aceptar que e l rendimiento no ha suf r ido var iaciones?

p = 0.2 q = 1 - p =0.8 p '= 90/ 500 = 0.18

E = 0.2 - 0.18 = 0.02

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 10

P (1 - zα / 2 <1.12) = 0.86861 - 0.8686 = 0.1314

0.8686 - 0.1314 = 0.737

Nivel de confianza: 73.72%

Contrastes de hipótesis

Hipótesis estadísticas

Un test estadístico es un procedimiento para, a par t i r de una muest ra a leator ia y s igni f icat iva, extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emit ida sobre e l va lor de un parámetro desconocido de una poblac ión.

La h ipótes is emit ida se designa por H0 y se l lama HIPÓTESIS NULA . La h ipótes is cont rar ia se designa por H1 y se l lama HIPÓTESIS

ALTERN ATIV A . Contrastes de hipótesis

1. Enunciar la hipótesis nula H 0 y la al ternat iva H 1 .

Bilateral H0=k H1 ≠ k

Uni lateral H0≥ k H1 < k

H0 ≤k H1> k

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 11

2. A part i r de un nivel de conf ianza 1 - α o el de signif icación α . Determinar :

El valor zα / 2 (bi laterales), o bien z α (uni laterales)

La zona de aceptación del parámetro muestral (x o p' ) .

3. Calcular: x o p' , a part i r de la muestra.

4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis con un nivel de signif icación α. Si no, se rechaza .

Contraste Bi lateral

Se presenta cuando la h ipótes is nu la es del t ipo H 0 : μ = k (o b ien H0 : p = k ) y la h ipótes is a l ternat iva, por tanto, es del t ipo H1 : μ≠ k (o b ien H1 : p≠ k) .

El nivel de signif icación α se concentra en dos partes (o colas) simétr icas respecto de la media.

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 12

La región de aceptación en este caso no es más que el cor respondiente in tervalo de probabi l idad para x o p ' , es decir :

o b ien:

Se sabe que la desviac ión t íp ica de las notas de c ier to examen de Matemát icas es 2,4. Para una muest ra de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para conf i rmar la hipótes is de que la nota media del examen fue de 6, con un n ivel de conf ianza del 95%?

1. Enunciamos las hipótes is nula y a l ternat iva:

H0 : μ = 6 La nota media no ha var iado.

H1 : μ ≠ 6 La nota media ha var iado.

2. Zona de aceptac ión

Para α = 0.05 , le cor responde un valor cr í t ico: zα / 2 = 1.96 .

Determinamos el in tervalo de conf ianza para la media:

(6-1,96 · 0 ,4 ; 6+1,96 · 0,4) = (5,22 ; 6,78)

3. Ver i f icac ión.

Valor obtenido de la media de la muestra: 5,6 .

4. Decis ión

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 13

Aceptamos la hipótesis nula H 0 , con un n ivel de s igni f icac ión del 5%.

Contraste unilateral

Caso 1

La hipótesis nula es del t ipo H0 : μ ≥ k (o b ien H0 : p ≥ k ) .

La hipótesis alternat iva , por tanto, es del t ipo H1 : μ < k (o b ien H1 : p < k ) .

Valores cr ít icos

1 - α α z α

0 .90 0.10 1.28

0.95 0.05 1.645

0.99 0.01 2.33

El n ive l de s ignif icac ión α se concentra en una parte o cola.

La reg ión de aceptac ión en este caso será:

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 14

o b ien:

Un soció logo ha pronost icado, que en una determinada c iudad, e l n ive l de abstención en las próximas e lecc iones será del 40% como mínimo. Se e l ige a l azar una muest ra a leator ia de 200 indiv iduos, con derecho a voto, 75 de los cuales estar ían d ispuestos a votar. Determinar con un n ive l de s ignif icac ión del 1%, s i se puede admit i r e l pronóst ico.

1. Enunciamos las hipótes is nula y a l ternat iva:

H0 : p ≥ 0.40 La abstención será como mínimo del 40%.

H1 : p < 0.40 La abstenc ión será como máximo del 40%;

2. Zona de aceptac ión

Para α = 0.01 , le cor responde un valor cr í t ico: zα = 2.33 .

Determinamos el in tervalo de conf ianza para la media:

3.Ver if icac ión.

4.Decis ión

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 15

Aceptamos la hipótesis nula H0 . Podemos af i rmar, con un n ivel de s ignif icac ión del 1%, que la La abstención será como mínimo del 40%.

Caso 2

La h ipótes is nula es del t ipo H0 : μ ≤ k (o b ien H0 : p ≤ k ) .

La h ipótes is a l ternat iva, por tanto, es del t ipo H1 : μ > k (o b ien H1 : p > k ) .

El n ive l de s ignif icac ión α se concent ra en la otra par te o cola.

La reg ión de aceptac ión en este caso será:

o b ien:

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 16

Un informe indica que e l prec io medio del b i l le te de avión ent re Canar ias y Madr id es, como máximo, de 120 € con una desviac ión t íp ica de 40 €. Se toma una muest ra de 100 via jeros y se obt iene que la media de los prec ios de sus b i l le tes es de 128 €.

¿Se puede aceptar, con un n ivel de s ignif icac ión igual a 0,1, la af i rmación de par t ida?

1. Enunciamos las hipótes is nula y a l ternat iva:

H0 : μ ≤ 120

H1 : μ > 120

2.Zona de aceptac ión

Para α = 0.1 , le corresponde un valor cr í t ico: zα = 1.28 .

Determinamos el in tervalo de conf ianza:

3. Ver i f icac ión.

Valor obtenido de la media de la muestra: 128 € .

4. Decis ión

No aceptamos la hipótesis nula H 0 . Con un n ivel de s igni f icac ión del 10%.

Universidad del Golfo Inferencia Estadística

2015

Mtro. Raymundo Hernández David 17

Errores de t ipo I y t ipo I I

Error de t ipo I . Se comete cuando la hipótesis nula es verdadera y, como consecuencia del cont raste, se rechaza .

Error de t ipo I I . Se comete cuando la hipótesis nula es falsa y, como consecuencia del cont raste se acepta .

H0 Verdadera Falsa

Aceptar Decisón correcta

Probabi l idad = 1 - α

Decisión incorrecta:

ERROR DE TIPO I I

Rechazar ERROR DE TIPO I

Probabi l idad = α

Decisión correcta

La probabil idad de cometer Error de t ipo I es el nivel de signif icación α .

La probabi l idad de cometer Error de t ipo I I depende de l verdadero valor del parámetro. Se hace tanto menor cuanto mayor sea n .