Estad stica Grado en Nutrici on Humana y Diet etica - …fmocan/NHD/TEMA5.pdf · Estad stica Grado...

55
Estad´ ıstica Grado en Nutrici´ on Humana y Diet´ etica Tema 5: Introducci´ on al Muestreo Estad´ ıstico Francisco M. Oca˜ na Peinado http://www.ugr.es/local/fmocan Departamento de Estad´ ıstica e Investigaci´ on Operativa Francisco M. Oca˜ na Peinado (UGR) TEMA 5 Curso 2017/2018 1 / 55

Transcript of Estad stica Grado en Nutrici on Humana y Diet etica - …fmocan/NHD/TEMA5.pdf · Estad stica Grado...

EstadısticaGrado en Nutricion Humana y Dietetica

Tema 5: Introduccion al Muestreo Estadıstico

Francisco M. Ocana Peinadohttp://www.ugr.es/local/fmocan

Departamento de Estadıstica e Investigacion Operativa

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 1 / 55

Tema 5: Introduccion al MuestreoEstadıstico

1 Introduccion

2 Tipos de Muestreo

3 Metodos de muestreo no probabilıstico

4 Metodos de muestreo probabilıstico

5 Determinacion del tamano de la muestra

6 Un ejemplo de aplicacion de las tecnicas demuestreo

7 Bibliografıa

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 2 / 55

¿Como surge el muestreo?

Estrategias en investigacion con poblaciones

Existen 2 estrategias posibles para la recopilacion de datos:

Examinar todas las unidades de la poblacion, es decir, realizar un censo.

Examinar segun unos planes establecidos con anterioridad, ciertas unidadesde la poblacion (muestra), y suponer que los resultados obtenidos sonrepresentativos de toda la poblacion.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 3 / 55

¿Por que utilizar muestras?

Razones para uso de muestras

Hay ocasiones en las que no queda otra solucion que la eleccion de una muestradebido a que:

La poblacion es tan grande que excede las posibilidades del investigador.

La poblacion es suficientemente homogenea como para que cualquiermuestra de una buena representacion.

El proceso de medida o investigacion es destructivo.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 4 / 55

Definicion y cuestiones clave

Definicion

Muestreo: tecnica estadıstica cuyo objetivo es obtener muestras representativasde una poblacion para realizar inferencia acerca de parametros poblacionales

Cuestiones relevantes en Muestreo

Cuando se plantea la toma de muestras surgen dos preguntas:

(a) ¿Como incluir los individuos en la muestra?

(b) ¿Cuantos individuos debo incluir en la muestra?

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 5 / 55

Notacion

Conceptos basicos

A continuacion definiremos algunos de los conceptos basicos en Muestreo

Poblacion o Universo: Conjunto de unidades con caracterısticas comunes delas cuales se desea obtener cierta informacion.

P = {u1, u2, ..., uN}

Pueden ser personas, familias, viviendas, escuelas, empresas, etc. y lainformacion deseada, el consumo medio por familia de un alimento, elnumero total de personas con sobrepeso, el porcentaje de personas conobesidad...

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 6 / 55

Notacion

Conceptos basicos

Muestra: Subconjunto de unidades de la poblacion de las cuales se obtienela informacion. Se supone que este subconjunto es representativo de todo eltotal.

Marco: Conjunto real de unidades a partir del cual se selecciona la muestra.Es necesario que se ajuste lo mejor posible al conjunto ideal que constituyela poblacion.

Tamano de la poblacion es el numero N de unidades que forman la poblacion

Tamano de la muestra es el numero n de unidades seleccionadas para lamuestra.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 7 / 55

Notacion

Conceptos basicos

Factor de elevacion: es el cociente entre el tamano de la poblacion y el

tamano de la muestra,N

n.

Representa el numero de elementos que hay en la poblacion por cadaelemento de la muestra.

Fraccion o Factor de muestreo: es el cociente f , entre el tamano de la

muestra y el tamano de la poblacion, f =n

N.

Si se multiplica por 100, obtenemos el porcentaje de la poblacion al querepresenta la muestra.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 8 / 55

Estimadores y Propiedades

Propiedades de estimadores

Si θ es un estimador del parametro poblacional θ, se desean al menos dospropiedades para θ:

a) θ sea insesgado: E (θ) = θ.

b) θ tenga mınima varianza, es decir que proporcione estimaciones cercanas alparametro θ al que estima.

Se medira la precision de los estimadores θ por su varianza, V (θ) o por su error

estandar

√V (θ)

Inconveniente

Problema: V (θ) no es calculable, por lo que en los metodos de muestreo que se

trataran, se daran estimaciones de V (θ), que se denominaran V (θ).

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 9 / 55

Construccion de Intervalos de Confianza

Para estimar parametros, es muy recomendable utilizar intervalos de confianza(recordemos, un intervalo al que pertenezca el parametro con una probabilidaddada). La idea es:

Si el tamano de la muestra es suficientemente grande (n ≥ 30), se obtiene elintervalo de confianza a nivel 100(1− α)% como:(

θ − zα/2

√V (θ) , θ + zα/2

√V (θ)

)(1)

donde θ es el estimador de cualquiera de los parametros que interese estimar

Si el tamano de muestra es pequeno, (n < 30), se sustituye en la expresionanterior del intervalo el valor zα, por el valor tn−1;α/2 quedando:(

θ − tn−1;α/2

√V (θ) , θ + tn−1;α/2

√V (θ)

)(2)

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 10 / 55

Construccion de Intervalos de Confianza

De forma resumida

S.E.(estimador) es el error estandar del estimador, que en nuestro caso es laraız cuadrada de la estimacion de la varianza

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 11 / 55

Tipos de Muestreo

Tipos de Muestreo

Muestreo probabilıstico o aleatorio: Todos los individuos de la poblacionpueden formar parte de la muestra, por tanto es el tipo de muestreo que sedebe usar en investigacion, al ser riguroso y cientıfico.

Muestreo no probabilıstico o no aleatorio: Existe influencia de la personao personas que seleccionan la muestra o simplemente se realiza atendiendo arazones de comodidad, por lo que carece de una base teorica satisfactoria.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 12 / 55

Metodos de muestreo no probabilıstico

Algunos tipos de Muestreo no probabilıstico

a) Muestreo por cuotas o accidental: Se fijan unas cuotas que consisten enun numero de individuos que reunen unas determinadas condiciones. Unavez determinada la cuota, se eligen los primeros que se encuentren quecumplan esas caracterısticas.

b) Muestreo opinatico o intencional:Esfuerzo deliberado por obtenermuestras representativas mediante la inclusion en la muestra de grupossupuestamente tıpicos.

c) Muestreo incidental o de conveniencia: Se trata de un proceso en el queel investigador selecciona directa e intencionadamente los individuos de lapoblacion.

d) Muestreo bola de nieve: Se localiza a algunos individuos, los cualesconducen a otros, y estos a otros, y ası hasta conseguir una muestrasuficiente.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 13 / 55

Metodos de muestreo probabilıstico

Metodos de muestreo probabilıstico

1 Muestreo Aleatorio Simple (sin reemplazamiento).

2 Muestreo Sistematico.

3 Muestreo Estratificado Aleatorio.

4 Muestreo por Conglomerados.

En cuanto a los parametros a estimar:

1 X ≡ Total Poblacional de una caracterıstica. X =N∑i=1

Xi

2 X ≡ Media Poblacional de una caracterıstica. X =X

N

3 P ≡ Proporcion de la poblacion que posee una caracterıstica.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 14 / 55

Muestreo Aleatorio Simple: Procedimiento

M.A.S.

Se parte de una poblacion de N unidades de la cual extraemos una muestrade tamano n.

Extraemos sucesiva e independientemente las unidades con probabilidadesiguales, en cada extraccion esa probabilidad es:

1

N − tt = 0, 1, . . . , n − 1

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 15 / 55

Muestreo Aleatorio Simple: Procedimiento

M.A.S.

1) Se asigna un numero a cada individuo de la poblacion

2) A traves de algun medio (tablas, calculadora, ordenador...) se generannumeros aleatorios y se eligen tantos individuos como sea necesario paracompletar el tamano de muestra requerido

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 16 / 55

Muestreo aleatorio simple

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 17 / 55

Muestreo aleatorio simple

Ejemplo

Imagınese que hay de recoger una muestra de n = 20 enfermos de un hospitaldonde hay N = 600. Se parte de un listado completo de los 600 enfermos. Seseleccionarıa un enfermo al azar, con probabilidad de elegirlo 1

600 . La probabilidadde escoger al 2o enfermo serıa ya de 1

599 , y ası sucesivamente con el resto.La eleccion al azar de los enfermos de la muestra a partir de la lista, se llevarıa acabo mediante numeros aleatorios.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 18 / 55

Estimadores y sus varianzas. Intervalos deconfianza

Los estimadores de los parametros de interes, X , X y P son respectivamente:

X = x =n∑

i=1

xin

X = Nx

P =

n∑i=1

Ai

n

donde x es la media muestral, con:

Ai =

{1 si el individuo posee la caracterıstica0 si el individuo no posee la caracterıstica

(3)

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 19 / 55

Estimadores y sus varianzas. Intervalos deconfianza

Varianza de estimadores

Las varianzas se estiman a partir de s2, siendo respectivamente:

V (X ) = (1− f )s2

n

V (X ) = N2V (X ) V (P) = (1− f )PQ

n − 1

con: Q = 1− P f =n

Ns2 =

n∑i=1

(xi − x)2

n − 1

Construccion de I.C.

En cuanto a los I.C. para los parametros de interes, se construyen segun sea el tamanode muestra, a partir de las expresiones vistas al principio del tema (para m.a.s y paracualquiera de los otros tipos de muestreo probablıstico que se estudiaran mas ade-lante)

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 20 / 55

Muestreo Sistematico: Procedimiento

Muestreo sistematico

Se parte de una poblacion de N unidades numeradas.

Para tomar una muestra de n unidades (con N = nk), se toma al azar una unidadentre las primeras k unidades, y de ahı en adelante se toma cada k-esima unidad.

Ventajas respecto al m.a.s.

Mas facil y rapido obtener la muestra.

Ninguna sucesion grande de elementos de la lista se queda sin representacion.Consecuencia: puede ser mas representativo que el m.a.s.

Inconvenientes respecto al m.a.s.

Estimaciones sesgadas si existe periodicidad en la numeracion de los elementos.

Problemas de estimacion de la varianza.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 21 / 55

Muestreo Sistematico

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 22 / 55

Muestreo Sistematico: Ejemplo

Ejemplo

Imagınese que hay de recoger una muestra de n = 20 enfermos de un hospitaldonde hay N = 600. Se parte de un listado completo de los 600 enfermos. Comohay que seleccionar 20 enfermos de 600, es decir, 1 de cada 30, se procedeeligiendo uno al azar, por ejemplo el enfermo no 27, y luego los demas se eligen apartir de este a intervalos de 30 enfermos. Se seleccionarıa por tanto a losenfermos:

27, 57, 87, 117, 147, 177, 207, 237, 267, 297,

327, 357, 387, 417, 447, 477, 507, 537, 567, 597

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 23 / 55

Estimadores y sus varianzas. Intervalos deconfianza

Semejanzas entre muestreo sistematico y m.a.s.

El muestreo sistematico es equivalente al m.a.s. si los elementos seencuentran enumerados de manera aleatoria

Por ello para estimacion los parametros de interes y construccion de I.C., seusan las formulas del m.a.s. ya vistas anteriormente

Para estimar la varianza de los estimadores, aunque existen metodosespecıficos, es comun el uso de las formulas del m.a.s.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 24 / 55

Muestreo Estratificado Aleatorio: IdeaGeneral

Conceptos

Objetivo: Aumentar la precision de los estimadores para un tamano dado dela muestra frente a m.a.s. o sistematico

Se consideran categorıas diferentes entre sı (estratos) con homogeneidadrespecto a alguna caracterıstica Se pretende asegurar que todos los estratosestaran representados adecuadamente en la muestra

Dentro de cada estrato se estima independientemente, pudiendo aplicarsedentro de ellos el m.a.s. u otro tipo de muestreo para elegir los elementos dela muestra. En nuestro caso: m.a.s. dentro de cada estrato

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 25 / 55

Muestreo Estratificado

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 26 / 55

Muestreo Estratificado Aleatorio: IdeaGeneral

Planteamiento

Poblacion de tamano N dividida en L subpoblaciones de tamanosN1,N2, . . . ,NL de forma que:

N1 + N2 + . . .+ NL =L∑

h=1

Nh = N

Cada una de las subpoblaciones son los estratos. Para obtener una muestrade tamano n, se toma en cada estrato una muestra aleatoria de tamano nh ,de manera que:

n1 + n2 + . . .+ nL =L∑

h=1

nh = n

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 27 / 55

Muestreo Estratificado Aleatorio: Ventajase Inconvenientes

Ventajas

Obtencion de informacion dentro de las subpoblaciones sobre lacaracterıstica objeto del estudio

Aumento de la precision de los estimadores

Inconvenientes

La eleccion del tamano de las muestras dentro de cada estrato para que eltotal sea n

En la practica, la division en estratos en algunas poblaciones puede no sersencilla.

En general, este tipo de muestreo mejora al m.a.s. cuanto mas diferentes sean losestratos entre sı y mas homogeneos internamente

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 28 / 55

Eleccion del tamano muestral en losestratos: Afijacion

Concepto de afijacion

Se denomina afijacion, a la asignacion del tamano muestral n entre los diferentesestratos, es decir a la eleccion de los valores nh de forma que la suma sea n.

Criterios de afijacion

1. Afijacion uniforme: todos los nh son iguales:

nh =n

L

2. Afijacion proporcional: nh es proporcional al tamano de cada estrato:

nh = Nhn

Na partir de

n

N=

nh

Nh

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 29 / 55

Afijacion: Ejemplo

Afijacion uniforme

Imagınese que hay que tomar una muestra de n = 20 enfermos de un hospitaldonde hay N = 600. Supongase que se tiene: 100 ninos, 150 jovenes, 150 adultosy 200 ancianos

1. Afijacion uniforme:

nh =n

L=

20

4= 5 ∀h = 1, 2, 3, 4

Muestra formada por 5 ninos, 5 jovenes, 5 adultos y 5 ancianos

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 30 / 55

Afijacion: Ejemplo

Afijacion proporcional

2. Afijacion proporcional:n

N=

nh

Nh

Primer estrato (ninos):

20

600=

n1

100⇒ n1 = 3.3 enfermos⇒ 3 enfermos

Segundo estrato (jovenes):

20

600=

n2

150⇒ n2 = 5 enfermos

Tercer estrato (adultos), igual que el anterior n3 = 5 enfermos

Cuarto estrato (ancianos): n4 = 6.6 ' 7

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 31 / 55

Notacion en Muestreo Estratificado

Notacion

Se utilizara el subındice h para indicar el estrato.

Nh ≡ numero total de unidades en el estrato h

nh ≡ numero de unidades de la muestra del estrato h

fh =nh

Nh≡ fraccion de muestreo en el estrato h

wh =Nh

N≡ ponderacion del estrato h

xh ≡ media muestral del estrato h

s2h ≡ cuasivarianza muestral del estrato h

Ph ≡ proporcion muestral en el estrato h

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 32 / 55

Estimadores de los Parametros

Estimadores

Los estimadores de los parametros de interes, X , X y P son:

X st =1

N

L∑h=1

Nhxh =L∑

h=1

whxh

Xst = NX st =L∑

h=1

Nhxh

Pst =1

N

L∑h=1

NhPh =L∑

h=1

whPh

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 33 / 55

Estimacion de la Varianza de los Estimadores

Estimacion de la Varianza de los Estimadores

V (X st) =1

N2

L∑h=1

Nh(Nh − nh)s2hnh

=L∑

h=1

w2h (1− fh)

s2hnh

V (Xst) = N2V (X st) V (Pst) =L∑

h=1

w2h (1− fh)

PhQh

nh − 1

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 34 / 55

Muestreo por conglomerados

Idea general

Division previa de la poblacion en grupos, denominados conglomerados, delos cuales se selecciona cierto numero, por lo que sera necesario disponer dela lista de ellos.

Si seleccionados algunos conglomerados, la muestra esta formada por todaslas unidades que componen el conglomerado, se denomina muestreo por con-glomerados en una etapa.

Requisito: que los elementos del conglomerado sean muy heterogeneos entresı, (idea opuesta a la del muestreo estratificado).

Extensa teorıa de este tipo de muestreo: bietapico, trietapico, polietapico...Tambien segun sean los tamanos de los conglomerados (distintos, iguales,desconocidos, etc...).

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 35 / 55

Muestreo por Conglomerados

Ejemplo

Supongase que se desea extraer una muestra aleatoria de enfermos de un paıs.Muy difıcil realizar un m.a.s., sistematico o estratificado. Supongase tambienque los enfermos estan clasificados por regiones, provincias y hospitales

Muestreo conglomerados: Muestreo de algunas regiones, despues muestreo dealgunas provincias, despues de algunos hospitales y dentro de los hospitales,de algunos enfermos por muestreo aleatorio simple⇒Muestreo por conglom-erados en 3 etapas (conglomerados son unidades amplias y heterogeneas)

Nuestro caso: Muestreo por conglomerados en una etapa serıa seleccionarmediante m.a.s., una muestra de hospitales, para a continuacion analizar atodos los enfermos de ese hospital

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 36 / 55

Muestreo por conglomerados en una etapa

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 37 / 55

Muestreo por conglomerados en una etapa

Notacion

N ≡ Numero de conglomerados en la poblacion.

n ≡ Numero de conglomerados en la muestra.

mi ≡ Numero de elementos en el conglomerado i , i = 1, 2, . . . ,N

M =N∑i=1

mi ≡ numero de elementos en la poblacion.

xij ≡ valor de la variable en la unidad j del i-esimo conglomerado.

Xi =mi∑j=1

xij ≡ total de la variable en el i-esimo conglomerado.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 38 / 55

Estimadores y sus varianzas

Estimadores de parametros

X = x =

n∑i=1

Xi

n∑i=1

mi

⇒ X = Mx

P =

n∑i=1

Ai

n∑i=1

mi

donde Ai =

mi∑j=1

Aij i = 1, 2, . . . , n j = 1, 2, . . . ,m

Aij =

{1 si el individuo posee la caracterıstica0 si el individuo no posee la caracterıstica

(4)

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 39 / 55

Estimadores y sus varianzas

Estimacion de la Varianza de los Estimadores

V (X ) =N(N − n)

M2n

1

n − 1

n∑i=1

(Xi − xmi )2

V (X ) = M2V (X ) V (P) =N(N − n)

M2n

1

n − 1

n∑i=1

(Ai − Pmi )2

Si n es grande, puede ser practico en el calculo de V (X ) desarrollar el cuadradode la diferencia:

V (X ) =N(N − n)

M2n

1

n − 1

n∑i=1

(Xi − xmi )2 =

=N(N − n)

M2n

1

n − 1

(n∑

i=1

X 2i − 2x

n∑i=1

Ximi + x2n∑

i=1

m2i

)

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 40 / 55

Resumen de tipos de muestreo probabilıstico

M.A.S. M. Sistemático

M. Estratificado M. Conglomerados

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 41 / 55

Determinacion del tamano de la muestra

Tamano de muestra a tomar

La decision es importante, ya que una muestra demasiado grande desperdiciarecursos, y demasiado pequena disminuye la utilidad de los resultados.

Unicamente se estudira el caso del m.a.s.

Objetivo: Determinar el tamano muestral necesario, para estimar un parametrocon un cierto nivel de confianza, a partir de un nivel de tolerancia o error prefijado.

Notacion

θ ≡ parametro a estimar

δ ≡ error maximo admisible, es la amplitud del intervalo de confianza.

δ = |θ − θ| ≡ maxima diferencia entre estimacion y valor verdadero.

(1− α) ≡ probabilidad de que el parametro este en el intervalo.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 42 / 55

Determinacion del tamano de la muestra

Para estimar una media poblacional X

A partir de:

n0 =z2α/2S2

δ2se ajusta ese tamano n0 al caso de una poblacion finita:

n =n0

1 + n0N

donde:

S2 es la varianza poblacional (estimada mediante s2, o conocida de estudiosprevios)

zα/2 el valor de una v.a. Normal estandar que deja a su derecha un area α/2.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 43 / 55

Determinacion del tamano de la muestra

Para estimar un total poblacional X

El tamano de muestra n es:

n =n0

1 + n0N

n0 = N2z2α/2S2

δ2

donde, de nuevo:

S2 es la varianza poblacional (estimada mediante s2, o conocida de estudiosprevios)

zα/2 el valor de una v.a. Normal estandar que deja a su derecha un area α/2.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 44 / 55

Determinacion del tamano de la muestra

Para estimar una proporcion poblacional P

n =n0

1 + n0N

con n0 =z2α/2PQ

δ2

donde:

P y Q son parametros poblacionales que se estiman con P y Q, por estudiosprevios, o mediante muestra piloto.

Si no hay informacion disponible, tomar P = Q = 0.5 (criterio de maximaindeterminacion)

zα/2 el valor de una v.a. Normal estandar que deja a su derecha un area α/2.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 45 / 55

Ejemplo

Estudio acerca de la obesidad y el sedentarismo en un centro escolar.Variables del estudio:

X ≡ Cantidad de colesterol en sangre en mg/dl .Y ≡ Numero de horas semanales de videoconsola y TV.Z ≡ Practica regular de deporte (1 = SI , 0 = NO).C ≡ Posesion de videoconsola (1 = SI , 0 = NO).

Tamano muestra: n = 60. Tamano Poblacion: N = 544

Grupo A Grupo B Grupo C Grupo D Grupo E TOTAL

Curso 1 33 20 53Curso 2 20 15 30 65Curso 3 20 15 26 14 75Curso 4 27 27 25 79Curso 5 33 28 30 21 23 145Curso 6 30 34 32 31 127

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 46 / 55

Muestreo estratificado aleatorio I

Para n = 60, se debe decidir la afijacion. Se tienen 6 estratos con los siguientestamanos:

Estrato Nh

1 N1 = 532 N2 = 653 N3 = 754 N4 = 795 N5 = 1456 N6 = 127

Serıa deseable que los tamanos de los estratos guarden la mismas proporciones

que los tamanos de los estratos ⇒ Afijacion proporcional ⇒ nh = Nhn

N

n1 = 53 ·60

544= 5.84⇒ n1 = 6

n2 = 65 ·60

544= 7.16⇒ n2 = 8

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 47 / 55

Muestreo estratificado aleatorio II

n3 = 75 ·60

544= 8.27⇒ n3 = 8

n4 = 79 ·60

544= 8.71⇒ n4 = 8

n5 = 145 ·60

544= 15.99⇒ n5 = 16

n6 = 127 ·60

544= 14.00⇒ n6 = 14

A partir de los datos del manual, se calculan las medias y cuasivarianzas en cadaestrato, ası como fh y wh

Estrato xh s2h1 x1 = 155.5 s21 = 36.72 x2 = 164.625 s22 = 24.41073 x3 = 167.625 s23 = 22.55354 x4 = 168.125 s24 = 36.69945 x5 = 169.3125 s25 = 81.69586 x6 = 177.6428 s26 = 67.478

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 48 / 55

Muestreo estratificado aleatorio III

Estrato wh =Nh

Nw2h fh =

nh

Nh1− fh

1 0.095 0.009 0.1132 0.88682 0.1194 0.014 0.1231 0.87693 0.1344 0.018 0.1066 0.89344 0.1415 0.02 0.1012 0.89885 0.2598 0.0675 0.1103 0.88976 0.2276 0.0518 0.1102 0.8898

Estimacion de la media

X st =L∑

h=1

whxh =1

N

L∑h=1

Nhxh =1

544(53 · 155.5 + 65 · 164.25 + 75 · 167.625+

+79 · 168.125 + 145 · 169.3125 + 127 · 177.6428) = 168.9463

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 49 / 55

Muestreo estratificado aleatorio IV

Estimacion de la varianza

V (X st) =L∑

h=1

w2h (1− fh)

s2hnh

= (0.009 · 0.8868 ·36.7

6+ 0.014 · 0.8769 ·

21.4107

8+

+0.018 · 0.8934 ·22.5535

8+ . . .+ 0.0518 · 0.8898 ·

64.478

14= 0.728

Se estima una cantidad media de colesterol en sangre de 168.9463 mg/dl conuna varianza de 0.728 (mg/dl)2.

I.C. para la media(168.9463− 1.96

√0.728 , 168.9463 + 1.96

√0.728

)≡ (167.2739 , 170.6186)

Ası, se podrıa afirmar con un 95% de confianza que la media del colesterol estacomprendida entre 167.2739 y 170.6186

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 50 / 55

Muestreo por conglomerados en una etapa I

Estimacion de la proporcion de Z y C para tamano de muestra 60.

Los grupos en las que esta dividida la poblacion se comportan comopequenas poblaciones: conglomerado = grupo. Interesante por la facilidadde entrevistarlos.

2 o 3 grupos asegurarıan estar rondando el tamano de muestra 60⇒ m.a.s.3 conglomerados (grupos) de entre todos los del centro.

A partir de los datos del manual, se calcula la proporcion para cada conglomeradoy cada variable:

Variable Z Variable CConglomerado mi Total (Zi) Proporcion Total (Ci) Proporcion

1 20 3 0.15 10 0.52 25 2 0.08 20 0.83 23 0 0 17 0.7391

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 51 / 55

Muestreo por conglomerados en una etapa II

Estimacion de la proporcion para Z

PZ =

n∑i=1

Zi

n∑i=1

mi

=

3∑i=1

Zi

3∑i=1

mi

=3 + 2 + 0

20 + 25 + 23= 0.0735

por lo que se estima que el 7.35% de los alumnos practica deporte regularmente

Estimacion de la varianza para PZ

V (PZ ) =N(N − n)

nM2

1

n − 1

n∑i=1

(Zi − Pzmi )2 =

=21(21− 3)

3(544)21

2

[(3− 0.0735 · 20)2 + (2− 0.0735 · 25)2 + (0− 0.0735 · 23)2

]= 0.0011

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 52 / 55

Muestreo por conglomerados en una etapa III

I.C. para PZ (0.0735∓ 1.96

√0.0011

)≡ (0.00849 , 0.1385)

Por lo que se estima, con una confianza del 95% que la proporcion de personasque hace deporte esta comprendida entre el 0.8% y el 13.85%.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 53 / 55

Trabajo autonomo

Trabajo autonomo

M. Estratificado Aleatorio: Obtener el I.C. para la media de Y (de formaanaloga al llevado a cabo para la media de X ). Resultado a obtener:

Y st = 8.8633 horas V (Y st) = 0.666 (horas)2

siendo el I.C. al 95% para la media de Y : (7.2637 , 10.4628)

M. Conglomerados en una etapa: Obtener el I.C. para la proporcion de C ,(de forma analoga al llevado a cabo para Z ). Resultados que se debenobtener se detallan abajo.

PC = 0.6911 V (PC ) = 0.00049

siendo el I.C. al 95% para PC : (0.6477 , 0.7344)

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 54 / 55

Bibliografıa

Alba M. V. y Ruız-Fuentes N. (2006): Muestreo estadıstico en poblacionesfinitas. Septem Ediciones, Oviedo.

Azorın F. y Sanchez-Crespo J.L. (1994): Metodos y aplicaciones del muestreo.Alianza Universidad, Madrid.

Fernandez, F.R. y Mayor J.A. (1994): Muestreo en poblaciones finitas: CursoBasico. Editorial P.P.U. Barcelona.

Rueda M. y Arcos A. (2004): Problemas de muestreo en poblaciones finitas.Grupo Editorial Universitario, Granada.

Francisco M. Ocana Peinado (UGR) TEMA 5 Curso 2017/2018 55 / 55