Modulo 100403 Vol 1 Inferencia Estadistica

8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

1/113

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA

UNIDAD DE CIENCIAS BÁSICAS

JEAMMY JULIETH SIERRA HERNÁNDEZ

(Director Nacional de Curso)

100403 – INFERENCIA ESTADÍSTICAVol. 1

IBAGUÉFEBRERO 2013


2/113

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 2

COMITE DIRECTIVO

Jaime Alberto Leal AfanadorRector

Constanza Abadía GarcíaVicerrectora Académica y de Investigación

Gloria HerreraVicerrector de Medios y mediaciones Pedagógicos

Maribel Córdoba GuerreroSecretaria General

Inferencia Estadí stica

Tercera Versión

Actualización por Jeammy Julieth Sierra Hernández

Autores Primera Edición:Jorge RondonDanis Brito

CopyrightUniversidad Nacional Abierta y a Distancia

ISBN

2012

Unidad de Ciencias Básicas UNAD


3/113



CAMPOS DE Básica CR DITOS: 2 TRABAJO INDEPENDIENTE: 72TIPO DE CURSO Teórico C DIGO:100403 ACOMPAÑAMIENTO TUTORIAL: 24

OBJETIVO GENERAL:

Que el estudiante comprenda, aplique y desarrolle la teoría y las técnicas de lainferencia estadística en diversos campos de su saber formativo, y que dichaaplicación se convierta en una herramienta de uso matemático para la toma dedecisiones sobre hipótesis cuantitativas de datos, basado en la informaciónextraída de una muestra.

OBJETIVOS ESPECÍFICOS: Que el estudiante identifique las técnicas y procedimientos que se

deben emplear para que las muestras sean representativas de la poblaciónque se pretende estudiar, de forma que los errores en la determinación de

los parámetros de la población objeto de estudio sean mínimos.

Que el estudiante comprenda el comportamiento de una población apartir del análisis metódico de una muestra aleatoria de la misma, y queentienda que la inferencia inductiva de los parámetros estadísticos queestime sobre dicha muestra, conlleva un error, el cual es posible de sercuantificado.

Conocer los criterios técnicos que hay que tener en cuenta antes

de seleccionar un tamaño de muestra.

Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.

Diferenciar y analizar las ventajas y desventajas de la estimaciónpor intervalos de confianza y las pruebas de hipótesis.

Determinar la prueba o técnica apropiada a aplicar en las diferentespruebas de hipótesis paramétricas y No paramétricas.

COMPETENCIA GENERAL DE APRENDIZAJE:

Identificar un procedimiento adecuado para seleccionar de una población unaparte de ella, con el fin de obtener resultados confiables y poder generalizar losresultados obtenidos a toda la población.Determinar los estadísticos necesarios para el análisis y solución de situacionesque implican conjuntos de datos de su disciplina de formación, por medio del


4/113



conocimiento de la teoría elemental del muestreo y de las distribucionesmuestrales.

Plantear y desarrollar el proceso de la inferencia estadística para resolverproblemas concretos de investigación en el ámbito de otras disciplinas.

Aplicar apropiadamente los resultados teóricos y metodológicos de la inferenciaestadística de estimación y prueba de hipótesis en el marco de la modelación.

Habilidad para planear una investigación, diseño de instrumentos, definición devariables, recolección de la información, resumen y presentación de los datos.


5/113



UNIDADES DIDÁCTICAS

INTRODUCCIÓN ................................................................................................................................... 6

UNIDAD UNO: ...................................................................................................................................... 7

MUESTREO, DISTRIBUCIÓN MUESTRAL E INTERVALOS DE CONFIANZA ............................................. 7

CAPITULO UNO: PRINCIPIOS DE MUESTREO ................................................................................... 8

Lección No 1: Conceptos Básicos .............................................................................................. 10

Lección No 2: Tipos de muestreo y selección de muestra ........................................................ 15

Lección No 3: Tipos de Selección de Muestras ......................................................................... 30

Lección No 4: Métodos de Inferencias, Paramétrico y No Paramétrico ................................... 31

Lección No 5: Estimadores y propiedades de los estimadores ................................................. 34

................................................................................................................................................... 36

CAPITULO DOS: DISTRIBUCIONES MUESTRALES ........................................................................... 37

Lección No 6: Distribuciones Muestrales .................................................................................. 38

Lección No 7: Distribución Muestral de la Media y de la Proporción ....................................... 40

Lección No 8: Distribución Muestral de la proporción.............................................................. 58

Lección No 9: Distribución Muestral de Diferencias de Medias y de la Proporciones .............. 63

Lección No 10: Tamaño de la muestra para estimar la media, la proporción y el total de la

Población ................................................................................................................................... 67

CAPITULO TRES: INTERVALOS DE CONFIANZA .............................................................................. 74

Lección No 11: Nociones Fundamentales. ................................................................................ 75

Lección 12. Intervalos de confianza para medias y diferencias de medias con muestras

pequeñas 30n ..................................................................................................................... 80

Lección 13. Intervalos de confianza para la media y diferencias de medias muestras grandes

30n .................................................................................................................................... 101

Lección 14. Intervalos de confianza para la proporción y diferencias de proporciones (siempre

son muestras grandes) 30n .............................................................................................. 105

Lección 15. Intervalos de confianza para la varianza poblacional. ......................................... 107


6/113



INTRODUCCIÓN

El presente modulo está dirigido a estudiantes de programas de pregrado queoferta la UNAD, bajo la modalidad de educación superior a distancia.

El material está estructurado en dos unidades que son las temáticas macro delcurso académico.

El contenido de cada una de las partes fue seleccionado, teniendo en cuenta lossaberes mínimos que se esperaría debe alcanzar un estudiante de laUniversidad Nacional Abierta y a Distancia en el campo de la Inferenciaestadística.

La propuesta permite que los estudiantes reconozcan los conocimientosmínimos del curso en mención, que le permita resolver situaciones propias delmismo y además, abordar posteriores temáticas que requieran de éstosconocimientos.

Para el mejor aprovechamiento de este material, se recomienda que el estudianteposea como conocimientos previos: de estadística descriptiva y de la teoría deprobabilidad.

El modulo se caracteriza porque en cada lección se presentan ejemplos

modelos del tema en estudio, al final de cada capítulo se exponen ejercicios conrespuesta, que permite a los estudiantes contextualizarse en diversas áreas delconocimiento, con el fin de fortalecer las temáticas propias del curso.

Al final de cada unidad se presenta una Autoevaluación de un nivel medio-alto, lascuales permiten verificar los alcances de los estudiantes en las temáticasanalizadas y detectar las debilidades y así centrarse en éstas, con el fin dealcanzar las metas propuestas.

Finalmente, el Material pretende servir como guía de aprendizaje autónomo, serecomienda apoyar este proceso por medio de lecturas especializadas, ayudasaudiovisuales, visitas a sitios Web y prácticas de laboratorio; entre otros, asílograr una efectiva comprensión, y aplicación de las temáticas estudiadas.


7/113



UNIDAD UNO:

MUESTREO, DISTRIBUCIÓN MUESTRAL E INTERVALOS DE CONFIANZA


8/113



CAPITULO UNO: PRINCIPIOS DE MUESTREO

Introducción

En los estudios de investigación lo primero que se define es el f enómeno aanalizar, luego la población objeto de estudio, la cual puede ser finita cuandose conocen todos los elementos, o infinita cuando no se conocen todoslos elementos de la misma. Desde estos puntos de vista analizar la poblaciónno es práctico, por tiempo y costos, lo que induce a seleccionar unamuestra, cuya importancia radica en el proceso de consecución dedatos que proporcionan la información suficiente y necesaria a cerca dela población, además que con la muestra se están utilizando menos recursos,debido a que sólo una parte de la población se encuentra bajo observación,lo que resulta significativamente beneficioso sobre todo cuando se trata

de poblaciones grandes y dispersa.

Otro aspecto que justifica la decisión de tomar una muestra es en casos dondese debe destruir los elementos de ésta, por ejemplo cuando se deseaidentificar el grado de vacío de un producto enlatado, la resistencia de unmaterial y otros.

En las encuestas de opinión sobre la preferencia de un producto se nota másclaramente la utilidad de una muestra en contraste con la población,para conocer las preferencias de los consumidores y poder acomodar

rápidamente el sistema de producción a dichos cambios.

En desarrollo del presente modulo, se utiliza la coma para indicar la parte decimalde un número.


9/113



Objetivo general

Que los estudiantes identifiquen los principios sobre población y

muestra, métodos de muestreo, distribución de muestreo para medias,el teorema central del límite, aplicados al cálculo de tamaños de muestraspertinentes.

Objetivos especí f icos

Comprender los conceptos de población y muestra.

Identificar los diferentes diseños de muestreo y su utilidad en

diferentes campos del saber. Conceptuar una distribución muestra y calcular las estimacionesrequeridas, la varianza y el error de estimación para los mismos.

Conocer y comprender los elementos del teorema central delímite y su utilidad.

Determinar un tamaño de muestra representativo tanto para mediascomo para proporciones.

Realizar aplicaciones en Excel y SPSS.


10/113


CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA

10

Lección No 1: Conceptos Básicos

Dentro de la inferencia estadística, el proceso de muestreo permite que apartir de los resultados obtenidos al analizar una muestra, se pueda obtenerconclusiones en cuanto a una o varias de las características o parámetros de una

población. Esta área de la Estadística, ayuda a determinar la confiabilidad de lainferencia de que los fenómenos observados en la muestra ocurrirán tambiénen la población de donde se selecciona la muestra. Es decir, sirve paraestimar la eficacia del razonamiento inductivo con el cual se infiere que loobservado en una parte ser equivalente a lo observado en la población.

Las técnicas de muestreo son importantes en la medida que se utilice enforma adecuada para la situación que se requiera. De las técnicas másconocidas y utilizadas se tienen el Muestro Aleatorio Simple (M.A.S), Muestreo

Aleatorio Estratificado (M.A.E), Muestro Sistemático (M.S) y Muestreo porConglomerados (M.C). Se tratará de analizar estas técnicas, especialmente elM.A.S y M.A.E.

El Éxito en el desarrollo del curso en mención está en los buenosconocimientos previos en Estadística Descriptiva, Probabilidad y, algebra,Trigonometría y Geometría analítica. Lo anterior debido a que se debe predecirresultados o tomar decisiones que tienen un grado de incertidumbre o ungrado de error que se debe definir de antemano.

1.1. Población Y Muestra

Existe una serie de términos estadísticos básicos, que son muy utilizados y serequiere sean comprendidos para avanzar en otros temas o unidades, enesta sección se tratarán los conceptos de población y muestra.

Población ó Universo: Se considera a todo aquello sobre el que sedesea hacer un estudio estadístico. Según el número de unidades,elementos o casos que la constituyen, la población puede ser finita o infinita.

Población Finita: Es aquella conformada por un determinado o limitado númerode elementos.

Población Infinita: Es aquella conformada por un determinado o limitadonúmero de elementos. Cuando el número de unidades que integra una población es muy grande, sepuede considerar a ésta como una población infinita. El investigador define la


11/113



11

población objeto de estudio en términos de espacio y tiempo, ya que de estamanera los resultados serán sobre la población definida en el espaciodemarcado y en el tiempo definido.

Ejemplo

Estudiantes del Programa de Ingeniería de SistemasEstudiantes del programa de Ingeniería de sistemas de la UNADEstudiantes del programa de Ingeniería de sistemas en la UNAD de losaños2.010, 2.011 y 2.012

Muestra: Se considera una muestra al subconjunto representativo de lapoblación, que ha sido seleccionada de manera técnica mediante unprocedimiento denominado diseño de muestreo, para garantizar que dicha

muestra es representativa de la población, es decir, que las unidadesseleccionadas en la muestra mediante un proceso aleatorio, hayan tenidoigual probabilidad de haber sido seleccionadas para el análisis.

Figura 1. Población y muestra

Muestra representativa: Subconjunto de sujetos que pertenecen a unapoblación determinada. Debería tener las mismas características generales quela población. En caso contrario, tenemos una muestra sesgada. (M. J. Navas,2001, p. 19). Ir al referente. Los dos principios que determinan la

http://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htmhttp://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htmhttp://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htm


12/113



12

representatividad de una muestra son, la forma de selección, que debe seraleatoria y el otro corresponde al tamaño de la muestra.

Parámetros: Según Moore, D. (2000) es un número que describe algunacaracterística de la población. En la práctica estadística el valor del parámetro noes conocido ya que en muchos casos no podemos examinar toda la población.

Pudiendo ser por ejemplo el porcentaje de personas con VIH en Colombia, aquíel parámetro es la “Proporción” de personas en la población (Colombia) que

tienen dicho virus.Es conveniente el uso de un símbolo general para designar el parámetro de

interés, entonces éste será:

Entre los parámetros más importantes tenemos:

= Tamaño total de la población

= Promedio Poblacional= Varianza Poblacional = Desviación estándar Poblacional = Total Poblacional =Proporción poblacionalEstadístico: Es un número que se puede calcular a partir de los datos de lamuestra. Moore, D. (pág. 270). Entonces un estadístico mide características,pero en una parte de la población, es decir, en una muestra; por ejemplo elporcentaje de personas en Bogotá con VIH; aquí se evidencia que la muestra es

la capital en donde se está analizando una característica, lo que permite sacarconclusiones de todo el país, por lo cual se dice que la inferencia suministraconclusiones de la población sirviéndose de los resultados encontrados en lasmuestras.

El objetivo fundamental del muestreo es Est imar los parámetros de lapoblación a partir de algunos elementos cuyas mediciones son los Estadístic os Los estadísticos más utilizados por su importancia son:

n =Tamaño de la muestra

=Promedio de muestraS2 =Varianza MuestraS =Desviación estándar Muestra ̂ =Total Estimado

p =Proporción Muestra

Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso


13/113



13

de estimación en inferencia estadística puede ser descrito como el proceso deestimar un parámetro a partir del estadístico correspondiente, tal como usar unamedia muestra (un estadístico) para estimar la media de la población (unparámetro).

Error de muestreo (error muestral): En estadística se sabe que existen

diferencias entre lo que se obtuvo en el estudio y lo que se esperaba. En elproceso de estimación es poco probable que la media Muestra sea idéntica a lamedia poblacional, igual para la varianza y la desviación estándar. El error demuestreo es la diferencia entre el estadístico y el parámetro, es decir diferenciaentre lo encontrado en la muestra con lo esperado en la población.

es el Parámetro y es el estadístico. Recuerde que

| | es el símbolo de valor absoluto

A medida que el tamaño de la muestra aumenta el error de muestreo disminuye,

es decir, son inversamente proporcionales.

Error tolerable: Se considera el error tolerable al error máximo que seestá dispuesto a aceptar y aún considerar que el muestreo ha alcanzadosu objetivo. En todo estudio estadístico siempre se considera un error tolerable,partiendo del principio que a menor error tolerable, mayor será el tamaño de

la muestra. Si es el parámetro y es

el estadístico, el error tolerable está

determinado por B, donde:

Error estándar: La desviación estándar de una distribución, en elmuestreo de un estadístico, es frecuentemente llamada el error estándar delestadístico. Por ejemplo, la desviación estándar de las Medias de todas lasmuestras posibles del mismo tamaño, extraídas de una población, es llamada elerror estándar de la media. De la misma manera, la desviación estándar de lasproporciones de todas las muestras posibles del mismo tamaño, extraídas de unapoblación, es llamada el error estándar de la proporción. La diferencia entre los

términos desviación estándar y error de estándar es que la primera se refierea los valores originales, mientras que la segunda está relacionada con valorescalculados.


14/113



14

1.2. Razones para seleccionar una muestra

Entre los motivos que inducen a tomar una muestra aleatoria están:

Naturaleza Destructiva: Existen casos donde se requiere destruir loselementos de la muestra para medir la car acter ística, como es el caso de

medir la resistencia de un material, el vacío de un producto enlatado, otros. Noes lógico pensar en destruir todos los elementos de la población, de allí que setome una muestra.

Imposibilidad Física de Medir Todos los Elementos de la Población:Se sabe que existen poblaciones muy grandes, consideradas infinitas y escasi imposible conocer todos los elementos de la misma.

Costos: Estudiar todos los elementos de la población es muy costoso, tanto en

tiempo como en dinero, por lo que es más rentable hacer un estudio Muestra.

Confiabilidad del Estudio Muestra: Esta demostrado con soporte matemáticoque una muestra representativa arroja resultados que permiten inferir sobre lapoblación con una confiabilidad muy alta.

Unidad de observación: Son los elementos que se miden; es decir, sobre losque se toman los datos de las variables a medir. En el caso de los hogares, launidad de observación serán las personas y en el caso de las llantas delautomóvil, cada una serán las unidades de observación.

Marco de muestreo: Se considera el referente para identificar las unidades deobservación, éste NO incluye todos los elementos de la población. Ejemplos demarcos de muestreo tenemos el directorio telefónico de una ciudad, comopotenciales votantes, el registro de ventas de los últimos 5 años enuna compañía comercializadora y muchos otros.

1.3. Etapas en la Selección de La Muestra

En todo estudio de muestreo se debe definir las etapas que permiten sudesarrollo.

a) Definición de objeto de Estudio: Comprende la identificación del problema yel establecimiento de las metas que busca el estudio.


15/113



15

b) Marco de Muestreo: Establecimiento de una metodología para identificar loselementos que estarán en el muestreo, sus características y el modelo quelos identifica.

c) Identificación de Variables: Es pertinente identificar las variables deestudio, para así definir la forma de medición que se haría.

d) Tamaño de la Muestra: Por medio del modelo de muestreo pertinenteseleccionar la muestra representativa, sobre la que se realizarán lasmediciones.

e) Unidad de Muestreo: Se debe extraer las unidades de muestreo según elmodelo definido que determinan las n unidades maestrales de la población N .

f) Trabajo de Campo: Son todas las acciones necesarias para obtener la

información, definiendo los costos, desplazamientos, herramientas física ylogísticas para su realización.

g) Análisis de Información: La información obtenida, requiere de un procesoestadístico, el cual puede ser descriptivo o inferencia, para el curso quenos ocupa se deben hacer los dos.

h) Resultados: Con el proceso desarrollado sobre los datos obtenidos, seprocede a la emisión de los resultados y la confrontación con las metaspropuestas para verificar el grado de eficiencia del trabajo realizado. Es

pertinente saber presentar los resultados, ya que un buen trabajo que no sepresente de la mejor manera, quedaría oscuro en su información.

Lección No 2: Tipos de muestreo y selección de muestra

Tipos de Muestreo

Con los conceptos previos que se han analizado, ahora corresponde

estudiar las clases de muestreo. Los dos grandes grupos están enmarcados enlas siguientes clases:

Muestreo probabilístico

Muestreo No probabilístico


16/113



16

2.1. Muestreo No Probabilístico

Son aquellos muestreos donde los elementos de la muestra se toman al azar,siendo imposible determinar el grado de representatividad de la muestra. Parael caso de una población homogénea, la representatividad de tal muestra puedeconsiderarse satisfactoria.

Por otra parte, en problemas comerciales diarios y en la toma de decisionesque a falta de tiempo no permiten disecar métodos de muestreo probabilísticohay que recurrir a este tipo de muestreo, donde el investigador conoce lapoblación.

Dentro del muestreo no probabilístico se conoce variostipos:

Muestreo por conveniencia.

Muestreo por juicio Muestreo Causa / Efecto

Muestreo por Cuotas

Muestreo de Poblaciones Móviles

2.1.1. Muestreo por convenienciaLa muestra se determina por conveniencia, incorporando elementos en la muestralsin probabilidades especificadas o conocida de selección. Por ejemplo unprofesor que se encuentra investigando una causa universitaria, puede usaralumnos voluntarios para formar la muestra, tan solo porque dispone fácilmente

de ellos y participan como elementos a un costo pequeño o nulo. Tiene laventaja de ser de fácil selección y recolección de sus datos. Tiene ladesventaja de no poderse evaluar en su bondad de la muestra enfunción de la representatividad de la población, motivo por el cual se haceimposible inferir a cerca de la población correspondiente.

2.1.2. Muestreo por juicioEn este método la persona por experiencia y capacidad selecciona a losindividuos u otros elementos de la población, que supone son los más

representativos de esa población. Por ejemplo un reportero puedemuestrear uno o dos senadores, por considerar que ellos reflejan la opinióngeneral de todos.

2.1.3. Muestreo causa / efectoSe realiza cuando no hay una población definida y se requiere tomarelementos para el estudio en cuestión, caso por el cual se toman los elementosdisponibles.


17/113



17

2.1.4. Muestreo por cuotas

Cuando es necesario obtener una cantidad dada de elementos que constituyenuna muestra proporcional a la población, se toman elementos hasta cubrirdicha cuota. El caso de tomar una cantidad de carros en una esquina para

hacer un estudio sobre accidentalidad en dicho sitio.

2.1.5. Muestreo de poblaciones móviles

Método propio de poblaciones móviles como en estudios de migraciónocurridos en un sitio determinado. El caso típico es con animales que migran,donde se hace captura-marca- recaptura.

2.2. Muestreo Probabilístico

El muestreo aleatorio o muestreo probabilístico, es aquel en que cada uno delos elementos de la población objeto de estudio, tienen una probabilidadmatemática conocida, y frecuentemente igual, para ser elegido en la muestra.

Muestra probabilística

Una muestra se considera probabilística si cumple con las siguientescondiciones:

a) Se pueda definir un conjunto de muestras M1, M2, M3... Mi posibles

derivados del proceso de selección propuesta. Así se puede iden ti fi ca rque unidades de muestreo pertenecen a la muestra M1, M2, M3... Mi

b) A cada muestra posible le debe corresponder una probabilidad deselección conocida P(S).

c) El proceso de selección garantiza que todos los elementos de la poblacióntienen una probabilidad P(yi)>0 de ser elegido en alguna muestra.

d) La selección es un proceso aleatorio que garantiza que cadamuestra S tenga una probabilidad P(S) de ser elegida. Muestreo aleatoriosimple

Dentro del muestreo probabilístico o aleatorio existen cuatro métodos:1. Muestreo aleatorio simple2. Muestreo estratificado3. Muestreo sistemático4. Muestreo por conglomerados


18/113



18

2.2.1. Muestreo Aleatorio Simple

El M A S es la forma m á s sencilla de muestreo probabilístico y es la base detécnicas más complejas. La muestra se puede tomar de una población finitao infinita, la cantidad de muestras posibles depende del tipo de diseño y la

forma de tomar las muestras. Este tipo de muestreo se utilize cuando seconsidera que la población es más o menos homogénea. Como ya sabemos elmuestreo puede ser con y sin reemplazamiento.

El marco de muestreo corresponde a la lista codificada de todas las observacionesque hacen parte de la población. La muestra se elige de tal manera que cadaobservación tiene la misma probabilidad de ser elegida, la elección de unaobservación NO tiene influencia sobre la elección de otra. Es de aclarar que en elM.A.S la unidad de muestreo es igual a la unidad de observación.

Este tipo de muestreo requiere la construcción de un marco demuestreo, consistente en el listado completo de las unidades de lapoblación.

Técnicas para Seleccionar la Muestra

a) Tabla de números aleatorios

(Ver tabla siguiente). Se enumeran las unidades que conforman la población

objetivo de estudio, partiendo desde 01 hasta 99, desde 001 hasta 999, y asísucesivamente, dependiendo del tamaño poblacional. Luego se define eltamaño de la nuestra y como los elementos de la población estánlistados y codificados, entonces se establece un punto de partida:Columna x Fila y, se van leyendo ya sea horizontal o verticalmente losnúmeros de la tabla hasta completar el tamaño de la muestra.

Ejemplo

Suponga que tenemos N=30 facturas de servicios públicos (unidades en lapoblación), saque una muestra aleatoria simple de tamaño n=5.

Paso 1: Asigne etiquetas: Dé a cada unidad en la población un número, etiqueta oidentificación. Todas las etiquetas deben tener el mismo número de dígitos. Comotenemos 30 unidades y el número 30 tiene dos dígitos, todas las unidades tienenque tener dos dígitos.


19/113



19

Tabla 1.Facturas de servicios públicos

Paso 2: Use la tabla: Empezando en un lugar escogido al azar lea grupos dedígitos (dependiendo del número de dígitos en las etiquetas) de izquierda aderecha, continuando con la línea siguiente cuando se acabe la línea que estáleyendo. Si el grupo de dígitos corresponde a una de las etiquetas, ese númeroidentifica a una de las unidades que será seleccionada. Si el grupo de dígitos nocorresponde a una de las etiquetas o si ya fue seleccionado, se salta al gruposiguiente.

Por ejemplo suponga que el lugar de partida escogido al azar fue la fila 05,columna 1 (la columna 1 es la 12345) y la lectura sera vertical (aunque puede serhorizontal):

Se toman dos digitos porque la muestra es 30 (que tiene dos digitos)33850 Este número no se escoge porque está por encima de 30

97340Este número no se escoge porque solo se escogen numerous entre01 y 30. Se sigue buscando y se llega hasta un número menor oigual a 30

Este número si se escoge porque es menor a 30.14756

Se continúa y si con la primera columna no se han encontrado los 5 números parala muestra se pasa a la siguiente.

Cabe notar que el número 23913 de la tabla se salta ya que se repite el 23 que seencontró en 23236

La muestra está conformada por las observaciones que se ubican en la posición:14, 23, 09, 11 y 06

Recibo No. Valor $ Recibo No. Valor $ Recibo No. Valor $

01 $ 45.661 11 $ 37.798 21 $ 44.901

02 $ 43.629 12 $ 33.672 22 $ 40.155

03 $ 41.502 13 $ 39.607 23 $ 48.082

04 $ 45.069 14 $ 34.904 24 $ 32.825

05 $ 45.813 15 $ 36.701 25 $ 45.915

06 $ 49.687 16 $ 34.001 26 $ 30.382

07 $ 45.960 17 $ 36.302 27 $ 41.835

08 $ 35.001 18 $ 48.728 28 $ 47.227

09 $ 49.553 19 $ 48.706 29 $ 48.485

10 $ 46.976 20 $ 34.881 30 $ 45.159


20/113



20

Tabla 2.

Números aleatorios

Columna

00000 00001 11111 11112 22222 22223 33333 33334

Renglón 12345 67890 12345 67890 12345 67890 12345 67890

0149280 88924 35779 00283 81163 07275 89863 02348

02 61870 41657 07468 08612 98083 97349 20775 45091

03 43898 65923 25078 86129 78496 97653 91550 08078

04 62993 93912 30454 84598 56095 20664 12872 64647

05 33850 58555 51438 85507 71865 79488 76783 31708

06 97340 03364 88472 04334 63919 36394 11095 92470

07 70543 29776 10087 10072 55980 64688 68239 20461

08 89382 93809 00796 95945 34101 81277 66090 88872

09 37818 72142 67140 50785 22380 16703 53362 44940

10 60430 22834 14130 96593 23298 56203 92671 15925

11 82975 66158 84731 19436 55790 69229 28661 1367512

39087 71938 40355 54324 08401 26299 49420 59208

13 55700 24586 93247 32596 11865 63397 44251 43189

14 14756 23997 78643 75912 83832 32768 18928 57070

15 32166 53251 70654 92827 63491 04233 33825 69662

16 23236 73751 31888 81718 06546 83246 47651 04877

17 45794 26926 15130 82455 78305 55058 52551 47182

18 09893 20505 14225 68514 46427 56788 96297 78822

19 54382 74598 91499 14523 68479 27686 46162 83554

20 94750 89923 37089 20048 80336 94598 26940 36858

21 70297 34135 53140 33340 42050 82341 44104 82949

22 85157 47954 32979 26575 57600 40881 12250 73742

23 11100 02340 12860 74697 96644 89439 28707 25815

24 36871 50775 30592 57143 17381 68856 25853 35041

25 23913 48357 63308 16090 51690 54607 72407 55538

26 79348 36085 27973 65157 07456 22255 25626 57054

27 92074 54641 53673 54421 18130 60103 69593 49464

28 06873 21440 75593 41373 49502 17972 82578 16364

29 12478 37622 99659 31065 83613 69889 58869 29571

30 57175 55564 65411 42547 70457 03426 72937 83792 31 91616 11075 80103 07831 59309 13276 26710 73000

32 78025 73539 14621 39044 47450 03197 12787 47709

33 27587 67228 80145 10175 12822 86687 65530 49325

34 16690 20427 04251 64477 73709 73945 92396 68263

35 70183 58065 65489 31833 82093 16747 10386 59293

36 90730 35385 15679 99742 50866 78028 75573 67257

37 10934 93242 13431 24590 02770 48582 00906 58595

38 82462 30166 79613 47416 13389 80268 05085 96666

39 27463 10433 07606 16285 93699 60912 94532 95632

40 02979 52997 09079 92709 90110 47506 53693 49892

41 46888 69929 75233 52507 32097 37594 10067 67327

42 53638 83161 08289 12639 08141 12640 28437 09268

43 82433 61427 17239 89160 19666 08814 37841 12847

44 35766 31672 50082 22795 66948 65581 84393 15890

45 10853 42581 08792 13257 61973 24450 52351 16602

46 20341 27398 72906 63955 17276 10646 74692 48438

47 54458 90542 77563 51839 52901 53355 83281 19177

48 26337 66530 16687 35179 46560 00123 44546 79896

49 34314 23729 85264 05575 96855 23820 11091 79821

50 28603 10708 68933 34189 92166 15181 66628 58599

Fuente:Web

Paso 3: Indicar según las posiciones que arroja la tabla de números aleatorios


21/113



21

cuales elementos se escogerán para la muestra

Tabla 3:Selección muestra de 5 recibos ejemplo 1

Este método de selección permite que todos los elementos que constituyen la

población tengan la misma posibilidad de ser incluidos en la muestra. Loselementos se escogen en forma individual y aleatoriamente de la totalidad dela población. Esta selección puede ser sin reemplazamiento, similar a la quese realiza en la extracción aleatoria de números en el juego denominado baloto.Cada elemento que constituye la muestra se selecciona una sola vez,denominándose extracciones sin reposición.

En otras ocasiones, cada elemento puede ser elegido más s de una vez enla misma muestra, como por ejemplo, cuando se selecciona aleatoriamente elnúmero ganador de una lotería, que puede ocurrir ser el mismo número; enestos casos se dice que las extracciones son realizadas con reposición.

b) Programa de Computador: Utilizando el programa Excel que es el máscomún se puede desarrollar números aleatorios de la siguiente manera:

Si la población es de N = 1.000 observaciones y se desea una muestra de 20,entonces: Sobre una celda se escribe =ALEATORIO ()*N y se da clic, elsistema genera el primer número aleatorio, se despliega en la parte inferiorderecha de la celda del número hasta el tamaño de la muestra definida.

Sintaxis para obtener números aleatorios de una población de 1000observaciones

Figura 2. Sintaxis número aleatorio en Excel

No. Recibo Valor $ No. Recibo Valor $ No. Recibo Valor $

01 $ 45.661 11 $ 37.798 21 $ 44.901

02 $ 43.629 12 $ 33.672 22 $ 40.155

03 $ 41.502 13 $ 39.607 23 $ 48.082

04 $ 45.069 14 $ 34.904 24 $ 32.825

05 $ 45.813 15 $ 36.701 25 $ 45.915

06 $ 49.687 16 $ 34.001 26 $ 30.382

07 $ 45.960 17 $ 36.302 27 $ 41.835

08 $ 35.001 18 $ 48.728 28 $ 47.227

09 $ 49.553 19 $ 48.706 29 $ 48.485

10 $ 46.976 20 $ 34.881 30 $ 45.159


22/113



22

Al dar clic se genera el primer número aleatorio y desplegando se obtiene losque se desea.

De esta manera se obtiene los números aleatorios que se requierenpara tomar la muestra aleatoria de la población objeto de estudio. Si sevuelve a hacer el proceso, se obtendrán nuevos números y cada que se realice

un nuevo proceso, se generarán diferentes números; esto por lo de Aleatorio.

VIDEOS

c) Método de Fan Muller:

Para seleccionar una muestra aleatoria simple mediante este método hay queseguir los siguientes pasos:

1. Para cada elemento de la población se genera un número aleatorio entre 0y 1. Ese número aleatorio se llamará r.

2. Se hace un recorrido secuencial de la población y se incluye a la muestrael número aleatorio r si cumple: Comprobando que no estuviera anteriormente introducida, en el caso deque esté repetida se pasa a la siguiente unidad. Si se introduce la unidadse vuelve a empezar en el paso 1.

3. El algoritmo termina cuando d) Coordinado Negativo: El proceso general es de la siguiente manera:

1. Se adiciona una variable aleatoria U con distribución uniforme U (0, 1)2. Se ordena el marco muestral según la distribución U.3. La muestra se forma de los n primeros elementos del marco ordenado

Selección de

muestras a través

de M A S

https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1


23/113



23

2.2.2. Muestreo Aleatorio Estratificado

En el diseño de muestreo probabilístico, es pertinente identificar la poblaciónobjeto de estudio, ya que no siempre la variable de análisis es más o menoshomogénea. Si se desea analizar la variable peso; por lo general los hombres

pesan más s que las mujeres, en estratos altos se paga más arriendo queen estratos bajos. En estos y otros muchos casos el M. A. S. no es adecuado.En casos donde la población es muy heterogénea respecto a la variablede estudio el muestreo estratificado es mejor que el muestreo aleatorio simple.La palabra estratificar hace referencia a formar Capias.

DEFINICIÓN: Una muestra aleatoria estratificada se obtiene mediante laseparación de los elementos de la población en subgrupos llamados ESTRATOS,los cuales son disyuntos.

Obtenidos los estratos, en cada uno se obtiene la muestra por M.A.S para elestudio de la variable de interés.

Como los elementos de los estratos son disyuntos, entonces cadaunidad de muestreo pertenece solo a un estrato. Las muestrasseleccionadas en los estratos deben ser independientes; es decir, la elegidaen un estrato no debe afectar la elección de otra muestra en otro estrato.

La esencia de la estratificación es que ésta saca provecho de lahomogeneidad conocida de las sus poblaciones, de tal forma sólo se requieranmuestras relativamente pequeñas para estimar las características de cadasub-población, estas estimaciones individuales pueden entonces serfácilmente combinadas para producir una estimación de toda lapoblación; además, la economía en el tamaño de la muestra, unvalioso sub-producto del esquema del muestreo estratificado es que lasestimaciones obtenidas para diferentes partes de la población sepueden usar posteriormente para hacer comparaciones.

Para una descripción general del muestreo aleatorio estratificado y losmétodos de inferencia asociados con este procedimiento, suponemosque la población está dividida en h subpoblaciones o estratos de tamañosconocidos N 1, N 2 ,..N h tal que las unidades en cada estrato sean

homogéneas respecto a la característica en cuestión.


24/113



24

Figura 3. Población divida en estratos

Ejemplo

Población de tutores del CEAD Ibagué - UNAD (ver figura 3). El tamaño de lapoblación 18 tutores (N= 18), la cual está dividida en 3 escuelas o subgrupos(H=3). Cada escuela es un estrato, y se tiene que son diferentes los perfiles de lostutores de una escuela a otra pero al interior de cada una son similares susprofesiones, esto significa que los subgrupos son heterogéneos entre sí, perohomogéneos dentro de cada uno.

VENTAJAS DEL MUESTREO ESTRATIFICADO

1. Evitar la obtención de muestras erróneas, tal es el caso deescoger elementos que podrían sesgar el muestreo, por consiguientese puede perder representatividad de la población.


25/113



25

2. Obtener información precisa de ciertos subgrupos para hacercomparaciones

3. Producir un límite de error de estimación (B) más pequeño, comparado conel obtenido en el M.A.S. para un mismo tamaño de muestra.

4. Los costos por observación en las encuestas son más reducidos yaque se evitan desplazamientos extremos.

5. Las estimaciones se obtienen por subgrupos así los estratos se hacenidentificables.

Notación: Partiendo de la población o universo U cuyo tamaño es N,ésta se divide en NL estratos.

Figura 4. Tamaño de estratos

N = N1 + N2 +…+NL (Tamaño poblacional) = Tamaño del estrato i. = Valor de la observación j en el Estrato i. = Media poblacional en el estrato i.= Varianza poblacional en el estrato i.

= Total poblacional en el estrato i.

Proporcion poblacional en el estrato iLa media poblacional del estrato, la varianza poblacional del estrato, eltotal poblacional del estrato y el total poblacional, se obtiene de la siguientemanera:

En cada estrato se obtiene una muestra aleatoria por M.A.S. Si tenemos el


26/113



26

estrato l, se puede hacer el siguiente análisis.

Tamaño de la muestra en el estrato i Promedio de la muestra del estrato i

Varianza muestral del estrato i

̂ Proporción estimada del estrato i ∑ Donde son los elementos j del estrato iTamaño de la submuestras en los estratos

Ecuación No.1

Dónde:

N = Tamaño de la población

N = Tamaño de la muestra

Ni= Tamaño del estrato i

ni= Tamaño de muestra en el estrato i

N= N1+N2+N3+..+Nh

n = n1 + n2+…+ ni

Ejemplo

La sección operativa de una empresa de confecciones cuenta con 100empleados, la cual está dividida en operarios de maquina plana, dibujantes ycortadores, de los que hay 40, 35 y 25 operarios respectivamente; se quiere hacerun estudio estadístico y se toma una muestra de 20 empleados. ¿Cuántosoperarios de cada línea deben escogerse si la selección se hace a través de unmuestreo estratificado?

N= 100n = 20

N1= 40N2= 35N3= 25


27/113



27

La muestra de 20 empleados debe estar compuesta por 8 de máquina plana,7 dibujantes y 5 cortadores.

2.2.3. Muestreo Sistemático

Es utilizado por algunos contadores para revisar sumas, cuentas, inventarios,etc., por ser un método directo y económico. Consiste en seleccionar uno a

uno, los elementos de la muestra en un orden determinado, dando un inicioaleatorio. Es decir, la muestra queda ordenada.La fracción de muestreo se establece por medio de la siguiente relación: Dónde:

f = Fracción de muestreo

N= Población

n = Tamaño de la muestra

Ejemplo

De una población de 1.000 observaciones, se desea tomar una muestra de 10,cuáles serían las observaciones que harían parte de la muestra sistemática.

La fracción de muestreo es: f = Fracción de muestreoN= Poblaciónn = Tamaño de la muestra

Como la fracción de muestreo dio 100, el primer elemento se seleccionaaleatoriamente en el intervalo cero a cien, por ejemplo seleccionando elnúmero 25, el segundo elemento que se selecciona es 125 (25+100), luego el225 (125+100) y así sucesivamente, hasta completar la muestra de diez.


28/113



28

Puede ver un ejemplo de muestreo sistemático en:https://sites.google.com/site/unadjeammysh/recursos-de-apoyo

Figura 5. Recursos de apoyo

Un problema específico del muestreo sistemático es la existencia de cualquier

factor periódico o cíclico en la lista de la población que pudiera conducir aun error sistemático en los resultados muestrales.

Ejemplo

Si en un hospital hay un universo de quince mil cien historias clínicasque están numeradas interrumpidamente y se desea tener una muestraequivalente al 10%, o sea, mil quinientas diez historias, ello significa que hade tomarse una de cada 10, ya que (15100 /1510 = 10). La primera historiapuede seleccionarse del primer grupo de 10. Si la primera historia

seleccionada es la número 8 en la población, teniendo en cuenta que elocho es un número cualquiera tomado aleatoriamente; la segunda será la 18=(8+10) la tercera será la 28 = (18 + 10), la cuarta será la 38 = (28 + 10), y asísucesivamente.

La estimación y tamaño de muestra tiene un análisis similar al muestreoaleatorio simple M.A.S.

2.2.4. Muestreo Conglomerados

Este es un método de muestreo aleatorio en el que los elementos de lapoblación se dividen en forma natural en subgrupos, de tal forma que dentro deellos sean lo más heterogéneo posible y entre ellos sean homogéneos, casocontrario al muestreo estratificado.

Este tipo de muestreo se usa en particular cuando no se dispone de una

Clic allí para descargar archivo

https://sites.google.com/site/unadjeammysh/recursos-de-apoyohttps://sites.google.com/site/unadjeammysh/recursos-de-apoyohttps://sites.google.com/site/unadjeammysh/recursos-de-apoyo


29/113



29

lista detallada y enumerada de cada una de las unidades que conforman eluniverso y resulta muy complejo elaborarla. Se le denomina así debido aque en la selección de la muestra en lugar de escogerse cada unidad seprocede a tomar los subgrupos o conjuntos de unidades, a los que se llama"conglomerados". Aunque quizá por ello se tienda a creer que es lomismo que el estratificado, ambos se diferencian en que en los

conglomerados los subconjuntos se dan en la vida real o ya estánagrupados de esa manera; por ejemplo: Escuelas, tipos de Industrias,bloques de casas y otros. En el estratificado el investigador decide lasagrupaciones que utilizar según la posible variabilidad de los fenómenos aestudiar; otra diferencia es que en este el investigador conoce la distribuciónde la variable, todo lo contrario que en el muestreo por conglomerado.

El proceso se indica definiendo los conglomerados, después se seleccionan lossubconjuntos a estudiar (o sea, que se realiza un muestreo de

conglomerados); de estos seleccionados se procede a hacer el listado de lasunidades que componen cada conglomerado, continuando posteriormente con laselección de las unidades que integrarán la muestra, siguiendo algunos de losmétodos aleatorios indicados.

Si se desea hacer un estudio en las escuelas de educación primaria sobre undeterminado fenómeno, inicialmente se seleccionan las escuelas que seestudiarán, de esas escuelas seleccionadas se determinan los grados o clasesque deben incluir y posteriormente se escogen los alumnos, que serán lasunidades de observación, utilizando uno de los métodos aleatorios. Se estima

que las inferencias que se hacen en una muestra conglomerada no son tanconfiables como las que se obtienen de un estudio hecho por muestreo aleatorio.

Ejemplo

Si un analista de la Secretaría de Salud necesita hacer un estudio de losservicios médico-asistenciales que reciben los trabajadores del áreametropolitana, sería difícil obtener una lista de todos los trabajadores de lapoblación objetivo. Sin embargo podría obtenerse una lista de las empresas yfábricas del área. Con esta lista, el analista puede tomar una muestra aleatoriade las empresas o fábricas, que representan conglomerados detrabajadores, y obtener la información de los servicios médicos que se lesestán prestando.


30/113



30

Lección No 3: Tipos de Selección de Muestras

En el diseño Muestra hacemos referencia a la probabilidad de selección, lacual consiste en definir el valor de probabilidad de que una muestra dadasea seleccionada. En teoría de probabilidad existen dos tipos de selección:

3.1. Selección con Reemplazamiento:

Consiste en que los elementos seleccionados una vez medidos vuelven a lamuestra, lo que hace que el espacio Muestra permanezca constante. Por loanterior la ocurrencia de un evento no afecta la ocurrencia de otro, por lo quelos eventos se consideran independientes.

Ejemplo

Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. ¿ Cuál serála probabilidad que al seleccionar dos bolas, estas sean blancas?

La probabilidad de que la primera sea negra es: La probabilidad de que la segunda sea negra es:

3.2. Selección sin Reemplazamiento:

Los elementos elegidos una vez la medición, estos NO vuelven a lamuestra, lo que hace que el espacio muestral cambie a medida que se vantomado elementos de la muestra.

Ejemplo

Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. ¿Cuál será laprobabilidad que al seleccionar dos bolas estas sean blancas, la selección essin reemplazamiento?

La probabilidad de que la primera sea negra es: 4/9La probabilidad de que la segunda sea negra es: 3/8Recordemos que una vez elegida la primera, ésta no vuelve a la muestra.


31/113



31

Ejemplo

Suponga que tenemos N = 4 unidades 1, 2, 3 y 5 en una poblaciónhipotética y desea seleccionar muestras con reemplazamiento y sinreemplazamiento de tamaño n=2

Para los propósitos de esta selección, los valores podrían ser el número delas personas que viven en cada una de cuatro unidades habitacionales queconstituyen una población. Se realizará una comparación entre el muestreoaleatorio con y sin reemplazamiento para una muestra de tamaño n=2.Primero se listan todas las posibles muestras no ordenadas de tama ño n= 2.

Para recordar:

Tabla 4:Técnicas de conteoMuestreo Con Orden Sin Orden

Con Repetición Regla del exponente (o permutacionescon repetición)

N n

Multiplicación de opciones:n1 x n2 x n3….

Combinaciones

Sin Repetición Permutaciones (de n elementos tomadostodos a la vez)

N! = N P n

Permutaciones (de N elementos tomadosde r en r. con )

Combinaciones (de Nelementos tomados de r en r.

con )

Lección No 4: Métodos de Inferencias, Paramétrico y No

Paramétrico

4. Métodos De InferenciaLos procedimientos de inferencia permiten establecer conclusiones acerca deuna población, a partir de las propiedades estudiadas en una muestra de ella.

Además, como dichas conclusiones dependen de sucesos aleatorios, se lesasociará un nivel de confianza o de verosimilitud.


32/113



32

Gráfico No.1 Métodos de inferencia

4.1. Métodos ParamétricosResuelve objetivos relacionados con parámetros de una población, tales comomedia, varianza, proporción etc. Estos modelos se apoyan en el conocimientode la distribución de probabilidad asociada a dicha población aunque sedesconozca algún parámetro de dicho modelo. Por ejemplo podemos suponerque el número de clientes atendidos por hora en una entidad bancaria sigue unmodelo de Poisson pero de parámetro µ desconocido.

Para resolver un problema de inferencia paramétrico se utilizan dos tipos deprocedimientos:

4.1.1. Estimación: Puntual cuando obtenemos valores aproximados del

parámetro desconocido y una medida de error asociado; por Intervaloscuando obtenemos un rango de valores, que contiene el verdadero valordel parámetro con una probabilidad o confiabilidad prefijada.

4.1.2. Test de Hipótesis: Cuando aceptamos o rechazamos una hipótesisrelacionada con uno o varios parámetros de una población desconocidos,con un cierto nivel de error prefijado.

4.2. Métodos no paramétricoLos métodos no paramétricos se refieren a menudo como distribución

libremente métodos pues no confían encendido asunciones que los datos estándibujados del dado distribución de la probabilidad. Resuelven situacionesrelacionadas con el tipo de distribución de probabilidad asociada a la poblaciónde estudio u otros objetivos no relacionados directamente con parámetros.

Lo deseable en estos casos será buscar la inferencia en contrastes que seanválidos bajo un amplio rango de distribuciones de la población. Tales contrastes

Métodos deInferencia

Parámetrico

EstimaciónPruebas deHipótesis

No

Parámetrico

Pruebas NoParámetricas

http://www.worldlingo.com/ma/enwiki/es/Assumptionhttp://www.worldlingo.com/ma/enwiki/es/Probability_distributionhttp://www.worldlingo.com/ma/enwiki/es/Probability_distributionhttp://www.worldlingo.com/ma/enwiki/es/Assumption


33/113



33

se denominan no paramétricos.

El término no paramétrico no se significa implicar que tales modelos carecentotalmente parámetros, sino que el número y la naturaleza de los parámetros sonflexibles y no fijados por adelantado.

Ventajas y Desventajas

Las pruebas no paramétricas no necesitan suposiciones respecto a lacomposición de los datos poblacionales. Las pruebas no paramétricas son deuso común:

1. Cuando no se cumplen las suposiciones requeridas por otrastécnicas usadas, por lo general llamadas pruebas paramétricas.

2. Cuando es necesario usar un tamaño de muestra pequeño y no es

posible verificar que se cumplan ciertas suposiciones clave.3. Cuando se necesita convertir datos cualitativos a información útil parala toma de decisiones.

Existen muchos casos en los que se recogen datos medidos en una escalanominal u ordinal. Muchas aplicaciones de negocios involucran opiniones osentimientos y esos datos se usan de manera cualitativa.

Ventajas

Las pruebas no paramétricas tienen varias ventajas sobre las pruebas

paramétricas:

1. Por lo general, son fáciles de usar y entender.2. Eliminan la necesidad de suposiciones restrictivas de las pruebas

paramétricas.3. Se pueden usar con muestras pequeñas.4. Se pueden usar con datos cualitativos.

Desventajas

También las pruebas no paramétricas tienen desventajas:

1. A veces, ignoran, desperdician o pierden información.2. No son tan eficientes como las paramétricas.


34/113



34

Lección No 5: Estimadores y propiedades de los estimadores

5. Estimador

En estadística, un estimador es un estadístico (esto es, una función de lamuestra) usado para estimar un parámetro desconocido de la población. Porejemplo, si se desea conocer el precio medio de un artículo (el parámetrodesconocido) se recogerán observaciones del precio de dicho artículo endiversos establecimientos (la muestra) y la media aritmética de lasobservaciones puede utilizarse como estimador del precio medio.

Para cada parámetro pueden existir varios estimadores diferentes. En general,escogeremos el estimador que posea mejores propiedades que los restantes,como insesgadez, eficiencia, convergencia y robustez (consistencia).

5.1. Propiedades de un estimadorEl concepto de estimación de parámetros mediante la especificación de laspropiedades que deben cumplir los estimadores y el desarrollo de técnicasapropiadas para implementar el proceso de estimación. Se utilizar · el puntode vista práctico de la teoría del muestreo, que considera un parámetro comouna cantidad fija pero desconocida.

Para evaluar la calidad de un estadígrafo como un estimador este debe

cumplir las siguientes propiedades:

5.1.1. Insesgado

Un estimador insesgado es aquel cuya media o valor esperado de la distribuciónde las de las estimaciones es igual al parámetro estimado. En otras palabras,cuando el promedio de un estimador muestral es igual al parámetro poblacionalque se desea estimar.

5.1.2. Eficiencia:

La eficiencia se refiere al tamaño del error estándar del estadígrafo de lamuestra. Si se comparan dos estadígrafos de una muestra del mismo tamaño yse desea decidir cuál de los dos es el estimador más eficiente, se escogeráel estadígrafo que tenga el menor error estándar o desviación de ladistribución muestra. Supóngase que se escoge una muestra de un tamañodado y se decide cuando usar la media muestra o la mediana muestra para


35/113



35

estimar la media de la población. Si se calcula el error estándar de la mediamuestra y se encuentra que es igual a 2.15 y luego se calcula el errorestándar de la mediana muestra y se encuentra que es de 2.6, se podrádecir que la media muestra es un estimador más eficiente de la media de lapoblación porque su error estándar es menor o con menos variación, tendráuna mayor oportunidad de producir un estimador más cercano al parámetro de

la población bajo estudio.

5.1.3. Consistencia:

Un estadígrafo es un estimador consistente de un parámetro de la poblaciónsi en la medida en que el tamaño de la muestra aumenta se está seguro deque el valor del estadígrafo se acerca al valor del parámetro de la población.

Cuando un estimador es consistente, se vuelve más confiable tomando

muestras grandes. De esta manera, cuando usted se preocupa poraumentar el tamaño de la muestra para obtener más información acerca deun parámetro de la población, debe primero encontrar si su estadígrafo esun estimador consistente, si no es así, usted desperdiciará dinero y tiempoal tomar muestras grandes.

5.1.4. Suficiencia:

Estadísticos que, de alguna manera, resumen toda la información de una muestrarelacionada con un parámetro objetivo, se dice que tienen la propiedad de

suficiencia, es decir, utilizan toda la información relevante contenida en unamuestra.


36/113



36

Ejercicios propuestos

En cierta cadena de centros comerciales trabajan 150 personas en eldepartamento de personal, 450 en el departamento de ventas, 200 en el de

contabilidad y 100 en el de servicios al cliente. Con el objeto de realizar unaencuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. Quénúmero de trabajadores tendríamos que seleccionar en cada departamentoatendiendo a un criterio de proporcionalidad

R/ta: 30, 90, 40, 20

Suponga que se quiere estimar el número de días-hombre perdidos debidoa accidentes de trabajo en un mes particular. Además se sabe que la mayorparte de dichos accidentes se presentan en los niveles operativo, técnico y

administrativo. ¿Cuál de los siguientes diseños de muestreo es el másaconsejable?:

R/ta: Estratificado, identificando como estrato los niveles de trabajo

Supongamos que en la ciudad “T” hay 200 barrios. Si elegimos al azar dosde estos barrios, de manera que la muestra esté compuesta por todoslos individuos de esos dos barrios. Se trata de de:

R/ta: Por conglomerados

Se ha proyectado realizar una encuesta sobre el consumo de leche enlas familias. El número de familias de la población es 6000 y el tamaño dela muestra 840, con la siguiente clasificación de profesión u oficio:

Profesionales: 100 Comerciantes: 200Operarios: 2000 Agricultores: 600Servicios 1900 Empleados: 1200

Cuántas familias de agricultores deben estar representadas en la muestra.R/ta: 84


37/113



37

CAPITULO DOS: DISTRIBUCIONES MUESTRALES

Introducción

Como se ha señalado anteriormente, el propósito del muestreo es averiguar lascaracterísticas de la población en estudio. Se recuerda de nuevo que parapoder dar conclusiones de los parámetros se usan los estadísticos que sonmediciones obtenidas en la muestra, mientras que los parámetros soncaracterísticas medibles propias de la población.

El escoger una muestra, es un proceso que inevitablemente puede arrojardiferentes subconjuntos de la población, por ejemplo de la población de tutores,se puede escoger como muestra los tutores de la ECBTI o escoger los deECEDU. El valor del estadístico es aleatorio porque depende de los elementoselegidos en la muestra seleccionada- también aleatoriade tamaño “n” y, por lotanto, el estadístico tiene una distribución de probabilidad la cual es llamada laDistribución Muestral del estadístico.

Objetivo general

Que los estudiantes lleguen a formar, no sólo, una muestra si no un conjunto deposibles muestras de una población, con las unidades de observación y seancapaces de reconocer la distribución de ese conjunto de muestras.

Objetivos especí f icos

Comprender la importancia del teorema del límite central.

Establecer las diferencias entre un parámetro y un estadístico


38/113



38

Lección No 6: Distribuciones Muestrales

En estadística, la distribución muestral es lo que resulta de considerar todas lasmuestras posibles que pueden ser tomadas de una población. Su estudio permite

calcular la probabilidad que se tiene, dada una sola muestra, de acercarse alparámetro de la población. Mediante la distribución muestral se puede estimar elerror para un tamaño de muestra dado.

Como bien lo afirma Ximenez, C. (S, F.) “La estadística inferencial trata sobre las

inferencias con respecto a las poblaciones (sus parámetros µ y σ 2 ) a partir de la

información contenida en las muestras (los estadísticos ̅ y S2 ).Para poder llevar a cabo esas inferencias es necesario conocer la relación que se

establece entre estadísticos y parámetros. El concepto que permite poner en

relación ambas cosas es “la distribución muestral de un estadístico”.

Figura 6. Distribución de un estadístico Algunos estadísticos pueden ser: La media, la proporción y la desviación.Recuerde que todos son cálculos en las muestras.

A cada una de las muestras se les calcula el respectivo estadístico, es decir, setendrá tantos estadísticos como muestras se haya obtenido. Por ejemplo, si el

estadístico que se está estimando es la media, y si se obtuvo 8 muestras,entonces, serán 8 medias muestrales las que tendrá.

Con todos los resultados del estadístico en todas las muestras, se forma ladistribución muestral del estadístico.

Distribución Muestral: Es la distribución de Probabilidad de un estadístico


39/113



39

6. Diferentes distribuciones muestrales

Ya que a nivel muestral se pueden calcular diferentes estadísticos, como lamedia, desviación y la proporción entre otros, se pueden encontrar susrespectivas distribuciones muestrales, entre estas:

Distribución muestral de la medias Distribución muestral de las proporciones

Distribución muestral de la diferencias de medias

Distribución muestral de la diferencias de proporciones

Nota: El muestreo se puede hacer sin o con reemplazamiento.

Ejemplo

En la figura a continuación se tiene que la variable X, es el número de párrafos

digitado por minuto, X: 1, 2, 3, 4.

Figura 7. Distribución de la población

Poblacionalmente se tiene:Parámetros

E(X)= 2.5Var (X)= 1.1180

E(x) es el valor esperado de la variable o promedio, y V(x) es la varianza.

∑

∑ ̅ Se sugiere al lector comprobar los cálculos para la varianza con el comandoVAR.P en Excel.


40/113



40

Ejemplo

Si se quiere escoger una muestra de tamaño 3, es decir compuesta por 3personas y si además las muestras se toman con reposición es decir se puedevolver a incluir el individuo. La distribución muestral será:

Gráfico No.2. Histograma de medias muestrales

El 1,00 que se observa corresponde a la media de la muestra conformada por lasobservaciones 1, 1, 1; es decir se tomo una muestra de tres personas pero al sercon reposición, el primer elemento que se obtuvo fue 1, éste se devuelve lapoblación y tiene de nuevo la posibilidad de ser escogido, que es lo que vuelve asuceder, del mismo modo en la tercera extracción. El valor 1,33 es la media deuna muestra que puede ser por ejemplo las observaciones 1, 1, 2. El total de

muestras es 24 conformadas por 3 personas, ya que se aplica el principio de laspermutaciones.

Lección No 7: Distribución Muestral de la Media y de laProporción

Los estadísticos obtenidos en una muestra son variables aleatorias, por lo cualdeben tener una distribución de probabilidad, así que la media muestral tiene una

distribución.

Supongamos que se tiene una muestra de tamaño “n” observaciones tomada deuna población normal N (µ; σ2) cada observación X1= 1, 2, 3,…, n tendrá lamisma distribución que la población de donde fue tomada la muestra.

0

2

4

6

8

10

12

14

1,00 1,33 1,67 2,00 2,33 2,67 3,00 3,33 3,67 4,00

Distribución de frecuencias de mediasmuestrales


41/113



41

7. Principios y conceptos en la medias muestrales

Teorema: (Población infinita)-------------------------------------------------------------------------------------------------------

Sea la media de la muestra aleatoria de tamaño nproveniente de una población infinita de tamaño N con media µ y varianza σ2.

Entonces:̅ El valor esperado de la media muestral es la media poblacional

La varianza del estimador es igual a la varianza poblacional dividida por el tamañode la muestra.

Teorema: (Población Finita)-------------------------------------------------------------------------------------------------------

Sea la media de la muestra aleatoria de tamaño nproveniente de una población finita de tamaño N con media µ y varianza σ2.Entonces:̅ Comentario: Se conoce como el factor de corrección para poblaciones finitas. Cuando N esmuy grande comparado con n, la diferencia se hace despreciable lo que originaque para poblaciones infinitas dicho factor de corrección se hace uno.

7.1. Distribución Muestral de la Media

Las muestras aleatorias obtenidas de una población son, por naturaleza propia,impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño ytomadas de la misma población tenga la misma media muestral o que seancompletamente parecidas; puede esperarse que cualquier estadístico, como lamedia muestral, calculado a partir de las medias en una muestra aleatoria, cambie


42/113



42

su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todoslos valores posibles de un estadístico. Tales distribuciones serán muy importantes enel estudio de la estadística inferencial, porque las inferencias sobre las poblacionesse harán usando estadísticas muestrales. Como el análisis de las distribucionesasociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de unestadístico muestral como un instrumento para hacer inferencias sobre un parámetro

poblacional desconocido.

Como los valores de un estadístico, tal como x, varían de una muestra aleatoria aotra, se le puede considerar como una variable aleatoria con su correspondientedistribución de frecuencias.

La distribución de frecuencia de un estadístico muestral se denomina distribuciónmuestral. En general, la distribución muestral de un estadístico es la de todos susvalores posibles calculados a partir de muestras del mismo tamaño.

Figura 8. Distribución muestral de medias

Ejemplo Construcción de la distribución de las medias muestrales.

Un Colegio tiene siete profesores, la retribución por hora cátedra es la que semuestra a continuación:

Tabla 5:Tabla No. Salario profesores

Profesor Salario $1234567

7000700080008000700080009000


43/113



43

Para determinar la distribución muestral de las medias, se seleccionaron todaslas muestras posibles de tamaño 2, sabiendo que son sin sustitución y queno interesa el orden de selección en la población. Se calculan las medias decada muestra y se calcula la media de las medias muestrales.

Para saber cuántas muestras posibles se pueden tomar, se utiliza la combinatoria,por los preceptos tomados: Sin repetición y no importa el orden

El valor de 21, es el número de muestras tamaño 2 que se pueden formar deuna población de 7 elementos. A continuación se indican las 21 muestras posiblesy el valor de la media para cada una de las muestras:

72 =7!

(7 2)! 2! =

7!

(5)! 2! =

5! × 6 × 7

5!2! =

42

2! =

42

2 = 21

Paso 1: Media de la población

9 Paso 2: Varianza de dicha población.

9 99

∑

La varianza poblacional está dada por:

Entonces:

Otra formulación es:

Recuerde que la desviación es la raiz cuadrada de la varianza, entonces la

desviavión en este caso es 99 699 Paso 3: Distribución muestral de las medias


44/113



44

Tabla 6:

Distribución salarios de profesores. Muestreo sin reemplazamiento y las medias Muestra Prof. Salario Media Muestra Prof. Salario Media

1 1 y 2 7000-7000 7000 12 3 y 4 8000-8000 8000

2 1 y 3 7000-8000 7500 13 3 y 5 8000-7000 7500

3 1 y 4 7000-8000 7500 14 3 y 6 8000-8000 8000

4 1 y 5 7000-7000 7000 15 3 y 7 8000-9000 8500

5 1 y 6 7000-8000 7500 16 4 y 5 8000-7000 7500

6 1 y 7 7000-9000 8000 17 4 y 6 8000-8000 8000

7 2 y 3 7000-8000 7500 18 4 y 7 8000-9000 8500

8 2 y 4 7000-8000 7500 19 5 y 6 7000-8000 7500

9 2 y 5 7000-7000 7000 20 5 y 7 7000-9000 8000

10 2 y 6 7000-8000 7500 21 6 y 7 8000-9000 8500

11 2 y 7 7000-9000 8000

Suma Total 162.000

En el cuadro siguiente se indica la distribución de probabilidad para elmuestreo de medias, donde la sumatoria de todas las probabilidades es iguala uno:

Tabla 7:Distribución de probabilidad

Media muestral Número de medias Probabilidad

7000 3 0,1429

7500 9 0,4285

8000 6 0,2857

8500 3 0,1429

Suma 21 1,000

Gráfico No.3. Histograma de medias muestrales salario de los profesores


45/113



45

La media poblacional es igual a la media de las medias muestrales

La media de la distribución muestral de medias, se determina sumando lasdiferentes medias muestrales y dividiendo la suma entre el número de muestras.

La media de todas las medias muestrales en general se expresa:

̅ ̅ Ecuación No.2

Primero se obtiene todas las muestras (todos los subconjuntos) y luego a cadamuestra le calcula la media, finalmente obtendrá, tantas medias como muestrashaya, y con esas medias calcula de nuevo un promedio; es decir, se calcula una

media de medias. ̅ 6 Vea el valor obtenido en el paso 1 (Media poblacional) y compárelo con elresultado anterior ¡Son equivalentes! Note que: ̅ es la media de las medias muestrales y es la media poblacional.

Por tanto para nuestro caso:

Paso 4: Media de la distribución muestral de medias


46/113



46

Paso 5: Construcción de distribución de errores muestrales

̅

Error Muestral

Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, lamedia poblacional , entonces la media muestral, como medida, conlleva algúnerror. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria detamaño 25 de una población con media ; si la media de la muestra es ̅ , entonces a la diferencia observada ̅ se le denominael error muestral . Una media muestral x puede pensarse como la suma de doscantidades: la media poblacional y el error muestral; si e denota el errormuestral, entonces:

Ecuación No.3

Al calcular la media y desviación estándar de los errores muestrales “e” (últimacolumna de la tabla 7) se tiene respectivamente:

Se deja como ejercicio al lector calcular y


47/113


48/113



48

Muestreo con reemp lazo

Si de una población se eligen muestras de tamaño n conreemplazo (o la población es No finita), entonces el error estándar

de la media es igual a la desviación estándar de la distribución delos errores muestrales.

En general se tiene: ̅ Ecuación No.4

Muestreo sin reemp lazo

Cuando las muestras se toman de una población pequeña y sin

reemplazo se puede usar la siguiente fórmula para encontrar ̅: ̅ √

Ecuación No.5

Error estándar del estadístico

La desviación estándar de la distribución muestral de un estadístico se conocecomo er ro r es tándar del es tadíst ic o . Para el ejercicio anterior el error estándarde la media denotado por ̅, es 451,75.

Aunque, se puede notar que en este caso la desviación de los erroresmuestrales y el error estándar, son iguales.

̅,

: Es llamado factor de corrección para poblaciones finitas, o en dondese muestrea sin reemplazo.


49/113



49

Más adelante se verá que, estas dos concepciones hacen parte de los principiosdel teorema del límite central. Para lo cual se desarrollan dos ejemplos, uno demuestreo con reemplazamiento y otro sin reemplazamiento.

El siguiente es un diagrama de flujo que le permite identificar en que caso debe

usar o no el factor de corrección.

Gráfico No.4. Diagrama de flujo para error estándar de la media

Teorema central del límite.

En el caso de una población con media y varianza 2 , la distribución muestralde medias de todas las muestras posibles de tamaño n a partir de la población,tendrá una distribución aproximadamente normal (siendo la media de la

distribución muestral igual a y la varianza igual a n/2 ) considerando que eltamaño de la muestra es bastante grande.

El teorema central del límite es uno de los teoremas más importantes dentro de

¿Es la población

infinita?

COMIENZO

¿Se muestrea

con sustitución?

¿Es N≥ 20n?

̅ √

̅ si

si

si

No

No


50/113



50

las ciencias estadísticas, ya que su funcionalidad es muy grande.

Hay que destacar tres aspectos importantes del teorema central de límite.

Primer principio:

Si el tamaño de la muestra n es suficientemente grande, la distribución muestralde las medias será más o menos normal. Esto se cumple ya sea que la poblaciónesté o no distribuida normalmente. Esto es, el teorema se verifica, ya sea que lapoblación esté distribuida en forma normal, o bien sea sesgada o uniforme.

Segundo principio:Como se mostró con anterioridad, la media de la población, , y la media de todas

las medias muestrales posibles, x , son iguales. Si la población es grande y se

selecciona un número grande de muestras de la población, la media de las medias

muestrales se aproximará a la media poblacional.

Tercer principio:

La varianza de la distribución de medias muestrales se determina de n/2 .No existe acuerdo general sobre lo que constituye un tamaño de muestra“suficientemente grande”. Algunos estadísticos consideran que es 30; otrospiensan que un número pequeño como 12 es adecuado. El ejemplo sobre lossalarios por hora de todos los profesores del colegio funcionó bastante bien conuna muestra de 2. Sin embargo, a menos que la población sea aproximadamente

normal, los tamaños de muestra así de pequeños, por lo general no dan comoresultado una distribución muestral que se distribuya normalmente. A medida queel tamaño de la muestra se vuelve cada vez más grande, la distribución de lamedia muestral se aproxima más a la distribución normal con forma de campana.

TEOREMA CENTRAL DEL LÍMITE:

Sea X1, X2,…, Xn un

Modulo 100403 Vol 1 Inferencia Estadistica

Documents

Transcript of Modulo 100403 Vol 1 Inferencia Estadistica