Modulo 100403 Vol 1 Inferencia Estadistica

download Modulo 100403 Vol 1 Inferencia Estadistica

of 113

Transcript of Modulo 100403 Vol 1 Inferencia Estadistica

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    1/113

     

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

    ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA

    UNIDAD DE CIENCIAS BÁSICAS 

    JEAMMY JULIETH SIERRA HERNÁNDEZ

    (Director Nacional de Curso)

    100403 – INFERENCIA ESTADÍSTICAVol. 1 

    IBAGUÉFEBRERO 2013

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    2/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 2

    COMITE DIRECTIVO 

    Jaime Alberto Leal AfanadorRector  

    Constanza Abadía GarcíaVicerrectora Académica y de Investigación

    Gloria HerreraVicerrector de Medios y mediaciones Pedagógicos 

    Maribel Córdoba GuerreroSecretaria General 

    Inferencia Estadí stica 

    Tercera Versión

     Actualización por Jeammy Julieth Sierra Hernández

     Autores Primera Edición:Jorge RondonDanis Brito

    CopyrightUniversidad Nacional Abierta y a Distancia

    ISBN

    2012

    Unidad de Ciencias Básicas UNAD 

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    3/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA  3

    CAMPOS DE Básica CR DITOS: 2 TRABAJO INDEPENDIENTE: 72TIPO DE CURSO Teórico C DIGO:100403  ACOMPAÑAMIENTO TUTORIAL: 24

    OBJETIVO GENERAL: 

    Que el estudiante comprenda, aplique y desarrolle la teoría y las técnicas de lainferencia estadística en diversos campos de su saber formativo, y que dichaaplicación se convierta en una herramienta de uso matemático para la toma dedecisiones sobre hipótesis cuantitativas de datos, basado en la informaciónextraída de una muestra.

    OBJETIVOS ESPECÍFICOS:   Que el estudiante identifique las técnicas y procedimientos que se

    deben emplear para que las muestras sean representativas de la poblaciónque se pretende estudiar, de forma que los errores en la determinación de

    los parámetros de la población objeto de estudio sean mínimos.

      Que el estudiante comprenda el comportamiento de una población apartir del análisis metódico de una muestra aleatoria de la misma, y queentienda que la inferencia inductiva de los parámetros estadísticos queestime sobre dicha muestra, conlleva un error, el cual es posible de sercuantificado.

      Conocer los criterios técnicos que hay que tener en cuenta antes

    de seleccionar un tamaño de muestra.

      Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.

      Diferenciar y analizar las ventajas y desventajas de la estimaciónpor intervalos de confianza y las pruebas de hipótesis.

      Determinar la prueba o técnica apropiada a aplicar en las diferentespruebas de hipótesis paramétricas y No paramétricas.

    COMPETENCIA GENERAL DE APRENDIZAJE: 

    Identificar un procedimiento adecuado para seleccionar de una población unaparte de ella, con el fin de obtener resultados confiables y poder generalizar losresultados obtenidos a toda la población.Determinar los estadísticos necesarios para el análisis y solución de situacionesque implican conjuntos de datos de su disciplina de formación, por medio del

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    4/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA  4

    conocimiento de la teoría elemental del muestreo y de las distribucionesmuestrales.

    Plantear y desarrollar el proceso de la inferencia estadística para resolverproblemas concretos de investigación en el ámbito de otras disciplinas.

     Aplicar apropiadamente los resultados teóricos y metodológicos de la inferenciaestadística de estimación y prueba de hipótesis en el marco de la modelación.

    Habilidad para planear una investigación, diseño de instrumentos, definición devariables, recolección de la información, resumen y presentación de los datos.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    5/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA  5

    UNIDADES DIDÁCTICAS

    INTRODUCCIÓN ................................................................................................................................... 6

    UNIDAD UNO: ...................................................................................................................................... 7

    MUESTREO, DISTRIBUCIÓN MUESTRAL E INTERVALOS DE CONFIANZA ............................................. 7

    CAPITULO UNO: PRINCIPIOS DE MUESTREO ................................................................................... 8

    Lección No 1: Conceptos Básicos .............................................................................................. 10

    Lección No 2: Tipos de muestreo y selección de muestra ........................................................ 15

    Lección No 3: Tipos de Selección de Muestras ......................................................................... 30

    Lección No 4: Métodos de Inferencias, Paramétrico y No Paramétrico ................................... 31

    Lección No 5: Estimadores y propiedades de los estimadores ................................................. 34

    ................................................................................................................................................... 36

    CAPITULO DOS: DISTRIBUCIONES MUESTRALES ........................................................................... 37

    Lección No 6: Distribuciones Muestrales .................................................................................. 38

    Lección No 7: Distribución Muestral de la Media y de la Proporción ....................................... 40

    Lección No 8: Distribución Muestral de la proporción.............................................................. 58

    Lección No 9: Distribución Muestral de Diferencias de Medias y de la Proporciones .............. 63

    Lección No 10: Tamaño de la muestra para estimar la media, la proporción y el total de la

    Población ................................................................................................................................... 67

    CAPITULO TRES: INTERVALOS DE CONFIANZA .............................................................................. 74

    Lección No 11: Nociones Fundamentales. ................................................................................ 75

    Lección 12. Intervalos de confianza para medias y diferencias de medias con muestras

    pequeñas 30n   ..................................................................................................................... 80

    Lección 13. Intervalos de confianza para la media y diferencias de medias muestras grandes

    30n   .................................................................................................................................... 101

    Lección 14. Intervalos de confianza para la proporción y diferencias de proporciones (siempre

    son muestras grandes) 30n   .............................................................................................. 105

    Lección 15. Intervalos de confianza para la varianza poblacional. ......................................... 107

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    6/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA  6

    INTRODUCCIÓN

    El presente modulo está dirigido a estudiantes de programas de pregrado queoferta la UNAD, bajo la modalidad de educación superior a distancia.

    El material está estructurado en dos unidades que son las temáticas macro delcurso académico.

    El contenido de cada una de las partes fue seleccionado, teniendo en cuenta lossaberes mínimos que se esperaría debe alcanzar un estudiante de laUniversidad Nacional Abierta y a Distancia en el campo de la Inferenciaestadística.

    La propuesta permite que los estudiantes reconozcan los conocimientosmínimos del curso en mención, que le permita resolver situaciones propias delmismo y además, abordar posteriores temáticas que requieran de éstosconocimientos.

    Para el mejor aprovechamiento de este material, se recomienda que el estudianteposea como conocimientos previos: de estadística descriptiva y de la teoría deprobabilidad.

    El modulo se caracteriza porque en cada lección se presentan ejemplos

    modelos del tema en estudio, al final de cada capítulo se exponen ejercicios conrespuesta, que permite a los estudiantes contextualizarse en diversas áreas delconocimiento, con el fin de fortalecer las temáticas propias del curso.

     Al final de cada unidad se presenta una Autoevaluación de un nivel medio-alto, lascuales permiten verificar los alcances de los estudiantes en las temáticasanalizadas y detectar las debilidades y así centrarse en éstas, con el fin dealcanzar las metas propuestas.

    Finalmente, el Material pretende servir como guía de aprendizaje autónomo, serecomienda apoyar este proceso por medio de lecturas especializadas, ayudasaudiovisuales, visitas a sitios Web y prácticas de laboratorio; entre otros, asílograr una efectiva comprensión, y aplicación de las temáticas estudiadas.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    7/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA  7

    UNIDAD UNO:

    MUESTREO, DISTRIBUCIÓN MUESTRAL E INTERVALOS DE CONFIANZA

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    8/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA  8

    CAPITULO UNO: PRINCIPIOS DE MUESTREO 

    Introducción

    En los estudios de investigación lo primero que se define es el f enómeno  aanalizar, luego la población objeto de estudio, la cual puede ser finita cuandose conocen todos los elementos, o infinita cuando no se conocen todoslos elementos de la misma. Desde estos puntos de vista analizar la poblaciónno es práctico, por tiempo y costos, lo que induce a seleccionar unamuestra, cuya importancia radica en el proceso de consecución  dedatos que proporcionan la información suficiente y necesaria a cerca dela población, además que con la muestra se están utilizando menos recursos,debido a que sólo una parte de la población se encuentra bajo observación,lo que resulta significativamente beneficioso sobre todo cuando se trata

    de poblaciones grandes y dispersa.

    Otro aspecto que justifica la decisión de tomar una muestra es en casos dondese debe destruir los elementos de ésta, por ejemplo cuando se deseaidentificar el grado de vacío de un producto enlatado, la resistencia de unmaterial y otros.

    En las encuestas de opinión sobre la preferencia de un producto se nota másclaramente la utilidad de una muestra en contraste con la población,para conocer las preferencias de los consumidores y poder acomodar

    rápidamente el sistema de producción a dichos cambios.

    En desarrollo del presente modulo, se utiliza la coma para indicar la parte decimalde un número.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    9/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA  9

    Objetivo general 

    Que los estudiantes identifiquen los principios sobre población y

    muestra, métodos de muestreo, distribución de muestreo para medias,el teorema central del límite, aplicados al cálculo de tamaños de muestraspertinentes.

    Objetivos especí f icos 

      Comprender los conceptos de población y muestra.

      Identificar los diferentes diseños de muestreo y su utilidad en

    diferentes campos del saber.  Conceptuar una distribución muestra y calcular las estimacionesrequeridas, la varianza y el error de estimación para los mismos.

      Conocer y comprender los elementos del teorema central delímite y su utilidad.

      Determinar un tamaño de muestra representativo tanto para mediascomo para proporciones.

      Realizar aplicaciones en Excel y SPSS.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    10/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    10

    Lección No 1: Conceptos Básicos

    Dentro de la inferencia estadística, el proceso de muestreo permite que apartir de los resultados obtenidos al analizar una muestra, se pueda obtenerconclusiones en cuanto a una o varias de las características o parámetros de una

    población. Esta área de la Estadística, ayuda a determinar la confiabilidad de lainferencia de que los fenómenos observados en la muestra ocurrirán tambiénen la población de donde se selecciona la muestra. Es decir, sirve paraestimar la eficacia del razonamiento inductivo con el cual se infiere que loobservado en una parte ser equivalente a lo observado en la población.

    Las técnicas de muestreo son importantes en la medida que se utilice enforma adecuada para la situación  que se requiera. De las técnicas másconocidas y utilizadas se tienen el Muestro Aleatorio Simple (M.A.S), Muestreo

     Aleatorio Estratificado (M.A.E), Muestro Sistemático (M.S) y Muestreo porConglomerados (M.C). Se tratará de analizar estas técnicas, especialmente elM.A.S y M.A.E.

    El Éxito en el desarrollo del curso en mención está en los buenosconocimientos previos en Estadística Descriptiva, Probabilidad y, algebra,Trigonometría y Geometría analítica. Lo anterior debido a que se debe predecirresultados o tomar decisiones que tienen un grado de incertidumbre o ungrado de error que se debe definir de antemano.

    1.1. Población  Y Muestra

    Existe una serie de términos estadísticos básicos, que son muy utilizados y serequiere sean comprendidos para avanzar en otros temas o unidades, enesta sección se tratarán los conceptos de población y muestra.

    Población ó Universo: Se considera a todo aquello sobre el que sedesea hacer un estudio estadístico. Según el número de unidades,elementos o casos que la constituyen, la población puede ser finita o infinita. 

    Población Finita: Es aquella conformada por un determinado o limitado númerode elementos. 

    Población Infinita:  Es aquella conformada por un determinado o limitadonúmero de elementos. Cuando el número de unidades que integra una población es muy grande, sepuede considerar a ésta como una población infinita. El investigador define la

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    11/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    11

    población objeto de estudio en términos de espacio y tiempo, ya que de estamanera los resultados serán sobre la población definida en el espaciodemarcado y en el tiempo definido.

    Ejemplo

    Estudiantes del Programa de Ingeniería de SistemasEstudiantes del programa de Ingeniería de sistemas de la UNADEstudiantes del programa de Ingeniería  de sistemas en la UNAD de losaños2.010, 2.011 y 2.012

    Muestra: Se considera una muestra al subconjunto representativo de lapoblación, que ha sido seleccionada de manera técnica mediante unprocedimiento denominado diseño de muestreo, para garantizar que dicha

    muestra es representativa de la población, es decir, que las unidadesseleccionadas en la muestra mediante un proceso aleatorio, hayan tenidoigual probabilidad de haber sido seleccionadas para el análisis.

    Figura 1. Población y muestra

    Muestra representativa: Subconjunto de sujetos que pertenecen a unapoblación determinada. Debería tener las mismas características generales quela población. En caso contrario, tenemos una muestra sesgada.  (M. J. Navas,2001, p. 19). Ir al referente.  Los dos principios que determinan la

    http://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htmhttp://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htmhttp://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htm

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    12/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    12

    representatividad de una muestra son, la forma de selección, que debe seraleatoria y el otro corresponde al tamaño de la muestra.

    Parámetros: Según Moore, D. (2000) es un número que describe algunacaracterística de la población. En la práctica estadística el valor del parámetro noes conocido ya que en muchos casos no podemos examinar toda la población.

    Pudiendo ser por ejemplo el porcentaje de personas con VIH en Colombia, aquíel parámetro es la “Proporción” de personas en la población (Colombia) que

    tienen dicho virus.Es conveniente el uso de un símbolo general para designar el parámetro de

    interés, entonces éste será:  

    Entre los parámetros más importantes tenemos: 

      = Tamaño total de la población

    = Promedio Poblacional= Varianza Poblacional = Desviación estándar Poblacional  =  Total Poblacional =Proporción poblacionalEstadístico:  Es un número que se puede calcular a partir de los datos de lamuestra. Moore, D. (pág. 270). Entonces un estadístico mide características,pero en una parte de la población, es decir, en una muestra; por ejemplo elporcentaje de personas en Bogotá con VIH; aquí se evidencia que la muestra es

    la capital en donde se está analizando una característica, lo que permite sacarconclusiones de todo el país, por lo cual se dice que la inferencia suministraconclusiones de la población sirviéndose de los resultados encontrados en lasmuestras.

    El objetivo fundamental del muestreo es Est imar   los parámetros de lapoblación a partir de algunos elementos cuyas mediciones son los Estadístic os  Los estadísticos más utilizados por su importancia son:

    n =Tamaño de la muestra

      =Promedio de muestraS2  =Varianza MuestraS =Desviación estándar Muestra   ̂  =Total Estimado

     p =Proporción Muestra

    Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    13/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    13

    de estimación en inferencia estadística puede ser descrito como el proceso deestimar un parámetro a partir del estadístico correspondiente, tal como usar unamedia muestra (un estadístico) para estimar la media de la población (unparámetro).

    Error de muestreo (error muestral): En estadística se sabe que existen

    diferencias entre lo que se obtuvo en el estudio y lo que se esperaba. En elproceso de estimación es poco probable que la media Muestra sea idéntica a lamedia poblacional, igual para la varianza y la desviación estándar. El error demuestreo es la diferencia entre el estadístico y el parámetro, es decir diferenciaentre lo encontrado en la muestra con lo esperado en la población.  

       es el Parámetro y   es el estadístico. Recuerde que

    | | es el símbolo de valor absoluto

     A medida que el tamaño de la muestra aumenta el error de muestreo disminuye,

    es decir, son inversamente proporcionales.

    Error tolerable: Se considera el error tolerable al error máximo que seestá dispuesto a aceptar y aún considerar que el muestreo ha alcanzadosu objetivo. En todo estudio estadístico siempre se considera un error tolerable,partiendo del principio que a menor error tolerable, mayor será el tamaño de

    la muestra. Si es el parámetro y  es

     el estadístico, el error tolerable está

    determinado por B, donde:

     Error estándar:  La desviación estándar de una distribución, en elmuestreo de un estadístico, es frecuentemente llamada el error estándar delestadístico. Por ejemplo, la desviación estándar de las Medias de todas lasmuestras posibles del mismo tamaño, extraídas de una población, es llamada elerror estándar de la media. De la misma manera, la desviación estándar de lasproporciones de todas las muestras posibles del mismo tamaño, extraídas de unapoblación, es llamada el error estándar de la proporción. La diferencia entre los

    términos desviación estándar y error de estándar es que la primera se refierea los valores originales, mientras que la segunda está relacionada con valorescalculados.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    14/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    14

    1.2. Razones para seleccionar una muestra

    Entre los motivos que inducen a tomar una muestra aleatoria están:

    Naturaleza  Destructiva:  Existen casos donde se requiere destruir loselementos de la muestra para medir la car acter ística,  como es el caso de

    medir la resistencia de un material, el vacío de un producto enlatado, otros. Noes lógico pensar en destruir todos los elementos de la población, de allí que setome una muestra.

    Imposibilidad Física  de Medir Todos los Elementos de la Población:Se sabe que existen poblaciones muy grandes, consideradas infinitas y escasi imposible conocer todos los elementos de la misma.

    Costos: Estudiar todos los elementos de la población es muy costoso, tanto en

    tiempo como en dinero, por lo que es más rentable hacer un estudio Muestra.

    Confiabilidad del Estudio Muestra: Esta demostrado con soporte matemáticoque una muestra representativa arroja resultados que permiten inferir sobre lapoblación con una confiabilidad muy alta.

    Unidad de observación: Son los elementos que se miden; es decir, sobre losque se toman los datos de las variables a medir. En el caso de los hogares, launidad de observación serán las personas y en el caso de las llantas delautomóvil, cada una serán las unidades de observación.

    Marco de muestreo: Se considera el referente para identificar las unidades deobservación, éste NO incluye todos los elementos de la población.  Ejemplos demarcos de muestreo tenemos el directorio telefónico de una ciudad, comopotenciales votantes, el registro de ventas de los últimos 5 años enuna compañía comercializadora y muchos otros. 

    1.3. Etapas en la Selección de La Muestra

    En todo estudio de muestreo se debe definir las etapas que permiten sudesarrollo.

    a) Definición de objeto de Estudio: Comprende la identificación del problema yel establecimiento de las metas que busca el estudio. 

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    15/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    15

    b) Marco de Muestreo: Establecimiento de una metodología para identificar loselementos que estarán en el muestreo, sus características y el modelo quelos identifica.

    c) Identificación de Variables:  Es pertinente identificar las variables deestudio, para así definir la forma de medición que se haría.

    d) Tamaño de la Muestra:  Por medio del modelo de muestreo pertinenteseleccionar la muestra representativa, sobre la que se realizarán lasmediciones.

    e) Unidad de Muestreo:  Se debe extraer las unidades de muestreo según elmodelo definido que determinan las n unidades maestrales de la población N .

    f) Trabajo de Campo:  Son todas las acciones necesarias para obtener la

    información, definiendo los costos, desplazamientos, herramientas física ylogísticas para su realización.

    g) Análisis de Información:  La información obtenida, requiere de un procesoestadístico, el cual puede ser descriptivo o inferencia, para el curso quenos ocupa se deben hacer los dos.

    h) Resultados:  Con el proceso desarrollado sobre los datos obtenidos, seprocede a la emisión de los resultados y la confrontación con las metaspropuestas para verificar el grado de eficiencia del trabajo realizado. Es

    pertinente saber presentar los resultados, ya que un buen trabajo que no sepresente de la mejor manera, quedaría oscuro en su información.

    Lección No 2: Tipos de muestreo y selección de muestra

    Tipos de Muestreo

    Con los conceptos previos que se han analizado, ahora corresponde

    estudiar las clases de muestreo. Los dos grandes grupos están enmarcados enlas siguientes clases:

      Muestreo probabilístico

      Muestreo No probabilístico

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    16/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    16

    2.1. Muestreo No Probabilístico

    Son aquellos muestreos donde los elementos de la muestra se toman al azar,siendo imposible determinar el grado de representatividad de la muestra. Parael caso de una población homogénea, la representatividad de tal muestra puedeconsiderarse satisfactoria.

    Por otra parte, en problemas comerciales diarios y en la toma de decisionesque a falta de tiempo no permiten disecar   métodos de muestreo probabilísticohay que recurrir a este tipo de muestreo, donde el investigador conoce lapoblación.

    Dentro del muestreo no probabilístico se conoce variostipos:

      Muestreo por conveniencia.

      Muestreo por juicio  Muestreo Causa / Efecto

      Muestreo por Cuotas

      Muestreo de Poblaciones Móviles

    2.1.1. Muestreo por convenienciaLa muestra se determina por conveniencia, incorporando elementos en la muestralsin probabilidades especificadas o conocida de selección. Por ejemplo unprofesor que se encuentra investigando una causa universitaria, puede usaralumnos voluntarios para formar la muestra, tan solo porque dispone fácilmente

    de ellos y participan como elementos a un costo pequeño o nulo. Tiene laventaja de ser de fácil selección y recolección de sus datos. Tiene ladesventaja de no poderse evaluar en su bondad de la muestra enfunción de la representatividad de la población, motivo por el cual se haceimposible inferir a cerca de la población correspondiente.

    2.1.2. Muestreo por juicioEn este método la persona por experiencia y capacidad selecciona a losindividuos u otros elementos de la población, que supone son los más

    representativos de esa población. Por ejemplo un reportero puedemuestrear uno o dos senadores, por considerar que ellos reflejan la opinióngeneral de todos. 

    2.1.3. Muestreo causa / efectoSe realiza cuando no hay una población definida y se requiere tomarelementos para el estudio en cuestión, caso por el cual se toman los elementosdisponibles.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    17/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    17

    2.1.4. Muestreo por cuotas

    Cuando es necesario obtener una cantidad dada de elementos que constituyenuna muestra proporcional a la población, se toman elementos hasta cubrirdicha cuota. El caso de tomar una cantidad de carros en una esquina para

    hacer un estudio sobre accidentalidad en dicho sitio. 

    2.1.5. Muestreo de poblaciones móviles

    Método propio de poblaciones móviles como en estudios de migraciónocurridos en un sitio determinado. El caso típico  es con animales que migran,donde se hace captura-marca- recaptura. 

    2.2. Muestreo Probabilístico

    El muestreo aleatorio o muestreo probabilístico, es aquel en que cada uno delos elementos de la población  objeto de estudio, tienen una probabilidadmatemática conocida, y frecuentemente igual, para ser elegido en la muestra.

    Muestra probabilística

    Una muestra se considera probabilística si cumple con las siguientescondiciones:

    a) Se pueda definir un conjunto de muestras M1, M2, M3... Mi posibles

    derivados del proceso de selección propuesta. Así se puede iden ti fi ca rque unidades de muestreo pertenecen a la muestra M1, M2, M3... Mi 

    b) A cada muestra posible le debe corresponder una probabilidad deselección conocida P(S).

    c) El proceso de selección garantiza que todos los elementos de la poblacióntienen una probabilidad P(yi)>0 de ser elegido en alguna muestra.

    d) La selección es un proceso aleatorio que garantiza que cadamuestra S tenga una probabilidad P(S) de ser elegida. Muestreo aleatoriosimple

    Dentro del muestreo probabilístico o aleatorio existen cuatro métodos:1. Muestreo aleatorio simple2. Muestreo estratificado3. Muestreo sistemático4. Muestreo por conglomerados

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    18/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    18

    2.2.1. Muestreo Aleatorio Simple

    El M A S es la forma m á s sencilla de muestreo probabilístico y es la base detécnicas más complejas. La muestra se puede tomar de una población finitao infinita, la cantidad de muestras posibles depende del tipo de diseño y la

    forma de tomar las muestras. Este tipo de muestreo se utilize cuando seconsidera que la población es más o menos homogénea. Como ya sabemos elmuestreo puede ser con y sin reemplazamiento.

    El marco de muestreo corresponde a la lista codificada de todas las observacionesque hacen parte de la población. La muestra se elige de tal manera que cadaobservación tiene la misma probabilidad de ser elegida, la elección de unaobservación NO tiene influencia sobre la elección de otra. Es de aclarar que en elM.A.S la unidad de muestreo es igual a la unidad de observación.

    Este tipo de muestreo requiere la construcción de un marco demuestreo, consistente en el listado completo de las unidades de lapoblación. 

    Técnicas para Seleccionar la Muestra

    a) Tabla de números aleatorios 

    (Ver tabla siguiente). Se enumeran las unidades que conforman la población

    objetivo de estudio, partiendo desde 01 hasta 99, desde 001 hasta 999, y asísucesivamente, dependiendo del tamaño  poblacional. Luego se define eltamaño de la nuestra y como los elementos de la población estánlistados y codificados, entonces se establece un punto de partida:Columna x Fila y, se van leyendo ya sea horizontal o verticalmente losnúmeros de la tabla hasta completar el tamaño de la muestra.

    Ejemplo

    Suponga que tenemos N=30 facturas de servicios públicos (unidades en lapoblación), saque una muestra aleatoria simple de tamaño n=5.

    Paso 1: Asigne etiquetas: Dé a cada unidad en la población un número, etiqueta oidentificación. Todas las etiquetas deben tener el mismo número de dígitos. Comotenemos 30 unidades y el número 30 tiene dos dígitos, todas las unidades tienenque tener dos dígitos.

     

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    19/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    19

    Tabla 1.Facturas de servicios públicos

    Paso 2: Use la tabla: Empezando en un lugar escogido al azar lea grupos dedígitos (dependiendo del número de dígitos en las etiquetas) de izquierda aderecha, continuando con la línea siguiente cuando se acabe la línea que estáleyendo. Si el grupo de dígitos corresponde a una de las etiquetas, ese númeroidentifica a una de las unidades que será seleccionada. Si el grupo de dígitos nocorresponde a una de las etiquetas o si ya fue seleccionado, se salta al gruposiguiente.

    Por ejemplo suponga que el lugar de partida escogido al azar fue la fila 05,columna 1 (la columna 1 es la 12345) y la lectura sera vertical (aunque puede serhorizontal):

    Se toman dos digitos porque la muestra es 30 (que tiene dos digitos)33850 Este número no se escoge porque está por encima de 30

    97340Este número no se escoge porque solo se escogen numerous entre01 y 30. Se sigue buscando y se llega hasta un número menor oigual a 30

    Este número si se escoge porque es menor a 30.14756

    Se continúa y si con la primera columna no se han encontrado los 5 números parala muestra se pasa a la siguiente.

    Cabe notar que el número 23913 de la tabla se salta ya que se repite el 23 que seencontró en 23236

    La muestra está conformada por las observaciones que se ubican en la posición:14, 23, 09, 11 y 06

    Recibo No. Valor $ Recibo No. Valor $ Recibo No. Valor $

    01 $ 45.661 11 $ 37.798 21 $ 44.901

    02 $ 43.629 12 $ 33.672 22 $ 40.155

    03 $ 41.502 13 $ 39.607 23 $ 48.082

    04 $ 45.069 14 $ 34.904 24 $ 32.825

    05 $ 45.813 15 $ 36.701 25 $ 45.915

    06 $ 49.687 16 $ 34.001 26 $ 30.382

    07 $ 45.960 17 $ 36.302 27 $ 41.835

    08 $ 35.001 18 $ 48.728 28 $ 47.227

    09 $ 49.553 19 $ 48.706 29 $ 48.485

    10 $ 46.976 20 $ 34.881 30 $ 45.159

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    20/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    20

    Tabla 2.

    Números aleatorios 

    Columna 

    00000  00001  11111  11112   22222   22223  33333  33334 

    Renglón  12345   67890  12345   67890  12345   67890  12345   67890 

    0149280 88924 35779 00283 81163 07275 89863 02348

     02 61870 41657 07468 08612 98083 97349 20775 45091 

    03 43898 65923 25078 86129 78496 97653 91550 08078 

    04 62993 93912 30454 84598 56095 20664 12872 64647 

    05 33850 58555 51438 85507 71865 79488 76783 31708 

    06 97340 03364 88472 04334 63919 36394 11095 92470 

    07 70543 29776 10087 10072 55980 64688 68239 20461 

    08 89382 93809 00796 95945 34101 81277 66090 88872 

    09 37818 72142 67140 50785 22380 16703 53362 44940 

    10 60430 22834 14130 96593 23298 56203 92671 15925 

    11 82975 66158 84731 19436 55790 69229 28661 1367512

    39087 71938 40355 54324 08401 26299 49420 59208 

    13 55700 24586 93247 32596 11865 63397 44251 43189 

    14 14756 23997 78643 75912 83832 32768 18928 57070 

    15 32166 53251 70654 92827 63491 04233 33825 69662 

    16 23236 73751 31888 81718 06546 83246 47651 04877 

    17 45794 26926 15130 82455 78305 55058 52551 47182 

    18 09893 20505 14225 68514 46427 56788 96297 78822 

    19 54382 74598 91499 14523 68479 27686 46162 83554 

    20 94750 89923 37089 20048 80336 94598 26940 36858 

    21 70297 34135 53140 33340 42050 82341 44104 82949 

    22 85157 47954 32979 26575 57600 40881 12250 73742 

    23 11100 02340 12860 74697 96644 89439 28707 25815 

    24 36871 50775 30592 57143 17381 68856 25853 35041 

    25 23913 48357 63308 16090 51690 54607 72407 55538 

    26 79348 36085 27973 65157 07456 22255 25626 57054 

    27 92074 54641 53673 54421 18130 60103 69593 49464 

    28 06873 21440 75593 41373 49502 17972 82578 16364 

    29 12478 37622 99659 31065 83613 69889 58869 29571 

    30 57175 55564 65411 42547 70457 03426 72937 83792 31 91616 11075 80103 07831 59309 13276 26710 73000 

    32 78025 73539 14621 39044 47450 03197 12787 47709 

    33 27587 67228 80145 10175 12822 86687 65530 49325 

    34 16690 20427 04251 64477 73709 73945 92396 68263 

    35 70183 58065 65489 31833 82093 16747 10386 59293 

    36 90730 35385 15679 99742 50866 78028 75573 67257 

    37 10934 93242 13431 24590 02770 48582 00906 58595 

    38 82462 30166 79613 47416 13389 80268 05085 96666 

    39 27463 10433 07606 16285 93699 60912 94532 95632 

    40 02979 52997 09079 92709 90110 47506 53693 49892 

    41 46888 69929 75233 52507 32097 37594 10067 67327 

    42 53638 83161 08289 12639 08141 12640 28437 09268 

    43 82433 61427 17239 89160 19666 08814 37841 12847 

    44 35766 31672 50082 22795 66948 65581 84393 15890 

    45 10853 42581 08792 13257 61973 24450 52351 16602 

    46 20341 27398 72906 63955 17276 10646 74692 48438 

    47 54458 90542 77563 51839 52901 53355 83281 19177 

    48 26337 66530 16687 35179 46560 00123 44546 79896 

    49 34314 23729 85264 05575 96855 23820 11091 79821 

    50 28603 10708 68933 34189 92166 15181 66628 58599 

    Fuente:Web 

    Paso 3: Indicar según las posiciones que arroja la tabla de números aleatorios

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    21/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    21

    cuales elementos se escogerán para la muestra

    Tabla 3:Selección muestra de 5 recibos ejemplo 1

    Este método de selección permite que todos los elementos que constituyen la  

    población tengan la misma posibilidad de ser incluidos en la muestra. Loselementos se escogen en forma individual y aleatoriamente de la totalidad dela población. Esta selección puede ser sin reemplazamiento, similar a la quese realiza en la extracción aleatoria de números en el juego denominado baloto.Cada elemento que constituye la muestra se selecciona una sola vez,denominándose extracciones sin reposición.

    En otras ocasiones, cada elemento puede ser elegido más s de una vez enla misma muestra, como por ejemplo, cuando se selecciona aleatoriamente elnúmero ganador de una lotería, que puede ocurrir ser el mismo número; enestos casos se dice que las extracciones son realizadas con reposición.

    b) Programa de Computador:  Utilizando el programa Excel que es el máscomún se puede desarrollar números aleatorios de la siguiente manera:

    Si la población es de N = 1.000 observaciones y se desea una muestra de 20,entonces: Sobre una celda se escribe =ALEATORIO ()*N y se da clic, elsistema genera el primer número aleatorio, se despliega en la parte inferiorderecha de la celda del número hasta el tamaño de la muestra definida.

    Sintaxis para obtener números aleatorios de una población de 1000observaciones

    Figura 2. Sintaxis número aleatorio en Excel

    No. Recibo Valor $ No. Recibo Valor $ No. Recibo Valor $

    01 $ 45.661 11 $ 37.798 21 $ 44.901

    02 $ 43.629 12 $ 33.672 22 $ 40.155

    03 $ 41.502 13 $ 39.607 23 $ 48.082

    04 $ 45.069 14 $ 34.904 24 $ 32.825

    05 $ 45.813 15 $ 36.701 25 $ 45.915

    06 $ 49.687 16 $ 34.001 26 $ 30.382

    07 $ 45.960 17 $ 36.302 27 $ 41.835

    08 $ 35.001 18 $ 48.728 28 $ 47.227

    09 $ 49.553 19 $ 48.706 29 $ 48.485

    10 $ 46.976 20 $ 34.881 30 $ 45.159

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    22/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    22

     Al dar clic se genera el primer número aleatorio y desplegando se obtiene losque se desea.

    De esta manera se obtiene los números aleatorios que se requierenpara tomar la muestra aleatoria de la población objeto de estudio. Si sevuelve a hacer el proceso, se obtendrán nuevos números y cada que se realice

    un nuevo proceso, se generarán diferentes números; esto por lo de Aleatorio.

    VIDEOS

    c) Método de Fan Muller: 

    Para seleccionar una muestra aleatoria simple mediante este método hay queseguir los siguientes pasos:

    1. Para cada elemento de la población se genera un número aleatorio entre 0y 1. Ese número aleatorio se llamará r.

    2. Se hace un recorrido secuencial de la población y se incluye a la muestrael número aleatorio r si cumple:   Comprobando que no estuviera anteriormente introducida, en el caso deque esté repetida se pasa a la siguiente unidad. Si se introduce la unidadse vuelve a empezar en el paso 1.

    3. El algoritmo termina cuando  d) Coordinado Negativo: El proceso general es de la siguiente manera:

    1. Se adiciona una variable aleatoria U con distribución uniforme U (0, 1)2. Se ordena el marco muestral según la distribución U.3. La muestra se forma de los n primeros elementos del marco ordenado

    Selección de

    muestras a través

    de M A S

    https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    23/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    23

    2.2.2. Muestreo Aleatorio Estratificado

    En el diseño de muestreo probabilístico, es pertinente identificar la poblaciónobjeto de estudio, ya que no siempre la variable de análisis es más o menoshomogénea. Si se desea analizar la variable peso; por lo general los hombres

    pesan más s que las mujeres, en estratos altos se paga más arriendo queen estratos bajos. En estos y otros muchos casos el M. A. S. no es adecuado.En casos donde la población es muy heterogénea respecto a la variablede estudio el muestreo estratificado es mejor que el muestreo aleatorio simple.La palabra estratificar hace referencia a formar Capias.

    DEFINICIÓN: Una muestra aleatoria estratificada se obtiene mediante laseparación de los elementos de la población en subgrupos llamados ESTRATOS,los cuales son disyuntos.

    Obtenidos los estratos, en cada uno se obtiene la muestra por M.A.S para elestudio de la variable de interés.

    Como los elementos de los estratos son disyuntos, entonces cadaunidad de muestreo pertenece solo a un estrato. Las muestrasseleccionadas en los estratos deben ser independientes; es decir, la elegidaen un estrato no debe afectar la elección de otra muestra en otro estrato.

    La esencia de la estratificación es que ésta saca provecho de lahomogeneidad conocida de las sus poblaciones, de tal forma sólo se requieranmuestras relativamente pequeñas para estimar las características de cadasub-población, estas estimaciones individuales pueden entonces serfácilmente combinadas para producir una estimación de toda lapoblación; además, la economía en el tamaño de la muestra, unvalioso sub-producto del esquema del muestreo estratificado es que lasestimaciones obtenidas para diferentes partes de la población sepueden usar posteriormente para hacer comparaciones.

    Para una descripción general del muestreo aleatorio estratificado y losmétodos de inferencia asociados con este procedimiento, suponemosque la población está dividida en h subpoblaciones  o estratos de tamañosconocidos N 1, N 2 ,..N h tal que las unidades en cada estrato sean

    homogéneas respecto a la característica en cuestión.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    24/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    24

    Figura 3. Población divida en estratos

    Ejemplo

    Población de tutores del CEAD Ibagué - UNAD (ver figura 3). El tamaño de lapoblación 18 tutores (N= 18), la cual está dividida en 3 escuelas o subgrupos(H=3). Cada escuela es un estrato, y se tiene que son diferentes los perfiles de lostutores de una escuela a otra pero al interior de cada una son similares susprofesiones, esto significa que los subgrupos son heterogéneos entre sí, perohomogéneos dentro de cada uno.

    VENTAJAS DEL MUESTREO ESTRATIFICADO

    1. Evitar la obtención de muestras erróneas, tal es el caso deescoger elementos que podrían sesgar el muestreo, por consiguientese puede perder representatividad de la población.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    25/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    25

    2. Obtener información precisa de ciertos subgrupos para hacercomparaciones

    3. Producir un límite de error de estimación (B) más pequeño, comparado conel obtenido en el M.A.S. para un mismo tamaño de muestra.

    4. Los costos por observación en las encuestas son más reducidos yaque se evitan desplazamientos extremos.

    5. Las estimaciones se obtienen por subgrupos así los estratos se hacenidentificables.

    Notación: Partiendo de la población o universo U cuyo tamaño es N,ésta se divide en NL estratos. 

    Figura 4. Tamaño de estratos

    N = N1 + N2 +…+NL (Tamaño poblacional) = Tamaño del estrato i. = Valor de la observación j en el Estrato i. = Media poblacional en el estrato i.= Varianza poblacional en el estrato i.

    = Total poblacional en el estrato i.

    Proporcion poblacional en el estrato iLa media poblacional del estrato, la varianza poblacional del estrato, eltotal poblacional del estrato y el total poblacional, se obtiene de la siguientemanera:

    En cada estrato se obtiene una muestra aleatoria por M.A.S. Si tenemos el

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    26/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    26

    estrato l, se puede hacer el siguiente análisis.

      Tamaño de la muestra en el estrato i   Promedio de la muestra del estrato i

     Varianza muestral del estrato i

    ̂  Proporción estimada del estrato i  ∑     Donde   son los elementos j del estrato iTamaño de la submuestras en los estratos

     Ecuación No.1 

    Dónde:

    N = Tamaño de la población

    N = Tamaño de la muestra

    Ni= Tamaño del estrato i

    ni= Tamaño de muestra en el estrato i

    N= N1+N2+N3+..+Nh

    n = n1 + n2+…+ ni 

    Ejemplo

    La sección operativa de una empresa de confecciones cuenta con 100empleados, la cual está dividida en operarios de maquina plana, dibujantes ycortadores, de los que hay 40, 35 y 25 operarios respectivamente; se quiere hacerun estudio estadístico y se toma una muestra de 20 empleados. ¿Cuántosoperarios de cada línea deben escogerse si la selección se hace a través de unmuestreo estratificado?

    N= 100n = 20

    N1= 40N2= 35N3= 25

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    27/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    27

       

     La muestra de 20 empleados debe estar compuesta por 8 de máquina plana,7 dibujantes y 5 cortadores.

    2.2.3. Muestreo Sistemático

    Es utilizado por algunos contadores para revisar sumas, cuentas, inventarios,etc., por ser un método directo y económico. Consiste en seleccionar uno a

    uno, los elementos de la muestra en un orden determinado, dando un inicioaleatorio. Es decir, la muestra queda ordenada.La fracción de muestreo se establece por medio de la siguiente relación:   Dónde:

    f = Fracción de muestreo

    N= Población

    n = Tamaño de la muestra

    Ejemplo

    De una población de 1.000 observaciones, se desea tomar una muestra de 10,cuáles serían las observaciones que harían parte de la muestra sistemática.

    La fracción de muestreo es:    f = Fracción de muestreoN= Poblaciónn = Tamaño de la muestra

    Como la fracción de muestreo dio 100, el primer elemento se seleccionaaleatoriamente en el intervalo cero a cien, por ejemplo seleccionando elnúmero 25, el segundo elemento que se selecciona es 125 (25+100), luego el225 (125+100) y así sucesivamente, hasta completar la muestra de diez.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    28/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    28

    Puede ver un ejemplo de muestreo sistemático en:https://sites.google.com/site/unadjeammysh/recursos-de-apoyo 

    Figura 5. Recursos de apoyo

    Un problema específico del muestreo sistemático es la existencia de cualquier

    factor periódico o cíclico en la lista de la población que pudiera conducir aun error sistemático en los resultados muestrales.

    Ejemplo

    Si en un hospital hay un universo de quince mil cien historias clínicasque están numeradas interrumpidamente y se desea tener una muestraequivalente al 10%, o sea, mil quinientas diez historias, ello significa que hade tomarse una de cada 10, ya que (15100 /1510 = 10). La primera historiapuede seleccionarse del primer grupo de 10. Si la primera historia

    seleccionada es la número 8 en la población, teniendo en cuenta que elocho es un número cualquiera tomado aleatoriamente; la segunda será  la 18=(8+10) la tercera será la 28 = (18 + 10), la cuarta será la 38 = (28 + 10), y asísucesivamente.

    La estimación y tamaño de muestra tiene un análisis similar al muestreoaleatorio simple M.A.S.

    2.2.4. Muestreo Conglomerados

    Este es un método de muestreo aleatorio en el que los elementos de lapoblación se dividen en forma natural en subgrupos, de tal forma que dentro deellos sean lo más heterogéneo posible y entre ellos sean homogéneos, casocontrario al muestreo estratificado.

    Este tipo de muestreo se usa en particular cuando no se dispone de una

    Clic allí para descargar archivo

    https://sites.google.com/site/unadjeammysh/recursos-de-apoyohttps://sites.google.com/site/unadjeammysh/recursos-de-apoyohttps://sites.google.com/site/unadjeammysh/recursos-de-apoyo

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    29/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    29

    lista detallada y enumerada de cada una de las unidades que conforman eluniverso y resulta muy complejo elaborarla. Se le denomina así debido aque en la selección de la muestra en lugar de escogerse cada unidad seprocede a tomar los subgrupos o conjuntos de unidades, a los que se llama"conglomerados". Aunque quizá por ello se tienda a creer que es lomismo que el estratificado, ambos se diferencian en que en los

    conglomerados los subconjuntos se dan en la vida real o ya estánagrupados de esa manera; por ejemplo: Escuelas, tipos de Industrias,bloques de casas y otros. En el estratificado el investigador decide lasagrupaciones que utilizar según la posible variabilidad de los fenómenos aestudiar; otra diferencia es que en este el investigador conoce la distribuciónde la variable, todo lo contrario que en el muestreo por conglomerado.

    El proceso se indica definiendo los conglomerados, después se seleccionan lossubconjuntos a estudiar (o sea, que se realiza un muestreo de

    conglomerados); de estos seleccionados se procede a hacer el listado de lasunidades que componen cada conglomerado, continuando posteriormente con laselección de las unidades que integrarán la muestra, siguiendo algunos de losmétodos aleatorios indicados.

    Si se desea hacer un estudio en las escuelas de educación primaria sobre undeterminado fenómeno, inicialmente se seleccionan las escuelas que seestudiarán, de esas escuelas seleccionadas se determinan los grados o clasesque deben incluir y posteriormente se escogen los alumnos, que serán lasunidades de observación, utilizando uno de los métodos aleatorios. Se estima

    que las inferencias que se hacen en una muestra conglomerada no son tanconfiables como las que se obtienen de un estudio hecho por muestreo aleatorio.

    Ejemplo

    Si un analista de la Secretaría de Salud necesita hacer un estudio de losservicios médico-asistenciales que reciben los trabajadores del áreametropolitana, sería difícil obtener una lista de todos los trabajadores de lapoblación objetivo. Sin embargo podría obtenerse una lista de las empresas yfábricas del área. Con esta lista, el analista puede tomar una muestra aleatoriade las empresas o fábricas, que representan conglomerados detrabajadores, y obtener la información de los servicios médicos que se lesestán prestando. 

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    30/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    30

    Lección No 3: Tipos de Selección de Muestras

    En el diseño Muestra hacemos referencia a la probabilidad de selección, lacual consiste en definir el valor de probabilidad de que una muestra dadasea seleccionada. En teoría de probabilidad existen dos tipos de selección:

    3.1. Selección con Reemplazamiento:

    Consiste en que los elementos seleccionados una vez medidos vuelven a lamuestra, lo que hace que el espacio Muestra permanezca constante. Por loanterior la ocurrencia de un evento no afecta la ocurrencia de otro, por lo quelos eventos se consideran independientes.

    Ejemplo

    Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. ¿ Cuál serála probabilidad que al seleccionar dos bolas, estas sean blancas?

    La probabilidad de que la primera sea negra es:      La probabilidad de que la segunda sea negra es:      

    3.2. Selección sin Reemplazamiento:

    Los elementos elegidos una vez la medición, estos NO vuelven a lamuestra, lo que hace que el espacio muestral cambie a medida que se vantomado elementos de la muestra. 

    Ejemplo

    Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. ¿Cuál será laprobabilidad que al seleccionar dos bolas estas sean blancas, la selección essin reemplazamiento?

    La probabilidad de que la primera sea negra es: 4/9La probabilidad de que la segunda sea negra es: 3/8Recordemos que una vez elegida la primera, ésta no vuelve a la muestra.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    31/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    31

    Ejemplo

    Suponga que tenemos N = 4 unidades 1, 2, 3 y 5 en una poblaciónhipotética y desea seleccionar muestras con reemplazamiento y sinreemplazamiento de tamaño n=2

    Para los propósitos de esta selección, los valores podrían ser el número delas personas que viven en cada una de cuatro unidades habitacionales queconstituyen una población. Se realizará una comparación entre el muestreoaleatorio con y sin reemplazamiento para una muestra de tamaño n=2.Primero se listan todas las posibles muestras no ordenadas de tama ño n= 2.

    Para recordar:

    Tabla 4:Técnicas de conteoMuestreo Con Orden Sin Orden

    Con Repetición  Regla del exponente (o permutacionescon repetición)

    N n

      Multiplicación de opciones:n1 x n2  x n3…. 

    Combinaciones  

    Sin Repetición Permutaciones (de n elementos tomadostodos a la vez)

    N! = N P n  

    Permutaciones (de N elementos tomadosde r en r. con  )  

    Combinaciones (de Nelementos tomados de r en r.

    con  )  

    Lección No 4: Métodos de Inferencias, Paramétrico y No

    Paramétrico

    4. Métodos De InferenciaLos procedimientos de inferencia permiten establecer conclusiones acerca deuna población, a partir de las propiedades estudiadas en una muestra de ella.

     Además, como dichas conclusiones dependen de sucesos aleatorios, se lesasociará un nivel de confianza o de verosimilitud.

     

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    32/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    32

    Gráfico No.1 Métodos de inferencia

    4.1. Métodos ParamétricosResuelve objetivos relacionados con parámetros de una población, tales comomedia, varianza, proporción etc. Estos modelos se apoyan en el conocimientode la distribución de probabilidad asociada a dicha población aunque sedesconozca algún parámetro de dicho modelo. Por ejemplo podemos suponerque el número de clientes atendidos por hora en una entidad bancaria sigue unmodelo de Poisson pero de parámetro µ desconocido.

    Para resolver un problema de inferencia paramétrico se utilizan dos tipos deprocedimientos:

    4.1.1. Estimación: Puntual cuando obtenemos valores aproximados del

    parámetro desconocido y una medida de error asociado; por Intervaloscuando obtenemos un rango de valores, que contiene el verdadero valordel parámetro con una probabilidad o confiabilidad prefijada.

    4.1.2. Test de Hipótesis: Cuando aceptamos o rechazamos una hipótesisrelacionada con uno o varios parámetros de una población desconocidos,con un cierto nivel de error prefijado.

    4.2. Métodos no paramétricoLos métodos no paramétricos se refieren a menudo como distribución

    libremente métodos pues no confían encendido  asunciones que los datos estándibujados del dado distribución de la probabilidad.  Resuelven situacionesrelacionadas con el tipo de distribución de probabilidad asociada a la poblaciónde estudio u otros objetivos no relacionados directamente con parámetros.

    Lo deseable en estos casos será buscar la inferencia en contrastes que seanválidos bajo un amplio rango de distribuciones de la población. Tales contrastes

    Métodos deInferencia

    Parámetrico

    EstimaciónPruebas deHipótesis

    No

    Parámetrico

    Pruebas NoParámetricas

    http://www.worldlingo.com/ma/enwiki/es/Assumptionhttp://www.worldlingo.com/ma/enwiki/es/Probability_distributionhttp://www.worldlingo.com/ma/enwiki/es/Probability_distributionhttp://www.worldlingo.com/ma/enwiki/es/Assumption

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    33/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    33

    se denominan no paramétricos.

    El término no paramétrico no se significa implicar que tales modelos carecentotalmente parámetros, sino que el número y la naturaleza de los parámetros sonflexibles y no fijados por adelantado.

    Ventajas y Desventajas

    Las pruebas no paramétricas no necesitan suposiciones respecto a lacomposición de los datos poblacionales. Las pruebas no paramétricas son deuso común:

    1. Cuando no se cumplen las suposiciones requeridas por otrastécnicas usadas, por lo general llamadas pruebas paramétricas.

    2. Cuando es necesario usar un tamaño de muestra pequeño y no es

    posible verificar que se cumplan ciertas suposiciones clave.3. Cuando se necesita convertir datos cualitativos a información útil parala toma de decisiones.

    Existen muchos casos en los que se recogen datos medidos en una escalanominal u ordinal. Muchas aplicaciones de negocios involucran opiniones osentimientos y esos datos se usan de manera cualitativa.

    Ventajas

    Las pruebas no paramétricas tienen varias ventajas sobre las pruebas

    paramétricas:

    1. Por lo general, son fáciles de usar y entender.2. Eliminan la necesidad de suposiciones restrictivas de las pruebas

    paramétricas.3. Se pueden usar con muestras pequeñas.4. Se pueden usar con datos cualitativos.

    Desventajas 

    También las pruebas no paramétricas tienen desventajas:

    1. A veces, ignoran, desperdician o pierden información.2. No son tan eficientes como las paramétricas.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    34/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    34

    Lección No 5: Estimadores y propiedades de los estimadores

    5. Estimador

    En estadística, un estimador es un estadístico (esto es, una función de lamuestra) usado para estimar un parámetro desconocido de la población. Porejemplo, si se desea conocer el precio medio de un artículo (el parámetrodesconocido) se recogerán observaciones del precio de dicho artículo endiversos establecimientos (la muestra) y la media aritmética de lasobservaciones puede utilizarse como estimador del precio medio.

    Para cada parámetro pueden existir varios estimadores diferentes. En general,escogeremos el estimador que posea mejores propiedades que los restantes,como insesgadez, eficiencia, convergencia y robustez (consistencia).

    5.1. Propiedades de un estimadorEl concepto de estimación de parámetros mediante la especificación de laspropiedades que deben cumplir los estimadores y el desarrollo de técnicasapropiadas para implementar el proceso de estimación. Se utilizar ·  el puntode vista práctico de la teoría del muestreo, que considera un parámetro comouna cantidad fija pero desconocida.

    Para evaluar la calidad de un estadígrafo como un estimador este debe

    cumplir las siguientes propiedades:

    5.1.1. Insesgado

    Un estimador insesgado es aquel cuya media o valor esperado de la distribuciónde las de las estimaciones es igual al parámetro estimado. En otras palabras,cuando el promedio de un estimador muestral es igual al parámetro poblacionalque se desea estimar.

    5.1.2. Eficiencia:

    La eficiencia se refiere al tamaño del error estándar del estadígrafo de lamuestra. Si se comparan dos estadígrafos de una muestra del mismo tamaño yse desea decidir cuál de los dos es el estimador más eficiente, se escogeráel estadígrafo que tenga el menor error estándar o desviación de ladistribución muestra. Supóngase que se escoge una muestra de un tamañodado y se decide cuando usar la media muestra o la mediana muestra para

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    35/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    35

    estimar la media de la población. Si se calcula el error estándar de la mediamuestra y se encuentra que es igual a 2.15 y luego se calcula el errorestándar de la mediana muestra y se encuentra que es de 2.6, se podrádecir que la media muestra es un estimador más eficiente de la media de lapoblación porque su error estándar es menor o con menos variación, tendráuna mayor oportunidad de producir un estimador más cercano al parámetro de

    la población bajo estudio.

    5.1.3. Consistencia:

    Un estadígrafo es un estimador consistente de un parámetro de la poblaciónsi en la medida en que el tamaño de la muestra aumenta se está seguro deque el valor del estadígrafo se acerca al valor del parámetro de la población.

    Cuando un estimador es consistente, se vuelve más confiable tomando

    muestras grandes. De esta manera, cuando usted se preocupa poraumentar el tamaño de la muestra para obtener más información acerca deun parámetro de la población, debe primero encontrar si su estadígrafo esun estimador consistente, si no es así, usted desperdiciará dinero y tiempoal tomar muestras grandes.

    5.1.4. Suficiencia:

    Estadísticos que, de alguna manera, resumen toda la información de una muestrarelacionada con un parámetro objetivo, se dice que tienen la propiedad de

    suficiencia, es decir, utilizan toda la información relevante contenida en unamuestra.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    36/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    36

    Ejercicios propuestos

      En cierta cadena de centros comerciales trabajan 150 personas en eldepartamento de personal, 450 en el departamento de ventas, 200 en el de

    contabilidad y 100 en el de servicios al cliente. Con el objeto de realizar unaencuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. Quénúmero de trabajadores tendríamos que seleccionar en cada departamentoatendiendo a un criterio de proporcionalidad 

    R/ta: 30, 90, 40, 20

      Suponga que se quiere estimar el número de días-hombre perdidos debidoa accidentes de trabajo en un mes particular. Además se sabe que la mayorparte de dichos accidentes se presentan en los niveles operativo, técnico y

    administrativo. ¿Cuál de los siguientes diseños de muestreo es el másaconsejable?: 

    R/ta: Estratificado, identificando como estrato los niveles de trabajo

      Supongamos que en la ciudad “T” hay 200 barrios. Si elegimos al azar dosde estos barrios, de manera que la muestra esté compuesta por todoslos individuos de esos dos barrios. Se trata de de: 

    R/ta: Por conglomerados

      Se ha proyectado realizar una encuesta sobre el consumo de leche enlas familias. El número de familias de la población es 6000 y el tamaño dela muestra 840, con la siguiente clasificación de profesión u oficio:  

    Profesionales: 100 Comerciantes: 200Operarios: 2000 Agricultores: 600Servicios 1900 Empleados: 1200

    Cuántas familias de agricultores deben estar representadas en la muestra.R/ta: 84

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    37/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    37

    CAPITULO DOS: DISTRIBUCIONES MUESTRALES 

    Introducción

    Como se ha señalado anteriormente, el propósito del muestreo es averiguar lascaracterísticas de la población en estudio. Se recuerda de nuevo que parapoder dar conclusiones de los parámetros se usan los estadísticos que sonmediciones obtenidas en la muestra, mientras que los parámetros soncaracterísticas medibles propias de la población.

    El escoger una muestra, es un proceso que inevitablemente puede arrojardiferentes subconjuntos de la población, por ejemplo de la población de tutores,se puede escoger como muestra los tutores de la ECBTI o escoger los deECEDU. El valor del estadístico es aleatorio porque depende de los elementoselegidos en la muestra seleccionada- también aleatoria- de tamaño “n” y, por lotanto, el estadístico tiene una distribución de probabilidad la cual es llamada laDistribución Muestral del estadístico.

    Objetivo general 

    Que los estudiantes lleguen a formar, no sólo, una muestra si no un conjunto deposibles muestras de una población, con las unidades de observación y seancapaces de reconocer la distribución de ese conjunto de muestras.

    Objetivos especí f icos 

      Comprender la importancia del teorema del límite central.

      Establecer las diferencias entre un parámetro y un estadístico

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    38/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    38

    Lección No 6: Distribuciones Muestrales

    En estadística, la distribución muestral es lo que resulta de considerar todas lasmuestras posibles que pueden ser tomadas de una población. Su estudio permite

    calcular la probabilidad que se tiene, dada una sola muestra, de acercarse alparámetro de la población. Mediante la distribución muestral se puede estimar elerror para un tamaño de muestra dado.

    Como bien lo afirma Ximenez, C. (S, F.) “La  estadística inferencial trata sobre las

    inferencias con respecto a las poblaciones (sus parámetros µ y σ 2  ) a partir de la

    información contenida en las muestras (los estadísticos ̅ y S2  ).Para poder llevar a cabo esas inferencias es necesario conocer la relación que se

    establece entre estadísticos y parámetros. El concepto que permite poner en

    relación ambas cosas es “la distribución muestral de un estadístico”.  

    Figura 6. Distribución de un estadístico  Algunos estadísticos pueden ser: La media, la proporción y la desviación.Recuerde que todos son cálculos en las muestras.

     A cada una de las muestras se les calcula el respectivo estadístico, es decir, setendrá tantos estadísticos como muestras se haya obtenido. Por ejemplo, si el

    estadístico que se está estimando es la media, y si se obtuvo 8 muestras,entonces, serán 8 medias muestrales las que tendrá.

    Con todos los resultados del estadístico en todas las muestras, se forma ladistribución muestral del estadístico.

    Distribución Muestral: Es la distribución de Probabilidad de un estadístico 

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    39/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    39

    6. Diferentes distribuciones muestrales  

    Ya que a nivel muestral se pueden calcular diferentes estadísticos, como lamedia, desviación y la proporción entre otros, se pueden encontrar susrespectivas distribuciones muestrales, entre estas:

      Distribución muestral de la medias  Distribución muestral de las proporciones

      Distribución muestral de la diferencias de medias

      Distribución muestral de la diferencias de proporciones

    Nota: El muestreo se puede hacer sin o con reemplazamiento.

    Ejemplo

    En la figura a continuación se tiene que la variable X, es el número de párrafos

    digitado por minuto, X: 1, 2, 3, 4.

    Figura 7. Distribución de la población

    Poblacionalmente se tiene:Parámetros 

    E(X)= 2.5Var (X)= 1.1180

    E(x) es el valor esperado de la variable o promedio, y V(x) es la varianza.

    ∑ 

     

    ∑  ̅  Se sugiere al lector comprobar los cálculos para la varianza con el comandoVAR.P en Excel.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    40/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    40

    Ejemplo

    Si se quiere escoger una muestra de tamaño 3, es decir compuesta por 3personas y si además las muestras se toman con reposición es decir se puedevolver a incluir el individuo. La distribución muestral será:

    Gráfico No.2. Histograma de medias muestrales

    El 1,00 que se observa corresponde a la media de la muestra conformada por lasobservaciones 1, 1, 1; es decir se tomo una muestra de tres personas pero al sercon reposición, el primer elemento que se obtuvo fue 1, éste se devuelve lapoblación y tiene de nuevo la posibilidad de ser escogido, que es lo que vuelve asuceder, del mismo modo en la tercera extracción. El valor 1,33 es la media deuna muestra que puede ser por ejemplo las observaciones 1, 1, 2. El total de

    muestras es 24 conformadas por 3 personas, ya que se aplica el principio de laspermutaciones.

    Lección No 7: Distribución Muestral de la Media y de laProporción

    Los estadísticos obtenidos en una muestra son variables aleatorias, por lo cualdeben tener una distribución de probabilidad, así que la media muestral tiene una

    distribución.

    Supongamos que se tiene una muestra de tamaño “n” observaciones tomada deuna población normal N (µ; σ2) cada observación X1= 1, 2, 3,…, n tendrá lamisma distribución que la población de donde fue tomada la muestra.

    0

    2

    4

    6

    8

    10

    12

    14

    1,00 1,33 1,67 2,00 2,33 2,67 3,00 3,33 3,67 4,00

    Distribución de frecuencias de mediasmuestrales

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    41/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    41

    7. Principios y conceptos en la medias muestrales

    Teorema: (Población infinita)-------------------------------------------------------------------------------------------------------

    Sea     la media de la muestra aleatoria de tamaño nproveniente de una población infinita de tamaño N con media µ y varianza σ2.

    Entonces:̅  El valor esperado de la media muestral es la media poblacional

     La varianza del estimador es igual a la varianza poblacional dividida por el tamañode la muestra.

    Teorema: (Población Finita)-------------------------------------------------------------------------------------------------------  

    Sea     la media de la muestra aleatoria de tamaño nproveniente de una población finita de tamaño N con media µ y varianza σ2.Entonces:̅    Comentario:  Se conoce como el factor de corrección para poblaciones finitas. Cuando N esmuy grande comparado con n, la diferencia se hace despreciable lo que originaque para poblaciones infinitas dicho factor de corrección se hace uno.

    7.1. Distribución Muestral de la Media

    Las muestras aleatorias obtenidas de una población son, por naturaleza propia,impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño ytomadas de la misma población tenga la misma media muestral o que seancompletamente parecidas; puede esperarse que cualquier estadístico, como lamedia muestral, calculado a partir de las medias en una muestra aleatoria, cambie

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    42/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    42

    su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todoslos valores posibles de un estadístico. Tales distribuciones serán muy importantes enel estudio de la estadística inferencial, porque las inferencias sobre las poblacionesse harán usando estadísticas muestrales. Como el análisis de las distribucionesasociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de unestadístico muestral como un instrumento para hacer inferencias sobre un parámetro

    poblacional desconocido.

    Como los valores de un estadístico, tal como x, varían de una muestra aleatoria aotra, se le puede considerar como una variable aleatoria con su correspondientedistribución de frecuencias.

    La distribución de frecuencia de un estadístico muestral se denomina distribuciónmuestral. En general, la distribución muestral de un estadístico es la de todos susvalores posibles calculados a partir de muestras del mismo tamaño.

    Figura 8. Distribución muestral de medias

    Ejemplo Construcción de la distribución de las medias muestrales.

    Un Colegio tiene siete profesores, la retribución por hora cátedra es la que semuestra a continuación:

    Tabla 5:Tabla No. Salario profesores 

    Profesor Salario $1234567

    7000700080008000700080009000

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    43/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    43

    Para determinar la distribución muestral de las medias, se seleccionaron todaslas muestras posibles de tamaño 2, sabiendo que son sin sustitución y queno interesa el orden de selección en la población. Se calculan las medias decada muestra y se calcula la media de las medias muestrales.

    Para saber cuántas muestras posibles se pueden tomar, se utiliza la combinatoria,por los preceptos tomados: Sin repetición y no importa el orden

    El valor de 21, es el número de muestras tamaño 2 que se pueden formar deuna población de 7 elementos. A continuación se indican las 21 muestras posiblesy el valor de la media para cada una de las muestras:

    72 =7!

    (7 2)! 2! =

    7!

    (5)! 2! =

    5! × 6 × 7

    5!2!  =

    42

    2!  =

    42

    2  = 21

     

    Paso 1: Media de la población

    9  Paso 2: Varianza de dicha población. 

     

    9 99 

     

    La varianza poblacional está dada por:

    Entonces:

    Otra formulación es:

    Recuerde que la desviación es la raiz cuadrada de la varianza, entonces la

    desviavión en este caso es  99 699 Paso 3: Distribución muestral de las medias 

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    44/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    44

    Tabla 6:

    Distribución salarios de profesores. Muestreo sin reemplazamiento y las medias Muestra Prof. Salario Media Muestra Prof. Salario Media

    1 1 y 2 7000-7000 7000 12 3 y 4 8000-8000 8000

    2 1 y 3 7000-8000 7500 13 3 y 5 8000-7000 7500

    3 1 y 4 7000-8000 7500 14 3 y 6 8000-8000 8000

    4 1 y 5 7000-7000 7000 15 3 y 7 8000-9000 8500

    5 1 y 6 7000-8000 7500 16 4 y 5 8000-7000 7500

    6 1 y 7 7000-9000 8000 17 4 y 6 8000-8000 8000

    7 2 y 3 7000-8000 7500 18 4 y 7 8000-9000 8500

    8 2 y 4 7000-8000 7500 19 5 y 6 7000-8000 7500

    9 2 y 5 7000-7000 7000 20 5 y 7 7000-9000 8000

    10 2 y 6 7000-8000 7500 21 6 y 7 8000-9000 8500

    11 2 y 7 7000-9000 8000

    Suma Total 162.000

    En el cuadro siguiente se indica la distribución de probabilidad para elmuestreo de medias, donde la sumatoria de todas las probabilidades es iguala uno:

    Tabla 7:Distribución de probabilidad

    Media muestral Número de medias Probabilidad

    7000 3 0,1429

    7500 9 0,4285

    8000 6 0,2857

    8500 3 0,1429

    Suma 21 1,000

    Gráfico No.3. Histograma de medias muestrales salario de los profesores

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    45/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    45

    La media poblacional es igual a la media de las medias muestrales 

    La media de la distribución muestral de medias, se determina sumando lasdiferentes medias muestrales y dividiendo la suma entre el número de muestras.

    La media de todas las medias muestrales en general se expresa:

      ̅ ̅    Ecuación No.2 

    Primero se obtiene todas las muestras (todos los subconjuntos) y luego a cadamuestra le calcula la media, finalmente obtendrá, tantas medias como muestrashaya, y con esas medias calcula de nuevo un promedio; es decir, se calcula una

    media de medias.   ̅ 6  Vea el valor obtenido en el paso 1 (Media poblacional) y compárelo con elresultado anterior ¡Son equivalentes!  Note que:    ̅  es la media de las medias muestrales y  es la media poblacional.

    Por tanto para nuestro caso:

    Paso 4: Media de la distribución muestral de medias 

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    46/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    46

    Paso 5: Construcción de distribución de errores muestrales 

      ̅    

     

    Error Muestral

    Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, lamedia poblacional , entonces la media muestral, como medida, conlleva algúnerror. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria detamaño 25 de una población con media ; si la media de la muestra es  ̅ , entonces a la diferencia observada   ̅  se le denominael error muestral . Una media muestral x puede pensarse como la suma de doscantidades: la media poblacional   y el error muestral; si e  denota el errormuestral, entonces:

    Ecuación No.3

     Al calcular la media y desviación estándar de los errores muestrales “e” (últimacolumna de la tabla 7) se tiene respectivamente:

    Se deja como ejercicio al lector calcular  y  

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    47/113

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    48/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    48

    Muestreo con reemp lazo

    Si de una población se eligen muestras de tamaño  n  conreemplazo (o la población es No finita), entonces el error estándar

    de la media es igual a la desviación estándar de la distribución delos errores muestrales.

    En general se tiene:  ̅   Ecuación No.4 

    Muestreo sin reemp lazo

    Cuando las muestras se toman de una población pequeña y sin

    reemplazo se puede usar la siguiente fórmula para encontrar   ̅:   ̅   √   

    Ecuación No.5 

     

     

    Error estándar del estadístico

    La desviación estándar de la distribución muestral de un estadístico se conocecomo er ro r es tándar del es tadíst ic o . Para el ejercicio anterior el error estándarde la media denotado por    ̅, es 451,75.

     Aunque, se puede notar que en este caso la desviación de los erroresmuestrales y el error estándar, son iguales.

      ̅,

     : Es llamado factor de corrección para poblaciones finitas, o en dondese muestrea sin reemplazo.

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    49/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    49

    Más adelante se verá que, estas dos concepciones hacen parte de los principiosdel teorema del límite central. Para lo cual se desarrollan dos ejemplos, uno demuestreo con reemplazamiento y otro sin reemplazamiento.

    El siguiente es un diagrama de flujo que le permite identificar en que caso debe

    usar o no el factor de corrección.

    Gráfico No.4. Diagrama de flujo para error estándar de la media

    Teorema central del límite.

    En el caso de una población con media  y varianza 2  , la distribución muestralde medias de todas las muestras posibles de tamaño n a partir de la población,tendrá una distribución aproximadamente normal (siendo la media de la

    distribución muestral igual a   y la varianza igual a n/2   ) considerando que eltamaño de la muestra es bastante grande.

    El teorema central del límite es uno de los teoremas más importantes dentro de

    ¿Es la población

    infinita?

    COMIENZO

    ¿Se muestrea

    con sustitución?

    ¿Es N≥ 20n?

      ̅    √   

      ̅     si

    si

    si

    No

    No

  • 8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica

    50/113

    UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA

    CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 

    50

    las ciencias estadísticas, ya que su funcionalidad es muy grande.

    Hay que destacar tres aspectos importantes del teorema central de límite.

    Primer principio:

    Si el tamaño de la muestra n es suficientemente grande, la distribución muestralde las medias será más o menos normal. Esto se cumple ya sea que la poblaciónesté o no distribuida normalmente. Esto es, el teorema se verifica, ya sea que lapoblación esté distribuida en forma normal, o bien sea sesgada o uniforme.

    Segundo principio:Como se mostró con anterioridad, la media de la población, , y la media de todas

    las medias muestrales posibles,  x  , son iguales. Si la población es grande y se

    selecciona un número grande de muestras de la población, la media de las medias

    muestrales se aproximará a la media poblacional.

    Tercer principio:

    La varianza de la distribución de medias muestrales se determina de n/2   .No existe acuerdo general sobre lo que constituye un tamaño de muestra“suficientemente grande”. Algunos estadísticos consideran que  es 30; otrospiensan que un número pequeño como 12 es adecuado. El ejemplo sobre lossalarios por hora de todos los profesores del colegio funcionó bastante bien conuna muestra de 2. Sin embargo, a menos que la población sea aproximadamente

    normal, los tamaños de muestra así de pequeños, por lo general no dan comoresultado una distribución muestral que se distribuya normalmente. A medida queel tamaño de la muestra se vuelve cada vez más grande, la distribución de lamedia muestral se aproxima más a la distribución normal con forma de campana.

    TEOREMA CENTRAL DEL LÍMITE:

    Sea X1, X2,…, Xn  un