Manual de Estadística 2013

download Manual de Estadística 2013

of 51

Transcript of Manual de Estadística 2013

  • 8/10/2019 Manual de Estadstica 2013

    1/51

    Sistema de Gestinde la Investigacin

    UPN

    2013

    MANUAL DE ESTADSTICA

  • 8/10/2019 Manual de Estadstica 2013

    2/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 2 -

    MANUAL DEESTADSTICA

    Profesor: MsC. Luis Alberto Rubio Jcobo

  • 8/10/2019 Manual de Estadstica 2013

    3/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 3 -

    PRESENTACIN

    El equipo de docentes que coordina las propuestas y la elaboracin de instrumentos para el

    Sistema de Gestin de la Investigacin de la Universidad Privada del Norte, tiene el agrado

    de presentar la segunda versin del Manual de Estadstica para proyectos de investigacin.

    Este manual constituye un material de consulta bsica para docentes y estudiantes de las

    diferentes carreras profesionales de nuestra universidad, posibilitando el uso adecuado de la

    estadstica, requerida en diversos momentos del proceso investigativo.

    Esperamos que con su uso, el presente manual vaya enriquecindose y hacindose ms

    familiar para todos los que de una u otra manera estamos involucrados con la investigacin

    en todas sus manifestaciones.

  • 8/10/2019 Manual de Estadstica 2013

    4/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 4 -

    NDICE

    PARTE 1: CONCEPTOS GENERALES ............................................................................................. - 6 -

    1. DEFINICIN DE ESTADSTICA ............................................................................... - 6 -

    2. CLASIFICACIN DE LA ESTADSTICA ................................................................... - 6 -

    3. UNIVERSO: ............................................................................................................... - 6 -

    4. POBLACIN: ............................................................................................................. - 6 -

    5. MUESTRA ................................................................................................................. - 6 -

    6. MUESTREO .............................................................................................................. - 7 -

    7. UNIDAD DE ESTUDIO .............................................................................................. - 7 -

    8. OBSERVACIONES .................................................................................................... - 7 -

    9. VARIABLE ................................................................................................................. - 7 -

    10. PARMETRO ............................................................................................................ - 8 -

    11. ESTIMADOR ............................................................................................................. - 8 -

    12. TCNICAS DE RECOLECCIN DE DATOS:........................................................... - 8 -

    13. INSTRUMENTOS DE RECOLECCIN DE DATOS ................................................. - 9 -

    PARTE 2: PRESENTACIN DE LA INFORMACIN...................................................................... - 10 -

    1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF) .................................... - 10 -

    2. PARTES DE UN CUADRO DE DISTRIBUCIN DE FRECUENCIAS.................... - 10 -

    3. ELEMENTOS PARA CONSTRUIR UN CDF........................................................... - 10 -

    4. PROPIEDADES DE UN CDF .................................................................................. - 11 -

    5. CONSTRUCCIN DE CUADROS DE FRECUENCIAS ......................................... - 11 -

    6. CONSTRUCCIN DE CDF CON EXCEL ............................................................... - 12 -

    7. GRFICO ESTADSTICO ....................................................................................... - 13 -

    8. PARTES DE UN GRFICO ESTADSTICO............................................................ - 13 -

    9. CRITERIOS PARA CONSTRUIR GRFICOS ........................................................ - 21 -

    10. TIPOS DE GRAFICOS ESTADSTICOS ................................................................. - 21 -

    11. CONSTRUCCIN DE GRFICOS ESTADSTICOS DE EXCEL ........................... - 21 -

    PARTE 3: MEDIDAS ESTADSTICAS ............................................................................................. - 23 -

    1. MEDIDAS DE TENDENCIA CENTRAL ..................................................................... - 23 -

    2. MEDIDAS DE LOCALIZACIN ................................................................................. - 23 -

    4. MEDIDAS DE VARIABILIDAD ................................................................................... - 24 -

    5. MEDIDAS DE FORMA ............................................................................................... - 24 -

    6. FRMULAS PARA CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL: ........ - 25 -

    7. FRMULAS PARA CALCULAR LAS MEDIDAS DE DISPERSIN O VARIACIN . - 26 -

    8. MEDIDAS ESTADSTICAS CON MEGASTAT .......................................................... - 27 -

    9. APLICACIN: (Evaluacin de un caso) ..................................................................... - 27 -

  • 8/10/2019 Manual de Estadstica 2013

    5/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 5 -

    PARTE 4: ANLISIS DE CORRELACIN Y REGRESIN ............................................................ - 30 -

    1. ANLISIS DE CORRELACIN ............................................................................... - 30 -

    2. ANLISIS DE REGRESIN .................................................................................... - 30 -

    PARTE 5: DISTRIBUCIONES DE PROBABILIDAD ....................................................................... - 33 -

    1. LA DISTRIBUCIN BINOMIAL ............................................................................... - 33 -

    2. LA DISTRIBUCIN POISSON ................................................................................ - 35 -

    3. LA DISTRIBUCIN NORMAL ................................................................................. - 38 -

    4. LA DISTRIBUCIN NORMAL ESTNDAR ............................................................ - 38 -

    5. APLICACIN CON MEGASTAT ............................................................................. - 39 -

    PARTE 6: ESTIMACIN ESTADSTICA ......................................................................................... - 41 -

    1. ESTIMACION PUNTUAL......................................................................................... - 41 -

    2. ESTIMACIN INTERVLICA .................................................................................. - 41 -

    3. APLICACIN UTILIZANDO MEGASTAT ................................................................ - 43 -

    PARTE 7: DETERMINACIN DEL TAMAO DE MUESTRA ........................................................ - 46 -

    1. MUESTREO ............................................................................................................ - 46 -

    2. TCNICAS DE MUESTREO ................................................................................... - 46 -

    3. DETERMINACIN DEL TAMAO DE MUESTRA ................................................. - 46 -

    5. FRMULAS PARA DETERMINAR EL TAMAO DE MUESTRA .......................... - 47 -

    6. PASOS A SEGUIR PARA DETERMINAR LA MUESTRA PTIMA ....................... - 47 -

    7. APLICACIN UTILIZANDO MEGASTAT ................................................................ - 48 -

    PARTE 8: PRUEBA DE HIPTESIS................................................................................................ - 50 -1. DEFINICIONES PRELIMINARES ........................................................................... - 50 -

    2. CLASES DE HIPTESIS ........................................................................................ - 50 -

    3. ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPTESIS: ................... - 50 -

    5. TIPOS DE PRUEBAS DE HIPTESIS: .................................................................. - 51 -

    6. ETAPAS DE UNA PRUEBA DE HIPTESIS: ......................................................... - 51 -

    8. FRMULAS DE ALGUNOS ESTADSTICOS DE PRUEBA ................................... - 52 -

    9. PRUEBA DE HIPTESIS CON MEGASTAT .......................................................... - 53 -

    10. APLICACIN UTILIZANDO MEGASTAT ................................................................ - 54 -

  • 8/10/2019 Manual de Estadstica 2013

    6/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 6 -

    PARTE 1: CONCEPTOS GENERALES

    1. DEFINICIN DE ESTADSTICALa Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas para recopilar,organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables en estudiode una poblacin, con el fin de obtener conclusiones y tomar decisiones sobre determinadoshechos o fenmenos en estudio.La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la actualidad,para hacer investigacin cientfica se necesita conocer de estadstica.

    2. CLASIFICACIN DE LA ESTADSTICALa Estadstica se clasifica de la siguiente manera:2.1. Estadstica Descriptiva

    Es aquella rea de la Estadstica que describe y analiza una poblacin, sin pretendersacar conclusiones de tipo general. Es decir, las conclusiones obtenidas son vlidas slopara dicha poblacin.

    2.2. Estadstica InferencialEs aquella rea de la Estadstica, cuyo propsito es inferir o inducir leyes decomportamiento de una poblacin, a partir del estudio de una muestra. Es decir lasconclusiones obtenidas a partir de una muestra, son vlidas para toda la poblacin.

    3. UNIVERSO:Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas enforma general en un espacio y tiempo.Ejemplo:Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de pacientes, conjunto declientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos,

    conjunto de documentos, etc.; de una determinada regin o zona en un tiempo determinado.4. POBLACIN:

    Es un conjunto grande y completo de individuos, elementos o unidades que presentan comomnimo una caracterstica en comn y observable. Para definir una poblacin esta debecontener los siguientes elementos: contenido, espacio y tiempo. Al nmero de elementos deuna poblacin de denota por N.Una poblacin puede clasificarse de la siguiente manera:A. Segn su extensin:

    Poblacin Finita:Es aquella que tiene un determinado nmero de elementos.Poblacin Infinita:Es aquella cuyos elementos no se pueden contar.

    B. Segn su mbito o naturaleza:

    Poblacin Objeto:Esta dada por los elementos que forman la poblacin.Poblacin Objetivo: est dada por la informacin que da la poblacin objeto

    Nota: De un universo se pueden desprender muchas poblaciones, pero operativamente sepueden hablar indistintamente como poblacin o universo.

    5. MUESTRAEs una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es unacoleccin de unidades de muestreo seleccionados de un marco muestral o de varios marcosmuestrales. Al nmero de elementos de la muestra se denota por n.Una muestra tiene lassiguientes caractersticas:a. Es representativa.b. Es adecuada.

  • 8/10/2019 Manual de Estadstica 2013

    7/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 7 -

    Para la determinacin del tamao de muestra se utilizan tcnicas de muestreo dondedependiendo de esta, se utiliza correctamente las frmulas adecuadas.

    6. MUESTREOEs una tcnica estadstica por la cual se realizan inferencias o generalizaciones para unapoblacin examinando solo una muestra de ella. Es una tcnica empleada para seleccionarelementos de una poblacin.Su propsito es proporcionar diferente tipo de informacin estadstica de naturaleza cuantitativao cualitativa. Por su gran importancia los investigadores lo utilizan en los diferentes campos desaber y tambin lo usamos en la vida diaria.

    7. UNIDAD DE ESTUDIOEs el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar lainformacin. Es el individuo u objeto del cual se toman las mediciones u observaciones.Ejemplos:Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una botella decerveza, una universidad, una vaca, una gota de sangre, etc.

    8. OBSERVACIONESEstadsticamente son los datos que se recolectan para un estudio. Una observacin o dato escuando una variable en s toma un valor especfico.

    9. VARIABLEUna variable es una caracterstica de estudio de una poblacin. Una variable es lo que sequiere evaluar en una investigacin. Las caractersticas toman diferentes valores que varan deindividuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen inalterablesen las unidades de estudio reciben el nombre de constantes.Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X,

    Y, Z; y los valores de las variables se designan con letras minsculas: xi,yi, etc.Las variables se clasifican de la siguiente manera:Por su relacin: variable dependiente - variable independiente.Por su escala de medicin: NominalOrdinalIntervaloRazn.Por su naturaleza: Cuantitativas - Cualitativas.

    Ejemplos:Unidad de estudio VariableEstudiante Peso, talla, edad, ci, nmero de hermanos, raza, color de ojos, tipo de

    sangre, etc.Empresa Ganancia, costos, produccin, nmero de trabajadores, nmero de

    computadoras, etc.PYME Nmero de trabajadores, aos de funcionamiento, ganancias, etc.

  • 8/10/2019 Manual de Estadstica 2013

    8/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 8 -

    10. PARMETROEs un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin. Dentrode estos tenemos:a. El promedio poblacionalb. La varianza poblacional.c. La proporcin poblacional, etc.

    11. ESTIMADOREs un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentrode estos tenemos:a. El promedio muestral.b. La varianza muestral.

    c. La proporcin muestral, etc.

    12. TCNICAS DE RECOLECCIN DE DATOS:Las tcnicas de recoleccin de datos permiten la obtencin sistemtica de informacin acercade los objetos de estudio (personas, objetos y fenmenos) y de su entorno.Como ya se mencion, la recoleccin de datos tiene que ser sistemtica, ya que, si los datos serecolectan al azar ser difcil responder las preguntas de investigacin de una maneraconcluyente.Las tcnicas de recoleccin de datos son

    1. Utilizacin de la informacin disponible2. Observacin3. Entrevista( cara a cara)4. Cuestionarios auto administrados

    5. Discusin con grupos focales6. Otras

    OBSERVACINLa observacin es una tcnica que implica seleccionar ver y registrar sistemticamente laconducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la conductahumana es una tcnica de recoleccin de datos muy utilizada que puede llevarse a cabo dediferentes formas:a. Observacin participativa: El observador participa en la situacin que observa.b. Observacin no participativa: El observador no participa en la situacin que observa.

    Las observaciones pueden servir para diferentes propsitos. Pueden dar informacin adicionaly ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios. Loscuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o porque

    los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin se puede,

  • 8/10/2019 Manual de Estadstica 2013

    9/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 9 -

    entonces, verificar la informacin recolectada (especialmente sobre temas como alcoholismo,drogadiccin, sida,) pero tambin puede ser una fuente primaria de informacin (observacinsistemtica de los juegos de los nios).La observacin de la conducta humana puede formar parte de algn estudio, pero comoconsume tiempo se usa con mayor frecuencia en estudios de pequea escala.

    ENTREVISTALa entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral delos entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas durante laentrevista pueden ser registradas por escrito o grabadas en una cinta. La entrevista puedeconducirse con diferentes grados de flexibilidad.Las entrevistas utilizan una cdula para asegurar que se discuten todos los puntos, pero dandosuficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer preguntasadicionales para obtener tanta informacin adicional como sea posible, Las preguntas sonabiertas y no hay restricciones para las respuestas.Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistasindividuales o grupales con informantes claves.Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de lasituacin que est investigando. Se aplica en estudios exploratorios y en los estudios de caso.

    ENCUESTASHoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo deobtener informacin de una muestra de individuos. Esta "muestra" es usualmente slo unafraccin de la poblacin bajo estudio. Una "encuesta" recoge informacin de una "muestra."Una "muestra" es usualmente slo una porcin de la poblacin bajo estudio.Las encuestas pueden ser clasificadas de muchas maneras. Una dimensin es por tamao ytipo de muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o nohumanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas).

    Mientras que muchos de los principios son los mismos para todas las encuestas, el foco aquser en mtodos para hacer encuestas a individuos. Las encuestas pueden ser clasificadas porsu mtodo de recoleccin de datos. Las encuestas por correo, telefnicas y entrevistas enpersona son las ms comunes. En los mtodos ms nuevos de recoger datos, la informacinse entra directamente a la computadora ya sea por un entrevistador adiestrado o an por lamisma persona entrevistada. Un ejemplo bien conocido es la medicin de audiencias detelevisin usando aparatos conectados a una muestra de televisores que grabanautomticamente los canales que se observan.

    OTRAS TCNICAS DE RECOLECCION DE DATOSa. Tcnica de grupo nominal.b. Tcnica Delphi.c. Historias de vida.

    d. Escalas.e. Ensayos.f. Estudios de casos.g. Mapeo.h. Tcnicas rpidas de evaluacin de sondeo.i. Encuestas participativas.

    13. INSTRUMENTOS DE RECOLECCIN DE DATOSSi tenemos presente el tema de investigacin por el que nos estamos guiando se percibir que,una vez obtenidos los indicadores de los elementos tericos y definido el diseo de lainvestigacin, se har necesario estructurar las tcnicas d recoleccin de datoscorrespondientes, para as poder construir los instrumentos que nos permitan obtener talesdatos de la realidad.

  • 8/10/2019 Manual de Estadstica 2013

    10/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 10 -

    Un instrumento de recoleccin de datos es, en principio, cualquier recurso del que puedavalerse el investigador para acercarse a los fenmenos y extraer de ellos informacin. Yaadelantbamos que dentro de cada instrumento concreto pueden distinguirse dos aspectosdiferentes: una forma y un contenido.La forma del instrumento se refiere al tipo de aproximacin que establecemos con lo emprico,a las tcnicas que utilizamos para esta tarea; una exposicin ms detallada de las principaleses la que se ofrece al lector en este mismo captulo. En cuanto al contenido ste quedaexpresado en la especificacin de los datos concretos que necesitamos conseguir; se realiza,por lo tanto, en una serie de tems que no son otra cosa que los indicadores bajo la forma depreguntas, de elementos a observar, etc.De este modo, el instrumento sintetiza en s toda la labor previa de investigacin: resume losaportes del marco terico al seleccionar datos que corresponden a los indicadores y, por lotanto, a las variables o conceptos utilizados; pero tambin expresa todo lo que tiene deespecficamente emprico nuestro objeto de estudio, pues sintetiza a travs de las tcnicas derecoleccin que emplea, el diseo concreto escogido para el trabajo.

    PARTE 2: PRESENTACIN DE LA INFORMACIN

    En la Estadstica se trabaja generalmente con una gran cantidad de datos los cuales por facilidad deanlisis y clculos se organizan en Cuadros de Distribucin de Frecuencias (CDF) y GrficosEstadsticos (GE).

    1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF)Un cuadro de distribucin de frecuencias, es una tabla resumen rectangular de un conjunto dedatos que muestra el comportamiento o distribucin de la variable en estudio en forma rpida y

    resumida.Aun cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta,generalmente es comn seguir algunos pasos que de alguna forma homogenizan criterios yayudan a los fines didcticos.Para realizar este anlisis se tiene que tener en cuenta el tipo de variable que se estevaluando.

    2. PARTES DE UN CUADRO DE DISTRIBUCIN DE FRECUENCIASLas partes de un CDF son las siguientes:

    a. Nmero del cuadro de frecuencias en forma correlativa.b. Ttulo: Especificar la variable y la poblacin en estudio.c. Encabezado o conceptos.d. Cuerpo o contenido del cuadro de frecuencias.

    e. Nota de pie (no siempre es necesaria).f. Fuente.g. Elaboracin.

    3. ELEMENTOS PARA CONSTRUIR UN CDFPara construir un cuadro de frecuencias se utilizan los siguientes elementos:

    a. Valores de la variable XiLos valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos susvalores correspondientes no agrupados se representan como X1, X2, X3,..., X50.

    b. Intervalos de claseLos intervalos son subconjuntos de la recta real Ron que estn definidos por un lmitemenor o inferior Li y un lmite mayor o superior Ls.

    c. Frecuencia1. Frecuencia absoluta simple

  • 8/10/2019 Manual de Estadstica 2013

    11/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 11 -

    Se denota por fi. Est constituida por el nmero de veces que se repite un valor. En elcaso de intervalos es el nmero de observaciones comprendidas en dicho intervalo.Estas frecuencias siempre son enteros positivos y adems la suma de todos ellos esel tamao de la muestra n.

    2. Frecuencia relativaSe denota por hi.Indica la relacin o proporcin existente entre la frecuencia absolutasimple y el nmero total de datos. Estas frecuencias son nmeros fraccionariospositivos entre o y 1. Para fines interpretativos estas frecuencias se expresan en %(hi%). As:

    n

    fihi o 100(%) x

    n

    ifhi

    3. Frecuencia absoluta acumuladaSe denota por Fi. Resulta de la suma de las frecuencias cuyas marcas de claseson iguales o menores a la marca de clase del intervalo dado o considerado, es

    decir:F1 = f1F2 = f1 + f2F3 = f1 + f2 + f3.............................................Fj = f1 + f2 + f3 + ....... + fi

    4. Frecuencia relativa acumuladaSe denota Hi. Resulta de la suma de las frecuencias relativas simples hasta lafrecuencia del intervalo considerado. As:H4 = h1 + h2 + h3 + h4H6 = h1 + h2 +....+ h6Para fines interpretativos estas frecuencias se expresan en % (Hi%)

    d. Marca de claseSe denota por Yi. Es el promedio de los valores correspondientes a los lmites inferior ysuperior de cada uno de los intervalos determinados.

    4. PROPIEDADES DE UN CDFa. Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi, Fi 0.b. Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0 y 1, es decir

    0 hi, Hi 1.c. F1 siempre es igual f1 y H1 siempre es igual a h1.d. La suma de todas las fi es igual a n y la suma de las hi es igual a 1.e. Fm siempre es igual a n y Hm siempre es igual a 1.

    5. CONSTRUCCIN DE CUADROS DE FRECUENCIASPara la construccin de los CDF hay que tener en cuenta el tipo de variable que se estaanalizando, es decir, si es cuantitativa continua, cuantitativa discreta o variable cualitativa.

    a. CDF PARA UNA VARIABLE CUANTITATIVA CONTINUAPara la construccin de este cuadro hay que realizar los siguientes pasos:PASO 1. Determinar el Rango del conjunto de datos.

    PASO 2. Determinar el nmero de intervalos m.

    Este valor siempre es un nmero entero (Redondeo)PASO 3. Determinar la amplitud A intervlica (de cada intervalo).

    R = Valor mximo - Valor mnimo

    m = 1 + 3.322 lo n

    A = R / m

  • 8/10/2019 Manual de Estadstica 2013

    12/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 12 -

    Este valor est en funcin de la estructura de la base de datos (tomar elinmediato superior)

    PASO 4. Determinar el nuevo rango R2 (Solamente si se tom un inmediatosuperior)

    A: es la amplitud teniendo en cuenta el inmediato superior.PASO 5. Determinar los intervalos y finalmente construir el cuadro.

    b. Cdf para una variable cuantitativa discretaPara la construccin de un CDF para una variable cuantitativa discreta (valoresdiscretos) ya no se utiliza los pasos anteriores solamente colocar en los intervalos a losdiferentes valores discretos.

    c. Cdf para una variable cualitativaPara la construccin de un CDF para una variable cualitativa se sigue los mismos pasosque para una variable cuantitativa discreta, es decir, solamente colocar en los en losintervalos a las diferentes categoras de la variable cualitativa.

    6. CONSTRUCCIN DE CDF CON EXCELSi bien es cierto que el EXCEL no es un programa exclusivamente diseado para anlisis dedatos, es muy utilizado dentro del anlisis de estos cuando se realiza una investigacincientfica. Una de las ventajas y razones de su uso, est en su fcil acceso, pues en todas lascomputadoras est instalado y as se podr explorar el funcionamiento de las herramientas quese presentan en este programa.

    A. CONSTRUCCIN DE CUADROS DE FRECUENCIA UTILIZANDO TABLAS DINMICASPara construir cuadros de distribucin de frecuencias a travs de Excel se utiliza laherramienta TABLAS DINMICAS.Teniendo en cuenta esta base de datos realizar los siguientes pasos:Hacemos clic en Insertar /tabla dinmica.aparece la siguiente pantalla:

    Luego aparecen las siguientes ventanas de trabajo.activamos (a) lista de base dedatos de Excel y (b) Tabla Dinmica. Luego siguiente seleccionamos el rangorespectivo, luego siguiente..luego seleccionamos la opcin diseo.En la opcin diseo seleccionamos la variable quevamos a analizar y con el cursor activamos dichavariable y lo arrastramos hasta la opcin FILA y luegola misma variable la arrastramos hasta la opcinDATOS. Finalmente aceptamos y obtenemos losresultados.

    R2 = A * m

  • 8/10/2019 Manual de Estadstica 2013

    13/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 13 -

    En funcin a lo que se quiera obtener como resultados de la variable analizada, seselecciona OPCIONES DE TABLA DINMICApara obtener ya sea totales, promedio ofrecuencia de dicha variable. Esta ventana de trabajo es la siguiente:

    B. CONSTRUCCIN DE CUADROS DE FRECUENCIA UTILIZANDO MEGASTATPara construir cuadros de distribucin de frecuencias con Megaestat se utiliza la opcinComplementos/MegaStat Distribucin de Frecuencias.Luego se debe seleccionar para variables cuantitativas o variables cualitativas.

    Si se selecciona variable cuantitativa se aprecia la siguiente ventana, donde debemosingresar el rangode los datos de la

    variable, luego sehace la seleccinde datosrespectiva yactivamos algntipo de grfico. Sepueden realizaralgunasmodificaciones al CDF dependiendo del investigador como tamao de intervalos, nmerode intervalos, lmite superior, lmite inferior, etc.

    7. GRFICO ESTADSTICO Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el

    comportamiento de una variable en estudio. Los grficos estadsticos son representaciones de informacin real que existe en nuestro

    mundo, es una expresin artstica de datos reales y observados. Un grfico sirve tambin para comparar visualmente el comportamiento de dos o ms

    variables similares o relacionadas.

    8. PARTES DE UN GRFICO ESTADSTICO Numeracin. Ttulo: Aqu se seala la poblacin en estudio y la variable de inters. Diagrama: est dado por el propio dibujo, el cual representa el comportamiento de los

    datos. Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia entre los

    elementos del grfico y la naturaleza de las medidas representadas. Fuente: Aqu se seala el CDF que permiti obtener el respectivo grfico.

  • 8/10/2019 Manual de Estadstica 2013

    14/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 21 -

    9. CRITERIOS PARA CONSTRUIR GRFICOS No existe una regla especfica para la construccin de grficos, pero si es posible

    considerar algunas recomendaciones o criterios. Se emplea una diversidad de grficos, cuya estructura o forma depender del tipo de

    variable que se est estudiando. Este grfico debe tener rasgos simples y de fcil comprensin.

    10. TIPOS DE GRAFICOS ESTADSTICOSHay varias tipos de grficos, los cuales dependen del tipo de variable que se est evaluando.Presentaremos aqu los ms importantes:

    a. Grfico de bastones: Se utiliza cuando se tienen datos de una variable cuantitativadiscreta.

    b. Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa continua.

    c. Grfico de Barras: Se utiliza cuando se tienen datos de una variable cualitativa.

    d. Grfico Sectorial o Pastel: Se utiliza cuando se tiene informacin de una variablecualitativa o cuantitativa discreta.

    e. Polgono de frecuencias: Se utiliza para indicar el comportamiento de un conjunto dedatos.

    f. Grfico de series de tiempo: Se utiliza para analizar variables cuantitativas continuaspero expresadas en el tiempo.

    g. Grfico de Cajas y Bigote: Se utiliza para analizar el comportamiento de una variablecuantitativa. Se obtiene en base a los cuartiles.

    h. Grfico de la telaraa: Sirve para visualizar el comportamiento de una variablecuantitativa cuando evala ciertos criterios de evaluacin.

    11. CONSTRUCCIN DE GRFICOS ESTADSTICOS DE EXCELExcel puede crear grficos a partir de datos previamente seleccionados en una hoja de clculo.El usuario puede insertar un grfico en una hoja de clculo, o crear el grfico en una hojaespecial para grficos. En cada caso el grfico queda vinculado a los datos a partir de loscuales fue creado, por lo que si en algn momento los datos cambian, el grfico se actualizarde forma automtica. Los grficos de Excel contienen muchos objetos, ttulos, etiquetas en losejes que pueden ser seleccionados y modificados individualmente segn las necesidades delusuario.Para crear un grfico con el As ist ente p ara Grfico s, se deben seguir los siguientes pasos:1. Seleccionar los datos a representar.

    2. Ejecutar el comando Ins ert ar / Grfic o o hacer clic en el botn

    A continuacin aparece el siguiente cuadro de dilogo del Asistente para Grfico que permiteelegir el tipo y subtipo de grfico que se va a utilizar entre dos listas que son estndares ypersonalizados.

  • 8/10/2019 Manual de Estadstica 2013

    15/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 22 -

    Luego seleccionar el rango de los datos a evaluar, sealando correctamente las series queestn evaluando.

    Luego debemos configurar los aspectos que conciernen a la presentacin del grfico,aportando una vista preliminar del mismo. As, se determinan el ttulo, las inscripciones de losejes, la apariencia de stos, la leyenda, la aparicin o no de tabla de datos y los rtulos. Lasopciones de y Finalizar son las mismas que en los otros cuadros.Finalmente hacer clic en el botn Final izar, el grfico aparece ya en el lugar seleccionado. Sise quiere desplazar a algn otro lugar sobre la propia hoja en que se encuentra bastaseleccionar todo el grfico y arrastrarlo con el mouse.

  • 8/10/2019 Manual de Estadstica 2013

    16/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 23 -

    PARTE 3: MEDIDAS ESTADSTICAS

    La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen elcomportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos:A. Las medidas de Posicin: Dentro de estas tenemos:

    a. Medidas de tendencia central: media, moda, mediana.b. Medidas de localizacin: cuartiles, deciles y percentiles.

    B. Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin.C. Las medidas de deformacin: asimetra y kurtosis.

    1. MEDIDAS DE TENDENCIA CENTRAL1.1. MEDIA ARITMTICA

    Se denota por x Es la medida estadstica ms fcil de calcular. La media o promedio es el punto central de un conjunto de datos. Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea sin son

    datos agrupados o datos no agrupados.1.2. MEDIANA

    Se denota por Me. Es un valor que divide al conjunto de datos en dos partes iguales, es decir, cada

    segmento tiene el 50% de los datos. Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea sin son

    datos agrupados o datos no agrupados.1.3. MODA

    Se denota por Mo. La moda es el valor que ms se repite en un conjunto de datos. En un conjunto de datos se presentan los siguientes casos:

    a. No existir datos Amodalb. 1 moda Unimodal.c. 2 modas Bimodald. 3 a ms modas Multimodal

    Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea sin sondatos agrupados o datos no agrupados.

    2. MEDIDAS DE LOCALIZACIN2.1. CUARTILES

    Se denotan por Qk, donde k=1,2,3 Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada

    sector tiene el 25% de los datos. Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea si son

    datos agrupados o datos no agrupados.2.2. DECILES Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9 Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada

    sector tiene el 10% de los datos.2.3. PERCENTILES

    Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99 Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir,

    cada sector tiene el 1% de los datos. Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea sin son

    datos agrupados o datos no agrupados.

  • 8/10/2019 Manual de Estadstica 2013

    17/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 24 -

    4. MEDIDAS DE VARIABILIDAD3.1. RANGO

    Se denota por R y la medida de variabilidad ms fcil de calcular. Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto de

    datos.3.2. VARIANZA

    Mide la variabilidad de un conjunto de datos respecto a un valor central (promedio) Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilgica

    su interpretacin. Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea sin son

    datos agrupados o datos no agrupados.3.3. DESVIACIN ESTNDAR

    Mide la variabilidad de un conjunto de datos respecto a su valor central pero enunidades originales.

    Esta es la medida de variabilidad que tiene una interpretacin lgica.

    Se obtiene al obtener la raz cuadrada de la varianza.3.4. COEFICIENTE DE VARIACIN Se denota por C.V. El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento

    homogneo o heterogneo. Para llegar a determinar la homogeneidad se compara con un valor convencional

    del 33%. Si el CV 33% el conjunto de datos tiene un comportamiento homogneo. Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.

    5. MEDIDAS DE FORMA4.1. ASIMETRA

    La asimetra se entiende como la deformacin horizontal de un conjunto de datos. Para conocer esta asimetra se calcula el coeficiente de asimetra As. En un conjunto de datos pueden presentar los siguientes casos:

    a. As= 0, el conjunto de datos es simtrica.b. As0, el conjunto de datos es asimtrica positiva.

    4.2. KURTOSIS Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es decir,

    mide el apuntamiento o achatamiento de un conjunto de datos. Para conocer qu tipo de asimetra tiene un conjunto de datos, se utilizan lassiguientes formulas:

    A. Kurtosis en funcin de los momentosSi K1>3, el conjunto de datos es leptocrtica.

    Si K1=3, el conjunto de datos es mesoctica.

    Si K1

  • 8/10/2019 Manual de Estadstica 2013

    18/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 25 -

    B. Kurtosis en funcin de los momentos de orden 4Si K2>0, el conjunto de datos es leptocrtica.Si K2=0, el conjunto de datos es mesoctica.Si K20.263, el conjunto de datos es leptocrtica. Si K3=0.263, el conjunto de datos es mesocrtica. Si K3

  • 8/10/2019 Manual de Estadstica 2013

    19/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 26 -

    CUANTILES

    QUARTILES Seguir pasos similares a la mediana.

    j

    j

    K

    f

    FknALiQ

    14/

    Similar a la Me. Lo nico que cambia es el elementodeterminante.

    DECILESSeguir pasos similares a la mediana.

    j

    j

    Kf

    FknALiD

    110/

    Similar a la Me. Lo nico que cambia es el elementodeterminante.

    PERCENTILES

    Seguir pasos similares a la mediana.

    j

    j

    Kf

    FknALiP

    1100/

    Similar a la Me. Lo nico que cambia es el elementodeterminante.

    7. FRMULAS PARA CALCULAR LAS MEDIDAS DE DISPERSIN O VARIACIN

    MEDIDAS PARA DATOS NO AGRUPADOS PARA DATOS AGRUPADOS

    RANGO minmax VVR LILSR

    Ls: Lmite superiorLi: Lmite inferior

    VARIANZA

    POBLACIONAL N

    uXN

    i

    i

    1

    2

    2

    )(

    Xi : Datos de la poblacinu : promedio poblacionalN: Nmero de elementos de la poblacin

    N

    fuYm

    i

    ii

    1

    2

    2

    *)(

    Yi : Marca de claseu : promedio poblacional

    N: Nmero de elementos de la poblacinfi: frecuencia absoluta simple

    MUESTRAL1

    )(1

    2

    2

    n

    xx

    s

    n

    i

    i

    Xi : Datos de la muestrax : promedio muestraln : Nmero de elementos de la muestra

    1

    *)(1

    2

    2

    n

    fyy

    s

    m

    i

    ii

    yi: Marca de clasey : promedio muestraln : Nmero de elementos de la muestrafi: frecuencia absoluta simple

    Frmulasabreviadas

    n

    i

    n

    i

    i

    in

    x

    xn

    s1

    1

    2

    22

    )(

    1

    1

    m

    i

    m

    i

    ii

    iin

    fy

    fyn

    s1

    1

    2

    22

    )(

    1

    1

    DESVIACIN ESTNDAR2

    D.E. Poblacional

    2ss D.E. Muestral

    COEFICIENTE DEVARIACIN

    100*..u

    VC

    C.V. Poblacional

    100*..x

    sVC

    C.V. Muestral

  • 8/10/2019 Manual de Estadstica 2013

    20/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 27 -

    8. MEDIDAS ESTADSTICAS CON MEGASTATEn Excel los pasos a seguir para obtener estas medidas son los siguientes:a. Tener una base de datos respecto a variables cuantitativas.b. Seleccionar en MegaStat / Estadstica descriptiva/. aparece la siguiente ventana, luego

    hay que ingresar los datos respectivos:

    9. APLICACIN: (Evaluacin de un caso)RUBIOJA S.A. es una de las firmas consultoras financieras ms importantes del Per. Ofrece asesorafinanciera y servicios a firmas particulares y a gobiernos regionales. Grecia Rubio, acababa de serencargada del departamento de personal de esta empresa. En los tres aos pasados, se han agregadootros ayudantes y hace seis semanas, se sum al departamento un estadstico recin graduado. Damneempez hace poco a revisar las prcticas de contratacin del departamento. Empez la revisinexaminando el campo ms crtico, las personas en adiestramiento financiero. La firma contrata entre 60 y130 de estas personas al ao, segn sea el crecimiento de la firma, el movimiento de empleados y elnmero de perspectivas notables" que encuentre. Prcticamente todos los que estn en adiestramientofinanciero se contratan entre los estudiantes del ltimo ao de escuelas superiores con especializacin

    financiera. Damne seleccion al azar 100 de los 197 candidatos que haban sido contratados hace dos aosy an seguan trabajando.

    Cada ficha contena la informacin siguiente (los datos van en el apndice adjunto):1. Gnero. (0=Femenino y 1=Masculino)2. Edad al contratarse.3. Promedio ponderado de sus notas universitarias (escala de 0 a 20).4. Calidad de la universidad de procedencia. (1=Excelente, 2=Muy buena, 3=Buena y 4=Regular)5. Nota de la prueba de aptitudes. La prueba produce una puntuacin de 0 (muy improbable que tenga

    xito en el trabajo) a 100 (muy probable que tenga xito en el trabajo).6. Evaluacin del rendimiento al final del segundo ao. Esta evaluacin produce una puntuacin

    numrica desde 0 (muy malo) hasta 100 (excelente).

    La Gerencia de RUBIOJA S.A. estn seguros de que la escala es de intervalo y tambin han decidido, conbase en los tres aos de experiencia con dicha escala, que una puntuacin inferior a 50 es insatisfactoria,50-69 es satisfactoria, 70-89 por sobre el promedio, y por encima de 89 es excelente. Grecia llama alestadstico a su oficina y le dice: "Estoy encantada de tener un estadstico que nos ayude. No estamos anlistos a desarrollar un modelo estadstico acabado de lo que constituye una buena contratacin, pero estiempo de empezar a evaluar algunas de las variables de que tenemos informacin. El gran nmero depersonas que contratamos, el alto costo de adiestrarlas y el hecho de que no podemos evaluar realmentelos rendimientos, hasta fines del segundo ao, significan que cualquier mejora en nuestra eficacia decontratacin tendr por resultado ahorros sustanciales para la firma.

    Para comenzar a tratar el tema, Podras dar respuesta a las siguientes preguntas?1. Necesitamos un resumen de la edad del personal al contratarse, del promedio de calificaciones de

    grado y de la evaluacin del rendimiento en el segundo ao, para tener una apreciacin general delgrupo en adiestramiento financiero. Cul es el perfil de este personal?

    2. Es ms alto el puntaje de varones en la nota de la prueba de aptitudes que el de mujeres? Y en la

    evaluacin del rendimiento?

  • 8/10/2019 Manual de Estadstica 2013

    21/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 28 -

    3. Un criterio inicial en RUBIOJA S.A era mantener la calificacin promedio de grado de los contratadospor encima de 14.00. Se sigue manteniendo este criterio?

    4. Otro criterio era mantener por lo menos un tercio de los contratados que provengan de escuelas decategora 2. Se sigue manteniendo este criterio?

    5. Son diferentes los rendimientos en la prueba de entrada para las diferentes calidades de escuelas dedonde provienen los candidatos? Y en la Evaluacin del rendimiento del segundo ao?

    Si Ud. fuera el analista que conclusiones le dara a Grecia Rubio respecto al anlisis querealiz. Utilice la siguiente base de datos.

    No. Gnero Edad Calificacin Calidad Universitaria ndice-xito Rendimiento 2

    1 1 22 15,41 3 62 72

    2 1 26 15,71 1 60 71

    3 1 22 12,45 2 80 66

    4 1 23 15,69 2 86 91

    5 1 25 16,05 1 86 48

    6 1 26 16,21 3 64 95

    7 0 27 14,42 2 54 828 1 23 12,87 3 80 929 1 23 13,08 2 62 7310 1 26 16,30 3 77 8111 1 24 15,82 4 61 6712 0 24 14,85 3 67 9513 0 36 13,31 4 95 9614 1 27 16,67 4 62 5915 0 26 16,35 2 50 7916 1 24 12,50 1 62 8817 1 26 12,32 1 81 5218 1 23 14,72 2 76 71

    19 1 24 13,94 2 87 7520 1 24 16,92 2 73 7521 0 25 13,14 3 85 9322 1 23 14,92 3 57 8423 1 23 13,81 2 89 9024 0 26 15,53 3 70 8325 1 25 15,33 3 65 7326 0 25 12,95 2 89 9727 1 24 12,24 4 87 8828 1 23 14,94 4 89 8129 1 22 12,57 3 94 7430 0 30 12,92 3 71 6731 1 24 15,94 1 63 8032 1 25 13,80 4 67 6433 1 23 14,42 3 96 82

    34 1 24 14,72 2 73 8235 1 26 12,60 3 92 8136 0 23 14,53 3 88 77

    37 1 26 14,76 4 82 8938 0 26 13,12 3 84 9539 1 26 13,35 4 86 5840 0 23 14,76 2 72 7441 1 22 15,27 4 82 8942 1 26 17,00 2 77 6843 1 24 16,57 2 66 7744 1 26 14,02 3 73 6745 1 25 13,08 1 85 9946 1 24 13,93 3 58 96

    47 1 25 14,17 2 58 97

    48 0 24 14,65 3 79 92

  • 8/10/2019 Manual de Estadstica 2013

    22/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 29 -

    49 1 22 13,92 1 50 95

    50 1 25 13,28 3 93 6751 1 25 12,96 2 75 52

    52 0 23 13,97 2 82 82

    53 1 25 13,92 3 57 8354 1 24 14,92 3 67 8755 1 24 16,33 2 60 73

    56 0 23 14,25 4 56 6757 1 23 15,29 1 94 72

    58 1 26 15,23 3 92 6659 1 26 15,73 3 81 95

    60 0 23 12,94 1 73 8261 1 24 15,96 1 91 8462 1 24 16,96 2 72 9863 1 27 12,23 3 85 93

    64 1 22 15,35 2 96 8765 0 23 16,77 2 85 5766 1 24 16,12 2 89 8567 0 25 14,34 3 92 8168 1 24 14,69 3 66 9569 1 22 14,67 2 85 9070 1 23 15,56 2 54 8071 1 22 12,35 2 85 4872 1 24 13,39 3 65 7173 0 26 16,99 1 76 6374 0 28 15,29 4 63 8775 0 26 15,93 2 89 9776 1 25 13,41 3 83 9777 1 25 15,55 2 57 7978 1 25 13,97 1 96 7179 0 23 12,81 4 72 7280 1 24 12,99 2 73 8981 1 25 15,67 2 53 9482 1 23 12,47 3 86 7883 1 24 12,77 3 64 8984 0 24 14,67 1 80 8485 0 25 13,94 3 77 9186 1 24 14,90 1 52 6987

    1 23 15,44 2 70 8988 0 23 16,03 4 90 9189 1 29 12,15 4 74 8990 0 22 13,42 2 95 9491 0 26 12,02 4 84 9592 0 22 13,04 3 68 7893 0 30 14,35 4 92 8494 1 25 13,65 2 52 8595 1 23 12,66 2 82 6996 1 26 13,22 3 56 7197 1 23 13,43 3 85 5898 1 22 15,54 4 85 9399 1 26 16,51 3 64 97

    100 1 23 16,91 3 61 83

  • 8/10/2019 Manual de Estadstica 2013

    23/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 30 -

    PARTE 4: ANLISIS DE CORRELACIN Y REGRESIN

    1. ANLISIS DE CORRELACIN

    El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin oafinidad entre las variables cuantitativas consideradas en un estudio.

    Se llamar CORRELACIN SIMPLE cuando se trata de analizar la relacin entre dosvariables. Se llamar CORRELACIN LINEAL O RECTILNEA si la funcin es una recta, yde CORRELACIN NO LINEAL cuando la funcin es una curva o una funcin de gradosuperior.

    El COEFICIENTE DE CORRELACIN DE PEARSON, es el estadgrafo que mide el gradode asociacin o afinidad entre las variables cuantitativas y se denota por r la cual sedefine como:

    Interpretacin:-1 -0.7 -0.4 0 0.4 0.7 +1

    Perfecta Alta Regular Baja Baja Regular Alta Perfecta

    N E G A T I V A P O S I T I V A

    2. ANLISIS DE REGRESIN

    2.1. ANLISIS DE REGRESIN LINEAL SIMPLE

    El anlisis de regresin es una tcnica estadstica que consiste en determinar larelacin funcional entre dos variables cuantitativas en estudio.

    Esta relacin funcional entre las variables, es una ecuacin matemtica de la formaY= A + B X, que recibe el nombre tambin de Funcin de Regresin o Modelo deRegresin.

    A la variable Y se le denomina variable dependiente, a la variable X independiente y alas variables A, B se les denomina parmetros de la ecuacin de regresin.

    La finalidad del Anlisis de Regresin es hacer pronsticos es decir, hacerestimaciones futuros de la variable dependiente.

    PASOS A SEGUIR:a. Realizar el diagrama de dispersin y ver el comportamiento de la variable.b. Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los

    parmetros de la ecuacin. Las frmulas son las siguientes:

    n

    i

    n

    iii

    n

    i

    n

    iii

    n

    iii

    XXn

    YXYXn

    B

    1

    2

    1

    2

    1 11

    )(

    XBYA

    c. Para hacer el pronstico o el valor estimado de Y, reemplazar en la ecuacinmatemtica el respectivo valor de Xo, de la siguiente manera:Y = A + B (Xo)

    n

    i

    n

    i

    i

    n

    i

    n

    i

    ii

    n

    i

    n

    i

    n

    iiiii

    YYnXXn

    YXYXnr

    1

    2

    1

    1

    2

    1 1

    22

    1 1 1

    )()(

  • 8/10/2019 Manual de Estadstica 2013

    24/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 31 -

    2.3. REGRESIN LINEAL MLTIPLE

    El ARLM es una tcnica estadstica que consiste en determinar el modelo deregresin lineal mltiple de una variable respuesta (Y) y un conjunto de variablesindependientes (Xs).

    El modelo de regresin lineal mltiple est dado por la siguiente ecuacin:

    KKXXXY ...22110 Para encontrar este modelo, es decir, estimar sus coeficientes tambin se utiliza el

    Mtodo de los Mnimos Cuadrados Ordinarios. Los elementos de este modelo de regresin mltiple son los siguientes:

    Y es la variable dependiente o variable respuesta.A las Xs se le llama variables independientes.Bs se les llama coeficientes de regresin.

    En el ARLM se prueban las siguientes Hiptesis:Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y);H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).

    Para dar respuesta a esta Hiptesis se utiliza el anlisis de varianza.

    2.4. REGRESIN LINEAL CON EXCEL (MEGASTAT)Para realizar estos ejercicios se deben realizar los siguientes pasos: Hacer clic enComplementos / MegaStat /y aparece la siguiente ventana.

    Luego aparece la ventana de dilogo donde hay que ingresar el rango de Y, el rango deX, activar rtulos, las opciones de salida y algunas alternativas de inters para elinvestigador.

  • 8/10/2019 Manual de Estadstica 2013

    25/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 32 -

    Luego tomar las decisiones respectivas.

    APLICACIN 01LA EMPRESA HIDRANDINA de la ciudad de Trujillo,est haciendo un estudio sobre los consumos de energa(en miles de kilowatts - hora) y el nmero de reas detrabajo en un conjunto de Empresas Privadas. Para esteestudio se selecciona una muestra aleatoria de 10Empresas Privadas, en la cual se obtuvo los siguientesresultados: (ver cuadro)Se solicita:a. Estimar la ecuacin de regresin lineal.b. Evaluar el consumo (en miles de kilowatts-hora), parauna Empresa que tiene 6 reas de trabajo.

    SALIDA DEL MEGASTAT:

    Regression Analysisr 0.857 n 10r 0.926 k 1

    Std. Error 2.021 Dep. Var. Consumo de energa (miles de kw)

    ANOVA tableSource SS df MS F p-value

    Regression 196.2333 1 196.2333 48.06 .0001Residual 32.6667 8 4.0833

    Total 228.9000 9

    Regression output confidence interval

    variables coefficients std. error t (df=8) p-value95%lower 95% upper

    Intercept -1.8889 1.5763 -1.198 .2651 -5.5237 1.7460Nmero de reas de

    trabajo 3.2222 0.4648 6.932 .0001 2.1504 4.2941

    APLICACIN 02:El Administrador General de Vencedores S.A. est haciendo unestudio entre el gasto de mantenimiento de sus computadoras yel ao de antigedad de dichas mquinas. Para esto recurre a laoficina de Mantenimiento y Contabilidad obteniendo la siguienteinformacin: (ver cuadro)Se solicita:a. Estimar la ecuacin de regresin lineal.b. Estimar cunto sera el costo de mantenimiento de unacomputadora que tiene 7 aos.c. Calcular e interpretar el valor del coeficiente de regresin linealr

    APLICACIN 03:El jefe de personal de una empresa comercializadora cree que existeuna relacin entre la tardanza al trabajo y la edad del trabajador. Con elpropsito de estudiar el problema tom en cuenta la edad de dieztrabajadores escogidos al azar y contabiliz los das de tardanzadurante todo un ao. Los resultados fueron como se observa en latabla que sigue:Se solicita:a. Construir el diagrama de dispersin.b. Obtener la ecuacin de la recta de regresin.c. Si un docente tiene 38 aos, averiguar Cuntas tardanzas se

    espera que tenga al ao?d. Si un trabajador tiene 3 tardanzas al ao, averiguar Qu edad se

    puede esperar que tenga este trabajador?e. Determinar el grado de relacin entre las variables en estudio.

    N de casaNmero de

    reas detrabajo

    Consumode energa(miles de

    kw)1 2 42 4 113 4 104 3 55 1 36 3 67 1 38 5 189 5 1410 3 7

    Total

    N demaquina

    Tiempo deantigedad

    (aos)

    Costo demantenimiento.

    ($)1 1 142 1 163 2 204 2 245 3 306 3 28

    Total

    NEdad en

    aosN de Tardanza en

    un ao1 25 202 50 53 35 104 20 205 45 86 50 27 30 158 40 129 62 110 40 8

    Total

  • 8/10/2019 Manual de Estadstica 2013

    26/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 33 -

    PARTE 5: DISTRIBUCIONES DE PROBABILIDAD

    1. LA DISTRIBUCIN BINOMIAL La Distribucin Binomial es una las distribuciones de probabilidad discretas ms

    importantes, la cual tiene muchas aplicaciones en Ingeniera, Administracin, etc. Esta distribucin se origina en los Ensayos o Experimentos Bernoullique consiste en

    realizar 1 experimento, con la obtencin de dos resultados posibles, llamados xito yfracaso.Ejemplos:1. Lanzar una moneda.2. Rendir un examen. Ensayos de Bernoulli3. Observar el sexo de un recin nacido.4. Encender una mquina, etc.

    Experimento Binomial:

    Es aquel que consiste en realizar n veces ensayos de Bernoulli, en el cual se debecumplir lo siguiente:a. Cada ensayo tienen solo dos resultados posibles.b. Los ensayos son independientes.c. La probabilidad de xito p es constante en cada ensayo.

    Esta distribucin tienen las siguientes caractersticas:1. Su variable aleatoria est definida como:

    X: Nmero de xitos en n ensayos.2. Su recorrido o rango es:

    Rx= {0,1,2,3,4,5, , n}3. Su funcin de probabilidad est dada por:

    4. Sus parmetros son :n: Nmero de veces que se repite el experimento o tamao de muestra.p: Probabilidad de xito en cada uno de los ensayos o proporcin de inters.

    5. Su notacin es : X B ( n, p )

    6. Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente

    APLICACIN CON MEGASAT:

    APLICACIN 01:En el almacn de la Empresa MAESTROS, hay 12 artculos elctricos de los cules 3 de ellos sondefectuosos. Si se extrae una muestra aleatoria de 5 a partir del grupo. Cul es la probabilidad de que:

    a. Exactamente 1 sea defectuoso.b. Ninguno sea defectuoso.c. Menos de 2 sean defectuosos.

    d. Ms de 3 sean defectuosos.

    A. P ( X a ) = Usar directamente la tablaB. P ( X > a ) = 1 - P ( X a )C. P ( X a ) = 1 - P ( X a - 1 )

    D. P ( X = a ) = P ( X a ) - P ( X a - 1 )E. P ( a X b ) = P ( X b ) - P ( X a-1 )F. P ( a X < b ) = P ( X b-1 ) - P ( X a-1 )G. P ( a < X < b ) = P ( X b-1 ) - P ( X a )

  • 8/10/2019 Manual de Estadstica 2013

    27/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 34 -

    SOLUCIN:

    Binomial distribution5 n

    0.25 pcumulative

    X P(X) probability

    0 0.23730 0.237301 0.39551 0.632812 0.26367 0.896483 0.08789 0.984384 0.01465 0.999025 0.00098 1.00000

    1.00000

    1.250 expected value0.938 variance0.968 standard deviation

    APLICACIN 02:En la Universidad Privada del Norte Escuela de Postgrado se est aplicando un nuevo mtodo deenseanza del aprendizaje del Idioma Portugus. Despus de completar con la aplicacin de este mtodose evala que el 1% sali desaprobado. El director acadmico selecciona en forma aleatoria estudiantesal azar de la Universidad:a. Cul es la probabilidad de que exista ms de 3 desaprobados?b. Cul es la probabilidad de que exista menos de 3 desaprobados?c. Cul es la probabilidad de que haya entre 2 y 4 desaprobados inclusive?

    0.00

    0.20

    0.40

    0.60

    0 1 2 3 4 5

    P(X)

    X

    Binomial distribution (n = 5, p = 0.25)

  • 8/10/2019 Manual de Estadstica 2013

    28/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 35 -

    APLICACIN 03:Segn informacin de Secretara Acadmica de la UPN, el 65% de los estudiantes son de gneromasculino y el resto del gnero femenino. Para la aplicacin de una encuesta por parte de la asistenta

    social, se selecciona aleatoriamente a 10 estudiantes:a. Cul es la probabilidad de encuestar a menos de 5 hombres?b. Cul es la probabilidad de encuestar ms de 5 hombres?c. Cul es la probabilidad de encuestar a 3 y 8 hombres inclusive?d. Cul es la probabilidad de encuestar a ningn hombre?

    2. LA DISTRIBUCIN POISSON

    La Distribucin de Poisson es otra de las distribuciones de probabilidad discretas msimportantes porque se aplica en muchos problemas reales.

    Esta distribucin se origina en problemas que consisten en observar la ocurrencia deeventos discretos en un intervalo continuo (unidad de medida).

    Ejemplos:1. Nmero de manchas en un metro cuadrado de un esmaltado de un refrigerador.2. Nmero de vehculos que llegan a una estacin de servicios durante una hora.3. Nmero de llamadas telefnicas en un da.4. Nmero de clientes que llegan a un banco durante las 10 y 12 p.m.5. Nmero de bacterias en un cm3de agua.

    Esta distribucin tienen las siguientes caractersticas:- Su variable aleatoria est definida como:

    X: Nmero de ocurrencias en 1 unidad de medida (Tiempo, Volumen,Superficie, etc)

    - Su recorrido o rango es:Rx= {0,1,2,3,4,5, .}

    Su funcin de probabilidad est dada por:

    Su parmetro es : tasa promedio de ocurrencia en 1 unidad de medida. Su notacin es: X P( ) Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente

    H. P ( X a ) = Usar directamente la tabla

    I. P ( X > a ) = 1 - P ( X a )J. P ( X a ) = 1 - P ( X a - 1 )K. P ( X = a ) = P ( X a ) - P ( X a - 1 )L. P ( a X b ) = P ( X b ) - P ( X a-1 )M. P ( a X < b ) = P ( X b-1 ) - P ( X a-1 )N. P ( a < X < b ) = P ( X b-1 ) - P ( X a )

  • 8/10/2019 Manual de Estadstica 2013

    29/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 36 -

    APLICACIN CON MEGASTAT

    APLICACIN 01En un estudio de Satisfaccin del Cliente, se determin que las personas llegan aleatoriamente a la ventanilla decaja, con una tasa promedio de 24 personas por hora, durante la hora punta comprendida entre 11:00 am y12:00 am de cierto da. El jefe administrativo desea calcular las siguientes probabilidades:a. Cul es la probabilidad de que lleguen exactamente 5 personas durante esa hora?b. Cul es la probabilidad de que lleguen ms de 5 personas durante esa hora?c. Cul es la probabilidad de que lleguen menos de 5 personas durante esa hora?d. Cul es la probabilidad de que lleguen ms de 8 personas durante esa hora?

    SOLUCIN:

    Poisson distribution24 mean rate of occurrence

    cumulativeX P(X) probability

    0 0.00000 0.000001 0.00000 0.000002 0.00000 0.000003 0.00000 0.000004 0.00000 0.000005 0.00000 0.000006 0.00001 0.000017 0.00003 0.000058 0.00010 0.000159 0.00027 0.00043

    10 0.00066 0.0010811 0.00144 0.0025212 0.00288 0.00540

    13 0.00531 0.0107214 0.00911 0.0198315 0.01457 0.0344016 0.02186 0.0562617 0.03086 0.0871318 0.04115 0.1282819 0.05198 0.1802620 0.06238 0.2426421 0.07129 0.3139322 0.07777 0.3917023 0.08115 0.4728524 0.08115 0.5540025 0.07791 0.6319126 0.07191 0.70382

    27 0.06392 0.7677428 0.05479 0.82253

  • 8/10/2019 Manual de Estadstica 2013

    30/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 37 -

    29 0.04534 0.8678830 0.03628 0.90415

    0.90415

    24.000 expected value24.000 variance4.899 standard deviation

    APLICACIN 02Si la secretaria de una Escuela de Postgrado, recibe un promedio de 2 llamadas cada 3 minutos por motivosacadmicos. Calcular lo siguiente:

    a. Cul es la probabilidad de que reciba ms de 3 llamadas en 3 minutos?b. Cul es la probabilidad de que reciba menos de 2 llamadas en tres minutos?c. Cul es la probabilidad de que reciba exactamente 2 llamadas en tres minutos?d. Cul es la probabilidad de reciba 5 llamadas en 6 minutos?e. Cul es la probabilidad de que reciba menos de 2 llamadas en un minuto?

    APLICACIN 03En un estudio por parte del Ministerio de Transporte y Comunicaciones (MTC), se ha determinado que en lacarretera panamericana con destino a Lima, hay en promedio 20 accidentes por semana (7 das), calcular lassiguientes probabilidades:

    a. Cul es la probabilidad de que en una semana no haya ningn accidente?b. Cul es la probabilidad de que en dos semanas haya 10 accidentes?c. Cul es la probabilidad de que en 1semana ocurra menos de 15 accidentes?d. Cul es la probabilidad de que en un da haya tres o menos accidentes?e. Cul es la probabilidad de que en un da haya tres o ms accidentes?

    APLICACIN 04En el Centro de impresiones de la UPN se comete dos fallas en las impresiones debido a causas externas cadavez que se imprimen 2,500 hojas como promedio. Con esta informacin determinar:

    a. La probabilidad de que en una impresin de 500 hojas, ocurra uno ms errores.b. La probabilidad de que no ocurrirn errores en una impresin de 50 hojas.

    APLICACIN 05Los clientes de una empresa llegan a la tienda de venta aleatoriamente, a una tasa de 300 personas por hora.Calcular la probabilidad de que:

    a. Una persona llegue durante un periodo de 1 minuto.b. Por lo menos dos personas lleguen durante un periodo dado de un minuto.c. Ninguna persona llegue durante un periodo de 1 minuto.

    0.000.02

    0.04

    0.06

    0.08

    0.10

    0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30

    P(X)

    X

    Poisson distribution ( = 24)

  • 8/10/2019 Manual de Estadstica 2013

    31/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 38 -

    3. LA DISTRIBUCIN NORMAL

    La distribucin normal, llamada tambin Curva de Gauss (en recuerdo al cientfico que ladescubri), es la distribucin de probabilidad ms importante en la Estadstica y por ende delclculo de Probabilidades.

    Esta distribucin de probabilidad es importante porque las variables aleatorias continuas(peso, edad, talla, produccin, gasto en publicidad, temperatura, ventas, PBI, ganancias, etc.)que son variables que ms se evalan en una investigacin cientfica o investigacin demercados se aproximan a esta distribucin de probabilidad.

    Tambin es importante porque se utiliza como aproximacin de las distribuciones discretastales como: la Binomial, la Poisson, etc.

    CARACTERSTICAS1. Tiene como parmetros a y 2. Su funcin de probabilidad est dada por:

    Xxf

    X

    ,2

    1)(

    2

    2

    1

    Adems: - +- < < + y > 0

    3. El promedio puede tomar valores entre y + mientras que > 0, entonces existeninfinitas curvas normales.

    4. Esta funcin de probabilidad es asinttica con respecto al eje X, (a pesar de tener recorridoinfinito, la curva nunca toca el eje X); adems es unimodal y es simtrica con respecto a lamedia .

    5. El rea bajo esta funcin o curva es 1 100%, de la misma manera se sabe que las reascomprendidas bajo la curva normal son:

    1. = 68.3%

    2. 2 = 95.5%

    3. 3 = 99%

    - 3 2 1 1 2 3 +

    5. Para calcular probabilidades en la distribucin normal se necesitarn infinitas tablas deprobabilidad.

    4. LA DISTRIBUCIN NORMAL ESTNDAR

    1. Es una distribucin a la cual se le ha modificado la escala original; esta modificacin se halogrado restando la media al valor de la variable original y dividiendo este resultado por ,la nueva variable se denota por Z y recibe el nombre de variable estandarizada

  • 8/10/2019 Manual de Estadstica 2013

    32/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 39 -

    Z X

    2. La modificacin de la escala ha permitido elaborar una tabla para el clculo de lasprobabilidades; si esto no hubiera sido posible, sera necesario construir una tabla paracada valor de y .

    3. La funcin de densidad de la variable estandarizada es:

    f z ez

    ( )

    1

    2

    1

    2

    2

    4. El promedio (valor esperado) y la varianza de Z son: E(Z) = 0 , V(Z) = 15. Notacin:

    Si X es v.a. continua distribuida normalmente con media y varianza 2

    , la denotamos por:X N(, 2).Aplicando esta notacin a la variable normal estandarizada Z, escribimos:Z N(0 , 1), esto se interpreta como, Z tiene distribucin normal con media 0 y varianza 1.

    6. La superficie bajo la curva normal Z estandarizada tambin es igual a 1. Por consiguiente,las probabilidades pueden representarse como reas bajo la curva normal estandarizadaentre dos valores.

    7. Debido a que la distribucin normal es simtrica muchas de las tablas disponibles contienenslo probabilidades para valores positivos de Z.

    USO DE TABLASi se conoce el comportamiento de una variable, es decir, se sabe que tienen una distribucinnormal, para calcular las diferentes probabilidades se tiene que estandarizar la variable. Una vez

    estandarizada la variable, recin utilizar la tabla de la distribucin normal estandarizada o tabla Z.

    FRMULAS:

    a. )()()(

    aZP

    axPaxP

    b. )(1)(1)(1)(

    aZP

    axPaxPaxP

    c. )()()()()(

    ax

    Pbx

    PaxPbxPbxaP

    5. APLICACIN CON MEGASTAT

    APLICACIN 01:El rendimiento acadmico de los estudiantes de una Universidad, tiene una distribucin normal con media igual a15 y varianza igual a 4. Si se selecciona un estudiante de esta Universidad, encuentre la probabilidad de que:a. El rendimiento sea menor que 16.b. El rendimiento sea menor que 14.c. El rendimiento este entre 14 y 18.d. El rendimiento sea mayor 15.5.

  • 8/10/2019 Manual de Estadstica 2013

    33/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 40 -

    SOLUCIN

    Reemplazando valores:

    APLICACIN 02:Los salarios mensuales de los trabajadores administrativos tiene un comportamiento normal cuya media es S/.2100 y una desviacin estndar de S/. 50. Cuntos trabajadores tienen salarios:a. Menores de S/. 2150.b. Menores de S/. 2200.c. Mayores a S/. 2180.d. Entre 2080 y 2150 soles.

    APLICACIN 03:

    El tiempo de duracin de los focos elctricos de los caones proyectores tienen una distribucin normal con unamedia de 1000 horas y una desviacin estndar de 250 horas. Determinar la probabilidad de que:a. Un foco tomado al azar se queme antes de las 990 horas de funcionamiento.b. Un foco se queme entre 980 y 1120 horas de funcionamiento.c. Un foco dure ms de 998 horas.

    APLICACIN 04:NEUMA Per, es una empresa que produce llantas para automviles en nuestro pas. La vida til de estas llantasse distribuye aproximadamente como una normal con media y desviacin estndar iguales a 32000 y 1000 millasrespectivamente. Esta empresa quiere exportar estas llantas por lo que empieza a hacer ciertos clculos acercade la calidad de estas llantas, para lo cual se hace las siguientes preguntas:a. Cul es la probabilidad de que una llanta producida por esta empresa tenga una vida til de 31900 millas?b. Cul es la probabilidad de que una llanta producida por esta empresa tenga una vida til desde 31000 y

    33000 millas?c. Si la empresa fija una garanta de 30000 millas. Qu porcentaje de esta produccin necesitar ser

    reemplazada?

  • 8/10/2019 Manual de Estadstica 2013

    34/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 41 -

    PARTE 6: ESTIMACIN ESTADSTICA

    1. ESTIMACION PUNTUALEs aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se debe tenerinformacin muestral. Las frmulas para calcular o realizar estas estimaciones son las siguientes:

    PROMEDIO VARIANZA PROPORCIN

    PARMETRO 2

    P

    ESTIMACINPUNTUAL

    2. ESTIMACIN INTERVLICAAl realizar una estimacin, siempre se va a cometer un error. Entonces, cuando estimamos unparmetro nunca va a ser exacto, ese valor ser mayor o menor al verdadero. Entonces se

    obtendr un intervalo de valores posibles. Ese intervalo se llama estimacin intervlica. A esadiferencia mayor o menor se llama error de estimacin, el cual est en relacin directa con lavariabilidad del estimador y el nivel de confianza determinado por el investigador. La estimacinintervlica para un parmetro en general, est dada por:

    2/2/

    ZZ

    Error de Est imacin Error de est imacin

    Tambin se puede escribir de la siguiente manera:

    2/

    : Z

    Para determinar este intervalo se necesita de:a. La estimacin puntual.b. La desviacin estndar del estimador.c. Nivel de confianza, el cual ser repartido para cada lado del intervalo.

    n

    x

    x

    n

    i

    i

    1

    1

    )(

    1

    2

    22

    n

    xx

    s

    n

    i

    i

    n

    apP

    ESTIMACIN: Es el proceso mediante el cual se intenta determinar el valor del parmetro de lapoblacin a partir de la informacin de una muestra. Al realizar una estimacin siempre se va acometer un error. Existen dos tipos de estimacin:A. ESTIMACIN PUNTUAL B. ESTIMACIN INTERVLICA

  • 8/10/2019 Manual de Estadstica 2013

    35/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 42 -

    FRMULAS DE LOS INTERVALOS DE CONFIANZA

    I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL

    A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:

    nZx

    2/

    :

    B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:

    n

    stx

    n )1,2/(:

    II. INTERVALO DE CONFIANZA PARA LA PROPORCIN POBLACIONAL

    A. Si la proporcin poblacional se conoce:

    n

    PQZpP

    2/:

    B. Si la proporcin poblacional No se conoce: (entonces hay que calcularla en la muestra)

    n

    pqZpP

    2/:

    III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

    A. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas

    poblacionales se CONOCEN:

    2

    2

    2

    1

    2

    1

    2/2121 )(:

    nnZxx

    B. Si las muestras son de tamao n1

  • 8/10/2019 Manual de Estadstica 2013

    36/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 43 -

    3. APLICACIN UTILIZANDO MEGASTAT

    RESPECTO AL PROMEDIO:APLICACIN 01:Los estudiantes de Administracin de una Universidad realizaron un trabajo de aplicacin respecto a los sueldosde los trabajadores de la mina YANACOCHA, para lo cual seleccionaron una muestra aleatoria de 24trabajadores en la cual se determin que el sueldo promedio semanal es de $160 y una varianza de 10 dolares2.

    a. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.

    SOLUCIN:

  • 8/10/2019 Manual de Estadstica 2013

    37/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 44 -

    APLICACIN 02:La Gerencia de la empresa HAMILTON LIGH est interesado en conocer el contenido de nicotina promedio desu marca de cigarrillos. Para lo cual selecciona una muestra de 14 cigarros obteniendo un promedio de 25

    miligramos y una varianza de 16 miligramos2.a. Calcular un intervalo de confianza para el sueldo promedio con el 99% de confianza.b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.c. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.

    APLICACIN 03:Nuestro amigo BRUNO se dedica al negocio de los AUTOS, el sospecha que su margen de beneficios mensualpromedio por auto vendido est por debajo del promedio nacional de S/. 700. Para evaluar su margen debeneficio toma informacin (muestra) respecto a 8 meses cuya informacin es la siguiente:

    MES 1 2 3 4 5 6 7 8 Promedio Varianza

    BENEFICIO 800 840 780 850 810 790 805 800

    a. Calcular un intervalo de confianza para el margen de beneficio promedio con el 99% de confianza.

    b. Calcular un intervalo de confianza para el margen de beneficio promedio con el 95% de confianza.c. Calcular un intervalo de confianza para el margen de beneficio promedio con el 90% de confianza.

    RESPECTO A LA PROPORCIN:

    APLICACION 04:Segn un vendedor de automviles, de todos los vehculos adquiridos por los docentes universitarios, en ms del80% de los casos el color es elegido por la mujer. Para verificar esta hiptesis se toma una muestra de 400parejas que han comprado autos nuevos durante el ltimo ao, hallndose que en 310 casos el color fue enefecto elegido por la dama. Calcular:

    a. El intervalo confidencial para la proporcin considerando el 99 % de confianza.b. El intervalo confidencial para la proporcin considerando el 90% de confianza.

    SOLUCIN

  • 8/10/2019 Manual de Estadstica 2013

    38/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 45 -

    RESPECTO A LA DIFERENCIA DE PROMEDIOS:1. La SUNAT est haciendo auditora en ciertos grifos gasolineros. Selecciona en forma aleatoria 05 grifos de 2

    empresas diferentes (Texaco y Repsol). Los ingresos en miles de soles semanales se presentan acontinuacin:TEXACO : 90 85 95 76 80REPSOL : 84 87 90 92 90

    a. Estimar un intervalo de confianza para la diferencia de medias (DIFERENCIA DE LOS INGRESOSPROMEDIOS) con el 90% de confianza.

    b. Estimar un intervalo confidencial para la diferencia de medias (DIFERENCIA DE LOS INGRESOSPROMEDIO) con el 99% de confianza.

    RESPECTO A LA DIFRENCIA DE PROPORCIONES:1. Se toman muestras independientes para determinar el la proporcin de personas que esta a favor de un

    impuesto al combustible. La primera muestra consiste en 100 personas que solamente trabajan en Trujillo yla segunda muestra es de 100 personas del cercado de Trujillo. Se determina que 50 y 60 personas de lasrespectivas muestras estn de acuerdo con el aumento.

    a. Calcular un intervalo de confianza para la diferencia de proporciones considerando el 99% deconfianza.

    b. Calcular un intervalo de confianza para la diferencia de proporciones considerando el 90% deconfianza.

  • 8/10/2019 Manual de Estadstica 2013

    39/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 46 -

    PARTE 7: DETERMINACIN DEL TAMAO DE MUESTRA

    1. MUESTREO

    2. TCNICAS DE MUESTREO

    3. DETERMINACIN DEL TAMAO DE MUESTRA

    Para determinar el tamao, primero hay que identificar la variable a estudiar (cuantitativa ocualitativa). Luego depende de cuatro factores o elementos que son los siguientes:

    PARA UNA VARIABLE CUANTITATIVAa. Un nivel de confianza: es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que

    origina el valor de Z.b. El error de estimacin (E): es fijado por el investigadorc. La desviacin estndar o varianza: son valores que se obtienen por estudios anteriores, por la

    muestra piloto o por la distribucin de la poblacin.d. El Tamao de la poblacin (N): generalmente no se conoce.

    PARA UNA VARIABLE CUALITATIVAa. Un nivel de confianza: es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que

    origina el valor de Z.b. El error de estimacin (E): tambin es fijado por el investigadorc. La proporcin poblacional (P): son valores que se obtienen por estudios anteriores, por la muestra

    piloto y si no se conoce asumir p=0.5.d. El Tamao de la poblacin (N): generalmente no se conoce.

    Es una TCNICA ESTADSTICA por la cual se realizan inferencias a la poblacin examinando solouna parte de ella, sta parte recibe el nombre de MUESTRA, la cual debe ser estadsticamenterepresentativay adecuada.Ventajas: Desventajas:

    Costo reducido Presencia del error de muestreo

    Mayor rapidez y exactitud Presencia de gran variabilidad de las observaciones. Minimiza los costos.

    Existen 2 tipos de tcnicas de muestreo:A. TECNICAS PROBABILSTICAS: B. TECNICAS NO PROBABILSTICAS

    Muestreo aleatorio simple El muestreo a criterio o juicio.

    Muestreo aleatorio estratificado El muestreo por cuotas.

    Muestreo sistemtico El muestreo por conveniencia.

    Muestreo por conglomerados etc.

    Etc.

  • 8/10/2019 Manual de Estadstica 2013

    40/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 47 -

    5. FRMULAS PARA DETERMINAR EL TAMAO DE MUESTRA

    VARIABLE Cualitativa(Proporcin Poblacional)

    Cuantitativa(Promedio Poblacional)

    POBLACININFINITA

    (Cuando no seconoce N)

    2

    2

    0

    )1(

    E

    PPZn

    2

    22

    0E

    SZn

    POBLACINFINITA

    (Cuando seconoce N)

    )1()1(

    )1(22

    2

    PPZNE

    NPPZn

    222

    22

    )1( SZNE

    NSZn

    Z= es el valor de la distribucin normal estandarizada para un nivel de confianza fijado por el investigador. S= Desviacin estndar de la variable fundamental del estudio o de inters para el investigador. Obtenida por estudios

    anteriores, muestra piloto, criterio de experto o distribucin de la variable de inters.

    P= es la proporcin de la poblacin que cumple con la caracterstica de inters. E= % del estimador o en valor absoluto (unidades). Fijada por el investigador. N= Tamao de la poblacin.

    6. PASOS A SEGUIR PARA DETERMINAR LA MUESTRA PTIMA

    A. Identificar el tipo de variable a analizar.

    B. Asumir que la poblacin es infinita y aplicar la frmula respectiva sealada anteriormente.Esta muestra se denomina muestra previa.

    C. Luego si se conoce el tamao de la poblacin N, obtener la fraccin de muestreoN

    n0

    Si %50 N

    n, entonces la muestra definitiva es n0 (muestra previa)

    Si %50 N

    n, entonces se ajusta la muestra.

    D. Para ajustar la muestra se tiene que aplicar la siguiente frmula:

    N

    n

    n

    n 0

    0

    1

    , n es la muestra final.

    ESTIMACIN DE LOS VALORES A APLICAR EN LAS FRMULAS

    A. Valor de Z: es el valor de la abscisa de la distribucin normal estandarizada teniendo encuenta el nivel de confianza fijado por el investigador, por lo tanto este valor se encuentra enlas tablas estadsticas respectivas. Para hacer el trabajo menos tedioso, presentamos acontinuacin los diferentes valores de Z

  • 8/10/2019 Manual de Estadstica 2013

    41/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 48 -

    TABLA N 01

    VALORES DE LA DISTRIBUCIN NORMAL

    ESTANDARIZADA(Z)

    Nivel de confianza(1-)

    Nivel de significancia()

    Valor ZBilateral Unilateral

    90% = 0.9095% = 0.9598% = 0.9899% = 0.99

    10% = 0.105% = 0.052% = 0.021% = 0.01

    1.641.962.322.57

    1.281.642.052.32

    B. Clculo del Valor de P: Se calcula este valor cuando la variable de estudio es cualitativa.

    TABLA N 02

    COMPORTAMIENTO DE P y QP Q=1-P PQ

    0.050.100.200.300.400.500.600.700.800.900.95

    0.950.900.800.700.600.500.400.300.200.100.05

    0.04750.0900.1600.2100.2400.2500.2400.2100.1600.0900.0475

    C. Clculo del valor de la varianza (Si la variable es CUANTITATIVA): este valor es obtenidapor estudios anteriores, muestra piloto, criterio de experto o distribucin de la variable de

    inters.

    D. Clculo del error de estimacin:generalmente se asume 2%, 5%, y 8% de error. Este valores fijado por el investigador. Es la diferencia entre el parmetro (poblacin) y el estimador

    (muestra). Es decir: ooE .Este error puede ser absoluto o relativo. Si E=0.35 sedenomina error absoluto. Si consideramos un error del 10% de la media, es decir, E=10%(x )= 0.10 (3.5)=0.35 se denomina error relativo.

    7. APLICACIN UTILIZANDO MEGASTAT

    APLICACIN 01

    Cul ser el tamao de corridas de produccin adecuado si se requiere estimar el tiempo promedio paraefectuar la produccin de un producto qumico con una confianza del 95%? Adems en un estudio piloto seencontr 5.3x horas y s = 2.2 horas y adems el investigador asume E = 0.35 horas.

    APLICANDO MEGASTAT

  • 8/10/2019 Manual de Estadstica 2013

    42/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 49 -

    APLICACIN 02El Director de la seccin de control de la rabia del Dpto. de salud pblica de la ciudad de Chiclayo desea obtener

    una muestra de los registros de dicho Dpto. acerca de las mordidas de perro reportadas durante el ao anterior,para estimar la edad media de las personas mordidas. El director desea una seguridad del 95%, con un E=2.5 yen base a estudios anteriores conoce que la desviacin estndar es de 15 aos. De qu tamao debe ser lamuestra?

    APLICACIN 03Se desea estimar el tiempo medio de duracin de artefactos elctricos (focos) producidos por la empresaPHILIPS. Se sabe por un estudio piloto de 10 focos que la desviacin estndar del tiempo de duracin es de 20meses. De qu tamao debe ser la muestra para estimar el tiempo medio de duracin con un error mximo de4 meses y con una confianza del 95%?

    APLICACIN 04Por estudios cientficos se sabe que el Coeficiente de Inteligencia promedio para jvenes segn la escala deWeshler es de 100 puntos con una desviacin estndar de 15 puntos. Determinar el tamao de muestra para

    realizar una investigacin sobre niveles de inteligencia en la UPN, si se admite un error del 2% del promedio yuna seguridad del 95%.

    APLICACIN 05Se desea estimar la proporcin de jvenes de la ciudad de CHICLAYO que hacen uso de Internet como mnimouna hora diaria con un 95% de confianza. De estudios anteriores se conoce que P=0.70 y se desea un E = 5%.Cul debe ser el tamao de muestra?

  • 8/10/2019 Manual de Estadstica 2013

    43/51

  • 8/10/2019 Manual de Estadstica 2013

    44/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 51 -

    5. TIPOS DE PRUEBAS DE HIPTESIS:

    A. PRUEBA BILATERAL O PRUEBA DE DOS COLAS

    B. PRUEBA UNILATERAL O PRUEBA DE UNA SOLA COLA:

    6. ETAPAS DE UNA PRUEBA DE HIPTESIS:

    Ho: = 0H1: 0

    Prueba de cola inferior o izquierdaHo: = 0

    H1: 0

    /2 /2

    MTODO TRADICIONAL

    1. Plantear la hiptesis nula y alternativa. (Ho y H1)2. Especificar el nivel de significancia (generalmente la plantea el

    investigador). (=0.05, 0.01)3. Calcular un valor experimental: Estadstico de prueba que debeser especificado en trminos de un estimador del parmetro aprobar.

    4. Calcular el valor crtico: valor que se encuentra en la tabla deprobabilidades, que representa el valor que determinar laregin de aceptacin y rechazo.

    5. Tomar la decisin de aceptar o rechazar Ho.6. Dar conclusin respectiva.

    MTODO MODERNO

    1. Plantear la hiptesis nula y alternativa. (Ho y H1)2. Observar el valor p (significancia)

    Si p< 0.05 RECHAZAR HoSi p 0.05 ACEPTAR Ho

    http://g/ESTADISTICA_INVESTIGACION_EDUCACION_UNS_2008/ESTADISTICA_II/PRUEBA%20DE%20HIPOTESIS_Estad%C3%ADsticos%20de%20Prueba.dochttp://g/ESTADISTICA_INVESTIGACION_EDUCACION_UNS_2008/ESTADISTICA_II/PRUEBA%20DE%20HIPOTESIS_Estad%C3%ADsticos%20de%20Prueba.doc
  • 8/10/2019 Manual de Estadstica 2013

    45/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 52 -

    8. FRMULAS DE ALGUNOS ESTADSTICOS DE PRUEBA

    FRMULAS DE LOS ESTADSTICOS DE PRUEBAI. PRUEBA DE HIP TESIS PARA EL PROMEDIO POBLACIONAL:

    A. Si n es mayor de 30 y la varianza poblacional es conocida:Estadstico de prueba:

    n

    xZ

    2/ZZt (distribucin normal)

    B. Si n es menor o igual a 30 y la varianza poblacional es desconocida:Estadstico de prueba:

    n

    s

    xt

    )1,2/(

    nt tt

    (distribucin t de student)

    II. PRUEBA DE HIPTESS PARA LA PROPORCIN POBLACIONALEstadstico de prueba:

    n

    PQ

    PpZ

    Esta frmula es tanto para muestras grandes como para muestras pequeas.

    III. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE MEDIASC. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas poblacionales se

    CONOCEN:Estadstico de prueba:

    2

    2

    1

    1

    21 )(

    nn

    DxxZ

    D. Si las muestras son de tamao n1

  • 8/10/2019 Manual de Estadstica 2013

    46/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 53 -

    9. PRUEBA DE HIPTESIS CON MEGASTAT

    PRUEBA DE HIPTESIS PARA LA MEDIA

    PRUEBA DE HIPTESIS PARA LA PROPORCIN

  • 8/10/2019 Manual de Estadstica 2013

    47/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 54 -

    PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES

    PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES

    PRUEBA Z PARA COMPARAR PROPORCIONES

    10. APLICACIN UTILIZANDO MEGASTAT

    APLICACIN 01:Las ganancias en miles de dlares de 10 centros educativos de nuestro medio han producido la siguienteinformacin:15.8, 12.7, 13.2 16.9, 10.6, 18.8, 11.1, 14.3, 17.0 y 12.5.Otro conjunto de centros educativos fueron evaluados tambin respecto a sus ganancias en miles dlares,

    obteniendo los siguientes resultados:24.9, 23.6, 19.8, 22.1, 20.4, 21.6, 21.8 y 22.5

  • 8/10/2019 Manual de Estadstica 2013

    48/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 55 -

    Realizar una prueba de hiptesis para verificar si las ganancias de este ltimo grupo son superiores alas ganancias de las empresas de nuestro medio. Para probar esta hiptesis utilice un = 0.05.

    SOLUCIN: (Aqu se utiliza la prueba T para muestras independientes)

    Hypothesis Test: Independent Groups (t-test, pooled variance)

    T1 T2

    14.290 22.088 mean2.738 1.637 std. dev.

    10 8 n

    16 df

    -7.7975 difference (T1 - T2)

    5.3911 pooled variance

    2.3219 pooled std. dev.

    1.1014 standard error of difference

    0 hypothesized difference

    -7.08 t

    2.61E-06 p-value (two-tailed)

    APLICACIN 02Jorge Melndez, Administrador del BCP, est interesado en saber si existe diferencia significativa entre lostiempos de atencin al cliente de los mismos empleados que trabajan en los dos turnos: maana y tarde. Alrespecto, ayer personalmente registr los tiempos que utilizaron los empleados para atender a sus clientes enambos turnos. Los tiempos en minutos que registr fueron los siguientes:

    Maana 2.10 4.10 4.70 3.70 6.00 3.90

    Tarde 4.00 4.50 3.70 4.00 4.10 3.45A la luz de estos resultados, a qu conclusin lleg Jorge Melndez? Utilice un nivel de confianza del 95%.

  • 8/10/2019 Manual de Estadstica 2013

    49/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 56 -

    SOLUCIN: (Aqu se utiliza la prueba T para muestras pareadas)

    Hypothesis Test: Paired Observations

    0.00000 hypothesized value

    4.08333 mean Maana

    3.95833 mean Tarde

    0.12500 mean difference (Maana - Tarde)1.30987 std. dev.0.53475 std. error

    6 n5 df

    0.23 t.8244 p-value (two-tailed)

    APLICACIN 03Un fabricante de microcircuitos est interesado en determinar si dos diseos diferentes producen un flujo deelectricidad equivalente. El ingeniero responsable ha obtenido la siguiente informacin:

    Diseo 1 20.3 22.5 23.3 29.1 26.5 22.1 20.8 28.6 23.3 21.5

    Diseo 2 23.5 26.5 23.6 21.5 26.4 27.9 22.5 25.5 26.7 23.9

    Diseo 3 29.1 26.5 22.1 25.6 23.5 26.5 25.5 26.7 20.3 22.5

    Diseo 4 20.3 22.5 25.5 26.7 28.9 17.3 21.5 20.4 27.9 26.5Con =0.01, se desea determinar si existe alguna diferencia significativa en el flujo de electricidad entre los dosdiseos.

    SOLUCIN: (Aqu se utiliza anlisis de varianza)

  • 8/10/2019 Manual de Estadstica 2013

    50/51

    SISTEMA DE GESTIN DE LA INVESTIGACIN UPN pg. - 57 -

    One factor ANOVA

    Mean n Std. Dev

    23.80 10 3.163 Diseo 1

    24.80 10 2.089 Diseo 2

    24.83 10 2.657 Diseo 323.75 10 3.865 Diseo 4

    24.30 40 2.944 Total

    ANOVA table

    Source SS df MS F p-value

    Treatment 10.833 3 3.6110 0.40 0.7558

    Error 327.266 36 9.0907

    Total 338.099 39

    APLICACIN 04Una compaa desea estudiar el efecto que tiene la pausa para el caf, sobre la productividad de sus obreros.Selecciona 6 obreros y mide su productividad en un da cualquiera (sin pausa para el caf), y luego mide laproductividad de los mismos 6 obreros en un da que se concede la pausa para el caf. Las cifras que miden laproductividad son las que siguen: Con = 0,05. A qu conclusin llegar la compaa?.

    TRABAJADOR 1 2 3 4 5 6Sin pausa 23 35 29 33 43 32

    Con pausa 28 38 29 37 42 30

    APLICACIN 05En fecha reciente fue descubierto un neurotransmisor cerebral endgeno llamado galanina. Segn parece, steafecta de manera directa el deseo de ingerir alimentos con un alto contenido de grasa. Mientras ms alta sea lacantidad de este neurotransmisor de origen natural en un individuo, mayor ser el apetito que este sienta por lacomida con alto contenido de grasa. Recientemente una compaa farmacutica desarroll una sustanciaexperimental que bloquea la galanina sin alterar el apetito por otros alimentos ms saludables (es decir conmenos grasas). Un neurocientfico piensa que esa sustancia experimental ser muy til para controlar laobesidad. Se realiza un experimento para lo cual se elige 10 mujeres obesas todas ellas voluntarias y se lesadministra el medicamento experimental durante 06 meses. Se registra el peso inicial y el peso final (despus de

    6 meses) de cada persona. Los pesos se presentan en la siguiente tabla. Probar si el uso del medicamentoexperimental produce prdida de peso en las personas. Utilice un nivel de significancia de 0.05.

    15.00

    20.00

    25.00

    30.00

    Diseo 1 Diseo 2 Diseo 3 Diseo 4

    Comparison of Groups

  • 8/10/2019 Manual de Estadstica 2013

    51/51

    Persona PESO INCIAL (libras) PESO FINAL (libras)12