ESTADÍSTICA EXPERIMENTAL

download ESTADÍSTICA EXPERIMENTAL

If you can't read please download the document

Transcript of ESTADÍSTICA EXPERIMENTAL

ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera1ESTADST ESTADSTICA CAEXPERIMEN EXPERIMENTALAplicada a ciencia e Aplicada a ciencia e ing ingeniera niera2468 1031579 Edicin Edicin CONC CONCYTEC TEC PALACIOS C. PALACIOS C. SSEVERO VEROPalacios C. SeveroESTADSTICAEXPERIMENTALAplicada a ciencia e ingeniera PALACIOS C. SeveroCEO Proceso [email protected]@hotmail.com(+511) 996696214, Lima Per(+5152) 952672846, Tacna Per(+505) 84566216 Centro AmricaPrimera edicin: ISBN: Hecho el Depsito Legal en la Biblioteca Nacional del Per N PALACIOS C. Severo CONCYTEC en la presente edicinTiraje: 1000 ejemplaresSubvencin CONCYTEC N ConsejoNacional deCiencia, TecnologaeInnovacinTecnolgica-CONCYTECPresidente: Dr. Augusto Mellano MndezAv. Del Aire 485, San Borja, Lima PerTelefax: (51) 01-2251150www.concytec.gob.pe Impreso por: Derechos Reservados. Prohibida lareproduccin de esta publicacin por cualquier sistema conocido sin la autorizacin escrita del autor; y del editor en la presente edicin.2EIRLESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraLa presente obra esta dedicada a la Memoria de:Juan de la Cruz Palacios AvendaoAdelaida Calisaya FloresLuz Lucila Zeballos ArgandoaCamila Palacios ZeballosCeferina Chambilla ChambillaGustavo Vallenas CasaverdeCon mucho amor a quienes amor nos dio, que Dios lo tenga en su gloria y nosotros en nuestro corazn3Palacios C. SeveroUn reconocimiento muy especial al Rector de la Universidad Nacional Micaela Bastidas de AbancayDr. Leoncio Carnero Carnero4ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraCONTENIDOCONTENIDOPgina1I.II.III.IV.V.VI.VII.VIII.IX.X.XI.XII.XIII.XIV.XV.XVI.XVII.XVIII.XIX.2I.II.III.IV.V.VI.VII.VIII.IX.PrlogoIntroduccinEstadstica bsicaIntroduccinRecopilacin de datosCuestionario como fuente de datosPresentacin de datosAnlisis de datosDistribucin de frecuenciaCriterios de distribucin de frecuenciaMedias de tendencia centralMedidas de disepersinProblemasEstimacin de parmetrosDiferencias significativasDispersin de los datos problemasProblemasDistribucionesIntervalos de confianzaMuestreoMtodos de muestreoToma de decisionesPrincipios para la toma de decisinPlanificacinProblemasAnlisis de regresinIntroduccinMtodos de mnimos cuadradosModelos de regresinModelo de regresin lineal con k variablesRegresin lineal simpleRegresin lineal mltipleRegresin polinomialRegresin polinomial cuadrticaRegresin no linealCoeficiente de correlacin mltiple R911131314151516171919262939394043505455555962626467676770707173747576775Palacios C. SeveroX.XI.3I.II.III.IV.V.VI.VII.VIII.IX.X.XI.XII.XIII.XIV.4I.II.III.IV.a)b)c)V.VI.VII.VIII.IX.X.XI.XII.5Prueba de significancaProblemasPrincipios de diseo experimentalIntroduccinTipo de experimentosUnidades experimentales y mustralesFuente de variacinControl de la variacin del no tratamientoPropiedades del diseo estadsticoReplicacinAleatorizacinControl localClasificacin de los diseosEstrategia del diseoDiseo de tratamientosDiseo de muestreoEstudio experimentalProblemasDiseo experimental aplicado a cienciasIntroduccinLimitacionesPrediccinDiseo experimentalDiseo aleatorizadoDiseo unifactorial con n nivelesDiseo de parcelas divididasProblemasDiseo totalmente aleatorizadoProblemasDiseo de bloques aleatorizadosProblemasDiseo cuadrado latinoProblemasDiseo cuadrado greco latinoProblemasPrueba de intervalos mltiples de DuncanDiseo doble reversoProblemasEstimacin de parmetros del modeloPolinomio ortogonalMtodos de anlisisIntroduccin7781838384868790929697991011031041051061101111111111121131131141181211291311341411431471511531541541571581591611616ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraI.II.III.IV.V.VI.6I.II.III.IV.V.VI.VIIVIII.IX.X.XI.XII.XIII.XIV.XV.XVI.XVII.XVIII.XIX.XX.XXI.XXII.A.B.Mtodos no paramtricosPrueba U de Mann WhitneyPrueba H de Kruskal WallisMtodos multivariablesCorrelacin de SpearmanProblemasDiseos experimentales aplicado a ingenieraIntroduccinProblemasDiseos bifactorialesComparacin mltipleDiseo anidadoProblemasDiseos factorialesDiseo factorial 2nDiseo factorial 2ProblemasDiseo factorial 2ProblemasDiseo factorial 2k replicadoProblemasDiseo 2k con pruebas centralesDiseo confundidoDiseo factorial 2k con dos bloquesDiseo factorial 2k con cuatro bloquesDiseo factorial 2k con bloques replicadosAlgoritmo de YatesProblemasDiseo factorial fraccionadoMedio fraccionado del diseo 2kCuarto fraccionado del diseo 2kProblemasDiseo Plackett BurmanProblemasDiseos factoriales 3nProblemasDiseos rotablesDiseos rotables con dos factoresDiseo trigonalDiseo pentagonalDiseo hexagonalProblemas1621621651661681711731731761771801821841861881891952052212252282312332332352362372392442452472502582632662702752752752762762807Palacios C. SeveroC.D.E.F.G.7I.II.III.IV.V.VI:VII:VIII:IX.X.XI.XII.XIII.Diseo octogonalDiseo compuesto centradoProblemasDiseo experimental comercial EXCODiseo SeveroDiseo factorial centrado de dos factoresDiseo Factorial centrado de tres factoresDiseo rotable centrado de n factoresProblemasSuperficie respuestaIntroduccinSuperficie respuestaPolinomio de primer ordenPrueba de significanciaPrueba de falta de ajusteMxima pendiente ascendentePolinomio de segundo ordenCaracterizacin de la superficie respuestaDiseo de superficie respuesta cuadrticoSuperficie de respuesta cuadrticaExploracin de superficie respuestaPunto estacionarioCriterio de formas cuadrticasAnexoReferencias2812822912952983003053083113233233233243253263283313333403503543673683873938ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraPRLOGOEl objetivo primordial del presente libro es presentar los conceptos paradiferentessituacionesrealesquesevenadiarioenel campo social, industrial yexperimental. Sehaconcebidoprimordialmente como un texto introductorio en planificacin y control de operaciones a nivel laboratorio, bach e industrial. Tambin se ha proyectado como unlibrodereferenciaparaagronomomos, alimentarios, pesqueros,biologos, medicos, civiles, gegrafos, ambientalistas, mecnicos,mineros, metalurgistas yqumicos de Pre, Postgrado yMaestra,practicantes y cientficos encargados de la planificacin y operacin de sistemas productivos tanto en la ciencia como en la ingeniera.El libro es el resultado de conferencias ofrecidas en diferentes centros acadmicos latinoamericanos. Se ha intentado resaltar los conceptos tcnicosyafirmandosindudaysinexcusasquelapresentacines exactamente fidedigna. Se presentan los conceptos que considero pueden contribuir ms a la comprensin de los principios, con referencia a los que pueden realizarse con los conocimientos bsicos y las posibilidades e instrumentos de la tecnologa actual.Se ha intentado presentar un marco conceptual que estimule la habilidad del lector de las diversas ramas del saber (Biologa,Medicina, Ciencias Sociales, Economa, Administracin, Ingenieras y reas Tcnicas) para entender la manera en que los factores (variables) interactan en un sistema real de trabajo.Laorientacindel libro, noestamatemticamentesofisticado. Los conocimientospreviosnecesarioscomoel clculo, probabilidadesy estadsticadescriptiva. Enalgunas secciones se realiza el uso de operaciones elementales de matrices.El libro est diseado como un manual dividido en partes con captulos para su mejor comprensin. Se propone servir como fuente de referencia para tratar casos especfic0s de los lectores.Los ejemplos resueltos (fueron desarrollados aplicando los programas estadsticos Statgraphics Centurion y ESPC elaborado para el9Palacios C. Severopresente libro), sirven para ilustrar y ampliar las teoras, sin lo cual ellector sentira un vaci. Las demostraciones de procesos industriales se incluyen en ello. Los problemas suplementarios completan la revisin del material tratado en cada tema.El material cubre un curso habitual con el fin de flexibilizar, ampliar y mejorarlossistemascurriculares, siendoesteunlibrodeconsulta para inters de otros temas.No deseo finalizar sin agradecer a mi amigo Luis Solrzano Espinola por larevisinminuciosay detallada de lapresente edicindelpresente libro, su tiempo yesfuerzo es unaporte alacienciay tecnolgacomol siemprevienedesarrollandoenlasaulasconlos estudiantes de pre grado.Finalmente deseo agradecer a CONCYTEC por tan importante aporte a la educacin a nivel de nuestro pas, as mismo estoy en deuda con muchasuniversidades latinoamericanas gubernamentales como privadas por la cooperacin para la elaboracin del presente, de igualmanera con prestigiosos colegas por su colaboracin para la culminacin de tan importante tema.Palacios C. SeveroCEO Proceso SEVEROMvil: (+511) [email protected] EXPERIMENTALAplicada a ciencia e ingenieraINTRODUCCINSi su trabajo tiene que ver con la investigacin cientfica tecnolgica (ciencias e ingeniera). Probablemente se ha dado cuenta quelamayoradeloslibrosdeestadstica(bsicayavanzada)son abstractos y no ayudan mucho en el tratamiento de la base de datos,peroustedsabequeelprocesoalcualestudiafunciona(demanera eficienteysinproblemas), es por elloquesetuvoquerealizar elesfuerzo a fin de brindar al amable lector un texto con caractersticas nuevas a fin de poder llenar muchos vacos, los cuales son parte de la experiencia.Lo que desea saber el investigador es como analizar e interpretar los datos de un proceso para tomar una decisin sobre los rangos ptimos, pero necesita saber cmo llevar a cabo una prueba experimental (laboratorio, bach e industrial); sabe que la estadstica experimental le ayudara a seleccionar los rangos (niveles) y variables (factores)significativasdelprocesos innovativo,perorequiereideas sobrecomoseleccionarestos.Enlapresenteobraleexplicaremosy despejaremos sus dudas.Lapalabra estadstica se origina, enlas tcnicas de recoleccin,organizacin, conservacin, ytratamientodelasdiversasbasesde datos propios, conque los antiguos gobernantes controlaban sus sbditos y dominios econmicos. Estas tcnicas evolucionaron a la par con el desarrollo de las matemticas utilizando sus herramientas en elproceso del anlisis e interpretacin de la informacin.Estadstica Experimental aplicada a ciencia e Ingeniera, el libro que en esta ocasin presento a los lectores de habla hispana, es un importanteaporte.Porlotilyporlanovedaddesuenfoque,ala faltade bibliografa. Para comprender los beneficios que pueden derivarse de la utilizacin de los conceptos (fundamentos) presentados, conviene tener presente la complejidad creciente de nuestras industrias (automatizacin), impuesta por los diferentes factores que estn incidiendo en el cambio vertiginoso que caracteriza a nuestra poca (competitividad) y que, en mayor o menor grado, con mayoromenorvelocidad, llegaatodas lasregionesypasesdelmundo. Veamos algunos de los factores de complejidad en operaciones 11Palacios C. Severoindustriales. Laplantareciberdenesdeproduccinquedebanser procesados y cumplidos en un lapso determinado, utilizando recursos internos y externos casi siempre escasos.La importancia de los resultados, anticipado en la toma de decisiones,empiezaabuscar respuestas aotrotipodepreguntas Ques lo mejor? Cmo optimizar un determinado conjunto de variables para alcanzar un fin especfico? Que significan nuestros datos y que grado de confianza podemos tener en ello visto una prediccin.El mundo actual requiere otras herramientas analticas, aquellas que nos permitancrear modelos (lenguaje de comunicacin) ydefinir relaciones entre diversos factores (interacciones). Esto requiere entre otras cosasquepodamosguardarconjuntosparticulares dedatos aparte de las rutinas de anlisis (numrico y sostenible) que se realicen en base a ella.El presente texto no pretende teorizar el saber estadstico, desde luego,noesunlibroparaestadsticos, yaque, adredeseobviael rigorcientfico de lo expuesto en beneficio de la sencillez necesaria para elnefito;conunlenguajecoloquial seconduceal lectoratravsdelcontenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados.El avance tecnolgico en la informtica ha contribuido enormemente al desarrollodelaestadstica, sobretodoenlamanipulacindela informacin, pues enel mercado existenpaquetes estadsticos de excelentecalidad, comoel SAS, SPSS, SCA, Statgraphics, amnde otros, quecorrenenunordenadorsinmayoresexigenciastcnicas,permitiendoel manejodegrandesvolmenesdeinformacinyde variables.12ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera1ESTADSTICA BSICA(...) Conseguimos obtener as la frmula estadstica para conocer aproximadamentelaposicindeunelectrnenuninstantedeterminado.Pero, personalmente, no creo que Dios juegue a los dados.Albert EinsteinI. INTRODUCCINEn las ltimas dcadas la estadstica ha alcanzado un alto grado de desarrollo, hasta el punto de incursionar en la totalidad de las cienciaseingeniera;inclusive, enlalingsticaseaplicantcnicas estadsticas para esclarecer la paternidad de un escrito o los caracteres ms relevantes de un idioma.La estadstica es una ciencia auxiliar para todas las ramas del saber humano; suutilidadseentiendemejor sitenemos encuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre y la estadstica ayuda en la incertidumbre, trabaja con ellaynos orientaparatomar las decisiones conundeterminado grado de confianza.Loscrticosde laestadsticaafirmanque a travsde ella es posibleprobar cualquier cosaquesucedeenlanaturaleza, locual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifactico de los mtodos estadsticos. Sin embargo muchos investigadorestendenciososhancometidoabusosconlaestadstica,elaborandoinvestigaciones de intencin, teniendopreviamente los resultados que les interesan mostrar a personas ingenuas y desconocedorasdeloshechos. Otros, porignoranciaonegligencia,abusan de la estadstica utilizando modelos inapropiados o razonamientos ilgicos y errneos que conducen al rotundo fracaso de sus investigaciones.13Palacios C. SeveroA veces nuestras vidas parecen estar controladas por estadsticas. De informessobre el tiempo,lectura delaspresionessanguneas, todos tenemos que ver rutinariamente con una amplia variedad de medidas estadsticas.El anlisis estadsticoes til paralainvestigacin(tecnolgicay cientfica), puesayudaaresumireinterpretarel granvolumende cifrasqueresultananenlaencuestamspequea.Losprincipios estadsticos que se usan en la investigacin provienen en gran escala de las ciencias sociales, economa e ingeniera. Como resultado hay gran cantidad de libros enteros sobre estadstica,probablemente ms que sobre cualquier otro aspecto de la investigacin.El propsito de la presenteobra es darle a usted una visin panormica de los tipos de medidas estadsticas ms importantes que se usan. Si usted requiere informacin ms detallada, consulte algunos de los muchos libros buenos en estadstica que estn disponibles1.Aunque existencentenares de medidas ypruebas estadsticas que pueden utilizar los investigadores, nosotros estudiaremos los de amplia aplicacin para desarrollar los trabajos prcticos.II. RECOPILACIN DE DATOSEl primer paso para describir un fenmeno natural es reunir los datos estadsticos necesarios. La fuente de los datos puede clasificarse como internas o externas.Losdatosinternosincluyenestadsticassobrelasoperacionesdela empresa, tales como estadsticas de produccin, comercializacin,transformacin, etc.Los datos estadsticos no vinculados conel funcionamiento de la empresa propiamente dicha se llaman datos externos.La gerencia de produccin de unafbrica de fundicin puede necesitar informacin sobre la cantidad de cierto metal en el mercado nacional, con el propsito de estimar las ventas a 10 aos plazo.1 Ver referencias bibliogrficas14ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraHay enormes cantidades de datos comerciales, empresariales,farmacuticos, que pueden consultarse en las bibliotecas pblicas y en las universidades.El gobiernoesel mayoreditordeestadsticasanuales, mensuales,semanales,diarias.UnapublicacinanualdelInstitutoNacionalde Estadstica contiene ms de mil pginas de datos sobre precios,educacin, produccin y otros puntos, que son de utilidad para los que procesan datos: economistas, analistas y dems profesionales.III. CUESTIONARIO COMO FUENTE DE DATOSLos datos estadsticos relativos a la opinin corriente de los consumidoressobredeterminadosprogramas detelevisin, nuevos productos, candidatos polticos y otros, no pueden hallarse en publicaciones. Por ello, este tipo de informacin debe reunirse a travs delaentrevistapersonal, porcuestionariosoalgnotromedio. La ventaja de ello es el alto porcentaje de respuestas posibles. Sin embargo, es por regla general ms costosa que enviar cuestionarios por correo.Lasfirmasdeanalistasyconsultoressabenqueesinconvenienteelformulariopostal comoinstrumentopararecopilar datos por ser relativamente bajo el porcentaje de respuestas a ciertos cuestionarios.La conveniencia principaldel cuestionario como tcnica de recopilacin de datos es sus costos relativamente bajo.IV. PRESENTACIN DE DATOSGrfica de lneas simples y de barras simples.Cualquiera de estos dos tipos de grfico puede utilizarse ventajosamente para representar la tendencia general de la produccin.El cmulodedatosestadsticosdentrodeunaempresa, defuentes publicadas, o recopilados por entrevistas personales, no est usualmenteaptaparaunanlisis. Losdatos debenorganizarsey presentarse en una tabla o grfico, antes de efectuar ningn anlisis ni interpretacin. Si se necesitan cifras exactas de un informe convendrapresentarlosdatosenunatabla. Encasocontrario, es preferible un grfico para atraer la atencin del lector.15Palacios C. SeveroGrfico de lneas mltiples y de barras mltiples.La tendencia o movimiento de las exportaciones de dos comercializadoras se pueden representar grficamente.Grfico de barras de componentes. El gerente de ventas de una embotelladora desea graficar el total de ventas en tres aos y tambin la variedad de los productos en relacin con el total. Podra utilizar un grfico de lneas o un grfico de barras.Grficodebarrasbidireccionales.Paraindicar los cambios porcentuales puede utilizarse un grfico bi direccional, que tambin es til para ilustrar ganancias y prdidas, produccin o ventas cobre lo normal o bajo lo normal de unperodo aotro. Por ejemplo, se representanloscambiosporcentualesdeventascorrespondientesa cinco aos de ventas:SucursalesVentas CambioPorcentual 2005 2010Mercado Central 10 8 -20Mercado Sur 5 7 +40Mercado Norte 2 4 +100Mercado Este 6 3 -50Mercado Oeste 10 11 +10V. ANLISIS DE DATOSUn anlisis de datos suele seguir los siguientes pasos:Anlisisexploratoriodedatos:Estadsticadescriptivadecada variable por separado. Se obtienenmedidas de tendenciacentral,variabilidad, representacingrfica, etc. Sepretendeconocercada variable as como detectar errores, valores extremos.Estadstica Bivariable: Estudia las relaciones entre pares de variables, utilizandoestadsticoscomoel coeficientedecorrelacin Chicuadrado, t de Student, etc. y representaciones grficas diversas.Anlisis Multivariante: Analiza simultneamente dos o ms variables. Los mtodos pueden ser predictivos cuando existe una variablecriteriooindependientequeseexplicaoidentificaporun conjunto de variables independientes, predoctoras o explicativas (Regresin lineal, Regresin cuadrtica, anlisis discriminante,anlisisde varianza)oreductivoscuandose estudian las relaciones entre un conjunto de variables o casos sin que exista una variable a 16ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraidentificar (componentes principales, anlisis factorial,correspondencia binaria, correspondencia mltiple).Usos de variables en el anlisisLas variables puedenser definidas paramedir una determinada salida o respuesta o bien para explicar por que se obtiene una determinada salida. Por ejemplo en el estudio de una enfermedad, las variablesedad, antecedentes, severidaddel estado, tratamientoson variables explicativas o independientes. Las variables discretas sana/no sana es la variable dependiente.En ciertos anlisis exploratorios todas las variables se usan como un nico conjunto, sin distincin entre independientes y dependientes.Anlisis apropiado de datosSondosmotivosporloqueresultadifcil laeleccindelatcnica estadstica adecuada para un investigador con datos reales.El primero es que los libros de estadstica y los cursos curriculares se presentan en un orden lgico desde el punto de vista de la enseanza de las materias, pero desde el punto de vista del proceso del anlisis de datos.La segunda es que los datos reales contienen mezcla de tipos de datos que hacen la eleccin del anlisis arbitrario.Una buena estrategia consiste en aplicar diferentes anlisis al mismo conjuntodedatos, loquenos proporcionarinformacinvariada sobre el fenmeno en estudio.Para decidir el anlisis apropiado se clasifican las variables como:Independiente frente a dependientesNominal u ordinaria frente intervalosVI. DISTRIBUCIN DE FRECUENCIALos problemas industriales abarcan una gran masa dedatos cuantitativos a los que deben darse ciertas formas significativas antes de poder efectuar ningn anlisis e interpretacin. Una forma de uso 17Palacios C. Severocorriente es la distribucin de frecuencia. Existen dos tipos de variables, a saber: discretas y continuas. El anlisis de la distribucin de frecuencia se refiere a datos continuos.OrdenamientoLos datos que se haya sin agrupar son difciles de analizar. Sea, por ejemplo, determinar los ingresos bajos ylos elevados yunpunto central de concentracin, si lo hubiere.Porlotantoesesencial, paraanalizarlasentradas, organizarlos datos que estn sin agrupar en una forma agrupada llamada distribucin de frecuencia.Segnlanaturalezadelavariableestudiadalasdistribucionesde frecuencias pueden ser:Datosnoagrupados:sepresentancuandoel nmerodevalores quepuedepresentarlavariablenoesmuyelevado, yenesecaso podemos observar todos los valores deesavariable. Este casose presenta cuando la variable es discreta y continua no presenta excesivos valores. Datos enintervalos:se presenta cuando la variable es continua o cuando es discretapero conelevado nmero de valores. Enesta situacin se agrupan dichos valores en intervalos o clases. Los intervalos se notan: i ie e 1 es intervalo i-simo. Sellamaamplituddel intervaloaladistanciaqueexisteentrelos extremos.1 i i ie e aSe llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el representante del intervalo. 21 1 + +i iie exSe llamadensidad de frecuenciade unintervalo alafrecuencia correspondiente a cada unidad de la variable en dicho intervalo.18ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraiiiand Losintervalossesuelentomarabiertosporlaizquierdaycerrados por la derecha, salvo el primero que se toma cerrado por los dos lados. Enestetipodedistribucionessepierdepartedelainformacinalagruparlas en intervalos, ya no se puede hablar de valores concretos sino de intervalos.Cuantomayorsealaamplituddelos intervalosmenos intervalos habr, yportantomenosprecisintendremos. Encambio, cuanto menorsealaamplituddelosintervalosmenosintervaloshabr, y mayor ser la precisin, sin embargo la distribucin ser mas grande y ms difcil de manejar.Intervalo de claseCon el propsito de preparar una distribucin de frecuencia a partir del ordenamiento y el apuntado, los ingresos podranagruparse arbitrariamente en clases con un intervalo digamos 250 dlares. Este valor se denomina amplitud de clase. El intervalo de clase es, sencillo,la amplitud de los ingresos mensuales para cada clase. Una manera conveniente de determinarlo es encontrar la diferencia entre los lmitesinferioresdedosclasesadyacentesoladiferenciaentrelas marcas de clase adyacente.VII. CRITERIOS DE DISTRIBUCIN DE FRECUENCIAEnlaprctica, lacantidadtotal declasesvarausualmentedeun mnimo de 5 a un mximo de 20. El hecho de que sean muy pocas o muchas clases no nos aclara la caracterstica esencial de los datos. Por ejemplo, si organizamos los ingresos de los operadores de computadoras solamente en dos clases:Ingreso Mensual (US$) Cantidad de operariosDe 250 a 400De 400 a 6002523Un anlisis dedistribucin de frecuencia no revelaramucho acerca de la estructura de los ingresos de los operarios.19Palacios C. SeveroSiempre que seaposible, el intervalo entre todas las clasesse la distribucin de frecuencia deber ser igual. Los intervalos desiguales originan problemas al graficar y al calcular promedios y otras medias estadstica.VIII. MEDIDAS DE TENDENCIA CENTRALUnamedidadetendenciacentral esunnmeroquerepresentaelvalor central de un conjunto de valores. Habitualmente, estas medidas se llaman promedios. He aqu algunos ejemplos: el ingreso promedio de una familia, es de US$ 1500 por ao; para el peso promedio de 60 fardosde fibra de llama utilizados para eltejido de alfombrasyun dimetro promedio de pistones maquinados durante un jornal.Enel presenteseconsideranlasherramientasestadsticasquems comnmente se usan:Media aritmticaGeneralmente se le llama media o promedio. La media es simplemente la suma de una serie de datos numricos dividida por el nmero totalde ellos. Esapropiadousarlamediacuandolosresultadossonsimtricosy tienen una distribucin normal. Pero existen casos que estudiaremos a continuacin:Datosnoagrupados:Si losdatosnoestnagrupadoslamedia aritmticasecalculatomandotodaslasmedicionesydividiendola suma por el nmero de stos.Datos agrupados: La resistencia a la traccin de varios filamentos son 6, 6, 7, 7, 8, 8, y 9,4. Estos valores se agrupan en una distribucin de frecuencia.El puntomediodecadaclaseseusapararepresentarlaclase. Elpuntomediodelaclase se multiplicaentonces por el nmerode frecuencia en esa clase. La suma de estos productos se divide por la cantidad total de datos para obtener la media aritmtica.Ejemplo 1.120ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraLa tabla 1.1 muestra los puntajes de tres artculos en unaprueba de degustacin, usando preguntas cualitativas de escalas, a fin de cuantificar los valores.Todos los productos probados tienen la misma media. La media de 20 esestaescalaesbastantedescriptivadeladistribucinnormal delproducto 1, pero sera engaoso si se usara para describir el producto 2 el producto 3. La mayora de los resultados en una investigacin tienen una distribucin normal (es decir, en forma de campana alrededor de un punto medio) pero otras distribuciones son lo bastante comunes como para que se deba verificar siempre, antes de usar la media, si sta es en realidad descriptiva.nXXi n i ,... 2 , 1 La media tiene otra debilidad sobre la que se debe estaralerta: se ve afectada por las observaciones extremas.Tabla 1.1 Puntaje de tres productos en preguntas de degustacinNivel dedegustacinProducto1 2 3543211057051020202020200505000Media 20 20 20Ejemplo 1.2Si los ingresos de dos profesionales se promedian con losingresos de diez peones, el ingreso para todos los doce ser de ms de US$ 250,que obviamente es una cifra engaosa, si se evita usar la media para datos que no tengan una distribucin normal o para datos que incluyanobservacionesextremas, staeslamedidaestadsticams til para describir el promedio.Tabla 1.2 Mano de obra por da para cada productoPersonalJornal(US$)Producto 1 Producto 2CalificadoSemi calificadoNo calificado20105853852Media aritmtica ponderada21Palacios C. SeveroPermite calcular un promedio que toma en cuenta la importancia o elfactor que tiene cada valor sobre el total. Todas las medias aritmticas son ponderadas. Si no se dan factores especficos a todos y cada uno de los valores de la serie.ii imm XXEjemplo 1.3Una empresa desea contratar tres tipos de personal: calificado,semicalificado y no calificado, para la produccin de ciertos artefactos. La gerenciadeseaconocerelcostopromediodemanodeobraporda para cada producto.El promedio aritmtico simple es:2 10160 , 0 661 , 1 644 , 0 X X Y + + El costo de mano de obra promedio del producto 1 es,( ) $ 72 , 187 3 5 8 67 , 11 US + +Y para una unidad del producto 2 es,+ ++ +22 2 Fe AgO Fe AgEl anlisis de esta manera es incorrecto, ya que no se toma en cuenta que se trabaja con diferente personal.Ejemplo 1.4Se compra material de construccin a tres empresas comercializadoras siendo sus costos: 80 kilo a 0,5 dlares por kilo, 20 kilo a 0,7 dlares y 10 kilos a 0,9 dlares. Determine el precio promedio por kilos de alambrn. Tabla 1,3 Precio por kilo de alambrnPrecio por kilo (Xi) Kilo comprado (mi)0,50,70,9802010Total 11022ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraAplicando la frmulaii imm XX( ) ( ) [ ] ( ) ( ) [ ] kilo US X / $ 5727 , 0 110 / 10 ... 110 / 80 / 110 / 10 9 , 0 ... 110 / 8 , 0 5 , 0 + + + + Comparando con el promedio simple[ ] 10 / 9001 X X( ) ( ) ( ) ( ) ( ) ( ) [ ] k i l o U S X / $ 5 7 2 7 , 0 1 1 0 / 1 0 9 , 0 2 0 7 , 0 8 0 5 , 0 + + Media armnicaEsel inversodel valormedio, selautilizaconfrecuenciaparala medicin y anlisis de flujos volumtricos.iXn H1Ejemplo 1.5Calcular el flujo volumtrico medio (FVM) de dos bombasque entregan combustible 10000 litros a razn de 500 litros por minuto y 10000 litros a razn de 100 litros por minuto, n = 2min / 7 , 166100 / 1 500 / 112 litros H ]]]

+El resultado tambin puede obtenerse calculando el tiemponecesario para bombear 10000 litros con los dos flujos volumtricos y dividiendoel resultadoporel nmerototal delitrosbombeados, es decir:r1 = 10000/500 = 20 minr2 = 10000/100 = 100 minFVM = (10000 + 10000)/120 = 166,7 l/min23Palacios C. SeveroObsrvese que el valor medio es de 300 litros por minuto, casi el doble de la media armnica.Media geomtricaLa media geomtrica Xges la n-raz de los productos de la n observaciones medidas, de amplia utilidad en economa.nig X XEn forma logartmicann L o g XX L o gigUnaaplicacinimportanteesdeterminarel incrementoporcentualpromedio en ventas, produccin u otras variables correspondientes a un lapso dado.Una modificacin de la frmula es:1Pr 11

`

(|

`

(|Lapso imerLapso ltimoLognX Log gEjemplo 1.6Supongamos que durante cinco aos de una economainflacionaria,las entidades crediticias pagan tasas altas de inters de 10, 20, 25, 30 y 40 por ciento. Hallarlatasadeinters promedioanual deundepsitode1000 dlares.Tabla 1.4 Economa inflacionariaAoTasa de inters Factor de crecimiento Ahorro al final de ao (US$)123451020253040233,5451000*2 = 20002000*3 = 60006000*3,5 = 2100021000*4 = 8400084000*5 = 420000El factor de crecimiento anual, ser:[ ] a o c a d a v e c e s X 5 , 3 5 / 5 4 5 , 3 3 2 + + + + Pero 3,5 = 1 + 25/1024ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraCorresponde a una tasa de inters promedio de 20% anual.Entonces, el depsito de 1000 dlares crecer en cinco aos:( ) ( ) 75 , 2 16 / 158 4 / 41 39 41 372 2 2 2 2 + + + columnaSCEste es un valor excedente al real en ms de US$ 10521 - 8,75 un errormuy considerable.Usando la media geomtrica, el factor de crecimiento promedio Anualcorresponde a una tasa de inters promedio de 235% anual o 3,35 = 1 + 235/100 entonces el depsito de 1000 dlares crecer en cinco aos a:( ) ( ) 25 , 94 16 / 158 4 / 36 56 31 352 2 2 2 2 + + + oo tratamientSCSiendo est la media ms apropiada para el caso.Media cuadrticaDe un conjunto de nmeros Xn es denotado por la raz cuadrada de la media cuadrtica y es definida como:nXX q2Ejemplo 1.7Evalu los datos que se muestran a continuacin 1, 5, 7 y 92 4 , 6 q XMedianaSellamamedianadeunavariableestadsticaaaquel valordela variable tal que el nmero de observaciones menores que l es igualqueel nmerodeobservaciones mayores. SenotaMeysepuede considerar como el punto de abscisas cuya ordenada en la curva vale .25Palacios C. SeveroNiN/2Ni-1ei-1 MeeCCB ABiiii eiiii eanN Ne MnaN Ne MCCACBBAB]]]

+ 11112 /2 / Datos no agrupados: La mediana es el valor correspondiente a un puntodeunaescalaconrespectoal cual lamitadsuperioragrupa igualcantidaddevaloresquelamitadinferior.Paradeterminarla medianadedatos noagrupados se ordenan, enprimer lugar, de menor a mayor.Datosagrupados:Ordenaralgunasobservacionesnoagrupadas de menor a mayor y elegir el valor central representa poco trabajo.Sin embargo, si son muchas las observaciones siempre es un problema ordenarla y encontrar el punto medio. En cambio, en datos cuantitativosesposibleclasificarladirectamenteenclasesyhallar unaaproximacindelamedianaenfuncindeladistribucinde frecuencia resultante.La mediana se puede clasificar con la frmula siguiente:ifF nL M e d i a n a]]]

+ 2 /Donde:L Lmite inferior de la clase en que se ubica la medianan Cantidad de datosF Frecuencia acumulativa para la clase inmediata inferiorf Frecuencia en la clase mediai Amplitud del intervalo de claseEjemplo 1.826ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraOrdenelos valores porsumagnitud,obtenga lamediana.92,3 92,6 92,5 92,8 92,4.Resulta ser la mediana 92,5ModaLamodaeslanicamedidaquesepuededefinirparacaracterescualitativos. Se define la moda de una distribucin como aquel valor que se ha presentado ms veces, es decir, es aquel que su frecuencia absoluta es mxima.Si ladistribucinesagrupadaenintervalossehabladeintervalo modal. Una moda en una distribucin no tiene por qu ser nica, puede haberms de una enuna misma distribucin, y entonces se habla de distribuciones bimodales, trimodales, o en general plurimodales. Datos noagrupados:El modo se define como el valor de la observacin que aparece con mayor frecuencia. Cuando existe solo un modo, ladistribucinsellamaunimodal, si existendosvaloresque aparecen con frecuencia, la distribucin recibe la denominacin bimodal.Datosagrupados:El modoobservadoparadatosagrupadosen una distribucin de frecuencia es el punto medio de la clase en donde se encuentra el mayor nmero de frecuencia.IX. MEDIDAS DE DISPERSINLasmedidasdedispersinnos vanainformarsobreel gradode esparcimiento de ladistribucin, es decir, nos vanadecir si los valores que aparecen estn ms o menos concentrados. Por tanto, nos vaninformar tambinsobre el grado de representatividad de la medida de posicin, pues cuanto ms concentrados estn los valores quetomalavariablemejor representarunsolovalor atodala distribucin.VarianzaLavarianzaes unamedidade dispersinque mide el grado de esparcimiento de una distribucin alrededor de la media aritmtica.27Palacios C. SeveroCuanto ms grande sea la varianza ms esparcidos estarn los valores de la variable. La varianza se suele notar 2y se calcula:( )( )i ii if X XNn X X Al igual que en la media aritmtica los Xi representan a los valores de la variable si es una distribucin no agrupada y a las marcas de clase si es una distribucin agrupada en intervalos.Lavarianzaes lasumade las desviaciones de los valores de la variable sobre la media aritmtica ponderada por las frecuencias. Por lo tanto, cuanto menor sealavarianzams agrupadaestarla distribucin en torno a su media aritmtica. La varianza viene expresada en las mismas unidades que la variable pero al cuadrado. Desviacin tpicaLa desviacin tpica se define para obtener una medida de dispersin quevengaexpresadaenlas mismas unidades quelavariable. Se define como la raz cuadrada de la varianza. Coeficiente de variacinTanto la varianza como la desviacin tpica son medidas de dispersin absoluta, esdecir, noshablandeladispersindelavariableque estamos estudiando, pero no nos permiten comparar la dispersin de dos distribuciones distintas.El coeficiente de variacin es una medida de dispersin relativa que nos va permitir comparar dos distribuciones distintas, se define como el cociente entre la desviacin tpica y la media aritmtica. XCVEl coeficientedevariacinesuncoeficienteadimensional ysolose puede definir cuando la media aritmtica es distinta de cero.28ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraPara comparar la dispersin de dos distribuciones basta con comparar sus coeficientes de variacin, aquella que su coeficiente de variacinseamenoreslaqueestamsconcentradaentornoasu media aritmtica. Problemas(1) Un operario que trabaja a jornal gana por mes US$ 150, otro mes US$ 120 y otro mes US$ 140.Cunto gana en promedio mensualmente?(2) Los ingresos sobre ventas en una tienda comercial se evalan cadasemestre. Lossiguientesdatosrepresentan, losingresos (en dlares) por cada mes: 300, 280, 350, 320, 290 y 325Determine el ingreso medio de la muestra.(3) Durante dos semanas se ha observado la temperatura en C almedio da, siendo los resultados:12 10 14 18 9 8 108 9 11 10 11 10 11Determine la temperatura media de la muestra.(4) Calcular la media de los datos agrupados:Y 40 41 42 43 44 45 46 47 48 49 50n 3 4 6 2 2 3 1 1 2 2 4(5) Un grupo de micro empresarios, trabajan con obreros eventuales. Ciertos das trabajan con seis, ocho y cuatro.29Palacios C. SeveroEn la mayora de las veces trabajan con siete obreros, siendo en total ocho micro empresas.Cul es el promedio de obreros por micro empresa(6) Supongamos que se han registrado 50 observaciones referentes a los pesos de 50 garrafas de gas licuado, la muestra fueobtenidadelaproduccinporhoraylasunidadesestn dadas en kilogramo9.8 9.3 9,5 9,2 9,4 9,2 9,3 9,3 9,5 9,49,2 9,3 9,5 9,3 9,4 9,3 9,2 9,1 9,3 9,39,4 9,5 9,4 9,4 9,2 9,4 9,6, 9,6 9,3 9,19,4 9,2 9,5 9,3 9,2 9,3 9,2 9,3 9,4 9,69,4 9,3 9,4 9,3 9,4 9,3 9,3 9,4 9,2 9,4Calcule el peso promedio de las garrafasSi el peso estndar es de 10 kilos cuanto de gas falta en promedio(7) La temperatura registrada en un vivero, a cierta hora de un da cualquiera, en grados centgrados, fueron 30, 32, 39, 32, 33,31, 38, 37, 32 y 31.Determine la media en grados Fahrenheit.(8) Un proyecto econmico muestra que el consumo de alimentos de un barrio marginal de 350 personas es en promedio de US$ 120 mensuales. Halle la media del gasto diario en alimentacin.(9) El ingreso percapite mensual en un pas es US$ 250. El sector del magisterio constituye el 60% de la poblacin que percibe el2/5 del ingreso total. Calcule el ingreso medio por habitante delsector.(10) Una empresa A tiene80 empleados con un sueldo promedio mensual de 180 dlares por empleado. La empresa B tiene 120 empleadosconunsueldopromediomensual porempleadode 200 dlares por empleado, calcular:Cul esel sueldopromediomensual delasdosempresasen conjuntoSe agrega una tercera empresa con 40 empleados y unsueldo promedio mensual de 250 dlares por empleado.Cul es el sueldo promedio de las tres empresas en conjunto?(11) Se compran 100 kilos de carne de res a 2,3 dlares por kilo, 50 kilos de carne de cerdo a 2,8 dlares por kilo y 20 kilos de carnedecorderoa1,8dlaresporkilo. UnplatodeBuffettieneun costo de 8 dlares en donde se incluyen los tres tipos de carnes a razn de 1:0,5:0,2 respectivamente.Determine el promedio de platos Buffet que podrn prepararse y cuanto de carne sobra?30ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera(12) Unaempresaindustrial fabricaazulejos a60dlares por metro cuadrado, jarrones a 20 dlares la unidad y floreros a 5 dlares por unidad. Un decorador desea adquirir dichos productos pero cuentatanslocon500dlares ytiene un ambiente de 20 metros cuadrados.Determineelpromediodecadaproductoparaladecoracin del ambiente?(13) Un proyecto minero posee cuatro ingenios aurferos. Elingenio A tiene una ley de cabeza de 8 gramos por tonelada y trabajan 20 mineros. El ingenio B tiene una ley de cabeza de 4 gramos por tonelada y trabajan 12 mineros. El ingenio C tiene unaleydecabezade12gramosportoneladaytrabajan25 mineros. El ingenioDtieneunaley2gramosportoneladay trabajan 25 mineros.Determine la media aritmtica y la media geomtrica de la ley de cabeza?Si el costo real del oro es de 30,2 dlares por gramo.Evalu el costo de mano de obra, siend0 la relacin de produccin de A=2B, C=5D, A=3D en cada ingenio?En que ingenio se trabaja a perdida?(14) Se tiene sospecha de que en las aguas subterrneas las concentraciones de nitritos superanlas normas establecidas paralacrianzadepeces, dichaconcentracinesde0,03mg NO2/l. Paratratar deverificar lasospecha, semidieronlos nivelesdenitritosendiezpuntosaleatoriosdel acuferoyse obtuvieron los siguientes datos.0,02 0,05 0,03 0,05 0,04 0,06 0,07 0,03 0,04 0,03Estime el nivel de confianza al 90% que las concentraciones de nitritos superan las normas establecidas para que sea factible la existencia de vida pisccola en la zona.(15) Los datos obtenidos de una muestra aleatoria simple de tamao30deladistribucinX,porcentajedeincrementodelcontenidodealcoholenlasangredeunapersona,despusde ingerir cuatro cervezas es.2 , 41 X1 , 2 sCalcular un intervalo de confianza del 90% para el porcentaje medio de alcohol en la sangre de una persona, despus de tomar cuatro cervezas.Si se calcula un intervalo de confianza del 95%, cual ser el de mayor o menor amplitud.31Palacios C. Severo(16) El2000se reforestaronmsde3millonesde acres condos milmillonesdeplantasdeviveros.Unagravesequadurante lassiguientesestacionesmatamuchasdeestasplantas. Se obtuvounamuestrade1000plantasysedescubrique300 estaban muertas. Obtener un intervalo de confianza del 90% de laproporcinde plantas del vivero muertas. Utilizar dicha informacin para estimar el nmero de plantas muertas en la poblacin.(17) La capacidad de los equipos de vidrio producido en una determinada empresa de vidrio tiene una distribucin normal.Unamuestraaleatoriade7deellas diocomoresultadoun varianzade62mililitros. Dar unaestimacin, medianteun intervalo de confianza del 95% de la varianza de la capacidad del equipo de vidrio que fabrica dicha empresa.(18) Se quiere estudiar la eficacia de un tratamiento para eliminar una bacteria de un pino. En una muestra aleatoria de 150 pinos sometidos al tratamiento, 118 resultaron sanos. En otra muestra aleatoria de 130 pinos no tratados, los pinos sanos fueron 91.Construir un intervalo de confianza del 95% para la diferencia en la taza de pinos sanos entre los tratados y los no tratados.A que conclusin llega respecto a la efectividad del tratamiento.(19) Para estudiar el rendimiento de dos tipos de cereales se hacen 20determinacionesenparcelasdondesehasembradocerealdel tipo A y 18 determinaciones en parcelas con cereales tipo B con los resultados siguientes.rea Kg XA / 5 , 14 rea Kg sA/ 23 , 3 rea Kg XB / 3 , 15 rea Kg sB/ 85 , 1 Sonigualmenteefectivosparael cultivoloscerealesAyBalnivel de confianza del 90%(20) Se realiz un estudio para comparar en lcteos el contenido de sodioenel plasmayenleche. Se obtuvieronlas siguientes observaciones sobre el contenido de sodio (mili moles por litro de leche), en 10 envases aleatoriamente seleccionadas.Envase 1 2 3 4 5 6 7 8 9 10LechePlasma931471041579514281141951429514776148801447914487146Hallar un intervalo de confianza del 95% de la diferencia media de los niveles de sodio en los fluidos del lcteo(21) En el departamento de control de calidad de una empresa, se quiere determinar si hahabido un descenso significativo de la 32ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieracalidad de su producto entre las producciones de dos semanas consecutivas a consecuencia de un incidente ocurrido durante elfin de semana. Deciden tomar una muestra de la produccin de cadasemana, si lacalidaddecadaartculosemideenuna escala de 100, obtienen los resultados siguientes:Semana I 93 86 90 90 94 91 92 96Semana II 93 87 97 90 88 87 84 93Suponiendo que las varianzas de lapuntuacinenlas dos produccionessoniguales,construyeunintervalodeconfianza para la diferencia de medias al nivel de 95%. Interpreta los resultados obtenidos.(22) Sospechamos quenuestrocromatgrafoestestropeado, y queremos determinar si los resultados que nos proporciona son lo suficientemente precisos. Para ello, realizamos una serie de 8 mediciones del contenidodeunasolucindereferenciaque,sabemos, contiene 90%de un determinado compuesto. Los resultados que obtenemos son:93,386,8 90,4 90,1 94,9 91,6 92,3 96,5Construirunintervalodeconfianzaal nivel de95%parala varianza poblacional. Qu conclusiones podemos realizar?(23) Sehahechounestudiosobrelaproporcindeenfermosde cncer de pulmn detectados en hospital que fuman,obtenindosequede123 enfermos 41 de elloseran fumadores.Obtener un intervalo de confianza para dicha proporcin.Estudiar si dichaproporcinpuede considerarse igual ala proporcin de fumadores en la poblacin si sta es de un 29%.(24) Paraestudiar laefectividaddeunmedicamentocontrala diabetessemidelacantidaddeglucemiaensangreantesy despus de la administracin de dicho medicamento,obtenindose los resultados siguientes:Antes 7,2 7,3 6,5 4,2 3,1 5,3 5,6Despus5,2 5,4 5,3 4,7 4,1 5,4 4,9Estimar la reduccin producida por el medicamento.(25) Eres el encargado de un departamento de produccin en una fbricayrecibes unlotede2000piezas necesarias parala fabricacin de un artculo. Tienes la responsabilidad de aceptar o rechazar el lote, si estimas que lacalidad de ste no es suficiente. El fabricante te asegura que, en este lote, no hay ms de 100 piezas defectuosas, pero decides tomar una muestra para estimar la proporcin de las mismas.33Palacios C. Severoa) Cuntas piezas decides examinar para que, con un nivel de confianza del 95%, el error que cometas en la estimacin de la proporcin poblacional de defectuosas no sea mayor que 0.05?b) Si decides tomar una muestra de 100artculos escogidos alazarenelloteyrealizaselrecuentodepiezasdefectuosasen esta muestra, encontrado 4 artculos defectuosos.Construye paralaproporcinde defectuosos enel lote, un intervalodeconfianzaal nivelde95%deconfianza. Sedebe rechazar el lote?(26) Los tiempos de reaccin, en mili segundos, de 17 sujetos frente a una matriz de 15 estmulos fueron los siguientes:448460514 488592 490507 513 492534 523 452 464562 584507 461Suponiendo que el tiempo de reaccin se distribuye Normalmente, determine unintervalo de confianza para la media a un nivel de confianza del 95%.(27) Se considera una poblacin representada por una variante ,de suerte que la media poblacional es igual a 25 y la varianza poblacional es igual a240. Supuestoextradas muestras de tamao 100, muestreo aleatorio simple, determinar la probabilidad de que el estadstico media muestral, Ax, este comprendido entre los valores 23; 55 y 28,1.(28) La duracin aleatoria de las unidades producidas de un artculo, se distribuye segn la ley normal, con desviacin tpica igual a seis minutos. Elegidas al azar cien unidades, resulto ser laduracinmediade14,35minutos. Elaborarel intervalode confianzadel 99%paraladuracinmediade las unidades producidas.(29) Seestudiaron40muestrasdeaceitecrudodedeterminado proveedor con el fin de detectar la presencia del nquel mediante unapruebaquenuncadaunresultadoerrneo. Si en5de dichasmuestrasseobservolapresenciadenquel podemos creer al proveedor cuando asegura que a lo sumo el 8% de lasmuestras contienen nquel?(30) La resistividad elctrica de ciertas barras de aleacin de Cromo- molibdeno es una variable N(12,5; 4,1).Un investigador acabadecalibrar unaparatoquemidedicharesistividady para comprobar que lo ha hecho bien utiliza el sistema consistente en medir cuatro barras y aceptar que el calibrado es34ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenierabueno si encuentra al menos un valor inferior y otro superior a 12,5.Determinar el nivel de significacin del contraste que esta llevando a cabo. Es sensible el contraste a una mayor o menor dispersin de la variable resistividad?(31) En una muestra de 65 sujetos las puntuaciones en una escala de extroversin tienen una media de 32,7 puntos y una desviacin tpica de 12,64.a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la poblacin.b) Indique, conunnivel deconfianzadel 95%, cual seraelmximo error que podramos cometer al tomar como media de la poblacin el valor obtenido en la estimacin puntual.(32) En una muestra aleatoria de 90 pacientes se mide el nivel de glucosaensangreenayunas. Seobtiene132 Xmg/dl y s2=109. Construir el intervalo de confianza al 95%.(33) Para evaluar una vacuna para la gripe se selecciona un grupo de200individuosderiesgo. Seeligen100deellos yseles suministra la vacuna; de ellos 10 pasan la gripe. Construir un intervalo de confianza al 95% para la probabilidad de pasar la gripe si se esta vacunado. En los otros 100 pacientes sin vacunar la pasan 20. Es eficaz la vacuna?(34) Seanalizan9zumosde fruta ysehaobtenido un contenido mediodefrutade22mgpor100cc dezumo. Lavarianza poblacional es desconocida, por lo que se ha calculado la desviacin tpica de la muestra que ha resultado ser 6,3 mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del zumo es normal, estimar el contenido medio de fruta de los zumos tanto puntualmente como por intervalos al 95% de confianza.(35) Una firma comercial encuesta a 100 individuos para conocer sus opiniones sobre la eleccin de dos productos alternativos A y B recientemente fabricados. El resultado de la encuesta arroja que el producto A lo han elegido 55 individuos y el producto B 45. Hallar un intervalo de confianza al 95% para la proporcin de individuos que eligen cada producto.(36) En un proceso de fabricacin de pilas alcalinas se sabe que su duracin media es de 1100 horas y que dicha duracin sigue una distribucin normal. El nuevo proceso busca reducir la dispersin de la duracin de las pilas por lo que se hace 35Palacios C. Severonecesario construir intervalos de confianza para la citada dispersin con coeficientes de confianza 90% y 98%.Construir dichos intervalos a partir de una muestra de tamao 20 cuya dispersin es2240horas.(37) Se sabe que lalongitud de los dimetros de los tornillos fabricados por una mquina sigue una distribucin normal y se busca un intervalo en el cual se encuentre la variabilidad de las longitudesdelostornillosfabricadosporlamquinaconuna probabilidad del 80%.Construir dicho intervalo sabiendo que una muestra de 16 tornillos presenta una variabilidad cuantificada en 30.(38) UngranjerodisponededoscriaderosdiferentesAyBcon varias granjas cada una para la cra de pollos. Con el objetivo deestudiar lamortalidaddelos pollosenlasdos criaderos observa el nmero de pollos muertos tomando una muestra de 4 granjasenel criaderoAyotras4granjasenel criaderoB obteniendo los siguientes resultados:N de pollos muertos en las granjas del criadero A: 16 14 13 17N de pollos muertos en las granjas del criadero B: 18 21 18 19Suponiendo normalidad en los criaderos, se trata de estudiar sila mortalidad de los pollos puede considerarse diferente en los dos criaderos con un nivel de confianza del 95%.Resolverel problemabajolahiptesisadicional devarianzas iguales en los criaderos.(39) Al analizar40muestrasdeunaaleacindebajopuntode fusin de tipo babit se ha detectado ausencia de cadmio en 12 de ellas. Determinar un intervalo de confianza para la proporcinde muestras de dichaaleacinque nocontienen cadmio.(40) La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribucin normal X. se ha observado una muestra de extensin 9 con los siguientes resultados0,70,80,60,950,6510,90,20,55.Si aceptamos como valor de el valor calculado de la desviacin tpica muestral S ,Cul sera el tamao mnimo de la muestra que habra de ser considerada para que el intervalo de confianza al 95% para elnivel medio de azufre tenga una longitud inferior a 0,1?(41) La prdida de peso de un determinado producto diettico en 16 individuos despus de un mes fue (en kg):3,2 2 2,5 3,3 5 4,3 2,9 4,136ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera3,62,73,54,22,84,43,33,1Determinar unintervalodeconfianzaparalavarianzacon nivel de confianza del 99%, si la prdida de peso esaproximadamente normal.(42) Se consideran lo siguientestiempos de reaccin de un producto qumico, en segundos:1,41,21,21,31,51,32,21,41,1Obtenerunintervalodeconfianzadel 90%parael tiempode reaccin. Suponer la variable normal con desviacin tpica poblacional conocida = 0,4.(43) El tiempo, en minutos, que esperan los clientes de un determinado bancohasta que son atendidos siguedistribucin normal de media desconocida y desviacin tpica igual a 3. Lostiempos que esperaron diez clientes elegidos al azar fueron los siguientes:1,5 2 2,5 3 1 5 5,5 4,5 3 3Determinar un intervalo de confianza de coeficiente de confianza 0,95, para el tiempo medio de espera.(44) Laduracinenminutos de undeterminado viaje es una variable aleatoria con distribucin normal de media desconociday desviacintpicaigual a3. Enunamuestra tomadaal azardediezrealizacionesdel viajeencuestinse obtuvieron los siguientes tiempos:10,1 6,5 5,5 7,9 8,2 6,5 7,0 8,1 6,9 7,7a) Realizar la estimacin de mxima verosimilitud de la duracin media del viaje.b) Calcular la probabilidad de que, en valor absoluto, la diferencia entre media estimada la real sea menor que 1 minuto.(45) Las velocidades de difusin del bixido de carbono a travs de la porosidad del suelo son distintas.Arenoso 2027 22 23 23 2823 26 22 26 2019 22Arcilloso 19 3032 2815 26 35 18 25 35Comprobar si se puede afirmar que las velocidades de difusin son distintas al nivel de confianza del 95%(46) Una transformadora de productos lcteos recibe diariamente la leche de dos granjas. Se desea estudiar la calidad delproducto acopiado, se extraen dos muestras al azar y se analiza el contenido en materia grasa, obtenindose los siguientes resultados.37Palacios C. SeveroGranja A% 7 , 8 A X2 2% 02 , 1 As33 AnGranja B% 9 , 10 B X2 2% 73 , 1 Bs27 BnSepideconstruirunintervalodeconfianzadel 95%parala diferenciadel contenidomedioengrasade leche de ambas granjas.(47) Enunadeterminadarazade ganadovacuno los terneros incrementan 12 kg. de peso cada semana, en los primeros meses de vida. Para comprobar se someti al pesado de ocho terneras al cumplir las cuatro semanas y posteriormente dos semanas.Ternero 1 2 3 4 5 6 7 8Peso 4 semanasPeso 6 semanas130138125140128139127141129137123137131142130142Comprobar si la suposicin es cierta calculando los intervalos de confianza al 95% para la diferencia media de peso.(48) Se ha realizado un estudio sobre la tasa de supervivencia de pjaros adultos en trpico y en zonas templadas. Inicialmente se marcaron 500 pjaros adultos en las patas y se liberaron a una regintropical. Unao despus, se volvi acapturar 445.Suponiendo que los no recuperados fueron victimas de un depredador, la tasa de supervivencia estimada de un ao para los pjaros adultos en la regin es 0,80. Un experimento similar enotrazonatemplada, diocomoresultadode252delos500 pjaros con una tasa de supervivencia estimada de 0,504.Hallar un intervalo de confianza del 90% de la diferencia en las tasas de supervivencia de un ao para las dos zonas.(49) Unamuestrade tamao 10de unapoblacinde mujeres presentaunaalturamediade172cm. yunamuestrade12 varones de otra poblacin presenta una altura media de 176,7 cm. Sabiendo que ambas poblaciones son normales con varianzas 225 y 256 respectivamente, se trata de analizar si con unaprobabilidaddel 95%sepuedeasegurarquelosvarones son ms altos en media que las mujeres o viceversa.(50) Losresponsables municipales de la salud miden la radiactividadenel aguadeunafuentenatural enunazona abundanteengranito. Realizadas12medicionesendiferentes fechas del ao se observ una media de 3,6 picocurios con una desviacin tpica de 0,82.Determinar,al95%yal99%,intervalosdeconfianzaparala radiacin media y para la varianza.38ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera(51) En una muestra de 65 sujetos las puntuaciones en una escala de extroversin tienen una media de 32,7 puntos y una desviacin tpica de 12,64.a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la poblacin.b) Indique, conunnivel deconfianzadel 95%, cual seraelmximo error que podramos cometer al tomar como media de la poblacin el valor obtenido en la estimacin puntual.(52) Los tiempos de reaccin, en mili segundos, de 17 sujetos frente a una matriz de 15 estmulos fueron los siguientes:448, 460, 514, 488, 592, 490, 507, 513, 492, 534, 523, 452, 464,562, 584, 507, 461Suponiendo que el tiempo de reaccin se distribuye normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%.(53) Deunapoblacincuyadistribucinsedesconoceseobtiene una muestra aleatoria de 2000 valores en que la media muestral resulta ser 225 y la desviacin tpica muestral 10.Suponiendo que lavarianzamuestral coincidaconlade la poblacin, estimar un intervalo parala media de la poblacin con un nivel de confianza del 95%(54) En una muestra de 100 personas de un barrio de Lima se ha observado una proporcin de 0,18 personas que leen elperidico diariamente. Puede ser que la verdadera proporcin de personas que leen el peridico en ese barrio sea 0,20?39Palacios C. SeveroX. ESTIMACIN DE PARMETROSOtracosaquelosinvestigadorestratandehacerconfrecuenciaes obtenerinferenciassobrela poblacin conbase en losresultados de una experiencia a partir de una muestra. El hecho de que 50 personas en una prueba prefieran el producto A al producto B por un margen dedosatres, esimportantesoloenlamedidaenquelepermita concluir en que la poblacin como un todo tambin prefiere elproducto A. Esto es se llama inferencia estadstica, tomar una decisin sobre la poblacin entera en base a las caractersticas de una muestra.Para hacer una inferencia sobre la poblacin, usted debe de aplicar un lmite de confianzaounintervalo de confianzaal resultado que encontr en el estudio.Ejemplo 1.9EnunestudioXseencontrqueel 30%delosinformantestienen conocimiento del producto A, es poco factible que exactamente el 30% de la poblacin entera tenga ese conocimiento del producto A, pero la cifra de la poblacin deber estar cerca del 30%. S la muestra es lo suficientemente grande y estuvo bien tomada. A la diferencia entre los resultados de la muestra y la poblacin se la llama error muestral.El intervalo que se conexa al resultado de la encuesta paraestimar o inferir la cifra de la poblacin se llama intervalo de confianza.XI. DIFERENCIAS SIGNIFICATIVASA veces en un proyecto de investigacin se propone comparar resultados entre dos muestras. Las comparaciones ms comunes son:Dos o ms subgrupos dentro de una misma muestra40ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraTienen las personas con ingresos superiores de US$ 10000, opiniones diferentes de las que tienen las personas con ingresos por debajo de Sus 10000? Son distintas las evaluaciones de productos confeccionados por los varones alas evaluaciones hechas por las mujeres?Muestras tomadas en diferentes puntos en el tiempoAument el conocimiento del producto durante el ao pasado? Es la participacinenlasUniversidadesmayordeloqueerahacecinco aos? Lo primero que usted hace, es observar los resultados en forma simple y directa.Si las respuestas de los hombres ymujeres soniguales, ustedno necesita de una prueba estadstica adicional. Si la participacin en las Universidades no ha cambiado desde hace cinco aos usted ya tiene una respuesta.Pero si los resultados son distintos entre cualquiera de sus sub-grupos entonces ustedtiene queconfrontar dos preguntas bsicas Es la diferencia de los resultados tan pequea como para sugerir que sta probablemente ocurri por azar? est si usted repite la prueba. Hay unabuenaprobabilidaddequeelresultado seaelcontrario?Eselresultadolobastantegrandecomoparaqueprobablementeseaelresultado de unaverdaderadiferencia? s ustedrepite laprueba varias veces, Es muy factible que sta resulte igual cada vez?Antes de hacer una prueba estadstica, usted debe tener una hiptesis es decir una relacin que usted querr probar como verdadera o falsa.En estadstica, usualmente se supone que dos poblaciones son iguales hasta que se pruebe lo contrario. Esto se llama hiptesis nula.Empezamoscon la hiptesis nula, si la diferencia entre dos muestras es lo bastante pequeacomo paraque fcilmente pudierahaber ocurrido por azar, entonces la hiptesis nula no puede ser rechazada y usteddebeconcluirqueladiferenciaentrelasdosmuestrasnoes estadsticamente significativa al nivel de significacindel 95 por ciento (o cualquier nivel de, significacin que usted elige). En cambio,si la diferencia en los resultados de la toma de datos es tan grande que noes factible que estohayaocurridopor azar, ustedrechazala hiptesis nula y concluye que la diferencia entre las dos muestras es estadsticamente significativa al nivel de significacindel 95 por ciento.41Palacios C. SeveroAdems de estas medidas de la diferencia en dos muestras, hay otras pruebasestadsticasquesontilesparaevaluardiversasclasesde resultados.XII. DISPERSIN DE LOS DATOS PROBLEMASLa varianza mide la dispersin de los datos con respecto a la media aritmtica y la desviacin estndar es simplemente la raz cuadrada positiva de la varianza. Daremos las definiciones para su aplicacin. Datos no agrupdos: La varianza tambin se basa en desviaciones a partir de medias. Para hallar la varianza a de un producto, se eleva alcuadradolasdesviacionesapartirdelasmedias ( )2X X ,luego tambinsesuman ( )2 X Xysepromediandividiendoporelnmero total de productos, o sea n.( )nX Xi 2Comola media verdadera no se conoce prcticamente, la desviacin estndarverdaderaesunamagnitudterica. Sinembargoapuede obtenerse aproximadamente a partir de la desviacin estndar estimada S(X).( )( )12nX XX SiEn el anlisis estadstico se utiliza una cantidad denominada grados de libertad que designaremos para el futuro como GL. Esta cantidad permite tener en cuenta y corregir, desde el punto de vista matemtico, las restricciones impuestas a los valores. En este caso alcalcularladesviacinestndar, el nmerondeobservacionessta fijado y la desviacin estndar estimada se puede calcular a partir de la media. De la n observaciones slo n-1 pueden variar, el ltimo valor queda determinadopor Xy n.Por lo tanto alestimar ladesviacin estndar a partir de una muestra de la poblacin de datos, solo hay n-1gradosdelibertad. Elevandoal cuadradoladesviacinestndar estimada se tiene la varianza estimada( )2X S .42ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraEjemplo 1.10Sehanrealizadocincoanlisisdeunproductoparadeterminarla concentracin de un componente X. Los resultados fueron: 98 97,7 87 96 y 9332 , 94 X( ) 54 , 456 , 471 93 96 87 7 , 97 982 2 2 2 2 2 + + + + X SDatos agrupados: Para ilustrar el clculo de la desviacin estndar para datos agrupados veamos los siguientes jornales de obreros. En primertrminosehallanlospuntosmedios ( ) X decadaclasede jornal. Luego se eleva al cuadrado las ( )2X Xse multiplican por elnmero adecuado de frecuencia de clase para dar 2X f .( )22XnfXX S Jornal (US$) Cantidad (f)X2X2X fX f3 a 55 a 77 a 92534681636643218019283024Total 10 404 62( ) $ 4 , 11062104042US X S

`

(| La desviacinestndarpuedeemplearsecomodenominadorcomn para colectar la dispersindelas dos distribuciones y la representatividad de las dos medias.Otra aplicacin es la desviacin estndar como instrumento de anlisis se da en su relacin con la media de una distribucin normal.Unarelacinse hallaenfuncindel porcentaje de observaciones dentro de una desviacin estndar debajo de la media y una desviacin estndar incluye un 95% de las observaciones. La 43Palacios C. Severo) ( 3 S Xtincluye alrededor de 99,7% de las observaciones.Desviacin mediaOtramedidadeladispersindelosvaloresesladesviacinmedia real, se trata simplemente de la media aritmtica de las desviaciones de las medias sin tener en cuenta lo siguiente: iX X mdnmediana X Paraunadesviacinnormal, ladesviacinestndarverdaderaes aproximadamente igual 1,25 veces la desviacin media.Ejemplo 1.11Calcular la desviacin media del ejemplo 1.10. md = 3,456 La dispersin de los resultados ser 3,456Problemas44ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera(55) Calcule el valor medio, mediana y moda dela siguiente distribucin de datos:X Y110 -119100 10990 9980 8970 7960 6950 5940 4930 3920 2910 - 191025101394501(56) Se recibe materia! de dos fuentes de abastecimiento.Los anlisis de muestras provienen de las dos fuentes que se indican a continuacin. Se desea saber si se justifica que existe diferencia entre las dos fuentes.Fuente 1 85 74 76 88 73 84 77Fuente 2 79 71 75 77 79 77 78(57) El anlisis de gas natural indica el siguiente concentrado de CO2 en volumen: 24,6 23,7 23,4 23,8 24,1 23,9 Calcule el intervalo de confiabilidad de la media verdadera?(58) En una refinera de plata, se analiza el contenido de plata en losresiduosparaestablecersuconcentracinenloslingotes.Las muestras obtenidas durante dos turnos dieron los resultados.Hora 1 2 3 4 5 6 7 8Turno 1 89 92 98 97 98 97 97 98Turno 2 87 87 97 97 97 98 97 97Trate de saber si la diferencia entre los anlisis de los dos turnos es significativa.(59) La informacin obtenida de cuatro reactores qumicos diferentes, acerca del efecto de latemperaturasobre cierta reaccin es la siguiente:Temperatura (C)Rendimiento del reactor1 2 3 480090098010,410,912,112,910,811,611,710,612,813,513,510,2Determinar mediante anlisis de varianza de dos caminos, si la varianza entre los reactores y entre la temperatura es altamente significativo.(60) Unfabricantedehipocloritosabequelacantidaddecloro contenido en su producto decrece con el tiempo y eventualmente 45Palacios C. Severoseestabilizaentornoal 0,3%. El fabricantedeseaestimarla cantidad de cloro en el hipoclorito para un tiempo dado, con elfin de informar a los vendedores y retirar el producto caducado.Paraellose analizan sobre los porcentajesdeclorodisponible por unidad de producto restante de 8 a 42 semanas despus de fabricado.Semanas desde la fabricacinCantidad disponible de cloro (%)810121416182022242628303234363840420,490,480,460,450,440,460,420,410,420,410,410,40,410,400,410,400,390,390,490,470,460,430,430,450,420,410,400,400,400,400,400,380,400,480,450,430,430,430,400,400,410,380,470,43Realizar el anlisis de regresin y anotar la ecuacin del modelo lineal, el coeficiente de correlacin.(61) Sesabeporexperiencia, queel incrementodepesodelos embriones de pollo al transcurrir el tiempo sigue la ley de tipo exponencial.Enunexperimentose obtuvieronlos pesos (gramos) de un embrin desde el sexto da de su nacimiento hasta e decimosexto que aparecen a continuacin.Da 6 7 8 9 10 11 12 13 14 15 16Peso0,020,050,070,130,180,260,430,741,131,882,81Crear una tabla con la variable das y peso con datos anteriores.Realizarun anlisis de regresin para comprobar que valores siguen la ley exponencial.Grfique los datos y la lnea de regresin ajustada.Estime el peso de un pollo alos 7,5 a los 16 y a los 18 das de su nacimiento. Justificar si alguna de las estimaciones obtenidas es poco fiable.(62) En la siguiente tabla se refiere al nmero Y de bacterias por unidad de volumen presentes en un cultivo despus de X horas.46ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraX 0 1 2 3 4 5 6Y 32 47 65 92 132 190 275Ajustar los datos a una curva del tipo Y = aXbCalcular los valores del coeficiente de correlacinVisualizar la lnea de regresin y los datos obtenidosEstimar el valor de Y para un valor de X = 3,5(63) La tabla adjunta muestra cinco observaciones de un fenmeno cinticoU 103 102 10 1 0,1T 0 1 2 3 4El investigador sugiere un modelo de ajuste del tipo U = ke-bTEstimar los parmetros k y b.(64) La presin de un correspondiente a diferentes volmenes V se dan en la tabla.V (cm) 50 60 70 90 100P (Kg/cm) 60 54 46 24 10Obtenga por regresin el coeficiente de correlacin de los modelos lineales, exponenciales y cuadrticos.(65) En una reunin medica se probo con una droga fue tomada por 14 personas, de las cuales 6 lo hacen por primera vez y 8 ya sonhabitualesdeella. Ladrogaprodujoenel primergrupo sueos de duracin 11, 12, 13, 16, 17 y 15 horas, mientras que en el segundo grupo 8, 7, 9, 10, 6, 7, 9 y 8 horas.a) Media y desviacin tpica de cada grupob) Formar el estadstico que se distribuye segn una t de Studentde 12 grados de libertad, sabiendo que las poblaciones tienen la misma media y desviacin tpica.(66) Segnunaencuestarealizadasobreunamuestrade2500 personaselegidasal azar,el 80% est decidido avotar enlas ltimas elecciones.a) Puede ser cierto que llegue a votar el 85% de la poblacin?b) Con un 99% de nivel de confianza ente qu valores estar elporcentaje de los votantes de la poblacin(67) Suponga que de una poblacin consistente en los valores 0, 2,4, 6 y 8, se toman muestras de tamao 2 con reemplazo.X Frecuencia Frecuencia relativa02468111111/5 = 0,21/5 = 0,21/5 = 0,21/5 = 0,21/5 = 0,247Palacios C. SeveroDemostrar que es razonable aproximar la distribucin muestralde por una distribucin normal, una vez que se conoce la media y la desviacin estndar de la distribucin muestral.(68) Enunexperimentodelaboratoriosemideeltiempodeuna reaccinqumica.Seharepetidoelexperimento98vecesyse obtiene quela mediadelos98 experimentosesde5 segundos con una desviacin de 0,05 segundos. Cul es la probabilidad de que la media poblacional m difiera de la media muestral en menos de 0,01 segundos?(69) Se establece un control de calidad para un proceso de produccin de balas. Se ha dispuesto que cuando el proceso est bajocontrol, el dimetrodelas balas es de1 cm., conuna desviacin tpica de 0,003 cm. Cada hora se toman muestras de nueve balas y se miden sus dimetros. Los dimetros de media de diez muestras sucesivas, en centmetros, son:1,00060,99970,99921,00121,00081,00121,00181,00161,00201,0022Establecer cules son los lmites de control y explicar qu concluyes sobre el proceso de produccin en estos instantes.(70) Uninvestigadorquiereestimarlamediadeunapoblacin usando una muestra suficientemente grande para que la probabilidadde quelamedia muestralno difieradelamedia poblacional enmsdel 25%deladesviacintpicasea0,95.Hallar el tamao de muestra necesario.(71) Laefectividadendasdeundeterminadoantibitico, sigue unadistribucinnormal demedia14dasydesviacintpica desconocida. Fue administrada a 16 enfermos, obtenindose una desviacin tpica muestral de 1,4 das. Determinar la probabilidadde que laefectividadmediaenlamuestrano supere los 3 das, que es el tiempo mnimo de efectividad requerido.(72) Serealizaunanlisisdeladuracinde40pilasalcalinas obtenindose los siguientes resultados:Duracin XiFrecuencia absoluta nj1,55 1,951,95 2,452,45 2,952,95 3,453,45 3,953,95 4,454,45 4,95214151053Ajustar las duraciones de las pilas alcalinas a una distribucin normal con media 3,5 y desviacin tpica 0,7.48ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera(73) Unestudio degenticaconresesconsistien variosmachos apareados con grupos separados de hembras.Cuando nacanterneros, se usabanenunestudio de pesos hereditarios. Enlasiguientetablasepresentanlos pesos alnacer deochoterneros decadaunodelos cincogrupos de apareamiento.Macho Peso al nacer1772002012022036175585759100102605646569560671201131035759115999857581151031155912196759854101105629410010175Escriba el modelo lineal, explique cada trmino, calcule elanlisis de varianza y muestre los cuadrados medios esperados.Pruebe la hiptesis nula Ho: 2 = 0 para los machos.(74) Los datos del ejercicio 3.5 corresponden a las concentraciones de colesterol en anlisis de laboratorio a 2 muestras de cada uno de 8 pacientes.Suponga un modelo aleatorio para el estudio. Escriba el modelo lineal, expliquecada trmino, calcule el anlisis de varianza y muestre los cuadrados medios esperados.Estime las componentes de la varianza para pacientes y muestras y determine intervalos de confianza medios al 90%.(75) Unpatlogodeplantastomcuatromuestras, de3libras cada una, de lotes de 50 toneladas de semilla de algodn acumulada en varias cosechas durante la temporada de limpia.Las muestras se analizaron en el laboratorio para buscar aflatoxin, que es una toxina producida por organismos asociados con las semillas.A continuacin se proporcionan las concentraciones de aflatoxin en partes por billn para las muestras de ocho lotes.Lote Afloxin (ppb)3469 723849 523721 243477 803669 723873 763777 803461 - 6439566429381123105713835566490116325882153345236631715181102037(76) Supongaqueloslotesysusmuestrassonefectosaleatorios.Escriba el modelo lineal para el estudio, explique los trminos,calcule el anlisis de varianza completo y muestre los cuadrados medios esperados.49Palacios C. Severo(77) Piense en problemas de investigacin en su rea de inters que requieran muestras (u observaciones) de la unidad experimental debido a que no sea posible medir la unidad en su totalidad.Escriba un modelo lineal para su estudio; identifique los trminos y bosqueje el anlisis de varianza, muestre las fuentes devariacin, losgradosdelibertadyloscuadradosmedios esperados.(78) Se realiz en conjunto un estudio sobre cartuchos para filtradodepartculasdealtaenerga, usadosenrespiradores comerciales para proteccin contra partculas de materia. Una pruebaespecficaincluytresfiltroselegidosal azardecada uno de dos fabricantes, se hicierontres rplicas de prueba independientes de cada filtro, las medidas fueron el porcentaje de penetracin por medio de una prueba estndar de aerosol.Fabricante I Fabricante IIFiltro 1 2 3 4 5 61,121,101,120,160,110,260,150,120,120,910,830,950,660,830,612,171,521,58Escriba un modelo lineal para este estudio, explique los trminos, calcule el anlisis de varianza y muestre los cuadrados medios esperados.Pruebe la hiptesis de que no existen diferencias entre la penetracin porcentual promedio de los filtros de los dos fabricantes.Calcule las medias, sus errores estndar y las estimaciones delintervalo de confianza de 95%para las medias de cada fabricante.(79) Uncientficodesuelosestudiel crecimientodeplantasde cebadaentres niveles diferentes de salinidadenunmedio controlado. Tena dos contenedores rplica de cada tratamiento,enundiseototalmentealeatorizadoymiditresplantasde cada rplica. Los pesos en seco de las plantas, en gramos, son los siguientes:Salinidad ContenedorPeso (g)Control6 barras12 barras12345611,297,375,644,204,833,2811,086,555,983,344,772,1611,108,505,694,215,662,6950ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraEscriba un modelo lineal para un anlisis de datos, explique los trminos, calcule el anlisis de varianza y muestre los cuadrados medios esperados.Pruebe la hiptesis de que no hay diferencia entre las medias de los niveles salinos.Calcule el error estndar de una media de nivel salino.Haga una particin de las sumas de cuadrados para la salinidad en dos sumas de cuadrados polinomiales ortogonales (lineal y cuadrtica), cada una con 1 grado de libertad y pruebe la hiptesis nula de que no hay regresin lineal o cuadrtica.(80) El ndice de porosidad es una medida usada por los cientficos de suelos para ayudar en la prediccin del movimiento,almacenamiento, disponibilidaddel aguaylascondicionesde oxigenacin del subsuelo. Un cientfico de suelos us un diseo de muestreo especial para tomar muestras del suelo de una de las granjas experimentales de launiversidadparamedir elndice de porosidad del suelo. Se hizo una particin de la granja encamposdeaproximadamente4hectreas, cadaunacon8 secciones.Elplandemuestreoincluyunaseleccinaleatoria de los campos dentro de las secciones.Acontinuacin se presenta el ndice de porosidad de cada sub muestra:CampoSeccinPorosidad CampoSeccinPorosidad12345678123456789101112131415163,8465,6295,0874,6214,4113,3573,9915,7665,6773,3334,3554,9402,9834,3965,6033,6833,7122,0216,2924,810910111213141517181920212223242526272829305,9425,0145,1434,0613,8354,5844,1934,1253,0743,4833,8674,2126,2474,7302,9644,398Suponga que todos los efectos son aleatorios. Escriba un modelo lineal para el estudio, explique cada trmino, calcule el anlisis devarianzaparalosdatosymuestreloscuadrados medios esperados.Estime las componentes de la varianza para campos, secciones y muestras.51Palacios C. SeveroXIII. DISTRIBUCIONESAl tratar con grandes cantidades de datos, es conveniente ordenarlos de tal manera que la frecuencia de la aparicin de rangos de valoresdados, puedan ser tabuladas y graficadas. Este ordenamiento se realiza estableciendo rangosllamados intervalos de clase la frecuencia relativa de los intervalos de clase se denomina distribucin emprica y se utilizan para estimar las distribuciones tericas.Ensayos estadsticosExistenvarios tipos de ensayos estadsticos que se empleanpara determinarsi ladiferenciaentredosconjuntosdevaloresesreal y significativa o a errores azarsticos.Ensayo tLa distribucin t de Student aparece al comprobar la hiptesisde la media de una totalidad general de distribucin normal siendo incgnita la varianza.52ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera211221) (nNXnanX f

`

(|+

`

(|

`

(| +Ejemplo 1.12Consideremos los datos del ejemplo 1.10, se tratade sabersi la diferencia entre el valor medio y el supuesto valor medio 96 es significativa.( )( )4:54 , 403 , 232 , 94GLHiptesisX SX SXo ( )82 , 0 t X SXtoEl valor tabulado de t para un nivel de significacin del 99% y 4 GL, es igual 3,75, como el valor calculado de t es inferior al valor tabulado, la hiptesis no es rechazada.Chi-cuadradoEstapruebapuedeutilizarseparacompararlosresultadosdeuna encuesta con frecuencia terica o esperada.( )22ff fXEjemplo 1.13Laalimentacindeflujocontinuoqueserealizaacuatroreactores industrialesquehansufridountotal decuarentafallasduranteun ao, la distribucin de las fallas, por bombas fue:Bomba 1: 16Bomba 2: 9Bomba 3: 653Palacios C. SeveroBomba 4: 9El capataz de mantenimiento sostiene que la bomba 1 hasufridoun nmero excesivo de fallas, en comparacin con los resultados posteriores se trata de saber si esta afirmacin es justificada.Comohaycuatro categoras posibles de nmerosy como elnmero total estdado, el nmerode GLes tres. Estocorresponde aun nmerodeprobabilidadesaproximadamenteigual a0,25eindica que, si todas las bombas operan en las mismas condiciones, el valordel Chi-cuadrado sera de 5,4 es decir una vez cada cuatro, por la sola accindel azar. Por lotanto laprobabilidadque lahiptesis de mantenimiento esta equivocado es del 25 por ciento en la poblacin,La prueba puede usarse siempre que los resultados, las respuestas o los encuestadores se pueden organizar en varias categoras.Distribucin FEl anlisis de varianza que se realiza mediante el ensayo F permite la separacin de la varianza total de un proceso, en sus componentes.Con el ensayo F el nmero de GL correspondiente a las dos varianzas no necesita ser idnticas.La mayora de los textos de estadstica tabulan valores de F para los niveles de probabilidad 0,05 y 0,01. El nmero de GL, con la varianza enel numerador, seindicanormalmenteenlapartesuperiordela tabla, mientras que el nmero de GL con la varianza en eldenominador se encuentra en la columna de la izquierda.Ejemplo 1.14Para un ensayo de laboratorio de rutina, se ha propuesto un procedimientoanalticosimplificado. Esnecesariodeterminarsi elprocedimiento propuesto arroja los mismos resultados que elconvencional, es decir, si los valores medios de un ensayo por duplicado son iguales y si la precisin del ensayo propuesto es igual alantiguo. Convencional Propuesto89,789,689,589,689,889,889,689,489,590,054ESTADISTICA EXPERIMENTALAplicada a ciencia e ingeniera89,789,2013 , 0 ) (464 , 89211X SGLX07 , 0 ) (66 , 89221X SGLXLos valores medios de las muestras con los dos mtodos son similares pero la diferencia con la varianza es significativa al nivel del 0,05 de probabilidad. Consultado la tabla de valores F indica el valor de 6,2 parael nivel deprobabilidadcorrespondienteyel nmerodeGL existente.Paradeterminarsi losvaloresdevariosconjuntosdemedicin, es necesario el clculo de varianza de los valores medios de los conjuntos. Si la varianza de los valores medios es slo normal resulta.Ejemplo 1.15Tresreactores ubicados en diferentes lugares, que emplean sin embargo el mismoproceso. Se deseasaber si los valores medios correspondientes a los tres reactores son similares.Entre valores medios( ) 825 , 32 X SEntre conjuntos( ) 3988 , 02 X S( )( )59 , 922 X SX SFReactor 1 2 310,410,011,811,211,612,412,911,99,8010,910,410,1Suma de conjunto 43,4 48,8 41,2Media 10,85 12,2 10,3 61 , 1490 /2K SC 96 , 1482 /2K X55Palacios C. Severo 2 , 14922XLa tabla F para los GL establecido indica los valores de4,26 y 8,02 respectivamente. Como el valor calculado es mayor que el valor tabulado, se concluye que los valores medios de los tres reactores son significativamente diferentes.Logaritmo normalLadistribucinlogartmicanormal es de ampliouso enlafsica estadstica, geologa estadstica, estadstica econmica, biologa.LogsticaLa funcin de distribucin se diferencia un poco de la funcin normalde distribucin, se utilizaenlas investigaciones mdico-biolgicas paraanalizarlaeficienciadediferentesmedicamentos, nutrientes,venenos, etc.ParetoLa distribucin de Pareto encuentra amplia aplicacin enlos problemas de la estadstica econmica.Weibull-GnedenkoSeusaconfrecuenciaenlateoradefiabilidadparadescribireltiempo de funcionamiento sin fallo de los instrumentos.PearsonSeusaampliamenteenlaestadsticamatemticaparasuavizarlas distribuciones de los datos empricos.XIV. INTERVALOS DE CONFIANZAEl desarrollo del anlisis estadstico implica la determinacinterica de la distribucin de ciertos valores, como el valor medio, la desviacin estndar y la varianza, que se puede esperar si slo acta alazar. Lateoraestadsticaconstituyeunaherramientapoderosa,para determinar, en un grado razonable de certidumbre, si las diferencias observadas son debidas al azar. Por definicin:Reordenando Intervalo de 56ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraconfianzaXnZ+tnX Z/ tPorlotanto,paraunciertonivel deprobabilidadquedeterminaelvalor de Z, puede afirmarse que el intervalo de confiabilidad de estar dado por,nZXnZX+ < < Si no se conoce la desviacin estndar verdadera, anpuede determinarse un intervalo de confiabilidad. Esta estimacin utiliza la distribucin t en lugar de la distribucin Z porque el concepto t incluye la variacin adicional introducida por la estimacin de la desviacin estndar, reordenando:( ) ( )nX tSXnX tSX + < < Ejemplo 1.16Establecerelintervalodeconfiabilidad paralamedia verdaderade los datos del ejemplo 1.10.( )6 , 4 78 , 254 , 4499 , 095 , 0ttX SGLNivel Intervalo% 95 ( )( ) 68 , 88 96 , 99 5 / 54 , 4 78 , 2 32 , 94 + t y% 99 ( )( ) 94 , 84 65 , 103 5 / 54 , 4 60 , 4 32 , 94 + t ySe observaqueparaunnivel de confiabilidaddel 95%serms correcto afirmar el resultado del anlisis como 5,64 por ciento en lugar de 94,32%.XV. MUESTREO57Palacios C. SeveroNadie necesita beber todo un vaso de leche daada para poder decir que esta mala - una muestra es suficiente.Realizar un muestreo es ms barato y ms rpido que hacer un censo detodaunapoblacin. Yenlamayoradeloscasos, desdeluego,tomar una muestra es la nica alternativa factible para la investigacin simplemente no es prctico pensar siquiera en encuestas a toda la poblacin. Pero si la muestra se desarrolla con propiedad,sta puede proporcionar suficiente precisin para propsitos de toma de decisiones.El muestreo en la investigacin requiere estas dos dimensiones:a) Seleccionar las unidades de la poblacin que se incluir en el estudio.b) Interpretar los resultados del estudioconel finde estimar los parmetros de la poblacin a partir de los datos de lamuestrayprobarhiptesis, usualmentesobreladiferencia entre dos muestras o entre una muestra y un resultado esperado.XVI. MTODOS DE MUESTREOHay dos grandes mtodos de muestreo:Probabilstico y no probabilstico.a) Muestreo probabilsticoEste es el tipo de muestreo ms objetivo y cientfico. Unrequisito delmuestreo probabilstico es que cada unidad en la poblacin tenga una probabilidad igual y conocida a ser seleccionada para la muestra. Elcriterio de investigador no debe influir en la seleccin de los informantes. Hay varias formas de muestreo:Muestreo simple al azarEs el tipo ms bsico. Implica seleccionar informantes completamente al azar; es tal comosi los nombres se sacarnde unsombrero.Obviamente,estorequiereunmarcodemuestreoperfecto;esdecir,una lista completa de todas las unidades en el universo.Muestreo estratificado al azar58ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraImplicaprimeroagruparlapoblacinensegmentoshomogneosy luego hacer el muestreo de datos de cada segmento o estrato.Muestreo de agregadosImplica tomar muestras de grupos de entrevistados como unidad y no como elemento individual. Con el fin de lograr eficiencia en entrevistas de muestreo a muestreo.Muestreo sistemticoSe incluye cada n-simo elemento de la poblacin en la muestra. Este es un procedimiento comn que se puede combinar con un muestreo de agregados y muestreo estratificado.La ventaja principal del muestreo probabilstica es su precisin. Es elmejorcaminoparadesarrollarunamuestraqueseaperfectamente representativa de la poblacin. El muestreo probabilstica tiene varias desventajas importantes que resulta su utilizacin amplia:a) Para seleccionar una muestraprobabilstica es necesario tener una lista o un marco de muestreo,correspondiente a toda la poblacin.b) Apesar de los mejores intentos de muestreo, los errores de no respuesta pueden afectar la precisin delresultado.c) El muestreo probabilstica es muy costoso de realizar,es especial para estudios de muestra a muestra.ErroresSi bienesciertoquebuenosmtodosdemuestreopuedenproducir resultados muy costosos, ninguna muestra es absolutamente precisa.Ejemplo 1.17Supongamos que una muestra probabilstica local indica que el 40% de los hogares entrevistados se tiene un gato para erradicar las ratas transmisoras del virus Hanta. Es poco probable que un censo de todos los hogares revele que exactamente en el 40% de ellos haya un gato. Sila muestra original fue bien tomada, bien ejecutada y fue suficientemente grande hay una buena probabilidad de que el nmero 59Palacios C. Severoreal de hogares con gatos, revelado al censo est cerca del 40%; pero probablemente no ser exacta mente esa cifra.Estoserroresodiferenciasentrelosresultadosdelaencuestaylas cifrascomparablesdelapoblacin, vienededosfuentes:factorde muestreo y factor no mustrales.Error de muestreoEnelejemplo1.17sobreposesindegatosesposiblemedirelerror muestral del estudio y anexar un lmite de confianza a la cifra de la encuesta, a fin de estimar los datos de la poblacin total.Supongamos que el estudio sobre la posesin de gatos ha utilizado una muestraprobabilsticade 1000hogares.Eneste casolacifrade40 por ciento de poseedores de gatos tendra un intervalo de ms o menos 3por cientoaunnivel deconfianzadel 95por ciento. Enotras palabras las probabilidades son95en100dequeel intervalode confianzaincluyael verdadero porcentaje de hogares que poseen gatos, en la poblacin total.Eso es el error de muestreo: el intervalo que debe anexarse a cualquier resultado de una encuesta, debido a que proviene de una muestra.Las muestras grandes tienenmenos errores de muestreo que las muestras pequeas.Error no muestralLa importancia y el impacto del error no muestral generalmente son sub-estimados por los investigadores, Entre los errores no mustrales se pueden mencionar lo siguiente:a) Incapacidad de localizar informantes correctos.b) Negativa de los informantes a empezar la investigacin.c) Terminacin de la encuesta por los informantes durantelainvestigacin porqueconsideran que esmuylarga,muy tediosa.d) Mentiras intencionales de los informantes. e)Mala memoria, suposiciones insesgadas.f) Mal entendimiento del procedimiento.g) Manipulacin por parte del investigador.60ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenierah) Sesgos introducidos por el investigador.i) Errores de anotacin.j) Errores de codificacin.Es decir, la precisin de los mejores mtodos de muestreo probabilstico pueden anularse por algn problema de alguna de ests reas. Sin embargo, el impacto de estos errores potenciales no mustrales en mayor parte se pasa por alto en todo muestreo. Para solucionar los errores mustrales, consiste bsicamente en una planeacin cuidadosa y una atencin estrecha a los detalles de realizacin del proyecto.Error en la prediccinEn un diagrama de dispersin en el que no todos los puntos caen en la lnea de regresin. Si todos los puntos hubiesen cado sobre la recta y si la cantidad de observaciones hubiera sido lo suficientemente grande, nosehabradadoerror enlaprediccindel proceso. La prediccin perfecta es prcticamente inexistente. An en los casos que nos ocupa, existen factores que no son de prediccin perfecta, quizs se deba a causas de imperceptibilidad en la composicin de los factores.Loquenecesita,entonces,esunamedidaquepudieraindicarhasta qu punto es precisa la prediccin de Y, basada en X, o viceversa, cun imprecisa podra ser. Esta medida se llama error de estimacin.( )( ) 22 NY YSpyxSyx representa la desviacin estndar de las Y sobre la base de las X.Esta medida de error es similar a la desviacin estndar que mide la dispersin alrededor de un promedio; el error de la estimacin mide ladispersinalrededor de unalneapromedio, llamadalneade regresin.b) Muestreo no probabilsticoExisten tres tipos de muestreo no probabilstica:Muestreo por conveniencia61Palacios C. SeveroDeja la seleccin de los informantes primordialmente a los investigadores.Muestreo por criterioImplica seleccionar nicamente cierto tipo de informantespara participar en el estudio.Muestreo por cuotasSe estructura la muestra de tal modo que incluya nmeros especficos de informantes con caractersticas que se sabe o se cree que afecta altema de la investigacin.XVII. TOMA DE DECISIONESLos ejecutivos de muchas empresas estn empezando a tomar en serio laimportanciadelasaproximacionescuantitativasenlatomade decisiones.Estees uncambioimportante. As probablementenoespor puro accidente que el tema est ganando importancia en la gestin empresarial - investigacin - consultora. El nfasis se debe alas herramientas estadsticas quereducenla incertidumbre de la toma de decisiones, con problemas que pueden ser parcialmente estructuradas.Estas herramientas intentan ir ms all que simplemente proporcioneninformacindel quetomeladecisin. El finesel de ayuda a que se pueda alcanzar una decisin reconociendo, por supuesto, el juicio profesional.Los problemas que se ajustan bien a los sistemas de tomade decisiones son aquellas en las que existe suficiente estructuracin de formaquelasayudasanalticasseandegranutilidadrequiriendo siempre el juicio del profesional.Unaspectomuyimportantedetomadedecisionesesquesedala efectividad ms que laeficiencia. Entonces hay que aumentar elnmero de posibles soluciones para que el ejecutivo pueda mejorar la efectividad de una decisin.62ESTADISTICA EXPERIMENTALAplicada a ciencia e ingenieraEl informe sobre evaluacin de los distintos resultados parala toma dedecisionescomounpuntoclaveparalaimplementacindelos grupos de trabajo que han de compartir la informacin.Distinguiendoespecialmentelastareasadministrativas-gestinde calendario - planificacin -agenda.Principios de decisinCuando existe una situacin en el cual se pueden distinguir dos o ms alternativos, una decisi