SEPARATA DE MÉTODOS_ESTADISTICOS-GP y EDUC..pdf
-
Upload
antonioorlando -
Category
Documents
-
view
71 -
download
4
Transcript of SEPARATA DE MÉTODOS_ESTADISTICOS-GP y EDUC..pdf
-
1
Mag. Rosa Vilchez Vsquez
SEMESTRE 2015-II
SEDE HUARAZ
-
2
INDICE
INTRODUCCION..03 I. ESTADISTICA DESCRIPTIVA
1. LA ESTADISTICA. 04 2. POBLACION.. 04 3. PARAMETRO 04 4. MUESTRA.. 04 5. ESTADISTICO.. 04 6. VARIABLE.. 04 7. EL METODO ESTADISTICO 05
II. MUESTREO 1. VENTAJAS DEL MUESTREO.. 10 2. TIPO DE MUESTREO.. 11
A) MUESTREO NO PROBABILISTICO.. 11 B) MUESTREO PROBABILISTICO 12
3. TAMAOS DE MUESTRA 13 PARA LA MEDIA POBLACIONAL... 13 PARA LA PROPORCION POBLACIONAL.... 14
4. AGRUPACION Y PRESENTACION DE DATOS.... 15 DISTRIBUCION DE FRECUENCIAS.... 16
5. REPRESENTACIONES GRAFICAS.. 17 6. MEDIDAS DE TENDENCIA CENTAL. 25 7. MEDIDAS DE DISPERSION. 26
III. PROBABILIDADES 1. EXPERIMENTO ALEATORIO.. 36 2. ESPACIO MUESTRAL. 32 3. PROBABILIDAD DE UN EVENTO ALEATORIO.. 33 4. PROBABILIDAD CONDICIONAL. 34 5. REGLA DE LA MULTIPLICACION 36 6. PRUEBA DE BAYES. 37
IV. PRUEBA DE HIPOTESIS 1. PRUEBA DE HIPOTESIS. 39 2. HIPOTESIS ESTADISTICAS 39 3. TIPOS DE ERRORES. 40 4. PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL 41 5. PRUEBA DE HIPOTESIS PARA LA COMPARACION DE MEDIAS DE DOS
POBLACIONALES.. 42 6. PRUEBA DE HIPOTESIS PARA LA PROPORCIN POBLACIONAL. 43 7. PRUEBA DE HIPOTESIS PARA LA COMPARACION DE PROPORCIONES DE
DOS POBLACIONES... 44 8. PRUEBA DE INDEPENDENCIA... 45
V. REGRESION Y CORRELACION LINEAL 1. INTRODUCCION.. 47 2. REGRESION LINEAL SIMPLE.. 48 3. COEFICIENTE DE DETERMINACION.. 48 4. CORRELACION LINEAL 49 5. PRUEBA DE HIPOTESIS PARA LA CORRELACION. 49 6. REGRESION LINEAL MULTIPLE 51
VI. TABLAS ESTADSTICAS: . 56
-
3
INTRODUCCIN
La estadstica es una ciencia con base matemtica referente a la recoleccin, anlisis e interpretacin de
datos, que busca explicar condiciones regulares en fenmenos de tipo aleatorio. Se considera un eje
transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, y es usada para
la toma de decisiones en reas de negocios e instituciones gubernamentales.
Es por ello que no existe posibilidad de tener sistemas eficientes de monitoreo y evaluacin de resultados
de la gestin pblica sin confiables y oportunos sistemas nacionales de estadstica, de all que esta
herramienta resulta fundamental para la Gerencia Pblica.
Existen bsicamente 4 niveles en la administracin pblica que producen y demandan informacin
estadstica: el estado, las comunidades autnomas, los estados y los municipios.
La estadstica mide intensidad, cambio, ubicacin y distribucin y su aplicabilidad permite generar,
formular, implementar y monitorear polticas, al mismo tiempo que sirve para declarar que una poltica
fue exitosa o que fue un fracaso.
La aplicabilidad de la estadstica permite obtener informacin oportuna, creble y relevante esencial para
mejorar el funcionamiento del sector pblico y privado en nuestro pas. La necesidad de datos de alta
calidad, producidos a tiempo, ampliamente accesibles, y que sean tiles para la gestin pblica se ha
vuelto una prioridad en la agenda del gobierno.
Este ejemplar se ha distribuido en ocho partes, que proporcionan los principios bsicos del curso de
Mtodos Estadsticos. Las primeras partes estn dedicadas a la Estadstica Descriptiva, la cual constituye
la base previa de cualquier anlisis estadstico considerando las Tcnicas de muestreo y la Regresin
Lineal y Correlacin.
En las dos ltimas partes, estn dedicadas al estudio de la Inferencia Estadstica, comprendiendo tcnicas
como loa estimacin por intervalos y el contraste de hiptesis, con objeto de proporcionar al participante
instrumentos para la toma de decisiones cuando prevalece el azar.
-
4
I. ESTADISTICA DESCRIPTIVA
1. LA ESTADSTICA: La Estadstica es una ciencia que trata de la recoleccin, organizacin, presentacin
y anlisis de datos con el fin de realizar una toma de decisiones ms adecuada.
2. POBLACIN: Una poblacin es un conjunto de elementos (que consiste de personas, objetos, etc.),
que contienen una o ms caractersticas observables de naturaleza cualitativa o cuantitativa que se
pueden medir en ellos.
Las poblaciones se clasifican: por extensin y por el objeto de estudio;
POR EXTENSIN: las poblaciones pueden ser:
a) Poblacin finita: cuando los elementos son numerables.
b) Poblacin infinita: cuando no se puede determinar el ltimo elemento.
POR EL OBJETO DE ESTUDIO: las poblaciones pueden ser:
a) Poblacin objeto: es la totalidad de elementos en discusin y acerca de los cuales
necesitamos informacin. Ejemplo: Poblacin de estudiantes universitarios
b) Poblacin muestreada: Es la que restringe solo al conjunto de la cual se obtiene la muestra.
Ejemplo: Poblacin de estudiantes de pre-grado de contabilidad de la UNASAM
matriculados en el semestre 2014-I.
3. UNIDAD DE ANLISIS: Es el objeto del cual se desea obtener informacin. Muchas veces nos
referimos a las unidades de anlisis con el nombre de elementos. Una poblacin puede definirse
como el conjunto de unidades de anlisis.
4. PARAMETRO: Es una medida descriptiva que resume una caracterstica de la poblacin, tal como la
media poblacional (), la varianza poblacional (2) o la proporcin poblacional (P); calculado a partir
de los datos observados de toda la poblacin.
5. MUESTRA: Es un subconjunto que seleccionamos de la poblacin de acuerdo a un plan de muestreo
y cumple con dos caractersticas de ser representativo y adecuado.
6. ESTADISTICO: Es una medida descriptiva que resume una caracterstica de la muestra, tal como la
media muestral (), la varianza muestral (S2) o la proporcin muestral (), calculada a partir de los
datos observados de una muestra aleatoria.
7. VARIABLE: es una caracterstica definida en la poblacin por la investigacin estadstica, que puede
tomar dos o ms valores (cualidades o nmeros).
-
5
Las variables pueden ser de dos tipos,
Segn su naturaleza:
7.1 Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo:
nacionalidad, color de la piel, sexo, ocupacin, opinin sobre un servicio, etc).
Nominal.- Los elementos solo pueden ser clasificados en categoras pero no se da un
orden o jerarqua.
Ordinal.- Existe un orden o jerarqua entre las categoras.
De intervalo.- Establece la distancia entre una medida y otra. Carece de un cero
absoluto.
De razn.- Es posible establecer la proporcionalidad. Existe el cero absoluto. Se permiten
todas las operaciones aritmticas.
7.2 Variables cuantitativas: utiliza un instrumento de medicin, tienen valor numrico
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: tamao
familiar, nmero de empresas que no cumplen las normas de saneamiento ambiental,
etc.
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
ingreso familiar, peso, talla, presin sangunea, temperatura, etc.
Segn su funcin:
7.3 Variable independiente: Es aquella caracterstica o propiedad que se supone es la causa
del fenmeno estudiado.
7.4 Variable dependiente: Es el factor que es observado y medido para determinar el efecto
de la variable independiente.
8. EL METODO ESTADISTICO:
Existe similitud entre el mtodo estadstico y el mtodo cientfico, por lo que consta de cuatro
etapas: planteamiento, recoleccin de datos, procesamiento y anlisis e interpretacin.
Etapa 1. PLANTEAMIENTO
En esta etapa se disea la investigacin en todos sus aspectos:
Formulacin del problema de investigacin
Se fijan los objetivos
-
6
Se plantean las hiptesis
Definicin de trminos y variables
Se define la metodologa del estudio: tipo de estudio, poblacin, diseo muestral,
tcnicas de procesamiento y anlisis de datos.
Se define el cronograma, presupuesto y financiamiento del estudio.
DEFINICION DE TERMINOS Y VARIABLES (OPERACIONALIZACION DE VARIABLES)
Es la definicin conceptual y operacional de las variables, pasando de un nivel abstracto a un
nivel concreto y especifico a efectos de poder observarla, medirla o manipularla, con el
propsito de contrastar la hiptesis. Se debe de precisar el significado de las variables en estudio
y como se miden.
Las variables deben ser descompuestas en dimensiones y estas a su vez traducidas en
indicadores que permitan la observacin directa y la medicin
Procedimiento para operacionalizar las variables:
Identificacin de las variables (reconoce el tipo de variable)
Definicin conceptual (depende del enfoque terico y las hiptesis que se plantea)
Definicin operacional (seala su dimensin)
El indicador (sub-variable que se pueda observar, medir, controlar, manipular o evaluar.
Los indicadores cumplen las siguientes funciones:
- Sealar con exactitud la informacin que se desea recoger.
- Indicar las fuentes a las que se debe recurrir.
- Ayudar a determinar y a elaborar los instrumentos de recoleccin de datos.
Etapa 2. RECOLECCION DE DATOS
La recoleccin de datos se refiere a los mtodos usados para obtener informacin
pertinente de las unidades de anlisis introducidas en una muestra o en una poblacin.
A esta etapa tambin se le conoce como Recopilacin de datos
A) METODOS DE RECOLECCION DE DATOS
Se refiere a los instrumentos a aplicar en la poblacin o muestra.
Censo: Cuando se recoge datos de todos los elementos de la poblacin.
Encuesta: Cuando se recoge datos de una muestra de la poblacin.
-
7
B) TECNICAS DE RECOLECCION DE DATOS
Son aquellas que provienen de las fuentes originales y se recopilan directamente en el campo
especfico. Las tcnicas que se emplean son:
Observacin
Entrevista (por cuestionario, por telfono, por correo)
Experimento
Registros documentarios, entre otros
C) FUENTES DE RECOLECCION DE DATOS
Primarias: Son aquellas que provienen de las fuentes originales y se recopilan directamente en
el campo especifico.
Secundarias: Cuando los datos obtenidos fueron previamente recogidos y procesados por
otros individuos (textos, revistas)
Ejemplos:
Portal del Estado Peruano. www.peru.gob.pe/
Instituto Nacional de Estadstica e Informtica. www.inei.gon.pe/
Ministerio de Trabajo. www.mintra.org.pe
Ministerio de Educacin. www.minedu.org.pe
D) ERRORES EN LA RECOLECCION DE DATOS
Los errores que pueden cometerse en la recoleccin de datos de una investigacin dependen
de:
El observador. Se refiere al nivel diferente de preparacin o entrenamiento de los
observadores, el estado fsico, condiciones de trabajo de la persona que realiza la
observacin; estos aspectos pueden distorsionar la medicin de los registros y
caractersticas estudiadas.
El mtodo de observacin. Se refiere a la calibracin y a la utilizacin de diferentes
mtodos y tcnicas de recoleccin de datos, tanto de los entrevistados como de los
instrumentos utilizados para realizar mediciones.
El objeto o individuo observado. En algunas ocasiones los individuos al sentirse
observados, cambian sus actitudes, hbitos o conductas.
E) INSTRUMENTOS DE RECOLECCION DE DATOS
Cuestionarios
Test
Fichas
-
8
Guas
Listas de cotejo
F) DISEO DE CUESTIONARIOS
El cuestionario es un instrumento de investigacin, es un medio til y eficaz para recoger
informacin en un tiempo relativamente breve. Este instrumento se utiliza de un modo
preferente en el desarrollo de muchas investigaciones.
En su construccin pueden considerarse preguntas cerradas, abiertas o mixtas.
Preguntas abiertas (no estructuradas). El encuestado responde con sus propias palabras
a la pregunta formulada.
Ejemplos:
Qu opinin tiene de la biblioteca?..............................................................
Qu ms le gusta de la biblioteca?...............................................................
Preguntas cerradas (estructuradas). Cuando la pregunta establece varias respuestas, de
las cuales el encuestado elegir segn le corresponda.
Ejemplos:
Sexo: Femenino ( ) Masculino ( )
El personal de la biblioteca del colegio es amable al atender a los estudiantes y docentes
1) Muy en desacuerdo 2) En desacuerdo 3) Ni de acuerdo, ni en
desacuerdo 4) De acuerdo 5) Muy de acuerdo
G) REQUISITOS DEL INSTRUMENTO DE MEDICIN
VALIDEZ. Representa el grado en que un instrumento realmente mida la variable que
pretende medir. Medida por expertos o jueces
CONFIABILIDAD. Es una medida que asegura su repetitividad con los mismos resultados.
Mtodos de mitades partidas, coeficiente de Cronbach, coeficiente KR-20 (variable tipo
binomial-dicotmica)
Etapa 3. PROCESAMIENTO
Es necesario la depuracin de los datos recogidos Representarlos en tablas y grficos estadsticos para facilitar los anlisis.
Etapa 4. ANALISIS E INTERPRETACION
Determinacin de los parmetros y estadsticos muestrales para las estimaciones, el ajuste de modelos y las pruebas de las hiptesis planteadas
Establecer y redactar las conclusiones definitivas.
-
9
Ejemplos de modelos de encuestas:
1. ENCUESTA DE LA COMERCIALIZADORA UNIPEZ S.R.
Se est realizando un estudio de mercado con el objetivo de analizar informacin para la toma de decisiones con respecto a la venta de la conserva de pescado BELLS con verduras. Para lo cual se ha encuestado a un grupo de amas de casa de una localidad urbana, para conocer el consumo de conservas enlatados. I. DATOS GENERALES
Edad: ________________
Sexo: Masculino.. 1 Femenino.. 2
Zona Geogrfica: Urbanizacin: __________________________
II. INSTRUCCIONES: Lea atentamente cada interrogante y conteste de manera clara y veraz. Gracias. 1. Consume usted conserva de pescado, es decir pescado en lata?
SI1 NO 2 2. Si su respuesta fuese SI Qu marca de conserva de pescado consume con mayor
frecuencia? A1.1 Gloria.4 Compass..2 Fanny.5 Campomar.3 Otros..6
3. Con respecto a la marca que Ud. utiliza, Cmo lo calificara su calidad?: Baja....1 Media... 2 Alta.... 3
4. Dnde adquiere Ud. dicha marca de conserva de pescado? Supermercados.1 Mercado.2 Bodegas....3
5. Indique Ud. en ORDEN DE IMPORTANCIA, los atributos que influyen en su decisin de compra, siendo : 1 Muy importante; 2 Importante; 3 Indiferente; 4 Poco importante; 5 Insignificante
1 2 3 4 5
Calidad
Precio
Presentacin
Sabor
Marca
6. Con qu frecuencia consume usted conserva de pescado? 1 2 veces a la semana..1 2 3 veces a la semana..2 3 4 veces al mes.....3 6 o ms veces al mes...4
7. En qu cantidad, en unidades, compra usted la conserva de pescado? 1 lata. 1 3 latas... 3 2 latas... 2 4 a ms..... 4
8. A qu precio compra usted la conserva de pescado?
-
10
s/.3.00 1 s/. 3.50 ... 2 s/.4.00 ... 3 s/.4.50 a ms 4
9. Con respecto al Producto que Ud. adquiere, su grado de satisfaccin es: Muy satisfechos...1 Poco satisfecho.4 Satisfecho..2 Insatisfecho.5 Indiferente.3
10. Usted ha probado una Conserva de Pescado con verduras, la cual est incluida dentro de la conserva?
SI..1 NO2
11. Si entrara al mercado una nuevo distribuidor UNIPEZ SRL, y este le ofreciera un producto de calidad, especficamente, conservas de pescado, pero que contenga verduras, estara dispuesto a adquirir este producto:
Muy dispuesto..1 Dispuesto..2 Indiferente..3 Poco Dispuesto.4 Indispuesto..5
12. Usted, comprara BELLS VERDURAS, a la distribuidora UNIPEZ SRL:
SI..1 NO.......2
13. Cunto estara dispuesto a pagar por este producto, sabiendo que es una conserva con trozos de pescado y vegetales, listo para comer?
s/.3.50 . 1 s/. 4.00 ... 2 s/.4.50 . 3 s/.5.00 a ms 4
14. Dnde le gustara encontrar este producto? Supermercados.....1 Mercado..2 Bodegas..3
15. Cul es el medio de comunicacin por el cual Ud. adquiere mayor informacin sobre las
conservas de pescado? a) Televisin ( ) d) Revistas ( ) b) Radio ( ) e) Afiches ( ) c) Boletines ( )
16. Qu tipo de promociones le gustara que se promoviera, para la adquisicin de dicho producto?
a) Ofertas ( ) c) Descuentos ( ) b) Degustaciones ( ) d) Sorteos ( ) e) Otros (especifique):.......................................................
II. MUESTREO
Es el proceso de seleccin de una parte representativa de la poblacin que permita estimar los
parmetros de la poblacin.
1. VENTAJAS DEL MUESTREO
-
11
- Proporciona informacin confiable con costos mucho menores que las de un censo.
- Los datos se pueden reunir ms rpido.
- Las estimaciones con frecuencia son mucho ms precisas que las basadas en un censo.
- Permiten inferir la realidad sin necesidad de estar examinando a toda la poblacin.
2. TIPOS DE MUESTREO
A. MUESTREO NO PROBABILISTICO
En el proceso de seleccin de la muestra hay un juicio personal. No es posible evaluar la
probabilidad de inclusin de cada elemento en la muestra.
MUESTREO POR CONVENIENCIA
Se usa por razones de comodidad o por acceso factible. Por ejemplo realizar una
encuesta en una de las secciones de un determinado grado de estudios porque es la
seccin que tiene a su cargo el docente.
MUESTREO DE JUICIO O INTENCIONAL
Los elementos de la muestra se espera que sirvan para un propsito de la
investigacin.
Ejemplo una encuesta a personas de 20 a 25 aos referente a la msica de moda
juvenil.
MUESTREO DE CUOTA
Es una muestra no probabilstica de manera que la proporcin de elementos con
ciertas caractersticas estn representados en el grado que al investigador lo
considere. Por ejemplo a un entrevistador en una ciudad en particular se le asigna 100
entrevistas 45 para celulares de la empresa A 30 para celulares de la empresa B y 25
para celulares de la empresa C.
MUESTREO DE BOLA DE NIEVE:
En este tipo de muestreo cada unidad muestral es localizada por indicacin de otra
persona se caracteriza porque hay comodidad en la seleccin de la muestra no tiene
por qu ser rpida ni cmoda el muestre bola de nieve se emplea cuando se trata de
estudiar poblaciones muy especializadas, que son difciles de localizar por no existir
censos o ser inaccesibles y cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos, etc. Se trata cuando se busca
-
12
estudiar poblaciones pequeas y difcilmente localizables. Por ejemplo la poblacin de
personas que practican el deporte de esgrima en el puerto de Veracruz, puede no estar
censado, por lo cual se busca a una persona o profesor que practica dicho deporte, se
entrevista, y despus se le pregunta dnde y cmo localizar a otros que practican el
mismo deporte y as se contina el muestreo sucesivamente. Identificar una muestra de
dueos de perros pequineses. Identificar una muestra de aficionados al parapente.
B. MUESTREO PROBABILISTICO
MUESTREO ALEATORIO SIMPLE (MAS)
Es el muestreo mediante el cual todas las unidades de la poblacin tienen la misma
probabilidad de constituir la muestra, para evitar la participacin subjetiva, que cambien
la igualdad de oportunidad que tiene cada elemento, se utiliza los nmeros aleatorios o
cualquier tipo de proceso aleatorio.
Ventajas:
Sencillo y de fcil comprensin
Calculo rpido de medias y varianzas
Se basa en la teora estadstica y por tanto existe paquetes informticos para analizar
los datos.
MARCO MUESTRAL: la palabra marco se usa ampliamente en lugar de listas de muestreo
(poblacin muestreada)
NMEROS ALEATORIOS: Las tablas de nmeros aleatorios son tablas de dgitos del 0, 1,
2,, 9 donde cada digito tiene la misma probabilidad de ser elegido o seleccionado en cada
extraccin. Entre las tablas ms grandes estn las que publico la Rand Corporation (1955)
con milln de dgitos y las de Kendall y Smith (1938) con 100,000 dgitos.
USOS DE LA TABLA DE NMEROS ALEATORIOS: Cuando se usan las tablas de nmeros
aleatorios para seleccionar una muestra se debe tener en cuenta los siguientes pasos:
1. Se determina el tamao de la poblacin N (cuantos dgitos tiene la poblacin).
2. La tabla de nmeros aleatorios se sectoriza en filas y columnas (nmero de dgitos de
la poblacin).
3. Se busca un inicio cualesquiera de la forma matricial.
-
13
4. Los nmeros son seleccionados sin repeticin en el rango entre 1 y N
NUMEROS ALEATORIOS:
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
3251 8902 8843 2103 8567 8131 8116 5270 5994 9092
3. TAMAOS DE MUESTRA:
Para determinar el tamao de muestra se debe tener en cuenta la ecuacin fundamental del
muestreo:
Precisin: Es la diferencia en trminos de probabilidad entre el parmetro y su estimador (e).
Nivel de confianza: Es la probabilidad de que la estimacin efectuada se ajusta a la realidad. Es
el punto crtico de la normal (z) que cuantifica la relatividad del error
Nivel de confianza (1-) 99.73% 99% 95% 90% 80%
Valores de Z 3.00 2.58 1.96 1.645 1.28
CALCULO DEL TAMAO MUESTRAL
Tamao de muestra para estimar la media poblacional :
Poblacin infinita o finita muy grande.
Poblacin finita, cuando se conoce el tamao de la poblacin.
-
14
n : tamao de la muestra.
N : tamao de la poblacin
Z : valor crtico normal que depende del nivel de confianza.
2 : varianza poblacional.
E : margen de error o nivel de precisin.
Tamao de muestra para la estimacin de la proporcin poblacional:
Poblacin infinita o finita muy grande.
Poblacin finita, cuando se conoce el tamao de la poblacin.
n : tamao de la muestra
N : tamao de la poblacin
Z : valor crtico normal que depende del nivel de confianza.
P : proporcin de la poblacin que tienen la caracterstica de inters. Q = 1 - P
Ejemplos:
1. En una ciudad se desea conocer el nmero promedio de oportunidades de trabajo que los
pobladores mayores de 20 aos han intentado en diferentes instituciones hasta lograr un
trabajo estable. Por estudios anteriores se sabe que la desviacin estndar es 2 veces
(oportunidades) y que la poblacin para el estudio es 20550. Cuntas personas deben de
considerarse en la muestra para que con un error de 0,08 se obtenga los resultados con una
confianza del 95%?
Solucin:
N = 20500
Z = 1,96
E = 0,08
= 2
-
15
= 2150
Se requiere una muestra de 2150 personas, como mnimo.
2. Una organizacin de apoyo desea saber la proporcin de estudiantes con problemas de
aprendizaje en un determinado lugar para implementar un programa de actualizacin
educativa. Qu tamao de muestra ser necesario para realizar el estudio si se considera
un error de estimacin del 5%, P = 0,4 y una confianza del 95%?
Solucin:
P = 0,4; Q = 0,6
Z = 1,96
E = 0,05
n = 369
El tamao de muestra necesario es 369 estudiantes.
PROCEDIMIENTOS PARA OBTENER MUESTRAS PTIMAS
1. Primero se obtiene 0
2. si 0
10%, entonces 0 es optimo.
3. si 0
> 10%, entonces se corrige con el muestreo sin reemplazo donde n es
optimo
=0
1 +0
;
=0
1 +0 1
;
4. AGRUPACION Y PRESENTACION DE DATOS
-
16
La informacin que se recolecta, antes de ser organizada y analizada se conoce como datos sin
procesar. Ejemplo la edad, condicin laboral, tiempo de servicio, sueldo mensual y actitud frente al
trabajo de los 150 empleados de una empresa. Una forma de organizar los datos es
presentndolos en una tabla o distribucin de frecuencias.
DISTRIBUCION DE FRECUENCIAS
Es una forma de presentar los datos organizados en filas y columnas para facilitar la descripcin del
comportamiento de la variable de inters. Despus de recoger la informacin, se clasifica y ordena
en una tabla de frecuencias o tabla estadstica.
Ejemplo 1.
La informacin siguiente son edades de 30 profesionales que asisten a la Escuela de Postgrado de la
UCV.
45 32 43 40 28 36
47 41 50 37 34 59
25 45 48 42 51 50
30 48 41 35 40 55
37 24 45 47 45 49
Rango: R = max min = 59 24 = 35
El nmero de intervalos segn sturges es :
K = 1 + 3,3 log 30 (log 30 = 1.48)
K = 5,87 6 intervalos
Amplitud Intervlica: =
=
35
6= 5,83 6
Teniendo en cuenta esta amplitud formamos 6 intervalos o clases, en la primera columna de
la tabla y, si es necesario, se calculan los puntos medios o marcas de clase para cada clase.
=+
2
Li = lmite inferior de clase Ls = lmite superior de clase
Frecuencias absolutas
-
17
Frecuencia absoluta simple (fi) es el nmero de veces que aparece cada observacin en el
conjunto de datos originales, la suma de todas las frecuencias absolutas es igual al tamao de la
muestra o poblacin, segn sea el caso ( fi = n). Las frecuencias absolutas acumuladas (Fi) se
obtienen acumulando las frecuencias absolutas simples, excepto la primera frecuencia (F1 = f1).
Frecuencias relativas
Frecuencia relativa simple (hi) es la proporcin que existe entre la frecuencia absoluta simple y
el tamao de muestra hi = fi/n, hi = 1. Para obtener las frecuencias relativas acumuladas (Hi),
se acumulan las frecuencias relativas simples, excepto la primera frecuencia (H1 = h1).
Algo importante a tener en cuenta es que, en la prctica cuando se publica una tabla,
generalmente no se requieren utilizar o presentar los diferentes tipos de frecuencias
mencionados. Lo usual es considerar slo las frecuencias absolutas, los porcentajes simples y,
cuando es pertinente, los porcentajes acumulados. Asimismo, se debe utilizar la simbologa
estadstica slo cuando sea estrictamente necesaria y siempre indicar la fuente de origen de los
datos. Tambin es importante sealar que las tablas deben tener un nmero que las identifique
y su correspondiente ttulo, claro y preciso.
Tabla 1.
Edades de 30 profesionales de la Escuela de Postgrado de la Universidad Csar
Vallejo Edad Xi N de Profe-
sionales Fi hi Hi % %
acumulado 24 a menos de 30
30 a menos de 36
36 a menos de 42
42 a menos de 48
48 a menos de54
54 a menos de 60
27
33
39
45
51
57
3
4
7
8
6
2
3
7
14
22
28
30
0,10
0,13
0,23
0,27
0,20
0,07
0,10
0,23
0,46
0,73
0,93
1,00
10
13
23
27
20
7
10
23
46
73
93
100 Total 30 1,00 100
Fuente. Base de datos de la Escuela de Postgrado
Segn la informacin que presenta la tabla 1, la clase de edad ms frecuente es la de 42 a
menos de 48 aos, con el 27% de profesionales, le sigue la clase de 36 a menos de 42 aos con
el 23 % de profesionales y la clase de edad menos frecuente es la de 54 a menos de 60 aos con
un 7% de profesionales. Asimismo, el 73% de los profesionales tienen edad menor de 48 aos.
-
18
Como se dijo anteriormente, en la prctica al presentar esta tabla para difusin, se consideraran
slo la primera, tercera, penltima y ltima columna y se agregara la fuente de donde provienen
los datos. Adems se debe remplazar fi por n de profesionales.
5. REPRESENTACIONES GRFICAS
Histograma de frecuencias
Se caracterizan por considerar rectngulos adyacentes teniendo como base la amplitud de cada
intervalo y como altura las frecuencias. A continuacin se presenta el histograma de frecuencias
simples correspondiente a la tabla 1.
Polgono de frecuencias
Se grafica teniendo en cuenta los puntos medios o marcas de clase y las frecuencias
correspondientes. El polgono simple para la tabla 1 es el siguiente.
En su presentacin, para difusin, los grficos deben tener, como la tabla, n, ttulo y fuente.
Ejemplo 2.
3 24 0 36 42 48 54 X
fi
5
57 33 39 45 51 27
X
fi
5
-
19
Se ha clasificado a 20 individuos (n=20 y k=4), segn su nivel de estudios que puede
tomar valores: Nivel de estudios
1 Sin estudios
2 Primarios
3 Secundarios
4 Superiores
y se han obtenido los siguientes datos: 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3
Frecuencias absolutas:
f1=3; f2=7; f3=6; f4=4
= + + + = + + + =
Frecuencias relativas:
=
= . ; =
= . ; =
= . ; =
= .
+ + + = . + . + . + . = .
Distribucin de frecuencias:
Tabla 2
Nivel de estudios de un grupo de individuos que
laboran en la UGEL. Huaraz Categoras fi hi Fi
Sin estudios 3 0,15 3
Primaria 7 0,35 10
Secundaria 6 0,3 16
Superior 4 0,2 20
Total n=20 1
Fuente: Resultados de encuesta aplicado a los individuos
La categora ms frecuente es la de estudios primarios y la menos frecuente la de sin estudios.
REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS
-
20
a) Grfico de barras: Cada barra representa una categora, puede representarse en forma
absoluta o porcentual; de la tabla 2 obtenemos la siguiente grfica de barras.
Grfico N 3. Nivel de estudios de un grupo de individuos que
laboran en la UGEL. Huaraz
b) Grfica Circular: Llamada tambin de sectores o de pastel, resulta til para representar una
distribucin de frecuencias porcentuales. Se puede preferir al grfico de barras, cuando el n de
categoras no es muy grande. A partir de la tabla 2, se obtiene el siguiente grfico circular.
Grfico N 4. Nivel de estudios de un grupo de individuos que laboran en la UGEL. Hz.
Ejemplo 3:
Se aplic una encuesta a 27 trabajadores de la empresa ANITA y se les pregunto su edad, los
datos obtenidos fueron:
30 26 29 27 31 22 29 17 21
36 41 30 21 36 26 18 31 23
27 29 19 17 23 29 30 24 29
a) Identificar: poblacin, muestra, unidad estadstica, variable y tipo de variable.
0%
5%
10%
15%
20%
25%
30%
35%
Sin estudios Primarios Secundarios Superiores
15%
35% 30%
20%
Sin estudios, 15%
Primarios, 35%
Secundarios, 30%
Superiores, 20%
-
21
Poblacin : Todos los trabajadores de la empresa Anita
Muestra : 27 trabajadores
Unidad estadstica : Un trabajador
Variable : Edad
Tipo de variable : Cuantitativa-continua.
b) Construir una tabla de distribucin de frecuencias adecuada.
Rango = Dato mayor-Dato menor, R= 41-17= 24
- Determinar el valor de k (nmero de intervalos):
Ley de Sturges: k = 1+3.3 log (n) (muestra)
K = 1+3.3 log (27)= 5.7 6 (redondeando al entero)
k= 5 < n
-
22
Creamos etiquetas:
Analizar Estadsticos descriptivos frecuencias
y arrastrar la nueva variable y aceptar
Edad de los trabajadores (agrupado)
Marca de
clase
Frecuencia Porcentaje Porcentaje
vlido
Porcentaje
acumulado
Vlidos
17-21 19 4 14,8 14,8 14,8
21 - 25 23 6 22,2 22,2 37,0
25 - 29 27 4 14,8 14,8 51,9
29 - 33 31 10 37,0 37,0 88,9
33 - 37 35 2 7,4 7,4 96,3
37-41 39 1 3,7 3,7 100,0
Total 27 100,0 100,0
-
23
c) Interpretar: f2; h3 ; h1 % ; F4
f2 = 6 seis trabajadores tienen desde 21 aos pero menos de 25 aos
h3 = la proporcin de trabajadores que tienen de 25 aos pero menos de
29 aos es de 0.148
h1% = 14.8%, el 14.8% de los trabajadores tienen de 17 a menos de 21 aos.
Grfica del Histograma:
Analizar Estadsticos descriptivos Frecuencias
Seleccionar la variable a graficar y desactivar mostrar tabla de frecuencia
Seleccionar grficos Tipos de grficos Seleccionar Histogramas, mostrar
curva normal, continuar y aceptar.
POLIGONO DE FRECUENCIA
-
24
Segn la grfica se observa que del segundo y cuarto intervalo del grupo de edades de los
trabajadores, representados 21 a 25 aos y de 29 a 33 aos respectivamente; corresponden
a un 22.2% y 37.0% lo que equivalen a ms del 50% de los trabajadores.
EJERCICIOS DE REPASO N 1
1. Las edades de los 50 integrantes de un programa social municipal son:
75 92 65 64 82
94 74 83 78 51
80 78 44 88 84
60 65 63 76 68
51 72 40 83 70
56 60 91 61 45
66 67 51 64 50
75 62 85 69 48
42 41 88 95 70
53 55 71 80 43
a) Construir distribuciones de frecuencias con 7 clases y calcular los porcentajes simples y
acumulados.
b) Graficar los histogramas de frecuencias absolutas y porcentuales simples y los polgonos
correspondientes.
c) Interpretar la segunda frecuencia absoluta simple, el tercer % simple.
d) Interpretar los porcentajes acumulados tercero, cuarto y quinto.
2. El nmero de minutos que les toma a 30 empleados de una institucin en llegar desde su casa a su centro de trabajo son:
40.3 40.1 41.6 25.4 26.3
20.5 28.3 35.5 38.2 40.2
50.5 48.5 28.0 42.5 39.5
35.7 14.0 50.2 50.0 20.3
30.4 17.2 30.3 41.7 17.2
25.2 20.8 36.5 38.5 40.5
a) A partir de los datos elabore una distribucin de frecuencias con intervalos de clases iguales.
b) Calcular los porcentajes simples y acumulados.
-
25
c) Interpretar dos porcentajes simples y dos acumulados.
d) Graficar el histograma y polgono de frecuencias
3. Los siguientes datos representan los tamaos de 40 familias que residen en la ciudad.
4, 7,10, 8, 10, 6, 7, 5, 6, 10, 3, 2, 4, 3, 5, 4 5, 6, 6, 4,
12, 6, 8, 9, 3, 5, 8, 4, 5, 3, 7, 5, 10, 4, 6, 3, 12, 8, 4, 5.
a) Construya una tabla de frecuencias para estos datos.
b) Representar la informacin mediante el grfico de barras.
6. MEDIDAS DE TENDENCIA CENTRAL:
MEDIA ARITMETICA.- La media aritmtica es la suma de los valores observados dividido entre el
nmero de observaciones. La media aritmtica de una muestra se obtiene mediante
=
datos no tabulados (I)
=
datos tabulados (II)
= valores de la variables o puntos medios
=
Debe tenerse presente que cuando se calcula la media aritmtica con la frmula (II) y los datos estn
agrupados en clases, el promedio que se obtiene es aproximado.
MODA.-Moda es el valor ms comn en una distribucin. Si se trata de una tabla de datos agrupados
en clases, tambin se puede hallar la clase modal.
MEDIANA
Se ubica en la posicin central que ocupa el orden de su magnitud, dividiendo la informacin en dos
partes iguales, dejando igual nmero de datos por encima y por debajo de la mediana.
CUARTILES
Son tres valores posicionales que dividen a la distribucin o conjunto de datos ordenado en cuatro
partes iguales: 1; 2 3
Ejemplo 4:
Las puntuaciones obtenidas en una muestra de 10 participantes en un torneo de ajedrez en base a 100
puntos como mximo son:
70, 80, 50, 95, 75, 65, 90, 85, 60, 90
-
26
a) La puntuacin promedio es:
= 76 puntos
b) El puntaje que se presenta con mayor frecuencia es 90 puntos que representa la moda.
c) Cul es la mediana?
Ordenando los datos en forma ascendente se obtiene:
50; 60; 65; 70; 75; 80; 85; 90; 90; 95
Como el tamao de muestra es 10 (n par) la mediana es:
Me =
El 50% de los participantes en el torneo de ajedrez obtuvieron puntajes menores de 77.5
7. MEDIDAS DE DISPERSIN
RANGO O RECORRIDO
Es la diferencia entre el valor mximo y el valor mnimo de la distribucin: R = max min.
VARIANZA
Es la media de los cuadrados de las desviaciones de los valores de la variable respecto a la media
aritmtica.
Varianza Poblacional:
2 =( )
2
Varianza Muestral:
2 =( )
2
1 , para datos no tabulados
2 =( )
2 1
, para datos tabulados
DESVIACION ESTANDAR
Es la raz cuadrada de la varianza. La desviacin estndar es: = 2
-
27
COEFICIENTE DE VARIACION
El coeficiente de variacin considera la desviacin estndar con la media aritmtica para
establecer un valor relativo que hace comparable el grado de dispersin entre dos o ms
variables o distribuciones de una misma variable. Se utiliza con frecuencia para medir el grado
de homogeneidad o heterogeneidad de un conjunto de datos.
S CV =
X
Para los datos del ejemplo 4:
2 =1940
9= 215.56
= 215.56 = 14.6818
=14.6818
76= 0.1932
La dispersin de las puntuaciones obtenidas por los participantes en ajedrez es
aproximadamente 15 puntos. La variacin relativa es 19,3%. Segn este resultado se puede
considerar que los datos del ejemplo 4 son homogneos.
MEDIDAS DE ASIMETRA
La asimetra o sesgo en una distribucin ocurre cuando los valores de la media aritmtica, la
moda y la mediana no son iguales por la presencia de algunos datos muy diferenciados. Una
medida para evaluar el sesgo o asimetra de la distribucin se denomina coeficiente de asimetra
(C.A.)
Coeficiente de Asimetra
Teniendo en cuenta la media aritmtica y moda el coeficiente de asimetra es:
CA =
Si se considera la media aritmtica con la mediana, el coeficiente de asimetra es:
-
28
CA =
Si CA < 0 la distribucin tiene asimetra negativa.
Si Ca > 0, la distribucin tiene asimetra positiva.
Si CA = 0, la distribucin es simtrica.
CURTOSIS
Mide el grado de apuntamiento de una distribucin en relacin con la distribucin normal.
Coeficiente De Curtosis El coeficiente de curtosis para analizar el apuntamiento en una muestra es:
=(
2)4/
(2)2
Si:
C < 3 La distribucin es Platicrtica.
C = 3 La distribucin es Mesocrtica.
C > 3 La distribucin es Leptocrtica.
Ejemplo 5
Una institucin investiga los tiempos en minutos por llamadas telefnicas que hace cada oficina
durante un da de trabajo. En una muestra de 40 oficinas obtiene lo siguiente:
Tiempo Xi N de
llamadas (fi) Fi xi*fi (xi-)2*fi
10 a menos de 13 11.5 3 3 34.5 113.4675
13 a menos de 16 14.5 11 14 159.5 109.1475
16 a menos de 19 17.5 12 26 210 0.27
19 a menos de 22 20.5 9 35 184.5 73.1025
22 a menos de 25 23.5 5 40 117.5 171.1125
Total 706 467.1
-
29
Las medidas estadsticas necesarias para calcular los coeficientes de asimetra y curtosis son:
S
S = 3,46
Mo = 16 + Mo = 16,75
Me = 16 + 3 Me = 17,5
El coeficiente de asimetra segn la Moda es:
CA = CA = 0,26
El coeficiente de asimetra segn la mediana es
CA = 3 CA = 0,13
Luego los dos coeficientes de asimetra nos indican que la distribucin tiene una asimetra
positiva. El coeficiente de curtosis es
C = C = 2,06
El valor 2,06 nos indica que la distribucin tiene forma platicurtica.
Usando el software estadstico SPSS. (Ejemplo de las edades de los trabajadores de la empresa ANITA)
-
30
MEDIDAS DESCRIPTIVAS PARA VARIABLES CUANTITATIVA CONTINUA:
EJERCICIOS DE REPASO N 2
1. Los siguientes datos (en miles de nuevos soles) representan las
rentas netas anuales de una muestra de 32 trabajadores de una
institucin.
15; 23; 18; 15; 20; 22; 19; 18; 16; 30; 25; 18; 17; 16; 37; 19
25; 28; 40; 35; 22; 21; 17; 21; 36; 30; 19; 26; 35. 20; 15; 35
a) Representa un histograma de frecuencias absolutas relativas
con 5 intervalos de clase.
b) Cul es la renta promedio de los contribuyentes. Cul su
dispersin.
c) Dividir, a partir de datos tabulados la distribucin en 2
categoras.
Estadsticos
Das de la semana
N Vlidos 89
Perdidos 0
Media 2,44
Mediana 2,00
Moda 2
Desv. tp. 1,215
Varianza 1,476
Asimetra ,692
Error tp. de asimetra ,255
Curtosis ,038
Error tp. de curtosis ,506
Rango 5
Mnimo 1
Mximo 6
Suma 217
Percentiles 25 1,50
50 2,00
75 3,00
Estadsticos
Edad de los trabajadores (agrupado)
N Vlidos 27
Perdidos 62
Media 3,11
Mediana 3,00
Moda 4
Desv. tp. 1,368
Varianza 1,872
Asimetra -,020
Error tp. de asimetra ,448
Curtosis -,753
Error tp. de curtosis ,872
Rango 5
Mnimo 1
Mximo 6
Suma 84
Percentiles 25 2,00
50 3,00
75 4,00
Perodo
de
atencin
(minutos)
Puntuacin
IQ
3,0
5,2
4,9
6,3
5,4
6,6
7,0
6,5
7,2
5,5
5,4
3,8
2,7
2,2
88
94
90
105
108
112
116
122
110
118
128
130
140
142
-
31
d) Es la distribucin simtrica?
2. Los datos siguientes se refieren al perodo de atencin (en minutos) y la puntuacin en un test de
inteligencia (IQ) de 14 nios en edad escolar.
a) Cules son los promedios del perodo de atencin y del coeficiente de inteligencia?
b) Calcular e interpretar comparativamente las dispersiones absolutas y relativas para cada
variable.
c) Calcular e interpretar el coeficiente de asimetra.
3. Una empresa que vende computadoras recopil datos con respecto al nmero de entrevistas que
requeran cada uno de los 40 vendedores para iniciar una venta. La tabla siguiente representa la
distribucin de frecuencias absolutas.
a) Graficar el polgono de frecuencias porcentuales simples. b) Cul es el nmero promedio de entrevistas que necesitaron los vendedores para iniciar su
venta.
c) Cul es su variacin absoluta y cul su variacin relativa. Interpretar.
d) Cul es el nmero de entrevistas que la mayora requiri.
e) Calcular e interpretar el coeficiente de asimetra.
4. La siguiente distribucin de frecuencias representa
el tiempo en segundos que los cajeros de un banco
necesitan para servir a una muestra de clientes en
el mes de diciembre.
Hacer el anlisis estadstico descriptivo.
N de entrevistas N de vendedores
0 4
5 9
10 14
15 19 20 -25
6 10 12 8 4
Tiempo (segundos) N de clientes
20 -29
30 39
40 49
50 59
60 69
70 79
80 89
90 99 100 109
110 119 120 -129
6 15 20 30 25 22 11 6 4 0 2
-
32
III. PROBABILIDADES
1. EXPERIMENTO ALEATORIO
Un experimento aleatorio es un proceso de medicin u observacin en el que los resultados no
se pueden predecir. Por ejemplo el lanzamiento de una moneda y observar si el resultado es
cara o sello, se fabrican artculos en una lnea de produccin y se cuentan el nmero de artculos
defectuosos producidos diariamente; observar el tiempo de servicio til en horas de una
computadora.
2. ESPACIO MUESTRAL
Es el conjunto de todos los resultados posibles de un experimento aleatorio. A cada elemento, se
denomina punto muestral, se nombra por
S = {s1, s2, . . . , sn}
Ejemplo 1
Se lanzan dos monedas simultneamente, el espacio muestral correspondiente es S = {cc,
cs, sc, ss}
Ejemplo 2
Se entrevista a 10 personas preguntndoles la preferencia por determinado diario de
circulacin nacional. Se reporta el nmero de personas que leen el diario. El espacio muestral es:
S = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
EVENTO ALEATORIO
Es un posible resultado o una combinacin de resultados de un experimento aleatorio. Es un
subconjunto del espacio muestral S, se conoce tambin como suceso aleatorio.
Ejemplo 3
Sea el experimento: lanzar un dado y observar el nmero que aparece en la cara superior. El
espacio muestral correspondiente es
S = {1, 2, 3, 4, 5, 6}
De este experimento podemos definir los siguientes eventos:
A: Obtener exactamente el nmero 3
A = {3}
B : Obtener un nmero menor que 5
-
33
B = {1, 2, 3, 4}
C : Obtener un nmero par
C = {2, 4, 6}
D : Obtener un nmero mayor o igual que 4.
D = {4, 5, 6}
Evento simple. Consta de un elemento, llamado tambin evento elemental, cada resultado est
definido por la aparicin de un elemento sencillo, como muestra en el evento A del ejemplo 3.
Evento compuesto. Est formado por ms de un elemento o punto muestral. Los eventos B, C y D del
ejemplo 3 son eventos compuestos.
Eventos Incompatibles. Se llama tambin mutuamente exclusivos, no pueden suceder al mismo
tiempo, como ejemplo, considere obtener un nmero par e impar al tirar un solo dado una vez;
si ocurre uno de estos eventos no es posible que el otro evento ocurra.
Evento Complementario. Dos eventos aleatorios son complementarios si los resultados que no estn
contenidos en uno estn contenidos en el otro evento. En el ejemplo 3, el evento complementario
de D: obtener un nmero mayor o igual que 4 es D: obtener un nmero menor que 4.
D = {1, 2, 3}
3. PROBABILIDAD DE UN EVENTO ALEATORIO
Para determinar la probabilidad de un evento A en el espacio muestral S se divide el nmero
de resultados o elementos del evento A entre el nmero de resultados posibles del espacio
muestral S. Es decir
() =
La probabilidad de un evento A, es un nmero real P(A) que cumple las siguientes propiedades.
i) P(A) 0
ii) P(S) = 1
iii) Si A, A2, , An son eventos mutuamente excluyente de S, entonces
= (=1
=1 )
-
34
Propiedades de la probabilidad
1. Para cualquier evento A
0 P(A) 1
2. Si A y A son eventos complementarios del espacio muestral S, entonces P(A) = 1 P(A)
3. Si es un evento imposible o conjunto vaco, P () = 0 para cualquier espacio muestral S.
4. Si A, B son eventos de un espacio muestral S y A B, entonces P(A) P(B).
5. Regla de adicin
Si A, B dos eventos cualesquiera del espacio muestral S, entonces
P (AB) = P (A) + P (B) P (AB)
6. Si A, B eventos mutuamente excluyentes, entonces
P(AB) = P(A) + P (B)
Ejemplo 4
De 100 profesionales que solicitaron empleo en una institucin 50 tenan experiencia
profesional, 20 tenan maestra y 10 tenan experiencia profesional y maestra. Cul es la
probabilidad que un profesional aleatoriamente elegido tenga experiencia profesional o
maestra.
Solucin:
Sea E el evento que el profesional elegido tenga experiencia profesional.
Sea M el evento que el profesional elegido tenga maestra.
P(E M) = P(E) + P(M) P(E M)
= + - = 0.60
4. PROBABILIDAD CONDICIONAL
Una medida de probabilidad en el espacio muestral S de que ocurra el evento A, dado el
evento B ha ocurrido se llama probabilidad condicional para dos eventos, se denota P(A/B).
Definicin.-Si A, B dos eventos cualesquiera del espacio muestral S y P(B) > 0. La probabilidad condicional de A dado B es
(/) =( )
()
-
35
P(A B) se llama probabilidad conjunta de los eventos A y B, se simboliza tambin P(AB).
Ejemplo 5
La probabilidad que una computadora tenga alta selectividad y alta resolucin es 0.25 y la
probabilidad que tenga alta resolucin es 0.70. . Cul es la probabilidad de que una
computadora tenga alta selectividad dado que tiene alta resolucin? .
Solucin:
Sean los eventos:
A: La computadora tiene alta selectividad
B: La computadora tiene alta resolucin
(A B): La computadora tiene alta selectividad y alta resolucin.
(/) =( )
()=
0.25
0.70= 0.40
Ejemplo 6
Una empresa estudia dos grupos de industrias para invertir en sus acciones y clasifica como
industrias de alto costo o de costo moderado y de alimentos o de servicios. Los resultados
se muestran en la siguiente tabla:
Tipo de industria Costo moderado Alto costo Total
Alimentos
Servicios
12
15
9
14
21
29
Total 27 23 50
Si se elige al azar una empresa.
a) Cul es la probabilidad que sea de alimentos dado que es de costo moderado?
b) Cul es la probabilidad que sea de servicios dado que es de alto costo?
Solucin:
Sea: A el evento de elegir una empresa de alimentos.
B el evento de elegir una empresa de servicios.
C el evento de elegir una empresa de costo moderado.
C el evento de elegir una empresa de alto costo.
-
36
Entonces:
a) (/) =()
()=
0.24
0.54= 0.44
b) P(S/C) = = 0.61
5. REGLA DE MULTIPLICACIN
Definicin:
Si A, B dos eventos cualesquiera del espacio muestral y P(A) > 0, entonces
P (A.B) = P(A) P(B/A)
Esta regla se conoce a veces como el teorema de multiplicacin y se aplica al clculo de la
probabilidad de la ocurrencia simultnea de dos eventos A y B.
Ejemplo 7
Si se eligen al azar en sucesin dos gaseosas de determinada marca de un lote de 240
gaseosas de los cuales 12 tienen premio Cul es la probabilidad de que las dos gaseosas
estn premiadas?
Solucin:
Supongamos A, el evento de que la primera gaseosa tenga premio y B, el evento de que la
segunda gaseosa tenga premio.
La probabilidad de obtener dos gaseosas con premio es
P(A.B) = . = 0.0023
Ejemplo 8
Una caja de USB tiene 15 unidades de los cuales 5 estn con virus informtico. Si selecciona
al azar tres USB sin reemplazo. Cul es la probabilidad de que los tres USB estn con virus?
Solucin:
Si A es el evento de que el primer USB est con virus, B el evento de que el segundo USB
est con virus y C el evento de que el tercer USB tambin est con virus, entonces
P (A) = 5/15, P (A/B) = 4/14, P(C/A.B) = 3/13
-
37
P (A.B.C) = . . = 0.022
6. PROBABILIDAD DE BAYES
TEOREMA.-Sean A1, A2, An eventos que forman una particin del espacio muestral S y sea B un evento cualquiera en S, entonces.
(/) =()(/)
()
Ejemplo 9
El departamento de crdito de una empresa comercial inform que 20% de sus ventas son en
efectivo, 50% se pagan con cheque en el momento de la adquisicin y 30% son a crdito. Se
sabe que el 40% de las ventas en efectivo, 80% en cheques y 70% de las ventas a crdito son
artculos nacionales. Se elige aleatoriamente un cliente de la empresa y resulta que el artculo
vendido es nacional Cul es la probabilidad que la venta haya sido a crdito?
Solucin:
Sean los eventos de las ventas:
E: efectivo, CH: cheque, C: a crdito
N: articulo nacional
I: articulo importado
P(N) = P (EN + CHN + CN) = P(E) P(N/E) + P(CH) P(N/CH) + P(C) P(N/C)
= 0.20 (0.40) + 0.50 (0.80) + 0.30(0.70) = 0.69
Ahora se calcula mediante el teorema de Bayes.
(/) =()(/)
()=
0.30(0.70)
0.69 = 0.3043
-
38
EJERCICIOS DE REPASO N 3
1. Un encuesta a ejecutivos revel que 65% leen con regularidad la revista A, 45% leen la
Revista B y 30% leen ambas revistas.
a) Cul es la probabilidad que un ejecutivo especfico lea con regularidad la revista
A o la revista B.
b) Como se le denomina a la probabilidad 0,30.
c) Los eventos son mutuamente excluyentes? Explique la respuesta.
2. Explique la diferencia entre un evento colectivamente exhaustivo y uno mutuamente
excluyente. De un ejemplo de cada uno.
3. En los ltimos aos una compaa de tarjetas de crdito ha desarrollado una estrategia
para atraer nuevas cuentas a profesionales recin egresados de la Universidad. Una muestra
de 200 profesionales se entrevist para ver si posea una tarjeta de crdito bancaria o una
tarjeta de dbito obteniendo la siguiente informacin:
Tarjeta de crdito
Tarjeta de dbito
SI NO
SI 70 60
NO 40 30
a) De un ejemplo de evento simple.
b) De un ejemplo de evento conjunto.
c) Cul es el complemento de tener una tarjeta de crdito.
d) Si se sabe que el profesional tiene una tarjeta de crdito bancaria Cul es la
probabilidad de que tenga una tarjeta de dbito?
e) Si se sabe que el profesional no tiene tarjeta de dbito Cul es la probabilidad
que tenga una tarjeta de crdito?
4. Una caja de 10 CD, 6 son marca A y 4 marca B, todos estn en sobres de igual color.
Si se seleccionan 2 CD aleatoriamente de la caja sin reemplazo:
a) Cul es la probabilidad de que ambos CD sean de la marca A.
b) Cul es la probabilidad que un CD sea marca A y el otro CD marca B.
-
39
5. Un director de una organizacin de seguros distribuy solicitudes de afiliacin a nuevos
trabajadores durante una reunin de orientacin 55% de los que recibieron estas solicitudes
eran hombres y el 45% mujeres. Posteriormente el 8% de los hombres y el 10% de las
mujeres que recibieron la solicitud se afili a la organizacin.
a) Cul es la probabilidad de que un nuevo trabajador elegido al azar que recibe la
solicitud se afilie a la organizacin.
b) Cul es la probabilidad de que un nuevo trabajador elegido al azar que se afilia
a la organizacin despus de recibir la solicitud sea hombre.
IV. PRUEBA DE HIPOTESIS
1. PRUEBA DE HIPOTESIS
INTRODUCCIN
Mediante una prueba de hiptesis se puede decidir, a partir de la informacin que proporciona
una muestra aleatoria, si lo que se afirma respecto a un parmetro es verdadero o no.
El planteamiento y prueba de hiptesis son partes muy importantes del diseo metodolgico
de una investigacin cuantitativa.
2. HIPOTESIS ESTADISTICA
La hiptesis estadstica es un supuesto para tomar decisiones estadsticas referidas a uno o ms
parmetros poblacionales.
Hiptesis Nula y Alternativa
Hiptesis Nula: Se denomina hiptesis nula y se representa por Ho a la hiptesis que es
aceptada provisionalmente y cuya validez ser sometida a comprobacin.
Hiptesis Alternativa: Se designa por H1 y constituye una alternativa en caso que la hiptesis
nula no sea aceptada. En investigacin, generalmente corresponde a la hiptesis de
investigacin.
Ejemplo
Para probar si el rendimiento promedio de los alumnos de una institucin educativa es
mayor que 14, se toma una muestra aleatoria de los alumnos de la institucin y de acuerdo
-
40
a la informacin que sta proporciona se aceptar o rechazar una de las siguientes
afirmaciones.
Ho: El rendimiento acadmico promedio de los alumnos de la institucin educativa no es mayor
a 14.
H1: El rendimiento acadmico promedio de los alumnos de la institucin educativa es mayor a
14
3. TIPOS DE ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPTESIS
En todo proceso inferencial, por el hecho de trabajar con informacin muestral, se corre
el riego de cometer error. Este error en estadstica se mide en trminos de probabilidad
y se trata de minimizar.
Error tipo I: Consiste en tomar la decisin de rechazar la hiptesis nula cuando es cierta
en trminos de probabilidad.( nivel de significancia)
Error tipo II: Consiste en tomar la decisin de aceptar la hiptesis nula cuando sea falsa
en trminos de probabilidad. ( potencia de la prueba )
0 FALSA 0 CIERTO
RECHAZAR 0 CORRECTO ERROR I
ACEPTAR 0 ERROR II CORRECTO
.
Regin de aceptacin y Regin crtica
Prueba unilateral de cola a la izquierda.
Cuando la hiptesis alternativa es planteada usando la relacin menor que (). Dado
un nivel de significacin , 1- es la probabilidad de aceptar Ho. Se rechaza Ho si el
valor calculado de la estadstica de la prueba es mayor que el valor tabular.
-
41
Prueba bilateral
Cuando la hiptesis alternativa es planteada usando la relacin diferente (). Dado un
nivel de significacin , 1- es la probabilidad de aceptar Ho. Se acepta Ho si el valor
calculado de la estadstica de la prueba est entre los valores tabulares.
Procedimiento
El procedimiento general en una prueba de hiptesis es:
1. Formular la hiptesis nula Ho y la hiptesis alternativa Ha.
2. Especificar el nivel de significacin .
3. Determinar la estadstica de la prueba a usar.
4. Determinar la regin de aceptacin y la regin crtica o de rechazo.
5. Calcular el valor de la estadstica a partir de los datos de la muestra.
6. Tomar la decisin: rechazar Ho si el valor calculado de la estadstica est en la regin
de rechazo de H0 y por lo tanto, aceptar H1. En caso contrario no rechazar Ho y por lo
tanto no aceptar H1
4. PRUEBA DE HIPTESIS PARA LA MEDIA DE UNA POBLACIN ()
Ho: o Ho: o Ho: = o
Ha: < o Ha: > o Ha: o
1. Cuando se conoce la varianza poblacional.
La estadstica para la prueba es:
=
que tiene distribucin normal estndar.
2. Cuando no se conoce la varianza poblacional.
Para una muestra pequea, la estadstica para la prueba es:
=
que tiene distribucin t con n-1 grados de libertad.
Ejemplo 1. El director de una institucin educativa afirma que el ingreso mensual promedio de las
familias de los alumnos de su institucin es mayor de S/. 850. Para probar esta afirmacin
selecciona una muestra aleatoria de 25 familias y calcula que el ingreso promedio es S/. 870
-
42
con una desviacin estndar de S/. 50. Con un nivel de significacin del 5%, Cul es su
conclusin?
Solucin:
Ho: 850
Ha: > 850
= 0,05
La muestra es pequea y no se conoce la varianza poblacional, por lo tanto, la estadstica para
la prueba es:
=
=
=
(.;) = 1,729
Como tc es mayor que el valor tabular, es decir, se encuentra en la regin de rechazo de H0,
entonces se rechaza H0 y se acepta H1. Se concluye que la afirmacin del director se acepta,
al nivel de significacin del 5% o 0.05
5. PRUEBA DE HIPTESIS PARA LA COMPARACIN DE MEDIAS DE DOS
POBLACIONES
Caso 1. Las varianzas de las poblaciones 2x, 2y se conocen
Ho: x y Ho: x y Ho: x = y
H1: x < y H1: x > y H1: x y La estadstica para la prueba es:
=
2
+
2
que tiene una distribucin normal estndar.
Caso 2. Las varianzas de las poblaciones 2x, 2y no se conocen
Ho: x y Ho: x y Ho: x = y
H1: x < y H1: x > y H1: x y
-
43
Varianzas desconocidas iguales: 2x = 2y = 2 La estadstica para
la prueba, para muestras pequeas, es:
=
( 1)
2 + ( 1)2
+ 2[
1
+1
]
La estadstica para la prueba es:
que tiene distribucin t con nx + ny 2 grados de libertad.
Ejemplo 3.
En un sistema educativo se aplican dos mtodos de enseanza X, Y. En el primer grupo de
120 alumnos se aplic el mtodo X y en el segundo grupo de 250 alumnos se aplic el
mtodo Y. Las medias de las calificaciones obtenidas fueron = 12 y = 12,2
respectivamente Puede admitirse que los mtodos de enseanza no difieren en los
resultados y que las diferencias encontradas en las muestras se deben al azar? Por
experiencias anteriores se conoce que las varianzas poblacionales son 2x = 4 y 2y = 4,12
respectivamente. Use = 0,05.
Solucin: Ho: x = y
H1: x y = 0,05.
=
2
+
2
= 12 12.2
4120 +
4.12250
= 0.896
0.975 = 1.96
El valor de Z calculado (Zc) no cae en la regin de rechazo, podemos considerar que la
diferencia observada entre los valores promedios no es significativo al nivel 0,05.
6. PRUEBA DE HIPTESIS PARA LA PROPORCIN DE UNA POBLACIN
Ho: P Po Ho: P Po Ho: P = Po
H1: P < Po H1: P > Po H1: P Po
-
44
=
que tiene distribucin normal estndar, por aproximacin.
Ejemplo 5.
Un profesor de educacin secundaria acus a una editorial diciendo que ms del 15% de los
textos que publica la editorial tienen algn defecto. Para continuar con la investigacin se tom
una m.a. de 50 textos de la produccin en circulacin de la editorial y se encontr que 10 de los
textos tenan por lo menos un defecto (falla) Cul es su conclusin? Use = 0,05
Solucin:
Ho: P 0,15
Ha: P > 0,15
= 0,10
=
= .
=
=. .
(. )(. )
= .
. = .
El valor de Z calculado es menor que el valor tabular por lo tanto la acusacin del profesor
no se acepta al nivel de 5% de significacin.
7. PRUEBA DE HIPTESIS PARA LA COMPARACIN DE PROPORCIONES DE DOS POBLACIONES
Ho: Px Py Ho: Px Py Ho: Px = Py
H1: Px < Py H1: Px > Py H1: Px Py
La estadstica para la prueba es:
=
+
tiene distribucin normal estndar.
Considerando el estimador de la proporcin comn ()
-
45
=
(
+
)
donde: = +
+=
+
+
Ejemplo 6.
Un escritor que promociona su novela afirma que su obra representa un atractivo igual para los
hombres que para las mujeres, pero el equipo de prensa piensa que es mayor el porcentaje de
hombres al de mujeres que leen la novela. En una muestra aleatoria de 200 hombres y 250
mujeres revel que 110 hombres y 110 mujeres leen la novela Puede considerarse que la
proporcin de lectores hombres es mayor que la proporcin de lectoras mujeres, para un nivel
de significacin del 5%?
Solucin:
Ho: Px Py Px : proporcin de lectores hombres
Ha: Px > Py Py : proporcin de lectoras mujeres
= 0,05
=
= . =
= .
= +
+ =
+
+ = .
=
(
+
)
=. .
(. )(. )(
+
)
= .
El valor calculado Zc pertenece a la regin crtica por lo tanto, se rechaza Ho y se acepta H1,
es decir, la proporcin de lectores hombres es mayor que la proporcin de lectoras mujeres,
al nivel de 5%
8. PRUEBA DE INDEPENDENCIA.
La prueba de independencia se utiliza en investigaciones donde interesa analizar la relacin o
la independencia de dos variables cualitativas X e Y.
-
46
Cada variable se divide en categoras o niveles de acuerdo a un criterio de clasificacin y los
datos se presentan en una tabla bidimensional o tabla de contingencia con r filas y c
columnas. Las hiptesis se suelen presentar de dos formas:
1) Ho: La variable X no est relacionada con la variable Y.
Ha: La variable X est relacionada con la variable Y, o
2) Ho: La variable X e Y son independientes.
Ha: La variable X e Y no son independientes.
La estadstica para la prueba es
2 = ( )
2
que tiene distribucin chi cuadrado con gl grados de libertad ( gl = (r-1)(c-1) ) .
Oij = valores observados, Eij = valores esperados, Eij = ri cj / n, ri: total de la fila i, cj: total de
la columna j, n: nmero de datos
Ejemplo 6.
Se aplic una encuesta a una muestra de 400 trabajadores de una empresa. Despus de
procesar los datos se obtuvo la siguiente tabla de contingencia para las variables gnero
y opinin sobre como avanzar en el trabajo. Al nivel de = 0,05 existe relacin entre la
opinin de los trabajadores y el gnero?
Gnero
Opinin
Total Trabajo duro
Trabajo duro y suerte
Suerte
Hombre
Mujer
145 48 40 233
115 32 20 167
Total 260 80 60 400
Solucin:
Ho: No existe relacin entre la opinin de los trabajadores y el gnero.
H1: Existe relacin entre la opinin de los trabajadores y el gnero.
= 0,05
2 = ( )
2
-
47
gl = (2-1)(3-1) = (1)(2) = 2
(2;0.05)2 = 5.99
Calculando los Eij :
E11 = 233x260/400 = 151.45 E21 = 167x260/400 = 108.55
E12 = 233x80/400 = 46.6 E22 = 167x80/400 = 33.4
E13 = 233x60/400 = 34.95
E23 = 167x60/400 = 25.05
X2c = (145-151.45)2 /151.45 + (48-46.6)2 / 46.6 + (40- 34.95)2 / 34.95 +
(115-108.55)2 / 108.55 + (32-33.4)2 / 33.4 + (20-25.05)2 / 25.05
X2c = 2.5
Considerando que el valor calculado de X2 = 2.5, es menor que el valor tabular 5.99, es
decir cae en la regin de aceptacin de H0 , no se puede rechazar Ho, es decir, se puede
concluir que no existe relacin entre la opinin de los trabajadores y el gnero al nivel de
significacin = 0,05.
V. REGRESIN Y CORRELACIN LINEAL
1. INTRODUCCIN
Mediante la regresin lineal se desarrolla una ecuacin para predecir el valor de la variable
dependiente (Y) dado el valor de una variable independiente (X) y para medir el grado en
que la variable dependiente puede ser explicada por la variable independiente. Mediante la
correlacin se mide el grado de asociacin entre las variables.
Por ejemplo, un investigador desea estimar la relacin existente entre los ingresos familiares
y sus gastos familiares en 30 profesores de la ciudad de Trujillo. Aplicando la correlacin se
medir en que medida estn correlacionadas estas variables. Asimismo, si se halla una
relacin funcional que se ajuste a los datos de las variables, ser posible medir en que medida
la variable dependiente explica el comportamiento de la variable dependiente.
-
48
2. REGRESIN LINEAL SIMPLE
Consideremos una variable dependiente (Y) y una variable independiente (X) La
forma general de la ecuacin de regresin poblacional es:
Yi = + xi + Ei
donde:
: ordenada en el origen
: pendiente de la ecuacin de regresin lineal
E : error
Diagrama de dispersin:
Es la grfica de los datos muestrales en el plano XY. Indica el patrn de comportamiento de
los datos. A partir de este grfico se puede tener una idea de la asociacin entre las variables
y la posible relacin funcional entre ellas.
Estimacin de la Ecuacin de Regresin Lineal:
Se utiliza el mtodo de mnimos cuadrados. Este mtodo consiste en calcular los estimadores
a y b de manera que la suma de los cuadrados de las distancias entre los valores verdaderos
y los valores estimados sea mnima.
La estimacin de la ecuacin de regresin poblacional o ecuacin de regresin muestral es:
i = a + b Xi i = + xi
Donde
=
2( )2
=
=
3. COEFICIENTE DE DETERMINACIN
El coeficiente de variacin R2 es la proporcin de variacin de la variable dependiente que se
explica por la variacin de la variable independiente.
Se puede describir en trminos de la variacin total en Y comparada con la variacin no explicada
en la variable dependiente (Y).
2 = 1 Variacin de los errores que no es explicada mediante la lnea de regresin
Variacin total de los valores de y
-
49
R 0 R2 1
4. CORRELACIN LINEAL
La correlacin lineal mide el grado de asociacin o relacin entre dos variables X, Y. Si al
aumentar X aumenta Y la correlacin lineal es directa. Si al aumentar X disminuye Y la
correlacin lineal es inversa. Si no existe ninguna relacin entre los datos graficados, las
variables no estn correlacionadas.
Coeficiente de Correlacin Lineal.
El coeficiente de correlacin lineal(r) de la muestra segn Pearson es:
=
2 ( )2
2 ( )2 1 1
r = 1 : correlacin perfecta r = 0 : correlacin nula
Criterios para interpretar r
Cuando r es positivo, la relacin entre las variables es directa.
Cuando r es negativo, la relacin entre las variables es
inversa
5. PRUEBA DE HIPTESIS PARA LA CORRELACIN
Ho: = 0 : No existe correlacin
Ha: 0 : Existe correlacin
Para contrastar la hiptesis se aplica la prueba T de Student. El estadstico para la prueba es:
t , gl = n - 2
r interpretacin
0.80 0.99 Muy alta
0.60 0.79 Alta
0.40 0.59 Moderada
0.20 0.39 Baja
0.01 0.19 Muy baja
-
50
Ejemplo 1.
La informacin siguiente corresponde a puntajes obtenidos por 8 estudiantes en su examen
parcial de unidad y su nota promedio de unidad.
a) Determinar la ecuacin de regresin lineal. Hacer su grfica.
b) Calcular los coeficientes de determinacin y correlacin lineal.
c) Hacer una prueba de hiptesis para .
Examen parcial 10 16 15 14 12 11 17 14
Nota Promedio de unidad 11 15 14 12 12 12 16 15
Solucin:
Ex. Parcial
X
Pro. Unidad
Y
XY X 2 Y2
10
16
15
14
12
11
17
14
11
15
14
12
12
12
16
15
110
240
210
168
144
132
272
210
100
256
225
196
144
121
289
196
121
225
196
144
144
144
256
225
109 107 1486 1527 1455
=8(1468)(109)(107)
8(1527)(1096)2 = 4.224
= 1074
8 (4.224)
109
8= 0.672
La ecuacin de regresin lineal es: = 4,224 + 0,672 Xi
R2 = 0,7912
El 79% de la variacin en la nota promedio de unidad se explica est determinada mediante su
relacin lineal con el examen parcial. Tambin se puede decir que la nota promedio de la unidad se
explica en un 79% por la nota del examen parcial.
El coeficiente de correlacin lineal es:
r = 0,8895
-
51
Prueba de hiptesis para
Ho: = 0
Ha: 0
Se rechaza Ho.
Se concluye que existe una relacin lineal entre los puntajes del examen parcial y la nota
promedio de unidad.
Prueba de hiptesis para
Ho: = 0 Ha: 0
To
Se concluye que el coeficiente de correlacin calculado es significativo, es decir es diferente de cero. Como se puede observar las pruebas para el coeficiente de regresin y para el coeficiente de correlacin son equivalentes.
6. REGRESIN LINEAL MLTIPLE
La regresin mltiple estudia la relacin de una variable dependiente con dos o ms variables
independientes. El modelo de regresin mltiple es: y = 0 + 1X1 + 2X2 + + KXK +
donde: X1, X2, , XK son variables independientes
0, 1, , K parmetros
error aleatorio
El modelo de regresin mltiple estimado, denominado tambin ecuacin de regresin
mltiple estimada es: = b0, + b1x1 + + bK xk
Dnde: b0, b1, , bk son los estimadores de los parmetros.
-
52
Mediante el mtodo de mnimos cuadrados se obtienen los coeficientes b0, b1,, bk de tal manera
que la suma de los cuadrados de los residuos se hagan mnima.
Ejemplo 2.
El gerente de la empresa desea conocer el comportamiento de la demanda de laptops que la
empresa ofrece. Considera que la publicidad y el precio son los factores determinantes de la
demanda. Para ello toma informacin de los ltimos 10 meses, la informacin obtenida es la
siguiente:
Demanda
(unidades)
Publicidad (N de
anuncios)
Precio mensual promedio
($)
40
65
70
60
50
62
35
75
74
30
11
16
15
18
10
14
15
16
12
14
500
600
750
400
700
580
520
500
450
550
Utilizando la hoja de clculo Excel u otro software estadstico se obtienen los coeficientes de la
ecuacin de regresin lineal mltiple que determina el comportamiento de la demanda con
relacin a la publicidad y el precio. La ecuacin es: = 15, 92 + 2,08 x1 + 0,02 x2
Si el nmero de anuncio es 20 y el precio es $ 720, la demanda esperada es aproximadamente
72 laptops.
EJERCICIOS DE REPASO N 4
1. Un establecimiento de comida rpida tiene una venta media de $ 2000 por da. Para
contrastar si las cifras del negocio estn cambiando debido al deterioro de la economa,
la direccin ha decidido registrar cuidadosamente las cifras de negocio de los 8 das
prximos.
Si los valores fueron:
2050; 2212; 1880; 2121; 2205; 2018; 1980; 2188.
a) Cules son las hiptesis nula y alternativa?
b) Estos datos son lo suficientemente significativos para probar al nivel de 5% que se ha
producido un cambio?
-
53
c) Qu ocurre al nivel de significancia del 1%?
2. Hace 20 aos, los alumnos del curso de comunicacin en la universidad podan contestar
en promedio 24 preguntas buenas en 60 minutos. Para ver si esto contina igual en la
actualidad se ha seleccionado una muestra de 36 alumnos del curso de comunicacin. Si
la media muestral result ser de 25,5 preguntas buenas con una desviacin tpica de 3,5
Se puede concluir que el promedio de contestar preguntas buenas ha mejorado?. Utilice
el nivel de significacin de 5%.
3. Un comercio ha recibido un envo de artculos de cierto tipo. Si se puede establecer que
ms de 4% de los artculos recibidos son defectuosos, se devuelve el envo. Si en una
muestra de 90 artculos se encontr que 5 de ellos eran defectuosos Se debera devolver
el envo al proveedor? Utilice un nivel de significacin de 10%. Qu ocurrir al nivel de
5%?
4. Se recogen datos para determinar si existe una diferencia entre los resultados del test de
los estudiantes de la institucin A y los de la institucin B. Se toma una m.a. de 100
estudiantes de la institucin A, se obtuvo una puntuacin media de 102,2 y una
desviacin estndar de 11,8. Por parte de la institucin B se obtiene una m.a. de 60
estudiantes, la puntuacin media fue de 105,3 con una desviacin estndar de 10,6. Los
datos son suficientemente significativos al nivel de 5% para rechazar la hiptesis de que
las puntuaciones medias de los estudiantes de las instituciones A y B son iguales?
5. Una agencia de publicidad pretende determinar la composicin demogrfica del mercado
para un nuevo producto. Selecciona al azar una m.a., de 120 de los diferentes grupos de
edad segn su actitud de compra. Los resultados de la encuesta son los siguientes:
a) Existe relacin o independencia entre los grupos de edad y la actitud de compra, a un nivel de
significacin de 5%?
b) Qu ocurre si el nivel es de 10%?
6. Dado el siguiente conjunto de datos:
X 12 15 14 11 18 9 13 17 18 12
Y 6,2 8,6 7,2 4,5 9,0 3,5 6,5 9,3 9,5 5,7
a) Dibuje un diagrama de dispersin.
b) Estime la ecuacin de regresin lineal.
Actitud
Grupo de Edad
18 29 30 39 40 50
Compra frecuente 12 15 10
Compra alguna vez 20 25 18
Nunca compra 8 5 7
-
54
c) Pronostique Y para X = 10; 16; 20.
d) Calcular el coeficiente de correlacin lineal de la muestra.
A) Usando el SPSS:
Analizar > Regresin > Lineales
y vamos solicitando las diferentes opciones en los distintos botones de Estadsticos, Grficos,
Guardar y Opciones.
La salida correspondiente a las opciones marcadas, en primer lugar, nos seala el porcentaje de
varianza explicada, que es el coeficiente de determinacin
(Coeficiente de correlacin de Pearson al cuadrado), as como un ANOVA de la
Regresin
-
55
R cuadrado, es considerado el ndice de bondad de ajuste del modelo de regresin o que es
tambin llamado coeficiente de determinacin.
A continuacin nos indica las diferentes estimaciones de los parmetros de la ecuacin de
regresin de tal manera que Y = -13,628 + 0,038X + 22,75144
Posteriormente, se evalan los residuos mediante ndices numricos y grficos. Se tienen en
cuentan los residuos tipificados a partir de +3 y -3, que se dan en este caso.
Los datos no se ajustan al modelo lineal.
Como en guardar marcamos la opcin de valores
pronosticados no tipificados, en el fichero de datos
nos aparece una columna con los valores que tendra
la variable dependiente (Y), al aplicar la ecuacin de
regresin sobre la variable independiente (X), esto es,
-
56
VI. TABLAS ESTADISTICAS
DISTRIBUCIN DE PROBABILIDAD NORMAL ESTANDAR
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
-
57
TABLA DE LA DISTRIBUCIN t - STUDENT
0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005
r
1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,689
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,660
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551
60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460
120 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373
0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,290
-
58
TABLA DE LA DISTRIBUCIN CHI-CUADRADO
Chi-cuadrado rea de la cola,
/v 0.995 0.990 0.975 0.950 0.900 0.800 0.700 0.500
1 0.00 0.00 0.00 0.00 0.02 0.06 0.15 0.45
2 0.01 0.02 0.05 0.10 0.21 0.45 0.71 1.39
3 0.07 0.11 0.22 0.35 0.58 1.01 1.42 2.37
4 0.21 0.30 0.48 0.71 1.06 1.65 2.19 3.36
5 0.41 0.55 0.83 1.15 1.61 2.34 3.00 4.35
6 0.68 0.87 1.24 1.64 2.20 3.07 3.83 5.35
7 0.99 1.24 1.69 2.17 2.83 3.82 4.67 6.35
8 1.34 1.65 2.18 2.73 3.49 4.59 5.53 7.34
9 1.73 2.09 2.70 3.33 4.17 5.38 6.39 8.34
10 2.16 2.56 3.25 3.94 4.87 6.18 7.27 9.34
11 2.60 3.05 3.82 4.57 5.58 6.99 8.15 10.34
12 3.07 3.57 4.40 5.23 6.30 7.81 9.03 11.34
13 3.57 4.11 5.01 5.89 7.04 8.63 9.93 12.34
14 4.07 4.66 5.63 6.57 7.79 9.47 10.82 13.34
15 4.60 5.23 6.26 7.26 8.55 10.31 11.72 14.34
16 5.14 5.81 6.91 7.96 9.31 11.15 12.62 15.34
17 5.70 6.41 7.56 8.67 10.09 12.00 13.53 16.34
18 6.26 7.01 8.23 9.39 10.86 12.86 14.44 17.34
19 6.84 7.63 8.91 10.12 11.65 13.72 15.35 18.34
20 7.43 8.26 9.59 10.85 12.44 14.58 16.27 19.34
21 8.03 8.90 10.28 11.59 13.24 15.44 17.18 20.34
22 8.64 9.54 10.98 12.34 14.04 16.31 18.10 21.34
23 9.26 10.20 11.69 13.09 14.85 17.19 19.02 22.34