estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
-
Upload
ciencia-politica-uahc -
Category
Documents
-
view
221 -
download
0
Transcript of estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
1/92
1
COLEGIODEBACHILLERES
ESTADSTICA DESCRIPTIVAE INFERENCIAL II
FASCCULO 3. FUNCIONES DE DISTRIBUCINNORMAL ESTNDARUNA VISIN ESTTICA
Autores: Emigdio Arroyo CervantesJuan Matus Parra
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
2/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
3/92
3
INTRODUCCIN 5
PROPSITO 7
CUESTIONAMIENTO GUA 9
CAPTULO 1. FUNCIONES PROBABILSTICASCONTNUAS
11
1.1 DISTRIBUCIN NORMAL ESTNDAR 12
1.1.1 Normalizacin 14
1.1.2 Valores Normalizados Z y rea Bajo la Curva 21
1.1.3 Aproximacin Normal a la Distribucin Binomial 36
1.2 DISTRIBUCIONES MUESTRALES Y TEOREMADEL LMITE CENTRAL 40
1.2.1 Distribuciones Muestrales 401.2.2 El Teorema Central del Lmite 50
1.2.3 Distribucin T-Student 55
RECAPITULACIN 70
ACTIVIDADES DE CONSOLIDACIN 71
AUTOEVALUACIN 73
APENDICES 79
BIBLIOGRAFA CONSULTADA 92
N D I C E
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
4/92
4
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
5/92
5
En el fascculo anterior estudiaste las distribuciones de probabilidad binomial y de
Poisson. Estas son distribuciones de variable aleatoria discretas, en que cada valor delas variables se le asigna una probabilidad.
Existen otras distribuciones de probabilidad, las de variables aleatorias continuas cuyadeterminacin de la probabilidad difiere de las anteriores toda vez que las observacionesdel experimento generan un espacio muestral infinito y cada intervalo de este tiene unnmero infinito no numerable de posibles resultados los cuales incluyen valores reales.
De lo anterior podemos concluir que para determinar la probabilidad de una variablealeatoria continua, se desarrolla un mtodo distinto a los anteriores.
En este fascculo estudiars la distribucin normal como modelo de fenmenos
aleatorios en los que se efectan mediciones continuas y te capacitars en el clculo dela probabilidad de fenmenos aleatorios de regularidad estadstica, aplicando para ello,la distribucin normal estndar.
As mismo, estudiars la aplicacin de a distribucin de medias muestrales mediante eluso del Teorema del Lmite Central para muestras grandes y la distribucin de Studenten muestras pequeas.
INTRODUCCIN
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
6/92
6
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
7/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
8/92
8
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
9/92
9
Sabemos que las aguas negras de la Ciudad de Mxico se utilizan para el riego de loscampos de cultivo circunvecinos al Valle de Mxico.
Esta agua negras contienen entre otras sustancias, el cloro en cantidades perjudicialesal sembrado de cereales porque en lugar de beneficiarlo con el riego, lo quema y lo
seca.
Por lo anterior, es necesario darle al agua un tratamiento con el fin de disminuir oeliminar el contenido de cloro. Para ello el Departamento del D.F. tiene establecido unlaboratorio en los colectores de aguas para determinar el contenido de cloro y dar eltratamiento correspondiente antes de abrir las compuertas.
Para el anlisis se toma una muestra de 5 lt. De aguas negras diariamente. Losresultados correspondientes al mes de noviembre de 1993 fueron las que se muestranen la siguiente tabla. Las cantidades de cloro se registran en partes pro milln (ppm).
16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.815.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3
Usemos estos datos para realizar un recordatorio de los conceptos estudiados en tucurso de Estadstica I. Esto nos servir para abordar los nuevos conceptos queestudiars en este fascculo y para ello realiza el siguiente ejercicio:
1. Ordena los datos en sentido creciente.2. Determina el rango de variacin de los datos.3. Elabora una tabla de frecuencia de datos agrupados de 5 clases.4. Determina la moda, la mediana y la media de la muestra.5. Determina la desviacin estndar.6. Traza el histograma.7. Traza el polgono de frecuencia.
8. Analiza e polgono de frecuencias y determina:a) De qu tipo es (platicrtica, mesocrtica, etc.)b) Determina el sesgo.c) Determina el orden de la media, la moda y la mediana.
9. Analiza la desviacin estndar y determina como es la dispersin de las puntuaciones.
CUESTIONAMIENTO GUA
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
10/92
10
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
11/92
11
CAPTULO 1FUNCIONES PROBABILSTICAS
CONTNUAS
En el siglo XVIII a los jugadores profesionales les interesaba conocer a priori, lasprobabilidades de xito en los distintos juegos de azar, para ello acudieron a losmatemticos de la poca en busca de ayuda. Como una respuesta a una necesidadplanteada a los matemticos, en 1973 Abraham DMoavre (1667-1754) es quien obtienepor primera vez la ecuacin matemtica de la curva normal.
La distribucin normal nos permite el clculo de probabilidades de variables aleatoriascontinuas y discretas de cualquier problema de: Ingeniera, Medicina, Ciencias Sociales,Agricultura, Psicologa, Fsica, Qumica, etc.
Otros grandes matemticos contribuyeron dndole impulso, entre ellos podemos citar aFriedrich Gauss (1777-1855) quien perfeccion y la utiliz ampliamente en su teora deerrores de las mediciones fsicas. Laplace la us en el clculo de lo errores de lasobservaciones astronmicas. El matemtico Ruso P.L. Chebyshev estableci variosteoremas relacionados con la curva de la distribucin normal.
Los experimentos realizados pro muchos cientficos, permiten determinar que la mayorparte de las variables aleatorias se pueden estudiar considerando que tiene una funcinde densidad normal.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
12/92
12
1.1 DISTRIBUCIN NORMAL ESTNDAR
Retomemos el problema de las aguas negras. Los resultados que debiste obtener son:
R = 1.7 M = 16.01M = 16.05 X= 16.08S = 0.42
El histograma y el polgono de frecuencias son los siguientes:
Fig. 1
Del polgono de frecuencias podemos ver que la curva es asimtrica; est sesgada a laizquierda por lo tanto su asimetra es negativa. Por su puntiagudez es del tipoleptocrtica.
Recordars que los polgonos de frecuencias pueden ser :
1. Simtricos ( Grfica A )
2. Asimtricos ( Grficos B y C )
d) En la asimetra positiva el sesgo es a la derecha (Grfico B)
e) En la asimetra negativa el sesgo es a la izquierda (Grfico C)
15.7215.3715.2 16.08 16.42 16.77
5
10
fi
x0
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
13/92
13
Fig. 2
1. Los polgonos simtricos se clasifican en :
a) Platicrtico (Grfica A)b) Mesocrtico (Grfica B)c) Leptocrtico (Grfica C)
Fig. 3
De los grficos anteriores podemos concluir que la forma de cada una, est ntimamenterelacionada con las medidas de tendencia central y de dispersin.
En las simtricas, las medidas de tendencia central coinciden en el mismo punto, esdecir = Mo = Md.
fi
x0
ACB
x
fi
CBA0
C
B
A
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
14/92
14
Las medidas de dispersin son diferentes, de la figura ( 3 ) obtenemos que:
A = B = C
En las asimtricas las medidas de tendencia central son diferentes y lo mismo ocurre conlas de dispersin.
a) Sesgo positivo < Md < Mob) Sesgo negativo > Md > Mo
En cualquier problema de variable aleatoria continua, su polgono de frecuencia esalguna de las grficas anteriores y stas dependen de sus parmetros de tendenciacentral y de dispersin.
La grfica que tiene forma de campana, su media = 0 y = 1, se llama curva normalestndar o campana de Gauss pro haber sido el primer cientfico que us estarepresentacin.
Las curvas simtricas tienen la forma de campana y las asimtricas no tienen esa formapero pueden transformarse a simtricas.
El procedimiento para transformar las curvas asimtricas en simtricas, es mediante unanormalizacin de los datos del problema y que estudiaremos a continuacin.
1.1.1. Normalizacin
El proceso de transformacin de un polgono de frecuencias a una curva normal, sellama normalizacin y para ello se hace un cambio de escala mediante la normalizacino tipificacin de las puntuaciones, es decir, los valores ( x ) se transforman en valores Zmediante la ecuacin de transformacin.
=Xi
Z . . . ( 1 )
Z= Puntuacin normalizada o tipificadaXi = Cada una de las puntuaciones de la poblacin = Media de las puntuaciones de la poblacin
= Desviacin estndar de la poblacin
A B C
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
15/92
15
Veamos el siguiente ejemplo:
Se desea conocer el peso promedio de los alumnos del turno vespertino del plantel 2 delColegio de Bachilleres. Para ello se toma una muestra representativa de 150 alumnos y
se pesan. Los pesos ya organizados en 13 clases, se muestran en la siguiente tabla defrecuencias:
Clases en kg.fi
30 341
35 395
40 448
45 498
50 5410
55 5918
60 6412
65 6936
70 - 7428
75 7912
80 848
85 893
90 941
Con estos datos anteriores, calcula:
c) La media, yd) La desviacin estndar.e) Traza el polgono de frecuencias.
ACTIVIDAD DE REGULACIN
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
16/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
17/92
17
Para explicar el procedimiento vamos a construir la siguiente tabla:
Normalizacin de una Distribucin Asimtrica
1 2 3 4 5 6 7 8 9CLASE fi Lr
SUPx=xix Z = x/ PARTE
MAYORPARTEMENOR
fe feredondeada
9094 1 94.5 30.6 2.51 0.9940 0.0119 1.785 1.88589 3 89.5 25.6 2.10 0.9821 0.0276 4.140 4.18084 8 84.5 20.6 1.69 0.9545 0.0548 8.220 8.27579 12 79.5 15.6 1.28 0.8997 0.0919 13.875 13.97074 28 74.5 10.6 0.87 0.8078 0.1306 19.590 19.66569 36 69.5 5.6 0.46 0.6772 0.1573 23.595 23.6
606412 64.5 0.6 0.05 0.5199 0.1605 24.075 24.1
5559 18 59.5 4.4 0.36 0.3594 0.1388 20.820 20.85054 10 54.5 9.4 0.77 0.2206 0.1016 15.240 15.24549 8 49.5 14.4 1.18 0.1190 0.0631 9.465 9.54044 8 44.5 19.4 1.59 0.0599 0.8331 4.965 5.03539 5 39.5 24.4 2.00 0.0228 0.0148 2.220 2.23034 1 34.5 29.4 2.41 0.0080 0.0080 1.200 1.2
Las columnas 1 y 2 corresponden a la clase y la frecuencia establecidas en la primeratabla.
La columna 3 corresponde al lmite real superior de cada clase el cual se determinaaumentando medio punto a cada valor del lmite superior.
La columna 4 es igual a la desviacin de cada puntuacin con respecto a la media y seobtiene mediante la ecuacin:
x = xi x . . . ( 1 )
Se toma como xi, al lmite real superior de cada clase.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
18/92
18
La columna 5 es el valor de Z correspondiente a cada puntuacin y se obtiene mediantela ecuacin de normalizacin o tipificacin, esto es:
=
=
xx
x
Z
i
. . . ( 2 )
La columna 6 se determina de los valores de la tabla del apndice ( A ) reas y
ordenadas de la curva de distribucin normal en funcin dex
que posteriormente
ejemplificaremos.
En la primera columna de esta se localiza el valores de z, en la tercera columna se lee elvalor del rea bajo la curva normal de la parte mayor.
En la cuarta columna se lee el rea bajo la curva normal de la parte menor y se registraen la columna siete de nuestra tabla.
EJEMPLO:
Para z = 2.51 el rea de la parte mayor que se lee en la tercera columna es 0.9940.
Para z = 2.41 en la cuarta columna se lee el rea de la parte menor correspondiente a0.0080.
La columna ocho de nuestra tabla corresponde a la frecuencia esperada (fe) y se calculamultiplicando el total de casos N =150 por el rea de la parte menor (columna 7) de cadapuntuacin.
Ejemplo: (0.0119) (150) = 1.785
La columna nueve es la frecuencia esperada (fe) redondeada a una cifra decimal.
Con estos valores de la tabla trazamos el polgono de frecuencias y la curva normalizadapara ver el cambio que sufre el polgono de frecuencias de cualquier problema que senormalizan los datos:
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
19/92
19
Fig. 5
A = Polgono de frecuencia de los pesos de 150 alumnos del plantel 2 del turnovespertino del Colegio de Bachilleres.
B = Curva normal del mismo problema.
En la escala Z de la figura 5, se determinan los valores de la desviacin tpica ( s ), auno y otro lado de la media ( x ).
Del ejemplo anterior habrs notado que normalizar los datos de un problema esequivalente a cambiar la escala x por la z y calcular las nuevas frecuencias que sonlas ordenadas de cada punto. Para ello usamos los valores de la tabla. Estos valores
corresponden a las reas bajo la curva normal y se han calculado mediante la ecuacinque define a la funcin normal y sta es:
y = f (x) =( ) 2
2
x
e2
1
. . . ( 3 )
S
fi
27 32 37 42 47 52 57 62 67 72 77 82 87 92 970
10
20
30
Z0 27.3 39.5 51.7 S=63.9 76.1 88.3 100.3
A
B
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
20/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
21/92
21
Y la ecuacin de tipificacin es la ya conocida:
x = + Z Z =x
. . . ( 1 )
Con los datos del problema de las aguas negras, elabora la tabla con los datosnormalizados y traza la curva normal sobre el polgono de frecuencias que ya obtuvisteantes.
1.1.2 VALORES NORMALIZADOS Z Y REA BAJO LA CURVA NORMAL
Ya qued establecido que para normalizar el polgono de frecuencias y transformarlo enuna campana de Gauss, se tipifican las observaciones ( ix ) del problema cambindolosa una escala (Z) mediante la ecuacin (1).
Esta curva normal es necesaria estandarizarla para poder calcular la probabilidadmediante una misma tabla ya elaborada para toda curva normal estandarizada, que seobtiene trasladando la media al origen como ya se indic.
La curva normal estandarizada tiene las siguientes caractersticas:
a) La altura alcanza su valor mximo como = 0 y su valor es 0.4, es decir; el puntomximo es Pm(0,0.4)
b) La curva normal estndar es simtrica con respecto a la media por lo tanto losparmetros de tendencia central son iguales, es decir:
= Mo = Md = 0 . . . ( 5 )
ACTIVIDAD DE REGULACIN
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
22/92
22
c) La desviacin estndar es = 1
d) El rea bajo la curva es A = 1
Fig. 7
El rea sombreada vale 1 y como la curva es simtrica cada regin a los lados del eje yvale 0.5.
e) El eje Zes una asntota horizontal de la curva ya que lim (z) = 0z
f) El rea ms importante donde se distribuye la probabilidad de un suceso, se encuentracomprendida entre + 3 y esto lo puedes constatar en la siguiente grfica de la Fig. 8.
g) De acuerdo con el teorema de Chebishev relacionado con la desviacin estndar y elrea bajo la curva, podemos establecer los siguientes porcentajes de la misma:
Fig. 8
De esta grfica podemos ver que el rea antes y despus de + 3 corresponde al 1%, esdecir el 0.5% para cada lado de la grfica.
= 0Z
68%
95%
99%
-3 -2 - 32Z
= 0
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
23/92
23
Por la simetra que tiene la curva normal estndar, existen tablas correspondientes alrea bajo al curva que nicamente contemplan la parte positiva de la grfica y estosmismos valores se usan para el lado negativo.
Ejemplo: Con los siguientes valores de Z determinaremos el valor de rea bajo la curvay trazaremos un esquema del rea correspondiente:
Z = + 0.5, + 0.7, + 1.5
En la primera columna de la tabla localizamos el valor de Z = 0.5 y en la segundacolumna leemos el valor del rea.
Z = 0.5 ; A = 0. 1915
Z = -0.5 , A = 0.1915
Z = 0.7 ; A = 0.2580
= 0 Z= 0.5Z
Z=-0.5 = 0Z
= 0 Z= 0.7Z
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
24/92
24
Z = -0.7 ; A = 0.2580
Z = 1.5 ; A = 0.4332
Z = -1.5 ; A = 0.4332
De las grficas anteriores podemos ver, que el valor del rea es el mismo para valorespositivos y negativos de Z solamente que para el valor negativo, el rea se representa ala izquierda de la media.
Z=-0.7 = 0Z
= 0 Z= 1.5
Z
Z=-1.5 = 0
Z
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
25/92
25
Normaliza los valores de X = 4, 6, 9,12,18,20, usando = 10 y = 5. traza una grficapara cada valores de x, comprala con la grfica de los valores normalizados y traza unapara cada Z sombreando en ambas grficas la regin correspondiente.
El rea bajo la curva normal estndar representa la probabilidad de un evento; toda elrea bajo la curva vale uno y representa la probabilidad del evento seguro.
El rea de cada mitad de la grfica, es 0.5
Si queremos la probabilidad de un evento cuyo valor est limitado por dos puntuaciones,por ejemplo:
P ( x, X x2 )
Probabilidad de x comprendida entre x1 y x2.
Para determinar esta probabilidad, tipificamos los valores x.
Sabemos que la curva normalizada de la escala x es equivalente a la curva normallestndar en la escala Z.
P ( x1 x x2) = P ( Z1 Z Z2 )
Determinamos Z1 =
1X P ( Z ) = P ( Z1 ) + P ( Z2 )
Z2 =
2
X
= 0
P(Z) = 0.5
= 0
P(Z) = 0.5
ACTIVIDAD DE REGULACIN
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
26/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
27/92
27
Si los valores de x estn en la parte negativa de z es decir a la izquierda de la media,entonces los grficos son:
X2 X1 X X Z2 Z1
Si solamente tenemos una X a la derecha de la media entonces el rea bajo la curvaes:
X X1 X =0 Z1 Z
P ( Z ) = P ( Z2 ) P ( Z1 )
P ( Z ) = 0.5 + P ( Z1 )
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
28/92
28
Recuerda que la primera mitad del rea bajo la curva vale 0.5, es por eso que a laprobabilidad de Z, le sumamos 0.5.
Si nos interesa la probabilidad de x
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
29/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
30/92
30
Si se conoce la probabilidad de un evento y queremos determinar el valor de Z, entoncesnos situamos en la segunda columna de la tabla ( rea desde la media), localizamos elvalores de la probabilidad y en el mismo rengln y en la misma columna 1 determinamosel valores deZ.
Ejemplo: Si P ( Z ) = 0.4429 entonces el valore de Z es?
De la tabla obtenemos que Z = 1.58
Determina Z si P ( Z ) = .7580. Este valor es mayor que 0.5 correspondiente a la mitadde la grfica por lo tanto hacemos la siguiente transformacin:
P ( Z) = 0.5 + P ( Z ) P (Z1 ) = P ( Z ) 0.5 = 0.7589 0.5 = 0.2589
P ( Z1 ) = 0.2589
En la tabla nos situamos en este valor y en la columna 1 est el valor de Z = 0.70
Si la probabilidad de z a la izquierda de la media es P ( Z ) = 0.1331, entonces Z es?
=0 Z Z
=0 Z1 Z
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
31/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
32/92
32
EJEMPLO:
Con los siguientes valores, calcula la probabilidad de la distribucin binomial y traza e
polgono de frecuencia de cada una.
1) n = 10, p = 0.2, q = 0.8, x = 0, 1, 2, . . . 102) n = 10, p = 0.8, q = 0.2, x = 0, 1, 2, . . . 103) n = 10, p = 0.5, q = 0.5, x = 0, 1, 2, . . . 10
Para el problema 1 sustituimos valores en ( 6 ) y obtenemos:
10 0 10F( 0 ) = ( 0 ) ( 0.2 ) ( 0.8 ) = ( 1 ) ( 1 ) ( 0.1073 ) = 0.1073
10 1 9
F( 1 ) = ( 1 ) ( 0.2 ) ( 0.8 ) = ( 10 ) ( 0.2 ) ( 0.1342 ) = 0.268410 2 8
F( 2 ) = ( 2 ) ( 0.2 ) ( 0.8 ) = ( 45 ) ( 0.04 ) ( 0.1677 ) = 0.3019
10 3 7F( 3 ) = ( 3 ) ( 0.2 ) ( 0.8 ) = ( 120 ) ( 0.0008 ) ( 0.2097 ) = 0.2013
10 4 6F( 4 ) = ( 4 ) ( 0.2 ) ( 0.8 ) = ( 210 ) ( 0.0016 ) ( 0.2621 ) = 0.0881
10 5 5F( 5 ) = ( 5 ) ( 0.2 ) ( 0.8 ) = ( 252 ) ( 0.00032 ) ( 0.3276 ) = 0.0264
Calcula los siguientes valores:
F( 6 ) =
F( 7 ) =
F( 8 ) =
F( 9 ) =
F( 10 ) =
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
33/92
33
Clculo del segundo problema:
10 0 10F( 0 ) = ( 0 ) ( 0.8 ) ( 0.2 ) = ( 1 ) ( 1 ) ( 0.000000102 ) = 0.0000001
10 1 9F( 1 ) = ( 1 ) ( 0.8 ) ( 0.2 )= ( 10 ) ( 0.8 ) ( 0.000000512 ) = 0.0000009
10 2 8F( 2 ) = ( 2 ) ( 0.8 ) ( 0.2 ) = ( 45 ) ( 0.64 ) ( 0.000002 ) = 0.0000737
10 3 7F( 3 ) = ( 3 ) ( 0.8 ) ( 0.2 ) = ( 120 ) ( 0.512 ) ( 0.000012 ) = 0.0008
10 4 6F( 4 ) = ( 4 ) ( 0.8 ) ( 0.2 ) = ( 210 ) ( 0.4096 ) ( 0.000064 ) = 0.0055
10 5 5F( 5 ) = ( 5 ) ( 0.8 ) ( 0.2 ) = ( 252 ) ( 0.3276 ) ( 0.00032 ) = 0.02642
Calcula los siguientes valores:
F( 6 ) =
F( 7 ) =
F( 8 ) =
F( 9 ) =
F( 10 ) =
Clculo para el tercer problema:
10 0 10f( 0 ) = ( 0 ) ( 0.5 ) ( 0.5 ) = ( 1 ) ( 1 ) ( 0.00097 ) = 0.0009
10 1 9f( 1 ) = ( 1 ) ( 0.5 ) ( 0.5 )= ( 10 ) ( 0.5 ) ( 0.00195 ) = 0.009
10 2 8f( 2 ) = ( 2 ) ( 0.5 ) ( 0.5 ) = ( 45 ) ( 0.25 ) ( 0.0039 ) = 0.039
10 3 7f( 3 ) = ( 3 ) ( 0.5 ) ( 0.5 ) = ( 120 ) ( 0.125 ) ( 0.00781 ) = 0.1172
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
34/92
34
10 4 6f( 4 ) = ( 4 ) ( 0.5 ) ( 0.5 ) = ( 210 ) ( 0.0625 ) ( 0.0156 ) = 0.2051
10 5 5f( 5 ) = ( 5 ) ( 0.5 ) ( 0.5 ) = ( 252 ) ( 0.03125 ) ( 0.03125 ) = 0.2461
f( 6 ) =
f( 7 ) =
f( 8 ) =
f( 9 ) =
f( 10 ) =
Representacin grfica de las probabilidades de cada uno de los problemas:
Para poder trazar la grfica como si fuese una variable continua, cerramos los espaciosentre cada barra del histograma, para ello tomemos medio punto despus de cada valorpara obtener el lmite real superior de clase.
Grfica del problema 1.
La grfica 1 es asimtrica y sesgada a la derecha-
p < q
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
35/92
35
Grfica del problema 2.
La grfica 2 es antisimtrica y sesgada a la izquierda.
Grfica del problema 3.
La grfica 3 es simtrica muy parecida a la campana de Gauss.
p > q
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
36/92
36
1.1.3 APROXIMACIN NORMAL A LA DISTRIBUCIN BINOMIAL
En el fascculo anterior estudiaste el clculo de probabilidades de variables discretascuya distribucin es binomial.
Veamos la representacin grfica de una variable de distribucin binomial cuandon ( nmero de elementos de la poblacin ) aumenta.
n = 5 n = 11 n = 15 n = 50
En las grficas anteriores podemos ver si n aumenta, los espacios entre las barras sevan cerrando y la grfica se aproxima a la campana de Gauss que es la grfica de unavariable aleatoria continua.
Veamos el clculo de los siguientes problemas correspondientes a una dis tribucinbinomial definida por la ecuacin:
xnx ppx
nxf
= )1()(
n = Nmero de observacionesx = Nmero de xitos esperadosp = Probabilidad de xitoq = 1-p = Probabilidad de fracaso
Con estos ejemplos podrs notar que el clculo en la distribucin binomial, es muylaborioso, aunque existen tablas para algunos valores; pero no son suficientes cuandon crece.
Por ejemplo si en un problema de distribucin binomial se han realizado 100observaciones y se desea saber la probabilidad de obtener al menos 45 xitos.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
37/92
37
Para determinar esta probabilidad tenemos que calcular
f ( 45 ) + f ( 46 ) + f ( 100 ) = P( x ) . . . ( 7 )
Otra forma de calcular esta Probabilidad es restndole a la unidad las probabilidades dela siguiente forma:
P (x ) = 1 [ f ( 0 ) + f ( 1 ) + f ( 2 ) + . . . + f ( 44 ) ] . . . ( 8 )
Una forma de ahorrar este trabajo laborioso es haciendo el clculo de probabilidades pormedio de la distribucin normal.
Ya vimos en las grficas anteriores cmo el polgono de frecuencias de un problema dedistribucin binomial se aproxima a la campana de Gauss, por lo tanto podemos usar ladistribucin normal para calcular una probabilidad binomial con una aproximacinaceptable.
Se recomienda usar la distribucin cuando n es grande y P se aproxima al valor de 0.5.se considera que n es grande si n>30
Para usar la distribucin normal se calculan los parmetros aplicando las siguientesecuaciones:
= np . . . ( 9 )
)1( pnp = . . . ( 10 )
Veamos el siguiente ejemplo:
Determinar la probabilidad de obtener 6 guilas en 15 lanzamientos de una monedaequilibrada y comparar el resultado mediante la distribucin normal.
Solucin:
f (x ) = f ( 6 ) = 152700000305050052
1
6
15
2
11
2
1
6
15 156156 .).()()()( ==
=
f ( x ) = 0.1527
Solucin usando la distribucin normal.
Para aplicar esta distribucin corregimos los espacios para considerar a la variable comosi fuese continua o sea para 6 guilas tomamos medio punto antes y medio puntodespus, es decir:
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
38/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
39/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
40/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
41/92
41
DEFINICIN:
Se llama muestreo aleatorio de una poblacin finita de n elementos, si cada muestratiene la misma probabilidad de ser seleccionada y cada elemento de la poblacin tiene la
misma probabilidad de ser incluido en la muestra.
Los tipos de muestras aleatorias son:
1. Muestreo sistemtico.2. Muestreo estratificado.3. Muestreo por conglomerados.4. Muestreo aleatorio simple.
En lo que sigue nos ocuparemos de cada uno de ellos.
Muestreo SistemticoEn este muestreo los elementos de la poblacin se seleccionan con un intervalouniforma que se mide en el tiempo, en el espacio o en el orden.
Ejemplo:
Se desea entrevistar a cada dcimo estudiante del S.E.A. del Plantel 2 del Colegio deBachilleres, para ello se toma una lista de todos los estudiantes. Supongamos queescogimos el 5., entonces el siguiente ser de los 10 primeros seleccionados al azar y apartir de este vamos tomando los nmeros dcimos de toda la lista.
Este muestreo tiene ventajas y desventajas.
a) Ventajas:
1. Cada elemento de la poblacin tiene la misma probabilidad de ser seleccionado.
2. El muestreo requiere de poco tiempo.
3. El costo es reducido.
b) Desventajas:
1. No todas las muestras tienen la misma probabilidad de ser seleccionadas.
2. Debido a lo anterior se puede cometer el grave error de tomar una muestra que
no sea representativa, por ejemplo:
Se muestrea un determinado nmero de familias para saber si el mircoles estincluido un platillo de carne de res en su alimentacin. La respuesta es negativaporque solamente el domingo la consume ya que es el da en que van al puebloa comprarla. Esta forma de tomar la muestra no es representativa.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
42/92
42
Muestreo estratificado
Para este muestreo, dividimos la poblacin en grupos homogneos llamados
estratificados. Determinamos la proporcin correspondiente de cada estrato enbase a la poblacin y esta misma proporcin se toma cada estrato para formar lamuestra.
Este mtodo es til cuando la poblacin ya esta dividida en grupos.
Por ejemplo:
Los estudiantes del S.E.A. del plantel 2 del Colegio de Bachilleres estndivididos por edades con intervalos de 5 aos y los porcentajes son lossiguientes:
de 18 a 23 30%
de 24 a 29 25%de 30 a 35 20%de 36 a 41 10%de 42 a 47 7%de 48 a 53 5%de 54 y mas 3%
Se desea saber cuantas horas estudian diariamente; para ello de cada grupo setoma un porcentaje igual al del grupo, es decir del primer grupo tomamos el 30%del grupo. De la misma forma se toma el porcentaje de los siguientes grupospara formar la muestra representativa para su estudio.
Muestreo con Conglomerados
Para este tipo de muestreo, dividimos a la poblacin en grupos conglomerados yde estos seleccionamos una muestra aleatoria, para su estudio.
Por ejemplo:
En una investigacin de mercados se desea saber el nmero de coches porfamilia de la ciudad de Mxico. Para ello dividimos las colonias en manzanas yde este nmero seleccionamos aleatoriamente un nmero de manzanas paraentrevistar a cada familia.
Muestreo Aleatorio Simple
El muestreo aleatorio simple tiene las caractersticas establecidas en ladefinicin dada en la pgina 30. Es el muestreo ms recomendable para elestudio estadstico, solamente que tiene sus inconvenientes.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
43/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
44/92
44
En el 2 caso cada muestra debe tener161700
1de probabilidad de ser seleccionada.
Cmo debemos tomar cada muestra para que sea representativa?
Hay varias formas de tomar la muestra. Estas formas son las siguientes: en el primercaso cuando el nmero de muestras no es muy grande se pueden numerar recortes depapel, doblarlos y meterlos en un recipiente donde se puedan mezclar ampliamente.Una vez mezclados, se saca la muestra.
Por ejemplo:
En una empresa se premiar con un viaje a Europa a solo 2 de los 5 empleados demayor eficiencia. Cmo seleccionamos a los dos que deben ir?
Solucin:
A cada empleado lo representamos con la primera letra de su nombre.
1. Abraham ( A )2. Dionisio ( D )3. Efran ( E )4. Fausto ( F )5. Ivn ( I )
Determinamos el nmero de muestras
102
20
32
543
252
5
2
5===
=
=
)!(!
!
)!(!
!C
n
NC
P ( n ) =10
1
Cada muestra la escribimos en un recorte de papel y stas son:
1 2 3 4 5 6 7 8 9 10A-D A-E A-F A-I D-E D-F D-I E-F E-I F-I
Doblamos bien el corte de papel de cada muestral, la introducimos en una vasija; la
agitamos ampliamente y extraemos a la pareja afortunada.
Quiz haya visto este procedimiento en el sorteo de los equipos para el campeonatomundial de ftbol. En el sorteo se usaron esferas huecas bisectadas y en su interior secoloc el nombre de cada equipo, se revolvan ampliamente, se sacaba una esfera de lacual se tomaba el nombre del equipo y se colocaba en el grupo correspondiente.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
45/92
45
EJERCICIO:
1) Si para el campeonato mundial de ftbol hay 24 equipos de los cuales se deben
formar 6 grupos de 4. Cmo organizaras los equipos para que cada muestrasea aleatoria? Cmo tomaras cada muestra y qu equipos la compondran?Determina los dos posibles finalistas.
2) Calcula el nmero de muestras de tamao 3 para una poblacin de:
a) 7 elementosb) 15 elementosc) 50 elementos
3) Calcula el nmero de muestras de tamao 5 para una poblacin de:
a) 10 elementos
b) 25 elementosc) 75 elementos
Si tienes alguna duda consulta a tu profesor o a tu consultor acadmico.
5b) Si el nmero de muestras es muy grande como en el ltimo ejercicio 15, que son17,259, 390; la forma explicada con recortes de papel no es la adecuada. Para estoscasos se usa otro procedimiento que consiste en usar una tabla de nmeros aleatorioscomo la que se incluye en el apndice B.
Esta tabla de nmeros aleatorios se puede constituir fcilmente con un programa decomputacin.
Uso de la tabla de nmeros aleatorios.
Para explicar su uso, veamos el siguiente ejemplo:
El Banco Nacional de Mxico tiene una promocin para tarjeta habientes que consiste encondonarles la cuenta a 10 personas de cada sucursal, en la primera quincena del mesde enero de 1994. La lista de cuenta habientes es de 550 y para determinar la muestraaleatoria numeramos cada cliente con tres cifras en orden ascendente esto es: 001,002, 003, ..., 550 y nos situamos al azar en una columna de nmeros aleatorios y nosdesplazamos en ella en la direccin que queramos analizando las tres primeras cifras decada nmero hasta completar los 10 nmeros de la muestra.
Para nuestro ejemplo nos situamos en la ltima pgina de nmeros aleatorios del
apndice B, en la columna 27 rengln 31 y nos desplazamos hacia abajo, los nmerosobtenidos de 3 cifras son:
187, 155, 388, 320, 281, 088, 520, 275, 480 y 273
Como la tabla es de nmeros aleatorios, podemos asegurar que esta muestra es
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
46/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
47/92
47
2 = Varianza de la poblacin:
2
= 5
1[ ( 1 - 5 ) + ( 3 - 5 ) + ( 5 5 ) + ( 7 5 ) + ( 9 5 ) ]
2 = 8 = 8 = 2.83 = 2.83
Nmero de muestras)(!
!C
252
5
2
5
=
= 10
Conjunto de muestras
{(1, 3), (1, 5), (1, 7), (1, 9), (3, 5), (3, 7), (3, 9), (5, 7), (5, 9), (7, 9)}
Conjunto de medias muestrales
{2, 3, 4, 5, 4, 5, 6, 6, 7, 8}
Probabilidad de las medias muestrales
Media de la distribucin de medias muestrales
x = 2 )(10
1+ 3 )(10
1+ 4 )(10
2+ 5 )(10
2+ 6 )(10
2+ 7 )(10
1+ 8 )(10
1
x = 5
Varianza de la distribucin de medias muestrales:
2 = (2-5) )(
10
1+ (3-5) )(
10
1+ (4-5) )(
10
1+ (5-5) )(
10
1+ (6-5) )(
10
1+ (7-
5) )(10
1+ (8-5) )(
10
1
2 = 3 = 3 = 1.73
xProbabilidad
2
3
4
5
6
7
8
110
1
102
10
210
210
110
110
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
48/92
48
De estos resultados concluimos que:
1. La media de la distribucin de mediasx
es igual a la media poblacional ( )
2. La desviacin estndar de la distribucin de medias x es menor que ladesviacin estndar poblacional ().
De este ejemplo podemos ver el error estndar de la media en quex
< , el cual ya
habamos mencionado.
Ilustramos el proceso de la distribucin de media muestrales mediante las siguientesgrficas.
Dada una poblacin de N elementos, sta tiene una media y una desviacin estndar cuya relacin entre ellos se muestra en la grfica siguiente:
Grfica A.
Grfica B.
Distribucin de lapoblacin
Distribucin demedias muestrales
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
49/92
49
De esta poblacin se pueden formar un gran nmero de muestras pero solamentemostramos 4 de ellas para ilustrar el procedimiento.
Con estas grficas podemos darnos mejor idea de la secuencia de operaciones querealizamos para obtener la distribucin de medias muestrales representada por la grficaC. Esta grfica es simtrica y tiene la forma de la curva normal o campana de Gauss.De esta misma grfica podemos constatar que la media poblacional es igual a la mediade la distribucin de medias, lo cual no ocurre con la desviacin estndar en la que hayun error.
La desviacin estndar de la distribucin muestral de medias para poblaciones finitas detamao N, se puede calcular por la ecuacin
1
=
= N
nN
nx . . . (15)
Esta ecuacin se llama error estndar de las medias.
A la raz1
N
nNle llamamos factor de correccin por poblacin finita, toda vez que para
poblaciones infinitas se aplica la ecuacin
=n
x. . . (16)
Si la muestra es al menos el 5% de la poblacin entonces el factor de correccin noafecta porque tiende a la unidad.
Distribucin demedias muestrales
con =x
x < ,=0
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
50/92
50
Veamos el ejemplo que usamos para la distribucin de medias en que:
N = 5 n = 2x
= 3 = 8
Con estos valores sustituimos en la frmula y obtenemos:
x =
2
8
15
25
=2
8
4
3=
)(
)(
42
83
x = 3
De este resultado concluimos que por ser la muestra al menos el 5% de la poblacin, elfactor de correccin no afecta a la distribucin estndar de medias.
EJERCICIO:
1. De una poblacin finita N = { 3, 4, 5, 6, 7, 8 y 9}, se toman muestras aleatorias de2 elementos.
a) Calcula la media y la desviacin estndar de la poblacin, .
b) Calcula el nmero de muestras aleatorias que se pueden formar,establece el conjunto de muestras u determina la probabilidad de cadauna.
c) Construye la distribucin de medias muestrales de la poblacin.
d) Calcula la media, la varianza de la distribucin de medias; valor de ladesviacin estndar de las medias, aplicando la ecuacin del error
estndar.
e) Realiza las grficas de la secuencia de operaciones.
2. Determina el factor de correccin para una poblacin N = 10, 000 con muestrasde n = 100 e indica si afecta o no a la desviacin estndar de la distribucin de
medias muestralesx
.
1.2.2 EL TEOREMA CENTRAL DEL LMITE
En los ejemplos anteriores qued establecido que las muestras aleatorias tomadas deuna poblacin tienen diferentes medias y comparadas con la media muestral, hay undeterminado error.Con respecto a este error, el teorema de Chebyshev dice:
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
51/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
52/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
53/92
53
Veamos el siguiente ejemplo:
Si tomamos a x como estimacin de , cmo es el error estndar de la media si n=50se incrementa a n=200.
Solucin:
2
1
4
1
200
50
200
50 ===
=
50
200
Con este ejemplo podemos vera que al aumentar el valor de (n), el error de la mediadisminuye; en nuestro ejemplo disminuy la mitad.
Si la naturaleza del problema que se est resolviendo tiene distribucin normal, entonces
el teorema del lmite central cobra mayor importancia en el clculo del error estndar dela media. Veamos el siguiente ejemplo:
Dada una poblacin normal de =100 y =25, formamos muestras de 5elementos ydeterminamos la media de cada muestra X. Sin duda la media de cada muestra esmayor que la media poblacional y la desviacin estndar de la distribucin muestral esmenor que la de la poblacin, porque la dispersin de la muestra es menor que la de lapoblacin. Grficamente lo podemos ver de la siguiente forma:
Figura 10.
La grfica A es la distribucin muestral de la poblacin =100 y =25.
La grfica B es la distribucin de las medias maestrales con n=5 y _
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
54/92
54
Ahora formemos muestras con n=20 y la grfica de esta nueva distribucin de mediasmaestrales es la C
Figura 11.
De la grfica C concluimos que al aumentar el valor de (n) estamos intensificando elefecto de promediar la muestra y por ello la dispersin disminuye an ms, es decir enla grfica C _
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
55/92
55
2. En los equipos de deteccin de la contaminacin por humo, se usan pequeasbateras cuya duracin tiene una desviacin =77 horas. Se utiliza la media de unamuestra de tamao n=49 para estimar la media poblacional. Mediante la aplicacindel lmite central, qu podemos decir acerca de la probabilidad de que la estimacin
tenga un error?
a) Menor de 10 horas?b) Menor de 20 horas?
1.2.3 DISTRIBUCIN T DE STUDENT
En la inferencia estadstica se hacen generalizaciones con base en muestras, medianteestimaciones y pruebas de hiptesis.
La estimacin consiste en asignar un valor numrico a un parmetro de una poblacinsobre la base de datos de muestras; y la prueba de hiptesis est basada en laaceptacin o rechazo de suposiciones concernientes a los parmetros de una poblacin.
En el subtema 3.2.2 se hicieron estimaciones de medias poblacionales a travs demedias maestrales cuando el tamao de la muestra es grande (Teorema del lmitecentral).
Sin embargo, cuando la muestra involucrada es pequea es muy probable que ladesviacin tpica muestral S sea bastante distinta de la desviacin tpica de la poblacin; en consecuencia en estos casos no se puede utilizar el teorema central del lmite paraestimar la media de una poblacin a travs de la media de una muestra. En estos casosse utiliza otra distribucin llamada t de Student.
La teora de las muestras pequeas sacadas de una poblacin normal de desviacintpica desconocida, fue descubierta por el ingls William Gosset en 1908 con elseudnimo de Student.
La distribucin t de Student se representa mediante la expresin:
ns/
-Xt
= , ..(12)
donde:
X = media de la muestra
= media de la poblacins = desviacin tpica de la muestran = tamao de la muestra
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
56/92
56
La distribucin t de Student se basa en la consideracin de que la poblacin a partir de lacual se obtiene la muestra tiene una distribucin normal, al menos aproximadamentenormal.
Con la distribucin Student es posible estimar parmetros de una poblacin a partir delos estadsticos calculados para una muestra cuando sta es pequea.
Dicha estimacin puede ser puntual o por intervalos.
La estimacin es puntual cuando se estiman parmetros empleando valores de unamuestra nica; y por intervalos cuando se establece un rango de valores dentro de loscuales se espera que el parmetro caiga.
Como ejemplo para ilustrar un problema en la estimacin de medias, considrese unestudio en el cual un mdico desea determinar el incremento promedio real del pulsocardiaco de una persona que realiza cierta tarea ardua. Los siguientes datos representanlos incrementos de pulso cardiaco en pulsaciones por minuto que el mdico obtuvo en
relacin con 32 personas:27, 25, 19, 28, 35, 23, 24, 22,14, 30, 32, 34, 23, 26, 29, 27,27, 24, 31, 22, 23, 38, 25, 16,32, 29, 26, 25, 28, 26, 21, 28.
Calculando la media de la muestra se obtiene que X =26.2 pulsaciones por minuto y enausencia de otra informacin este nmero sirve como estimador de la media de lapoblacin .
Una estimacin de este tipo es una estimacin puntual ya que consta de un solo nmero.Pero esta manera de estimar un parmetro no es la ms confiable ya que no nos dice en
cuanta informacin se basa la estimacin y tampoco nos dice nada acerca del posibletamao del error. Una estimacin por intervalos es mucho ms til que una estimacinpuntual, debido a que posee ms informacin; no solo da el valor estimado, sino tambinla precisin y el nivel de confianza.
Propiedades de la distribucin T - Student
Comparando la variable normal estandarizada Z=n/
-X
y la variable t de student,
t=n/s
-X se observa que son similares y que el nico cambio est en el denominador
donde se sustituye S en lugar de .
Como la distribucin normal estndar Z, la distribucin t tambin es continua, en formade campana y perfectamente simtrica. La nica diferencia entre las dos distribuciones,es que la distribucin t tiene mayor variabilidad; la curva t est ms extendida en la partede las clases y es ms achatada en la zona del centro.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
57/92
57
En la siguiente figura se comparan los dos tipos de curvas.
Figura 12.
La siguiente figura muestra el comportamiento de la distribucin t comparada con la
distribucin Z.
g.l = grados de libertad.
Figura 13.
De la figura se puede observar que conforme aumenta el tamao de la muestra, la curvat se aproxima a la curva normal; cuando el tamao de la muestra n tiende a infinito, lacurva t es idntica a la curva normal. Tambin de la figura se puede afirmar que no hayuna sola distribucin para la distribucin t de Student, sino una familia de distribuciones;esto es debido al efecto del tamao de la muestra. Si n es pequea, la t de Student
correspondiente es muy ancha, pero si n30, la distribucin t y la normal Z son casiindistinguibles. De todo lo anterior se pueden establecer propiedades de la distribucinde t de Student.
CURVA Z
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
58/92
58
Caractersticas de la distribucin t de Student
1. Es simtrica con respecto a la media2. Tiene media =0 y >1
3. La desviacin tpica
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
59/92
59
EJEMPLO:
Z0.05, significa que estamos dispuestos a tolerar un 5% de error.
Hallando este nivel de confianza en una grfica, se tiene:
Figura 14.
En las tablas del rea bajo la curva normal se obtiene Z2=1.96; y como la curva essimtrica, Z1=-1.96.
Lo anterior significa que el 95% de las diferencias maestrales cae entre -1.96 y 1.96desviaciones estndares.
En base al ejemplo anterior, obtener Z0.01 y representarlo en una grfica.
EJEMPLO:
Un experto en mecnica utiliza la media de una muestra aleatoria de tamao n=30 paraestimar el tiempo promedio que le toma a un mecnico realizar cierta tarea. Si con baseen la experiencia, el experto puede suponer f=2.5 minutos para estos datos, qu sepuede decir con un nivel de confianza del 1% acerca del tamao mximo de su error?
SOLUCIN:
n = 30 = 2.5 = 1% = 0.01 = /2 = 0.005
Utilizando las tablas del rea bajo la curva normal se tiene:
Z0.005 = 2.57
Sustituyendo estos datos en la frmula E = Z/2 x
se tiene:
E = (2.57) 1.175.477
6.425
).(==
30
52
Z1 =0 ZzZ
= 0.05
2
= 0.025
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
60/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
61/92
61
Sustituyendo los datos de la frmula:
E
/2Zn
2
=
se tiene
2
300
=
.
(1.50)(1.96)n = 96.04
Se requiere una muestra aleatoria de tamao n=96 para la estimacin.
EJERCICIO:
1. En un estudio de los hbitos de ver televisin, se busca estimar el nmero de horasen promedio que los alumnos de bachillerato ven televisin por semana. Si esrazonable suponer = 3 horas, de qu tamao deber ser la muestra de maneraque se pueda afirmar con la probabilidad de 0.99 que la media de la muestra fallarcuando mucho en 35 minutos?
Intervalos de confianza
Anteriormente ya se dijo que para estimar parmetros, lo ms adecuado es formar unintervalo de confianza, el cual generalmente incluir al parmetro por estimar.
Como ya vimos al estimar en base a la media de la muestra X , la estimacin no serperfecta; es decir, siempre habr un margen de error, tal que:
= X error muestral;
pero ya vimos que el mximo error muestral que se puede cometer es E =n
Z
2, por
lo tanto podemos escribir:
n
2
ZX
= .(17)
donde:
X = media muestral
2
Z
= Es el valor de Z para el cual el rea bajo la curva normal a la
derecha de Z es /2 = Nivel de confianza
n
= Desviacin tpioca de la media
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
62/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
63/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
64/92
64
= X 2.58n
= 70 (2.58)
40
2
= 70 (2.58) (0.82)
o sea:
69.18 70.82
El gerente, al recibir el informe, observa que este resultado cae muy cerca del extremodel rango aceptable (de 68.3 ________), pide que se aumente la precisin del intervalode confianza del 0.82 a 0.50, preservando el nivel de confianza en 99%. Qu haras t?
SOLUCIN:
Hay que determinar el tamao de la muestra necesaria para alcanzar la precisin de E =0.50.
2
=
E
/2Zn podemos tomar = 5
106.50(10.32)0.50
5.16
.
(2)(2.58)n 2 ==
=
=
22
500
Entonces nos bastara una muestra de 107 piezas. Como ya tenamos 40 piezas, semanda completar la muestra probando la dureza de 67 piezas adicionales. Se calculanlas nuevas X y S en base a la muestra total y se obtiene el nuevo intervalo de confianzaa 99% con precisin de 0.50.
EJERCICIO:
La actividad de ciertas vacunas puede mediarse nicamente a travs de pruebas enorganismos vivos (conejos por ejemplo). Este procedimiento es costos y tardado, peroesencial para asegurar el funcionamiento correcto de estas vacunas.
a) Si la muestra de 30 pruebas dio un ndice medio de actividad de X = 880 unidadescon S = 110, forma un intervalo de confianza de 95% para la actividad media de lavacuna.
b) Calcula el tamao de muestra total necesaria para tener un error de estimacinE 25 unidades con 99% de confianza.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
65/92
65
Confiabilidad de Promedios en Muestras Pequeas
Anteriormente ya se compar la distribucin Z con la distribucin t de Student.
Si en la distribucin Z =n/
-X
, se reemplaza t por Z y por S se tiene la distribucin:
t =n/
-X
distribucin de Student.
Esta distribucin se utiliza para estimar parmetros para muestras pequeas.
Los intervalos de confianza se forman de la misma manera que en la distribucin Z.
La forma de la curva de la distribucin t de Student est basada en el nmero de grados
de libertad (g. l. = n-1), en lugar del tamao n de la muestra. A medida que aumenta elnmero de grados de grados de libertad, la curva de la distribucin t es menos variable.
Una muestra la vamos a considerar pequea cuando sea n
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
66/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
67/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
68/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
69/92
69
Pruebas de hiptesis
Al hacer inferencias de caractersticas de poblaciones a travs de muestras se utilizanlos mtodos de Estimacin y Pruebas de Hiptesis.
Cuando se analizan caractersticas de poblaciones por el mtodo de pruebas dehiptesis, es necesario tener en cuenta los siguientes conceptos:
NIVEL DE CONFIANZA. Es el nivel de error que se est dispuesto a tolerar.
ESTADSTICO DE PRUEBA. Es una variable aleatoria cuyo valor se utiliza para llegar ala decisin de rechazar o no la hiptesis nula.
REGIN CRTICA. Es el conjunto de valores para el estadstico de prueba que llevar arechazar la hiptesis nula.
REGIN DE ACEPTACIN. Es el conjunto de valores para el estadsticos de prueba
que provocar la aceptacin de la hiptesis nula.VALOR CRTICO. Es el valor que separa a la regin de rechazo y la regin deaceptacin.
HIPTESIS ESTADSTICA. Es una afirmacin o conjetura acerca del parmetro oparmetros de una poblacin.
La siguiente grfica muestra el valor crtico, la regin de rechazo y la regin deaceptacin.
Figura 17.
Se ha aprendido a estimar la media de una poblacin , dando un intervalo de confianza
o acompaando la estimacin de punto X con una evaluacin del error posible. Ahoraaprenders cmo demostrar una hiptesis referente a la media de una poblacin ; esdecir, se presentarn mtodos para decidir si se acepta o se rechaza una afirmacinacerca de un valor especfico de .
Estos conceptos sern abordados en la siguiente unidad, preprate para acceder a ellos.
REGIN DE VALOR REGIN DE VALOR REGIN DERECHAZO CRTICO ACEPTACIN CRTICO RECHAZO
1-
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
70/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
71/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
72/92
72
PROBLEMA
II. Los datos dados a continuacin corresponden a incrementos de pulso cardiaco enpulsaciones por minuto que un mdico determina en relacin con diez personas
que realizan una tarea ardua:
27, 14, 27, 32, 25, 30, 24, 29, 19, 32
a) estimar el incremento promedio real del pulso cardiaco de una persona querealiza una tarea ardua, mediante el estimador puntual X.
b) Estimar el alejamiento de las pulsaciones por minuto con respecto alpromedio, utilizando un estimador puntual.
c) Determinar el nmero de grados de libertad para la muestra dada.
d) Determinar el error mximo que se comete al estimar el incremento
promedio del pulso cardiaco de una persona mediante el estimador puntualX, con un nivel de confianza del 95%.
e) Obtener el tamao que deber tener la muestra, de tal manera que alemplear la media X, de una muestra para estimar el incremento promediodel pulso cardiaco de una persona, se tenga un error mximo de 25pulsaciones por minuto con un nivel de confianza de 95%.
f) Construir un intervalo con un nivel del 99% en relacin con el incrementopromedio real del pulso de personas que realizan la tarea dada.
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
73/92
73
Los resultados que debiste obtener son los siguientes, si alguno no coincide, entoncesrevisa tus clculos, localiza el error y corrgelo.
SOLUCIN DEL PROBLEMA I
1) = 47.1 2) Mo = 48.7 3) Md = 50.6
4) = 64.2 5) = 9.04
6) TABLA DE FRECUENCIAS
CLASE Xm Fi Fa XmFi Xm- X (Xm- X )2 Fi(Xm- X )2
60-6257-5954-5651-5348-5045-4742-4439-4136-3833-3530-3227-29
615855524946434037343128
5101518201714108643
5153048688599
109117123127130
30558082593698078260240029620412484
6118
13.910.97.94.91.9
-1.1-4.1-7.1
-10.1-13.1-16.1-19.1
193.21118.81
62.124.013.611.21
16.8150.41
102.01171.61259.21364.81
966.51188.1936.2432.272.220.6
235.3504.1816.1
1029.71036.81094.48332.2
47.1130
6118
n
XmfiX ==
=
129
833.2
1-130
8332.2
1-n
)X-(Xmfi ==
= 2 = 64.6
8.0464.590698 ==
Mo = 47.5 + 3 5
647.5 =+=
+ 322
48.7
Md = 48 + 320
5148
20
48-=+=
2
130
50.6
AUTOEVALUACIN
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
74/92
74
7) TABLA DE NORMALIZACIN PARA EL AJUSTE DE CURVAS
CLASE fi Ls. X = Xi -
X
Z =
IX
DEBAJO ENCIMA fe Fe. red.
60-6257-5964-5651-5348-50
45-4742-4439-4136-3833-3530-3227-29
510151820
1714108643
62.559.556.553.550.5
47.544.541.538.535.532.529.5
15.412.49.46.43.4
0.4-2.6-5.6-8.6
-11.6-14.6-17.6
1.921.541.120.800.42
0.05-0.32-0.70-1.07-1.44-1.82-2.19
0.97260.93820.86860.78810.6628
0.51990.37450.24200.14230.07490.03440.0143
0.03440.06960.08050.12530.1429
0.14540.13250.09970.06740.04050.02010.0143
4.479.05
10.4716.2918.58
18.9017.2312.968.765.272.611.86
4.59.1
10.516.318.6
18.917.213.08.85.32.61.9
X = 47.1
= 8.04
N = 130
POLGONO DE FRECUENCIAS
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
75/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
76/92
76
Este error que se comete al estimar a travs de X se determina mediante lafrmula:
E = t /2 n
Donde:
E = errort /2 = rea bajo la curva a la derecha de /2 = desviacin estndar de la poblacinn = N de datos
NOTA: Recuerda que en ausencia de se puede utilizar s.
= 0.05 /2 = 0.025
De las tablas de la distribucin t de Student y tomando g. l. = 9, se tiene:
t(0.025) = 2.262
E = 2.2623.162
30512.
.=
10
445= 3.89
E = 3.89
Esto significa que podemos asegurar con un grado de confianza del 95% que elerror que se comete al estimar a travs de X es menor de 3.89 pulsaciones porminuto.
La confiabilidad de X como estimador de la media de la poblacin depende deltamao de la muestra y el tamao de la desviacin estndar de la poblacin.
b) Para estimar el alejamiento promedio de las pulsaciones por minuto con respectoal incremento promedio real existen varios estimadores. Los ms usuales son: ladesviacin media, varianza y desviacin estndar.
De ellos utilizaremos el estimador s (desviacin estndar de la muestra).
Dado que generalmente no se conoce el parmetro, que es la desviacin estndarde la muestra; es estadstico s (desviacin estndar de lamuestra), puede servircomo estimador de .
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
77/92
77
X f X2 fix2
1419
242527293032
11
112112
196361
576625729841900
10245252
196361
5766251458841900
20487005
s = 29.69670.81-700.5).( == 292510
7005= 5.44
s = 5.44
Esto significa que en promedio el incremento promedio del pulso cardiaco se aleja5.44 pulsaciones por minuto de la media.
c) g. l. = n 1 g. l. = 10 1 = 9
g. l. = 9
d) Sabemos que al estimar la media poblacional a travs de la media muestral Xexiste un error, es decir:
= X error muestral
e) Para determinar el tamao que deber tener la muestra con un nivel de confianzadel 95% para tener un error mximo de 2.5 pulsaciones por minuto se utiliza lafrmula:
E = t /2 n
despejando n se tiene
n = E/2t
n =.
(5.44)).( 2=
52
2622(4.922112)2 = 24.22
Para determinar s se utiliza la frmula
S =2
X-N
fx 2
donde N = N de datosf = frecuencia de cada datoX = media de la muestra
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
78/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
79/92
79
APNDICES
APNDICE AREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIN NORMAL EN FUNCIN DEX/
(1)Z
PUNTUACINTIPIFICADA
X
(2)A
REA DESDELA MEDIA
AX
(3)B
REA DE LAPARTE MAYOR
(4)C
REA DE LAPARTE MENOR
(5)Y
ORDENADA
ENX
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
80/92
80
APNDICE AREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIN NORMAL EN FUNCIN DEX/
(1)Z
PUNTUACINTIPIFICADA
X
(2)A
REA DESDELA MEDIA
AX
(3)B
REA DE LAPARTE MAYOR
(4)C
REA DE LAPARTE MENOR
(5)Y
ORDENADA
ENX
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
81/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
82/92
82
APNDICE AREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIN NORMAL EN FUNCIN DEX/
(1)ZPUNTUACINTIPIFICADA
X
(2)AREA DESDE
LA MEDIA
AX
(3)BREA DE LA
PARTE MAYOR
(4)CREA DE LA
PARTE MENOR
(5)YORDENADA
ENX
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
83/92
83
APNDICE AREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIN NORMAL EN FUNCIN DEX/
(1)Z
PUNTUACINTIPIFICADA
X
(2)A
REA DESDELA MEDIA
AX
(3)B
REA DE LAPARTE MAYOR
(4)C
REA DE LAPARTE MENOR
(5)Y
ORDENADA
ENX
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
84/92
84
APNDICE AREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIN NORMAL EN FUNCIN DEX/
(1)ZPUNTUACINTIPIFICADA
X
(2)AREA DESDE
LA MEDIA
AX
(3)BREA DE LA
PARTE MAYOR
(4)CREA DE LA
PARTE MENOR
(5)YORDENADA
ENX
2.69
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
85/92
85
APNDICE AREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIN NORMAL EN FUNCIN DEX/
(1)Z
PUNTUACINTIPIFICADA
X
(2)A
REA DESDELA MEDIA
AX
(3)B
REA DE LAPARTE MAYOR
(4)C
REA DE LAPARTE MENOR
(5)Y
ORDENADA
ENX
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
86/92
86
APNDICE AREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIN NORMAL EN FUNCIN DEX/
(1)Z
PUNTUACINTIPIFICADA
X
(2)A
REA DESDELA MEDIA
AX
(3)B
REA DE LAPARTE MAYOR
(4)C
REA DE LAPARTE MENOR
(5)Y
ORDENADA
ENX
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
87/92
87
APNDICE B
Tabla. Valores crticos de t
t2
n t.100 t.050 t.025 t.010 t.005 d.f
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
88/92
88APNDICE C
NMEROS ALEATORIOS
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
89/92
89
NMEROS ALEATORIOS
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
90/92
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
91/92
91
APNDICE C
NMEROS ALEATORIOS
-
8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra
92/92
DOWNIE, N. M. y HEAT, R. W. Mtodos Estadsticos Aplicados. Ed. Harla.
FREUD, John E. , WILLIAM, Frank J., PERLES. Benjamn M. Estadstica para laAdministracin. Ed. Prentice Hall Hispanoamericana S. A.
GRAY, William A. y OTIS M, Ulm. Probabilidad y Estadstica Elemental. EditorialC.E.C.S.A.
HOEL, Paul G. Estadstica Elemental. Ed. C. E. C. S. A. Mxico, 1976.
KREYSZING, Edwin. Introduccin a la Estadstica Matemtica. Ed. Limusa. Mxico,1981.
LEVN, Richard I. Estadstica para Administradores. Ed. Pretince Hall.
LINCONL L., Chao. Introduccin a la Estadstica. Ed. CECSA. Mxico, 1985.
LINCOYAN Portus, Goviden. Curso Prctico de Estadstica. Ed. McGraw-Hill, Mxico,1985
LIZRRAGA G., Ignacio Manuel. Estadstica. Ed.; McGraw-Hill. Mxico, 1986.
MENDENHALL, William. Trad. SEGAMI, Carlos. Introduccin a la Probabilidad y laEstadstica. Grupo Editorial Iberoamrica. Mxico, 1989.
PARSEN, Emanuel. Teora Moderna de Probabilidad y sus Aplicaciones. Ed. Limusa.Mxico, 1973.
SEYMOR, Lipschutz, Ph. D. Teora y Problemas de Probabilidad. Editorial McGraw-Hill.
BIBLIOGRAFA CONSULTADA