estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra

8/14/2019 estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra

1/92

1

COLEGIODEBACHILLERES

ESTADSTICA DESCRIPTIVAE INFERENCIAL II

FASCCULO 3. FUNCIONES DE DISTRIBUCINNORMAL ESTNDARUNA VISIN ESTTICA

Autores: Emigdio Arroyo CervantesJuan Matus Parra


2/92


3/92

3

INTRODUCCIN 5

PROPSITO 7

CUESTIONAMIENTO GUA 9

CAPTULO 1. FUNCIONES PROBABILSTICASCONTNUAS

11

1.1 DISTRIBUCIN NORMAL ESTNDAR 12

1.1.1 Normalizacin 14

1.1.2 Valores Normalizados Z y rea Bajo la Curva 21

1.1.3 Aproximacin Normal a la Distribucin Binomial 36

1.2 DISTRIBUCIONES MUESTRALES Y TEOREMADEL LMITE CENTRAL 40

1.2.1 Distribuciones Muestrales 401.2.2 El Teorema Central del Lmite 50

1.2.3 Distribucin T-Student 55

RECAPITULACIN 70

ACTIVIDADES DE CONSOLIDACIN 71

AUTOEVALUACIN 73

APENDICES 79

BIBLIOGRAFA CONSULTADA 92

N D I C E


4/92

4


5/92

5

En el fascculo anterior estudiaste las distribuciones de probabilidad binomial y de

Poisson. Estas son distribuciones de variable aleatoria discretas, en que cada valor delas variables se le asigna una probabilidad.

Existen otras distribuciones de probabilidad, las de variables aleatorias continuas cuyadeterminacin de la probabilidad difiere de las anteriores toda vez que las observacionesdel experimento generan un espacio muestral infinito y cada intervalo de este tiene unnmero infinito no numerable de posibles resultados los cuales incluyen valores reales.

De lo anterior podemos concluir que para determinar la probabilidad de una variablealeatoria continua, se desarrolla un mtodo distinto a los anteriores.

En este fascculo estudiars la distribucin normal como modelo de fenmenos

aleatorios en los que se efectan mediciones continuas y te capacitars en el clculo dela probabilidad de fenmenos aleatorios de regularidad estadstica, aplicando para ello,la distribucin normal estndar.

As mismo, estudiars la aplicacin de a distribucin de medias muestrales mediante eluso del Teorema del Lmite Central para muestras grandes y la distribucin de Studenten muestras pequeas.

INTRODUCCIN


6/92

6


7/92


8/92

8


9/92

9

Sabemos que las aguas negras de la Ciudad de Mxico se utilizan para el riego de loscampos de cultivo circunvecinos al Valle de Mxico.

Esta agua negras contienen entre otras sustancias, el cloro en cantidades perjudicialesal sembrado de cereales porque en lugar de beneficiarlo con el riego, lo quema y lo

seca.

Por lo anterior, es necesario darle al agua un tratamiento con el fin de disminuir oeliminar el contenido de cloro. Para ello el Departamento del D.F. tiene establecido unlaboratorio en los colectores de aguas para determinar el contenido de cloro y dar eltratamiento correspondiente antes de abrir las compuertas.

Para el anlisis se toma una muestra de 5 lt. De aguas negras diariamente. Losresultados correspondientes al mes de noviembre de 1993 fueron las que se muestranen la siguiente tabla. Las cantidades de cloro se registran en partes pro milln (ppm).

16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.815.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0

16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3

Usemos estos datos para realizar un recordatorio de los conceptos estudiados en tucurso de Estadstica I. Esto nos servir para abordar los nuevos conceptos queestudiars en este fascculo y para ello realiza el siguiente ejercicio:

1. Ordena los datos en sentido creciente.2. Determina el rango de variacin de los datos.3. Elabora una tabla de frecuencia de datos agrupados de 5 clases.4. Determina la moda, la mediana y la media de la muestra.5. Determina la desviacin estndar.6. Traza el histograma.7. Traza el polgono de frecuencia.

8. Analiza e polgono de frecuencias y determina:a) De qu tipo es (platicrtica, mesocrtica, etc.)b) Determina el sesgo.c) Determina el orden de la media, la moda y la mediana.

9. Analiza la desviacin estndar y determina como es la dispersin de las puntuaciones.

CUESTIONAMIENTO GUA


10/92

10


11/92

11

CAPTULO 1FUNCIONES PROBABILSTICAS

CONTNUAS

En el siglo XVIII a los jugadores profesionales les interesaba conocer a priori, lasprobabilidades de xito en los distintos juegos de azar, para ello acudieron a losmatemticos de la poca en busca de ayuda. Como una respuesta a una necesidadplanteada a los matemticos, en 1973 Abraham DMoavre (1667-1754) es quien obtienepor primera vez la ecuacin matemtica de la curva normal.

La distribucin normal nos permite el clculo de probabilidades de variables aleatoriascontinuas y discretas de cualquier problema de: Ingeniera, Medicina, Ciencias Sociales,Agricultura, Psicologa, Fsica, Qumica, etc.

Otros grandes matemticos contribuyeron dndole impulso, entre ellos podemos citar aFriedrich Gauss (1777-1855) quien perfeccion y la utiliz ampliamente en su teora deerrores de las mediciones fsicas. Laplace la us en el clculo de lo errores de lasobservaciones astronmicas. El matemtico Ruso P.L. Chebyshev estableci variosteoremas relacionados con la curva de la distribucin normal.

Los experimentos realizados pro muchos cientficos, permiten determinar que la mayorparte de las variables aleatorias se pueden estudiar considerando que tiene una funcinde densidad normal.


12/92

12

1.1 DISTRIBUCIN NORMAL ESTNDAR

Retomemos el problema de las aguas negras. Los resultados que debiste obtener son:

R = 1.7 M = 16.01M = 16.05 X= 16.08S = 0.42

El histograma y el polgono de frecuencias son los siguientes:

Fig. 1

Del polgono de frecuencias podemos ver que la curva es asimtrica; est sesgada a laizquierda por lo tanto su asimetra es negativa. Por su puntiagudez es del tipoleptocrtica.

Recordars que los polgonos de frecuencias pueden ser :

1. Simtricos ( Grfica A )

2. Asimtricos ( Grficos B y C )

d) En la asimetra positiva el sesgo es a la derecha (Grfico B)

e) En la asimetra negativa el sesgo es a la izquierda (Grfico C)

15.7215.3715.2 16.08 16.42 16.77

5

10

fi

x0


13/92

13

Fig. 2

1. Los polgonos simtricos se clasifican en :

a) Platicrtico (Grfica A)b) Mesocrtico (Grfica B)c) Leptocrtico (Grfica C)

Fig. 3

De los grficos anteriores podemos concluir que la forma de cada una, est ntimamenterelacionada con las medidas de tendencia central y de dispersin.

En las simtricas, las medidas de tendencia central coinciden en el mismo punto, esdecir = Mo = Md.

fi

x0

ACB

x

fi

CBA0

C

B

A


14/92

14

Las medidas de dispersin son diferentes, de la figura ( 3 ) obtenemos que:

A = B = C

En las asimtricas las medidas de tendencia central son diferentes y lo mismo ocurre conlas de dispersin.

a) Sesgo positivo < Md < Mob) Sesgo negativo > Md > Mo

En cualquier problema de variable aleatoria continua, su polgono de frecuencia esalguna de las grficas anteriores y stas dependen de sus parmetros de tendenciacentral y de dispersin.

La grfica que tiene forma de campana, su media = 0 y = 1, se llama curva normalestndar o campana de Gauss pro haber sido el primer cientfico que us estarepresentacin.

Las curvas simtricas tienen la forma de campana y las asimtricas no tienen esa formapero pueden transformarse a simtricas.

El procedimiento para transformar las curvas asimtricas en simtricas, es mediante unanormalizacin de los datos del problema y que estudiaremos a continuacin.

1.1.1. Normalizacin

El proceso de transformacin de un polgono de frecuencias a una curva normal, sellama normalizacin y para ello se hace un cambio de escala mediante la normalizacino tipificacin de las puntuaciones, es decir, los valores ( x ) se transforman en valores Zmediante la ecuacin de transformacin.

=Xi

Z . . . ( 1 )

Z= Puntuacin normalizada o tipificadaXi = Cada una de las puntuaciones de la poblacin = Media de las puntuaciones de la poblacin

= Desviacin estndar de la poblacin

A B C


15/92

15

Veamos el siguiente ejemplo:

Se desea conocer el peso promedio de los alumnos del turno vespertino del plantel 2 delColegio de Bachilleres. Para ello se toma una muestra representativa de 150 alumnos y

se pesan. Los pesos ya organizados en 13 clases, se muestran en la siguiente tabla defrecuencias:

Clases en kg.fi

30 341

35 395

40 448

45 498

50 5410

55 5918

60 6412

65 6936

70 - 7428

75 7912

80 848

85 893

90 941

Con estos datos anteriores, calcula:

c) La media, yd) La desviacin estndar.e) Traza el polgono de frecuencias.

ACTIVIDAD DE REGULACIN


16/92


17/92

17

Para explicar el procedimiento vamos a construir la siguiente tabla:

Normalizacin de una Distribucin Asimtrica

1 2 3 4 5 6 7 8 9CLASE fi Lr

SUPx=xix Z = x/ PARTE

MAYORPARTEMENOR

fe feredondeada

9094 1 94.5 30.6 2.51 0.9940 0.0119 1.785 1.88589 3 89.5 25.6 2.10 0.9821 0.0276 4.140 4.18084 8 84.5 20.6 1.69 0.9545 0.0548 8.220 8.27579 12 79.5 15.6 1.28 0.8997 0.0919 13.875 13.97074 28 74.5 10.6 0.87 0.8078 0.1306 19.590 19.66569 36 69.5 5.6 0.46 0.6772 0.1573 23.595 23.6

606412 64.5 0.6 0.05 0.5199 0.1605 24.075 24.1

5559 18 59.5 4.4 0.36 0.3594 0.1388 20.820 20.85054 10 54.5 9.4 0.77 0.2206 0.1016 15.240 15.24549 8 49.5 14.4 1.18 0.1190 0.0631 9.465 9.54044 8 44.5 19.4 1.59 0.0599 0.8331 4.965 5.03539 5 39.5 24.4 2.00 0.0228 0.0148 2.220 2.23034 1 34.5 29.4 2.41 0.0080 0.0080 1.200 1.2

Las columnas 1 y 2 corresponden a la clase y la frecuencia establecidas en la primeratabla.

La columna 3 corresponde al lmite real superior de cada clase el cual se determinaaumentando medio punto a cada valor del lmite superior.

La columna 4 es igual a la desviacin de cada puntuacin con respecto a la media y seobtiene mediante la ecuacin:

x = xi x . . . ( 1 )

Se toma como xi, al lmite real superior de cada clase.


18/92

18

La columna 5 es el valor de Z correspondiente a cada puntuacin y se obtiene mediantela ecuacin de normalizacin o tipificacin, esto es:

=

=

xx

x

Z

i

. . . ( 2 )

La columna 6 se determina de los valores de la tabla del apndice ( A ) reas y

ordenadas de la curva de distribucin normal en funcin dex

que posteriormente

ejemplificaremos.

En la primera columna de esta se localiza el valores de z, en la tercera columna se lee elvalor del rea bajo la curva normal de la parte mayor.

En la cuarta columna se lee el rea bajo la curva normal de la parte menor y se registraen la columna siete de nuestra tabla.

EJEMPLO:

Para z = 2.51 el rea de la parte mayor que se lee en la tercera columna es 0.9940.

Para z = 2.41 en la cuarta columna se lee el rea de la parte menor correspondiente a0.0080.

La columna ocho de nuestra tabla corresponde a la frecuencia esperada (fe) y se calculamultiplicando el total de casos N =150 por el rea de la parte menor (columna 7) de cadapuntuacin.

Ejemplo: (0.0119) (150) = 1.785

La columna nueve es la frecuencia esperada (fe) redondeada a una cifra decimal.

Con estos valores de la tabla trazamos el polgono de frecuencias y la curva normalizadapara ver el cambio que sufre el polgono de frecuencias de cualquier problema que senormalizan los datos:


19/92

19

Fig. 5

A = Polgono de frecuencia de los pesos de 150 alumnos del plantel 2 del turnovespertino del Colegio de Bachilleres.

B = Curva normal del mismo problema.

En la escala Z de la figura 5, se determinan los valores de la desviacin tpica ( s ), auno y otro lado de la media ( x ).

Del ejemplo anterior habrs notado que normalizar los datos de un problema esequivalente a cambiar la escala x por la z y calcular las nuevas frecuencias que sonlas ordenadas de cada punto. Para ello usamos los valores de la tabla. Estos valores

corresponden a las reas bajo la curva normal y se han calculado mediante la ecuacinque define a la funcin normal y sta es:

y = f (x) =( ) 2

2

x

e2

1

. . . ( 3 )

S

fi

27 32 37 42 47 52 57 62 67 72 77 82 87 92 970

10

20

30

Z0 27.3 39.5 51.7 S=63.9 76.1 88.3 100.3

A

B


20/92


21/92

21

Y la ecuacin de tipificacin es la ya conocida:

x = + Z Z =x

. . . ( 1 )

Con los datos del problema de las aguas negras, elabora la tabla con los datosnormalizados y traza la curva normal sobre el polgono de frecuencias que ya obtuvisteantes.

1.1.2 VALORES NORMALIZADOS Z Y REA BAJO LA CURVA NORMAL

Ya qued establecido que para normalizar el polgono de frecuencias y transformarlo enuna campana de Gauss, se tipifican las observaciones ( ix ) del problema cambindolosa una escala (Z) mediante la ecuacin (1).

Esta curva normal es necesaria estandarizarla para poder calcular la probabilidadmediante una misma tabla ya elaborada para toda curva normal estandarizada, que seobtiene trasladando la media al origen como ya se indic.

La curva normal estandarizada tiene las siguientes caractersticas:

a) La altura alcanza su valor mximo como = 0 y su valor es 0.4, es decir; el puntomximo es Pm(0,0.4)

b) La curva normal estndar es simtrica con respecto a la media por lo tanto losparmetros de tendencia central son iguales, es decir:

= Mo = Md = 0 . . . ( 5 )



22/92

22

c) La desviacin estndar es = 1

d) El rea bajo la curva es A = 1

Fig. 7

El rea sombreada vale 1 y como la curva es simtrica cada regin a los lados del eje yvale 0.5.

e) El eje Zes una asntota horizontal de la curva ya que lim (z) = 0z

f) El rea ms importante donde se distribuye la probabilidad de un suceso, se encuentracomprendida entre + 3 y esto lo puedes constatar en la siguiente grfica de la Fig. 8.

g) De acuerdo con el teorema de Chebishev relacionado con la desviacin estndar y elrea bajo la curva, podemos establecer los siguientes porcentajes de la misma:

Fig. 8

De esta grfica podemos ver que el rea antes y despus de + 3 corresponde al 1%, esdecir el 0.5% para cada lado de la grfica.

= 0Z

68%

95%

99%

-3 -2 - 32Z

= 0


23/92

23

Por la simetra que tiene la curva normal estndar, existen tablas correspondientes alrea bajo al curva que nicamente contemplan la parte positiva de la grfica y estosmismos valores se usan para el lado negativo.

Ejemplo: Con los siguientes valores de Z determinaremos el valor de rea bajo la curvay trazaremos un esquema del rea correspondiente:

Z = + 0.5, + 0.7, + 1.5

En la primera columna de la tabla localizamos el valor de Z = 0.5 y en la segundacolumna leemos el valor del rea.

Z = 0.5 ; A = 0. 1915

Z = -0.5 , A = 0.1915

Z = 0.7 ; A = 0.2580

= 0 Z= 0.5Z

Z=-0.5 = 0Z

= 0 Z= 0.7Z


24/92

24

Z = -0.7 ; A = 0.2580

Z = 1.5 ; A = 0.4332

Z = -1.5 ; A = 0.4332

De las grficas anteriores podemos ver, que el valor del rea es el mismo para valorespositivos y negativos de Z solamente que para el valor negativo, el rea se representa ala izquierda de la media.

Z=-0.7 = 0Z

= 0 Z= 1.5

Z

Z=-1.5 = 0

Z


25/92

25

Normaliza los valores de X = 4, 6, 9,12,18,20, usando = 10 y = 5. traza una grficapara cada valores de x, comprala con la grfica de los valores normalizados y traza unapara cada Z sombreando en ambas grficas la regin correspondiente.

El rea bajo la curva normal estndar representa la probabilidad de un evento; toda elrea bajo la curva vale uno y representa la probabilidad del evento seguro.

El rea de cada mitad de la grfica, es 0.5

Si queremos la probabilidad de un evento cuyo valor est limitado por dos puntuaciones,por ejemplo:

P ( x, X x2 )

Probabilidad de x comprendida entre x1 y x2.

Para determinar esta probabilidad, tipificamos los valores x.

Sabemos que la curva normalizada de la escala x es equivalente a la curva normallestndar en la escala Z.

P ( x1 x x2) = P ( Z1 Z Z2 )

Determinamos Z1 =

1X P ( Z ) = P ( Z1 ) + P ( Z2 )

Z2 =

2

X

= 0

P(Z) = 0.5

= 0

P(Z) = 0.5



26/92


27/92

27

Si los valores de x estn en la parte negativa de z es decir a la izquierda de la media,entonces los grficos son:

X2 X1 X X Z2 Z1

Si solamente tenemos una X a la derecha de la media entonces el rea bajo la curvaes:

X X1 X =0 Z1 Z

P ( Z ) = P ( Z2 ) P ( Z1 )

P ( Z ) = 0.5 + P ( Z1 )


28/92

28

Recuerda que la primera mitad del rea bajo la curva vale 0.5, es por eso que a laprobabilidad de Z, le sumamos 0.5.

Si nos interesa la probabilidad de x


29/92


30/92

30

Si se conoce la probabilidad de un evento y queremos determinar el valor de Z, entoncesnos situamos en la segunda columna de la tabla ( rea desde la media), localizamos elvalores de la probabilidad y en el mismo rengln y en la misma columna 1 determinamosel valores deZ.

Ejemplo: Si P ( Z ) = 0.4429 entonces el valore de Z es?

De la tabla obtenemos que Z = 1.58

Determina Z si P ( Z ) = .7580. Este valor es mayor que 0.5 correspondiente a la mitadde la grfica por lo tanto hacemos la siguiente transformacin:

P ( Z) = 0.5 + P ( Z ) P (Z1 ) = P ( Z ) 0.5 = 0.7589 0.5 = 0.2589

P ( Z1 ) = 0.2589

En la tabla nos situamos en este valor y en la columna 1 est el valor de Z = 0.70

Si la probabilidad de z a la izquierda de la media es P ( Z ) = 0.1331, entonces Z es?

=0 Z Z

=0 Z1 Z


31/92


32/92

32

EJEMPLO:

Con los siguientes valores, calcula la probabilidad de la distribucin binomial y traza e

polgono de frecuencia de cada una.

1) n = 10, p = 0.2, q = 0.8, x = 0, 1, 2, . . . 102) n = 10, p = 0.8, q = 0.2, x = 0, 1, 2, . . . 103) n = 10, p = 0.5, q = 0.5, x = 0, 1, 2, . . . 10

Para el problema 1 sustituimos valores en ( 6 ) y obtenemos:

10 0 10F( 0 ) = ( 0 ) ( 0.2 ) ( 0.8 ) = ( 1 ) ( 1 ) ( 0.1073 ) = 0.1073

10 1 9

F( 1 ) = ( 1 ) ( 0.2 ) ( 0.8 ) = ( 10 ) ( 0.2 ) ( 0.1342 ) = 0.268410 2 8

F( 2 ) = ( 2 ) ( 0.2 ) ( 0.8 ) = ( 45 ) ( 0.04 ) ( 0.1677 ) = 0.3019

10 3 7F( 3 ) = ( 3 ) ( 0.2 ) ( 0.8 ) = ( 120 ) ( 0.0008 ) ( 0.2097 ) = 0.2013

10 4 6F( 4 ) = ( 4 ) ( 0.2 ) ( 0.8 ) = ( 210 ) ( 0.0016 ) ( 0.2621 ) = 0.0881

10 5 5F( 5 ) = ( 5 ) ( 0.2 ) ( 0.8 ) = ( 252 ) ( 0.00032 ) ( 0.3276 ) = 0.0264

Calcula los siguientes valores:

F( 6 ) =

F( 7 ) =

F( 8 ) =

F( 9 ) =

F( 10 ) =


33/92

33

Clculo del segundo problema:

10 0 10F( 0 ) = ( 0 ) ( 0.8 ) ( 0.2 ) = ( 1 ) ( 1 ) ( 0.000000102 ) = 0.0000001

10 1 9F( 1 ) = ( 1 ) ( 0.8 ) ( 0.2 )= ( 10 ) ( 0.8 ) ( 0.000000512 ) = 0.0000009

10 2 8F( 2 ) = ( 2 ) ( 0.8 ) ( 0.2 ) = ( 45 ) ( 0.64 ) ( 0.000002 ) = 0.0000737

10 3 7F( 3 ) = ( 3 ) ( 0.8 ) ( 0.2 ) = ( 120 ) ( 0.512 ) ( 0.000012 ) = 0.0008

10 4 6F( 4 ) = ( 4 ) ( 0.8 ) ( 0.2 ) = ( 210 ) ( 0.4096 ) ( 0.000064 ) = 0.0055

10 5 5F( 5 ) = ( 5 ) ( 0.8 ) ( 0.2 ) = ( 252 ) ( 0.3276 ) ( 0.00032 ) = 0.02642

Calcula los siguientes valores:

F( 6 ) =

F( 7 ) =

F( 8 ) =

F( 9 ) =

F( 10 ) =

Clculo para el tercer problema:

10 0 10f( 0 ) = ( 0 ) ( 0.5 ) ( 0.5 ) = ( 1 ) ( 1 ) ( 0.00097 ) = 0.0009

10 1 9f( 1 ) = ( 1 ) ( 0.5 ) ( 0.5 )= ( 10 ) ( 0.5 ) ( 0.00195 ) = 0.009

10 2 8f( 2 ) = ( 2 ) ( 0.5 ) ( 0.5 ) = ( 45 ) ( 0.25 ) ( 0.0039 ) = 0.039

10 3 7f( 3 ) = ( 3 ) ( 0.5 ) ( 0.5 ) = ( 120 ) ( 0.125 ) ( 0.00781 ) = 0.1172


34/92

34

10 4 6f( 4 ) = ( 4 ) ( 0.5 ) ( 0.5 ) = ( 210 ) ( 0.0625 ) ( 0.0156 ) = 0.2051

10 5 5f( 5 ) = ( 5 ) ( 0.5 ) ( 0.5 ) = ( 252 ) ( 0.03125 ) ( 0.03125 ) = 0.2461

f( 6 ) =

f( 7 ) =

f( 8 ) =

f( 9 ) =

f( 10 ) =

Representacin grfica de las probabilidades de cada uno de los problemas:

Para poder trazar la grfica como si fuese una variable continua, cerramos los espaciosentre cada barra del histograma, para ello tomemos medio punto despus de cada valorpara obtener el lmite real superior de clase.

Grfica del problema 1.

La grfica 1 es asimtrica y sesgada a la derecha-

p < q


35/92

35


La grfica 2 es antisimtrica y sesgada a la izquierda.


La grfica 3 es simtrica muy parecida a la campana de Gauss.

p > q


36/92

36

1.1.3 APROXIMACIN NORMAL A LA DISTRIBUCIN BINOMIAL

En el fascculo anterior estudiaste el clculo de probabilidades de variables discretascuya distribucin es binomial.

Veamos la representacin grfica de una variable de distribucin binomial cuandon ( nmero de elementos de la poblacin ) aumenta.

n = 5 n = 11 n = 15 n = 50

En las grficas anteriores podemos ver si n aumenta, los espacios entre las barras sevan cerrando y la grfica se aproxima a la campana de Gauss que es la grfica de unavariable aleatoria continua.

Veamos el clculo de los siguientes problemas correspondientes a una dis tribucinbinomial definida por la ecuacin:

xnx ppx

nxf

= )1()(

n = Nmero de observacionesx = Nmero de xitos esperadosp = Probabilidad de xitoq = 1-p = Probabilidad de fracaso

Con estos ejemplos podrs notar que el clculo en la distribucin binomial, es muylaborioso, aunque existen tablas para algunos valores; pero no son suficientes cuandon crece.

Por ejemplo si en un problema de distribucin binomial se han realizado 100observaciones y se desea saber la probabilidad de obtener al menos 45 xitos.


37/92

37

Para determinar esta probabilidad tenemos que calcular

f ( 45 ) + f ( 46 ) + f ( 100 ) = P( x ) . . . ( 7 )

Otra forma de calcular esta Probabilidad es restndole a la unidad las probabilidades dela siguiente forma:

P (x ) = 1 [ f ( 0 ) + f ( 1 ) + f ( 2 ) + . . . + f ( 44 ) ] . . . ( 8 )

Una forma de ahorrar este trabajo laborioso es haciendo el clculo de probabilidades pormedio de la distribucin normal.

Ya vimos en las grficas anteriores cmo el polgono de frecuencias de un problema dedistribucin binomial se aproxima a la campana de Gauss, por lo tanto podemos usar ladistribucin normal para calcular una probabilidad binomial con una aproximacinaceptable.

Se recomienda usar la distribucin cuando n es grande y P se aproxima al valor de 0.5.se considera que n es grande si n>30

Para usar la distribucin normal se calculan los parmetros aplicando las siguientesecuaciones:

= np . . . ( 9 )

)1( pnp = . . . ( 10 )


Determinar la probabilidad de obtener 6 guilas en 15 lanzamientos de una monedaequilibrada y comparar el resultado mediante la distribucin normal.

Solucin:

f (x ) = f ( 6 ) = 152700000305050052

1

6

15

2

11

2

1

6

15 156156 .).()()()( ==

=

f ( x ) = 0.1527

Solucin usando la distribucin normal.

Para aplicar esta distribucin corregimos los espacios para considerar a la variable comosi fuese continua o sea para 6 guilas tomamos medio punto antes y medio puntodespus, es decir:


38/92


39/92


40/92


41/92

41

DEFINICIN:

Se llama muestreo aleatorio de una poblacin finita de n elementos, si cada muestratiene la misma probabilidad de ser seleccionada y cada elemento de la poblacin tiene la

misma probabilidad de ser incluido en la muestra.

Los tipos de muestras aleatorias son:

1. Muestreo sistemtico.2. Muestreo estratificado.3. Muestreo por conglomerados.4. Muestreo aleatorio simple.

En lo que sigue nos ocuparemos de cada uno de ellos.

Muestreo SistemticoEn este muestreo los elementos de la poblacin se seleccionan con un intervalouniforma que se mide en el tiempo, en el espacio o en el orden.

Ejemplo:

Se desea entrevistar a cada dcimo estudiante del S.E.A. del Plantel 2 del Colegio deBachilleres, para ello se toma una lista de todos los estudiantes. Supongamos queescogimos el 5., entonces el siguiente ser de los 10 primeros seleccionados al azar y apartir de este vamos tomando los nmeros dcimos de toda la lista.

Este muestreo tiene ventajas y desventajas.

a) Ventajas:

1. Cada elemento de la poblacin tiene la misma probabilidad de ser seleccionado.

2. El muestreo requiere de poco tiempo.

3. El costo es reducido.

b) Desventajas:

1. No todas las muestras tienen la misma probabilidad de ser seleccionadas.

2. Debido a lo anterior se puede cometer el grave error de tomar una muestra que

no sea representativa, por ejemplo:

Se muestrea un determinado nmero de familias para saber si el mircoles estincluido un platillo de carne de res en su alimentacin. La respuesta es negativaporque solamente el domingo la consume ya que es el da en que van al puebloa comprarla. Esta forma de tomar la muestra no es representativa.


42/92

42

Muestreo estratificado

Para este muestreo, dividimos la poblacin en grupos homogneos llamados

estratificados. Determinamos la proporcin correspondiente de cada estrato enbase a la poblacin y esta misma proporcin se toma cada estrato para formar lamuestra.

Este mtodo es til cuando la poblacin ya esta dividida en grupos.

Por ejemplo:

Los estudiantes del S.E.A. del plantel 2 del Colegio de Bachilleres estndivididos por edades con intervalos de 5 aos y los porcentajes son lossiguientes:

de 18 a 23 30%

de 24 a 29 25%de 30 a 35 20%de 36 a 41 10%de 42 a 47 7%de 48 a 53 5%de 54 y mas 3%

Se desea saber cuantas horas estudian diariamente; para ello de cada grupo setoma un porcentaje igual al del grupo, es decir del primer grupo tomamos el 30%del grupo. De la misma forma se toma el porcentaje de los siguientes grupospara formar la muestra representativa para su estudio.

Muestreo con Conglomerados

Para este tipo de muestreo, dividimos a la poblacin en grupos conglomerados yde estos seleccionamos una muestra aleatoria, para su estudio.

Por ejemplo:

En una investigacin de mercados se desea saber el nmero de coches porfamilia de la ciudad de Mxico. Para ello dividimos las colonias en manzanas yde este nmero seleccionamos aleatoriamente un nmero de manzanas paraentrevistar a cada familia.

Muestreo Aleatorio Simple

El muestreo aleatorio simple tiene las caractersticas establecidas en ladefinicin dada en la pgina 30. Es el muestreo ms recomendable para elestudio estadstico, solamente que tiene sus inconvenientes.


43/92


44/92

44

En el 2 caso cada muestra debe tener161700

1de probabilidad de ser seleccionada.

Cmo debemos tomar cada muestra para que sea representativa?

Hay varias formas de tomar la muestra. Estas formas son las siguientes: en el primercaso cuando el nmero de muestras no es muy grande se pueden numerar recortes depapel, doblarlos y meterlos en un recipiente donde se puedan mezclar ampliamente.Una vez mezclados, se saca la muestra.

Por ejemplo:

En una empresa se premiar con un viaje a Europa a solo 2 de los 5 empleados demayor eficiencia. Cmo seleccionamos a los dos que deben ir?

Solucin:

A cada empleado lo representamos con la primera letra de su nombre.

1. Abraham ( A )2. Dionisio ( D )3. Efran ( E )4. Fausto ( F )5. Ivn ( I )

Determinamos el nmero de muestras

102

20

32

543

252

5

2

5===

=

=

)!(!

!

)!(!

!C

n

NC

P ( n ) =10

1

Cada muestra la escribimos en un recorte de papel y stas son:

1 2 3 4 5 6 7 8 9 10A-D A-E A-F A-I D-E D-F D-I E-F E-I F-I

Doblamos bien el corte de papel de cada muestral, la introducimos en una vasija; la

agitamos ampliamente y extraemos a la pareja afortunada.

Quiz haya visto este procedimiento en el sorteo de los equipos para el campeonatomundial de ftbol. En el sorteo se usaron esferas huecas bisectadas y en su interior secoloc el nombre de cada equipo, se revolvan ampliamente, se sacaba una esfera de lacual se tomaba el nombre del equipo y se colocaba en el grupo correspondiente.


45/92

45

EJERCICIO:

1) Si para el campeonato mundial de ftbol hay 24 equipos de los cuales se deben

formar 6 grupos de 4. Cmo organizaras los equipos para que cada muestrasea aleatoria? Cmo tomaras cada muestra y qu equipos la compondran?Determina los dos posibles finalistas.

2) Calcula el nmero de muestras de tamao 3 para una poblacin de:

a) 7 elementosb) 15 elementosc) 50 elementos

3) Calcula el nmero de muestras de tamao 5 para una poblacin de:

a) 10 elementos

b) 25 elementosc) 75 elementos

Si tienes alguna duda consulta a tu profesor o a tu consultor acadmico.

5b) Si el nmero de muestras es muy grande como en el ltimo ejercicio 15, que son17,259, 390; la forma explicada con recortes de papel no es la adecuada. Para estoscasos se usa otro procedimiento que consiste en usar una tabla de nmeros aleatorioscomo la que se incluye en el apndice B.

Esta tabla de nmeros aleatorios se puede constituir fcilmente con un programa decomputacin.

Uso de la tabla de nmeros aleatorios.

Para explicar su uso, veamos el siguiente ejemplo:

El Banco Nacional de Mxico tiene una promocin para tarjeta habientes que consiste encondonarles la cuenta a 10 personas de cada sucursal, en la primera quincena del mesde enero de 1994. La lista de cuenta habientes es de 550 y para determinar la muestraaleatoria numeramos cada cliente con tres cifras en orden ascendente esto es: 001,002, 003, ..., 550 y nos situamos al azar en una columna de nmeros aleatorios y nosdesplazamos en ella en la direccin que queramos analizando las tres primeras cifras decada nmero hasta completar los 10 nmeros de la muestra.

Para nuestro ejemplo nos situamos en la ltima pgina de nmeros aleatorios del

apndice B, en la columna 27 rengln 31 y nos desplazamos hacia abajo, los nmerosobtenidos de 3 cifras son:

187, 155, 388, 320, 281, 088, 520, 275, 480 y 273

Como la tabla es de nmeros aleatorios, podemos asegurar que esta muestra es


46/92


47/92

47

2 = Varianza de la poblacin:

2

= 5

1[ ( 1 - 5 ) + ( 3 - 5 ) + ( 5 5 ) + ( 7 5 ) + ( 9 5 ) ]

2 = 8 = 8 = 2.83 = 2.83

Nmero de muestras)(!

!C

252

5

2

5

=

= 10

Conjunto de muestras

{(1, 3), (1, 5), (1, 7), (1, 9), (3, 5), (3, 7), (3, 9), (5, 7), (5, 9), (7, 9)}

Conjunto de medias muestrales

{2, 3, 4, 5, 4, 5, 6, 6, 7, 8}

Probabilidad de las medias muestrales

Media de la distribucin de medias muestrales

x = 2 )(10

1+ 3 )(10

1+ 4 )(10

2+ 5 )(10

2+ 6 )(10

2+ 7 )(10

1+ 8 )(10

1

x = 5

Varianza de la distribucin de medias muestrales:

2 = (2-5) )(

10

1+ (3-5) )(

10

1+ (4-5) )(

10

1+ (5-5) )(

10

1+ (6-5) )(

10

1+ (7-

5) )(10

1+ (8-5) )(

10

1

2 = 3 = 3 = 1.73

xProbabilidad

2

3

4

5

6

7

8

110

1

102

10

210

210

110

110


48/92

48

De estos resultados concluimos que:

1. La media de la distribucin de mediasx

es igual a la media poblacional ( )

2. La desviacin estndar de la distribucin de medias x es menor que ladesviacin estndar poblacional ().

De este ejemplo podemos ver el error estndar de la media en quex

< , el cual ya

habamos mencionado.

Ilustramos el proceso de la distribucin de media muestrales mediante las siguientesgrficas.

Dada una poblacin de N elementos, sta tiene una media y una desviacin estndar cuya relacin entre ellos se muestra en la grfica siguiente:

Grfica A.

Grfica B.

Distribucin de lapoblacin

Distribucin demedias muestrales


49/92

49

De esta poblacin se pueden formar un gran nmero de muestras pero solamentemostramos 4 de ellas para ilustrar el procedimiento.

Con estas grficas podemos darnos mejor idea de la secuencia de operaciones querealizamos para obtener la distribucin de medias muestrales representada por la grficaC. Esta grfica es simtrica y tiene la forma de la curva normal o campana de Gauss.De esta misma grfica podemos constatar que la media poblacional es igual a la mediade la distribucin de medias, lo cual no ocurre con la desviacin estndar en la que hayun error.

La desviacin estndar de la distribucin muestral de medias para poblaciones finitas detamao N, se puede calcular por la ecuacin

1

=

= N

nN

nx . . . (15)

Esta ecuacin se llama error estndar de las medias.

A la raz1

N

nNle llamamos factor de correccin por poblacin finita, toda vez que para

poblaciones infinitas se aplica la ecuacin

=n

x. . . (16)

Si la muestra es al menos el 5% de la poblacin entonces el factor de correccin noafecta porque tiende a la unidad.

Distribucin demedias muestrales

con =x

x < ,=0


50/92

50

Veamos el ejemplo que usamos para la distribucin de medias en que:

N = 5 n = 2x

= 3 = 8

Con estos valores sustituimos en la frmula y obtenemos:

x =

2

8

15

25

=2

8

4

3=

)(

)(

42

83

x = 3

De este resultado concluimos que por ser la muestra al menos el 5% de la poblacin, elfactor de correccin no afecta a la distribucin estndar de medias.

EJERCICIO:

1. De una poblacin finita N = { 3, 4, 5, 6, 7, 8 y 9}, se toman muestras aleatorias de2 elementos.

a) Calcula la media y la desviacin estndar de la poblacin, .

b) Calcula el nmero de muestras aleatorias que se pueden formar,establece el conjunto de muestras u determina la probabilidad de cadauna.

c) Construye la distribucin de medias muestrales de la poblacin.

d) Calcula la media, la varianza de la distribucin de medias; valor de ladesviacin estndar de las medias, aplicando la ecuacin del error

estndar.

e) Realiza las grficas de la secuencia de operaciones.

2. Determina el factor de correccin para una poblacin N = 10, 000 con muestrasde n = 100 e indica si afecta o no a la desviacin estndar de la distribucin de

medias muestralesx

.

1.2.2 EL TEOREMA CENTRAL DEL LMITE

En los ejemplos anteriores qued establecido que las muestras aleatorias tomadas deuna poblacin tienen diferentes medias y comparadas con la media muestral, hay undeterminado error.Con respecto a este error, el teorema de Chebyshev dice:


51/92


52/92


53/92

53


Si tomamos a x como estimacin de , cmo es el error estndar de la media si n=50se incrementa a n=200.

Solucin:

2

1

4

1

200

50

200

50 ===

=

50

200

Con este ejemplo podemos vera que al aumentar el valor de (n), el error de la mediadisminuye; en nuestro ejemplo disminuy la mitad.

Si la naturaleza del problema que se est resolviendo tiene distribucin normal, entonces

el teorema del lmite central cobra mayor importancia en el clculo del error estndar dela media. Veamos el siguiente ejemplo:

Dada una poblacin normal de =100 y =25, formamos muestras de 5elementos ydeterminamos la media de cada muestra X. Sin duda la media de cada muestra esmayor que la media poblacional y la desviacin estndar de la distribucin muestral esmenor que la de la poblacin, porque la dispersin de la muestra es menor que la de lapoblacin. Grficamente lo podemos ver de la siguiente forma:

Figura 10.

La grfica A es la distribucin muestral de la poblacin =100 y =25.

La grfica B es la distribucin de las medias maestrales con n=5 y _


54/92

54

Ahora formemos muestras con n=20 y la grfica de esta nueva distribucin de mediasmaestrales es la C

Figura 11.

De la grfica C concluimos que al aumentar el valor de (n) estamos intensificando elefecto de promediar la muestra y por ello la dispersin disminuye an ms, es decir enla grfica C _


55/92

55

2. En los equipos de deteccin de la contaminacin por humo, se usan pequeasbateras cuya duracin tiene una desviacin =77 horas. Se utiliza la media de unamuestra de tamao n=49 para estimar la media poblacional. Mediante la aplicacindel lmite central, qu podemos decir acerca de la probabilidad de que la estimacin

tenga un error?

a) Menor de 10 horas?b) Menor de 20 horas?

1.2.3 DISTRIBUCIN T DE STUDENT

En la inferencia estadstica se hacen generalizaciones con base en muestras, medianteestimaciones y pruebas de hiptesis.

La estimacin consiste en asignar un valor numrico a un parmetro de una poblacinsobre la base de datos de muestras; y la prueba de hiptesis est basada en laaceptacin o rechazo de suposiciones concernientes a los parmetros de una poblacin.

En el subtema 3.2.2 se hicieron estimaciones de medias poblacionales a travs demedias maestrales cuando el tamao de la muestra es grande (Teorema del lmitecentral).

Sin embargo, cuando la muestra involucrada es pequea es muy probable que ladesviacin tpica muestral S sea bastante distinta de la desviacin tpica de la poblacin; en consecuencia en estos casos no se puede utilizar el teorema central del lmite paraestimar la media de una poblacin a travs de la media de una muestra. En estos casosse utiliza otra distribucin llamada t de Student.

La teora de las muestras pequeas sacadas de una poblacin normal de desviacintpica desconocida, fue descubierta por el ingls William Gosset en 1908 con elseudnimo de Student.

La distribucin t de Student se representa mediante la expresin:

ns/

-Xt

= , ..(12)

donde:

X = media de la muestra

= media de la poblacins = desviacin tpica de la muestran = tamao de la muestra


56/92

56

La distribucin t de Student se basa en la consideracin de que la poblacin a partir de lacual se obtiene la muestra tiene una distribucin normal, al menos aproximadamentenormal.

Con la distribucin Student es posible estimar parmetros de una poblacin a partir delos estadsticos calculados para una muestra cuando sta es pequea.

Dicha estimacin puede ser puntual o por intervalos.

La estimacin es puntual cuando se estiman parmetros empleando valores de unamuestra nica; y por intervalos cuando se establece un rango de valores dentro de loscuales se espera que el parmetro caiga.

Como ejemplo para ilustrar un problema en la estimacin de medias, considrese unestudio en el cual un mdico desea determinar el incremento promedio real del pulsocardiaco de una persona que realiza cierta tarea ardua. Los siguientes datos representanlos incrementos de pulso cardiaco en pulsaciones por minuto que el mdico obtuvo en

relacin con 32 personas:27, 25, 19, 28, 35, 23, 24, 22,14, 30, 32, 34, 23, 26, 29, 27,27, 24, 31, 22, 23, 38, 25, 16,32, 29, 26, 25, 28, 26, 21, 28.

Calculando la media de la muestra se obtiene que X =26.2 pulsaciones por minuto y enausencia de otra informacin este nmero sirve como estimador de la media de lapoblacin .

Una estimacin de este tipo es una estimacin puntual ya que consta de un solo nmero.Pero esta manera de estimar un parmetro no es la ms confiable ya que no nos dice en

cuanta informacin se basa la estimacin y tampoco nos dice nada acerca del posibletamao del error. Una estimacin por intervalos es mucho ms til que una estimacinpuntual, debido a que posee ms informacin; no solo da el valor estimado, sino tambinla precisin y el nivel de confianza.

Propiedades de la distribucin T - Student

Comparando la variable normal estandarizada Z=n/

-X

y la variable t de student,

t=n/s

-X se observa que son similares y que el nico cambio est en el denominador

donde se sustituye S en lugar de .

Como la distribucin normal estndar Z, la distribucin t tambin es continua, en formade campana y perfectamente simtrica. La nica diferencia entre las dos distribuciones,es que la distribucin t tiene mayor variabilidad; la curva t est ms extendida en la partede las clases y es ms achatada en la zona del centro.


57/92

57

En la siguiente figura se comparan los dos tipos de curvas.

Figura 12.

La siguiente figura muestra el comportamiento de la distribucin t comparada con la

distribucin Z.

g.l = grados de libertad.

Figura 13.

De la figura se puede observar que conforme aumenta el tamao de la muestra, la curvat se aproxima a la curva normal; cuando el tamao de la muestra n tiende a infinito, lacurva t es idntica a la curva normal. Tambin de la figura se puede afirmar que no hayuna sola distribucin para la distribucin t de Student, sino una familia de distribuciones;esto es debido al efecto del tamao de la muestra. Si n es pequea, la t de Student

correspondiente es muy ancha, pero si n30, la distribucin t y la normal Z son casiindistinguibles. De todo lo anterior se pueden establecer propiedades de la distribucinde t de Student.

CURVA Z


58/92

58

Caractersticas de la distribucin t de Student

1. Es simtrica con respecto a la media2. Tiene media =0 y >1

3. La desviacin tpica


59/92

59

EJEMPLO:

Z0.05, significa que estamos dispuestos a tolerar un 5% de error.

Hallando este nivel de confianza en una grfica, se tiene:

Figura 14.

En las tablas del rea bajo la curva normal se obtiene Z2=1.96; y como la curva essimtrica, Z1=-1.96.

Lo anterior significa que el 95% de las diferencias maestrales cae entre -1.96 y 1.96desviaciones estndares.

En base al ejemplo anterior, obtener Z0.01 y representarlo en una grfica.

EJEMPLO:

Un experto en mecnica utiliza la media de una muestra aleatoria de tamao n=30 paraestimar el tiempo promedio que le toma a un mecnico realizar cierta tarea. Si con baseen la experiencia, el experto puede suponer f=2.5 minutos para estos datos, qu sepuede decir con un nivel de confianza del 1% acerca del tamao mximo de su error?

SOLUCIN:

n = 30 = 2.5 = 1% = 0.01 = /2 = 0.005

Utilizando las tablas del rea bajo la curva normal se tiene:

Z0.005 = 2.57

Sustituyendo estos datos en la frmula E = Z/2 x

se tiene:

E = (2.57) 1.175.477

6.425

).(==

30

52

Z1 =0 ZzZ

= 0.05

2

= 0.025


60/92


61/92

61

Sustituyendo los datos de la frmula:

E

/2Zn

2

=

se tiene

2

300

=

.

(1.50)(1.96)n = 96.04

Se requiere una muestra aleatoria de tamao n=96 para la estimacin.

EJERCICIO:

1. En un estudio de los hbitos de ver televisin, se busca estimar el nmero de horasen promedio que los alumnos de bachillerato ven televisin por semana. Si esrazonable suponer = 3 horas, de qu tamao deber ser la muestra de maneraque se pueda afirmar con la probabilidad de 0.99 que la media de la muestra fallarcuando mucho en 35 minutos?

Intervalos de confianza

Anteriormente ya se dijo que para estimar parmetros, lo ms adecuado es formar unintervalo de confianza, el cual generalmente incluir al parmetro por estimar.

Como ya vimos al estimar en base a la media de la muestra X , la estimacin no serperfecta; es decir, siempre habr un margen de error, tal que:

= X error muestral;

pero ya vimos que el mximo error muestral que se puede cometer es E =n

Z

2, por

lo tanto podemos escribir:

n

2

ZX

= .(17)

donde:

X = media muestral

2

Z

= Es el valor de Z para el cual el rea bajo la curva normal a la

derecha de Z es /2 = Nivel de confianza

n

= Desviacin tpioca de la media


62/92


63/92


64/92

64

= X 2.58n

= 70 (2.58)

40

2

= 70 (2.58) (0.82)

o sea:

69.18 70.82

El gerente, al recibir el informe, observa que este resultado cae muy cerca del extremodel rango aceptable (de 68.3 ________), pide que se aumente la precisin del intervalode confianza del 0.82 a 0.50, preservando el nivel de confianza en 99%. Qu haras t?

SOLUCIN:

Hay que determinar el tamao de la muestra necesaria para alcanzar la precisin de E =0.50.

2

=

E

/2Zn podemos tomar = 5

106.50(10.32)0.50

5.16

.

(2)(2.58)n 2 ==

=

=

22

500

Entonces nos bastara una muestra de 107 piezas. Como ya tenamos 40 piezas, semanda completar la muestra probando la dureza de 67 piezas adicionales. Se calculanlas nuevas X y S en base a la muestra total y se obtiene el nuevo intervalo de confianzaa 99% con precisin de 0.50.

EJERCICIO:

La actividad de ciertas vacunas puede mediarse nicamente a travs de pruebas enorganismos vivos (conejos por ejemplo). Este procedimiento es costos y tardado, peroesencial para asegurar el funcionamiento correcto de estas vacunas.

a) Si la muestra de 30 pruebas dio un ndice medio de actividad de X = 880 unidadescon S = 110, forma un intervalo de confianza de 95% para la actividad media de lavacuna.

b) Calcula el tamao de muestra total necesaria para tener un error de estimacinE 25 unidades con 99% de confianza.


65/92

65

Confiabilidad de Promedios en Muestras Pequeas

Anteriormente ya se compar la distribucin Z con la distribucin t de Student.

Si en la distribucin Z =n/

-X

, se reemplaza t por Z y por S se tiene la distribucin:

t =n/

-X

distribucin de Student.

Esta distribucin se utiliza para estimar parmetros para muestras pequeas.

Los intervalos de confianza se forman de la misma manera que en la distribucin Z.

La forma de la curva de la distribucin t de Student est basada en el nmero de grados

de libertad (g. l. = n-1), en lugar del tamao n de la muestra. A medida que aumenta elnmero de grados de grados de libertad, la curva de la distribucin t es menos variable.

Una muestra la vamos a considerar pequea cuando sea n


66/92


67/92


68/92


69/92

69

Pruebas de hiptesis

Al hacer inferencias de caractersticas de poblaciones a travs de muestras se utilizanlos mtodos de Estimacin y Pruebas de Hiptesis.

Cuando se analizan caractersticas de poblaciones por el mtodo de pruebas dehiptesis, es necesario tener en cuenta los siguientes conceptos:

NIVEL DE CONFIANZA. Es el nivel de error que se est dispuesto a tolerar.

ESTADSTICO DE PRUEBA. Es una variable aleatoria cuyo valor se utiliza para llegar ala decisin de rechazar o no la hiptesis nula.

REGIN CRTICA. Es el conjunto de valores para el estadstico de prueba que llevar arechazar la hiptesis nula.

REGIN DE ACEPTACIN. Es el conjunto de valores para el estadsticos de prueba

que provocar la aceptacin de la hiptesis nula.VALOR CRTICO. Es el valor que separa a la regin de rechazo y la regin deaceptacin.

HIPTESIS ESTADSTICA. Es una afirmacin o conjetura acerca del parmetro oparmetros de una poblacin.

La siguiente grfica muestra el valor crtico, la regin de rechazo y la regin deaceptacin.

Figura 17.

Se ha aprendido a estimar la media de una poblacin , dando un intervalo de confianza

o acompaando la estimacin de punto X con una evaluacin del error posible. Ahoraaprenders cmo demostrar una hiptesis referente a la media de una poblacin ; esdecir, se presentarn mtodos para decidir si se acepta o se rechaza una afirmacinacerca de un valor especfico de .

Estos conceptos sern abordados en la siguiente unidad, preprate para acceder a ellos.

REGIN DE VALOR REGIN DE VALOR REGIN DERECHAZO CRTICO ACEPTACIN CRTICO RECHAZO

1-


70/92


71/92


72/92

72

PROBLEMA

II. Los datos dados a continuacin corresponden a incrementos de pulso cardiaco enpulsaciones por minuto que un mdico determina en relacin con diez personas

que realizan una tarea ardua:

27, 14, 27, 32, 25, 30, 24, 29, 19, 32

a) estimar el incremento promedio real del pulso cardiaco de una persona querealiza una tarea ardua, mediante el estimador puntual X.

b) Estimar el alejamiento de las pulsaciones por minuto con respecto alpromedio, utilizando un estimador puntual.

c) Determinar el nmero de grados de libertad para la muestra dada.

d) Determinar el error mximo que se comete al estimar el incremento

promedio del pulso cardiaco de una persona mediante el estimador puntualX, con un nivel de confianza del 95%.

e) Obtener el tamao que deber tener la muestra, de tal manera que alemplear la media X, de una muestra para estimar el incremento promediodel pulso cardiaco de una persona, se tenga un error mximo de 25pulsaciones por minuto con un nivel de confianza de 95%.

f) Construir un intervalo con un nivel del 99% en relacin con el incrementopromedio real del pulso de personas que realizan la tarea dada.


73/92

73

Los resultados que debiste obtener son los siguientes, si alguno no coincide, entoncesrevisa tus clculos, localiza el error y corrgelo.

SOLUCIN DEL PROBLEMA I

1) = 47.1 2) Mo = 48.7 3) Md = 50.6

4) = 64.2 5) = 9.04

6) TABLA DE FRECUENCIAS

CLASE Xm Fi Fa XmFi Xm- X (Xm- X )2 Fi(Xm- X )2

60-6257-5954-5651-5348-5045-4742-4439-4136-3833-3530-3227-29

615855524946434037343128

5101518201714108643

5153048688599

109117123127130

30558082593698078260240029620412484

6118

13.910.97.94.91.9

-1.1-4.1-7.1

-10.1-13.1-16.1-19.1

193.21118.81

62.124.013.611.21

16.8150.41

102.01171.61259.21364.81

966.51188.1936.2432.272.220.6

235.3504.1816.1

1029.71036.81094.48332.2

47.1130

6118

n

XmfiX ==

=

129

833.2

1-130

8332.2

1-n

)X-(Xmfi ==

= 2 = 64.6

8.0464.590698 ==

Mo = 47.5 + 3 5

647.5 =+=

+ 322

48.7

Md = 48 + 320

5148

20

48-=+=

2

130

50.6

AUTOEVALUACIN


74/92

74

7) TABLA DE NORMALIZACIN PARA EL AJUSTE DE CURVAS

CLASE fi Ls. X = Xi -

X

Z =

IX

DEBAJO ENCIMA fe Fe. red.

60-6257-5964-5651-5348-50

45-4742-4439-4136-3833-3530-3227-29

510151820

1714108643

62.559.556.553.550.5

47.544.541.538.535.532.529.5

15.412.49.46.43.4

0.4-2.6-5.6-8.6

-11.6-14.6-17.6

1.921.541.120.800.42

0.05-0.32-0.70-1.07-1.44-1.82-2.19

0.97260.93820.86860.78810.6628

0.51990.37450.24200.14230.07490.03440.0143

0.03440.06960.08050.12530.1429

0.14540.13250.09970.06740.04050.02010.0143

4.479.05

10.4716.2918.58

18.9017.2312.968.765.272.611.86

4.59.1

10.516.318.6

18.917.213.08.85.32.61.9

X = 47.1

= 8.04

N = 130

POLGONO DE FRECUENCIAS


75/92


76/92

76

Este error que se comete al estimar a travs de X se determina mediante lafrmula:

E = t /2 n

Donde:

E = errort /2 = rea bajo la curva a la derecha de /2 = desviacin estndar de la poblacinn = N de datos

NOTA: Recuerda que en ausencia de se puede utilizar s.

= 0.05 /2 = 0.025

De las tablas de la distribucin t de Student y tomando g. l. = 9, se tiene:

t(0.025) = 2.262

E = 2.2623.162

30512.

.=

10

445= 3.89

E = 3.89

Esto significa que podemos asegurar con un grado de confianza del 95% que elerror que se comete al estimar a travs de X es menor de 3.89 pulsaciones porminuto.

La confiabilidad de X como estimador de la media de la poblacin depende deltamao de la muestra y el tamao de la desviacin estndar de la poblacin.

b) Para estimar el alejamiento promedio de las pulsaciones por minuto con respectoal incremento promedio real existen varios estimadores. Los ms usuales son: ladesviacin media, varianza y desviacin estndar.

De ellos utilizaremos el estimador s (desviacin estndar de la muestra).

Dado que generalmente no se conoce el parmetro, que es la desviacin estndarde la muestra; es estadstico s (desviacin estndar de lamuestra), puede servircomo estimador de .


77/92

77

X f X2 fix2

1419

242527293032

11

112112

196361

576625729841900

10245252

196361

5766251458841900

20487005

s = 29.69670.81-700.5).( == 292510

7005= 5.44

s = 5.44

Esto significa que en promedio el incremento promedio del pulso cardiaco se aleja5.44 pulsaciones por minuto de la media.

c) g. l. = n 1 g. l. = 10 1 = 9

g. l. = 9

d) Sabemos que al estimar la media poblacional a travs de la media muestral Xexiste un error, es decir:

= X error muestral

e) Para determinar el tamao que deber tener la muestra con un nivel de confianzadel 95% para tener un error mximo de 2.5 pulsaciones por minuto se utiliza lafrmula:

E = t /2 n

despejando n se tiene

n = E/2t

n =.

(5.44)).( 2=

52

2622(4.922112)2 = 24.22

Para determinar s se utiliza la frmula

S =2

X-N

fx 2

donde N = N de datosf = frecuencia de cada datoX = media de la muestra


78/92


79/92

79

APNDICES

APNDICE AREAS Y ORDENADAS DE LA CURVA

DE DISTRIBUCIN NORMAL EN FUNCIN DEX/

(1)Z

PUNTUACINTIPIFICADA

X

(2)A

REA DESDELA MEDIA

AX

(3)B

REA DE LAPARTE MAYOR

(4)C

REA DE LAPARTE MENOR

(5)Y

ORDENADA

ENX


80/92

80



(1)Z

PUNTUACINTIPIFICADA

X

(2)A

REA DESDELA MEDIA

AX

(3)B


(4)C


(5)Y

ORDENADA

ENX


81/92


82/92

82



(1)ZPUNTUACINTIPIFICADA

X

(2)AREA DESDE

LA MEDIA

AX

(3)BREA DE LA

PARTE MAYOR

(4)CREA DE LA

PARTE MENOR

(5)YORDENADA

ENX


83/92

83



(1)Z

PUNTUACINTIPIFICADA

X

(2)A

REA DESDELA MEDIA

AX

(3)B


(4)C


(5)Y

ORDENADA

ENX


84/92

84



(1)ZPUNTUACINTIPIFICADA

X

(2)AREA DESDE

LA MEDIA

AX

(3)BREA DE LA

PARTE MAYOR

(4)CREA DE LA

PARTE MENOR

(5)YORDENADA

ENX

2.69


85/92

85



(1)Z

PUNTUACINTIPIFICADA

X

(2)A

REA DESDELA MEDIA

AX

(3)B


(4)C


(5)Y

ORDENADA

ENX


86/92

86



(1)Z

PUNTUACINTIPIFICADA

X

(2)A

REA DESDELA MEDIA

AX

(3)B


(4)C


(5)Y

ORDENADA

ENX


87/92

87

APNDICE B

Tabla. Valores crticos de t

t2

n t.100 t.050 t.025 t.010 t.005 d.f


88/92

88APNDICE C

NMEROS ALEATORIOS


89/92

89

NMEROS ALEATORIOS


90/92


91/92

91

APNDICE C

NMEROS ALEATORIOS


92/92

DOWNIE, N. M. y HEAT, R. W. Mtodos Estadsticos Aplicados. Ed. Harla.

FREUD, John E. , WILLIAM, Frank J., PERLES. Benjamn M. Estadstica para laAdministracin. Ed. Prentice Hall Hispanoamericana S. A.

GRAY, William A. y OTIS M, Ulm. Probabilidad y Estadstica Elemental. EditorialC.E.C.S.A.

HOEL, Paul G. Estadstica Elemental. Ed. C. E. C. S. A. Mxico, 1976.

KREYSZING, Edwin. Introduccin a la Estadstica Matemtica. Ed. Limusa. Mxico,1981.

LEVN, Richard I. Estadstica para Administradores. Ed. Pretince Hall.

LINCONL L., Chao. Introduccin a la Estadstica. Ed. CECSA. Mxico, 1985.

LINCOYAN Portus, Goviden. Curso Prctico de Estadstica. Ed. McGraw-Hill, Mxico,1985

LIZRRAGA G., Ignacio Manuel. Estadstica. Ed.; McGraw-Hill. Mxico, 1986.

MENDENHALL, William. Trad. SEGAMI, Carlos. Introduccin a la Probabilidad y laEstadstica. Grupo Editorial Iberoamrica. Mxico, 1989.

PARSEN, Emanuel. Teora Moderna de Probabilidad y sus Aplicaciones. Ed. Limusa.Mxico, 1973.

SEYMOR, Lipschutz, Ph. D. Teora y Problemas de Probabilidad. Editorial McGraw-Hill.

BIBLIOGRAFA CONSULTADA

estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra

Documents

Transcript of estadistica descriptiva e inferencial ii, emigdio arroyo cervantes, juan matus parra