Manual de Estadística

50

Click here to load reader

Transcript of Manual de Estadística

  • 1 UTA Ing. M.B.A William Teneda

    UNIVERSIDAD TCNICA DE AMBATO

    GUIA DEL MODULO

    ESTADISTICA

    Ing. M.B.A William Fabin Teneda Llerena

  • 2 UTA Ing. M.B.A William Teneda

    CAPITULO I

    ESTADIGRAFOS DE POSICION Y

    ESTADIGRAFOS DE DISPERSION

    I.1 Objetivos

    Diferenciar entre los estadgrafos de posicin y los estadgrafos de dispersin.

    Demostrar el inters en la aplicacin de los estadgrafos.

    Comprender como se desarrollan y se aplica las medidas de tendencia central

    [estadgrafos de posicin] y los estadgrafos de dispersin.

    I.2 Marco Terico

    I.2.1 DISTRIBUCIN DE FRECUENCIAS

    La distribucin de frecuencias es un mtodo para organizar y resumir datos. Con este

    mtodo los datos que componen una serie se clasifican y ordenan indicndose el

    nmero de veces que se repite el valor.

    ELABORACIN DE UNA TABLA DE FRECUENCIAS

    Variable Discreta.- es necesario familiarizarse con algunos smbolos.

    n = tamao muestra

    N = tamao poblacin

    X i = identificacin de cada valor observado

    n i = frecuencia absoluta

    h i = frecuencia relativa

    N i = frecuencia absoluta acumulada

    H i = frecuencia relativa acumulada

  • 3 UTA Ing. M.B.A William Teneda

    Y i = indican los valores que toman las variables

    y i = marca de clase

    m = nmero de valores que toma la variable Yi. Tambin se

    considera el nmero de intervalos o marcas de clase en la variable.

    Ejercicio.

    Supongamos una poblacin constituida por 200 cajas y se desea examinarlas,

    determinndose el nmero de piezas defectuosas que contiene cada caja. Por

    diferentes razones se desea que la investigacin no sea exhaustiva, es decir

    seleccionar una muestra de tamao 20, correspondiendo a una investigacin

    parcial.

    N = 200 n = 20

    El resultado de esta encuesta, se anota a continuacin, siendo X1 la primera

    caja examinada y 3 el nmero de piezas defectuosas encontradas en esa caja.

    x1= 3 x6= 3 x11= 3 x16= 2

    x2= 2 x7= 1 x12= 3 x17= 4

    X3= 0 X8= 1 X13= 4 X18= 2

    x4= 2 x9= 0 x14= 4 x19= 4

    x5= 3 x10= 1 x15= 3 x20= 2

    Variable contnua.- debemos conocer

    m = nmero de intervalos

    c = amplitud del ancho del intervalo

    Yi ni hi Ni Hi0 2 0,10 2 0,101 3 0,15 5 0,252 5 0,25 10 0,503 6 0,30 16 0,804 4 0,20 20 1,00

    20 1 ---- ----

  • 4 UTA Ing. M.B.A William Teneda

    =

    Histograma, usado para variables continuas. En el eje OX se sealan los extremos de

    los intervalos. Se construyen unos rectngulos de base la amplitud del intervalo y de

    altura la frecuencia absoluta.

    Polgono de frecuencias, se obtiene uniendo los puntos medios de los segmentos

    superiores de los rectngulos del diagrama.

    Grfico de sectores, es el resultado de dividir un crculo en sectores circulares de

    ngulos proporcionales a las frecuencias absolutas de cada valor de la variable. Para

    calcular los grados de cada sector se divide la frecuencia entre el nmero de datos y

    se multiplica por 360.Se utiliza para variable discreta y continua.

    1.2.2. MEDIDAS DE TENDENCIA CENTRAL [ESTADGRAFOS DE POSICIN]

    Estas medidas tienden a ubicarse en el centro del conjunto.

    Proporcionan un valor simple y representativo, que resume un gran volumen de

    informacin.

    1. Media Aritmtica

    2. Mediana

    3. Moda

    4. Media Geomtrica

    5. Media Armnica

    6. Media Cuadrtica

    7. Media Cbica

    8. Cuartiles, Deciles y Percentiles

    1. Media Artimtica

  • 5 UTA Ing. M.B.A William Teneda

    La media aritmtica se puede calcular para datos agrupados y no agrupados.

    La media aritmtica de un conjunto de valores x1 , x2, x3,............xn se obtiene

    sumando todos los valores y dividiendo por el nmero de datos n.

    XI= 1,26 X=

    X2=1,75 n

    Exi

    X3= 1,64 x=

    X4= 1,45 n

    x1+x2+x3+x4+x5

    X5= 1,38 x= 1,25+1,75+1,64+1,45+1,38 = 7,47

    5 5

    = 1,44

    Y1 y2 ni yi yini Ni

    2 4 1 3 3 1

    4 6 3 5 15 4

    6 8 7 7 49 11

    8 10 2 9 18 13

    10 12 4 11 44 17

    Eni= 17 Exiyi= 129

    X=

    nT

    Exini

    X= 129

    17

    = 1,58

    2. Mediana

  • 6 UTA Ing. M.B.A William Teneda

    De un conjunto ordenado de datos es aquel valor tal que la mitad de los datos

    son iguales o inferiores a l y la otra mitad son iguales o superiores.

    Si el nmero de datos es pequeo los ordenamos y cogemos el valor central.

    Caso 1: Cuando el nmero de datos es impar:

    Si los valores son 4,6,4,5,7,3,9. Los ordenamos 3,4,4,5,6,7,9, cmo son 7

    datos

    cogemos el dato que ocupa el lugar 4 que es 5.

    Caso 2: Cuando el nmero de datos es impar:

    Si los valores son 4,6,5,7,3,9. Los ordenamos 3,4,5,6,7,9, cmo son 6 datos

    cogemos los datos que ocupan el lugar 3 que es 5 y el lugar 4 que es 6. la

    mediana es la media de los dos nmeros es este caso 5,5 =(5+6)/2

    ejercicios de mediana

    Y1 y2 ni yi yini Ni

    2 4 1 3 3 1

    4 6 3 5 15 4

    6 8 7 7 49 11

    8 10 2 9 18 13

    10 12 4 11 44 17

    me = yj-1+c (

    Nj

    (n/2) Nj -1

    me = 6+2 ( 3.5 +4

    11

    )

    me = 6 + 2 +

    11

    4.5

    me = 6.81

    3. Moda

    La moda de un conjunto de datos es el dato que tiene mayor frecuencia.

    El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con

    datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

  • 7 UTA Ing. M.B.A William Teneda

    La moda, cuando los datos estn agrupados, es un punto que divide al

    intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del

    intervalo, que verifiquen

    que:

    Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de

    los intervalos anterior y posterior, respectivamente, al intervalo modal.

    ejercicios de moda

    Y1 y2 ni Yi yini Ni

    2 4 1 3 3 1

    4 6 3 5 15 4

    6 8 7 7 49 11

    8 10 2 9 18 13

    10 12 4 11 44 17

    md = yj-1+c (

    nj+1+nj-1

    (nj+1) )

    md = 6+2 ( 2 )

    2+8

    md = 6 +

    5

    4

    md = 6.8

    4. Media Geomtrica

    Es considerada como una medida de posicin simbolizada por Mo y su

    resultado al ser calculado debe estar comprendido entre la media armnica y la

    aritmtica.

  • 8 UTA Ing. M.B.A William Teneda

    Sea una distribucin de frecuencias (x , n ). La media geomtrica, que

    denotaremos por G. se define como la raz N-sima del producto de los N

    valores de la distribucin.

    Si los datos estn agrupados en intervalos, la expresin de la media

    geomtrica, es la misma, pero utilizando la marca de clase (Xi).

    El empleo ms frecuente de la media geomtrica es el de promediar variables

    tales como porcentajes, tasas, nmeros ndices. etc., es decir, en los casos en

    los que se supone que la variable presenta variaciones acumulativas.

    Ventajas e inconvenientes:

    - En su clculo intervienen todos los valores de la distribucin.

    - Los valores extremos tienen menor influencia que en la media aritmtica.

    - Es nica.

    - Su clculo es ms complicado que el de la media aritmtica.

    Adems, cuando la variable toma al menos un x = 0 entonces G se anula, y si

    la variable toma valores negativos se pueden presentar una gama de casos

    particulares en los que tampoco queda determinada debido al problema de las

    races de ndice par de nmeros negativos.

    5. Media Armnica

    Se utiliza como una medida de tendencia central para conjunto que consisten

    en caja de cambios.

    La media armnica, que representaremos por H, se define como sigue:

  • 9 UTA Ing. M.B.A William Teneda

    Es la inversa de la media aritmtica de las inversas de los valores de la variable,

    responde a la siguiente expresin:

    ....3

    3

    21

    2

    1

    1 +++==

    xn

    xn

    xn

    n

    xn

    nH

    i

    i

    Obsrvese que la inversa de la media armnica es la media aritmtica de los

    inversos de los valores de la variable. No es aconsejable en distribuciones de

    variables con valores pequeos. Se suele utilizar para promediar variables tales

    como productividades, velocidades, tiempos, rendimientos, cambios, etc.

    Ventajas e inconvenientes:

    - En su clculo intervienen todos los valores de la distribucin.

    - Su clculo no tiene sentido cuando algn valor de la variable toma valor

    cero.

    - Es nica.

    Relacin entre las medias:

    ejercicio de media armnica X1=0,15 M-1 = n = Q 3

    X2=0,18 E(/xi) (1/0,15)+(1/0,18)+(1/0,17)

    G

    X3=0,17 M-1= 0,165

    M-1 = n = Q 10

    E(/Yi) 0,0614

    G

    M-1= 162,866

  • 10 UTA Ing. M.B.A William Teneda

    6. Media Cuadrtica

    La media cuadrtica es igual a la raz cuadrada de la suma de los cuadrados

    de los valores dividida entre el nmero de datos:

    Esta media como medida de asociacin tiene aplicaciones tanto en ciencias

    biolgicas como en medicina.

    A veces la variable toma valores positivos y negativos, como ocurre, por

    ejemplo, en los errores de medida. En tal caso se puede estar interesado en

    obtener un promedio que no recoja los efectos del signo. Este problema se

    resuelve, mediante la denominada media cuadrtica. Consiste en elevar al

    cuadrado todas las observaciones (as los signos negativos desaparecen), en

    obtener despus su media aritmtica y en extraer, finalmente, la raz cuadrada

    de dicha media para volver a la unidad de medida original.

    ejercicio de media cuadrtica

    m2 = Eyi2*ni = 1020

    n 20

    = 7,4

    7. Media Cbica

    La media cbica es una medida derivada de la media aritmtica y consiste en

    obtener el valor del lado que tiene el cubo media de un conjunto de n cubos.

    yi ni Yi*ni Yi2*ni

    2

    4

    6

    8

    10

    2

    3

    5

    6

    4

    4

    12

    30

    48

    40

    8

    48

    180

    384

    400

    1020

  • 11 UTA Ing. M.B.A William Teneda

    ejercicio de media cubica X1= 5 X2=6 m3 =

    X3=10 5

    53+63+103+123+73

    X4=12 m3= 8,80

    X5=7

    8. Cuartiles, Deciles y Percentiles

    Los cuartiles son los tres valores de la variable que dividen a un conjunto de

    datos Ordenados en cuatro partes iguales.

    Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75%

    de los datos. Q2 coincide con la mediana.

    Los deciles son los nueve valores que dividen la serie de datos en diez partes

    iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al

    90% de los datos. D5 coincide con la mediana.

    Los percentiles son los 99 valores que dividen la serie de datos en 100 partes

    iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al

    99% de los datos. P50 coincide con la mediana.

    I.2.3 ESTADIGRAFOS DE DISPERSION

    Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los

    valores de la variable a un cierto valor central, o que permiten identificar la

    concentracin de los datos en un cierto sector del recorrido de la variable. Se trata

    de coeficiente para variables cuantitativas.

    1. Varianza

    2. Desviacin Tpica

    3. Desviacin Media

  • 12 UTA Ing. M.B.A William Teneda

    1. Varianza

    Varianza: Es la media de los cuadrados de las desviaciones de los datos

    respecto a la media.

    2. Desviacin Tpica

    Desviacin Tpica: Es la raz cuadrada de la varianza. Se calcula aplicando

    esta frmula.

    3. Desviacin Media

    Desviacin media de un conjunto de datos es la media aritmtica de los valores

    absolutos de las desviaciones respecto a la media.

  • 13 UTA Ing. M.B.A William Teneda

    I.3 Trminos y Conceptos claves

    Variable.- una variable es una cantidad sujeta a variacin existen 2 tipos de variables; las cuantitativas y cualitativas.

    Dentro de las variables cuantitativas podemos distinguir las variables discretas y las

    variables continuas.

    a) Variables Discretas .- valores enteros

    b) Variables Continuas.- valores fraccionables

    Tablas Y Graficas.- la presencia de datos en una investigacin se las puede representar de varias formas que pueden ser: textuales, cuadros o tablas y grficas.

    I.4 Preguntas y Problemas i. Las notas de una estudiante han sido 85, 76, 93, 82 y 96. Calcular los

    estadgrafos de posicin y de dispersin. ii. Un conjunto de nmeros contiene 6 seises, 7 sietes, 8 ochos, 9 nueves y 10

    dieces. Calcular los estadgrafos de posicin y de dispersin. iii. Tres profesores de economa dieron notas medias en sus cursos, con 32, 25 y

    17 estudiantes de 79, 74 y 82 puntos, respectivamente. Hallar la puntuacin

    media de los tres cursos.

    I.5 Bibliografa Complementaria

    Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin.

    Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df

    Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980.

    Primera Edicin

    Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill.

    Ronald E. Walpole, Raymond H. Myers. Probabilidad Y

    Estadstica. Editorial: 2007 Pearson Education De Mexico

    Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981

    McgrawHill Latinoamericana Editores S.A De C.V.

    Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw

    Hill/Interamericana Editores S.A De C.V. Edicon 2006.

  • 14 UTA Ing. M.B.A William Teneda

    Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial:

    Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin.

    Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias.

    Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007.

    Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica.

    Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990

  • 15 UTA Ing. M.B.A William Teneda

    CAPITULO II

    REGRESION Y CORRELACION

    2.1Objetivos

    Emplear adecuadamente los diferentes tipos de regresiones.

    Dominar la utilizacin de las regresiones.

    2.2Marco Terico

    REGRESIONES

    La regresin es una tcnica estadstica utilizada para simular la relacin existente

    entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo

    que permita predecir el comportamiento de una variable dada.

    La regresin es muy utilizada para interpretar situaciones reales, pero comnmente se

    hace de mala forma, por lo cual es necesario realizar una seleccin adecuada de las

    variables que van a construir las ecuaciones de la regresin, ya que tomar variables

    que no tengan relacin en la prctica, nos arrojar un modelo carente de sentido, es

    decir ilgico.

    Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden

    darse alguna de las siguientes relaciones, Lineal, Logartmica, Exponencial,

    Cuadrtica, entre otras.

    Regresin Lineal El objetivo de la tcnica de regresin es establecer la relacin estadstica que existe

    entre la variable dependiente (Y) y una o ms variables independientes (X1, X2, Xn).

    Para poder realizar esto, se postula una relacin funcional entre las variables. Que en

    la prctica es la relacin lineal:

    = b0 + b1x1 + bnxn

    donde los coeficientes b0 y b1, bn, son los parmetros que definen la variacin

    promedio de y, para cada valor de x..

  • 16 UTA Ing. M.B.A William Teneda

    El anlisis de regresin se utiliza para fines de prediccin. Y el anlisis de correlacin

    se utiliza para medir la fuerza de la asociacin entre las variables cuantitativas.

    - El parmetro b0, conocido como la ordenada en el origen, nos indica cunto es Y

    cuando X = 0. El parmetro b1, conocido como la pendiente, nos indica cunto

    aumenta Y por cada aumento en X.

    - La tcnica consiste en obtener estimaciones de estos coeficientes a partir de una

    muestra de observaciones sobre las variables Y y X.

    REGRESIN POLINOMIAL

    En situaciones donde la relacin funcional entre la respuesta Y y la variable independiente x no se puede aproximar de manera adecuada mediante una relacin lineal, es, algunas veces, posible obtener un ajuste razonable considerando una relacin polinomial. Es decir, podemos ajustar el conjunto de datos a una relacin funcional de la forma:

    Y = Bo + Box + B2x2 + Brxr + e

    Donde B0, B1,, Br son coeficientes de regresin que tienen que estimarse. Si los datos constan de los n pares (.xi, Yi), i= 1,..,n, entonces los estimadores de mnimos cuadrados de, B0,.....,Br llammoslos BO,..., Br son aquellos valores que minimizan

    Para determinar estos valores, obtenemos las derivadas parciales de la suma de cuadrados anterior, respecto a BO,... Br, y luego, igualamos a cero con el objetivo de determinar los valores minimizantes. Al hacer esto y reordenando despus las ecuaciones resultantes, obtenemos que los estimadores de mnimos cuadrados, BO,BI,Br satisfacen el conjunto de r + 1 ecuaciones lineales, llamadas ecuaciones normales.

  • 17 UTA Ing. M.B.A William Teneda

    Al ajustar una funcin polinomial a un conjunto de pares de datos, con

    frecuencia es posible determinar el grado necesario del polinomio mediante un estudio del diagrama de dispersin. Que queremos enfatizar que siempre se debe usar el menor grado posible que parezca describir los datos adecuadamente. (As, por ejemplo, aunque normalmente es posible encontrar un polinomio de grado n que pase por todos los n pares (xi, Yi), i=1,,n, sera difcil tener mucha confianza en tal ajuste.)

    - Resulta muy arriesgado, an ms que en el caso de la regresin lineal, usar un polinomio ajustado para predecir el valor de una respuesta a un nivel de entrada x0 que este lejos de los niveles de entrada xi, i=1,,n usados para encontrar el polinomio de ajuste. (El polinomio de ajuste puede ser vlido slo en una regin alrededor de las xi, i=1,,n y no incluir a x0).

    Regresin Lineal Mltiple

    Muchas aplicaciones del anlisis de regresin involucran situaciones donde se

    tiene ms de una variable de regresin. Un modelo de regresin que contiene ms

    de un regresor recibe el nombre de modelo de regresin mltiple

    Como ejemplo, supngase que la vida eficaz de una herramienta de corte depende

    de la velocidad de corte y del ngulo de la herramienta. Un modelo de regresin

    mltiple que puede describir esta relacin es el siguiente

    = + 11 + 22 +

  • 18 UTA Ing. M.B.A William Teneda

    FORMULAS PARA EL CALCULO DE REGRESIONES

    1. REGRESION LINEAL: = 0 + 1 y = 0 + 1 1 = ()()2 () 2 0 = 1 2 = 0 + 1 1 () 2

    ( 2) 1 () 2 = 0 + 1 = 0 + 1 2 x

    2. REGRESION LOGARITMICA: = 0 + 1

    1 = ( )( )( ) 2( ) 2 y 0 = 1 2 = 0 +1 ( )1( ) 2

    (2)1

    () 2 = 0 + 1 = 0 + 1 () = 0 + 1 2

    x

  • 19 UTA Ing. M.B.A William Teneda

    3. REGRESION EXPONENCIAL: = 0 + 1 y

    1 = ( )()( ) 2() 2 = 0 = 1 = 0 + 1 2 = 0 + 1 () 1 ( ) 2

    ( 2) 1 ( ) 2 = 0 + 1 () = 0 + 1 2 x

    4. REGRESION POTENCIAL: = 0 + 1 y

    1 = ( )( )( ) 2( ) 2 = 0 = 1 = 0 + 1 2 = 0 + 1 () 1 ( ) 2

    ( 2) 1 ( ) 2 = 0 + 1 ()() = 0 + 1 2

    5. REGRESION CUADRATICA: = 0 + 1 + 22

    1) = 0 + 1 + 2 2 2) = 0 + 1 2 + 2 3 3) 2 = 0 2 + 1 3 + 2 4

    2 = 0 + 1 + 2 2 1 () 2(2) 1 () 2

  • 20 UTA Ing. M.B.A William Teneda

    6. REGRESION CUBICA: = 0 + 1 + 22 + 33 1) = 0 + 1 + 2 2 + 3 3 2) = 0 + 1 2 + 2 3 + 3 4 3) 2 = 0 2 + 1 3 + 2 4 + 3 5 4) 3 = 0 3 + 1 4 + 2 5 + 3 6

    2 = 0 + 1 + 2 2 + 3 3 1 () 2(2) 1 () 2

    7. REGRESION MULTIPLE: 1) = 0 + 1 1 + 2 2 2) 1 = 0 1 + 1 12 + 2 12 3) 2 = 0 2 + 1 12 + 2 2 2

    2 = 0 + 1 + 2 2 1 () 2(2) 1 () 2

    2.3Trminos y Conceptos claves

    Interpretacin de los Coeficientes de Regresin:

    Interpretacin del intercepto :

    Indica el valor promedio de la variable de respuesta Y cuando X es cero. Si se tiene

    certeza de que la variable predictoria X no puede asumir el valor 0, entonces la

    interpretacin no tiene sentido.

    Interpretacin de la pendiente :

    Indica el cambio promedio en la variable de respuesta Y cuando X se incrementa

    en una unidad.

    Anlisis de Residuales

    Un residual es la diferencia entre el valor observado y el valor estimado por

    la lnea de regresin ,

    El residual puede ser considerado como el error aleatorio observado.

  • 21 UTA Ing. M.B.A William Teneda

    2.4 Problemas

    Se desea desarrollar un modelo de regresin polinmica para predecir la temperatura ambiente para la calefaccin domstica durante el mes de enero en funcin del consumo de combustible ambiente.

    Observacin Temperatura

    Ambiente Consumo Mensual De

    Petrleo Cantidad De Aislamiento

    (Diaria Promedio) Para Calefaccin [Galones] En El tico

    [F] [Pulgadas]

    1 40 27,5 3

    2 27 36,4 3

    3 40 16,4 10

    4 73 4,1 6

    5 64 9,4 6

    6 34 23,1 6

    7 9 36,7 6

    Regresin Cbica

    X1 Y Y2 X1Y X21Y X31Y

    27,5 40 1600 1100 30250 831875

    36,4 27 729 982,8 35773,92 1302171

    16,4 40 1600 656 10758,4 176437,8

    4,1 73 5329 299,3 1227,13 5031,233

    9,4 64 4096 601,6 5655,04 53157,38

    23,1 34 1156 785,4 18142,74 419097,3

    36,7 9 81 330,3 12122,01 444877,8

    153,6 287 14591 4755,4 113929,24 3232647

  • 22 UTA Ing. M.B.A William Teneda

    X21 X31 X41 X51 X61

    756,25 20796,875 571914,063 15727636,72 432510009,8

    1324,96 48228,544 1755519 63900891,66 2325992456

    268,96 4410,944 72339,4816 1186367,498 19456426,97

    16,81 68,921 282,5761 1158,56201 4750,104241

    88,36 830,584 7807,4896 73390,40224 689869,7811

    533,61 12326,391 284739,632 6577485,502 151939915,1

    1346,89 49430,863 1814112,67 66577935,07 2443410217

    4335,84 136093,122 4506714,92 154044865,4 5374003645

    Frmulas

    321

    bbbbo

    =

    YXYX

    XYY

    31

    21

    Matriz Inversa

    61

    51

    41

    31

    51

    41

    31

    21

    41

    31

    211

    31

    211

    xxxxxxxxxxxxxxxn

    =

    3232647,12113929,24

    4755,4287

    53740036454154044865,64506714,91136093,1224154044865,64506714,91136093,1224335,8464506714,91136093,1224335,84153,6

    136093,1224335,84153,67

    321

    bbbbo

    07-2,08942E05-1,30796E-0,000225760,00091455-05-1,30796E-80,000830680,01463819-0,060961830,0002257610,01463819-0,266422941,16835825-

    0,00091455-60,060961791,16835825-5,80046665

    =

    321

    bbbbo

    3232647,12113929,24

    4755,4287

  • 23 UTA Ing. M.B.A William Teneda

    7902272251 -0,003591836379108 0,243669352

    7294009 -6,27687081670896 97,6351505

    ====

    bbbbo

    Ecuacin Cbica

    bo X b1 X b2 X b3 Y 23 +++=

    Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635

    Coeficiente De Determinacin Y De Correlacin

    22

    232

    2

    )(1)(

    )(1321

    +++=

    Yn

    Y

    Yn

    YXbYXbXYbYboR

    28246127732555,043672 =R

    85438150,904760502 =R

    72785720,95118899=R

    Grfica:

    0

    20

    40

    60

    80

    0 10 20 30 40

    Consumo De Combustible [Galones]

    Tem

    pera

    tura

    Pro

    med

    io

    Diar

    ia [

    F]

  • 24 UTA Ing. M.B.A William Teneda

    Qu temperatura debera tener el ambiente si el consumo de tuviera 35 galones para el modelo utilizado en el literal anterior?

    Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635

    Y= 22,4378184793661 F

    Regresin Cuadrtica

    X1 Y Y2 X1Y X21Y X21 X31 X41

    27,5 40 1600 1100 30250 756,25 20796,875 571914,063

    36,4 27 729 982,8 35773,92 1324,96 48228,544 1755519

    16,4 40 1600 656 10758,4 268,96 4410,944 72339,4816

    4,1 73 5329 299,3 1227,13 16,81 68,921 282,5761

    9,4 64 4096 601,6 5655,04 88,36 830,584 7807,4896

    23,1 34 1156 785,4 18142,74 533,61 12326,391 284739,632

    36,7 9 81 330,3 12122,01 1346,89 49430,863 1814112,67

    153,6 287 14591 4755,4 113929,24 4335,84 136093,122 4506714,92

    Formulas

    41

    31

    21

    31

    211

    211

    xxxxxxxxn

    21

    bbbo

    =

    YXYX

    Y

    21

    1

    4506714,92136093,1224335,84136093,1224335,84153,6

    4335,84153,67

    21

    bbbo

    =

    113929,244755,4

    287

  • 25 UTA Ing. M.B.A William Teneda

    Matriz Inversa

    Ecuacin Cuadrtica

    boXbXbY ++= 12 2

    81,913 2,3958X - 0,0188X 2 +=Y

    Coeficiente De Determinacin Y De Correlacin

    22

    22

    2

    )(1)(

    )(121

    ++=

    Yn

    Y

    Yn

    YXbXYbYboR

    28246645952493,296282 =R

    56395020,882895282 =R

    71661540,93962507=R

    Grafico:

    05-1,192E0,00050563-90,003711740,00050563-0,0224841330,18017899-0,003711750,18017899-71,79742071

    113929,244755,4

    287

    =

    21

    bbbo

    564475910,0188209222991347-2,395816317530581,9132665

    ===

    bbbo

    0

    20

    40

    60

    80

    0 10 20 30 40

    Consumo De Combustible [Galones]

    Tem

    pera

    tura

    Pro

    med

    io

    Diar

    ia [

    F]

  • 26 UTA Ing. M.B.A William Teneda

    El conocido urbanista siente que hay una relacin entre una segunda variable independiente la cantidad de aislamiento. Establezca la regresin mltiple y analice los datos

    Regresin Mltiple

    X1 X2 Y X1X2 X1Y X2Y X21 X22

    27,5 3 40 82,5 1100 120 756,25 9

    36,4 3 27 109,2 982,8 81 1324,96 9

    16,4 10 40 164 656 400 268,96 100

    4,1 6 73 24,6 299,3 438 16,81 36

    9,4 6 64 56,4 601,6 384 88,36 36

    23,1 6 34 138,6 785,4 204 533,61 36

    36,7 6 9 220,2 330,3 54 1346,89 36

    153,6 40 287 795,5 4755,4 1681 4335,84 262

    Frmulas

    1. =+ nboYXbXb 21 21

    2. n

    YXYX

    nXX

    XXbnX

    Xb =

    +

    11

    2121

    212

    1 2)(

    1

    3. n

    YXYX

    nX

    Xbn

    XXXXb =

    +

    22

    222

    2121

    21

    )(21

    1. o7-2872401153,6 bbb =+

    2. [ ] [ ] -1542,282,2142857-2965,4171431 =+ bb

    3. [ ] [ ] 4133,4285714282,2142857-1 =+ bb

  • 27 UTA Ing. M.B.A William Teneda

    2. 8-1,59744412 0,08515934 -1 =bb

    3. 0,498696792 0,40660295 1 =+ bb

    -1,098747420,32144361 =b

    101,972188-1,888532816-3,41816522

    ===

    bobb

    Ecuacin Mltiple

    Y = bo b1X1 + b2X2

    Y = 101,9721 1,8885X1 -3,41816X2

    Coeficiente De Determinacin Y De Correlacin

    22

    221

    2

    )(1)(

    )(121

    ++=

    Yn

    Y

    Yn

    YXbYXbYboR

    28242772,350632 =R

    0,981710562 =R

    0,99081308=R

  • 28 UTA Ing. M.B.A William Teneda

    2.5 Bibliografa Complementaria

    Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin.

    Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df

    Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980.

    Primera Edicin

    Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill.

    Ronald E. Walpole, Raymond H. Myers. Probabilidad Y

    Estadstica. Editorial: 2007 Pearson Education De Mexico

    Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981

    McgrawHill Latinoamericana Editores S.A De C.V.

    Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw

    Hill/Interamericana Editores S.A De C.V. Edicon 2006.

    Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial:

    Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin.

    Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias.

    Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007.

    Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica.

    Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990.

    Estadistica de Inferencia. Hctor Anbal Saltos.

  • 29 UTA Ing. M.B.A William Teneda

    CAPITULO III

    INTRODUCCION A LAS PROBABILIDADES

    3.1 Objetivos

    Aplicar las probabilidades en ejercicios prcticos

    Dominar el empleo de la Distribucin normal, Binomial y Poisson .

    Explicar y predecir procesos reales que se presentan en la naturaleza y la

    tecnologa con la ayuda de la estadstica para resolver problemas inherentes a

    la ingeniera civil y mecnica.

    3.2 Marco Terico

    PROBABILIDAD

    Probabilidad de un suceso es el nmero al que tiende la frecuencia relativa

    asociada al suceso a medida que el nmero de veces que se realiza el

    experimento crece.

    P(X) =

    NUMERO DE SUCESO POSIBLES

    NUMERO DE EXITOS

    TABLA DE CONTINGENCIA El procedimiento Tablas de contingencia crea tablas de clasificacin doble y

    mltiple y, adems, proporciona una serie de pruebas y medidas de asociacin

    para las tablas de doble clasificacin. La estructura de la tabla y el hecho de

    que las categoras estn ordenadas o no determinan las pruebas o medidas

    que se utilizaban.

    Los estadsticos de tablas de contingencia y las medidas de asociacin slo se

    calculan para las tablas de doble clasificacin. Si especifica una fila, una

    columna y un factor de capa (variable de control), el procedimiento Tablas de

    contingencia crea un panel de medidas y estadsticos asociados para cada

    valor del factor de capa (o una combinacin de valores para dos o ms

    variables de control). Por ejemplo, si sexo es un factor de capa para una tabla

    de casado (s, no) en funcin de vida (vida emocionante, rutinaria o aburrida),

    los resultados para una tabla de doble clasificacin para las mujeres se

  • 30 UTA Ing. M.B.A William Teneda

    calculan de forma independiente de los resultados de los hombres y se

    imprimen en paneles uno detrs del otro.

    ANALISIS COMBINATORIO

    Combinacin

    Los coeficientes binomiales o combinaciones son una serie de nmeros

    estudiados en combinatoria que indican el nmero de formas en que se pueden

    extraer subconjuntos a partir de un conjunto dado. Sin embargo, dependiendo

    del enfoque que tenga la exposicin, se suelen usar otras definiciones

    equivalentes.

    Ejercicios De Combinacin

    En una clase de 35 alumnos se quiere elegir un comit formado por tres

    alumnos. Cuntos comits diferentes se pueden formar?

    C 335 = 35*34*33

    3*2*1

    = 6545

    A una reunin asisten 10 personas y se intercambian saludos entre todos.

    Cuntos saludos se han intercambiado?

    C 210 = 10*9

    2

    = 45

    En

    Permutacin matemticas, dado un conjunto finito con todos sus elementos diferentes, llamamos

    permutacin a cada una de las posibles ordenaciones de los elementos de dicho

    conjunto.

    Por ejemplo, en el conjunto {1,2,3}, cada ordenacin posible de sus elementos,

    sin repetirlos, es una permutacin. Existe un total de 6 permutaciones para

    estos elementos: "1,2,3", "1,3,2", "2,1,3", "2,3,1", "3,1,2" y "3,2,1".

    La nocin de permutacin suele aparecer en dos contextos:

    Como nocin fundamental de combinatoria, centrndonos en el

    problema de su recuento.

    En teora de grupos, al definir nociones de simetra.

  • 31 UTA Ing. M.B.A William Teneda

    Ejercicios De Permutaciones

    Cuntos nmeros de 5 cifras diferentes se puede formar con los dgitos: 1, 2,

    3, 4, 5.?

    m = 5 n = 5

    P5= 5! = 5*4*2*3*1 = 120

    Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; cuntos nmeros de nueve cifras se

    pueden formar?

    m = 9 a = 3 b = 4 c = 2 a + b + c = 9

    S entran todos los elementos. S importa el orden. S se repiten los elementos.

    ESPACIO MUESTRAL Y SUCESOS

    Experimentos, espacios mustrales y sucesos La teora de las probabilidades trata formalmente de experimentos y de sus resultados donde el trmino experimento se

    usa en el sentido ms general. Se denomina espacio muestral la coleccin de todos los

    posibles resultados de un experimento. Los elementos del conjunto S de este espacio

    se denominan puntos muestrales, cada uno de ellos asociado con uno y slo un

    resultado distinto. La precisin para distinguir resultados es cosa de criterio y

    depender en la prctica de la utilizacin que se har del modelo.

    Ejemplo. Un experimento consiste en lanzar una moneda y despus lanzarla una segunda vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez.

    Para listar los elementos del espacio muestral que proporcione la mayor informacin,

    construimos el diagrama de rbol de la figura 2.1. Las diversas trayectorias a lo largo de

    las ramas del rbol dan los distintos puntos mustrales. Al comenzar con la rama superior

    izquierda y movernos a la derecha a lo largo de la primera trayectoria, obtenemos el punto

    muestral HH, que indica la posibilidad de que ocurran caras en dos lanzamientos sucesivos

    de la moneda. Asimismo, el punto muestral T3 indica la posibilidad.

  • 32 UTA Ing. M.B.A William Teneda

    VALOR ESPERADO O ESPERANZA Si P es la probabilidad de xito de un suceso en un solo ensayo, el numero

    esperado o esperanza de ese suceso en N ensayos, estar dado por el producto

    de N y la probabilidad de xito P.

    E = n.p(x)

    Ejemplo.

    En el lanzamiento 900 veces de dos dados, Cul es la esperanza de que la suma

    de sus caras de un valor menor de 6.?

    Probabilidad de xito de un solo ensayo.

    (1,1) (1,2) (2,1) (2,2) (2,3) (3,2) (3,1) (1,3) (4,1) (4,4)

    p(x): 10/36 n=900

    E=np=900*(10/36)=9000/36= 250

    La esperanza o valor esperado es de que 250 de los 900 lanzamientos, la

    suma de sus caras sea menor de 6

    DISTRIBUCION BINOMIAL

    Procesos de Bernoulli: Un proceso de Bernoulli es una serie de n experimentos

    aleatorios que verifican:

    Cada experimento tiene dos resultados posibles, que se llaman xito y fracaso.

    La probabilidad p de xito es la misma en cada experimento, y esta

    probabilidad no se ve afectada por el conocimiento de los resultados anteriores.

    La probabilidad q de fracaso viene dada por q = 1 - p.

  • 33 UTA Ing. M.B.A William Teneda

    Ejemplos :

    Una moneda lanzada al aire 15 veces. Los dos resultados posibles son cara y

    cruz. La probabilidad de cara en un lanzamiento es 1/2

    Se pregunta a 200 alumnos de de un Instituto de Enseanza Secundaria si

    estudian Francs. Los dos resultados posibles son s y no. Si se considera

    xito la respuesta s, la probabilidad p de xito indica la proporcin de

    estudiantes del Instituto que responden s (estudian francs, pues suponemos

    que no mienten).

    Tirar un dado de seis caras 10 veces y considerar que el resultado de una

    tirada, es que salga un nmero par o un nmero impar. Los resultados posibles

    en este caso son par e impar.

    El espacio muestral, cada uno de los sucesos y la probabilidad de que ocurran,

    en un proceso de Bernoulli, aparecen muy ntidamente cuando se construye un

    rbol de probabilidades del proceso.

    Por ejemplo vamos a construir el rbol de probabilidades de un proceso de

    Bernoulli de tres experimentos:

    El espacio muestral del proceso est formado por cada uno de los caminos del

    rbol de probabilidades. La probabilidad de un camino, por ejemplo, del camino

    : EFE es :

    Si en un proceso de Bernouilli asignamos el valor 1 al xito y 0 al fracaso y

    consideramos el valor Sj , suma de todos los valores de un resultado concreto

    (un camino) con j xitos ; la probabilidad que corresponde a cada valor de la

    variable Sj es :

  • 34 UTA Ing. M.B.A William Teneda

    Ejercicios De Distribucin Binomial

    La probabilidad de xito de una determinada vacuna es 0,72. Calcula la

    probabilidad de a que una vez administrada a 15 pacientes:

    a) Ninguno sufra la enfermedad

    b) Todos sufran la enfermedad

    c) Dos de ellos contraigan la enfermedad

    Solucin :

    Se trata de una distribucin binomial de parmetros B(15, 0'72)

    DISTRIBUCIN DE POISSON

    En teora de probabilidad y estadstica, la distribucin de Poisson es una

    distribucin de probabilidad discreta. Expresa la probabilidad de un nmero k

    de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa

    media conocida, y son independientes del tiempo desde el ltimo evento.

    La distribucin fue descubierta por Simon-Denis Poisson (17811840) que

    public, junto con su teora de probabilidad, en 1838 en su trabajo Recherches

  • 35 UTA Ing. M.B.A William Teneda

    sur la probabilit des jugements en matires criminelles et matire civile

    ("Investigacin sobre la probabilidad de los juicios en materias criminales y

    civiles"). El trabajo estaba enfocado en ciertas variables aleatorias N que

    cuentan, entre otras cosas, un nmero de ocurrencias discretas (muchas veces

    llamadas "arribos") que tienen lugar durante un intervalo de tiempo de duracin

    determinada. Si el nmero esperado de ocurrencias en este intervalo es ,

    entonces la probabilidad de que haya exactamente k ocurrencias (siendo k un

    entero no negativo, k = 0, 1, 2, ...) es igual a:

    dnde

    e es el base del logaritmo natural (e = 2.71828...),

    k! es el factorial de k,

    k es el nmero de ocurrencias de un evento,

    es un nmero real positivo, equivalente al nmero esperado de

    ocurrencias durante un intervalo dado. Por ejemplo, si los eventos

    ocurren de media cada 4 minutos, y se est interesado en el nmero de

    eventos ocurriendo en un intervalo de 10 minutos, se usara como

    modelo una distribucin de Poisson con = 2.5.

    Ejercicios De Distribucin De Poisson

    1. Si un banco recibe en promedio 6 cheques sin fondo por da, cules

    son las probabilidades de que reciba, a) cuatro cheques sin fondo en un da

    dado, b) 10 cheques sin fondos en cualquiera de dos das consecutivos?

    Solucin:

    a) x = variable que nos define el nmero de cheques sin fondo que llegan al

    banco en un da cualquiera = 0, 1, 2, 3, ....., etc, etc.

    l = 6 cheques sin fondo por da

    e = 2.718

  • 36 UTA Ing. M.B.A William Teneda

    b)

    x= variable que nos define el nmero de cheques sin fondo que llegan al banco

    en dos das consecutivos = 0, 1, 2, 3, ......, etc., etc.

    l = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das

    consecutivos

    Nota: l siempre debe de estar en funcin de x siempre o dicho de otra forma,

    debe hablar de lo mismo que x.

    2. En la inspeccin de hojalata producida por un proceso electroltico

    continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine

    las probabilidades de identificar a) una imperfeccin en 3 minutos, b) al menos

    dos imperfecciones en 5 minutos, c) cuando ms una imperfeccin en 15

    minutos.

    Solucin:

    a) x = variable que nos define el nmero de imperfecciones en la hojalata

    por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc.

    l = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

    b) x = variable que nos define el nmero de imperfecciones en la hojalata

    por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.

    l = 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata

  • 37 UTA Ing. M.B.A William Teneda

    =1-(0.367918+0.367918) = 0.26416

    c) x = variable que nos define el nmero de imperfecciones en la hojalata

    por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.

    l = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

    = 0.0498026 + 0.149408 = 0.1992106

    .

    DISTRIBUCIN NORMAL

    La distribucin normal fue reconocida por primera vez por el francs Abraham

    de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855)

    elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah

    que tambin se la conozca, ms comnmente, como la "campana de Gauss".

    La distribucin de una variable normal est completamente determinada por

    dos parmetros, su media y su desviacin estndar, denotadas generalmente

    por y .

    Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es

    proporcional al nmero de datos en el rango de valores correspondiente si, tal y

    como se muestra en la Figura 2, en el eje horizontal se levantan

    perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas

    lneas indica la probabilidad de que la variable de inters, X, tome un valor

    cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en

  • 38 UTA Ing. M.B.A William Teneda

    torno a la media, mientras que sus "ramas" se extienden asintticamente hacia

    los ejes, cuando una variable siga una distribucin normal, ser mucho ms

    probable observar un dato cercano al valor medio que uno que se encuentre

    muy alejado de ste.

    Propiedades de la distribucin normal:

    La distribucin normal posee ciertas propiedades importantes que conviene

    destacar:

    1. Tiene una nica moda, que coincide con su media y su

    mediana.

    2. La curva normal es asinttica al eje de abscisas. Por ello,

    cualquier valor entre y es tericamente posible. El

    rea total bajo la curva es, por tanto, igual a 1.

    3. Es simtrica con respecto a su media . Segn esto, para

    este tipo de variables existe una probabilidad de un 50% de

    observar un dato mayor que la media, y un 50% de observar

    un dato menor.

    4. La distancia entre la lnea trazada en la media y el punto de

    inflexin de la curva es igual a una desviacin tpica ( ).

    Cuanto mayor sea , ms aplanada ser la curva de la

    densidad.

    5. El rea bajo la curva comprendido entre los valores situados

    aproximadamente a dos desviaciones estndar de la media

    es igual a 0.95. En concreto, existe un 95% de posibilidades

    de observar un valor comprendido en el intervalo

    .

    6. La forma de la campana de Gauss depende de los

    parmetros y (Figura 3). La media indica la posicin de

    la campana, de modo que para diferentes valores de la

    grfica es desplazada a lo largo del eje horizontal. Por otra

    parte, la desviacin estndar determina el grado de

    apuntamiento de la curva. Cuanto mayor sea el valor de ,

    ms se dispersarn los datos en torno a la media y la curva

    ser ms plana. Un valor pequeo de este parmetro indica,

  • 39 UTA Ing. M.B.A William Teneda

    por tanto, una gran probabilidad de obtener datos cercanos al

    valor medio de la distribucin.

    Ejemplo 1:

    Utilizando la tabla del rea bajo la curva normal, plantearemos algunos problemas que

    servirn de modelo.

    a.- para Z = 1.5 y Z = -.1.4

    Z = 1.5 la tabla da : 0.4332

    Z = 1.4 la tabla da : 0.4192

    P(-1.4 < Z < 1.5) = 0.4332+0.4192 = 0.8524

    P = 85.24%

    b.- si se plantea P( Z < 1.5 corresponden al

    siguiente grfico:

    0.5000+0.4232 = 0.9332 = 93.32%

  • 40 UTA Ing. M.B.A William Teneda

    c.- otro problema seria P(Z > 1.5) = ?

    0.5000-0.4332 = 0.0668 = 6.68%

    DISTRIBUCIONES t DE STUDENT

    El lector sabe cmo hacer deducciones acerca de la mayora de la poblacin si

    cabe suponer que la distribucin muestral de las medias es normal. Sin

    embargo, cabe preguntarse qu puede hacerse si se desconoce y n es

    pequea, de modo que no puede hacerse esta suposicin de normalidad.

    Contestaremos a esta pregunta en el presente captulo. Se encontrar una

    familia de distribuciones t(una distinta para cada valor de n), pero no se toma,

    porque pronto se descubrir que, conforme n aumenta, la distribucin t

    correspondiente se asemeja mucho a la distribucin normal, e incluso cuando n

    es pequea, se aplica una distribucin tefe la misma manera en que se hace

    con una distribucin normal.

    Se aprender cundo utilizar puntuaciones i y cundo utilizar puntuaciones z y

    cmo emplear puntuaciones t, para una media de la poblacin y para

    diferencias en las medias de dos poblaciones. Por ltimo, se descubrir cmo

    tratar puntuaciones apareadas en muestras que no son independientes.

    Caractersticas De Las Distribuciones t

    Las distribuciones t de Student tienen las siguientes caractersticas:

    1. No hay slo una distribucin t sino una distribucin distinta para cada valor den. Hay una curva normal estndar, y un cuadro de una pgina puede dar

    reas debajo de esta curva para la mayor parte de los valores de z que nos

  • 41 UTA Ing. M.B.A William Teneda

    interesan. Hay toda una familia de curvas t "estndar". Si se formara un cuadro

    para las reas debajo de la curva t para cada n (equivalente al cuadro para las

    reas debajo de la curva normal estndar), se necesitara todo un volumen. Los

    cuadros t sern muy abreviados.

    2. Cada curva t es simtrica a los lados de 0. E-lo significa que la mitad derecha de la curva t tiene este aspecto

    Y la mitad izquierda es una imagen en espejo; la curva entera tendr este

    aspecto:

    A causa de lo anterior, la media de toda distribucin f es 0.

    3. El punto ms alto de la curva ocurre cuando t = 0.

    4. Al aumentar n, la curva t se acerca cada vez ms a la curva normal. Es fcil advertir lo anterior considerando algunas grficas superpuestas:

    Si n es de 30, o ms, la distribucin t y la distribucin normal estndar estn lo

    suficientemente cercanas de modo que las reas abajo de esta ltima pueden

    utilizarse como aproximacin a las reas debajo de la primera. Esta cercana

  • 42 UTA Ing. M.B.A William Teneda

    de las curvas f y z para valores altos de n es lo que justifica el empleo de la

    ecuacin s/Vn como aproximacin de x cuando n es grande y se desconoce

    5. Cada distribucin t es una distribucin de probabilidad; esto es: el rea debajo de toda la curva es una, y la probabilidad de que una puntuacin t est

    entre a y b es igual a rea debajo de la curva entre las lneas t = a y t = b.

    CUANDO SE USA UNA DISTRIBUCIN t?

    La distribucin t se usa en las siguientes circunstancias:

    a) La poblacin tiene distribucin normal y,

    b) Se desconoce o- (pero se conoce s o puede calcularse) y

    c) n 30.

    Si la poblacin no tiene distribucin normal, se cometer un error. Qu tan

    grande es el error? Depende de qu tan lejos est la poblacin de la

    distribucin normal. Si es casi normal, el error ser pequeo. Si est muy lejos

    de ser normal, la distribucin t es casi intil. En la prctica, el problema es que

    a menudo se desconoce si la poblacin sigue o no una curva normal.

    GRADOS DE LIBERTAD

    Cmo se usa una distribucin t?

    Antes de continuar, debemos desviarnos un momento para explicar los grados

    de libertad.

    Imaginemos tres nios que juegan un juego muy sencillo; a saber: tres cartas

    estn marcadas, 0, 10 y 20 respectivamente. Se barajan las cartas y cada nio

    por turno toma una. Jaime es impulsivo y toma una carta en primer lugar; tiene

    10 puntos. Mara elige en seguida y obtiene 0. Toms toma la ltima carta y

    debe tener 20 puntos. Sin embargo, si Jaime sac la carta 0 y Mara la carta

    20, Toms sacar la carta 10. El punto es que, una vez que dos nios han

    elegido su carta, la tercera est fija. Dos de los nios eligieron libremente: hay

    dos grados de libertad.

  • 43 UTA Ing. M.B.A William Teneda

    Sin puntuaciones tienen media X, n -1 puede elegirse libremente y la ltima es

    regida; hay n -1 grados de libertad.

    Para encontrar un intervalo de confianza o poner a prueba una hiptesis acerca

    de la media valindose de la distribucin f para una muestra de dimensin n, el

    nmero de grado de libertad es n - 1. La letra D se utiliza para denotar el

    nmero de grados de libertad.

    D = n - 1

    DISTRIBUCION JI CUADRADO En primer lugar, conzcase la letra griega x (ji); no hay equivalente en

    castellano, pero fonticamente corresponde a ji. La veremos nicamente en la

    forma x2 y nos referiremos a distribuciones de ji cuadrada o pruebas de ji

    cuadrada.

    Se han conocido varias familias de distribuciones de probabilidad; a saber:

    distribuciones binomial, normal y. Ahora se conocer otra familia de

    distribuciones de probabilidad; al igual que con las distribuciones t, habr una

    distribucin x2 diferente para cada nmero de grados de libertad. Antes de

    conocer a fondo una distribucin x2 veamos un problema en el cual se necesita.

    Ejemplo 1. Estudios efectuados en 1950 comprobaron que, entre todos los

    varones con 30 aos de edad, 20 por 100 haban cursado la escuela superior,

    50 por 100 tenan certificado de escuela secundaria pero no de escuela

    superior, y 30 por 100 no haban llegado a la escuela secundaria. La

    distribucin de la poblacin actual es semejante? Se efecta un estudio de 1

    000 varones tomados aleatoriamente de quienes hoy tienen 30 aos de edad, y

    se descubre que 250 se han graduado en colegio superior, 520 en escuela

    secundaria y 230 no han terminado la secundaria. Hgase una prueba a nivel

    de significacin de .01.

    H: No hay cambio en la distribucin entre 1950 y la actualidad. (Advirtase que

    Ho es un supuesto no acerca de la media ola proporcin de una poblacin, sino

    acerca de la distribucin global de una poblacin.)

    H1: La poblacin actual (esto es: todos los varones que en la actualidad tienen

    30 aos de edad) posee distribucin distinta que la poblacin en 1950.

    Sea Ola letra 0, no el nmero 0 abreviatura de frecuencia Observada (en

    ~a actualidad) y E denote frecuencia Esperada. Si no hay cambio en la

    distribucin entre 1950, y la actualidad, los datos proporcionados pueden

  • 44 UTA Ing. M.B.A William Teneda

    presentarse de la manera siguiente:

    Graduados de colegio superior

    Graduados de escuela secundaria

    No graduados de escuela secundaria

    Total de graduados

    En 1950, 20 por 100 tenan estudios superiores. En consecuencia, caba

    esperar que en una muestra de 1 000,20 por 100 200 varones fuesen

    graduados de colegio superior, 50 por 100 500 varones hubiesen terminado la

    escuela secundaria, y 30 por 100 300 no hubiesen terminado la secundaria.

    Advirtase que comenzamos escalando la columna E de modo que la suma

    sea igual a la de la columna 0. Es inadecuado expresar la columna O en

    nmeros de varones (total 1 000) y la columna E en porcentajes o proporciones

    (total 1006 1, respectivamente). Las dos columnas deben sumar el nmero total

    de cifras en la muestra.

    Ahora debe hacerse una decisin de eleccin: qu debe utilizarse como

    requisito para aceptar o rechazar H(OE) describe la diferencia entre las dos

    distribuciones? Pero (0 E) = 0E = n n=0. 0, como se muestra en la

    columna OE que sigue, 50+20-70 = 0.

    Graduados de escuela

    superior

    Graduados de secundaria

    No graduados de secundaria

    Total de graduados

    Recuerda que al explicar medidas de variabilidad consideramos (xx)n pero result que(X) siempre es igual a 0? Despus ensayamos (x-)2 y por

    ltimo (x)2n la varianza.

    En consecuencia, en este caso podemos advertir si (0-E)2 manifiesta la

    diferencia entre las dos distribuciones. (0-E)2 = O nicamente si hay ajuste

    O E

    250 200

    520 500

    230 300

    1000 100

    O E O-E (O E)2 (O E)2/E

    250 200 50 2500 12.5

    520 500 20 400 8

    230 200 -70 4900 16.3

    1000 1000 0 7800 29.6

  • 45 UTA Ing. M.B.A William Teneda

    perfecto entre las frecuencias observada y esperada, y puede ser muy grande

    si no concuerdan.

    En lugar de limitarnos a usar (0-E)2 empleamos (0-E)2/E. El motivo de lo

    anterior es que una partida grande en la columna (0-E) 2es ms perturbadora si

    proviene de una categora con frecuencia esperada o calculada pequea que si

    la frecuencia esperada es grande, de manera que en el primer caso presenta

    mayor ponderacin. Una anotacin de 2500 en la columna (0-E)2 se convierte

    en 12.5 si la frecuencia esperada E es 200, pero ser slo 5.0 si la frecuencia

    esperada es 500, y 2.5 si la frecuencia esperada o calculada en la categora es

    1 000.

    Ahora definiremos x2:

    x2 = (0E)2E

    3.3 Trmino y Conceptos claves

    Definicin: El conjunto de todos los resultados posibles de un experimento estadstico se llama espacio muestral y se representa con el smbolo S.

    HIPOTESIS ESTADSTICAS

    Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la

    poblacin implicada. Tales hiptesis, que pueden ser o no ciertas, se llaman

    hiptesis estadsticas. Son, en general, enunciados acerca de las

    distribuciones de probabilidad de las poblaciones.

    Hiptesis nula

    En muchos casos formulamos una hiptesis estadstica con el nico

    propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda

    est trucada, formulamos la hiptesis de que la moneda es buena (o sea, p =

    0.5, donde p es la probabilidad de cara). Anlogamente, si deseamos

    decidir si un procedimiento es mejor que otro, formulamos la hiptesis de que

    no hay diferencia entre ellos (o sea, que cualquier diferencia observada se debe

  • 46 UTA Ing. M.B.A William Teneda

    simplemente a fluctuaciones en el muestreo de la misma poblacin). Tales

    hiptesis se suelen llamar hiptesis nula y se denotan Ho

    Hiptesis alternativa

    Toda hiptesis que difiera de una dada se llamar una hiptesis alternativa.

    Por ejemplo, si una hiptesis es p = 0.5, hiptesis alternativas podran ser p =

    0.7, p 0.5 o p > 0.5. Una hiptesis alternativa a la hiptesis nula se

    denotar por H1.

    ERRORES DE TIPO I Y DE TIPO II

    Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha

    cometido un error Tipo I.

    Por otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos

    que se ha cometido un error de Tipo II. En ambos casos, se ha producido un

    juicio errneo.

    Para que las reglas de decisin (o contrastes de hiptesis) sean buenas, deben

    disearse de modo que minimicen los errores de la decisin. Y no es una

    cuestin sencilla, porque para cualquier tamao de la muestra, un intento de

    disminuir un tipo de error suele ir acompaado de un crecimiento del otro tipo.

    En la prctica, un tipo de error puede ser ms grave que el otro, y dbil alcanzarse

    un compromiso que disminuya el error ms grave. La nica forma de disminuir

    ambos al la vez es aumentar el tamao de la muestra, que no siempre es

    posible.

    Tipos de errores

    Definicin.- El rechazo de la hiptesis nula cuando es verdadero se llama error de tipo 1

    Definicin.-No rechazarla hiptesis nula cuando es falsa se llama error de tipo 2

  • 47 UTA Ing. M.B.A William Teneda

    Cmo sabremos si est cometiendo un error de tipo I o de tipo II?

    Examinar la lgica de la influencia estadstica.

    Cmo saber si hemos rechazado o no una hiptesis nula equivocadamente?

    Coleccionar muestras y extraemos inferencias de las mismas nica y

    exclusivamente.

    No hay manera entonces de saber qu experimentos proporcionan resultados adecuados y cules no?

    La respuesta es si. Si tuviramos que repetir el experimento y obtener

    resultados parecidos tendramos mayor confianza de no estar cometiendo un

    error de tipo I

    3.4 Preguntas y Problemas Claves

    1. Defina cada uno de los conceptos de la seccin "trminos importantes".

    2. Supongamos que se cumplen los supuestos fundamentales de la prueba t.

    Cules son las caractersticas de la distribucin muestral de t?

    3. Explique lo que significa grados de libertad. Proponga un ejemplo.

    4. Cules son los supuestos fundamentales para el uso apropiado de la prueba

    t?

    5. Analice las semejanzas y las diferencias entre las pruebas z y t.

    6. Explique brevemente por qu la prueba z es ms poderosa que la prueba t.

  • 48 UTA Ing. M.B.A William Teneda

    7. Cul de las siguientes afirmaciones es ms correcta desde el punto de vista

    tcnico? 1) Tenemos el 95% de confianza de que la media de la poblacin se encuentra en el intervalo 80-90, o bien,

    8. 2) tenemos el 95% de confianza de que el intervalo 80-90 contiene la media de la poblacin. Explique.

    9. Explique por qu gl = N - 1 cuando se utiliza la prueba t con una sola muestra.

    10. Si el coeficiente de correlacin de una muestra tiene un valor diferente de cero

    (por ejemplo, r = 0.45), esto significa automticamente que la correlacin en la

    poblacin tambin es diferente de cero. Es correcta esta afirmacin?

    Explique.

    11. Con el mismo conjunto de datos mustrales, el intervalo de confianza de 99%

    para la media poblacional es mayor o menor que el intervalo de confianza de

    95% ? Le parece a usted lgico? Explique.

    12. Un conjunto muestral de 30 datos tiene una media de 82 y una desviacin

    estndar de 12. Podemos rechazar la hiptesis de que se trata de una

    muestra aleatoria, extrada de una poblacin normal con = 85? Utilice =

    0.012colas Para tomar su decisin, otra

    13. Es razonable considerar una muestra con N = 22, __X obt = 42 y s = 9 como una

    muestra aleatoria extrada de una poblacin normal con =38? Utilice =

    0.05 1 cola para tomar su decisin. Suponga que __X obt est en la direccin

    correcta, otra

    14. En cada una de las siguientes muestras aleatorias, determine los intervalos de

    confianza de 95 y el 99% para la media poblacional:

    i. __X obt = 25, s = 6, N = 15

    ii. __X obt = 120, s = 8, N = 30

  • 49 UTA Ing. M.B.A William Teneda

    iii. __X obt = 30.6, s = 5.5, N = 24

    iv. Vuelva a resolver la parte a con N = 30. Qu ocurre con el

    intervalo de confianza cuando N crece? Otra

    15. Supongamos que se desconoce la desviacin estndar poblacional del

    problema 21 del captulo 12, pgina 291. Utilice de nuevo = 0.052 Colas, Qu

    podra concluir con respecto a la tcnica de la estudiante? Explique la

    diferencia entre la conclusin del problema 21 y la de este problema, clnica,

    salud.

    16. si una variable aleatoria tiene distribucin normal estndar, calcula la

    probabilidad de que tome un valor:

    (a) menor que 1.50; (b) mayor que 2.16;

    (c) mayor que -1.175;

    17. escriba el valor de z si la probabilidad de que una variable aleatoria de

    distribucin normal estndar tome un valor:

    (a) menor que z es 0.9911; (b) mayor que z es 0.1093;

    (c) mayor que z es 0.6443; (d) menor que z es 0.0217

    e) entre z y z es 0.9298

    18. una variable aleatoria tiene una distribucin normal con = 62.4hallar su

    desviacin estndar si la probabilidad de que tome un valor mayor que 79.2 es

    verifica que

    z0.005=2.575

    z0.025=1.96

    3.5 Bibliografa Complementaria

    Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin.

    Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df

  • 50 UTA Ing. M.B.A William Teneda

    Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980.

    Primera Edicin

    Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill.

    Ronald E. Walpole, Raymond H. Myers. Probabilidad Y

    Estadstica. Editorial: 2007 Pearson Education De Mexico

    Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981

    McgrawHill Latinoamericana Editores S.A De C.V.

    Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw

    Hill/Interamericana Editores S.A De C.V. Edicon 2006.

    Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial:

    Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin.

    Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias.

    Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007.

    Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica.

    Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990.

    Estadistica de Inferencia. Hctor Anbal Saltos.