Estadística empresarial

download Estadística empresarial

of 153

Transcript of Estadística empresarial

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    1

    TEMA 1 VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES

    1. VARIABLE ALEATORIA UNIDIMENSIONAL.

    Una variable aleatoria es una funcin que asigna un valor numrico a cada suceso elemental del espacio muestral. Podemos encontrar variables aleatorias de dos tipos: discretas y continuas. Decimos que una variable aleatoria es discreta si toma un nmero finito o infinito, pero numerable de valores. Ser continua si puede tomar un nmero infinito no numerable de valores, o tomar valores en uno o ms intervalos de la recta real.

    1.2. DISTRIBUCIN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS.

    1..1. DISTRIBUCIN DE PROBABILIDAD, FUNCIN DE PROBABILIDAD O FUNCIN DE CUANTA.

    Es una funcin que llamaremos P(x) y que asigna las probabilidades con la que la variable aleatoria toma los posibles valores, de tal forma que las probabilidades verifiquen:

    1

    0 ( ) 1 1, 2,3,...,

    ( ) 1i

    r

    ii

    P x i r

    P x=

    =

    =

    Por lo tanto la probabilidad no puede ser negativa y para todos los valores posibles los sucesos son excluyentes y exhaustivos( Significa que de todos ellos slo debe de ocurrir uno y no pueden ocurrir dos de forma simultnea).

    1..2. FUNCIN DE DISTRIBUCIN.

    Una variable aleatoria queda definida cuando conocemos su campo de variacin y el conjunto de probabilidades con que toma valores en ese campo. La probabilidad del suceso ( ];X x recibe el nombre de funcin de distribucin de la variable aleatoria y la denominaremos ( ) ( )F x P X x= . La funcin de distribucin, por definicin no puede ser negativa, al ser una probabilidad, ni decreciente, ya que es acumulativa. Adems, por ser una probabilidad, est acotada 0 ( ) 1F x .

    1..2.1. PROPIEDADES.

    a) ( ) 0 ( ) 1F F = + = b) 1 2 2 1( ) ( ) ( )P x X x F x F x = c) La funcin es montona no decreciente. d) La funcin es continua por la derecha.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    2

    1.2. DISTRIBUCIN DE PROBABILIDAD DE VARIABLES ALEATORIAS CONTINUAS.

    1.2.1 FUNCIN DE DENSIDAD.

    Si X es una variable aleatoria de tipo continuo y se verifica:

    ( ) 0

    ( ) 1

    f x

    f x dx+

    =

    diremos que ( )f x es la funcin de densidad de la variable aleatoria continua. Grficamente representa la curva lmite correspondiente al histograma de frecuencias relativas. En el caso continuo la suma de densidades de probabilidad o rea bajo la curva ( )f x es igual a la unidad. Como en el caso continuo no existen las probabilidades puntuales

    ( ) 0P X a= = entonces ( ) ( )P a X b P a X b = < <

    1.2.1 FUNCIN DE DISTRIBUCIN ( ) ( ) ( )xF x P X x f x dx

    = = y representa el rea limitada por la curva funcin de densidad y a la izquierda de la recta X x=

    La funcin de distribucin conduce a la probabilidad a travs de una longitud, mientras que si utilizamos la funcin de densidad el valor es el mismo pero expresado como un rea.

    1.2.1 DISTRIBUCIN SIMTRICA.

    Se dice que una distribucin es simtrica respecto de un punto c si se verifica: ( ) ( )P X c x P X c x x = +

    Diremos que es simtrica respecto del punto cero si: ( ) ( )f x f x= (ver problemas 1 y 2)

    2. VARIABLE ALEATORIA BIDIMENSIONAL

    2.1.. DISTRIBUCIN DE PROBABILIDAD BIDIMENSIONAL.

    Podemos encontrarnos con los dos casos ya mencionados, discretos y continuos.

    En el caso discreto:

    Distribucin de probabilidad conjunta: 1 1

    0 ( , ) 1 ( , ) 1r s

    i jP x y P x y =

    Funcin de distribucin conjunta: ( )( , ) ; ( ; )i jF x y P X x Y y P X x Y y= = = = En el caso continuo:

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    3

    Funcin de densidad bidimensional: ( , ) 0

    ( , ) 1+- -

    f x y - x yf x y dxdy +

    < < + < < +

    =

    Funcin de distribucin bidimensional: ( , ) ( ; ) ( , )x yF x y P X x Y y f x y dxdy

    = =

    2.1.1 DISTRIBUCIONES MARGINALES. Cuando queremos conocer por separado la distribucin de alguna o de ambas variables partiendo de la informacin que nos da la distribucin conjunta.

    CASO DISCRETO.

    Distribucin de probabilidad marginal. . ( ) ( ; )

    . ( ) ( ; )j

    i

    i i i jy

    j j i jx

    P P x P X x Y y

    P P y P X x Y y

    = = = =

    = = = =

    Funcin de distribucin marginal. 1

    2

    ( ) ( , ) .( ) ( , ) .

    i

    j

    F x P X x Y PF y P X Y y P

    = < == < =

    CASO CONTINUO.

    Funcin de densidad marginal. 1

    2

    ( ) ( , )

    ( ) ( , )

    f x f x y dy

    f y f x y dx

    +

    +

    =

    =

    Funcin de distribucin marginal: 1 1

    2 2

    ( ) ( )

    ( ) ( )

    x

    y

    F x f x dx

    F y f y dy

    =

    =

    2.1.. DISTRIBUCIONES CONDICIONADAS. Cuando nos interesa conocer cmo se distribuye una de las variables cuando se imponen condiciones a la otra.

    CASO DISCRETO. Distribucin de probabilidad condicionada.

    ( ) ( ) ( ; ) ( ) 0( ) .ijpP X x Y yx X xP P siempre que P y yy Y y P Y y P j= === = = = >= =

    Funcin de distribucin condicionada.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    4

    ( ) ( ) ( , )( )P X x Y yx X xF Py Y y P Y y= == == =

    CASO CONTINUO.

    Funcin de densidad condicionada.

    ( )( )

    22

    11

    ( , ) ( ) 0( )0

    ( , ) ( ) 0( )0

    f x y f y

    x f yf y en el resto

    f x y f xy f xf

    x en el resto

    >

    =

    >

    =

    Funcin de distribucin condicionada.

    ( ) ( )( ) ( )

    2

    1

    ( , )( )

    ( , )( )

    x

    x

    y

    y

    f x y dxx xF f dxy y f y

    f x y dyy yF f dyx x f x

    = =

    = =

    2.1.. Independencia de variables aleatorias.

    Se dice que dos variables aleatorias son independientes si y slo si se verifica que la funcin de distribucin conjunta es igual al producto de sus distribuciones marginales: 1 2( , ) ( ) ( )F x y F x F y= Si las variables son discretas ( , ) ( ) ( )i jP x y P x P y= Si las variables son continuas 1 2( , ) ( ) ( )f x y f x f y=

    (ver problemas 3, 4 y 5)

    TEMA 1. PROBLEMAS

    1. En un dado trucado, la variable aleatoria puntuacin tiene la siguiente distribucin de probabilidad.

    xi 1 2 3 4 5 6 P(X=xi) 0,10 0,40 0,10 0,20 0,05 0,15

    Hallar la funcin de distribucin.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    5

    ( ) ( )( 1) 0,10( 2) 0,10 0, 40 0,50( 3) 0,10 0, 40 0,10 0,60( 4) 0,80( 5) 0,85( 6) 1

    iF x P X xP XP XP XP XP XP X

    = = = + = = + + = = = =

    2. Se ha comprobado que un gran nmero de fenmenos fsicos tienen asociada una variable aleatoria cuya funcin de densidad es:

    0 0( )0

    kxKe si x kf x en el resto

    < < >=

    Se pide: a) Qu valor puede tomar k. b) P(X>10) c) P(50

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    6

    a) 2 2 2 21 1 1( )3 1 3 1

    2 2 20 0 0 0

    ( 3, 1) x y x yP X Y xye dxdy xe dx ye dy + = = hacemos un

    cambio de variables

    21 0 02

    112

    y t Si y t

    ydy dt y t

    = = =

    = = =

    2 2 2 21 1 1 1 11 13 3 3 302 2 2 2 22 200 0 0 0 0

    11x x x x

    t txe dx e dt xe dx e xe dx e e xe dxe

    = = + =

    volvemos ha hacer un cambio de variables

    21 0 02

    932

    x t x t

    xdx dt x t

    = = =

    = = =

    21 9 932 2 2

    00 0 9

    9

    1 1 1 1 11 1 1 1 1

    1 11 1

    x t txe dx e dt e

    e e e e e

    e e

    = = = + =

    =

    b) 2 2 2 2 2

    2 2 2 2 2

    1 1 1 1( )2 2 2 2

    1 0 0

    1 1 1 1( )2 2 2 2

    2 0 0 9

    1( ) 1

    1( ) 1

    x y x y x

    x y y x y

    f x xye dy xe ye dy xee

    f y xye dx ye xe dx yee

    +

    +

    = = =

    = = =

    c)Debe cumplirse 1 2( , ) ( ) ( )f x y f x f y= 2 2 2 21 1 1( )

    2 2 29

    1 11 1x y x y

    xye xe yee e

    +

    Por lo tanto no son independientes.

    4. Una empresa se dedica a la fabricacin de un producto X y otro accesorio Y. La demanda de ambos productos tiene una funcin de densidad conjunta:

    ( , ) 2 2 ; 2xf x y xy para x y= Se pide: ( 1)P X , Si la demanda de X = 15, hallar la probabilidad de que la demanda de 0 '5Y . Ver si son independientes.

    X 0 2 Y 0 1

    Observamos que aunque el campo de variacin viene de - hasta 2, la funcin de demanda de un producto parte de 0. (no existe una demanda negativa)

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    7

    En primer lugar hallamos las funciones de densidad marginal. 32 2

    21 0

    022 2 3

    2 2 2

    ( ) 2 2 0 22 4

    ( ) 2 2 4( ) 0 12

    xx

    y y

    xyf x xydy x si x

    xf y xydx y y y si y

    = = = <

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    8

    ( )( )( )

    ( 5, 2) 0 '15 0 '362 ( 2) 0 '28( 10, 2) 0 '0510 0'182 ( 2) 0 '28( 15, 2) 0 '1315 0 '462 ( 2) 0 '28

    P x yXP Y P yP x yXP Y P yP x yXP Y P y

    = ==

    = = ==

    =

    = ==

    = = ==

    =

    = ==

    = = ==

    =

    La distribucin condicionada de Y cuando X = 5

    ( )( )

    ( 1, 5) 0 '251 0 '7145 ( 5) 0 '35( 2, 5) 0 '12 0 '2855 ( 5) 0 '35

    P y xYP X P xP y xYP X P x

    = == = = =

    ==

    = ==

    = = ==

    =

    6. Dada una distribucin bidimensional (X,Y) con una funcin de densidad ( )( , ) 0; 0x yf x y e x y += > > Hallar: distribucin marginal de X e Y. Distribucin de Y

    condicionada por X = a; distribucin de X condicionada por Y = b.

    ( )1 00 0

    0

    ( )2 00 0

    0

    1 1( ) ( , ) 1

    1( ) ( . )

    x y x y x xy

    x

    x y y x y yx

    f x f x y dy e dy e e e ee

    e

    f y f x y dx e dx e e e ee

    +

    +

    = = = = = + =

    =

    = = = = =

    Observamos en este caso que s son independientes

    1 2( )( , ) ( ) ( )

    x y x y

    f x y f x f ye e e

    +

    =

    =

    ( )( )

    ( )

    1( )

    2

    ( , )( )

    ( , )( )

    a yy

    a

    x bx

    b

    f x y eYf eX a f x ef x y eXf eY b f y e

    +

    = = ==

    = = ==

    TEMA 2.

    CARACTERSTICAS DE LAS VARIABLES ALEATORIAS.

    1. VALOR ESPERADO O ESPERANZA MATEMTICA.

    En el caso discreto representa la media ponderada de los posibles valores que puede tomar la variable aleatoria X. En el caso continuo representa el centro de la funcin de densidad. Para ambos casos es necesaria la condicin de convergencia absoluta, es decir que tengan un valor finito.

    P(Y/X=5) 0714 0285

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    9

    1 CASO DISCRETO ( ) ( )i ii

    E X x P x=

    CASO CONTINUO [ ] ( )E X xf x dx+

    =

    PROPIEDADES: - La esperanza de una constante es la propia constante. - Si la variable aleatoria est acotada ( )a X b a E X b - ( ) ( ) ( )E a b E a E b+ = + - ( ) ( )E kX kE X= - Si tenemos dos funciones [ ] [ ]( ) ( ) ( ) ( )g X H X E g X E h X - Si X es una variable aleatoria con distribucin simtrica respecto a un

    punto c, entonces si existe su esperanza ( )E X c=

    2. VALOR ESPERADO DE UNA FUNCIN DE UNA VARIABLE ALEATORIA.

    En este caso se calcula el valor esperado de una funcin, a diferencia del caso anterior en el que se calcula el valor esperado de una variable.

    CASO DISCRETO [ ]( ) ( ) ( )i ii

    E g x g x P x=

    CASO CONTINUO [ ]( ) ( ) ( )E g x g x f x dx+

    = (ver problemas)

    3. MOMENTOS

    - CON RESPECTO AL ORIGEN

    ( )rr

    E X r =1,2,3,...,n =

    ( )( )

    ( )

    r

    i iir

    rr

    x P xE X

    x f x dx

    +

    = =

    - CON RESPECTO A LA MEDIA O MOMENTO CENTRAL [ ]( ) 2,3,....,rR E X E X r n = =

    [ ] [ ][ ]( ) ( )

    ( ) ( )( ) ( )

    r

    i i irr

    r

    x E x P xE X X

    x E X f x dx +

    = =

    Importante: 1 ( )E X x = = =

    2 22 2 1( ) = =

    4. VARIANZA

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    10

    Es el momento central o con respecto a la media de orden dos. Es una medida de dispersin absoluta de los valores de la distribucin con respecto a su media, nos indica cmo representa la media a la distribucin. Como la varianza se encuentra representada en una unidad distinta a la media, se introduce la desviacin tpica

    2 = La varianza est influenciada por el tamao de los valores que toma y por la media. PROPIEDADES -

    2 22 2 1( ) = =

    - La varianza de una constante es cero. -

    2( ) ( )V kX k V X= -

    2( ) ( ) 0V kX B k V X+ = + - Si X e Y son dos variables aleatorias independientes, cuyas varianzas existen,

    entonces se verifica: ( ) ( ) ( )V X Y V X V Y = + - La varianza nunca es negativa.

    5. COEFICIENTE DE VARIACIN.

    Para eliminar la influencia que tiene la media con respecto a la varianza, se utiliza otra medida de dispersin, esta vez relativa, que expresa la dispersin de una variable aleatoria respecto a su media. Con el coeficiente de variacin podemos comparar dos distribuciones distintas de probabilidad.

    . .C V

    =

    El coeficiente no tendr sentido, cuando la variable aleatoria X tome valores positivos y negativos( la media puede quedar compensada), slo cuando tome valores positivos.

    6. CAMBIOS DE ORIGEN Y ESCALA.

    A veces es necesario para facilitar los clculos, realizar cambios de origen y escala. Si desplazamos los valores de una variable X en OT unidades del eje. TT X O= ( ) ( ) T T X TE T E X O O = =

    Si realizamos un cambio de escala e>0 TX OYe

    =

    1( ) ( )T T

    X TY

    X OE Y E E X O

    e e

    Oe

    = =

    =

    Por lo tanto la media se ver afectada ante

    cambios de origen y escala.

    Con respecto a la varianza: 2

    22 2

    1 ( )T XYX OV V X

    e e e

    = = =

    Por lo tanto no le afectan los cambios de origen, pero s los de escala.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    11

    Con respecto al coeficiente de variacin: X

    Y XY

    XY X

    eCV O Oe

    = = =

    Por lo tanto no le afectan los cambios de escala, pero s los de origen. ( Exceptuando que OT = 0) (ver problema 6)

    7. TIPIFICACIN DE UNA VARIABLE

    Las distribuciones poseen en general distintas medidas de posicin y de dispersin. Puede ocurrir que muchas distribuciones sean anlogas, o sea, slo se diferencian en sus orgenes o en sus escalas. Cuando queremos comparar estas distribuciones debemos hacerlas homogneas, a travs de la normalizacin o tipificacin.

    XZ

    = (0,1)N Es necesario que 0 > . Z no tiene asociada ninguna medida, con lo que puede compararse con otras variables tipificadas. (ver problema 7)

    8. OTRAS MEDIDAS DE POSICIN Y DISPERSIN.

    Cuantiles: mediana, cuartiles, deciles, percentiles.

    ( ) ( ) 1) ( )

    q q

    q q

    P X x q P X x q caso discreto.P(X x q F x q caso continuo

    = =

    0 1q Moda: ser aquel valor de la variable para el cual la funcin de probabilidad o la

    funcin de densidad se hace mxima. '( ) 0 ''( ) 0o of M f M= < Desviacin absoluta media respecto a la mediana. ( )e eE X M x M f x dx

    +

    = Recorrido intercuartlico. 3 1QR Q Q= dentro de este intervalo intercuartlico se

    encuentran el 50% de los valores centrales de la variable, prescindiendo del 25% de los valores ms pequeos y el 25% de los valores ms grandes.

    9. MEDIDAS DE FORMA

    Coeficiente de asimetra de Fisher: 1

    31 13

    1

    00

    simetrica asimetrica negativa

    asimetrica positiva

    =

    =

    Coeficiente de curtosis o apuntamiento:

    42 4 3

    =

    2

    2

    2

    000

    mesocurtica o normal. platicurtica leptocurtica

    =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    12

    10. TEOREMA DE MARKOV Y DESIGUALDAD DE CHEBYCHEV

    Se utilizan cuando conocemos la media y varianza de una distribucin desconocida y queremos calcular cotas superiores de ciertas probabilidades o la probabilidad para algn intervalo relativo a la media.

    Teorema de Markov: Sea X una variable aleatoria no negativa ( 0) 1P X = cuya media existe. Para cualquier k>0 ( )( ) E XP X k

    K

    Desigualdad de Chebychev: Sea X una variable aleatoria con media conocida y varianza finita; para cualquier k > 0

    2 2

    1P X k P X kk k

    <

    [ ] [ ]

    [ ]

    2

    2

    1

    P X k P X k P X kk

    P k X kk

    = + +

    < < +

    Si k crece, la probabilidad de que X se encuentre fuera del intervalo es menor. La cota de probabilidad es la misma para cualquier variable aleatoria, ya que slo depende de k. Y la amplitud del intervalo depende de la . Para una menor, disminuye la amplitud del intervalo para una misma probabilidad. Para una mayor aumenta la amplitud del intervalo para una misma probabilidad.

    Si hacemos k = para cualquier 0 > la desigualdad resulta:

    [ ]

    2

    2 2 2

    2

    1

    11

    P X

    P X

    =

    < < +

    (ver ejercicios)

    11. FUNCIN GENERATRIZ DE MOMENTOS

    Se utiliza para calcular los momentos de la distribucin de una variable aleatoria, y para obtener la distribucin de una funcin de variables aleatorias. Sea t un nmero real, la funcin generatriz de X ser: ( ) ( )txXg t E e= CASO DISCRETO ( ) ( ) itxtx iE e P x e= la serie debe ser convergente

    k k +

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    13

    CASO CONTINUO ( ) ( )tx txE e e f x dx+

    = la integral debe ser convergente

    Teorema de la unicidad de la funcin generatriz. Si la funcin generatriz existe, es nica y determina la distribucin de probabilidad de la variable aleatoria. Si dos variables tienen la misma funcin generatriz, entonces tienen la misma distribucin de probabilidad y viceversa. (ver ejercicios)

    12. VALOR ESPERADO DE UNA V.A BIDIMENSIONAL.

    CASO DISCRETO ( ), ( , ) ,i j i jE g X Y g x y P X x Y y = = = CASO CONTINUO ( , ) ( , )g x y f x y dxdy+ +

    Tanto la serie, como la integral deben ser absolutamente convergentes.

    Propiedades. Rigen las mismas propiedades que para el caso unidimensional. Si X e Y son variables independientes, cuyos valores esperados existen,

    entonces [ ] ( ) ( )E XY E X E Y=

    13. MOMENTOS DE UNA V.A BIDIMENSIONAL

    Con respecto al origen 0,1,2....r srs E X Y r = =

    Con respecto a la media ( ) ( ) , 0,1,2....r srs E X X Y Y r s = =

    10

    012

    202

    02

    112

    20 20 102

    02 02 01

    11 11 10 01

    ( )( )( )( )( )

    ( )( )

    ( , )

    X

    Y

    E XE YE XE YE XY

    V XV Y

    Cov X Y

    = =

    = =

    =

    =

    =

    = =

    = =

    = =

    14. COVARIANZA

    Permite dar una medida de la fuerza de la relacin lineal entre las variables, aunque al ser el producto de las unidades de dos variables aleatorias, esto hace difcil determinar la fuerza de la relacin.

    Cov(X;Y)>0 X aumenta, cuando aumenta Y o X disminuye cuando disminuye Y.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    14

    Cov(X;Y)0 correlacion positiva

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    15

    1. DISTRIBUCIN UNIFORME DISCRETA. Es la distribucin de una variable aleatoria discreta cuyos valores posibles son equiprobables.

    Funcin de cuanta 1

    ( ) ( )0

    i i=1,2,..,n

    P X P X x N en el resto

    = = =

    Funcin de distribucin 1( ) ( )F X P X xN

    = =

    2 Esperanza matemtica

    1 1 1 1 1( ) ( ) (1 2 3 ... )2 2i i i

    n nE X x P x x n nN N N

    + += = = + + + + = =

    Varianza 2 2

    21 1 1( )12i i

    nV X x xN N

    = =

    Funcin generatriz de momentos 1( ) txxg t eN= (VER PROBLEMA 1)

    2. DISTRIBUCIN DE BERNOUILLI.

    Sea un experimento aleatorio que nicamente da lugar a dos posibles resultados, que son mutuamente excluyentes y exhaustivos. Suceso xito A Suceso fracaso A

    A A E

    A A

    Funcin de cuanta 1( ) (1 ) 1, 2x xP X p p siendo x= =

    Funcin de distribucin 0 0

    ( ) 1 0 11 1

    si xF X p si x

    si x

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    16

    3. DISTRIBUCIN BINOMIAL.

    Este tipo de distribucin se da cuando se repite varias veces la prueba de Bernouilli. La probabilidad de xito es ( )P A p= que ser constante en todas las repeticiones. Se define la variable aleatoria Binomial X, como el nmero de xitos que tienen lugar cuando se realizan n repeticiones de la prueba de Bernouilli. ( , )X B n p

    Funcin de cuanta ( ) ( ) (1 )x n xnP X P X x p px

    = = =

    Funcin de distribucin

    0 0

    ( ) (1 ) 0

    1 1

    i n i

    si xn

    F X p p si x nx

    si x

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    17

    Funcin de distribucin 0 0

    ( ) ( )1, 2,...

    !i

    si xF X P X x

    e xx

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    18

    [ ]222 2 2

    2

    ( 1) ( ) 0 '6( 0) ( ) 1 0 '6 0 '4( ) 1 ( ) 0 ( ) 0 '6( ) 0 '6 0 '4 0 '24( ) ( ) ( )( ) 0 0 '4 1 0 '6 0 '6( ) 0 '6 (0 '6) 0 '24

    P X P A

    P X P A

    E X P A P AV X pq

    V X E X E X

    E XV X

    = = =

    = = = =

    = + =

    = = =

    =

    = + =

    = =

    3. Tres personas lanzan al aire dos monedas cada una. Sea X, el nmero de personas que obtienen dos caras. Determinar: funcin de cuanta, la tabla de probabilidad, la esperanza, la varianza y la funcin generatriz.

    Es una repeticin de un experimento aleatorio con dos posibles resultados ( cara o cruz).

    !!( )!

    n

    m

    mmCnn m n

    = =

    ( , )X B n p

    existen doce posibles resultados al lanzar las monedas 3 12

    cc

    cx

    xc

    xx

    =

    3(3, )12

    X B

    333 33 3( ) ( ) 1 0 '25 0 '75

    12 12

    r r

    r rf x P X rr r

    = = = =

    Tabla

    0 3

    1 2

    2

    3 0

    3(0) 0 '25 0 '75 0 '421903(1) 0 '25 0 '75 0 '421913(2) 0 '25 0 '75 0 '140623(3) 0 '25 0 '75 0 '01563

    f

    f

    f

    f

    = =

    = =

    = =

    = =

    3

    0

    ( ) 3 0 '25 0 '75

    ( ) ( ) 0 0 '4219 1 0 '4219 2 0'1406 3 0 '0156 0 '75

    E X np

    E X rP r

    = = =

    = = + + + =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    19

    ( ) ( )( )

    23 32 2 2 2

    0 0

    2

    ( ) 3 0 '25 0 '75 0 '5626

    ( ) ( ) ( ) 0 0 '4219 1 0'4219 2 0 '1406 3 0 '0156

    0 '75 0 '5625

    V X npq

    V X r P r rP r

    = = =

    = = + + +

    =

    ( ) ( ) (0 '75 0 '25 )t n t ng t q pe e= + = + Si derivamos la funcin generatriz, obtenemos los diferentes momentos.

    0 0

    '( ) 3(0 '75 0 '25 )(0 '25 )'(0) 3(0 '75 0 '25 )(0 '25 ) 0 '75 ( )

    t tg t e e

    g e e E X= +

    = + = =

    4. El nmero medio de enfermos recibidos cada 10 minutos en un centro sanitario, entre las 10 horas y las 15 horas es de 18. Calcular la probabilidad de que entre las 12h40min y las 12h50min, haya: ningn enfermo, un enfermo, dos enfermos, al menos dos enfermos, ms de dos enfermos.

    01'81'8( 0) 0 '1653

    0!P X e= = =

    1'81'8( 1) 0 '2975

    1!P X e= = =

    21'81'8( 2) 0 '2678

    2!P X e= = =

    [ ]( 2) 1 ( 0) ( 1) 0 '5372P X P X P X = = + = = [ ]( 2) 1 ( 0) ( 1) ( 2) 0 '2694P X P X P X P X> = = + = + = =

    5. Se sabe que el 1% de los artculos importados de un determinado pas tienen algn defecto. Si tomamos una muestra de tamao 30 (artculos), determinar la probabilidad de que tres o ms de ellos tengan algn defecto.

    La distribucin es (30, 0 '01)B

    3 27

    ( 3) ( 3) ( 4) ( 5) ...30( 3) 0 '01 0 '99 0 '00313

    P X P X P X P X

    P X

    = = + = + = +

    = = =

    4 26

    5 25

    30( 4) 0 '01 0 '99 0 '00024

    30( 5) 0 '01 0 '99 05

    P X

    P X

    = = =

    = =

    Las restantes son nulas. ( 3) 0 '0031 0 '0002 0'0033P X = +

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    20

    Como 0'1p y 30n podemos aproximarla a travs de una distribucin de Poisson.

    30 '3

    40 ' 3

    50 '3

    30 0'01 0 '3( 3) ( 3) ( 4) ( 5) ...

    0 '3( 3) 0 '00333!

    0 '3( 4) 0 '00024!

    0 '3( 5) 05!

    ( 3) 0 '0035

    npP X P X P X P X

    P X e

    P X e

    P X e

    P X

    = = =

    = = + = + = +

    = = =

    = = =

    = =

    TEMA 4

    ALGUNOS MODELOS DE DISTRIBUCIN DE TIPO CONTINUO.

    I. DISTRIBUCIN UNIFORME

    Aparece cuando una variable aleatoria toma valores equiprobables en un intervalo finito. Su masa de densidad est uniformemente repartida en un intervalo ( ; )a b ( , )X U a b

    Funcin de densidad: 1

    ( )0

    a x bf x b a

    =

    Funcin de distribucin: 1( ) ( ) x x aF x P X x dx a x bb a b a

    = = =

    2 22

    1( )2

    1 ( )( )2 12

    ( ) ( )

    b

    a

    b

    a

    tb ta

    a bE X x dxb a

    a b b aV X x dxb a

    e eg tt b a

    += =

    + = =

    =

    No cumple la propiedad reproductiva ( , ) ( , ) ( ; )U a b U c d U a c b d+ + + (ver problemas 1 y 2)

    II. DISTRIBUCIN NORMAL

    Se da cuando en un fenmeno influye un nmero elevado de causas, independientes entre s, y con efectos aditivo; teniendo cada una de estas causas un efecto despreciable frente al conjunto total y siendo igualmente probables las desviaciones positivas y negativas.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    21

    ( , )X N

    Funcin de densidad.

    2121( )

    2

    x

    f x e x

    pi

    =

    Existe un mximo en x = Dos puntos de inflexin en x = Es simtrica respecto a ( ) 0f x ( ) 1f x dx+

    = A medida que la va tomando valores ms grandes (mayor dispersin) la curva

    se ensancha y achata. A medida que disminuye ( menor dispersin) los valores se concentran ms

    en torno a la media, con lo que la curva se apunta ms y se estrecha.

    Se dice que la variable aleatoria X sigue una distribucin normal tipificada, si

    hacemos 0; 1 = = 21

    21( )2

    xf x e x pi

    =

    3.2 Funcin de distribucin

    2121( ) ( )

    2

    xx

    F x P X x e

    pi

    = =

    2 2

    2

    12

    ( )( )

    ( ) t t

    E XV X

    g t e

    +

    =

    =

    =

    Cumple la propiedad reproductiva:

    ( )2 2 21 2 1 2 1 2.. .. ; ..n n nX X X X N = + + + = + + + + + + Ejemplo:

    1 1 2

    2 1 2

    (6,8) (6 7; 64 36) (13,10)(7,6) (6 7; 64 36) ( 1;10)

    X N U X X N N

    X N V X X N N

    = + + +

    = +

    Para pasar de una ( ; )N a una (0;1)N se tipifica XZ

    =

    Para determinar el signo de los valores de la abscisa:

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    22

    3.3.1.1.1 Probabilidad 3.3.1.1 Suceso > 05

    > >

    2. APROXIMACIN DE LA DISTRIBUCIN NORMAL A LA DE POISSON.

    Aproximaremos una distribucin de Poisson a una normal, siempre que: 10 aunque algunos autores aceptan la aproximacin cuando 5 >

    (ver problemas13 y 14)

    Como al aproximar tanto una Binomial, como una Poisson, estamos pasando de una distribucin discreta a una continua, debemos realizar una correccin de continuidad:

    1 1( )2 21 1( )2 2

    1( )21( )2

    P X x P x X x

    P a X b P a X b

    P X x P X x

    P X x P X x

    = +

    +

    +

    IV. TEOREMA CENTRAL DEL LMITE

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    23

    Para una muestra n suficientemente grande, si Sn es la suma de n variables aleatorias independientes que satisfacen ciertas condiciones generales, entonces Sn tiende hacia una distribucin normal.

    2

    ( ) (0;1)( )( )( )

    n n

    n

    n

    n

    n

    S E SY N

    SE S nV S n

    =

    =

    =

    ( ; )nS N n n

    Se considera aceptable cuando n>30 (ver problema)

    V. DISTRIBUCIONES ASOCIADAS A LA NORMAL

    1. Distribucin 2 de Pearson. Es una distribucin asociada a la suma de cuadrados de variables aleatorias independientes y que siguen una distribucin normal.

    2 2 2 2 21 2

    1...

    n

    n n iX X X X = + + + =

    Siendo su campo de variacin 20 n Llamamos n a los grados de libertad y coinciden con el nmero de variables normales e independientes que se utilizan. Es una distribucin con forma asimtrica; a medida que aumenta n se va haciendo ms simtrica.

    Su funcin de densidad es: 12 22

    1( ) 02

    2

    n x

    nf x x e x

    n

    =

    2

    2

    2

    ( )( ) 2

    ( ) (1 2 )

    n

    n

    n

    E n

    V n

    g t t

    =

    =

    =

    Cumple la propiedad reproductiva: 2

    21 31 2 52

    2 2

    XX X X

    X

    = +

    Cuando n>30 se puede aproximar a una normal N(0;1) (ver problemas)

    2. Distribucin T de Student.

    Sea U una variable aleatoria independiente que se distribuye segn una N(0;1); y sea V una variable aleatoria que se distribuye segn una 2n entonces:

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    24

    n

    UT T tVn

    =

    A medida que n aumenta, la distribucin t- Student tiende a una distribucin normal N(0;1) ( ) 0 ( ) 2

    2nE T V T n

    n= = >

    es una distribucin simtrica respecto al origen (t = 0), siendo su campo de variacin t

    La variable aleatoria t-Student no depende de la varianza de las variables normales e independientes que intervienen en ella.

    Para valores grandes de n, las curvas de la distribucin tienden a la curva normal tipificada N(0,1)

    (ver problemas)

    3. Distribucin F de Snedecor.

    Se utiliza en problemas relacionados con la varianza.

    ( )( )

    2 2 2 21 2

    , 22 2 21 2

    1..

    1 ( ..m

    m

    m n

    nm m m n

    X X X nmFmX X X

    n

    + + +

    + + += =

    + + +

    estas variables son todas independientes entre s y normales. La distribucin F- Snedecor no depende de la varianza de las variables xi

    que la componen. Su campo de variacin es

    ,0 m nF

    ,

    ,

    1m n

    n m

    FF

    =

    ( ) 22

    nE F nn

    = >

    es independiente de m 2

    2

    2 ( 2)( ) ( 4)( 2)n m nV F

    m n n

    + =

    n>4

    (ver problemas)

    4 TEMA 4. PROBLEMAS

    1. El tiempo que tarda un alumno para ir de su domicilio a la facultad, vara entre 30 y 40 minutos. Diariamente debe llegar a clase a las 9 horas. Se pide: a) A qu hora debe salir de su casa para tener una probabilidad de 080 de no llegar tarde; b) Tiempo medio que tarda en ir a clase; c) Varianza.

    La funcin de densidad es:

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    25

    1 1 30 40( ) 40 30 100

    xf x

    = =

    (30, 40)X U

    [ ] ( )30301 1 1( ) 0 '80 0 '80 0'80 30 0'80

    10 10 100'80 10 30 38min

    t tP X t dx x t

    t

    = = = =

    = + =

    debe salir de su casa a lasa 8 horas y 22 minutos, para no llegar tarde con una probabilidad de 080.

    b) 40240 2 2

    3030

    1 1 1( ) (40 30 ) 35min10 10 2 20

    xE X x dx = = = =

    c)Varianza

    [ ]

    402 2 3 40 3 33030

    22 2

    1 1 1( ) ( ) (40 30 ) 1.233'3310 30 30

    ( ) ( ) ( ) 1.233'33 (35) 8 '33min( ) 8'33 2 '88min

    E X x dx x

    V X E X E X

    X

    = = = =

    = = =

    = =

    2. Sea X una variable aleatoria que se distribuye de forma uniforme en el intervalo 3 9x . Hallar: funcin de densidad, funcin de distribucin, Esperanza y varianza.

    1 1 3 9( ) 9 3 60

    xf x

    = =

    [ ]331 1 3( ) ( ) 3 96 6 6

    x x xF X P X x dx x x= = = =

    9 2 933

    92 2 3 933

    2

    1 1 72( ) ( ) 66 12 12

    1 1( ) ( ) 396 18

    ( ) 39 (6) 3

    E X x dx x

    E X x dx x

    V X

    = = = =

    = = =

    = =

    3. En una distribucin (0,1)N calcular . ( 1'85)P X >

    ( 1'85) 1 ( 1'85) 1 0 '9678 0 '032P X P X> = < = =

    ( 1 1'85)P X

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    26

    [ ]( 1 1'85) ( ) ( ) ( 1'85) ( 1) ( 1'85)1 ( 1) 0 '9678 (1 0 '8413) 0 '8091

    P X F b F a P X P X P XP X

    = = =

    = =

    4. Para una distribucin (5,3)N calcular: ( 8)P X

    ( )5 8 5( 8) 1 0 '84133 3

    xP X P P Z = = =

    5 8 5( 8) ( 8) 1 ( 8) 1 1 ( 1)3 3

    1 0'8413 0'1587

    xP X P X P X P P Z = = = = =

    = =

    5. Hallar el valor de a en los siguientes casos:

    ( ) 0 '7324 0'62( ) 0 '0192 2 '07( ) 0 '8485 1'03( ) 0 '2389 0'71

    P X a aP X a aP X a aP X a a

    = = = = = = = =

    6. Cules son los extremos del intervalo simtrico respecto a la media, que contienen el 95% de las observaciones de ( ; )N ?

    [ ]( ) 0 '95( ) ( ) 0 '95 ( ) 1 ( ) 0 '95

    0 '95 12 ( ) 1 0 '95 ( ) 0 '9752

    P a Z aP Z a P Z a P Z a P Z a

    P Z a P Z a

    = = =

    + = = =

    Buscamos en las tablas el valor de a que nos da una probabilidad de 0975 ( 1'96)a = Como XZ

    = los extremos del intervalos sern:

    1

    2

    1'96 ( 1'96 1'96 ) 0 '951'96

    xP X

    x

    =

    + == +

    7. Una variable aleatoria se distribuye segn una normal ( ; )N calcular : ( )P X + Tipificando XZ

    =

    [ ]( ) ( ) ( )

    ( 1 1) ( 1) ( 1) ( 1) 1 ( 1) 2 ( 1) 12 0'8413 1 0 '6826

    P Z P Z P ZP Z P Z P Z P Z P Z P Z + + = + = =

    = = = = =

    = =

    8. Sea una sucesin de variables aleatorias, independientes y distribuidas segn una distribucin de Poisson de parmetro 2 = Se define la variable aleatoria

    100

    1001

    iS x= Hallar (190 210)P X

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    27

    Como n = 100 podemos aproximar a una normal por el T.C.L ( ) 2( ) 2 ( ) 2( : ) (200;10 2)

    E X

    V X X

    N n n N

    = =

    = = =

    =

    190 200 210 200 1 1(190 210)10 2 10 2 2 2

    1 1 1 1 11 2 12 2 2 2 2

    2 0'7580 1 0 '516

    P X P Z P Z

    P Z P Z P Z P Z P Z

    = = =

    = = = =

    = =

    9. Para un distribucin con 11 grados de libertad, calcular:

    2 2 211;0 ' 05 11;0 '95 11;0 ' 75( ) ( ) ( ) ( ) 0 '75P X P X P X P X x =

    2 2 211;0 ' 05 11;0 '95 11;0 '75

    211;0 ' 25

    ( ) 4 '575 ( ) 19 '68 ( ) 13'70( ) 0 '75 1 ( ) 0 '25 7 '584

    P X P X P X

    P X x P X x

    = = =

    = = =

    10. Obtener el valor de A que verifica para 29X la relacin ( 5 ) 0 '75P x A< = 22( 5 ) (5 ) ( )5AP x A P x A P X< = < = < para una probabilidad de 075 y 9

    grados de libertad 2

    11'39 5 11'39 7 '54655A A= =

    11. En un distribucin t-Student con 15 grados de libertad, calcular: ( ) 0 '75 ( ) 0 '90 ( ) 0 '95 ( ) 0 '99 ( ) 0 '25p p p p pP T t P T t P T t P T t P T t = = = = =( ) 0 '75 0 '691( ) 0 '90 1'341( ) 0 '95 1'753( ) 0 '99 2 '602( ) 0 '25 0 '691

    p p

    p p

    p p

    p p

    p p

    P T t t

    P T t t

    P T t t

    P T t t

    P T t t

    = =

    = =

    = =

    = =

    = =

    cuando p

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    28

    10,15 10,15

    10,15 10,15

    10,15 10,15

    10,15 10,1515,10;0 '90

    10,15 10,1515,10;0 '95

    ( ) 0 '90 2 '06( ) 0 '95 2 '54( ) 0 '99 3'80

    1 1( ) 0 '10 0 '442 '24

    1 1( ) 0 '05 0 '352 '85

    P X F FP X F FP X F F

    P X F FF

    P X F FF

    = =

    = =

    = =

    = = = =

    = = = =

    13. Una empresa dedicada a la fabricacin y venta de bebidas observa que el 40% de los establecimientos que son visitados por sus vendedores realizan compras de esas bebidas. Si un vendedor visita 20 establecimientos, determinar la probabilidad de que por lo menos 6 de esos establecimientos realicen una compra.

    (20;0 '4)X B Observamos que: 5 0 '5np p> en nuestro caso 8 5 0 '4 0 '5np p= > = Aproximando a una normal

    20 0'4 820 0 '4 0 '6 2 '19

    np

    npq

    = = =

    = = =

    [ ]

    16 81 8 2 '52( 6) 6 ( 1'14)2 2 '19 2 '19 2 '19

    1 ( 1'14) 1 1 ( 1'14) ( 1'14) 0 '8729

    XP X P X P P Z P Z

    P Z P Z P Z

    = = = = =

    = = = =

    14. Un servicio dedicado a la reparacin de electrodomsticos en general, ha observado que recibe cada da, por trmino medio 15 llamadas. Determinar la probabilidad de que se reciban ms de 20 llamadas en un da.

    (15)X P Como 15 10 = aproximamos a una normal.

    1515 3'87

    = =

    = = =

    121 151 2( 21) 21 ( 1'42) 1 ( 1'42)2 3'87

    1 0 '9222 0 '0778

    P X P X P Z P Z P Z

    = = = = =

    = =

    TEMA 5.

    MUESTREO Y DISTRIBUCIONES EN EL MUESTREO.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    29

    Muestra aleatoria.

    Para saber qu modelo sigue una poblacin, nos basamos en una parte o subconjunto de sta, que llamaremos muestra aleatoria. Utilizaremos la informacin de la muestra para obtener conclusiones sobre las caractersticas poblacionales. Dichas conclusiones sern inferidas a la poblacin. La muestra que tomamos de la poblacin, est constituida por un subconjunto de observaciones independientes e idnticamente distribuidas, de tamao n y que denominaremos muestra aleatoria simple M.A.S.

    Parmetros poblacionales y estadsticos muestrales.

    Los parmetros poblacionales son las caractersticas numricas de la poblacin. El conocimiento del parmetro permite describir parcial o totalmente la funcin de probabilidad. Cuando no conocemos el parmetro, debemos estimarlo, a travs de los estadsticos muestrales, que son funciones reales de variables aleatorias, que no contienen ningn valor o parmetro desconocido. Como ejemplo de estadsticos tenemos:

    Parmetros Estadsticos

    Media iX

    N = i

    XX

    n=

    Varianza 2

    2 ( )iXN

    =

    22 ( )

    1iX XS

    n

    =

    Por ser estimador

    insesgado.

    Proporcin XpN

    = XXPn

    =

    Recordemos que los estadsticos son variables aleatorias, y que tendrn por tanto, una cierta distribucin de probabilidad.

    Funcin de distribucin emprica.

    La funcin de distribucin emprica tiene las mismas propiedades que la funcin de distribucin de la variable aleatoria, lo que implica que cuando el tamao de la muestra crece, la grfica de la funcin de distribucin emprica se aproxima bastante a la de la funcin de distribucin de la poblacin, con lo que puede utilizarse como estimador de la misma.

    ( )( )nN xF x

    n=

    Siendo N(x) el nmero de valores observados menores o iguales que x.

    Distribucin muestral de estadsticos.

    Los estadsticos muestrales se calculan a partir de una muestra aleatoria, y como estos estadsticos tambin son variables aleatorias, tendrn su distribucin de probabilidad. Esta distribucin depender del tamao de la muestra. Con esto se pone de manifiesto que existe diferencia entre la distribucin de la poblacin de la cual se ha tomado la muestra y la distribucin de alguna funcin de esa muestra.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    30

    Media y varianza de algunos estadsticos.

    2 2

    2

    2 2

    ( )1( )

    ( ) ( )

    ( )C

    E XnE S

    n

    V X Xn n

    E S por ser la cuasivarianza muestral estimador insesgado de la varianza

    =

    =

    = =

    =

    ( )( )

    2 2

    22

    E X

    E Xn

    =

    =

    La desviacin tpica de la media muestral es funcin decreciente del tamao de la muestra n. A mayor n menor es la probabilidad de que la media muestral difiera de la media poblacional en una cantidad fija. Cuando 40n esta disminucin se reduce. Por lo tanto, cuando utilizamos el estadstico media muestral, no es conveniente tomar muestras demasiado grandes, ya que el coste no compensa la escasa disminucin de la desviacin tpica.

    Distribuciones de estadsticos muestrales de poblaciones normales.

    Distribucin de la media muestral.

    Cuando se conoce la varianza poblacional:

    Si tenemos una muestra aleatoria de tamao n procedente de una distribucin normal ( ; )N entonces la distribucin del estadstico ser:

    ,

    xX N

    nn =

    si tipificamos

    (0,1)XZ Nn

    =

    Si la distribucin no es normal, basta que 30n para que la media muestral sea normal, por el Teorema Central del Lmite.

    Cuando no se conoce la varianza poblacional

    Calculamos la varianza muestral y la usamos como varianza poblacional (cuasivarianza)

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    31

    1

    30 (0,1)

    30 n

    Xn Z N

    sn

    Xn T

    sn

    t

    =

    < =

    Distribucin de la varianza.

    A partir de la definicin de la cuasivarianza muestral, obtenemos: Cuando no se conoce la media poblacional.

    22

    2 2

    22

    2 22

    1

    ( )1

    ( 1) ( )( )( 1)

    i

    2i

    in

    x xS

    n

    n S x x dividimos todo por

    x xn S

    =

    =

    =

    Cuando se conoce la media poblacional.

    2

    22( )in

    x

    Estos estadsticos son independientes. Recordar que los grados de libertad, son los nmeros de variables que integran, en este caso, el estadstico.

    Distribucin de la proporcin muestral.

    Sea una muestra aleatoria simple de tamao n procedente de una B(1, p)

    ,

    ( )

    ( )

    X

    X

    x

    X pqP N pn n

    E P ppqV Pn

    =

    =

    =

    Si tipificamos

    (0,1)XP pZ Npqn

    = (ver problemas)

    Resumen de distribuciones de estadsticos

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    32

    22

    2 22

    2

    2

    21

    2

    1

    , (0,1)

    30 , (0,1)

    ( , ) 30 ,

    ( )( 1)

    )

    i2

    i

    2

    i

    i

    i

    n

    n

    n

    x XSi X N Z Nn n

    n

    x s Xn X N Z N

    sn nnNo

    x s XNn X N T

    sn nn

    x xn SNo

    (xSi

    t

    = =

    = =

    < = =

    =

    TEMA 5. PROBLEMAS.

    1. El nmero de libros encuadernados diariamente por una mquina automtica, sigue una variable aleatoria cuya distribucin no se conoce, con una 16 = libros por da. Si se selecciona una muestra aleatoria de 49 das, determinar la probabilidad de que el nmero medio de libros encuadernados durante esos das se encuentre a lo sumo a 3 libros de la verdadera media poblacional.

    Hay que determinar la media poblacional, y conocemos: 49; 16n = = Como el tamao de la muestra es de 49 das, la distribucin se aproxima a una normal por el T.C.L.

    Usamos el estadstico media muestral: ( , )xX Nnn

    = y lo tipificamos,

    obteniendo (0,1)XZ Nn

    =

    ( ) ( )( )

    [ ]

    3 3 3

    3 3 1'31 1'31 ( 1'31) ( 1'31)16 16

    49 49( 1'31) 1 ( 1'31) 0 '9049 (1 0 '9049) 0 '8098

    P X P X dividimos por n

    P Z P Z P Z P Z

    P Z P Z

    =

    = = = =

    = = =

    2. Con el ejemplo anterior determinar el tamao de la muestra para que la media se encuentre a lo sumo a 3 libros de la media poblacional con una probabilidad del 095.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    33

    ( ) ( )( )

    3 3 3 0'95

    3 3 0 '187 0 '187 0 '9516 16

    P X P X dividimos por n

    P Z P n Z n

    n n

    = =

    = = =

    Para una probabilidad de 095, en la tabla normal los puntos que corresponden son 1'96

    21'960 '187 1'96 10 '48128 (10 '48128) 1100'187

    n n n= = = =

    3. En una fbrica conservera se admite que la distribucin de pesos de las latas de conserva es normal. El director comercial est muy interesado en que el peso neto del producto incluido en el interior de las latas tenga poca variabilidad, pues en ciertas ocasiones ha observado diferencias entre el peso real y el anunciado en la etiqueta. Si se selecciona una muestra aleatoria de 25 latas, obtener los valores K1 y K2, tales que:

    2 2

    1 22 20'05 0 '05S SP K P K

    = =

    Si multiplicamos por (n-1) obtenemos el estadstico 2

    22

    1( 1)

    n

    n S

    22

    1 24 12

    ( 1) ( 1) 0 '05 ( 24 ) 0 '05n SP n K P K

    = =

    para 24 grados de

    libertad y una probabilidad de 005 el valor ser 13848 1 124 13'848 0 '577K K= =

    Existe una probabilidad del 005 de que la varianza muestral difiera en un 0577 de la varianza poblacional 2 2( 0 '577 ) 0 '05P S =

    ( )( )

    22

    2 24 22

    224 2 2 2

    ( 1) ( 1) 0 '05 24 0 '05

    24 0'95 24 36 '42 1'517

    n SP n K P K

    P K K K

    = =

    = = = =

    Existe una probabilidad de 095 de que la varianza muestral difiera en un 1517 de la varianza poblacional.

    4. Supongamos que el 30% de la poblacin de viviendas de un pas tienen ms de una cuarto de aseo. Con el fin de obtener una informacin ms precisa se toma una muestra aleatoria de tamao 400 viviendas. Obtener la probabilidad de que la proporcin de viviendas de la muestra con ms de un aseo est comprendida entre 025 y 032.

    0'3 ,XX pqp P N pn n

    = =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    34

    ( )

    [ ]

    0'25 0 '32(0 '25 0 '32)

    0 '25 0 '3 0 '32 0 '3 2 '18 0 '873 ( 0 '873)0 '3 0 '7 400 0 '3 0 '7

    400( 2 '18) ( 0 '873) 1 ( 2 '18) 0 '8078 1 0'9854 0 '7932

    Xx

    P pp pP P Ppq pq pq

    n n n

    P Z P Z P Z

    P Z P Z P Z

    = =

    = = =

    = = + =

    TEMA 6

    ESTIMACIN PUNTUAL.

    I. INTRODUCCIN A LA INFERENCIA ESTADSTICA.

    La inferencia estadstica consiste en el proceso de seleccin y utilizacin de un estadstico muestral, a travs del cual, utilizando la informacin que nos da una muestra, permite sacar conclusiones sobre caractersticas poblacionales. La eleccin del estadstico, depende del parmetro a estimar. El valor del verdadero parmetro ser desconocido y el objetivo ser estimar su valor, por eso al estadstico se le denomina estimador.

    II. EL PROBLEMA DE LA ESTIMACIN: ESTIMACIN PUNTUAL.

    La estimacin estadstica se divide en dos grupos, la estimacin puntual y la estimacin por intervalos. En la estimacin puntual se obtiene un nico valor que ser utilizado como estimacin del parmetro poblacional , pudindole asignar un valor sobre la recta real. En la estimacin por intervalos, se obtienen dos puntos, definindose un intervalo sobre la recta real. Este intervalo contendr con cierta seguridad el valor del parmetro .

    El estimador es un estadstico ( una variable aleatoria) y el valor de esta variable aleatoria para una muestra concreta, ser la estimacin.

    Parmetro poblacional Estimador Media

    ixXn

    = = 2 Varianza

    2

    2 2 ( )1

    ix xSn

    = =

    p Proporcin X

    x n exitosp pn n pruebas

    = = =

    (ver problema)

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    35

    III. PROPIEDADES DE LOS ESTIMADORES.

    a) Estimador insesgado y de varianza mnima. Cota de Cramer-Rao.

    Se dice que un estimador es insesgado cuando no existe sesgo entre la esperanza del estimador y el parmetro, o sea, la esperanza del estimador es el propio parmetro.

    ( )( )

    0

    E

    Sesgo E

    =

    = =

    Para obtener un estimador insesgado de varianza mnima, hay que determinar las varianzas de todos los estimadores insesgados de y seleccionar el que posea la varianza ms pequea. La cota de Cramer Rao permite obtener una cota inferior de la varianza.

    2

    1. .

    ( , )C C R

    Lnf xn E

    =

    Siendo f(x,) la funcin de verosimilitud.

    b) Estimador eficiente.

    Un estimador es eficiente si se cumple que: Es insesgado E = Posee varianza mnima. Para calcular si el valor adquirido por la varianza es

    mnimo, usamos la cota de Cramer-Rao.

    c) Estimador Consistente.

    Un estimador es consistente cuando su distribucin tiende a concentrarse alrededor del verdadero valor del parmetro a medida que aumenta la muestra.

    K K +

    ( ) 0n

    P K

    >

    Cuando la muestra es suficientemente grande, la informacin que proporciona, puede llegar a ser casi exacta a la poblacin, siendo el estimador coincidente con el parmetro.

    d) Estimador suficiente.

    Un estimador es suficiente, si utiliza toda la informacin relevante contenida en la muestra aleatoria. Utilizando el teorema de factorizacin de Fisher-Neyman. iT x=

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    36

    (ver problemas) TEMA 6. PROBLEMAS.

    1. Las ventas de una muestra aleatoria de diez grandes establecimientos comerciales, el da 5 de enero de 2002, fueron respectivamente: 16, 10, 8,12, 4, 6, 5, 4, 10, 5 u.m. respectivamente. Obtener estimadores puntuales dela venta media, de la varianza de las ventas de todos los establecimientos comerciales y de la proporcin de stos cuyas ventas fueron superiores a 5 u.m.

    Venta media.

    16 10 8 12 4 6 5 4 10 5 8

    10ixX

    n + + + + + + + + += = = =

    Varianza

    ( ) ( ) ( ) ( ) ( ) ( )

    ( ) ( ) ( ) ( )

    2 2 2 2 2 222 2

    2 2 2 2

    ( ) 16 8 10 8 8 8 12 8 4 8 6 8

    1 95 8 4 8 10 8 5 8

    15'89

    ix xSn

    + + + + + +

    = = = =

    + + + + = =

    Proporcin

    6 0 '6

    10xpn

    = = =

    2. En una distribucin normal ( ), 25N se toman muestras aleatorias de tamao 3, considerndose los siguientes estimadores de la media poblacional:

    ( )

    1 2 3

    3 1

    1 2 3

    0 '65 0 '25 0 '1021

    3

    A X X XB X X

    C X X X

    = + +

    =

    = + +

    Determinar cul de los tres estimadores es el mejor desde el punto de vista del sesgo y de la eficiencia.

    a) Insesgado.

    [ ] [ ] [ ] [ ] [ ]1 2 30 '65 0 '25 0 '10 0 '65 0 '25 0 '10E A E A E X E X E X = = + + = + + =

    [ ] [ ] [ ] [ ]3 12 2E B E B E X E X = = = = [ ] [ ] ( ) [ ]1 2 31 1( ) ( )3 3E C E C E X E X E X = = + + = + + =

    Los tres son insesgados.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    37

    b) Eficiencia.

    Para que sea eficiente debe ser insesgado y tener varianza mnima.

    2 2 21 2 3 1 2 3

    2 2

    ( ) (0 '65 0 '25 0 '10 ) 0 '65 ( ) 0 '25 ( ) 0 '10 ( )0 '65 25 0 '25 25 0 '10 25 12 '375

    V A V X X X V X V X V X= + + = + + == + + =

    2 23 1 3 1( ) (2 ) 2 ( ) ( ) 2 25 25 125V B V X X V X V X= = + = + =

    ( )1 2 321 1 1 25( ) 3 ( ) 3 259 9 33V C V X X X V X= + + = = =

    Obtenemos la cota de Cramer Rao

    Como la distribucin es normal 2 2

    2( ) ( )

    2 501 1( , )2 5 2

    x x

    f x e e

    pi pi

    =

    ( )2 2( ) ( )

    50 50

    2 2

    1 1( , ) 1 5 25 2 5 2

    ( ) ( )0 (5 2 )50 50

    x x

    Lnf x Ln e Ln Ln e Ln Ln

    x xLne L

    pipi pi

    pi

    = = + = +

    + =

    [ ]( , ) 1 12( )( 1)50 25( )Lnf x

    xx

    = =

    ( )2 2

    2( , ) 1 2525 625 625

    dLnf x xE E E x

    = = =

    1 25. .

    25 33625

    C C R = =

    V(C)=C.C.R El estimador C es insesgado y eficiente.

    3. En una distribucin de Poisson de parmetro y en muestras aleatorias simples de tamao n, demostrar la suficiencia del estadstico iT x=

    Por el teorema de factorizacin de Fisher-Neyman, si T es un estimador suficiente, podemos descomponer la funcin de densidad conjunta de la muestra de la siguiente forma: 1 2 1 2 1 2( , ) ( , ) ... ( , ) ( , ) ( , ,.., )n nf x f x f x K T K x x x =

    En la distribucin de Poisson: 1 2

    11 2 1 2

    1( , ) ... ( , ) ...! ! ! ! !.. !

    inxxx x n

    n

    n n

    e e ef x f x ex x x x x x

    = =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    38

    Vemos que n Te es una funcin que depende de y del estadstico T(recordar que iT x= ) , y que

    1 2 !

    1! !.. nx x x

    es una funcin que slo depende de las

    variables x. Por lo tanto T es suficiente.

    4. Se toma una muestra aleatoria simple de tamao n de una poblacin ( , )N considerndose como estimador de la media la expresin iA K ix=

    Determinar K para que el estimador sea insesgado. Estudiar la consistencia si sabemos que la varianza del estimador es:

    22 2 13 ( 1)

    n

    n n

    +

    +

    (1) Insesgadez. ( ) ( )

    1

    (1 )( )2

    n

    i in nE A E K ix K iE x K i K += = = =

    Para que el estimador sea insesgado se tiene que verificar que ( )E A = por lo tanto: (1 ) 2

    2 (1 )n nK K

    n n + = =

    +

    El estimador ser insesgado si 2(1 ) iA ixn n= + (2) Consistencia. Para demostrar la consistencia se debe probar que ( ) 0

    nP

    <

    segn la desigualdad de Chebychev:

    ( ) 2 22 2 2 ( ) ( ) 2 2 1 03 ( 1) nE V nP

    n n

    + > = = +

    Luego es consistente. TEMA 7

    MTODOS DE OBTENCIN DE ESTIMADORES

    I. MTODO DE LOS MOMENTOS.

    Es el mtodo ms sencillo y antiguo. Se suele utilizar para obtener una primera aproximacin de los estimadores. Se igualan tantos momentos muestrales, como parmetros se tengan que estimar.

    A. Propiedades de los estimadores obtenidos por el mtodo de los momentos.

    - Si los parmetros desconocidos son momentos poblacionales, entonces los estimadores obtenidos sern insesgados y asintticamente normales

    - Bajo condiciones bastantes generales, los estimadores obtenidos sern consistentes.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    39

    II. MTODO DE MXIMA VEROSIMILITUD.

    Este mtodo consiste en elegir como estimador, el valor poblacional que hace mxima la probabilidad de que aparezcan los valores observados de la muestra.

    B. Propiedades de los estimadores obtenidos por el mtodo de mxima verosimilitud.

    - Los estimadores de mxima verosimilitud son consistentes. - En general no son insesgados, pero si no son insesgados son

    asintticamente insesgados ( el estimador converge al parmetro , y en el lmite coincide con su valor medio, que es el parmetro ).

    - Todo estimador de mxima verosimilitud no es eficiente, pero s son asintticamente eficientes.

    - Son asintticamente normales. - Son suficientes.

    5 PROBLEMAS

    1. Sea una muestra aleatoria obtenida de una poblacin que sigue una distribucin de Poisson de parmetro desconocido. Obtener un estimador de dicho parmetro por el mtodo de los momentos.

    Igualamos el momento de orden 1 de la poblacin 1( ) ( )E X = con el momento de orden 1 de la muestra a1

    1

    10 0 0 1

    11

    ( ) ( )! !

    i ix x

    i i ii i

    ni

    x P X x x e e e ex x

    xa x

    n

    = = = = = =

    = =

    1 11

    nixa x

    n = = =

    1 2

    0 1

    1 ...! 2!

    ix

    i

    Nota

    ex

    = + + + =

    2. Sea una muestra aleatoria procedente de una distribucin de Bernouilli B(1,p). Obtener el estimador de p utilizando el mtodo de los momentos.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    40

    1 ( ) ( ) ( ) 0 ( 0) 1 ( 1) 0 (1 ) 1i ip E X x P X x P X P X p p p = = = = = + = = + =

    1

    1 1

    i

    i

    xa x

    n

    xa x p p

    n

    = =

    = = =

    3. Una variable aleatoria X se distribuye segn la ley de densidad 1( ) xbf x eb

    =

    para 0; 0.x b > Obtener el estimador b por el mtodo de los momentos.

    1 0

    2

    0 0

    1( ) ( )

    1(2) 1 1 2

    x

    b

    t t

    xb E X x e dx t x bt dx bdtb b

    bbt e bdt te dt b b p pb b

    = = = = =

    = = = = = =

    1

    1 1

    ixa xn

    xa x b

    n

    = =

    = = =

    4. Sea una poblacin N(20,) donde la desviacin tpica es desconocida. Con la ayuda de una muestra aleatoria de tamao n, obtener:

    - Estimador de mxima verosimilitud de 2 - El estimador de mxima verosimilitud para n = 30, siendo

    302

    1( 20) 3.000ix =

    Hay que resolver la ecuacin de verosimilitud 2

    1 22

    ( , ,.., ; )nLn L x x x

    2 2

    2 2

    2

    2

    ( 20) ( 20)2 2 2 2

    1 21 1

    ( 20)2

    22

    1 1( , ,..., ; ) ( ; )2 2

    12

    i i

    i

    nx xn n

    n i

    nx

    L x x x f x e e

    e

    pi pi

    pi

    = = = =

    =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    41

    ( )22 21 2 2 22 2

    22 2

    ( 20)1( , ,.., ; ) 1 22 22 2

    ( 20) ( 20)22 22 2

    in

    i i

    xn nLnL x x x Ln Lne Ln Ln

    x xn nLn Ln

    pi pi

    pi

    = =

    =

    2 2

    2 2 4 3

    2 2 232

    3

    4 ( 20) ( 20)2 02 4

    ( 20) ( 20) ( 20)

    i i

    i i i

    x xLnL n n

    x x xn

    n n

    = + = + =

    = = =

    -

    2302

    1

    ( 20) 3.000 100

    30ix

    n

    = = =

    5. Se considera la distribucin Binomial B(n, p) siendo p desconocida. Obtener el estimador p por el mtodo de mxima verosimilitud.

    ( , ) (1 ) 0,1,2,...,x n xnB n p p p x nx

    = =

    Formamos la funcin de verosimilitud.

    1 1 2 2

    1 2 1 2 1 1

    1 21 2

    ( )... ( )( )... ( )

    1 2

    ( , ,.., ; ) (1 ) (1 ) ... (1 )

    ... (1 ) (1 )

    n n

    n n

    i in n

    x n xx n x x n x

    n

    n

    x n xx x x n x n x n x

    n

    nn nL x x x p p p p p p p

    xx x

    nn np p Cp p

    xx x

    = =

    = =

    1 1( )

    1 1(1 ) 0 ( ) (1 )

    n n

    i i n nx n x

    i iLnL LnC Ln p Ln p xLnp n x Ln p

    = + + = + +

    1 1 ( ) 0(1 )( ) (1 ) ( )(1 )

    i i

    i ii i i i i

    ii

    LnLx n x

    p p px n x

    p x p n x x p x pn p xp p

    xx pn x p

    n

    = =

    = = =

    = = =

    6. El parmetro de una distribucin de Poisson puede tomar uno de los cuatro valores siguientes: 4 4'5 5 '5 6 = = = = Decidir cul de ellos puede

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    42

    ser estimador de mxima verosimilitud, considerando una muestra aleatoria simple de tamao dos tal que 1 23 7x x= =

    Para =4

    1 2 4 3 4 7

    1 21 2

    4 4( 3, 7) 2 0'02326! ! 3! 7!

    x xe e e eP X X n

    x x

    = = = = =

    Para =45 4'5 3 4'5 7

    1 24'5 4'5( 3; 7) 2 0'027803! 7!

    e eP X X

    = = = =

    Para =55

    5'5 3 5'5 7

    1 25'5 5'5( 3; 7) 2 0'02798

    3! 7!e eP X X

    = = = =

    Para =6 6 3 6 7

    1 26 6( 3; 7) 2 0'02457

    3! 7!e eP X X

    = = = =

    Para =55 obtenemos la mayor probabilidad de extraer la muestra (3, 7).

    TEMA 8

    ESTIMACIN POR INTERVALOS DE CONFIANZA.

    Cuando se utiliza la estimacin puntual, el valor del estimador generalmente difiere del parmetro , por lo que la informacin que proporciona no es suficiente.

    Se hace necesario acompaar a la estimacin del parmetro con alguna medida que indique el error asociado a la estimacin, movindonos en un intervalo.

    Llamamos 1 al coeficiente de confianza y al nivel de significacin ( riesgo de cometer error).

    2

    1 2

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    43

    INTERVALOS DE CONFIANZA EN POBLACIONES NORMALES.

    1.1 Intervalos de confianza para la media.

    1.1.1 Siendo conocida.

    Tomamos el estadstico que dependa de la media poblacional .

    ; (0;1)ix xx N Z Nnn

    n

    = =

    el intervalo de confianza ser:

    2 2x z x z

    n n

    +

    1.1.2 Siendo desconocida

    Necesitamos un estadstico que dependa de la , pero no de la .

    1

    2 2

    n

    xT ts

    n

    s sx t x t

    n n

    =

    +

    INTERVALO DE CONFIANZA PARA LA VARIANZA.

    2.2 Siendo la desconocida.

    Usaremos un estadstico que dependa de 2, siendo su distribucin no dependiente de la varianza.

    222

    12 2

    2 22

    2 21;(1 ) 1;( )2 2

    ( )( 1)

    ( 1) ( 1)

    in

    n n

    x xn S

    n S n S

    =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    44

    21;(1 )2n

    (1 ) 2

    1; 2n

    2.2 Siendo conocida.

    22

    2

    2 22

    2 2;(1 ) ;( )2 2

    ( )

    ( ) ( )

    in

    i i

    n n

    x

    x x

    ESTIMACIN DEL TAMAO MUESTRAL, PARA ESTIMAR LA MEDIA DE UNA POBLACIN NORMAL CON CONOCIDA Y DESCONOCIDA.

    3.2 Con conocida.

    22

    224n z

    L

    =

    3.2 Con desconocida.

    22

    224 sn t

    L=

    6 PROBLEMAS

    1. De una poblacin N(;3) se tiene una muestra de tamao 9, cuya 20x = Determinar el intervalo de confianza del parmetro con un

    coeficiente de confianza del 095.

    1 0 '95 0 '05 0 '0252

    = = =

    El punto 2

    z que le corresponde para una probabilidad de 0025 es 196.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    45

    El intervalo ser:

    [ ]

    3 31'96 1'96 1'96 1'969 9

    3 320 1'96 20 1'96 0 '959 9

    18'09 21'96

    xP P x

    n

    P

    = =

    = + =

    2. Se desea obtener un intervalo de confianza de la para una poblacin N(;) a partir de una muestra de tamao 10, con 5x = y s = 6, siendo el coeficiente de confianza de 090.

    1 0 '90 0 '10 0 '052

    = = =

    9;0'052

    1'833t t =

    2 2

    1x

    P t ts

    n

    =

    [ ]

    6 65 1'833 5 1'833 0 '9010 10

    1'522 8 '477

    P

    + =

    3. Calcular el intervalo de confianza de para N(;3) conocida una muestra de tamao 25 con 10 '2x = . Hacerlo para un coeficiente de confianza de 090, 095 y 099.

    - 1 0 '90 0 '10 0 '052

    = = =

    0'052

    1'65z z =

    [ ]

    3 310 '2 1'65 10 '2 1'65 0 '9025 25

    9 '21 11'19

    P

    + =

    - 1 0 '95 0 '05 0 '0252

    = = =

    0'0252

    1'95z z =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    46

    [ ]

    3 310 '2 1'95 10 '2 1'95 0 '9525 25

    9 '024 11'376

    P

    + =

    - 1 0 '99 0 '01 0 '0052

    = = =

    0'0052

    2'58z z =

    [ ]

    3 310 '2 2 '58 10 '2 2 '58 0 '9925 25

    8 '652 11'748

    P

    + =

    A medida que aumenta el nivel de confianza (1-) el intervalo de confianza para la media poblacional es mayor.

    4. La oficina de control de calidad de una empresa dedicada al embotellamiento de agua, con vistas a establecer los lmites mximos y mnimos vlidos de agua contenida en botellas de 1 litro, tom muestras de tamao 10 con

    3998x cm= y 35s cm= Suponiendo que la cantidad de agua introducida en una botella sigue una distribucin normal, calcular dichos lmites de confianza a unos niveles de 99% y 95%

    - 1 0 '99 0 '01 0 '0052

    = = = 9;0'0052

    3'250t t =

    [ ] [ ]

    5 5998 3'250 998 3'250 0 '9910 10

    992 '86 1003'42 992 '86 1000

    P

    + =

    - 9;0 '0252

    1 0 '95 0 '05 0 '025 2 '2622

    t t

    = = = =

    [ ] [ ]

    5 5998 2 '262 998 2 '262 0 '9510 10

    994 '42 1001'77 994 '42 1000

    P

    + =

    5. Dada una poblacin N(;) hallar el intervalo de confianza para 2, a partir de una muestra de tamao 8 con 225 9x y s= = con un coeficiente de confianza de 090.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    47

    0 '0521 0 '90 0 '101 0 '952

    = = =

    =

    2 22 1; 1;(1 )2 2 2 2

    2 2 2 21; 1;(1 )2 2

    2 22

    2 21;(1 ) 1;2 2

    ( 1) 10'90 0'90( 1) ( 1)

    ( 1) ( 1) 0'90

    n n

    n n

    n n

    n SP Pn S n S

    n S n SP

    = =

    =

    [ ]

    22 27;0'95 7;0'05

    2

    (8 1)9 (8 1)9 0'90

    72 72 0'90 5'118;33'22514'067 2'167

    P

    P

    =

    =

    6. De una poblacin N(;) se desea calcular un intervalo de confianza para la varianza, siendo desconocida. Para ello, se tiene una muestra de tamao

    12, con 40x = y siendo 12

    2

    1( ) 108ix x = determinar el intervalo de

    confianza para un nivel de significacin de 002 y 010.

    - 0 '02 0 '012

    = =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    48

    [ ]

    12 122 2

    21 12 2

    1;(1 ) 1;( )2 2

    2 211;0 '991;(1 )2

    2 211;0 '011;( )2

    2

    ( ) ( )0 '98

    24 '72

    3 '053

    108 108 0 '98 4 '37;35 '3724 '72 3'053

    i i

    n n

    n

    n

    x x x x

    P

    P

    =

    = =

    = =

    =

    -

    0 '10 0 '101 0 '95 0 '052 2

    = =

    2 211;0 '95 11;0 '0519 '68 4 '575108 108

    ;19 '68 4 '575

    = =

    7. Un estudio sobre los precios de un determinado tipo de camisetas, llevado a cabo en diferentes zonas tursticas, nos da los siguientes precios de venta:

    1100, 300, 950, 790, 840, 820, 550, 700, 775, 770, 780, 670

    Determinar, (si sabemos de antemano que los precios de venta siguen una distribucin normal), intervalos de confianza para el precio medio y para la varianza del precio, con un nivel de significacin del 0,05.

    126707807707757005508208407909503001100 +++++++++++

    ==

    n

    xx

    i

    75,75312045.9

    ==x

    ( )

    =

    22

    11

    xxn

    S i

    [ ].22222 )75,753790()75.753950()75.753300()75,7531100(112

    1+++

    =S

    [ ]++++ 2222 )75.753700()75.753550()75.753820()75.753840([ ]22 )75.753670()75.753780( ++

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    49

    S = 197,773

    Con lo cual calcularemos un intervalo de confianza para la media siendo desconocida:

    El intervalo ser:

    Como =0,05 /2=0,025

    En las tablas de la T-Student, buscar para 11 grados de libertad y una probabilidad de 0,025

    11,0,025 2,201t =

    El intervalo para la media quedar: 197,773 197,773753,75 2,201 753.75 2,201

    12 12 +

    628,09 879,41 Que ser el intervalo en el que se mover el precio medio de las camisetas.

    Para hallar un intervalo para la varianza, desconociendo la media utilizaremos el estadstico:

    El intervalo ser:

    20,114.39)25.430256(1112

    ==S

    1

    = nt

    ns

    xT

    n

    stx

    n

    stx + 22

    12

    2

    2)1(

    n

    Sn

    2

    11, 1 0,05 2 0,0521,92 3,816

    2

    11, 2

    = =

    816,3)20,114.39(11

    92,21)20,114.39(11 2

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    50

    ( 19.628,47 112.750,58)

    Que ser el intervalo para la varianza del precio.

    (140,10 335,78)

    TEMA 9

    CONTRASTE DE HIPTESIS

    INTRODUCCIN

    A travs de los intervalos de confianza estimamos parmetros, y a travs del contraste de hiptesis, tomamos decisiones acerca de las caractersticas poblacionales.

    La hiptesis ser simple, si se refiere a un solo punto del espacio paramtrico, quedando totalmente especificada la forma de la funcin de densidad. Si la hiptesis se refiere a una regin del espacio probabilstico, estamos ante una hiptesis compuesta.

    En el contraste, se acepta provisionalmente una hiptesis como verdadera ( hiptesis nula H0), siendo sometida a comprobacin frente a la otra hiptesis ( hiptesis alternativa H1).

    Las formas bsicas de establecer las hiptesis sobre el parmetro son:

    0 0

    1 0

    0 0

    1 0

    0 0

    1 0

    :

    :

    :

    :

    :

    :

    HI

    H

    HII

    H

    HIII

    H

    =

    Regin crtica es el conjunto de muestras para las que se rechaza H0.

    Regin de aceptacin es el conjunto de muestras para las cuales se acepta H0.

    Valores crticos son los puntos que separan la regin crtica de la regin de aceptacin.

    El contraste consiste en seleccionar una regin crtica y averiguar si la muestra est o no en ella.

    Contraste tipo I.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    51

    7 Contraste tipo II

    8 Contraste tipo III

    ERROR TIPO I, TIPO II Y POTENCIA DEL CONTRASTE.

    Siempre que se tiene que tomar una decisin existe riesgo de equivocarse. La decisin en contraste de hiptesis se realiza sobre la hiptesis nula H0, dando lugar a cuatro posibles resultados:

    1. Aceptamos H0, siendo H0 verdadera. No hay error. 2. Rechazamos H0, siendo H0 falsa. No hay error. 3. Aceptamos H0, siendo H0 falsa. Error tipo II (). 4. Rechazamos H0, siendo H0 verdadera. Error tipo I ().

    0

    0

    0

    0

    Rechazar HP H CiertaAceptar HP H falsa

    =

    =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    52

    1 = Potencia del contraste: es la probabilidad de rechazar H0, cuando es falsa.

    Se dice que un contraste es ideal, cuando las probabilidades de cometer errores de tipo I y tipo II son nulas.

    FASES A REALIZAR EN UN CONTRASTE DE HIPTESIS.

    1. Formular la hiptesis nula y alternativa, en trminos estadsticos. 2. Determinar el estadstico de prueba apropiado. 3. seleccionar el nivel de significacin. 4. Determinar la regin crtica. 5. Seleccionar aleatoriamente la muestra y calcular el valor del estadstico de

    prueba. 6. Dar la regla de decisin y su interpretacin.

    POTENCIA Y FUNCIN DE POTENCIA DEL CONTRASTE.

    Cuando las hiptesis son compuestas, el error de tipo II tomar valores que vendrn expresados como funcin ( ) de los diferentes valores alternativos de bajo la hiptesis alternativa.

    Se denomina funcin de potencia del contraste ( )1 y nos indica la potencia del contraste para rechazar la hiptesis nula cuando es falsa. El valor particular que toma ( )1 para cada uno de los valores del parmetro que nos da la hiptesis alternativa, se denomina potencia del contraste, e indica la probabilidad de rechazar la hiptesis nula cuando es falsa.

    Se dir que la funcin de potencia es ideal cuando:

    0

    0

    0

    0

    0

    1

    rechazarHP H ciertarechazarHP H falsa

    =

    =

    ( ) ( )( )0

    1 1CP

    ==

    =

    Existen dos factores que afectan a la funcin de potencia: - El nivel de significacin . - El tamao de la muestra n.

    A medida que aumenta el nivel de significacin , los valores () disminuyen, con lo que la potencia ( )1 aumenta en 1. Para un tamao de muestra n fijo, si aumenta el error de tipo I , disminuye el error de tipo II y por lo tanto aumentar la potencia del contraste ( )1 Para un nivel de significacin fijo, cuando el tamao de la muestra n crece, la potencia del contraste ( )1 aumenta, y el error de tipo II , disminuye.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    53

    (ver problemas)

    DETERMINACIN DEL TAMAO DE LA MUESTRA PARA Y DADOS.

    ( ) 21 0

    z zn

    + =

    (ver problema)

    HIPTESIS SIMPLES Y EL LEMA DE NEYMAN- PEARSON.

    Diremos que una hiptesis es simple, si se refiere a un solo valor del parmetro, es decir, a un solo punto del espacio paramtrico, quedando totalmente especificada la forma de la funcin de cuanta o de densidad de la poblacin al conocer el valor del parmetro.

    Hemos visto que para un tamao de muestra fijo, si aumenta el error de tipo I, disminuye el error de tipo II, con lo que aumenta la potencia del contraste en 1. Lo que nos interesa es que la potencia sea mxima, pero esto no se puede obtener para un tamao de muestra fijo, lo que se hace es fijar el error de tipo I y tratar de obtener el test que haga mxima la potencia en 1.

    Para construir ese test se acude al Lema de Neyman Pearson. Deseamos contrastar:

    0 0

    1 0

    :

    :

    HH

    =

    siendo ( );L x la funcin de verosimilitud de la muestra

    01 2

    1

    01 2

    1

    2 0

    ( ; ) ( , ,.., ) (( ; )( ; ) ( , ,.., ) (( ; )

    , ,.., / )

    n

    n

    1 n

    L x k si x x x C region critica)L x

    L xK si x x x C region de aceptacion)

    L xP(X X X C

    = =

    La mejor regin crtica para realizar el contraste siendo 1 0 > vendr dada por la expresin:

    2 2 21 0

    1 0

    ( ) 2 ln2 ( ) C

    n kx x

    n

    =

    TEMA 9. PROBLEMAS.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    54

    1. Supongamos una poblacin N(;18), contrastar la hiptesis de que la media =8, siendo n =16 y =01, 22 '375x =

    0

    1

    : 8: 8

    HH

    =

    Se va ha realizar un contraste para la media, conociendo la desviacin tpica, por lo tanto el estadstico a utilizar ser:

    ( ; ) (0;1)x xx N Z Nn n

    n

    = =

    Estimador insesgado y eficiente.

    Estamos ante un contraste de dos colas, por lo que tendremos que calcular dos puntos o valores crticos.

    in f

    s u p

    ( )2

    ( )2

    P x x

    P x x

    < =

    > =

    Admitimos como cierto que H0: =8.

    Si 0 '1 0 '052

    = = con lo que el estadstico ser 18(8; )16

    x N

    0 inf 0

    22 2x x

    P P Z z

    n n

    < = < =

    Para z005=165 y despejamos infx

    infinf

    8 181'65 8 1'65 0 '5918 16

    16

    xx

    = = =

    sup 00

    22 2xx

    P P Z z

    n n

    > = > =

    supsup

    8 181'65 8 1'65 15'4018 1616

    xx

    = = + =

    Entonces la regin de aceptacin ser [ ]0 '59;15 '40 y las regiones de rechazo son ( ;0 '59) y (15'40; ) . Aceptaremos H0 si 0'59 15'40X Rechazamos H0 si 0'59 15'40X X< >

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    55

    Como 22'375X = rechazamos la hiptesis nula.

    2. De una poblacin N(;009) se obtiene una muestra de tamao 100, cuya media es 170. Para un nivel de significacin de 005, se desea contrastar la hiptesis

    0

    1

    : 1'68: 1'68

    HH

    =

    ( ; ) (0;1)x xx N Z Nn n

    n

    = =

    las regiones crticas sern:

    inf

    sup

    0 '05( ) 0'0252

    0'05( ) 0 '0252

    P x x

    P x x

    < = =

    > = =

    El estadstico queda: 0 '091'68;100

    X N

    El punto z0025 =196

    inf 0 infinf

    sup 0 supsup

    1'68 0'091'96 1'68 1'96 1'662100'091001'68

    1'96 1'68 1'96 0'09 10 1'6970'09100

    x xx

    n

    x xx

    n

    = = = =

    = = = + =

    Regin de aceptacin ser: [ ]1'662;1'697 Regiones crticas ( ) ( );1'662 1'697; y Como la media de la muestra 1'70X = rechazamos la hiptesis nula.

    3. De una poblacin N(;100) tomamos una muestra de tamao 625, cuya media es 10.225. Para un nivel de significacin de 005, contrastar 0 : 10.000H frente a 1 : 10.000H <

    ( ; ) (0;1)x xx N Z Nn n

    n

    = =

    El estadstico queda: 10010.000;625

    X N

    Este es un contraste de una sola cola ( ) ( ) 0 '05C CP x x P x x< = < =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    56

    ( )0 0 0'05 0'05Cx xP P Z zn n

    < = < =

    Para z005 =165 despejamos el punto crtico.

    10.000 1001'65 10.000 1'65 9.993'42100 625

    625

    CC

    xx

    = = =

    La regin de aceptacin ser: [ ]9.993'42; La regin de rechazo ser: ( );9.993'42 Como 10.225X = aceptamos la hiptesis nula.

    4. Sea una poblacin N(;), se desea contrastar la hiptesis 0 : 5H = frente a 1 : 5H , a un nivel de significacin de 001. Para ello se selecciona una

    muestra de tamao 20, cuya media es 6 y su varianza 9.

    En este caso se desea realizar un contraste para la media, pero no conocemos la desviacin tpica de la poblacin. Por lo tanto el estadstico ser:

    1n

    xT t

    sn

    =

    Como el contraste es de dos colas, las regiones crticas sern:

    inf

    sup

    ( ) 0'0052

    ( ) 0'0052

    P T t

    P T t

    < = =

    > = = Para t19;0005 = 2861

    El valor 0

    exp6 5 1'493

    20

    xT

    sn

    = = =

    La regin de aceptacin ser: [ ]2 '861;2 '861 por lo tanto aceptamos la hiptesis nula.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    57

    5. En una poblacin N(;) se desea contrastar la hiptesis 0 : 150H frente a 1 : 150H > . Se toma para ello una muestra de tamao 15 con una media de

    151234 y una desviacin tpica de 4072. realizar para un nivel de significacin de 010.

    La regin crtica ser: ( ) ( )0'10 0'10P T t P T t > = > = El valor t14;010 =1345. El intervalo crtico ser: [ ]1'345; El valor 0exp

    151'234 1501'1744'072

    15

    xT

    sn

    = = =

    Como 1174 = =

    Para una probabilidad de 0025 el punto correspondiente ser z0025 = 1'96

    inf 0 infinf

    sup 0 supsup

    10 201'96 10 1'96 2'165202510

    1'96 10 1'96 20 5 17'8420

    25

    x xx

    n

    x xx

    n

    = = = =

    = = = + =

    la regin de aceptacin ser [ ]2 '16;17 '84 las regiones crticas ( ) ( ); 2 '16 17 '84; y Como 19X = rechazamos la hiptesis nula.

    Para hallar la potencia del contraste calculamos el error tipo II

    ( ) 00

    aceptarHP H falsa =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    58

    Como 10 = es falso, tomamos otro valor para la media 12 = .

    ( )2 '16 17 '84( ) 12XP = = ahora tipificamos: ( ) ( )

    ( ) ( ) ( )

    2 '16 12 17 '84 12 2 '46 1'46 1'4620 20

    25 252 '46 1'46 1 2 '46 0 '9279 1 0 '9931 0 '921

    P Z P Z P Z

    P Z P Z P Z

    = = =

    = = + =

    Cuando 12 = aceptamos como cierta la hiptesis nula en un 921%

    La potencia del contraste 1 = para 12 = es: 1 0'921 0 '079 = =

    Entonces rechazamos la hiptesis nula cuando es falsa, en un 79% de las veces.

    7. Supongamos dos publicaciones N(60, 40) y N(80, 40). Se selecciona una muestra aleatoria simple de tamao 100; determinar:

    Mejor regin crtica para realizar el contraste sobre:

    0

    1

    : 60: 80

    HH

    =

    =

    siendo 0 '1 =

    Potencia del contraste. Tamao de la muestra para determinar la regin crtica, de manera que

    la talla sea 005 y la potencia de contraste sea 095, en 80 = .

    a) ( )2 2 21 0

    1 0

    ( ) 22 C

    n Lnkx x

    n

    ( )4060, 60, 4100X N N

    ( ) 60 60600'1 / 60 4 4 4C CCx xxP X x P P Z = = = = =

    Para una probabilidad de 01, buscamos en las tablas y obtenemos 128: 60 1'28 (1'28)4 60 65 '12

    4C

    Cx

    x

    = = + =

    La mejor regin crtica estara determinada por el conjunto de muestras para las cuales 65'12x .

    Para hallar el valor de k:

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    59

    2 2 2

    6'1

    100(80 60 ) 240 65'122100(80 60)

    2.800 32 65'12 32 65'12 40 2.80040

    32 195'2 6'1

    Lnk

    Lnk Lnk

    Lnk Lnk k e

    =

    = =

    = = =

    La mejor regin crtica tambin se puede definir como aquella regin para la cual:

    6'1( ,60)( ,80)

    L xe

    L x

    b) ( ) ( )( )1

    80 65 '12 80( ) / 80 3'724 4

    3'72 1

    CxP P x x P P Z

    P Z

    = = = = =

    =

    c) '

    0

    00'0560

    CrechazarH x xP PH es cierta

    = = = =

    4060,X Nn

    Tipificamos ' '60 60600 '05

    40 40 40C Cx xxP P Z

    n n n

    = =

    Buscamos en las tablas para una probabilidad de 005:

    '

    '60 1'645 ( 60) 65'8

    40c

    c

    xx n

    n

    = =

    para la potencia:

    '

    01

    0

    '

    ( ) 80

    8080 0'9540 40

    C

    c

    rechazarH x xP P PH es cierta

    xxP

    n n

    = = = =

    = =

    buscamos en tablas para una probabilidad de 095:

    '

    '80 1'645 ( 80) 65'840

    cc

    xx n

    n

    = =

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    60

    igualando los trminos obtenemos el nuevo punto crtico:

    ( )' ' ' ' 140( 60) 80 2 80 60 140 702c c c cx n x n x x = = + = = =

    ahora con el nuevo punto crtico, podemos calcular el tamao de la muestra:

    ( ) ( )265 '870 60 65 '8 6 '58 6 '58 4310

    n n n = = = = =

    TEMA 10

    CONTRASTES DE HIPTESIS PARAMTRICAS. CONTRASTES DE SIGNIFICACIN

    CONTRASTES DE SIGNIFICACIN.

    En ocasiones es necesario decidir si aceptar o no una hiptesis que se ha formulado, sin la existencia de una hiptesis alternativa. Esto puede suceder cuando la informacin de la que disponemos sobre el parmetro desconocido de la poblacin slo nos permite formular la hiptesis nula. Este tipo de contrastes se denominan de significacin.

    Si la diferencia existente entre el valor del parmetro segn la hiptesis nula y el valor proporcionado por la muestra, es debido a variaciones muestrales, entonces diremos que esa diferencia es no significativa y aceptaramos la hiptesis nula.

    Si la diferencia no est causada exclusivamente por variaciones muestrales, entonces diremos que existe diferencia significativa y rechazaramos la hiptesis nula.

    Para determinar la regin crtica, fijado el nivel de significacin: ( )0/P D d H > = siendo 0D =

    La regla de decisin ser: expD d> rechazamos la hiptesis nula y diremos que la discrepancia

    es significativa. expD d aceptamos la hiptesis nula y decimos que la discrepancia es

    no significativa.

  • UNED. CENTRO ASOCIADO DE LAS PALMAS. ESTADSTICA EMPRESARIAL. Ana M Ramrez Anaya

    61

    d

    CONTRASTE DE SIGNIFICACIN PARA LA MEDIA DE UNA POBLACIN NORMAL, CON CONOCIDA.

    Consideramos una poblacin ( ; )N con la desviacin tpica conocida, se desea contrastar la hiptesis

    0 0

    1 0

    :

    :

    HH

    =

    >

    como estadstico utilizaremos la medida de discrepancia D 0 0D X = =

    El estadstico media muestral 0 ;X Nn

    siendo 0;D Nn

    Para obtener la regin crtica hacemos 00 0

    X dD dP PH H > > = =

    Tipificando obtenemos: 00 0X d nP P Z d

    n n

    > = > =

    Utilizaramos las tablas normales para obtener el valor d

    9 PROBLEMAS

    1. Sea una poblacin ( ;3)N y deseamos contrastar la hiptesis nula 0 : 2H = a un nivel de significacin 0 '05 = Para ello se selecciona una muestra aleatoria simple de tamao 40n = cuya media es 2 '25x = .

    Con los datos que nos proporciona l