ANÁLISIS ESTADÍSTICO CON SPSS© Dat Company 5.5 Pruebas de Hipótesis Pruebas de dos colas o...

32
ANÁLISIS ESTADÍSTICO CON SPSS SESIÓN 5: DISTRIBUCIONES Y PRUEBAS DE HIPÓTESIS

Transcript of ANÁLISIS ESTADÍSTICO CON SPSS© Dat Company 5.5 Pruebas de Hipótesis Pruebas de dos colas o...

  • ANÁLISIS ESTADÍSTICO CON SPSS

    SESIÓN 5:

    DISTRIBUCIONES Y PRUEBAS DE HIPÓTESIS

  • © Dat Company

    Contenido

    5.1 Variables aleatorias

    5.2 Distribuciones de probabilidad discretas

    5.3 Distribuciones de probabilidad continuas

    5.4 Características de una variable aleatoria

    5.5 Pruebas de hipótesis

    2

  • © Dat Company

    5.1 Variable Aleatoria

    • Dado un experimento aleatorio 𝜀 y 𝛺 el espacio muestralasociado a 𝜀. Una función 𝑋 que asigna a cada elemento𝜔 en 𝛺 uno y solamente un número real 𝑥 = 𝑋(𝜔), sellama variable aleatoria. Es decir, 𝑋 es una función real,

    𝑋 : 𝛺 → 𝐼𝑅

    • El rango 𝑅𝑋 de la variable aleatoria 𝑋 está dado por elsiguiente conjunto de números reales.

    𝑅𝑋 = 𝑥 ∈ 𝐼𝑅 = 𝑋 𝜔 = x,𝜔 ∈ 𝛺 = 𝑋(𝛺)

  • © Dat Company

    5.1 Variable Aleatoria

    • Sea 𝛺 un espacio muestral asociado a un experimentoaleatorio 𝜀 , y 𝑋 una variable aleatoria con rango 𝑅𝑋definida sobre 𝛺 . Un evento 𝐴 en 𝛺 y un evento 𝐸𝑥 en 𝑅𝑋se dice que son eventos equivalentes, Si,

    𝐴 = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥

    • Si 𝐴 es un evento en el espacio muestral 𝛺 y 𝐸𝑥 A unevento en el rango Rx de la variable aleatoria X, entonces

    definimos la probabilidad como

    𝑃 𝐸𝑥 = 𝑃 𝐴 , donde A = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥

  • © Dat Company

    5.2 Distribuciones de probabilidad discretas

    • Si el rango de la variable aleatoria 𝑋, es un conjunto finitoo infinito numerable de posibles valores, se llama variable

    aleatoria discreta. En este caso

    𝑅𝑥 = 𝑥1, 𝑥2, 𝑥3, … .

    • Sea 𝑋 una variable aleatoria discreta con rango 𝑅𝑥 . Unafunción definida por

    𝑝 𝑥 = 𝑃 𝑋 = 𝑥 =

    𝜔 ∈ 𝛺 / 𝑋 𝜔 =𝑥

    𝑃[ 𝜔 ]

  • © Dat Company

    5.2 Distribuciones de probabilidad discretas

    • Donde la suma es sobre los sucesos 𝜔 𝜖 𝛺 tal que 𝑋 𝜔 =𝑥 y satisface las siguientes condiciones

    𝑝 𝑥 > 0 , ∀ 𝑥 ∈ 𝑅𝑥 ;

    𝑥 ∈ 𝑅𝑥

    𝑝 𝑥 =

    𝑥 ∈ 𝑅𝑥

    𝑃 𝑋 = 𝑥 = 1

    se llama función de probabilidad o ley de probabilidad de la

    variable aleatoria 𝑋

    • La función de probabilidad 𝑝 𝑥 debe estar está biendefinida para 𝑥 ∈ 𝑅𝑥 y se asume para los eventosimposibles 𝑝 𝑥 = 0

  • © Dat Company

    5.2 Distribuciones de probabilidad discretas

    • El dominio de la función 𝑝 puede considerarse como elconjunto de los números, reales y su rango el conjunto

    < 0,1] ∪ 0 . Es decir, 𝑝: 𝐼𝑅 → 0,1

    • La distribución de probabilidad se representa usualmente

    en una tabla

    x 𝑥1 𝑥2 𝑥3

    𝑝 𝑥 = P[X = x] 𝑝(𝑥1) 𝑝(𝑥2) 𝑝(𝑥3) . . .

    Tabla 3. Representación tabular de la distribución de probabilidad

  • © Dat Company

    5.2 Distribuciones de probabilidad discretas

    Función de distribución de variable aleatoria discreta

    • Sea X una variable aleatoria discreta con rango

    𝑅𝑥 = 𝑥1, 𝑥2, 𝑥3, … . y función de probabilidad,𝑝 𝑥𝑖 = 𝑃[𝑋 = 𝑥𝑖] , sea 𝑥 un número real cualquiera, lafunción de distribución de 𝑋 se denota por "𝐹(𝑥)“ y sedefine como

    𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 =

    𝑥𝑖≤𝑥

    𝑝( 𝑥𝑖) =

    𝑥𝑖≤𝑥

    𝑃[𝑋 = 𝑥𝑖]

  • © Dat Company

    5.2 Distribuciones de probabilidad discretas

    Propiedades de la función de distribución

    • Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ, pues 𝐹 𝑥 es unaprobabilidad para cualquier 𝑥 real y las probabilidadesestán limitadas por 0 y 1.

    • Propiedad 2: 𝐹 𝑥 es una función no creciente. Sean𝑥1, 𝑥2 ∈ 𝐼𝑅 tales que 𝑥1 ≤ 𝑥2, entonces se tiene

    𝑥 𝑋 ≤ 𝑥1 ⊂ 𝑥 𝑋 ≤ 𝑥2

    Aplicando probabilidades a ambos eventos,

    𝐹 𝑥1 = 𝑃 𝑋 ≤ 𝑥1 ≤ 𝑃[𝑋 ≤ 𝑥2]

    Obtenemos 𝐹 𝑥1 = 𝐹 𝑥2

  • © Dat Company

    5.2 Distribuciones de probabilidad discretas

    • Propiedad 3:

    (a) limx→∞

    F(x) = P x / X < ∞ = P X < ∞ = 1, pues el evento

    x / X < ∞ , es el conjunto de todos los números reales.

    (b) limx→∞

    F(x) = P x / X < −∞ = P X < −∞ = 0, pues el evento

    x / X < −∞ , es el conjunto nulo.

    • Propiedad 4: Sea 𝑥𝑘, 𝑥𝑘+1 ∈ 𝑅𝑥 , si x es tal que 𝑥𝑘 ≤ 𝑥 <𝑥𝑘+1, entonces 𝐹 𝑥 = 𝐹 𝑥𝑘 . Es decir, la función 𝐹 𝑥 esconstante e igual a 𝐹 𝑥𝑘 para todo x ∈ [𝑥𝑘 , 𝑥𝑘+1 > Estoimplica que si 𝑋 es una variable discreta, F(𝑥) es unafunción “escalonada"

  • © Dat Company

    5.3 Distribuciones de probabilidad continuas

    • Si el rango 𝑅𝑥, de una variable aleatoria 𝑋 es un intervalosobre la recta de los números reales, se llama Variable

    Aleatoria Continua.

    • Sea 𝑋 una variable aleatoria continua con rango 𝑅𝑥. Lafunción de densidad de probabilidad asociado a la

    variable aleatoria, es una función 𝑓 𝑥 integrable quesatisface las siguientes condiciones:

    1. 𝑓 𝑥 ≥ 0, para todo 𝑥 ∈ ℝ (𝑜 𝑓 𝑋 > 0 , 𝑥 ∈ 𝑅𝑥 )

    2. 𝑅𝑥 𝑓 𝑥 𝑑𝑥 = 1 (𝑜 ∞−+∞

    𝑓 𝑥 𝑑𝑥 = 1 )

  • © Dat Company

    5.3 Distribuciones de probabilidad continuas

    • La probabilidad de que la variable aleatoria tome los

    valores entre a y b, donde el intervalo 𝑎, 𝑏 ⊂ 𝑅𝑥 . Esdecir, queremos calcular la P 𝑎 ≤ 𝑋 ≤ 𝑏

    • Por tanto, la probabilidad del evento 𝐴 = {𝑋 / 𝑎 ≤ 𝑋 ≤ 𝑏}

    se define P A = 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = 𝑎

    𝑏𝑓 𝑥 𝑑𝑥

    • Sea 𝑋 una variable aleatoria continua con función dedensidad 𝑓 𝑥 . La función de distribución acumuladade la variable aleatoria 𝑋 , denotado por se define por“𝐹 𝑥 ”, se define por

    𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = −∞

    𝑥𝑓 𝑥 𝑑𝑥 , ∀ 𝑥 ∈ ℝ

  • © Dat Company

    5.3 Distribuciones de probabilidad continuas

    Propiedades de la función de distribución

    Las tres primeras propiedades son los mismos que el caso

    discreto.

    • Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ

    • Propiedad 2: lim𝑥→∞

    𝐹(𝑥) = lim𝑥→∞

    𝑥𝑓 𝑡 𝑑𝑡 = 1;

    lim𝑥→−∞

    𝐹(𝑥) = lim𝑥→−∞

    𝑥𝑓 𝑡 𝑑𝑡 = 0

    • Propiedad 3: La función de distribución es no decreciente,

    esto es si 𝑎 ≤ 𝑏, entonces 𝐹(𝑎) ≤ 𝐹(𝑏)

  • © Dat Company

    5.3 Distribuciones de probabilidad continuas

    • Propiedad 4: limℎ→0

    𝐹(𝑥 + ℎ) = 𝐹 𝑥 , ∀ 𝑥 ∈ ℝ, con h > 0; o

    sea 𝐹 es continua por la derecha, en todos los puntos.

    • Propiedad 5: Del segundo teorema fundamental del

    cálculo se tiene que si 𝐹(𝑥) es una función derivable,entonces

    𝑓 𝑥 =𝑑

    𝑑𝑥𝐹(𝑥)

  • © Dat Company

    5.4 Características de una variable aleatoria

    • La variable aleatoria está completamente determinado por

    la distribución de probabilidad [𝑥𝑖 , 𝑝 𝑥𝑖 ; i = 1,2,3,… ] si esdiscreta, y por la función de densidad 𝑓 𝑥 si es continua

    • Medidas descriptivas de una variable aleatoria

    El primer momento alrededor del origen es el valor

    esperado a la media de la variable aleatoria

    (esperanza matemática); el segundo momento alrededor

    de la media es la varianza de la variable aleatoria;

    finalmente la moda y la mediana.

  • © Dat Company

    5.4 Características de una variable aleatoria

    • El valor esperado o esperanza matemática de 𝑋, sedenota por E(x) y se define

    E(x)= σx ∈ 𝑅𝑥 𝑥 𝑝 𝑥 , 𝑆𝑖 𝑋 es una variable aleatoria

    discreta

    E(x)= 𝑅𝑥𝑥 𝑓 𝑥 𝑑𝑥 =

    −∞

    ∞𝑥 𝑓 𝑥 𝑑 𝑥 , 𝑆𝑖 𝑋 es una

    variable aleatoria continua.

    • Siempre que σx ∈ 𝑅𝑥 𝑥 𝑝 𝑥 sea absolutamente

    convergente, es decir σx ∈ 𝑅𝑥 |𝑥| 𝑝 𝑥 finita y

    −∞

    ∞|𝑥| 𝑓 𝑥 𝑑 𝑥 finita respectivamente.

  • © Dat Company

    5.4 Características de una variable aleatoria

    • La esperanza matemática de 𝑋 , se llama también, mediade la variable aleatoria, y se denota por 𝜇, o sea 𝜇 = E(X)

    Propiedades de la esperanza matemática

    • Teorema 5.4.1: Si 𝑋 es una variable aleatoria, 𝑎 𝑦 𝑏constantes. Entonces

    (i) 𝐸 𝑎 = 𝑎,

    (ii) 𝐸 𝑎 𝐻 𝑋 = 𝑎 𝐸 𝑎 𝐻 𝑋

    (iii) 𝐸 𝑎 𝐻 𝑋 + 𝑏 𝐺(𝑋) = 𝑎 𝐸 𝑎 𝐻 𝑥 + 𝑏 𝐸[𝐺(𝑋)]

  • © Dat Company

    5.4 Características de una variable aleatoria

    • Teorema 5.4.2: Caso especial del (iii)

    𝐸 𝑎 𝑋 ± 𝑏 = 𝑎 𝐸 𝑋 ± 𝑏

    Si 𝑏=0, entonces 𝐸 𝑎𝑋 = 𝑎 𝐸 𝑥

    • Teorema 5.4.3: Sean 𝑋1, 𝑋2, … , 𝑋𝑛, n variables aleatorias y𝑎1 𝑖 = 0,1, … , 𝑛 constantes, entonces

    𝐸 𝑎0 +

    𝑖=1

    𝑛

    𝑎𝑖𝑋𝑖 = 𝑎0 +

    𝑖=1

    𝑛

    𝑎𝑖𝐸(𝑋𝑖)

    • Consecuencia del Teorema 5.4.3: Si 𝑋 e 𝑌 son variables aleatorias y𝑎, 𝑏 constantes, entonces

    𝐸 𝑎 𝑋 + 𝑏𝑌 = 𝑎 𝐸 𝑋 + 𝑏 𝐸(𝑌)

  • © Dat Company

    5.4 Características de una variable aleatoria

    • La varianza de una variable aleatoria X, se denota por

    Var(𝑋) o por 𝜎𝑋2(o simplemente 𝜎2 ) y se define como

    Var 𝑋 = 𝜎2 = E X − 𝜇 2

    Por lo tanto

    𝜎2 = E X − 𝜇 2 = σ𝑥 ∈ 𝑅𝑥(𝑥 − 𝜇)2 𝑝 𝑥 , 𝑠𝑖 𝑋 es discreta

    = −∞

    ∞(𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥, 𝑠𝑖 𝑋 es continua

    • Otra media de dispersión llamada desviación típica de la

    variable aleatoria, se define

    𝝈 = + 𝜎2

  • © Dat Company

    5.4 Características de una variable aleatoria

    Propiedades de la varianza y desviación típica

    • Teorema 5.4.4: Si 𝑋 es una variable aleatoria con media𝜇, la varianza de 𝑋 está dado por

    𝑉𝑎𝑟 𝑋 = 𝜎2 = 𝐸 𝑋2 − 𝐸 𝑋 2 = 𝐸 𝑋2 − 𝜇2

    • Teorema 5.4.5: Si 𝑋 es una variable aleatoria, a y bconstantes, entonces

    𝑉𝑎𝑟 𝑎𝑋 ± 𝑏 = 𝑎2 𝑉𝑎𝑟(𝑋)

    • Consecuencia del Teorema 5.4.5

    1. Si 𝑎 = 0 , 𝑉𝑎𝑟 𝑏 = 0

    2. Si 𝑏 = 0 , 𝑉𝑎𝑟 𝑎𝑋 = 𝑎2 𝑉𝑎𝑟(𝑋)

  • © Dat Company

    5.4 Características de una variable aleatoria

    • Teorema 5.4.6: Si 𝑋 es una variable aleatoria y 𝑐 unaconstante, entonces

    1. 𝜎𝑐𝑋 = 𝑐 𝜎𝑋

    2. 𝜎𝑋+𝑐 = 𝜎𝑋

  • © Dat Company

    5.5 Pruebas de Hipótesis

    • Una hipótesis estadística es una aseveración que se

    hace a cerca de la distribución de una o más variables

    aleatorias (o poblaciones).

    • Se puede especificar una hipótesis, dando el tipo de

    distribución y el valor o valores del parámetro o los

    parámetros que la definen. Por ejemplo:

    (a) 𝑋, tiene una distribución binomial con 𝑝 =1

    3

    (b) 𝑋, tiene una distribución normal con 𝜇 = 50, 𝜎 = 5

  • © Dat Company

    5.5 Pruebas de Hipótesis

    • La prueba estadística de una hipótesis, toma los valores

    experimentales que son observados y conducen a una

    decisión; no rechazar (aceptar) o rechazar la hipótesis

    bajo consideración.

    • La hipótesis estadisticas se pueden especificar en

    hipótesis nula 𝐻0 (es la hipótesis que se quiere probar) yhipótesis alternativa 𝐻1 (es una suposición contraria a laque se quiere probar), que se acepta en caso de que la

    primera sea rechazada.

  • © Dat Company

    5.5 Pruebas de Hipótesis

    • En una terminología de prueba, hablamos de probar la

    hipótesis nula contra una alternativa en el supuesto

    tentativo que la hipótesis nula es cierta.

    • Hay tres tipos principales de pruebas, cada uno de los

    cuales es identificado por la forma en que se formulan 𝐻0 y𝐻1.

    Prueba de una cola o unilateral:

    (a) Prueba de cola inferior o prueba del lado izquierdo:

    𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 < 𝜃0

  • © Dat Company

    5.5 Pruebas de Hipótesis

    Este tipo de prueba se emplea cuando se tiene alguna

    evidencia que el parámetro no es igual a 𝜃0 ,si no quedebe ser menor.

    (b) Prueba de la cola superior o prueba de la cola derecha:

    𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 > 𝜃0

    Este tipo de prueba se emplea, en problemas, en que se

    tiene algún indicio que el parámetro no es igual al valor

    postulado, debe ser mayor que el postulado.

  • © Dat Company

    5.5 Pruebas de Hipótesis

    Pruebas de dos colas o bilaterales

    𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 ≠ 𝜃0

    • Este tipo de prueba se emplea, en el caso que el valor que

    se prueba no sea verdadera; entonces, todos los demás

    valores son posibles.

    Teorema del Limite Central

    • Una estadística para la media de la población, es la media

    muestral ത𝑋 Si la población es normal (o si la muestra esgrande 𝑛 ≥ 30, aún cuando la población no es normal),

  • © Dat Company

    5.5 Pruebas de Hipótesis

    • La distribución de ത𝑋 es 𝑁 𝜇,𝜎2

    𝑛y variable aleatoria

    𝑍 =ത𝑋−𝜇0

    𝜎/ 𝑛, tiene una distribución 𝑁(0,1).

    • Entonces, dada una muestra suficientemente grande de

    la población, la distribución de las medias muestrales

    seguirán una distribución normal.

    lim𝑛→∞

    Pr(ത𝑋 − 𝜇0

    𝜎/ 𝑛≤ 𝑧) =

    1

    2𝜋න−∞

    𝑥

    𝑒−12𝑡2𝑑𝑡

  • © Dat Company

    5.5 Pruebas de Hipótesis

    • A continuación se muestran algunas distribuciones para

    probar hipótesis, suponiendo la normalidad de los errores

    del MRSL. Como 𝜎2 no suele conocerse en los estudiosempíricos, casi siempre se usan las distribuciones 𝑡 y 𝐹.

    1 restricción 1 o más restricciones

    𝜎2 conocida 𝑁 𝜒2

    𝜎2 desconocida 𝑡 de Student 𝐹 de Snedecor

  • © Dat Company

    5.5 Pruebas de Hipótesis

    • Según el supuesto de normalidad, la variable que se

    distribuye como una 𝑡 de Student con 𝑛 − 2 gl, se leconsidera como estadístico de prueba 𝒕 (o 𝑡 calculado)

    𝑡 =መ𝛽2 − 𝛽2

    𝑒𝑒 መ𝛽2

    Prueba de hipótesis de 2: prueba 𝜒2

    • Las conjeturas para una prueba bilateral son:

    𝐻0: 𝜎2 = 𝜎0

    2

    𝐻1: 𝜎2 ≠ 𝜎0

    2

  • © Dat Company

    5.5 Pruebas de Hipótesis

    • El estadístico de prueba es:

    𝜒2 = 𝑛 − 2ො𝜎2

    𝜎2

    se distribuye con 𝑛 − 2 gl. Con un nivel de significanciadado, 𝛼, se obtendrá el 𝜒2 de tabla.

  • © Dat Company

    5.5 Pruebas de Hipótesis

    Método del valor p

    • El valor 𝑝 es el nivel de significancia más bajo al cualpuede rechazarse una hipótesis nula.

    • Consiste en encontrar la “probabilidad real” (nivel exacto

    de significancia) en la tabla de valores pertinente,

    utilizando el estadístico de prueba, 𝑡 𝑜 𝜒𝟐

    • Si el valor 𝑝 es menor al nivel de significancia supuesto,𝛼, se puede rechazar la hipótesis nula.

  • © Dat Company

    Referencias

    • Moya, R. & Saravia, G. (1988). Probabilidad e inferencia

    estadística (2da ed.). Lima: San Marcos.

    32