Lliçons 15: Suma de moltes variables independents: Llei dels...

16
Lli¸ cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema del Limit Central; Aproximem distribucions Albert Satorra Probabilitat, UPF Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 1 / 18

Transcript of Lliçons 15: Suma de moltes variables independents: Llei dels...

Page 1: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Llicons 15:Suma de moltes variables independents: Llei dels

Grans Nombres, Teorema del Limit Central;Aproximem distribucions

Albert Satorra

Probabilitat, UPF

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 1 / 18

Page 2: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Continguts

1 Suma de variables independentsLlei dels Grans NombresTeorema del Lımit Central

2 Aproximacio de distribucions

3 Exemples

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 2 / 18

Page 3: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Suma de variables independents

Ens preguntem per la distribucio aproximada (no exacte) de

Y = X1 + X2 + . . .Xn

quan n es gran, i les Xjs son (mutuament) independents. Per exemple: ladistribucio aproximada de la binomial B(n, p) (que es suma de n deBernouilli independents) quan n es gran; de la χ2

n (que es la suma deN(0,1) al quadrat independents), quan n es gran; de la nota Y deProbabilitat que es el resultat de la suma de molts factors independents;etc.

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 3 / 18

Page 4: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Esperances, variancies

Suposem Xj ’s independents amb la mateixa mitjana µ i variancia σ2. Enaquest cas, si Y = X1 + X2 + . . .Xn, clarament

E (Y ) = nµ; V (Y ) = nσ2

De fet, el valor esperat i variancia del promitg X n = (X1 + X2 + . . .Xn)/nson

E (X n) = µ; V (X n) = σ2/n

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 4 / 18

Page 5: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Llei dels Grans Nombres

Lımit en probabilitat: Llei dels Grans NombresEns preguntem perl valor del promitg X n quan n es gran.

Suposem: Xj independents amb E (Xj) = µ i V (Xj) = σ2. Per exemple,X1, . . . ,Xj , . . .Xn observacions independents de una X (n tirades d’un daui observar el no. X , de 1 a 6, de la cara).

Llei dels Grans Nombres: Per tot ε > 0,

limn→+∞

P(| X n − µ |> ε) = 0

Direm que X n tendeix a µ en probabilitat. Escriurem

X nP→ µ

Que vol dir??: Que el promitg d’observacions independents de X tendeix aµ = E (X )Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 5 / 18

Page 6: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Llei dels Grans Nombres

ExempleTirem un dau 1000 vegades: X1, . . .X1000, Xi es el numero (1 a 6) de lacara del dau en la tirada i−essima. Preguntem X 1000 =?

La llei dels grans nombres:

X 1000 ≈ µ = E (X ) = (1 + 2 + . . . 6)/6 = 3.5

X n tan proper de 3.5 com vulguem, nomes cal augmentar el nombre n detirades? R:

> mean(sample(1:6, 10, replace = T))

[1] 4

> mean(sample(1:6, 100, replace = T))

[1] 3.61

> mean(sample(1:6, 1000, replace = T))

[1] 3.509

> mean(sample(1:6, 10000, replace = T))

[1] 3.4766

> mean(sample(1:6, 100000, replace = T))

[1] 3.49472

> mean(sample(1:6, 1000000, replace = T))

[1] 3.499939

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 6 / 18

Page 7: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Teorema del Lımit Central

Teorema del Lımit Central

Si les Xj tenen valor esperat µ i variancia σ2, son independents, i n esgran, la distribucio de X n = (X1 + X2 + . . .Xn)/n es aproximadamentNormal, amb valor esperat µ i variancia σ2/n. Escriurem

X nD→ N(µ,

σ2

n),

Direm que X n convergeix en distribucio a N(µ, σ2

n ).

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 7 / 18

Page 8: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Teorema del Lımit Central

Tenim l’aproximacio:

X n ≈ N(µ,σ2

n)

Exemple: Tirem un dau 1000 vegades: X1, . . .X1000, Xi es el numero (1 a6) de la cara del dau en la tirada i−essima. Preguntem X 1000 =?

el TCL ens diu que

X 1000 ≈ N(3.5,σ2

1000) = N(3.5, 0.045643552)

ja que σ2 = (5×7/121000 = (35/12)/1000 = 0.002916667 = 0.054006182

Probabilitat P(3.4 ≤ X 1000 ≤ 3.6) = P(−1.85164 < X 1000−3.50.054 < 1.85164)

= 1− 2 ∗ pnorm(−1.85164) = 0.9359225

Em emprat 3.5−3.40.054 = 0.1

0.054 = 1.85164

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 8 / 18

Page 9: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Teorema del Lımit Central

Figure: TCL

!"#$%&'()*(+(,+%-#"$*./((+(0(((1

!"#$%&'

!"#$%&'

!"! !"# !"# !"# !"# !"#

!"!

!"#

!"#

!"#

!"#

!"#

!"#

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 9 / 18

Page 10: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Teorema del Lımit Central

Figure: TCL

promitg de n uniformes, n = 3

promitg

Density

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 10 / 18

Page 11: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Suma de variables independents

Teorema del Lımit Central

Figure: TCL

!"#$%&'()*(+(,+%-#"$*./((+(0(((12

!"#$%&'

!"#$%&'

!"# !"# !"# !"# !"# !"#

!!

!!

!!

!

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 11 / 18

Page 12: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Aproximacio de distribucions

Aproximacio Normal a la BinomialPel TCL, si n es gran (depen de p, per en general per n = 25 l’aproximacioes bona)

B(n, p) ≈ N(np, npq)

de manera que

P[a ≤ B(n, p) ≤ b] ' P[a− 0.5 ≤ N(np, npq) ≤ b + 0.5]

(on utilitzem el que s’anomena correccio per continuitat. Si norestem/sumem 0.5 l’aproximacio tambes es bona si n es gran)Per exemple: Llancem 100 monedes. Sigui Y igual el # de caresobtingudes. Interesa calcular P[47 ≤ Y ≤ 52]

(aproximacio normal sense correccio per continuitat)P[47 ≤ N(50, 25) ≤ 52] = .3811(aproximacio normal amb correccio per continuitat)P[46.5 ≤ N(50, 25) ≤ 52.5] = .4495valor exacte P[46.5 ≤ B(100, 0.05) ≤ 52.5] = .44929

L’aproximacio normal a la binomial es bona si npq > 5.Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 12 / 18

Page 13: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Aproximacio de distribucions

Exemple: error d’arrodoniment

Exemple: Tenim 100 numeros de quatre decimals. Per sumar-losarrodonim al enter mes proxim. Prob. que l’error d’arrodoniment sigui mesgran que 5. Solucio: E =

∑ei ∼ N(0, 100σ2) on ei ∼ U(−0.5, 0.5) i

σ2 = 1/12. Tenim que

P(−5 < E < 5) = P(−5 < N(0, 100/12) < 5)

= P(− 5

10/√

12< Z <

5

10/√

12) = (−1.732051 < Z < 1.732051) = 1−2P(Z < −1.73205)

De manera que P(l’error d’arrodoniment sigui mes gran que 5.) = 2 P(Z ¡-1.73205) = 2*pnorm(-1.732051)=0.083, un 8%.

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 13 / 18

Page 14: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Aproximacio de distribucions

Exemplw: Tirades repetides d’una moneda

Tirem una moneda (no trucada) repetidament n = 200 vegades,probabilitat que el promitg de cares p sigui a l’interval (.48, .52).p ≈ N(0.5, 0.25

n ), de manera que:

P(0.48 ≤ p ≤ 0.52) ≈ P(0.48− 0.5√

0.25n

≤ Z ≤ 0.52− 0.5√0.25n

)

= Φ(0.56)− Φ(−0.56) = Φ(0.56)− (1− Φ(0.56)) = 2× Φ(0.56)− 1

= 2 ∗ pnorm(0.5656854)− 1 = 0.4283923

es a dir, el 43%. Noteu que (0.52− 0.5)/sqrt(0.25/200) = 0.5656854

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 14 / 18

Page 15: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Aproximacio de distribucions

Tirades repetides d’una moneda, quantes tiradescalen?Quantes tirades cal per assegurar una probabilitat del 99% que el promitgp estigui a l’interval (.48, .52)?; es a dir: P(48 < p < 52) = 0.99.Seguint el raonament anterior, com que P(−3 < Z < 3) = .99, cal que0.52− 0.5√

0.25n

=

0.02√0.25n

= 3

0.02 = 3

√0.25

n

0.022 = 32 0.25

n

n =32 × 0.52

0.022=

(3× 0.5

0.02

)2

= 5625

tirades!Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 15 / 18

Page 16: Lliçons 15: Suma de moltes variables independents: Llei dels ...84.89.132.1/~satorra/P/P2011L9.pdfLli˘cons 15: Suma de moltes variables independents: Llei dels Grans Nombres, Teorema

Aproximacio de distribucions

Deures

Feu Exercici 2 de la Llista 5!

Albert Satorra ( Probabilitat, UPF ) AD/E-GRAU Tardor 2011 16 / 18