Estadística Nº 08 Regresion Lineal
-
Upload
juan-carlos-gutierrez-sanchez -
Category
Documents
-
view
219 -
download
0
description
Transcript of Estadística Nº 08 Regresion Lineal
-
7/17/2019 Estadstica N 08 Regresion Lineal
1/33
ESTADISTICA
GENERALUnidad IV: Regresin lineal y
Correlacin
Mg. Guillero An!onioMas A"a#uanc#e
-
7/17/2019 Estadstica N 08 Regresion Lineal
2/33
-
7/17/2019 Estadstica N 08 Regresion Lineal
3/33
Es!udio con1un!o de dos $aria%les A la derec#a !eneos una (osi%le anera de recoger los
da!os o%!enido o%ser$ando dos $aria%les en $arios
indi$iduos de una ues!ra.
En cada 'ila!eneos los da!os de un indi$iduo
Cada colunare(resen!a los $alores ue !oa una $aria%leso%re los isos.
Las indi$iduos no se ues!ran en ning?n orden(ar!icular.
Dic#as o%ser$aciones (ueden ser re(resen!adas en undiagrama de dispersin+@sca!!er(lo!/. En ellos0 cadaindi$iduos es un (un!o cuyas coordenadas son los $aloresde las $aria%les.
Nues!ro o%1e!i$o ser4 in!en!ar reconocera (ar!ir deliso si #ay relacinen!re las $aria%les0 de u& !i(o0 y sies (osi%le (redecirel $alor de una de ellas en 'uncin dela o!ra.
Alturaen cm.
Pesoen Kg.
,B B,
,7 B5
,-5 -
,7- B
,, BB
,B B5
,BB 7
,B -
,BF B-
... ...
-
7/17/2019 Estadstica N 08 Regresion Lineal
4/33
Diagraas de dis(ersin o nu%e de (un!os
Mide187cm.
Mide 161 cm.
Pesa 76 kg.
Pesa 50 kg.
Teneos las al!uras y los (esos de F5 indi$iduos re(resen!ados en un diagraa dedis(ersin.
-
7/17/2019 Estadstica N 08 Regresion Lineal
5/33
E1e(lo
Los da!os corres(onde a la es!a!ura del (adre +/ y la es!a!uradel su #i1o ayor +H/ (ara una ues!ra de (adres e #i1os son
los siguien!es:
AlturaPadre
AlturaHio
,.B7 ,.F
,.B5 ,.B-
,.5 ,.F,.BF ,.B7
,.F ,.7
,.7 ,.B-
,.- ,.F
,.B- ,.B7
,.F ,.-5
,.5 ,.5
,.7 ,.F
,.-5 ,.-
-
7/17/2019 Estadstica N 08 Regresion Lineal
6/33
Relacin en!re $aria%les.
Teneos las al!uras y los (esos de F5 indi$iduos re(resen!ados en un diagraa dedis(ersin.
3arec
e:ue
el(esoa
uen!
acon
laal!ur
a
-
7/17/2019 Estadstica N 08 Regresion Lineal
7/33
-
7/17/2019 Estadstica N 08 Regresion Lineal
8/33
!ncorrelacin
F5
-5
,F5
,-5
F5
-5
FF5
,5 ,75 ,B5 ,5 ,-5 ,5 55
Co reconocer relacin direc!a e in$ersa.
3ara $alores de (or encia de la edia!eneos $alores de H (or encia y (or de%a1oen (ro(orciones siilares. Incorrelacin.
3ara los $alores de ayores ue la ediale corres(onden $alores de H enores. Es!oes relacin in$ersao decrecien!e.
=3ara los $alores de ayores ue la
edia le corres(onden $alores de Hayores !a%i&n.
=3ara los $alores de enores ue laedia le corres(onden $alores de Henores !a%i&n.
=Es!o se llaa relacin direc!ao
crecien!e en!re e H.
-
7/17/2019 Estadstica N 08 Regresion Lineal
9/33
Co reconocer %uena o ala relacin
Dado un $alor de no (odeos decir grancosa so%re H. Mala relacin. Inde(endencia.
=Conocido sa%eos ue H se ue$e (oruna #oruilla es!rec#a. Juena relacin.
=Lo de )#oruilla es!rec#a* #ay ue en!enderlocon res(ec!o a la dis(ersin ue !iene la$aria%le H (or si sola0 cuando no se considera.
o
o
o
oo
-
7/17/2019 Estadstica N 08 Regresion Lineal
10/33
La co$arian"aen!re dos $aria%les0 "#$0 nos indica si
la (osi%le relacin en!re dos $aria%les es direc!a oin$ersa. Direc!a: S9y K5
In$ersa: S9y5
Incorreladas: S9y65
El signo de la co$arian"a nos dice si el as(ec!o de lanu%e de (un!os es crecien!e o no0 (ero no nos dice
nada so%re el grado de relacinen!re las $aria%les.
Co$arian"a de dos $aria%les e H
))((1
yyxxn
Si
i
ixy =
-
7/17/2019 Estadstica N 08 Regresion Lineal
11/33
M&!odo de M2nios Cuadrados
C4lculo de los coe'icien!es de regresin lineal:
x
xy
SC
SCB =
1 xByB
10 =
n
x
xSCx =2
2
)(
n
yx
xySCxy
= )()(
-
7/17/2019 Estadstica N 08 Regresion Lineal
12/33
E1e(lo
Los da!os corres(onde a la es!a!ura del (adre +/ y la es!a!ura del su #i1o ayor +H/ (arauna ues!ra de (adres e #i1os son los siguien!es:
Es!ud. Cali'icacin ena!e4!ica 3re
Uni$. +/
Cali'icacin en a!e4!icaUni$ersidad +H/
, 7F B
F7 7
F B
7 - 5
B 7- F
B7 -F- 7F
,5 5 BB
-
7/17/2019 Estadstica N 08 Regresion Lineal
13/33
Coe'. de correlacin lineal de 3earson
La coe'icien!e de correlacin lineal de 3earsondedos $aria%les0 r0 nos indica si los (un!os !ienen una!endencia a dis(onerse alineadaen!e+e9cluyendo rec!as #ori"on!ales y $er!icales/.
!iene el iso signo ue S9y(or !an!o de su signoo%!eneos el ue la (osi%le relacin sea direc!a oin$ersa.
r es ?!il (ara de!erinar si #ay relacin linealen!re
dos $aria%les0 (ero no ser$ir4 (ara o!ro !i(o derelaciones+cuadr4!ica0 logar2!ica0.../yx
xy
SSSr =
-
7/17/2019 Estadstica N 08 Regresion Lineal
14/33
Es adiensional Slo !oa $alores en O,0,P Las $aria%les son incorreladas r65 Relacin lineal (er'ec!a en!re dos $aria%les r68, o r6O,
E9cluios los casos de (un!os alineados #ori". o $er!icalen!e. Cuan!o 4s cerca es!& r de 8, o O, e1or ser4 el grado de
relacin lineal. Sie(re ue no e9is!an o%ser$aciones analas.
3ro(iedades de r
O, 8,5
Relacinin$ersa(er'ec!a
Relacindirec!a
casi
(er'ec!a
Varia%les
incorreladas
-
7/17/2019 Estadstica N 08 Regresion Lineal
15/33
En!renando el o1o: correlaciones (osi!i$as
-
7/17/2019 Estadstica N 08 Regresion Lineal
16/33
En!renando el o1o: casi (er'ec!as y (osi!i$as
-
7/17/2019 Estadstica N 08 Regresion Lineal
17/33
En!renando el o1o: correlaciones nega!i$as
-
7/17/2019 Estadstica N 08 Regresion Lineal
18/33
3regun!as 'recuen!es %"i r&0 eso 'uiere decir 'ue no las (aria)les son
independientes*
En la (r4c!ica0 casi sie(re s20 (ero no !iene(or u& ser cier!o en !odos los casos. Lo con!rario si es cier!o: Inde(endencia
i(lica incorrelacin.
Me +a salido r&1- %la relacin es superlineal/sicP*
QSu(eru& Eso es un error de c4lculo. Sie(re de%e !oar un$alor en!re O, y 8,.
%A partir de 'u (alores se considera 'ue +a$ )uena relacinlineal/*
Es di'2cil dar un $alor concre!o +irad los gr4'icos an!eriores/.
3ara es!e curso digaos ue si rK50 #ay %uena relacin linealy ue si rK50 #ay cier!a relacin +(or decir algo... la cosa esun (oco 4s co(licada: o%ser$aciones analas0.../
-
7/17/2019 Estadstica N 08 Regresion Lineal
19/33
!ros coe'icien!es de correlacin
Cuando las $aria%les en $e" de ser nu&ricas sonordinales0 es (osi%le (regun!arse so%re si #ay alg?n!i(o de correlacin en!re ellas.
Dis(oneos (ara es!os casos de dos es!ad2s!icos0aunue no los usareos en clase:
+@ro/ de S(earan +@!au/ de endall
No !en&is ue es!udiar nada so%re ellos en es!ecurso. Recordad slo ue son es!ad2s!icos an4logos
a r y ue los encon!rareis en (u%licaciones donde las$aria%les no (uedan considerarse nu&ricas.
Maurice George endall
C#arles Ed>ard S(eara
-
7/17/2019 Estadstica N 08 Regresion Lineal
20/33
Regresin
El an4lisis de regresin sir$e (ara (redecir una
edida en 'uncin de o!ra edida +o $arias/. H 6 Varia%le de(endien!e
(redic#a e9(licada
6 Varia%le inde(endien!e (redic!ora e9(lica!i$a
QEs (osi%le descu%rir una relacin H 6 '+/ 8 error
' es una 'uncin de un !i(o de!erinado el error es alea!orio0 (eueWo0 y no de(ende de
-
7/17/2019 Estadstica N 08 Regresion Lineal
21/33
Regresin
El e1e(lo del es!udio de la al!ura en gru(os 'ailiares de
3earson es del !i(o ue desarrollareos en el res!o del!ea.
Al!ura del #i1o 6 -7c 8 0,5al!ura del (adre +H 6 -7 8 507 /
Si el (adre ide 55c Qcu4n!o ide el #i1o Se es(era +(redice/ -7 8 5079556,-7 c. Al!o0 (ero no !an!o coo el (adre. Regresa a la edia.
Si el (adre ide ,5c Qcu4n!o ide el #i1o Se es(era +(redice/ -7 8 5079,56,7 c.
Ja1o0 (ero no !an!o coo el (adre. Regresa a la edia.
Es decir0 nos in!eresareos (or odelos de regresinlineal si(le.
-
7/17/2019 Estadstica N 08 Regresion Lineal
22/33
Modelo de regresin lineal si(le En el odelo de regresin lineal si(le0 dado dos
$aria%les H +de(endien!e/ +inde(endien!e0 e9(lica!i$a/
%uscaos encon!rar una 'uncin de muy simple (lineal)
ue nos (eri!a a(ro9iar H edian!e X 6 %58 %,
%5+ordenada en el origen0 cons!an!e/ %,+(endien!e de la rec!a/
H e X rara $e" coincidir4n (or uy %ueno ue sea elodelo de regresin. A la can!idad e6HOXse le denoina residuoo error residual.
-
7/17/2019 Estadstica N 08 Regresion Lineal
23/33
En el e1e(lo de 3earson y las al!uras0 &l encon!r: X 6 %58 %,
%56-7c +No in!er(re!ar coo al!ura de un #i1o cuyo (adre ide
5 c YE9!ra(olacin sal$a1eZ %,6507+En edia el #i1o gana 507 c (or cada c del (adre./
%5
6-7 c
%,6507
-
7/17/2019 Estadstica N 08 Regresion Lineal
24/33
La relacin en!re las $aria%les no es e9ac!a. Es na!ural(regun!arse en!onces: Cu4l es la e1or rec!aue sir$e (ara (redecir los $alores de H
en 'uncin de los de [u& error coe!eoscon dic#a a(ro9iacin +residual/.
%5
6-7 c
%,6507
-
7/17/2019 Estadstica N 08 Regresion Lineal
25/33
El odelo lineal de regresin se cons!ruye u!ili"ando la !&cnica dees!iacin 2nio cuadr4!ica: Juscar %50 %,de !al anera ue se iniice la can!idad
\iei
Se co(rue%a ue (ara lograr dic#o resul!ado %as!a con elegir:
Se o%!iene ade4s unas $en!a1as )de regalo* El error residual edio es nulo La $arian"a del error residual es 2nia(ara dic#a es!iacin.
Traducido: En !&rino edio no nos eui$ocaos. Cualuier o!raes!iacin ue no coe!a error en !&rino edio0 si es de !i(o lineal0ser4 (eor (or (resen!ar ayor $aria%ilidad con res(ec!o al error edio+ue es cero/.
xbybS
Srb
X
Y101
==
-
7/17/2019 Estadstica N 08 Regresion Lineal
26/33
[ue el error edio de las(redicciones sea nulo nouieredecir ue las (redicciones sean%uenas.
;ay ue encon!rar un edio dee9(resar la %ondad del a1us!e+%ondad de la (rediccin/
Coe!i un errorde 20en su
?l!ia (rediccin
No i(or!a. Con los dos?l!ios clien!es e
eui$ou& en 310y 3-0.
En !&rino edio el errores cero.
-
7/17/2019 Estadstica N 08 Regresion Lineal
27/33
QCo edir la %ondad de una regresin
Iagineos un diagraa de dis(ersin0 y $aos
a !ra!ar de co(render en (rier lugar u& esel error residual0 su relacin con la $arian"a de H0y de a#20 co edir la %ondad de un a1us!e.
-
7/17/2019 Estadstica N 08 Regresion Lineal
28/33
In!er(re!acin de la $aria%ilidad en H
HEn (rier lugar ol$ideos ue e9is!e la$aria%le . Veaos cu4l es la $aria%ilidaden el e1e H.
La 'ran1a so%reada indica la "ona donde$ar2an los $alores de H.
3royeccin so%re el e1e H 6 ol$idar
-
7/17/2019 Estadstica N 08 Regresion Lineal
29/33
In!er(re!acin del residuo
H
-
7/17/2019 Estadstica N 08 Regresion Lineal
30/33
Resuiendo:
=La dis(ersin del error residual ser4 una 'raccinde la dis(ersin original de H
=Cuan!o enor sea la dis(ersin del error residuale1or ser4 el a1us!e de regresin.
Eso #ace ue de'inaos coo edida de%ondad de un a1us!e de regresin0o coe'icien!e de de!erinacin a:
Jondad de un a1us!e
2
2
2
1Y
e
S
S
R =
H
22 Ye SS