Estadística Nº 08 Regresion Lineal

download Estadística Nº 08 Regresion Lineal

of 33

description

Estadística Nº 08 Regresion Lineal

Transcript of Estadística Nº 08 Regresion Lineal

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    1/33

    ESTADISTICA

    GENERALUnidad IV: Regresin lineal y

    Correlacin

    Mg. Guillero An!onioMas A"a#uanc#e

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    2/33

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    3/33

    Es!udio con1un!o de dos $aria%les A la derec#a !eneos una (osi%le anera de recoger los

    da!os o%!enido o%ser$ando dos $aria%les en $arios

    indi$iduos de una ues!ra.

    En cada 'ila!eneos los da!os de un indi$iduo

    Cada colunare(resen!a los $alores ue !oa una $aria%leso%re los isos.

    Las indi$iduos no se ues!ran en ning?n orden(ar!icular.

    Dic#as o%ser$aciones (ueden ser re(resen!adas en undiagrama de dispersin+@sca!!er(lo!/. En ellos0 cadaindi$iduos es un (un!o cuyas coordenadas son los $aloresde las $aria%les.

    Nues!ro o%1e!i$o ser4 in!en!ar reconocera (ar!ir deliso si #ay relacinen!re las $aria%les0 de u& !i(o0 y sies (osi%le (redecirel $alor de una de ellas en 'uncin dela o!ra.

    Alturaen cm.

    Pesoen Kg.

    ,B B,

    ,7 B5

    ,-5 -

    ,7- B

    ,, BB

    ,B B5

    ,BB 7

    ,B -

    ,BF B-

    ... ...

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    4/33

    Diagraas de dis(ersin o nu%e de (un!os

    Mide187cm.

    Mide 161 cm.

    Pesa 76 kg.

    Pesa 50 kg.

    Teneos las al!uras y los (esos de F5 indi$iduos re(resen!ados en un diagraa dedis(ersin.

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    5/33

    E1e(lo

    Los da!os corres(onde a la es!a!ura del (adre +/ y la es!a!uradel su #i1o ayor +H/ (ara una ues!ra de (adres e #i1os son

    los siguien!es:

    AlturaPadre

    AlturaHio

    ,.B7 ,.F

    ,.B5 ,.B-

    ,.5 ,.F,.BF ,.B7

    ,.F ,.7

    ,.7 ,.B-

    ,.- ,.F

    ,.B- ,.B7

    ,.F ,.-5

    ,.5 ,.5

    ,.7 ,.F

    ,.-5 ,.-

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    6/33

    Relacin en!re $aria%les.

    Teneos las al!uras y los (esos de F5 indi$iduos re(resen!ados en un diagraa dedis(ersin.

    3arec

    e:ue

    el(esoa

    uen!

    acon

    laal!ur

    a

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    7/33

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    8/33

    !ncorrelacin

    F5

    -5

    ,F5

    ,-5

    F5

    -5

    FF5

    ,5 ,75 ,B5 ,5 ,-5 ,5 55

    Co reconocer relacin direc!a e in$ersa.

    3ara $alores de (or encia de la edia!eneos $alores de H (or encia y (or de%a1oen (ro(orciones siilares. Incorrelacin.

    3ara los $alores de ayores ue la ediale corres(onden $alores de H enores. Es!oes relacin in$ersao decrecien!e.

    =3ara los $alores de ayores ue la

    edia le corres(onden $alores de Hayores !a%i&n.

    =3ara los $alores de enores ue laedia le corres(onden $alores de Henores !a%i&n.

    =Es!o se llaa relacin direc!ao

    crecien!e en!re e H.

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    9/33

    Co reconocer %uena o ala relacin

    Dado un $alor de no (odeos decir grancosa so%re H. Mala relacin. Inde(endencia.

    =Conocido sa%eos ue H se ue$e (oruna #oruilla es!rec#a. Juena relacin.

    =Lo de )#oruilla es!rec#a* #ay ue en!enderlocon res(ec!o a la dis(ersin ue !iene la$aria%le H (or si sola0 cuando no se considera.

    o

    o

    o

    oo

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    10/33

    La co$arian"aen!re dos $aria%les0 "#$0 nos indica si

    la (osi%le relacin en!re dos $aria%les es direc!a oin$ersa. Direc!a: S9y K5

    In$ersa: S9y5

    Incorreladas: S9y65

    El signo de la co$arian"a nos dice si el as(ec!o de lanu%e de (un!os es crecien!e o no0 (ero no nos dice

    nada so%re el grado de relacinen!re las $aria%les.

    Co$arian"a de dos $aria%les e H

    ))((1

    yyxxn

    Si

    i

    ixy =

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    11/33

    M&!odo de M2nios Cuadrados

    C4lculo de los coe'icien!es de regresin lineal:

    x

    xy

    SC

    SCB =

    1 xByB

    10 =

    n

    x

    xSCx =2

    2

    )(

    n

    yx

    xySCxy

    = )()(

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    12/33

    E1e(lo

    Los da!os corres(onde a la es!a!ura del (adre +/ y la es!a!ura del su #i1o ayor +H/ (arauna ues!ra de (adres e #i1os son los siguien!es:

    Es!ud. Cali'icacin ena!e4!ica 3re

    Uni$. +/

    Cali'icacin en a!e4!icaUni$ersidad +H/

    , 7F B

    F7 7

    F B

    7 - 5

    B 7- F

    B7 -F- 7F

    ,5 5 BB

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    13/33

    Coe'. de correlacin lineal de 3earson

    La coe'icien!e de correlacin lineal de 3earsondedos $aria%les0 r0 nos indica si los (un!os !ienen una!endencia a dis(onerse alineadaen!e+e9cluyendo rec!as #ori"on!ales y $er!icales/.

    !iene el iso signo ue S9y(or !an!o de su signoo%!eneos el ue la (osi%le relacin sea direc!a oin$ersa.

    r es ?!il (ara de!erinar si #ay relacin linealen!re

    dos $aria%les0 (ero no ser$ir4 (ara o!ro !i(o derelaciones+cuadr4!ica0 logar2!ica0.../yx

    xy

    SSSr =

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    14/33

    Es adiensional Slo !oa $alores en O,0,P Las $aria%les son incorreladas r65 Relacin lineal (er'ec!a en!re dos $aria%les r68, o r6O,

    E9cluios los casos de (un!os alineados #ori". o $er!icalen!e. Cuan!o 4s cerca es!& r de 8, o O, e1or ser4 el grado de

    relacin lineal. Sie(re ue no e9is!an o%ser$aciones analas.

    3ro(iedades de r

    O, 8,5

    Relacinin$ersa(er'ec!a

    Relacindirec!a

    casi

    (er'ec!a

    Varia%les

    incorreladas

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    15/33

    En!renando el o1o: correlaciones (osi!i$as

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    16/33

    En!renando el o1o: casi (er'ec!as y (osi!i$as

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    17/33

    En!renando el o1o: correlaciones nega!i$as

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    18/33

    3regun!as 'recuen!es %"i r&0 eso 'uiere decir 'ue no las (aria)les son

    independientes*

    En la (r4c!ica0 casi sie(re s20 (ero no !iene(or u& ser cier!o en !odos los casos. Lo con!rario si es cier!o: Inde(endencia

    i(lica incorrelacin.

    Me +a salido r&1- %la relacin es superlineal/sicP*

    QSu(eru& Eso es un error de c4lculo. Sie(re de%e !oar un$alor en!re O, y 8,.

    %A partir de 'u (alores se considera 'ue +a$ )uena relacinlineal/*

    Es di'2cil dar un $alor concre!o +irad los gr4'icos an!eriores/.

    3ara es!e curso digaos ue si rK50 #ay %uena relacin linealy ue si rK50 #ay cier!a relacin +(or decir algo... la cosa esun (oco 4s co(licada: o%ser$aciones analas0.../

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    19/33

    !ros coe'icien!es de correlacin

    Cuando las $aria%les en $e" de ser nu&ricas sonordinales0 es (osi%le (regun!arse so%re si #ay alg?n!i(o de correlacin en!re ellas.

    Dis(oneos (ara es!os casos de dos es!ad2s!icos0aunue no los usareos en clase:

    +@ro/ de S(earan +@!au/ de endall

    No !en&is ue es!udiar nada so%re ellos en es!ecurso. Recordad slo ue son es!ad2s!icos an4logos

    a r y ue los encon!rareis en (u%licaciones donde las$aria%les no (uedan considerarse nu&ricas.

    Maurice George endall

    C#arles Ed>ard S(eara

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    20/33

    Regresin

    El an4lisis de regresin sir$e (ara (redecir una

    edida en 'uncin de o!ra edida +o $arias/. H 6 Varia%le de(endien!e

    (redic#a e9(licada

    6 Varia%le inde(endien!e (redic!ora e9(lica!i$a

    QEs (osi%le descu%rir una relacin H 6 '+/ 8 error

    ' es una 'uncin de un !i(o de!erinado el error es alea!orio0 (eueWo0 y no de(ende de

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    21/33

    Regresin

    El e1e(lo del es!udio de la al!ura en gru(os 'ailiares de

    3earson es del !i(o ue desarrollareos en el res!o del!ea.

    Al!ura del #i1o 6 -7c 8 0,5al!ura del (adre +H 6 -7 8 507 /

    Si el (adre ide 55c Qcu4n!o ide el #i1o Se es(era +(redice/ -7 8 5079556,-7 c. Al!o0 (ero no !an!o coo el (adre. Regresa a la edia.

    Si el (adre ide ,5c Qcu4n!o ide el #i1o Se es(era +(redice/ -7 8 5079,56,7 c.

    Ja1o0 (ero no !an!o coo el (adre. Regresa a la edia.

    Es decir0 nos in!eresareos (or odelos de regresinlineal si(le.

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    22/33

    Modelo de regresin lineal si(le En el odelo de regresin lineal si(le0 dado dos

    $aria%les H +de(endien!e/ +inde(endien!e0 e9(lica!i$a/

    %uscaos encon!rar una 'uncin de muy simple (lineal)

    ue nos (eri!a a(ro9iar H edian!e X 6 %58 %,

    %5+ordenada en el origen0 cons!an!e/ %,+(endien!e de la rec!a/

    H e X rara $e" coincidir4n (or uy %ueno ue sea elodelo de regresin. A la can!idad e6HOXse le denoina residuoo error residual.

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    23/33

    En el e1e(lo de 3earson y las al!uras0 &l encon!r: X 6 %58 %,

    %56-7c +No in!er(re!ar coo al!ura de un #i1o cuyo (adre ide

    5 c YE9!ra(olacin sal$a1eZ %,6507+En edia el #i1o gana 507 c (or cada c del (adre./

    %5

    6-7 c

    %,6507

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    24/33

    La relacin en!re las $aria%les no es e9ac!a. Es na!ural(regun!arse en!onces: Cu4l es la e1or rec!aue sir$e (ara (redecir los $alores de H

    en 'uncin de los de [u& error coe!eoscon dic#a a(ro9iacin +residual/.

    %5

    6-7 c

    %,6507

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    25/33

    El odelo lineal de regresin se cons!ruye u!ili"ando la !&cnica dees!iacin 2nio cuadr4!ica: Juscar %50 %,de !al anera ue se iniice la can!idad

    \iei

    Se co(rue%a ue (ara lograr dic#o resul!ado %as!a con elegir:

    Se o%!iene ade4s unas $en!a1as )de regalo* El error residual edio es nulo La $arian"a del error residual es 2nia(ara dic#a es!iacin.

    Traducido: En !&rino edio no nos eui$ocaos. Cualuier o!raes!iacin ue no coe!a error en !&rino edio0 si es de !i(o lineal0ser4 (eor (or (resen!ar ayor $aria%ilidad con res(ec!o al error edio+ue es cero/.

    xbybS

    Srb

    X

    Y101

    ==

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    26/33

    [ue el error edio de las(redicciones sea nulo nouieredecir ue las (redicciones sean%uenas.

    ;ay ue encon!rar un edio dee9(resar la %ondad del a1us!e+%ondad de la (rediccin/

    Coe!i un errorde 20en su

    ?l!ia (rediccin

    No i(or!a. Con los dos?l!ios clien!es e

    eui$ou& en 310y 3-0.

    En !&rino edio el errores cero.

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    27/33

    QCo edir la %ondad de una regresin

    Iagineos un diagraa de dis(ersin0 y $aos

    a !ra!ar de co(render en (rier lugar u& esel error residual0 su relacin con la $arian"a de H0y de a#20 co edir la %ondad de un a1us!e.

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    28/33

    In!er(re!acin de la $aria%ilidad en H

    HEn (rier lugar ol$ideos ue e9is!e la$aria%le . Veaos cu4l es la $aria%ilidaden el e1e H.

    La 'ran1a so%reada indica la "ona donde$ar2an los $alores de H.

    3royeccin so%re el e1e H 6 ol$idar

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    29/33

    In!er(re!acin del residuo

    H

  • 7/17/2019 Estadstica N 08 Regresion Lineal

    30/33

    Resuiendo:

    =La dis(ersin del error residual ser4 una 'raccinde la dis(ersin original de H

    =Cuan!o enor sea la dis(ersin del error residuale1or ser4 el a1us!e de regresin.

    Eso #ace ue de'inaos coo edida de%ondad de un a1us!e de regresin0o coe'icien!e de de!erinacin a:

    Jondad de un a1us!e

    2

    2

    2

    1Y

    e

    S

    S

    R =

    H

    22 Ye SS