Regresión Lineal Simple

22
An´ alisis de regresi ´ on Jessica Mar´ ıa Rojas Mora [email protected] March 5, 2014 Jessica Mar´ ıa Rojas Mora () Estad´ ıstica March 5, 2014 1 / 22

description

Clase de regresion lineal simple con todas las indicaciones

Transcript of Regresión Lineal Simple

  • Analisis de regresion

    Jessica Mara Rojas [email protected]

    March 5, 2014

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 1 / 22

  • En que consiste el analisis deregresion?

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 2 / 22

  • Analisis de regresionTecnica estadstica para investigar y modelar la relacion entre varibles.

    Modelo de regresion lineal

    yi = 0 + 1x1 ++2x2 + ++nxn + i

    yi : i-esima variable respuesta ( o dependiente)xi : valor de la i-esima variable explicativa, regresora o predictora.

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 3 / 22

  • Etapas del analisis de regresionEstimacion de los parametros desconocidos en el modelo deregresion 0 y 1Comprobacion de la adecuacion del modeloRealizar predicciones

    Usos de los modelos de regresionDescripcion de datosEstimacion de parametrosPrediccion y estimacionControl

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 4 / 22

  • Regresion Lineal Simple

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 5 / 22

  • Regresion Lineal Simple

    Modelo con un solo regresor que tiene una relacion con una respuestay donde la relacion es una linea recta. El modelo esta dado por:

    yi = 0 + 1xi + i

    yi : i-esima variable respuesta ( o dependiente)xi : valor de la i-esima variable explicativa, regresora o predictora.0 : Ordenada al origen (o intercepto)1 : pendientei : diferencia entre el valor observado y el valor (0 + 1xi)

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 6 / 22

  • Supuestos del modelo de regresion

    SupuestosLos errores tienen promedio cero y varianza 2

    Los errores no estan correlacionados, es decir, que el valor de unerror no depende de cualquier otro error.

    Interpretacion de los coeficientes del modelo1 : cambio de la media de la distribucion de y producido por uncambio unitario en la variable predictora x0 : es la media de la distribucion de la respuesta cuando elintervalo de los datos incluye el valor cero, en caso contrario 0 notiene interpretacion practica.

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 7 / 22

  • Estimacion de los parametros en el modelo deregresion

    Estimacion por mnimos cuadrados

    0 = y 1x

    1 =SxyS2x

    dondey : denota la media muestral para la variable respuestax : denota la media muestral para la variable regresoraSxy : covarianza entre las variables x, yS2x : denota la varianza de la variable regresora.

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 8 / 22

  • Aplicacion

    Se desea modelar la esperanza de vida (edv) en funcion del productointerno bruto por habitante (pibh), los datos que se presentan acontinuacion corresponden a los valores de estas variables para 9paises:

    pibh edv2130 7120780 771794 711050 752096 683220 6920765 751899 6115025 75

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 9 / 22

  • Aplicacion

    Se desea estudiar el efecto que tiene el tamano poblacional sobre lasconcentraciones de ozono. Los siguientes datos consisten de lapoblacion (en millones de habitantes) y de la cantidad de ozonopresente (en ppmm/hora) en 10 ciudades.

    Pob 0.6 1.9 0.2 0.5 1.1 0.1 1.1 0.6 2.3 2.2Ozo 126 135 124 128 130 121 126 128 129 128

    Ajuste y explique el modelo de regresion lineal que permitaestimar las cantidades de ozono.Estime la cantidad de ozono para una ciudad cuyo tamanopoblacional es de: 1, 1.3 y 1.5 millones de habitantes.

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 10 / 22

  • Ajuste de modelos en r

    Digitar los datosPoblacion=c(0.6,1.9,0.2,0.5,1.1,0.1,1.1,0.6,2.3,2.2)

    Ozono=c(126, 135, 24,128,130,121,126,128,129,128)

    Estadsticas de resumensummary(Poblacion)Min. 1st Qu. Median Mean 3rd Qu. Max.0.100 0.525 0.850 1.060 1.700 2.300

    summary(Ozono)Min. 1st Qu. Median Mean 3rd Qu. Max.24.0 126.0 128.0 117.5 128.8 135.0

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 11 / 22

  • Ajuste de modelos en r

    Diagrama de dispersionplot(Poblacion, Ozono)

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 12 / 22

  • Ajuste de modelos en r

    Ajuste del modelo y estimacion de parametrosmodelo=lm(OzonoPoblacion)Ecuacion de regresion estimada

    Ozono= 98.92 +17.53 Poblacion La ecuacion anterior se utilizapara hacer predicciones relacionadas con la cantidad de Ozono enfuncion de la poblacion.

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 13 / 22

  • Ajuste de modelos en r

    summary(modelo)

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 14 / 22

  • Ajuste de modelos en r

    Recta de ajusteabline(modelo)

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 15 / 22

  • Ajuste de modelos en r

    intervalo de confianza para los parametros del modeloconfint(modelo,level=0.95)

    Tabla de analisis de varianzaanova(modelo)Se utiliza para examinar la significancia de los parametros del modelo.

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 16 / 22

  • Validacion de los supuestos del modelo

    Errores o residuales del modeloPrueba formal: shapiro.test(modelo)residuales=residuals(modelo);qqnorm(residuales);qqline(residuales)

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 17 / 22

  • Cargar bases de datos en r

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 18 / 22

  • data.frame(Variable1,Variable2)read.table(file.choose(),header=TRUE)read.csv(file.choose(),header=TRUE)

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 19 / 22

  • Los datos coresponden a la precipitacion total durante el ano 1986 en133 estaciones pluviometricas del departamento de Cundinamarca.

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 20 / 22

  • Jessica Mara Rojas Mora () Estadstica March 5, 2014 21 / 22

  • poblacion poblaciongiph:= Producto Interno Bruto por habitanteripo:= tasa de aumento de la poblacionrupo:= tasa de poblacion urbanaRLPO:= tasa de analfabetismo en la poblacionRSPO:= tasa de estudiantes de la poblacionELTP:= tiempo de vida esperado de personasrnnr:= ritmo de las necesidades nutricionales realizadonunh:= numero de periodicos y revistas por cada 1000 habitantesnuth numero de personas que ven la television por 1.000habitantes

    Jessica Mara Rojas Mora () Estadstica March 5, 2014 22 / 22