Regresion Lineal Simple y Multiple

37
ESTADISTICA INFERENCIAL II I.T.S.CH 1. REGRESION LINEAL SIMPLE Regresión lineal simple. Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta. Cuando la relación lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Y x y, según lo establecido, se tendrá De manera equivalente, otra formulación del modelo de regresión lineal simple sería: si x i es un valor de la variable predictora e Y i la variable respuesta que le corresponde, entonces E i es el error o desviación aleatoria de Y i . Definición VALOR MEDIO. Constante que representa el centro de gravedad de la ley de probabilidad de una variable aleatoria y que, en casos de notable simetría en la función de densidad, puede interpretarse que dicha constante nos señala la zona donde se sitúan los valores de máxima probabilidad de la variable aleatoria. El valor medio o valor esperado de una variable aleatoria X se define como

description

muestra los tipos de regresiones lineales tales como los simple y multiples

Transcript of Regresion Lineal Simple y Multiple

ESTADISTICA INFERENCIAL II I.T.S.CH

1. REGRESION LINEAL SIMPLE

Regresin lineal simple. Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr

De manera equivalente, otra formulacin del modelo de regresin lineal simple sera: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviacin aleatoria de Yi .Definicin VALOR MEDIO. Constante que representa el centro de gravedad de la ley de probabilidad de una variable aleatoria y que, en casos de notable simetra en la funcin de densidad, puede interpretarse que dicha constante nos seala la zona donde se sitan los valores de mxima probabilidad de la variable aleatoria. El valor medio o valor esperado de una variable aleatoria X se define como

Siempre que dicho valor exista, donde f es la funcin de densidad de la variable.

Estimacin de parmetros.

En un grupo de 8 pacientes se miden las cantidades antropomtricas peso y edad, obtenindose los siguientes resultados: Resultado de las mediciones

edad1281011771014

peso5842515440394956

Existe una relacin lineal importante entre ambas variables? Calcular la recta de regresin de la edad en funcin del peso y la del peso en funcin de la edad. Calcular la bondad del ajuste En qu medida, por trmino medio, vara el peso cada ao? En cunto aumenta la edad por cada kilo de peso? Solucin: Para saber si existe una relacin lineal entre ambas variables se calcula el coeficiente de correlacin lineal, que vale:

Ya que

Por tanto el ajuste lineal es muy bueno. Se puede decir que el ngulo entre el vector formado por las desviaciones del peso con respecto a su valor medio y el de la edad con respecto a su valor medio, , es:

es decir, entre esos vectores hay un buen grado de paralelismo (slo unos 19 grados de desviacin). La recta de regresin del peso en funcin de la edad es

La recta de regresin de la edad como funcin del peso es

que como se puede comprobar, no resulta de despejar en la recta de regresin de Y sobre X. La bondad del ajuste es

Por tanto podemos decir que el de la variabilidad del peso en funcin de la edad es explicada mediante la recta de regresin correspondiente. Lo mismo podemos decir en cuanto a la variabilidad de la edad en funcin del peso. Del mismo modo puede decirse que hay un de varianza que no es explicada por las rectas de regresin. Por tanto la varianza residual de la regresin del peso en funcin de la edad es

y la de la edad en funcin del peso: Por ltimo la cantidad en que vara el peso de un paciente cada ao es, segn la recta de regresin del peso en funcin de la edad, la pendiente de esta recta, es decir, b1=2,8367 Kg/ao. Cuando dos personas difieren en peso, en promedio la diferencia de edad entre ambas se rige por la cantidad b2=0,3136 aos/Kg de diferencia.

1.11 PRUEBA DE HIPOTESIS EN LA REGRESION LINEAL SIMPLE

1.1.2 CALIDAD DEL AJUSTE EN REGRESION LINEAL SIMPLE

1.1.3 ESTIMACION Y PREDICCION POR INTERVALOS EN REGRESION LINEAL SIMPLE

Medicin de la adecuacin del modelo de regresin. - Anlisis residual

1.4 USO DE SOFTWARE ESTADISTICO

1.2 REGRESION LINEAL MULTIPLE

1.2.1 PRUEBAS DE HIPOTESIS EN REGRESION LINEAL MULTIPLE

1.2.2 INTERVALOS DE CONFIANZA Y PREDICCION EN REGRESION MULTIPLE

1.2.3 USO DE SOFTWARE ESTADISTICO

1.3 REGRESION NO LINEAL

En estadstica, la regresin no lineal es un problema de inferencia para un modelo tipo:y = f(x, ) + Basado en datos multidimensionales x, , donde f es alguna funcin no lineal respecto a algunos parmetros desconocidos . Como mnimo, se pretende obtener los valores de los parmetros asociados con la mejor curva de ajuste (habitualmente, con el mtodo de los mnimos cuadrados). Con el fin de determinar si el modelo es adecuado, puede ser necesario utilizar conceptos de inferencia estadstica tales como intervalos de confianza para los parmetros as como pruebas de bondad de ajuste.El objetivo de la regresin no lineal se puede clarificar al considerar el caso de la regresin polinomial, la cual es mejor no tratar como un caso de regresin no lineal. Cuando la funcin f toma la forma:f(x) = ax2 + bx + cla funcin f es no lineal en funcin de x pero lineal en funcin de los parmetros desconocidos a, b, y c. Este es el sentido del trmino "lineal" en el contexto de la regresin estadstica. Los procedimientos computacionales para la regresin polinomial son procedimientos de regresin lineal (mltiple), en este caso con dos variables predictoras x y x2. Sin embargo, en ocasiones se sugiere que la regresin no lineal es necesaria para ajustar polinomios. Las consecuencias prcticas de esta mala interpretacin conducen a que un procedimiento de optimizacin no lineal sea usado cuando en realidad hay una solucin disponible en trminos de regresin lineal. Paquetes (software) estadsticos consideran, por lo general, ms alternativas de regresin lineal que de regresin no lineal en sus procedimientos.Mtodos Numricos para Regresiones No LinealesRegresin ExponencialEn determinados experimentos, en su mayora biolgicos, la dependencia entre las variables X e Y es de forma exponencial, en cuyo caso interesa ajustar a la nube de puntos una funcin del tipo:

Mediante una transformacin lineal, tomando logaritmos neperianos, se convierte el problema en una cuestin de regresin lineal. Es decir, tomando logaritmos neperianos:

EjemploxyIn yx2x InyIn y2

131,098611,09861,2069

1,23,41,22371,441,46841,4974

1,551,60942,252,41412,5901

220,693141,38620,4803

34,11,410994,23271,9906

3,751,609413,695,95472,5901

471,9459167,78363,7865

4,56,51,871820,258,42313,5056

20,9 36 11,4628 67,63 32,7614 17,6455

Numero de datos = n = 8

x promedio = = = 2,6125

y promedio = = = 1,43285

Usando la forma lineal de la Regresin Exponencial:

b = = = 0,216047

= 1,43285 - (0,216047)(2,6125) = 0,868427

a = eb = e0,216047 = 2,38316La ecuacin final que modela el sistema es

Regresin LogartmicaLa curva logartmica es tambin una recta, pero en lugar de estar referida a las variables originales e , est referida a y a Ejemploxyln xln x2ln x * yy2

130009

1.23.40.18230.03320.619811.56

1.550.40540.16432.02725

220.69310.48031.38624

34.11.09861.20694.504216.81

3.751.30831.71166.541525

471.38621.92159.703449

4.56.51.50402.26209.77642.25

20.9 36 6.5779 7.7798 34.5581 182.62

n=8

a = = = 2.090513

b = = 4.5 - (2.090513)(0.8222) = 2.78117

La ecuacin final que modela el sistema es

Regresin PolinomialAlgunas veces cuando la relacin entre las variables dependientes e independientes es no lineal, es til incluir trminos polinomiales para ayudar a explicar la variacin de nuestra variable dependiente.Las regresiones polinomiales se pueden ajustar la variable independiente con varios trminos

Ejemploxyxyx2y2x2yx3x4

13319311

1.23.44.081.4411.564.8961.7282.0736

1.557.52.252511.253.3755.0625

224448816

34.112.3916.8136.92781

3.7518.513.692568.4550.653187.4161

4728164911264256

4.56.529.2520.2542.25131.62591.125410.0625

20.9 36 106.63 67.63 182.62 376.121 246.881 958.6147

Usando una Matriz para calcular valores de los coeficientes

Usando el mtodo de Eliminacin de Gauss-Jordan

La ecuacin final que modela el sistema es

LinealizacinAlgunos problemas de regresin no lineal pueden linealizarse mediante una transformacin en la formulacin del modelo. Por ejemplo, consideremos el problema de regresin no lineal (ignorando el trmino de error):