Estad Stica b Sica Aplicada 4a Ed Cap Tulo 6 Medidas de Tendencia Central
M aster en Estad stica Aplicada Departamento de Estad ...
Transcript of M aster en Estad stica Aplicada Departamento de Estad ...
Master en Estadıstica Aplicada
Departamento de Estadıstica e I.O.
Universidad de Granada
“Modelizacion de curvas de rentabilidad del IBEX 35 basada en
Analisis en componentes principales funcional”
Trabajo Fin de Master presentado por:
Oscar Gonzalez Frutos
Dirigidos por los Profesores:
Dr. Mariano Valderrama Bonnet
Dr. Manuel Escabias Machuca
Setiembre de 2016
Introduccion
En el ambito de la estadıstica multivariable muchas veces nos encontramos con
grandes cantidades de datos, ası como tambien de variables que son medibles en el tiempo
como las series cronologicas. La situacion se complica cuando se dispone de variables que
estan altamente correladas que normalmente ocurre con las series temporales o cuando los
datos no son numerables como es el caso de los procesos estocasticos en tiempo continuo.
El Analisis en Componentes Priciples (ACP) es probablemente la tecnica mas po-
pular de la estadıstica multivariada y es utilizada en la mayor parte de las disciplinas
cientıficas en las que se manejan informacion cuantitativa cuyo objetivo es realizar trans-
formaciones lineales para obtener un conjunto de variables de menor dimension. El metodo
Analisis Funcional en componentes Principales (AFCP) es una extension del ACP clasico
en el que las componentes principales estan representadas por funciones y no por vectores.
En este trabajo el objetivo es modelizar la serie del Ibex a partir de las empresas
que la componen. Los datos que se utilizara son del El IBEX 35 que es el principal ındice
bursatil de referencia de la bolsa espanola elaborado por Bolsas y Mercados Espanoles
(BME). Esta formado por las 35 empresas con mas liquidez que cotizan en el Sistema
de Interconexion Bursatil Electronico (SIBE) en las cuatro bolsas espanolas (Madrid,
Barcelona, Bilbao y Valencia).
En el Capıtulo 1 tenemos una introduccion al ADF, empezando con la definicion, los
objetivos del ADF como tambien la representacion funcional a partir de datos discretos
i
y estudiando algunas bases de funciones usuales, enfatizando en los splines cubicos, que
es lo que se utilizara en este trabajo para la aproximacion de las funciones.
En el Capıtulo 2 la aproximacion de los coeficientes basicos, dependiendo de que el
predictor sea observado con error o sin error, luego el Capıtulo 3 sobre las teorıas AFCP,
resaltando el proceso estocastico de segundo orden que sera la base para el AFCP y sus
estimaciones puntuales como la media, la covarianza , sus valores y factores principales.
El Capıtulo 4 desarrollamos las teorıas mas importante del Analisis de Regresion
Multiple, porque aplicaremos esta tecnica luego de obtener las componentes principales
para estudiar la relacion existente entre la empresa Ibex con las demas empresas en
terminos de las componentes principales como la estimacion de los parametros, ajuste,
contrastes de significacion y prediccion.
Actualmente existen numerosos paquetes implementados en el programa estadısti-
co R que tienen incorporado el metodo del analisis en componentes principales, en este
trabajo se empleo fundamentalmente el paquete fda, en el Capıtulo 5 tenemos una des-
cripcion basica del paquete fda resaltando lo mas importante ası como tambien algunos
ejemplos implementados en R.
En el Capıtulo 6 entramos en la parte de la aplicacion real de la teorıa desarrollada en
los capıtulos anteriores estudiando las cotizaciones diarias en la bolsa espanola, utilizando
Regresion Lineal Multiple en terminos de las componentes principales funcionales y por
ultimo aproximamos las curvas del Ibex, mediante las funciones obtenidas.
Oscar Gonzalez Frutos ii
Indice general
Introduccion I
Indice general III
1 Analisis de datos funcionales 1
1.1 Representacion de datos funcionales . . . . . . . . . . . . . . . . . . . . . 3
1.2 Bases de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Estimacion de los coeficientes basicos 10
2.1 Aproximacion por mınimos cuadrados . . . . . . . . . . . . . . . . . . . . 11
2.2 Interpolacion B-splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3 Proyeccion ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Analisis funcional en componentes principales 16
3.1 Procesos estocasticos de segundo orden . . . . . . . . . . . . . . . . . . . 16
3.2 Analisis en componentes principales de un proceso estocastico . . . . . . 17
iii
Indice general
3.3 Estimacion puntual del AFCP . . . . . . . . . . . . . . . . . . . . . . . . 20
4 Analisis de regresion multiple 23
4.1 Estimacion de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.2 Bondad de Ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3 Contrastes de significacion . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4 Prediccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5 Analisis de datos funcionales en R 35
5.1 Descripcion basica del paquete fda . . . . . . . . . . . . . . . . . . . . . 36
5.2 Implementacion en el programa R . . . . . . . . . . . . . . . . . . . . . . 38
6 Aplicacion del AFCP 44
6.1 Descripcion de la base de datos . . . . . . . . . . . . . . . . . . . . . . . 44
6.2 Tratamiento de datos funcionales . . . . . . . . . . . . . . . . . . . . . . 46
6.3 Ajustes de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
6.4 Validacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Bibliografıa 56
Oscar Gonzalez Frutos iv
Capıtulo 1
Analisis de datos funcionales
Analisis de datos funcionales (ADF) es una tecnica muy reciente en el ambito de la
estadıstica que trabaja con muestras de funciones aleatorias, la herramienta estadıstica
que sustenta de manera teorica el analisis de datos funcionales es la de los procesos
estocasticos.
En la practica se dispone de observaciones discretas de las curvas muestrales a partir
de las cuales se reconstruye la forma funcional. De este modo se mantienen las propiedades
de las variables continuas y por ende se pierde menos informacion. Una de las ventajas
mas importantes del ADF, es que tiene hipotesis menos exigentes comparados con otras
tecnicas clasicas como analisis de series temporales que imponen, entre otras hipotesis,
que el proceso sea estacionario, las observaciones igualmente espaciadas y la pertenencia
del proceso a una clase especıfica.
En general, cualquier observacion de una magnitud continua como el tiempo u otros
se puede tomar como un dato funcional, pero la definicion formal de una variable aleatoria
funcional la encontramos en Ferraty and Vieu (2006) que dice:
Definicion 1.1 Una variable aleatoria X definida sobre un espacio de probabilidad (Ω, A, P )
se dice que es funcional si toma valores en un espacio funcional, es decir, un espacio nor-
1
Capıtulo 1. Analisis de datos funcionales
mado o seminormado completo. El espacio mas utilizado en datos funcionales, que es el
que vamos a considerar en este trabajo, es el espacio L2[T ] de las funciones de cuadrado
integrable en el intervalo real T definido por:
L2(T ) =
f : T −→ < :
∫T
f 2(t)dt <∞,
con el producto escalar usual dado por:
〈f, g〉 =
∫T
f(t)g(t)dt ∀f, g ∈ L2(T ) (1.1)
donde L2(T ) tiene estructura de espacio de Hilbert.
Cuando nos referimos al espacio L2(T ) podemos imaginar que estamos trabajando
con un vector de infinitas componentes, una para cada valor t ∈ <. El producto escalar
entonces sera la suma del producto de las infinitas componentes de f y g. Teniendo en
cuenta que la distancia entre componente y componente es infinitesimal, el producto
escalar se expresa a traves de integrales.
Los objetivos de analisis de datos funcionales son esencialmente las mismas que las de
cualquier otra rama de la estadıstica, vease Ramsay and Silverman (2005). A continuacion
detallamos esos objetivos:
• Representar los datos de manera que ayuden a un analisis mas detallado.
• Mostrar los datos con el fin de poner de relieve varias caracterısticas.
• Estudiar la presencia de patrones y variaciones entre los datos.
• Explicar la variacion en una variable dependiente (output) en terminos de la informa-
cion proporcionada por una variable independiente (input).
Oscar Gonzalez Frutos 2
Capıtulo 1. Analisis de datos funcionales
• Comparar dos o mas series de datos con respecto a ciertos tipos de variacion, donde dos
conjuntos de datos puedan tener distintas replicas de las mismas funciones, o distintas
funciones para un conjunto de replicas comunes.
Como dijimos al principio el analisis de datos funcionales tiene diversas aplicacio-
nes y podemos encontrar por ejemplo en Valderrama et al. (2000) donde se construye
un modelo PCP para predecir la rentabilidad en la Bolsa de Madrid de los tıtulos del
sector Bancos a partir de series cronologicas de seis bancos muestreados aleatoriamente
de dicho grupo. Otros ejemplos interesantes de datos funcionales aparecen en Mitsch and
James (2000) y Rice and Wu (2001). El libro de Ramsay and Silverman (2002) considera
diferentes aplicaciones para ilustrar la forma funcional de datos, tiene una amplia gama
de temas como la criminologıa, la economıa, la arqueologıa, la reumatologıa, la psicologıa,
la biomecanica y la educacion, entre otros.
1.1 Representacion de datos funcionales
El primer paso en ADF es reconstruir la verdadera forma funcional de las curvas
muestrales a partir de sus observaciones discretas. El modo mas usual de resolver este
problema consiste en asumir un desarrollo de cada curva muestral en terminos de una
base de funciones y aproximar los coeficientes basicos utilizando un suavizado o una
interpolacion.
Definimos ahora la variable funcional X que es un proceso estocastico de una mag-
nitud continua X(t) : t ∈ T. Se dice que es de segundo orden si todas sus variables
pertenecen al espacio L2(T ) de cuadrado integrable con el producto escalar usual dado
por la Ecuacion 1.1, es decir,
〈f, g〉 =
∫T
f(t)g(t)dt ∀f, g ∈ L2(T )
Oscar Gonzalez Frutos 3
Capıtulo 1. Analisis de datos funcionales
Ademas, un proceso estocastico de segundo orden X(t), t ∈ T es continuo de media
cuadratica si verifica:
lımh−→0
E[(X(t+ h)−X(t))2
]= 0, ∀t ∈ T
Las curvas muestrales en la practica son observadas como conjuntos de puntos finitos
como por ejemplo el tiempo puede ser observado en dıas, meses o anos, la idea es recons-
truir esas trayectorias muestrales a partir de las observaciones discretas con el objetivo
de obtener el mejor ajuste a partir de los datos, conviene destacar tambien que los datos
no necesariamente tienen que estar igualmente espaciados ni que tengan registros en los
puntos considerados.
Consideremos ahora una muestra de trayectorias muestrales x1(t), x2(t), ..., xn(t) que
se puede ver como las observaciones de un proceso estocastico X(t) : t ∈ T. A partir
de ahora, vamos a suponer que este proceso estocastico es de segundo orden, continuo en
media cuadratica y las funciones pertenecen al espacio de Hilbert L2(T ) de funciones de
cuadrado integrable.
Dado que en la practica es imposible observar un conjunto de funciones de manera
continua en el tiempo, sin embargo, en lugar de eso por lo general podemos obtener ob-
servaciones de tales funciones en diferentes momentos del tiempo ti0, ti1, ..., timi∈ T, i =
1, ..., n y con un numero diferente de observaciones para cada individuo, es decir, la in-
formacion de la muestra esta dada por los vectores xi = (xi0, xi1, ..., ximi)′ siendo xik el
valor observado de la trayectoria de la muestra en el momento tik(k = 0, ...,mi).
Con el fin de reconstruir la forma funcional de las trayectorias muestrales se con-
sideraran representaciones de las curvas muestrales en terminos de base de funciones.
Para reconstruir la forma funcional de las trayectorias muestrales a partir de los datos
discretos observados, se pueden utilizar varios metodos dependiendo del modo en que se
han obtenido dichos datos en tiempo discreto y la forma que esperamos que tengan las
Oscar Gonzalez Frutos 4
Capıtulo 1. Analisis de datos funcionales
funciones. En cualquier caso, es usual suponer que las trayectorias muestrales pertenecen
a un espacio de dimension finita generado por una base φ1(t), ..., φp(t), de modo que se
pueden expresar como:
xi(t) =
p∑p=1
aipφp(t) i = 1, ..., n (1.2)
1.2 Bases de funciones
Generalmente se utilizan las bases de B-splines porque tienen un mejor comporta-
miento local que las trigonometricas y polinomicas, de ahı su popularidad, siendo las mas
utilizadas los splines cubicos que son adecuadas para el caso de trayectorias regulares, sin
embargo, la eleccion depende de la naturaleza de los datos muestrales. A continuacion se
detallan las bases de funciones mas utilizadas.
A) B-splines
Las bases mas utilizadas para datos no periodicos son los B-splines, son curvas po-
linomicas unidas a trozos que tienen una forma suave y continuamente diferenciables,
existen muchas maneras de construir estas funciones, pero la mas popular son los
sistemas de bases B-spline desarrollado por De Boor et al. (1978) y esta implemen-
tado en una amplia gama de lenguajes de programacion, incluyendo R, S-PLUS y
MATLAB.
Existe un metodo recursivo utilizando el algoritmo De Boor que permite obtener las
funciones B-Spline de orden r a partir de las de orden r − 1, despues de ampliar la
particion de nodos originales en la forma t−3 < t−2 < t−1 < t0 < ... < tk < tk+1 <
tk+2 < tk+3, dado por
Bi,1(t) =
1 ti−2 ≤ t ≤ ti−1, i = −1, 0, 1, ..., k + 4
0 otro caso
Oscar Gonzalez Frutos 5
Capıtulo 1. Analisis de datos funcionales
Bi,r(t) =t− ti−2
ti+r−3 − ti−2Bi,r−1(t) +
ti+r−2 − tti+r−2 − ti−1
Bi+1,r−1(t)
r = 2, 3, ...; i = −1, 0, ..., k − r + 5
(1.3)
Para splines cubicos, vease en Valderrama et al. (2000), tienen nodos igualmente
espaciados dentro del intervalo [0, T ], es decir, tj = h × j, siendo h = T/k, si bien
esta condicion de equidistancia entre nodos no es, en absoluto, necesaria. Denotemos
S3(π) al espacio de dimension k + 3 de los splines cubicos sobre la particion π y
consideraremos en el la base de B-splines, los cuales, insertando seis nodos adicionales
en π : t−3 < t−2 < t−1 < t0 < ... < tk < tk+1 < tk+2 < tk+3, se definen de la forma:
Bi(t) =
(t− ti−2)3/h3, t ∈ [ti−2, ti−1]
1 + 3h−1(t− ti−1) + 3h−2(t− ti−2)2 − 3h−3(t− ti−1)3, t ∈ [ti−1, ti]
1 + 3h−2(ti+1 − t) + 3h−2(ti+1 − t)2 − 3h−3(ti+1 − t)3, t ∈ [ti, ti+1]
(ti+2 − t)3/h3, t ∈ [ti+1, ti+2]
0, t 6∈ [ti−2, ti+2]
Ası, la base de S3(π) sera B−1(t), B0(t), B1(t), ..., Bk(t), Bk+1(t), y facil observar
que todas estas funciones pertenecen a la clase C2[0, T ]; ademas verifican:
Bi(tj) =
4, si j = 1
1, si j = 1 o j = i+ 1
0, si j 6= i, i− 1, i+ 1
Por tanto, cada trayectoria del proceso se interpola en los puntos (tj, Xw(tj) mediante
el spline cubico
IXw(t) =k+1∑i=−1
γi(w)Bi(t) (1.4)
Oscar Gonzalez Frutos 6
Capıtulo 1. Analisis de datos funcionales
Para que este problema de tipo interpolatorio tenga solucion unica es necesario anadir
como condicion adicional que todas las funciones muestrales del proceso admitan
derivada de segundo orden en los extremos del intervalo [0, T ].
Podemos observar un ejemplo en la Figura 1.1 B-splines definido en el intervalo [0, 10],
que tienen polinomios de orden 2, orden 3 y orden 4 respectivamente construidos en el
programa R. El que corresponde a splines cubicos es la que tiene polinomio de orden
4.
0 2 4 6 8 10
0.0
0.2
0.4
0.6
0.8
1.0
Orden 2
t
B(t
)
0 2 4 6 8 10
0.0
0.2
0.4
0.6
0.8
1.0
Orden 3
t
B(t
)
0 2 4 6 8 10
0.0
0.2
0.4
0.6
0.8
1.0
Orden 4
t
B(t
)
Figura 1.1: B- Splines igualmente espaciados de diferentes ordenes en el intervalo [0, 10].
B) Bases de Fourier
Generalmente las bases de Fourier son utilizadas cuando las trayectorias a estimar
son regulares y periodicas, sin embargo, presentan inconvenientes cuando se sospecha
que existe algun grado de discontinuidad en las trayectorias a aproximar. Esta dada
por la siguiente expresion:
1, sin(ωt), cos(ωt), sin(2ωt), cos(2ωt), ..., sin(kωt), cos(kωt), ....
Oscar Gonzalez Frutos 7
Capıtulo 1. Analisis de datos funcionales
En la figura Figura 1.2 podemos observar K = 5 funciones de base de Fourier cons-
truido en el programa R con un perıodo de 12.
0 2 4 6 8 10 12
−0.
4−
0.2
0.0
0.2
0.4
t
B(t
)
Figura 1.2: Funciones de base de Fourier construido en el programa R con un perıodo de 12
C) Bases wavelets
Mencionaremos ahora a las bases wavelets que son muy utilizadas como funciones
basicas a la hora de representar los datos funcionales. Una base de wavelets se obtiene
mediante dilataciones y traslaciones de una funcion madre apropiada φ
φkj(t) = 2k/2φ(2ky − j),
con h, j y k enteros. A diferencia de las bases de Fourier, las bases wavelests no
asumen que los datos sean periodicos. Se utilizan sobre todo para representar curvas
muestrales con un caracter local muy fuerte.
Oscar Gonzalez Frutos 8
Capıtulo 1. Analisis de datos funcionales
D) Bases de potencias y exponenciales
Las bases de funciones compuestas por monomios que se utilizan para construir series
de potencias y tiene la siguiente forma:
1, t, t2, ..., tk, ... k = 1, 2, ...
Los sistemas de base exponencial consisten en una serie de funciones exponenciales,
eλ1t, eλ2t, ..., eλjt j = 1, 2, ...
donde, los parametros λj son todos distintos, y a menudo λ1 = 0. Las ecuaciones
diferenciales lineales con coeficientes constantes tienen como soluciones, expansiones
en terminos de bases exponenciales.
Oscar Gonzalez Frutos 9
Capıtulo 2
Estimacion de los coeficientes basicos
Despues de elegir la base adecuada para la forma funcional de las trayectorias mues-
trales se pueden presentar dos tipos de observaciones que pueden ser: con error o sin
error.
Si el predictor es observado con error tendrıa la siguiente forma:
xik = xi(tik) + εk k = 0, ...,mi, (2.1)
Se supone que εk tiene media cero, varianza constante, y la covarianza cero para valores
de argumentos distintos, para la aproximacion de los coeficientes basicos podemos uti-
lizar algun metodo de suavizacion como aproximacion mınimos cuadrados o proyeccion
ortogonal.
Por otro lado, si tenemos en cuenta que los datos se observan sin error en este caso
podrıamos utilizar algun metodo de interpolacion como por ejemplo los splines cubicos.
La ecuacion tendrıa la siguiente forma:
xik = xi(tik) k = 0, ...,mi, (2.2)
10
Capıtulo 2. Estimacion de los coeficientes basicos
Ambos metodos, suavizacion e interpolacion, nos permiten obtener la forma funcio-
nal de las trayectorias muestrales mediante la aproximacion de los coeficientes basicos aip
de la Ecuacion 1.2 a partir de las observaciones discretas.
A continuacion presentamos los diferentes metodos de aproximacion de los coeficien-
tes basicos.
2.1 Aproximacion por mınimos cuadrados
Mınimos cuadrados es una tecnica de analisis numerico enmarcada dentro de la op-
timizacion matematica, se intenta encontrar la funcion continua, dentro de dicha familia,
que mejor se aproxime a los datos (un “mejor ajuste”), de acuerdo con el criterio de
mınimo error cuadratico.
Supongamos que tenemos observaciones para una sola curva,
yi = xti + ε
y queremos estimar,
x(t) ≈k∑j=1
cjφj(t)
la idea de la aproximacion de mınimos cuadrados consiste en minimizar la suma de los
errores al cuadrado de:
SSE =n∑i=1
(yi − x(ti))2 =
n∑i=1
(yi − Φ(ti)c)2
Para el ajuste de curvas a los datos discretos xik, utilizamos la Ecuacion 2.1, se
consideraran que los errores son independientes y estan identicamente distribuidos. Ex-
Oscar Gonzalez Frutos 11
Capıtulo 2. Estimacion de los coeficientes basicos
presando en terminos de bases de funciones tenemos la Ecuacion 1.2, es decir,
xi(tk) =
p∑p=1
aipφp(tk) k = 0, ..., K i = 1, ..., N
expresando en forma matricial tenemos,
xi = Φiai (2.3)
donde ai = (ai1, ..., aip)′ y Φi = (φ(tk))K×P y xi el vector que representa a los vectores con
los datos discretos observados como xi = (xi1, ..., xik)′, donde los coeficientes de la expre-
sion basica, aip, se aproxima mediante el criterio de mınimos cuadrados. Matricialmente
viene dado por:
ECM(xi|ai) = (xi − Φiai)′(xi − Φiai)
derivando con respecto a ai e igualando a cero se obtiene,
2ΦΦ′iai − 2Φ′ixi = 0
una vez resuelto esta ecuacion para ai, tenemos el estimador de mınimos cuadratico del
vector de coeficientes basicos ai dado por:
ai = (Φ′iΦi)−1Φ′ixi
y por ultimo se ha calculado el vector xi con los valores aproximados y la curva ajustada
por:
xi = Φiai = Φi(Φ′iΦi)
−1Φ′ixi
de modo que cada curva muestral es aproximada por:
xi(t) = a′iφ(t) (2.4)
Oscar Gonzalez Frutos 12
Capıtulo 2. Estimacion de los coeficientes basicos
2.2 Interpolacion B-splines
Como dijimos anteriormente los splines cubicos son los mas utilizados para datos
no periodicos dado que es la interpolacion mas natural de las trayectorias del proceso
cuando son regulares, es decir continuas y diferenciables. Este metodo sirve cuando los
datos fueron observados sin error representados en la Ecuacion 2.2.
Vamos a considerar los mismos tiempos de observacion t0 < t1 < ... < tk pa-
ra todas las trayectorias muestrales (Ki = K, ∀i). Cuando se realiza interpolacion
spline cubico la curva ajustada pasa por todos los puntos y la dimension de la base
coincide con el numero de las observaciones de cada curva mas dos. Entonces, la fun-
cion spline cubico que interpola a cada una de las trayectorias muestrales xi(t) sobre
los nodos de observacion, se puede expresar en terminos de la base de B-splines cubicos
B−1(t), B0(t), B1(t), ..., Bk(t), Bk+1(t) en la forma
xi(t) =k+1∑j=−1
aijBj(t),
donde los coeficientes basicos se obtienen resolviendo el siguiente sistema de ecuacion
lineal
xik = xi(tk) =k+1∑j=−1
aijBj(tk) k = 0, ...,m. (2.5)
La Ecuacion 2.5 es un sistema de ecuaciones que contiene (m+1) ecuaciones y (m+3)
variables. Dependiendo de las condiciones impuestas, la interpolacion spline cubico recibe
varios nombres. A continuacion mencionamos los distintos nombres y condiciones que
reciben.
A) Spline cubico natural
Es la mas usada y lo que se va considerar en este trabajo, la cual impone que la
derivada de segundo orden del spline de interpolacion sea cero en los nodos extremos
Oscar Gonzalez Frutos 13
Capıtulo 2. Estimacion de los coeficientes basicos
del intervalo [0, T ] , es decir,
x′′i (t0) = 0
x′′i (tk) = 0(2.6)
Aquı si consideramos todas las curvas muestrales para el spline cubico natural x1(t), ..., xn(t)
observadas en los nodos t0, ..., tm, la Ecuacion 2.5 y las condiciones dado en la Ecua-
cion 2.6 nos lleva a XI = AB′ donde A es una matriz cuyas filas son los coeficientes
basicos de cada una de las trayectorias muestrales interpoladas xi(t), XI = (0|χ|0)
con 0 = (0, ..., 0)′ y χn×(m+1) = [xi(tk)], i = 1, ..., n, k = 0, ...,m, con B definido
por:
B =
B2)−1(t0) B
2)0 (t0) · · · B
2)m+1(t0)
B−1(t0) B0(t0) · · · Bm+1(t0)
......
......
B−1(tm) B0(tm) · · · Bm+1(tm)
B2)−1(tm) B
2)0 (tm) · · · B
2)m+1(tm)
(2.7)
donde B2)i (t) es la derivada de segundo orden del i-esimo B-spline en el tiempo t. Al
resolver la Ecuacion 2.7 se obtiene la matriz A con el resultado de la aproximacion
de los coeficientes basicos de todas las trayectorias muestrales, dada por:
A = X(B′)−1
B) Spline cubico periodico
Se llama spline cubico periodico si recibe la condicion
x′i(t1) = x′i(tk)
x′′i (t1) = x′′i (tk)
Oscar Gonzalez Frutos 14
Capıtulo 2. Estimacion de los coeficientes basicos
C) Cuasi natural
Es otro tipo de interpolacion introducida por Escabias et al. (2005) donde se propone
interpolacion cuasi natural, que utiliza valores generados uniformemente (proximos
a cero) como condiciones lımite, donde se abordo problemas de regresion logıstica
funcional y analisis de componentes principales. Aquı la matriz de interpolacion es
XI = (u1|χ|u2) donde tanto u1 como u2 son vectores de valores uniformemente gene-
rados en el intervalo [0, 1].
2.3 Proyeccion ortogonal
Otra tecnica de suavizacion para estimar los coeficientes basicos es la de la proyec-
cion ortogonal que consiste en aproximar cada curva muestral por su proyeccion ortogonal
sobre el subespacio de L2(T ) generado por una base ortonormal φ1(t), ..., φp(t) . Esta
tecnica resulta particularmente adecuada cuando tenemos alguna informacion adicional
sobre la naturaleza de la solucion exacta, vease en Aguilera (1993). La proyeccion orto-
normal de cada curva muestral xi(t) en este subespacio p-dimensional viene dado por:
Pp [xi(t)] =
p∑j=1
[∫T
xi(t)φj(t)dt
]φj(t) i = 1, ..., n j = 1, ..., p
El problema es estimar los coeficientes base aij =∫Txi(t)φj(t)dt a partir de obser-
vaciones en tiempo discreto de las trayectorias muestrales.
Se puede aproximar numericamente y consiste en aplicar metodos de cuadratura
compuesta, como el metodo de integracion de Romberg. Para aplicar este metodo es ne-
cesario aproximar los valores de las funciones muestrales en particiones cada vez mas finas
del intervalo de observacion. Estos valores pueden ser aproximados mediante interpolacion
spline cubica natural, vease en Aguilera et al. (1995).
Oscar Gonzalez Frutos 15
Capıtulo 3
Analisis funcional en componentes
principales
Analisis Funcional en Componentes Principales (AFCP) es una extension del Ana-
lisis en Componentes Principales (ACP) donde las componentes principales estan repre-
sentadas por vectores. Hotelling (1936) definio las componentes principales como combi-
naciones lineales de las variables originales, ası obtenemos un nuevo conjunto de variables
denominadas componentes principales.
El objetivo del ACP clasico es transformar un conjunto de variables originales, en un
nuevo conjunto de variables de menor dimension denominadas componentes principales
que se caracterizan por estar incorreladas entre sı, al igual que para en el caso ACP clasico,
en el AFCP el objetivo es tambien reducir la dimension de las variables del proceso.
3.1 Procesos estocasticos de segundo orden
Dado el proceso estocastico x(t), t ∈ [0, T ] definidos sobre el espacio probabilıstico
(Ω, A, P ), de segundo orden, continuo en media cuadratica y cuyas trayectorias pertenecen
16
Capıtulo 3. Analisis funcional en componentes principales
al espacio de Hilbert L2(T ) de funciones de cuadrado integrable con producto escalar
definido por:
〈f, g〉 =
∫T
f(t)g(t)dt ∀f, g ∈ L2(T )
llamaremos µ(t) a su funcion media y C(t, s) a su funcion covarianza. A continuacion
presentamos las siguientes funciones:
• Funcion media
µ(t) = E[X(t)]
• La funcion de varianza
V (t) = E[(X(t)− µ(t))2]
• La funcion de covarianza
C(t, s) = E[(X(t)− µ(t))(X(s)− µ(s))]
3.2 Analisis en componentes principales de un pro-
ceso estocastico
Sin perdida de generalidad se asume que la funcion media del proceso es constante
e igual a cero, µ(t) = 0 , ∀t ∈ T y si el proceso no fuese centrado se obtendrıa mediante
AFCP del proceso centrado X(t)− µ(t).
Asociado a la funcion de covarianza del proceso C(t, s), se define el operador de
covarianza R : L2(T ) −→ L2(T ) dado por:
R[f(t)] =
∫ T
0
C(t, s)f(s)ds ∀f ∈ L2(T ) (3.1)
Oscar Gonzalez Frutos 17
Capıtulo 3. Analisis funcional en componentes principales
donde el operador R es compacto, autoadjunto y positivo (Deville, 1974). Como conse-
cuencia a estas propiedades, el teorema de Mercer da la siguiente representacion unifor-
memente convergente para la funcion de covarianza.
C(t, s) =∑i
λifi(t)fi(s), ∀t, s ∈ [0, T ], (3.2)
siendo λi la sucesion decreciente de valores propios de C y fi la sucesion de de funciones
propias de C asociadas a los λi que constituyen una base ortonormal en L2[0, T ] . Es
decir, forman un conjunto ortonormal completo de soluciones de la ecuacion
∫ T
0
C(t, s)fi(s)ds = λifi(t)
Entonces se obtiene la siguiente representacion ortonormal del proceso. Sea ξi la
familia de variables aleatorias definida por:
ξi =
∫T
fi(t)X(t)dt
Los componentes principales ξi se definen como combinaciones lineales generaliza-
das de la variable funcional que tienen las siguientes propiedades: son incorreladas entre
sı, tienen maxima varianza y estan normalizadas.
Ası, la funcion peso f1 asociada a la primera componente principal se obtiene bus-
cando la combinacion lineal generalizada de varianza maxima. La j-esima componente
principal se obtiene se obtiene resolviendo la optimizacion MaxV ar[ξ] y teniendo en
cuenta las siguientes restricciones:
‖ f(t) ‖= 1 y
∫T
f(t)fi(t)dt = 0 ∀i = 1, ..., j − 1
Oscar Gonzalez Frutos 18
Capıtulo 3. Analisis funcional en componentes principales
Por lo tanto, la j-esima componente principal viene dada por:
ξj =
∫T
X(t)fj(t)dt,
siendo el autovalor asociado la varianza de la componente principal
λj = V ar[ξi]
La mejor aproximacion en media cuadratica de X(t) dada por Fukunaga (1990),
truncado en q-esimo termino del desarrollo de Karhunen- Loeve.
Xq(t) =
q∑i=1
fi(t)ξi
y proporciona una representacion ortogonal de la variable funcional en terminos de las q
primeras componentes principales.
Varianza total X(t) : t ∈ T
VT =
∫T
C(t, t)dt =∞∑j=1
λj
la proporcion de varianza acumulada esta dada por la expresion:
V q =
∑qi=1 λiVT
,
En la practica, la informacion proporcionada por las variables del proceso quedara
resumida en las primeras componentes principales tales que la suma de las varianzas sea
cercano como posible a 1.
Oscar Gonzalez Frutos 19
Capıtulo 3. Analisis funcional en componentes principales
3.3 Estimacion puntual del AFCP
A continuacion se presenta un resumen de estimacion del AFCP a partir de la
informacion obtenida por una muestra de trayectorias del proceso x1(t), x2(t), ..., xN(t)
del proceso estocastico X(t) : t ∈ T. Las demostraciones de los siguientes resultados se
pueden encontrar, vease en Aguilera (1993).
A) Estimacion puntual de la media del proceso
Sin perder generalidad asumimos que las curvas observadas estan centradas, entonces
la media muestral igual a cero y viene dada por la siguiente expresion:
xi =1
N
N∑i=1
xi(t) = 0
A continuacion se detallan sus principales propiedades:
• x es un estimador insesgado para µ, es decir E[x] = µ.
• x converge casi seguramente a µ.
• x converge en media cuadratica a µ.
• x es un estimador consistente para µ.
B) Estimacion puntual de la covarianza del proceso
El estimador natural de la funcion de covarianza es la funcion de covarianza muestral
definida por:
C(t, s) =1
N − 1
N∑i=1
[xi(t)− x(t)][xi(s)− x(s)]
Sus principales propiedades son:
• C es un estimador insesgado para C, es decir E[C(t, s)] = C(t, s).
• C converge casi seguramente a C.
Oscar Gonzalez Frutos 20
Capıtulo 3. Analisis funcional en componentes principales
• C converge en media cuadratica a C.
• C es un estimador consistente para C.
C) Estimacion puntual de los valores y factores principales
Una vez demostrados que C converge en media cuadratica a C, es natural pensar
que los elementos propios de C seran buenos estimadores de los de C cuando N
sea grande. Si denotamos por J al conjunto de ındices de los valores propios de
C; Ji = j ∈ J , λj = λi, cuyo cardinal es la multiplicidad ki del valor propio λi; y
J ′ = i ∈ J, Ji = i siendo su cardinal igual al numero de valores propios simples
de C.
En general, si λi es un valor propio de C con multiplicidad ki, el estimador natural
de λi se define promediando los correspondientes valores propios de C en la siguiente
forma:
λi =1
ki
∑j∈Ji
λj
al que llamaremos i-esimo valor principal muestral. En el caso particular en que λi es
un valor propio simple de C el i-esimo valor principal muestral es λi, el i-esimo valor
propio de C.
Analogamente, si fi es la familia ortonormal de funciones propias de C asociada
a la sucesion decreciente de sus valores propios λi, estimaremos la i-esima funcion
propia fi mediante la i-esima funcion propia fi de C asociada al i-esimo valor propio
de λi, eligiendo fi de modo que 〈fi, fi〉 ≥ 0, y lo denominaremos i-esimo factor
principal muestral. Es necesario recordar que si no todos los λi son simples, entonces
los factores principales fi no estan determinados de forma unica, y por lo tanto sus
estimadores fi tampoco.
A continuacion las propiedades mas importantes de los valores propios muestrales:
• λi son, en general, estimadores sesgados, es decir: E[λi] 6= λi.
• Para cada i ∈ J , el estimador λi converge casi seguramente al i-esimo valor principal
de λi.
Oscar Gonzalez Frutos 21
Capıtulo 3. Analisis funcional en componentes principales
• Para cada i ∈ J ′, el estimador λi converge en media cuadratica al i-esimo valor
principal de λi y , en consecuencia, λi es un estimador consistente para λi.
Analogamente, las propiedades mas importantes de los factores principales muestra-
les,
• Para cada i ∈ J ′, el estimador fi converge casi seguramente al i-esimo valor principal
de fi.
• Para cada i ∈ J ′, es decir para cada valor propio de multiplicidad uno, el estimador
fi converge en media cuadratica al i-esimo factor principal fi, y como consecuencia,
fi es un estimador consistente para fi.
Despues de obtener los buenos estimadores para los valores y factores principales es-
timaremos los componentes principales del proceso. Entonces, la j-esima componente
principal muestral es un vector de dimension N cuyas componentes vienen dadas por:
ξij =
∫ T
0
xi(t)fj(t)dt, i = 1, 2, ..., N
Oscar Gonzalez Frutos 22
Capıtulo 4
Analisis de regresion multiple
En este trabajo la idea que se llevara a cabo es el de modelo regresion lineal donde
se dispondra de variables dependientes funcionales Y (t) y variables independientes fun-
cionales x1(t), x2(t), ..., xk(t) que son componentes principales respectivamente, entonces
obtendrıamos la siguiente expresion:
Yi(t) = β0(t) +k∑j=1
Xij(t)βj(t) + εi(t) i = 1, 2, ..., n (4.1)
La Ecuacion 4.1 esta en notacion escalar y se puede expresar en forma matricial,
segun Seber and Lee (2003) la ecuacion de regresion lineal se puede expresar matricial-
mente escribiendo las n ecuaciones de la forma:
Y1
Y2
...
Yn
=
x10 x11 x12 · · · x1,p−1
x20 x21 x22 · · · x2,p−1
......
......
...
xn0 xn1 xn2 · · · xn,p−1
β0
β1
...
βp−1
+
ε0
ε1
...
εn
(4.2)
23
Capıtulo 4. Analisis de regresion multiple
o de forma equivalente
Y = Xβ + ε, (4.3)
donde, Y es un vector (N × 1) de las observaciones, X es una matriz (n × p) de
los niveles de las variables independientes, β es un vector (p × 1) de los coeficientes de
regresion y ε es un vector (n× 1) de los errores aleatorios. A continuacion analizaremos
los puntos importantes dentro del analisis de regresion multiple.
4.1 Estimacion de parametros
Es mas sencillo resolver las ecuaciones normales si se expresan en forma matricial, en-
tonces procederemos de esa forma utilizando la Ecuacion 4.3 y suponiendo que el termino
del error ε del modelo tiene E(ε) = 0 y V (ε) = σ2 y que las εi son variables aleatorias
independientes. A continuacion detallamos los siguientes metodos de mınimos cuadrados
y maxima verosimilitud.
A) Metodo de mınimos cuadrados
Se quiere encontrar el vector de los estimadores de mınimos cuadrados β que minimize
la expresion:
L =n∑i=1
ε2i = ε′ε = (Y −Xβ)′(Y −Xβ)
L tambien se puede expresar de la siguiente manera:
L = Y ′Y − 2β′X ′Y + β′X ′Xβ
ya que β′X ′Y es una matriz (1× 1, o un escalar, y su transpuesta (β′X ′Y )′ = Y ′Xβ
es el mismo escalar. Los estimadores de mınimos cuadrados deben satisfacer,
∂L
∂β
∣∣∣∣β
= −2X ′Y + 2X ′Xβ = 0
Oscar Gonzalez Frutos 24
Capıtulo 4. Analisis de regresion multiple
y simplificando se obtiene:
X ′Xβ = X ′Y (4.4)
La Ecuacion 4.4 es la forma matricial de las ecuaciones normales de mınimos cua-
drados. Para resolver las ecuaciones normales, ambos miembros de la Ecuacion 4.4 se
multiplican por la inversa de XX ′ , por lo tanto el estimador de mınimos cuadrados
de β esta dada por la siguiente expresion:
β = (X ′X)−1X ′Y
El modelo de regresion ajustado en notacion matricial es
Y = Xβ
La diferencia entre la observacion real Yi y el valor ajustado Yi es el residual, es decir,
εi = Yi − Yi . El vector (n× 1) de los residuales se denota por
ε = Y − Y
B) Estimador de maxima verosimilitud
La estimacion por maxima verosimilitud de β y σ2 en el modelo de la Ecuacion 4.3, se
toman como estimadores a aquellos valores que maximizan la probabilidad de obtener
las observaciones de una muestra dada.
Vamos a ver el procedimiento para obtener los estimadores de maxima verosimilitud
β y σ2 . De acuerdo con los supuestos del MLC
ε ∼ N(0, σ2I)
La esperanza y la varianza de la distribucion de Y estan dadas por
Oscar Gonzalez Frutos 25
Capıtulo 4. Analisis de regresion multiple
E(Y ) = E[Xβ + ε] = Xβ + E[ε] = Xβ
V ar(Y ) = E [(Y −Xβ)(Y −Xβ)′] = E [εε′] = σ2I
Por lo tanto,
Y ∼ N(Xβ, σ2I) (4.5)
La funcion de densidad de Y (o funcion de verosimilitud), considerando X e Y fijas
y β y σ2 variables, sera de acuerdo con la Ecuacion 4.5 igual a
L = f(Y |β, σ2) =1
(2πσ2)n/2exp
[−(1/2σ2)(Y −Xβ)′(Y −Xβ)
]Dado que el maximo para L se alcanza en el mismo punto que ln(L), por ser la funcion
logaritmo monotona, podemos, a efectos de maximizacion, trabajar con ln(L) en lugar
de con L. Entonces,
ln(L) = −nln(2π)
2− nln(σ2)
2− 1
2σ2− (Y −Xβ)′(Y −Xβ) (4.6)
Para maximizar ln(L), hay que derivar con respecto a β y σ2:
∂ln(L)
∂β= − 1
2σ2(−2X ′Y + 2X ′Xβ) (4.7)
∂ln(L)
∂σ2= − n
2σ2+
(Y −Xβ)′(Y −Xβ)
2σ4(4.8)
Igualando a cero la Ecuacion 4.7, vemos que el estimador de maxima verosimilitud
de β, denotado por β , satisface que
X ′Xβ = X ′Y
Oscar Gonzalez Frutos 26
Capıtulo 4. Analisis de regresion multiple
Como se supone que XX ′ es invertible, tenemos que
β = [X ′X]−1
X ′Y
En consecuencia, el estimador de maxima verosimilitud de β, bajo los supuestos del
MLC, coincide con el estimador MCO, es decir,
β = β
Por lo tanto,
(Y −Xβ)′(Y −Xβ) = (Y −Xβ)′(Y −Xβ) = ε′ε (4.9)
Igualando la Ecuacion 4.8 a cero y sustituyendo β por β , obtenemos:
− n
2σ2+ε′ε
2σ4= 0 (4.10)
donde hemos designado por σ2 al estimador de maxima verosimilitud de la varianza
de las perturbaciones aleatorias. De la Ecuacion 4.10 se deduce que
σ2 =ε′ε
n(4.11)
Si tomamos esperanzas en la Ecuacion 4.11,
E[σ2]
=1
nE [ε′ε] =
n− pn
σ2 (4.12)
Es decir, el estimador de maxima verosimilitud, σ2, es un estimador sesgado, aunque
su sesgo tiende a cero cuando n tiende a infinito, ya que
lımn−→∞
n− pn
= 1
Oscar Gonzalez Frutos 27
Capıtulo 4. Analisis de regresion multiple
4.2 Bondad de Ajuste
Una vez que se han aplicado los mınimos cuadrados o de maxima verosimilitud, es
conveniente tener alguna medida de la bondad del ajuste del modelo a los datos. En el
caso de que se hayan estimado varios modelos alternativos, las medidas de la bondad del
ajuste podrıan ser utilizadas para seleccionar el modelo mas apropiado, existen numerosas
medidas de bondad del ajuste. La mas popular es el coeficiente de determinacion, que se
designa por R2 o R cuadrado, y el coeficiente de determinacion ajustado, que se designa
por R2 o R2 ajustado. Dado que estas medidas tienen algunas limitaciones, nos referiremos
tambien al criterio de informacion de Akaike (AIC) y al criterio de Schwarz (SC).
A) Coeficiente de determinacion
El coeficiente de determinacion se basa en la siguiente descomposicion de la varianza
de la variable endogena, a la que denominaremos varianza total.
SCT = SCE + SCR (4.13)
donde, SCT es la suma de cuadrados totales, SCE es la suma de cuadrados explicados
y SCR es la suma de cuadrados residual.
Basandose en la Ecuacion 4.13, el coeficiente de determinacion se define como:
R2 =SCE
SCT
Los valores de R2 esta en el intervalo [0, 1], es decir, 0 cuando la varianza explicada es
cero y 1 cuando la varianza residual es cero, en este caso cuando el ajuste es perfecto.
El R2, es una medida muestral. Ahora bien, si deseamos una medida poblacional
(R2POB), esta se podrıa definir como
R2POB = 1− σ2
ε
σ2Y
(4.14)
Oscar Gonzalez Frutos 28
Capıtulo 4. Analisis de regresion multiple
En su lugar, vamos a utilizar estimaciones insesgadas de estas varianzas:
R2 = 1− SCR/(n− p)SCT/(n− 1)
= 1− (1−R2)n− 1
n− p(4.15)
Esta medida se denomina R cuadrado ajustado, o R2. El principal atractivo del R2
es que impone una penalizacion al anadir otros regresores a un modelo. Si se anade
un regresor al modelo la SCR decrece o, en el peor de los casos queda igual. Por otra
parte, los grados de libertad de la regresion (n− p) siempre disminuyen.
B) Criterio de informacion de Akaike (AIC) y criterio de Schwarz (SC)
El estadıstico AIC, propuesto por Akaike (1974) y basado en la teorıa de la informa-
cion, tiene la siguiente expresion:
AIC = −2l
n+
2p
n(4.16)
donde l es el logaritmo de la funcion de verosimilitud (suponiendo que las pertur-
baciones tengan una distribucion normal) evaluada para los valores estimados de los
coeficientes.
El estadıstico SC propuesto por Schwarz (1978), tiene la siguiente expresion:
SC = −2l
n+p ln(n)
n(4.17)
Los estadısticos AIC y SC, a diferencia de los coeficientes de determinacion R2 y R2,
indican mejores ajustes cuanto mas bajos sean sus valores. Es importante destacar
que los estadısticos AIC y SC no tienen cotas, a diferencia del R2.
Oscar Gonzalez Frutos 29
Capıtulo 4. Analisis de regresion multiple
4.3 Contrastes de significacion
Estos procedimientos requieren que los errores εi del modelo lo sigan una distribucion
normal e independiente con media cero y varianza σ2. Como resultado de este supuesto,
las observaciones Yi tienen una distribucion normal e independiente con media β0 +∑kj=1Xijβj y varianza σ2.
A) Prueba de significacion de la regresion
Es un procedimiento para determinar si existe una relacion lineal entre las variables
de respuesta y un subconjunto de regresores x1, x2, ..., xp.
Hipotesis de significacion del modelo de regresion
H0 : β1 = β2 = ... = βp = 0
H1 : No todos los βp son nulos(4.18)
El rechazo de H0 de la Ecuacion 4.18 implica que al menos uno de los regresores
x1, x2, ..., xp contribuye de manera significativa al modelo. El procedimiento de prueba
incluye un analisis de varianza en el que se hace la particion de la suma de cuadrados
total SST en una de cuadrados debida al modelo y una suma de cuadrados debida a
los residuales. Por lo general la prueba se resume en una tabla de analisis de varianza,
vease la Tabla 4.1.
Tabla 4.1: Analisis de varianza de la significacion de la regresion.
Fuente de variacion SC Grado de libertad CM F0
Regresion SSR p MSRMSR
MSE
Error o residual SSE n− p− 1 MSETotal SST n− 1
Oscar Gonzalez Frutos 30
Capıtulo 4. Analisis de regresion multiple
B) Contraste de un parametro individual
Varias veces el interes se centra en probar las hipotesis sobre los parametros en forma
individual, estas pruebas sirven para determinar el valor de cada uno de los regresores
del modelo de regresion para incluir o excluir variables dentro del modelo.
Adicionar una variable en el modelo surge un efecto de aumento en la suma de
cuadrados de regresion y disminucion en la suma de cuadrados del error.
Las hipotesis para probar la significacion de cualquier coeficiente de regresion indivi-
dual es
H0 : βj = 0
H1 : βj 6= 0
Si H0 : βj = 0 no se rechaza, entonces esto indica que xj puede eliminarse del modelo.
Se puede utilizar un estadıstico con distribucion t de Student para probar la hipotesis
dada por la Ecuacion 4.19.
t0 =βj√σ2Cij
(4.19)
donde Cij es el elemento de la diagonal de (X ′X)−1 correspondiente a βj y√σ2Cij
es el error estandar (se) del coeficiente βj, por lo tanto la Ecuacion 4.19 se puede
escribir en forma equivalente como
t0 =βj
se(βj)
La hipotesis nula H0 : βj = 0 se rechaza si |t0| > tα/2,n−p−1, lo cual en realidad se
trata de una prueba parcial o marginal, ya que el coeficiente de regresion βj depende
de todos los demas regresores xi(i 6= j) que estan en el modelo.
Oscar Gonzalez Frutos 31
Capıtulo 4. Analisis de regresion multiple
C) Contraste de un subconjunto de parametros
Para estudiar la contribucion de un subconjunto de regresores al modelo, consideremos
el modelo de la Ecuacion 4.3 de regresion con p regresores, es decir,
Y = Xβ + ε
Queremos determinar si el subconjunto de regresores x1, x2, ..., xr(r < p) contribuye
significativamente al modelo de regresion. Sea que se haga la particion del vector de
los coeficientes de regresion de la siguiente manera:
β =
β1
β2
donde β1 es (r × 1) y β2 es [(p− r)× 1], se quiere probar las hipotesis
H0 : β1 = 0
H1 : β1 6= 0
El modelo puede escribirse como
Y = Xβ + ε = X1β1 +X2β2 + ε (4.20)
donde X1 representa las columnas de X asociadas con β1 y X2 representa las columnas
de X asociadas con β2.
Para el modelo completo (incluyendo a β1 y β2) se sabe que β = (X ′X)−1X ′Y .
Ademas, la suma de cuadrados de regresion para todas las variables incluyendo la
ordenada al origen es SSR(β) = β′X ′Y (p grados de libertad) y MSE = Y ′Y−β′X′Yn−p .
Oscar Gonzalez Frutos 32
Capıtulo 4. Analisis de regresion multiple
A SSR(β) se le llama la suma de cuadrados de regresion debida a β. Para encontrar
la contribucion de los terminos en β1 a la regresion, se ajusta el modelo suponiendo
que la hipotesis nula H0 : β1 = 0 es verdadera.
El modelo reducido se encuentra a partir de la Ecuacion 4.20 con β1 = 0:
Y = X2β2 + ε
El estimador de mınimos cuadrados de β2 es β2 = (X ′2X2)−1X ′2Y , y SSR(β2) =
β2′X ′2Y (p− r grados de libertad).
La suma de cuadrados de regresion debida a β1 dado que β2 esta ya en el modelo es
SSR(β1|β2) = SSR(β)− SSR(β2)
Esta suma de cuadrados tiene r grados de libertad. Es la suma de cuadrados extra
debida a β1. Observe que SSR(β1|β2) es el incremento en la suma de cuadrados de
regresion debido a la inclusion de las variables x1, x2, ..., xr en el modelo.
Ahora bien, SSR(β1|β2) es independiente de MSE, y la hipotesis nula β1 = 0 puede
probarse con el estadıstico
F0 =SSR(β1|β2)/r
MSE
Si F0 > Fα,r,n−p, se rechaza H0, y se concluye que al menos uno de los parametros en
β1 es diferente de cero y por consiguiente, al menos unas de las variables x1, x2, ..., xr
en X1 contribuye significativamente al modelo de regresion.
4.4 Prediccion
Un proposito fundamental de la regresion lineal multiple es predecir observaciones
futuras de la respuesta Y que corresponden a valores particulares de los regresores, por
Oscar Gonzalez Frutos 33
Capıtulo 4. Analisis de regresion multiple
ejemplo x01, x02, ..., x0k. Si x′0k = [1, x01, x02, ..., x0k], entonces una estimacion puntual de
la observacion futura Y0 en el punto x01, x02, ..., x0k se calcula con la Ecuacion 4.21.
Y (x0) = x′0β (4.21)
Un intervalo de prediccion de 100(1− α) por ciento para esta observacion futura es
Y (x0)− tα/2,n−p√σ2(1 + (X ′X)−1x0) ≤ Y0 ≤ Y (x0) + tα/2,n−p
√σ2(1 + (X ′X)−1x0)
Oscar Gonzalez Frutos 34
Capıtulo 5
Analisis de datos funcionales en R
Una referencia basica para trabajar en el programa R Core Team (2016) con datos
funcionales es sin lugar a dudas, el paquete fda de Ramsay et al. (2009) donde aparece
una introduccion sobre el tema y ejemplos, ası como tambien los libros de Ramsay and
Silverman (2002, 2005) son muy conocidos en este ambito, en estos libros las tecnicas uti-
lizadas se limitan al espacio de funciones L2 (espacio de Hilbert de cuadrado integrable).
Otra referencia importante cuando se incorpora enfoques no parametricos es el libro de
Ferraty and Vieu (2006).
Tambien existe el paquete fda.usc de Febrero-Bande et al. (2013) que integra y
complementa la librerıa fda con medidas de profundidad, deteccion de outliers funcio-
nales, modelos de regresion funcional, metodos de clasificacion de un conjunto de datos
funcionales, ası como un ANOVA para datos funcionales.
35
Capıtulo 5. Analisis de datos funcionales en R
5.1 Descripcion basica del paquete fda
Para empezar consideraremos dos bases muy utilizadas, primeramente las bases de
funciones B-splines que se obtienen mediante la funcion create.bspline.basis en el
programa R con los siguientes argumentos mas importantes:
basisobj=create.bspline.basis(rangeval=NULL, nbasis=NULL,
norder=4,breaks=NULL)
donde,
rangeval: Vector con el mınimo y maximo de los valores de evaluacion (o argu-
mentos) de las funciones.
nbasis: Numeros de funciones basicas.
norder: Orden del polinomio considerado.
breaks: Un vector que especifica los puntos de quiebre que definen el B-spline.
Tambien se llama nodos, estos son una secuencia estrictamente creciente de los
puntos de union entre segmentos polinomicos a trozos.
La otra base de funciones son los de Fourier que se obtiene mediante la funcion
create.fourier.basis con los siguientes argumentos mas importantes:
basisobj = create.fourier.basis(rangeval, nbasis, period)
donde,
rangeval: Vector con el mınimo y maximo de los valores de evaluacion (o argu-
mentos) de las funciones.
Oscar Gonzalez Frutos 36
Capıtulo 5. Analisis de datos funcionales en R
nbasis: Numeros de funciones basicas.
period: La anchura de cualquier intervalo en el que las funciones de Fourier se
repiten o son periodicas.
Para la obtencion de la forma funcional se utiliza la funcion Data2fd que tiene los
siguientes argumentos:
data.fd=Data2fd(argvals=NULL, y=NULL, basisobj=NULL)
argvals: vector con los valores de evaluacion (argumento) de las funciones t1 =
1, ..., tm = m.
y: Normalmente una matrix de dimension (n,m) que contiene un conjunto de n
curvas discretizadas en m puntos o argvals.
basisobj: Es la base de funciones creadas previamente utilizando unas de las
funciones que puede ser como ejemplo base de Fourier, B-splines u otras.
Una vez obtenido la forma funcional podemos hallar las siguientes funciones:
Funcion media con mean.fd(data.fd).
La funcion desviacion tıpica mediante con std.fd(data.fd).
Y la matriz de covarianzas con var.fd(data.fd).
La funcion pca.fd calcula AFCP y tiene como objetivo realizar un analisis explora-
torio de datos, esta funcion arroja resultados como la proporcion de varianza explicada
por cada componente y las bases consideradas ya sea periodicos, no periodicos, entre
otros. La funcion pca.fd posee como argumentos principales:
acp=pca.fd(fdobj=data.fd, nharm = n)
Oscar Gonzalez Frutos 37
Capıtulo 5. Analisis de datos funcionales en R
fdobj: El objeto funcional.
nharm: Indica el numero de componentes principales para calcular.
5.2 Implementacion en el programa R
Utilizaremos como ejemplo las observaciones de los datos discretos de la temperatura
media diaria de 35 estaciones meteorologicas de Canada durante 365 dıas y representamos
inicialmente los datos discretos correspondiente a las temperaturas medias mensuales en
grados celsius de 4 estaciones meteorologicas que se puede observar en la Figura 5.1.
2 4 6 8 10 12
−30
−20
−10
010
20
Meses
Tem
pera
tura
med
ia
Pr. RupertMontrealEdmontonResolute
Figura 5.1: Las temperaturas medias en cuatro estaciones meteorologicas canadienses durante12 meses.
Para la obtencion de la forma funcional utilizaremos las bases de funciones de Fourier
dado que son datos periodicos, donde como argvals (argumento) tenemos los 12 meses es
decir m=12 que indican los meses de registros de las temperaturas, en consecuencia obte-
nemos rangeval teniendo como mınimo 1 y como maximo 12 de los valores de evaluacion
(o argumentos) de las funciones, por ultimo elegimos 5 como numero de funciones basicas
que corresponde a nbasis . En la Figura 5.2 tenemos para las 35 trayectorias muestrales
Oscar Gonzalez Frutos 38
Capıtulo 5. Analisis de datos funcionales en R
y en la Figura 5.3 podemos observar para una trayectoria muestral y su reconstruccion
con bases de Fourier que corresponde a la linea roja.
2 4 6 8 10 12
−30
−20
−10
010
20
Meses
Tem
pera
tura
med
ia
Figura 5.2: Las temperaturas medias en las 35 estaciones meteorologicas canadienses durante12 meses.
Ahora hallamos la funcion media funcional con mean.fd. Observamos en la Figu-
ra 5.4.
La funcion desviacion tıpica funcional mediante std.fd, observamos en la Figu-
ra 5.5 las representaciones graficas de dichas funciones para las 35 estaciones canadienses
durante 12 meses.
Calculamos y representamos graficamente los componentes principales funcionales
de las temperaturas medias canadienses durante 12 meses, en la Figura 5.6 se puede
observar que con cuatro componentes extraıdos ya se explica el 99.9 % de la variabilidad
total de los datos.
Otro ejemplo como data(Tecator) proporciona datos funcionales en la que el domi-
nio de la funcion no es el tiempo. En la literatura se utilizan solo las primeras 129 curvas
como muestra training y se consideran 2 grupos de curvas en funcion de su contenido
en grasa: menos del 20 % y mas del 20 %. En la Figura (5.7a) podemos observar los que
Oscar Gonzalez Frutos 39
Capıtulo 5. Analisis de datos funcionales en R
2 4 6 8 10 12
24
68
1012
Meses
Tem
pera
tura
med
ia
Figura 5.3: Aproximacion por mınimos cuadrados de bases de Fourier de la temperatura men-sual de “Pr. Rupert”durante 12 meses.
2 4 6 8 10 12
−10
−5
05
1015
Mes
Tem
pera
tura
med
ia
Figura 5.4: Funcion media funcional
Oscar Gonzalez Frutos 40
Capıtulo 5. Analisis de datos funcionales en R
2 4 6 8 10 12
45
67
89
Mes
Tem
pera
tura
med
ia
Figura 5.5: Desviacion tıpica funcional
contienen menos del 20 % de grasa y en la Figura 5.7b los que contienen mas del 20 %
de grasa.
Para la obtencion de la forma funcional (por mınimos cuadrados) utilizaremos B-
splines cubicos para datos de naturaleza suaves teniendo como 100 nodos de observacion.
En la Figura 5.8a podemos observar la forma funcional de Tecator para menos del 20 %
de grasa y en la Figura 5.8b para mas del 20 %.
Oscar Gonzalez Frutos 41
Capıtulo 5. Analisis de datos funcionales en R
2 4 6 8 10 12
−0.
6−
0.2
0.2
0.6
PC 1 (89.1%)
Mes
Val
or d
e la
cur
va C
P
2 4 6 8 10 12
−0.
6−
0.2
0.2
0.6
PC 2 (8.5%)
Mes
Val
or d
e la
cur
va C
P
2 4 6 8 10 12
−0.
6−
0.2
0.2
0.6
PC 3 (1.9%)
Mes
Val
or d
e la
cur
va C
P
2 4 6 8 10 12
−0.
6−
0.2
0.2
0.6
PC 4 (0.4%)
Mes
Val
or d
e la
cur
va C
P
Figura 5.6: Representacion grafica de las cuatro componentes principales consideradas.
Oscar Gonzalez Frutos 42
Capıtulo 5. Analisis de datos funcionales en R
0 20 40 60 80 100
23
45
6
nm
Abs
orba
ncia
(a) Bajo contenido en grasa
0 20 40 60 80 100
23
45
6nm
Abs
orba
ncia
(b) Alto contenido en grasa
Figura 5.7: Las curvas discretas de Tecator de acuerdo a su contenido de grasa.
850 900 950 1000 1050
2.5
3.0
3.5
4.0
4.5
5.0
nm
Abs
orba
ncia
(a) Forma funcional bajo contenido en gra-sa
850 900 950 1000 1050
2.5
3.0
3.5
4.0
4.5
5.0
5.5
nm
Abs
orba
ncia
(b) Forma funcional alto contenido en gra-sa
Figura 5.8: Forma funcional de las curvas discretas de Tecator de acuerdo a su contenido degrasa.
Oscar Gonzalez Frutos 43
Capıtulo 6
Aplicacion del AFCP
En este apartado se construye un modelo para modelizar la serie del Ibex a partir de
las empresas que la componen, los datos que se analizaran son las cotizaciones diarias de
varios anos de dichas empresas. Se aplicara las teorıas mencionadas en capıtulos anteriores
a los datos reales y una vez obtenidas las componentes principales de todas las empresas
se utilizara Modelo de Regresion Multiple para estudiar la relacion existente entre el Ibex
y las distintas empresas en terminos de las componentes principales.
Se tendra como variable dependiente a la empresa Ibex , lo cual se utilizara sus 5
primeros componentes y como variables independientes, en nuestro caso utilizaremos 33
empresas espanolas con sus 5 primeros componentes. En la Figura 6.1 podemos observar
las cotizaciones diarias de Ibex al cierre en la bolsa durante el ano 2007 hasta el ano 2013.
6.1 Descripcion de la base de datos
El Ibex 35 es el principal ındice bursatil de referencia de la bolsa espanola elaborado
por Bolsas y Mercados Espanoles (BME). Esta formado por las 35 empresas con mas
44
Capıtulo 6. Aplicacion del AFCP
0 500 1000 1500
8.8
9.0
9.2
9.4
9.6
Días
Cot
izac
ione
s
Figura 6.1: Logaritmo de Ibex de las cotizaciones diarias al cierre en la bolsa (2007-2013).
liquidez que cotizan en el Sistema de Interconexion Bursatil Electronico (SIBE) en las
cuatro bolsas espanolas (Madrid, Barcelona, Bilbao y Valencia).
Los datos seleccionados son las cotizaciones diarias de 33 empresas del Ibex, y del
propio Ibex, vease la Tabla 6.1, en total tenemos 1440 datos en un data.frame compren-
didos desde el ano 2007 al 2013. Cada columna tiene las cotizaciones de una empresa y
la ultima columna la cotizacion del Ibex propiamente dicho. Despues hemos traspuesto
dicho data.frame, para tener los individuos por filas y las empresas por columnas que lo
hemos llamado Cotizaciones.
Tabla 6.1: Las 33 empresas del Ibex seleccionadas.
Abengoa Bolsa y Mercados MapfreAbertis Enagas MetrovacesaAcciona ENDESA NHHotelesAcerinox FCC OHLACS Ferrovial PRISAAntena 3 Gamesa Red Electrica EspanolaBanco Popular Gas Natural RepsolBanco Sabadell Grifolsa Sacyr VallehermosoBanco Santander Iberdrola Tecnicas ReunidasBanesto Inditex TelefonicaBankinter Indra BBVA
Oscar Gonzalez Frutos 45
Capıtulo 6. Aplicacion del AFCP
Tomamos las rentabilidades a 10 dıas de las distintas empresas y del Ibex dada por
la Ecuacion 6.1. De este modo creamos una matriz de 34 filas para las distintas empresas
y 1440 columnas para las rentabilidades.
Ri =Ci − Ci−10Ci−10
, (6.1)
donde Ri son las rentabilidades y Ci las cotizaciones diarias.
6.2 Tratamiento de datos funcionales
Consideramos la rentabilidad a 10 dıas y cortamos la serie de 20 en 20, entonces se
dispondran de 72 curvas muestrales de cada empresa para el analisis de datos funcionales
mediante interpolacion spline cubico. Extraemos los 5 primeros componentes de las 33
empresas del Ibex, y del propio Ibex. Las componentes principales de todas las empresas
se ordenaran en forma decreciente segun su correspondiente varianza explicada.
Seguidamente analizamos las correlaciones entre las 5 componentes del Ibex con las
5 componentes de todas las demas empresas. Se seleccionaron las empresas que tenıan
mayor grado de correlacion y significativas en terminos de los componentes de Ibex y se
excluyeron aquellos que tenıan correlaciones muy pequenas y no significativas.
El procedimiento fue comparar primer componente de Ibex con los primeros compo-
nentes de las demas empresas, segunda componente de Ibex con las segundas componentes
de las demas empresas y ası sucesivamente hasta la quinta componente, se detallan dichas
correlaciones en las Tabla 6.2.
En la Tabla 6.3 podemos observar las empresas seleccionadas para la formulacion
de los modelos de regresion, es decir las significativas para el modelo, con sus respectivas
varianzas explicadas acumuladas.
Oscar Gonzalez Frutos 46
Capıtulo 6. Aplicacion del AFCP
Tabla 6.2: Correlaciones de Ibex con las demas empresas en terminos de las componentes.
Componente Correlacion Empresa Componente Correlacion Empresa
1 0,894 BBVA 3 0,952 BBVA1 0,863 Santander 3 0,859 Santander1 0,849 Iberdrola 3 0,732 Mapfre1 0,817 Telefonica 3 0,702 Popular1 0,808 Mapfre 4 0,929 BBVA1 0,794 Repsol 4 0,906 Santander1 0,793 RedElectrica 4 0,800 Popular1 0,775 ACS 4 0,773 Repsol1 0,765 FCC 4 0,764 Bankinter1 0,758 Acciona 4 0,762 Iberdrola1 0,753 Abertis 4 0,736 Abertis1 0,735 OHL 4 0,734 Banesto1 0,721 Banesto 4 0,726 Sabadell1 0,710 Acerinox 5 0,923 BBVA1 0,703 Gamesa 5 0,899 Santander2 0,932 BBVA 5 0,852 Telefonica2 0,869 Santander 5 0,821 Iberdrola2 0,736 Mapfre 5 0,814 Popular2 0,728 Banesto 5 0,776 Repsol2 0,719 ACS 5 0,753 Abertis2 0,709 Abertis 5 0,712 Gamesa2 0,704 Acerinox 5 0,701 Acciona2 0.675 Ferrovial
Tabla 6.3: Proporcion de varianza explicada acumulada por cada componente.
Empresas 1 2 3 4 5
Ibex 0.4806554 0.7192023 0.8816534 0.9253445 0.9551129Red Electrica Espanola 0.4927538 0.7453543 0.8876286 0.9358543 0.9581421Mapfre 0.5242329 0.7658765 0.8833405 0.9296943 0.9539771Acciona 0.5928001 0.7691061 0.9146142 0.9469638 0.9675901Acerinox 0.5047573 0.7807840 0.9125702 0.9453301 0.9645457Ferrovial 0.5199911 0.7697972 0.9039709 0.9406513 0.9624219Tecnicas Reunidas 0.5377797 0.7814031 0.9065747 0.9405936 0.9599856BBVA 0.4289670 0.7229704 0.8857093 0.9361519 0.9602449Banesto 0.4747387 0.8014432 0.9032365 0.9418629 0.9658811Bankinter 0.5283585 0.7904753 0.8947555 0.9386328 0.9583735Banco Popular 0.5254124 0.7905885 0.9112614 0.9492845 0.9714045Gamesa 0.4734703 0.7603740 0.9026338 0.9418104 0.9672443
Oscar Gonzalez Frutos 47
Capıtulo 6. Aplicacion del AFCP
Para mejor interpretacion de nuestros modelos , llamaremos a las curvas de las
rentabilidades consideradas, a las componentes principales y a las autofunciones de la
forma que escribimos en la Tabla 6.4.
Tabla 6.4: Notacion de las empresas consideradas.
Empresas Curvas Componentes Autofunciones
Ibex x(Ibex)i(t) ξ(Ibex)ij f(Ibex)j(t)Red Elec. Esp. x(REE)i(t) ξ(REE)ij f(REE)j(t)Mapfre x(Map)i(t) ξ(Map)ij f(Map)j(t)Acciona x(Acc)i(t) ξ(Acc)ij f(Acc)j(t)Acerinox x(Ace)i(t) ξ(Ace)ij f(Ace)j(t)Ferrovial x(Ferr)i(t) ξ(Ferr)ij f(Ferr)i(t)Tecnicas Reunidas x(Tecn)i(t) ξ(Tecn)ij f(Tecn)i(t)BBVA x(BBV A)i(t) ξ(BBV A)ij f(BBV A)i(t)Banesto x(Bane)i(t) ξ(Bane)ij f(Bane)i(t)Bankinter x(Bank)i(t) ξ(Bank)ij f(Bank)i(t)Banco Popular x(Popu)i(t) ξ(Popu)ij f(Popu)i(t)Gamesa x(Game)i(t) ξ(Game)ij f(Game)i(t)
Entonces se pueden expresar las curvas de cada empresa en terminos de sus cinco
primeras componentes principales como:
x(Ibex)i(t) =5∑j=1
ξ(Ibex)ijf(Ibex)j(t), i = 1, ..., n
x(REE)i(t) =5∑j=1
ξ(REE)ijf(REE)j(t), i = 1, ..., n
x(Map)i(t) =5∑j=1
ξ(Map)ijf(Map)j(t), i = 1, ..., n
x(Acc)i(t) =5∑j=1
ξ(Acc)ijf(Acc)j(t), i = 1, ..., n
x(Ace)i(t) =5∑j=1
ξ(Ace)ijf(Ace)j(t), i = 1, ..., n
Oscar Gonzalez Frutos 48
Capıtulo 6. Aplicacion del AFCP
x(Ferr)i(t) =5∑j=1
ξ(Ferr)ijf(Ferr)j(t), i = 1, ..., n
x(Tec)i(t) =5∑j=1
ξ(Tec)ijf(Tec)j(t), i = 1, ..., n
x(BBV A)i(t) =5∑j=1
ξ(BBV A)ijf(BBV A)j(t), i = 1, ..., n
x(Bane)i(t) =5∑j=1
ξ(Bane)ijf(Bane)j(t), i = 1, ..., n
x(Bank)i(t) =5∑j=1
ξ(Bank)ijf(Bank)j(t), i = 1, ..., n
x(Popu)i(t) =5∑j=1
ξ(Popu)ijf(Popu)j(t), i = 1, ..., n
x(Game)i(t) =5∑j=1
ξ(Game)ijf(Game)j(t), i = 1, ..., n
6.3 Ajustes de modelos
Tenemos los cinco modelos de regresion lineal, estimados mediante aproximacion
por mınimos cuadrados compuestos de las siguientes formas:
Modelo 1: Observamos las correlaciones en la Tabla 6.2 correspondientes a las
primeras componentes, se seleccionaron aquellas variables significativas para el modelo
mediante regresion lineal multiple. Las estimaciones de los parametros del modelo de
regresion lineal podemos observar en la Tabla 6.5, cuya salida proporcionada por el pro-
grama R , con Adjusted R-squared: 0.8363 , se observa que todos los coeficientes son
Oscar Gonzalez Frutos 49
Capıtulo 6. Aplicacion del AFCP
significativos a nivel del 5 % menos la constante y F-statistic: 91.66 on 4 and 67
DF, p-value: < 2.2e-16 que indica que el modelo es significativo.
Tabla 6.5: Estimaciones de los coeficientes del Modelo 1.
Coefficients Estimate Std. Error t value Pr(>| t |)β0 -4.311e-18 7.284e-03 0.000 1.00000β1 2.593e-01 7.746e-02 3.347 0.00134β2 2.906e-01 4.294e-02 6.768 3.94e-09β3 1.474e-01 5.328e-02 2.767 0.00730β4 1.197e-01 4.102e-02 2.918 0.00479
Entonces el modelo 1 queda de la siguiente forma representado en la Ecuacion 6.2.
ξ(Ibex)i1 = 0,2593ξ(REE)i1 + 0,2906ξ(Map)i1 + 0,1474ξ(Ace)i1 + 0,197ξ(Acc)i1 (6.2)
Observamos que en la Ecuacion 6.2 el parametro mas importante es β2 = 0,2906 de
Mapfre, esto significa que por cada unidad que cambie el valor de la primera componente
de Mapfre, se estima puntualmente que la primera componente del Ibex cambiara en
0.2906 unidades, siempre que permanezcan el resto de las variables constantes y se analiza
analogamente para los demas parametros.
Modelo 2: Observamos las correlaciones en la Tabla 6.2 en terminos de las segundas
componentes, seleccionamos las variables significativas para el modelo quedando de la si-
guiente forma: Segunda componente del Ibex en terminos de las segundas componentes de
Ferrovial y Tecnicas Reunidas, vease la Ecuacion 6.3. Las estimaciones de los parametros
del modelo de regresion lineal podemos observar en la Tabla 6.6, cuya salida proporcio-
nada por el programa R , con Adjusted R-squared: 0.5673 , se observa que todos los
coeficientes son significativos a nivel del 5 % menos la constante y F-statistic: 47.54
on 2 and 69 DF, p-value: 1.049e-13 que indica que el modelo es significativo.
ξ(Ibex)i2 = −0,2489ξ(Ferr)i2 + 0,3062ξ(Tec)i2 (6.3)
Oscar Gonzalez Frutos 50
Capıtulo 6. Aplicacion del AFCP
Tabla 6.6: Estimaciones de los coeficientes del Modelo 2.
Coefficients Estimate Std. Error t value Pr(>| t |)β0 5.278e-18 8.342e-03 0.000 1.000000β1 -2.489e-01 6.417e-02 -3.879 0.000237β2 3.062e-01 6.777e-02 4.519 2.51e-05
Observamos que en la Ecuacion 6.3 el parametro mas importante es β2 = 0,3062 que
corresponde a la empresa Tecnicas Reunidas, esto significa que por cada unidad que cam-
bie el valor de la segunda componente de Tecnicas Reunidas, se estima puntualmente que
la segunda componente del Ibex cambiara en 0.3062 unidades, siempre que se mantenga
constante la variable Ferrovial.
Modelo 3: Tercera Componente del Ibex en terminos de la Tercera componente de
BBVA, vease la Ecuacion 6.4. Las estimaciones de los parametros del modelo de regresion
lineal podemos observar en la Tabla 6.7, cuya salida proporcionada por el programa R
, con Adjusted R-squared: 0.9047, se observa que el coeficiente β1 es significativo a
nivel del 5 %, pero la constante β0 no es significativo y F-statistic: 674.9 on 1 and
70 DF, p-value: < 2.2e-16 que indica que el modelo es significativo.
Tabla 6.7: Estimaciones de los coeficientes del Modelo 3.
Coefficients Estimate Std. Error t value Pr(>| t |)β0 -2.615e-18 3.231e-03 0.00 1.000000β1 5.989e-01 2.306e-02 25.98 < 2e-16
ξ(Ibex)i3 = 0,5989ξ(BBV A)i3 (6.4)
Observamos que en la Ecuacion 6.4 consta de un solo parametro que es β1 = 0,5989
que corresponde a la empresa BBVA, esto significa que por cada unidad que cambie el
valor de la tercera componente de BBVA, se estima puntualmente que la tercera compo-
nente del Ibex cambiara en 0.5989 unidades.
Oscar Gonzalez Frutos 51
Capıtulo 6. Aplicacion del AFCP
Modelo 4: Siguiendo el mismo procedimiento del modelo anterior, tenemos cuarta
componente del Ibex en terminos de las cuartas componentes de Banesto y Bankinter,
vease la Ecuacion 6.5. Las estimaciones de los parametros del modelo de regresion lineal
podemos observar en la Tabla 6.8, cuya salida proporcionada por el programa R , con
Adjusted R-squared: 0.6604 , se observa que todos los coeficientes son significativos
a nivel del 5 % menos la constante y F-statistic: 70.04 on 2 and 69 DF, p-value:
< 2.2e-16 que indica que el modelo es significativo.
Tabla 6.8: Estimaciones de los coeficientes del Modelo 4.
Coefficients Estimate Std. Error t value Pr(>| t |)β0 8.327e-20 3.163e-03 0.000 1.000000β1 2.972e-01 6.988e-02 4.253 6.5e-05β2 2.879e-01 5.485e-02 5.250 1.6e-06
ξ(Ibex)i4 = 0,2972ξ(Bane)i4 + 0,2879ξ(Bank)i4 (6.5)
En la Ecuacion 6.5 los parametros practicamente tienen el mismo peso, analizemos el
parametro β1 = 0,2972 que corresponde a la empresa Banesto, esto significa que por cada
unidad que cambie el valor de la cuarta componente de Banesto, se estima puntualmente
que la cuarta componente del Ibex cambiara en 0.2972 unidades, siempre que se mantenga
constante la variable Bankinter.
Modelo 5: Quinta Componente del Ibex en terminos de las quintas componentes
de Banco Popular y Gamesa, vease la Ecuacion 6.6. Las estimaciones de los parametros
del modelo de regresion lineal podemos observar en la Tabla 6.9, cuya salida proporcio-
nada por el programa R , con Adjusted R-squared: 0.7028 , se observa que todos los
coeficientes son significativos a nivel del 5 % menos la constante y F-statistic: 84.96
on 2 and 69 DF, p-value: < 2.2e-16 que indica que el modelo es significativo.
ξ(Ibex)i5 = 0,3738ξ(Popu)i5 + 0,1587ξ(Game)i5 (6.6)
Oscar Gonzalez Frutos 52
Capıtulo 6. Aplicacion del AFCP
Tabla 6.9: Estimaciones de los coeficientes del Modelo 5.
Coefficients Estimate Std. Error t value Pr(>| t |)β0 3.886e-18 2.442e-03 0.000 1.00000β1 3.738e-01 5.354e-02 6.982 1.44e-09β2 1.587e-01 4.689e-02 3.385 0.00118
Por ultimo en la Ecuacion 6.6 el parametro mas importante es β1 = 0,3738 que
corresponde a la empresa Banco Popular, esto significa que por cada unidad que cambie
el valor de la quinta componente de Banco Popular, se estima puntualmente que la quinta
componente del Ibex cambiara en 0.3738 unidades, siempre que se mantenga constante
la variable Gamesa.
6.4 Validacion
Una vez que tenemos los modelos ajustados procedemos con sus respectivos diagnosti-
cos, que se realiza a traves del analisis de los residuos, con los valores ajustados en forma
grafica. Se puede observar que los residuos de los cinco modelos forman nubes de puntos
sin patrones formados y con, aproximadamente, la misma variabilidad por todas las zo-
nas como se muestra en la Figura 6.2, entonces, podemos constatar que las hipotesis de
linealidad, homocedasticidad e independencia de los residuos se cumplen para los cinco
modelos.
Observando la Figura 6.3 podemos decir que en los cinco modelos existe normali-
dad en los residuos estandarizados, las lineas rojas representan las cotas a un nivel de
significacion del 5 % , existen algunos casos que sobresalen la linea roja que representan
un porcentaje muy bajo y esto no deberıa ser motivo de preocupacion, podemos cons-
tatar que todos los modelos tienen medias cero y varianzas constantes, esto nos permite
concluir que el modelo se ajusta bien tanto globalmente como dato a dato.
Oscar Gonzalez Frutos 53
Capıtulo 6. Aplicacion del AFCP
−0.4 −0.2 0.0 0.2
−0.
10−
0.05
0.00
0.05
0.10
Modelo 1
Ajustados
Res
iduo
s
−0.2 −0.1 0.0 0.1
−0.
2−
0.1
0.0
0.1
Modelo 2
Ajustados
Res
iduo
s
−0.3 −0.2 −0.1 0.0 0.1 0.2
−0.
06−
0.02
0.00
0.02
0.04
Modelo 3
Ajustados
Res
iduo
s
−0.10 −0.05 0.00 0.05
−0.
050.
000.
05
Modelo 4
Ajustados
Res
iduo
s
−0.05 0.00 0.05 0.10
−0.
04−
0.02
0.00
0.02
0.04
0.06
Modelo 5
Ajustados
Res
iduo
s
Figura 6.2: Graficos de los residuos con los valores ajustados de los cinco modelos de regresion.
0 10 20 30 40 50 60 70
−2
−1
01
2
Modelo 1
Tiempo
Res
iduo
s es
tand
ariz
ados
0 10 20 30 40 50 60 70
−3
−2
−1
01
2
Modelo 2
Tiempo
Res
iduo
s es
tand
ariz
ados
0 10 20 30 40 50 60 70
−2
−1
01
2
Modelo 3
Tiempo
Res
iduo
s es
tand
ariz
ados
0 10 20 30 40 50 60 70
−2
−1
01
23
Modelo 4
Tiempo
Res
iduo
s es
tand
ariz
ados
0 10 20 30 40 50 60 70
−2
−1
01
23
Modelo 5
Tiempo
Res
iduo
s es
tand
ariz
ados
Figura 6.3: Graficos de los residuos estandarizados de los cinco modelos de regresion.
Oscar Gonzalez Frutos 54
Capıtulo 6. Aplicacion del AFCP
6.5 Conclusion
Los resultados obtenidos en el trabajo ilustran la capacidad de las componentes prin-
cipales funcionales para destacar caracterısticas importantes de un conjunto de series de
tiempo. Extrajimos cinco componentes de cada unas de las expresas que explican un 95 %
de la variabilidad total del Ibex de las ventas de las acciones a lo largo del perıodo anali-
zado. Se obtuvieron grupos de empresas para formular los modelos de regresion multiple
de acuerdo a sus correspondientes correlaciones en terminos de las componentes. Despues
de realizar todos los analisis de ajustes y diagnosticos, a continuacion tenemos los cinco
modelos ajustados mediante regresion lineal multiple que detallamos a continuacion,
ξ(Ibex)i1 = 0,2593ξ(REE)i1 + 0,2906ξ(Tec)i1 + 0,1474ξ(Ace)i1 + 0,197ξ(Acc)i1
ξ(Ibex)i2 = −0,2489ξ(Ferr)i2 + 0,3062ξ(Tec)i2
ξ(Ibex)i3 = 0,5989ξ(BBV A)i3
ξ(Ibex)i4 = 0,2972ξ(Bane)i4 + 0,2879ξ(Bank)i4
ξ(Ibex)i5 = 0,3738ξ(Popu)i5 + 0,1587ξ(Game)i5
Sabemos que se pueden aproximar las curvas del Ibex mediante la Ecuacion 6.7 :
x(Ibex)i(t) =5∑j=1
ξ(Ibex)ijf(Ibex)j(t), i = 1, ..., n (6.7)
Entonces se tiene que los coeficientes de regresion son los coeficientes de la aproxi-
macion del Ibex.
x(Ibex)i(t) = [ξ(Ibex)i1] f(Ibex)1(t) + [ξ(Ibex)i2] f(Ibex)2(t) + [ξ(Ibex)i3] f(Ibex)3(t)
+ [ξ(Ibex)i4] f(Ibex)4(t) + [ξ(Ibex)i5] f(Ibex)5(t), i = 1, ..., n
Oscar Gonzalez Frutos 55
Bibliografıa
Aguilera, A. M. (1993). Metodos de aproximacion de estimadores en el acp de un proceso
estocastico.
Aguilera, A. M., Gutierrez, R., Ocana, F. A., and Valderrama, M. J. (1995). Compu-
tational approaches to estimation in the principal component analysis of a stochastic
process. Applied stochastic models and data analysis, 11(4):279–299.
Akaike, H. (1974). A new look at the statistical model identification. IEEE transactions
on automatic control, 19(6):716–723.
De Boor, C., De Boor, C., De Boor, C., and De Boor, C. (1978). A practical guide to
splines, volume 27. Springer-Verlag New York.
Deville, J.-C. (1974). Methodes statistiques et numeriques de l’analyse harmonique. In
Annales de l’INSEE, pages 3–101. JSTOR.
Escabias, M., Aguilera, A. M., and Valderrama, M. J. (2005). Modeling environmental
data by functional principal component logistic regression. Environmetrics, 16(1):95–
107.
Febrero-Bande, M., de la Fuente, M. O., and de la Fuente, M. M. O. (2013). Package fda.
usc.
Ferraty, F. and Vieu, P. (2006). Nonparametric functional data analysis: theory and
practice. Springer Science & Business Media.
56
Bibliografıa
Fukunaga, R. (1990). Statistical pattern recognition.
Hotelling, H. (1936). Simplified calculation of principal components. Psychometrika,
1(1):27–35.
Mitsch, W. J. G. and James, G. (2000). Wetlands. Technical report, New York, US:
Wiley.
R Core Team (2016). R: A Language and Environment for Statistical Computing. R
Foundation for Statistical Computing, Vienna, Austria.
Ramsay, J. O., Hooker, G., and Graves, S. (2009). Functional data analysis with R and
MATLAB. Springer Science & Business Media.
Ramsay, J. O. and Silverman, B. W. (2002). Applied functional data analysis: methods
and case studies, volume 77. Citeseer.
Ramsay, J. O. and Silverman, B. W. (2005). Functional Data Analysis. Springer.
Rice, J. A. and Wu, C. O. (2001). Nonparametric mixed effects models for unequally
sampled noisy curves. Biometrics, 57(1):253–259.
Schwarz, G. (1978). Estimating the dimension of a model. The annals of statistics,
6(2):461–464.
Seber, G. A. and Lee, A. J. (2003). Linear regression analysis. hoboken. NJ: Wiley. doi,
10:9780471722199.
Valderrama, M. J., Aguilera, A. M., and Ocana, F. A. (2000). Prediccion Dinamica
Mediante Analisis de Datos Funcionales: Introduccion a Los Modelos PCP. La Muralla.
Oscar Gonzalez Frutos 57