M aster en Estad stica Aplicada Departamento de Estad ...

Master en Estadıstica Aplicada

Departamento de Estadıstica e I.O.

Universidad de Granada

“Modelizacion de curvas de rentabilidad del IBEX 35 basada en

Analisis en componentes principales funcional”

Trabajo Fin de Master presentado por:

Oscar Gonzalez Frutos

Dirigidos por los Profesores:

Dr. Mariano Valderrama Bonnet

Dr. Manuel Escabias Machuca

Setiembre de 2016

Introduccion

En el ambito de la estadıstica multivariable muchas veces nos encontramos con

grandes cantidades de datos, ası como tambien de variables que son medibles en el tiempo

como las series cronologicas. La situacion se complica cuando se dispone de variables que

estan altamente correladas que normalmente ocurre con las series temporales o cuando los

datos no son numerables como es el caso de los procesos estocasticos en tiempo continuo.

El Analisis en Componentes Priciples (ACP) es probablemente la tecnica mas po-

pular de la estadıstica multivariada y es utilizada en la mayor parte de las disciplinas

cientıficas en las que se manejan informacion cuantitativa cuyo objetivo es realizar trans-

formaciones lineales para obtener un conjunto de variables de menor dimension. El metodo

Analisis Funcional en componentes Principales (AFCP) es una extension del ACP clasico

en el que las componentes principales estan representadas por funciones y no por vectores.

En este trabajo el objetivo es modelizar la serie del Ibex a partir de las empresas

que la componen. Los datos que se utilizara son del El IBEX 35 que es el principal ındice

bursatil de referencia de la bolsa espanola elaborado por Bolsas y Mercados Espanoles

(BME). Esta formado por las 35 empresas con mas liquidez que cotizan en el Sistema

de Interconexion Bursatil Electronico (SIBE) en las cuatro bolsas espanolas (Madrid,

Barcelona, Bilbao y Valencia).

En el Capıtulo 1 tenemos una introduccion al ADF, empezando con la definicion, los

objetivos del ADF como tambien la representacion funcional a partir de datos discretos

i

y estudiando algunas bases de funciones usuales, enfatizando en los splines cubicos, que

es lo que se utilizara en este trabajo para la aproximacion de las funciones.

En el Capıtulo 2 la aproximacion de los coeficientes basicos, dependiendo de que el

predictor sea observado con error o sin error, luego el Capıtulo 3 sobre las teorıas AFCP,

resaltando el proceso estocastico de segundo orden que sera la base para el AFCP y sus

estimaciones puntuales como la media, la covarianza , sus valores y factores principales.

El Capıtulo 4 desarrollamos las teorıas mas importante del Analisis de Regresion

Multiple, porque aplicaremos esta tecnica luego de obtener las componentes principales

para estudiar la relacion existente entre la empresa Ibex con las demas empresas en

terminos de las componentes principales como la estimacion de los parametros, ajuste,

contrastes de significacion y prediccion.

Actualmente existen numerosos paquetes implementados en el programa estadısti-

co R que tienen incorporado el metodo del analisis en componentes principales, en este

trabajo se empleo fundamentalmente el paquete fda, en el Capıtulo 5 tenemos una des-

cripcion basica del paquete fda resaltando lo mas importante ası como tambien algunos

ejemplos implementados en R.

En el Capıtulo 6 entramos en la parte de la aplicacion real de la teorıa desarrollada en

los capıtulos anteriores estudiando las cotizaciones diarias en la bolsa espanola, utilizando

Regresion Lineal Multiple en terminos de las componentes principales funcionales y por

ultimo aproximamos las curvas del Ibex, mediante las funciones obtenidas.

Oscar Gonzalez Frutos ii

Indice general

Introduccion I

Indice general III

1 Analisis de datos funcionales 1

1.1 Representacion de datos funcionales . . . . . . . . . . . . . . . . . . . . . 3

1.2 Bases de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Estimacion de los coeficientes basicos 10

2.1 Aproximacion por mınimos cuadrados . . . . . . . . . . . . . . . . . . . . 11

2.2 Interpolacion B-splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3 Proyeccion ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3 Analisis funcional en componentes principales 16

3.1 Procesos estocasticos de segundo orden . . . . . . . . . . . . . . . . . . . 16

3.2 Analisis en componentes principales de un proceso estocastico . . . . . . 17

iii

Indice general

3.3 Estimacion puntual del AFCP . . . . . . . . . . . . . . . . . . . . . . . . 20

4 Analisis de regresion multiple 23

4.1 Estimacion de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.2 Bondad de Ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4.3 Contrastes de significacion . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.4 Prediccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5 Analisis de datos funcionales en R 35

5.1 Descripcion basica del paquete fda . . . . . . . . . . . . . . . . . . . . . 36

5.2 Implementacion en el programa R . . . . . . . . . . . . . . . . . . . . . . 38

6 Aplicacion del AFCP 44

6.1 Descripcion de la base de datos . . . . . . . . . . . . . . . . . . . . . . . 44

6.2 Tratamiento de datos funcionales . . . . . . . . . . . . . . . . . . . . . . 46

6.3 Ajustes de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

6.4 Validacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

6.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

Bibliografıa 56

Oscar Gonzalez Frutos iv

Capıtulo 1

Analisis de datos funcionales

Analisis de datos funcionales (ADF) es una tecnica muy reciente en el ambito de la

estadıstica que trabaja con muestras de funciones aleatorias, la herramienta estadıstica

que sustenta de manera teorica el analisis de datos funcionales es la de los procesos

estocasticos.

En la practica se dispone de observaciones discretas de las curvas muestrales a partir

de las cuales se reconstruye la forma funcional. De este modo se mantienen las propiedades

de las variables continuas y por ende se pierde menos informacion. Una de las ventajas

mas importantes del ADF, es que tiene hipotesis menos exigentes comparados con otras

tecnicas clasicas como analisis de series temporales que imponen, entre otras hipotesis,

que el proceso sea estacionario, las observaciones igualmente espaciadas y la pertenencia

del proceso a una clase especıfica.

En general, cualquier observacion de una magnitud continua como el tiempo u otros

se puede tomar como un dato funcional, pero la definicion formal de una variable aleatoria

funcional la encontramos en Ferraty and Vieu (2006) que dice:

Definicion 1.1 Una variable aleatoria X definida sobre un espacio de probabilidad (Ω, A, P )

se dice que es funcional si toma valores en un espacio funcional, es decir, un espacio nor-

1

Capıtulo 1. Analisis de datos funcionales

mado o seminormado completo. El espacio mas utilizado en datos funcionales, que es el

que vamos a considerar en este trabajo, es el espacio L2[T ] de las funciones de cuadrado

integrable en el intervalo real T definido por:

L2(T ) =

f : T −→ < :

∫T

f 2(t)dt <∞,

con el producto escalar usual dado por:

〈f, g〉 =

∫T

f(t)g(t)dt ∀f, g ∈ L2(T ) (1.1)

donde L2(T ) tiene estructura de espacio de Hilbert.

Cuando nos referimos al espacio L2(T ) podemos imaginar que estamos trabajando

con un vector de infinitas componentes, una para cada valor t ∈ <. El producto escalar

entonces sera la suma del producto de las infinitas componentes de f y g. Teniendo en

cuenta que la distancia entre componente y componente es infinitesimal, el producto

escalar se expresa a traves de integrales.

Los objetivos de analisis de datos funcionales son esencialmente las mismas que las de

cualquier otra rama de la estadıstica, vease Ramsay and Silverman (2005). A continuacion

detallamos esos objetivos:

• Representar los datos de manera que ayuden a un analisis mas detallado.

• Mostrar los datos con el fin de poner de relieve varias caracterısticas.

• Estudiar la presencia de patrones y variaciones entre los datos.

• Explicar la variacion en una variable dependiente (output) en terminos de la informa-

cion proporcionada por una variable independiente (input).

Oscar Gonzalez Frutos 2


• Comparar dos o mas series de datos con respecto a ciertos tipos de variacion, donde dos

conjuntos de datos puedan tener distintas replicas de las mismas funciones, o distintas

funciones para un conjunto de replicas comunes.

Como dijimos al principio el analisis de datos funcionales tiene diversas aplicacio-

nes y podemos encontrar por ejemplo en Valderrama et al. (2000) donde se construye

un modelo PCP para predecir la rentabilidad en la Bolsa de Madrid de los tıtulos del

sector Bancos a partir de series cronologicas de seis bancos muestreados aleatoriamente

de dicho grupo. Otros ejemplos interesantes de datos funcionales aparecen en Mitsch and

James (2000) y Rice and Wu (2001). El libro de Ramsay and Silverman (2002) considera

diferentes aplicaciones para ilustrar la forma funcional de datos, tiene una amplia gama

de temas como la criminologıa, la economıa, la arqueologıa, la reumatologıa, la psicologıa,

la biomecanica y la educacion, entre otros.

1.1 Representacion de datos funcionales

El primer paso en ADF es reconstruir la verdadera forma funcional de las curvas

muestrales a partir de sus observaciones discretas. El modo mas usual de resolver este

problema consiste en asumir un desarrollo de cada curva muestral en terminos de una

base de funciones y aproximar los coeficientes basicos utilizando un suavizado o una

interpolacion.

Definimos ahora la variable funcional X que es un proceso estocastico de una mag-

nitud continua X(t) : t ∈ T. Se dice que es de segundo orden si todas sus variables

pertenecen al espacio L2(T ) de cuadrado integrable con el producto escalar usual dado

por la Ecuacion 1.1, es decir,

〈f, g〉 =

∫T

f(t)g(t)dt ∀f, g ∈ L2(T )



Ademas, un proceso estocastico de segundo orden X(t), t ∈ T es continuo de media

cuadratica si verifica:

lımh−→0

E[(X(t+ h)−X(t))2

]= 0, ∀t ∈ T

Las curvas muestrales en la practica son observadas como conjuntos de puntos finitos

como por ejemplo el tiempo puede ser observado en dıas, meses o anos, la idea es recons-

truir esas trayectorias muestrales a partir de las observaciones discretas con el objetivo

de obtener el mejor ajuste a partir de los datos, conviene destacar tambien que los datos

no necesariamente tienen que estar igualmente espaciados ni que tengan registros en los

puntos considerados.

Consideremos ahora una muestra de trayectorias muestrales x1(t), x2(t), ..., xn(t) que

se puede ver como las observaciones de un proceso estocastico X(t) : t ∈ T. A partir

de ahora, vamos a suponer que este proceso estocastico es de segundo orden, continuo en

media cuadratica y las funciones pertenecen al espacio de Hilbert L2(T ) de funciones de

cuadrado integrable.

Dado que en la practica es imposible observar un conjunto de funciones de manera

continua en el tiempo, sin embargo, en lugar de eso por lo general podemos obtener ob-

servaciones de tales funciones en diferentes momentos del tiempo ti0, ti1, ..., timi∈ T, i =

1, ..., n y con un numero diferente de observaciones para cada individuo, es decir, la in-

formacion de la muestra esta dada por los vectores xi = (xi0, xi1, ..., ximi)′ siendo xik el

valor observado de la trayectoria de la muestra en el momento tik(k = 0, ...,mi).

Con el fin de reconstruir la forma funcional de las trayectorias muestrales se con-

sideraran representaciones de las curvas muestrales en terminos de base de funciones.

Para reconstruir la forma funcional de las trayectorias muestrales a partir de los datos

discretos observados, se pueden utilizar varios metodos dependiendo del modo en que se

han obtenido dichos datos en tiempo discreto y la forma que esperamos que tengan las



funciones. En cualquier caso, es usual suponer que las trayectorias muestrales pertenecen

a un espacio de dimension finita generado por una base φ1(t), ..., φp(t), de modo que se

pueden expresar como:

xi(t) =

p∑p=1

aipφp(t) i = 1, ..., n (1.2)

1.2 Bases de funciones

Generalmente se utilizan las bases de B-splines porque tienen un mejor comporta-

miento local que las trigonometricas y polinomicas, de ahı su popularidad, siendo las mas

utilizadas los splines cubicos que son adecuadas para el caso de trayectorias regulares, sin

embargo, la eleccion depende de la naturaleza de los datos muestrales. A continuacion se

detallan las bases de funciones mas utilizadas.

A) B-splines

Las bases mas utilizadas para datos no periodicos son los B-splines, son curvas po-

linomicas unidas a trozos que tienen una forma suave y continuamente diferenciables,

existen muchas maneras de construir estas funciones, pero la mas popular son los

sistemas de bases B-spline desarrollado por De Boor et al. (1978) y esta implemen-

tado en una amplia gama de lenguajes de programacion, incluyendo R, S-PLUS y

MATLAB.

Existe un metodo recursivo utilizando el algoritmo De Boor que permite obtener las

funciones B-Spline de orden r a partir de las de orden r − 1, despues de ampliar la

particion de nodos originales en la forma t−3 < t−2 < t−1 < t0 < ... < tk < tk+1 <

tk+2 < tk+3, dado por

Bi,1(t) =

1 ti−2 ≤ t ≤ ti−1, i = −1, 0, 1, ..., k + 4

0 otro caso



Bi,r(t) =t− ti−2

ti+r−3 − ti−2Bi,r−1(t) +

ti+r−2 − tti+r−2 − ti−1

Bi+1,r−1(t)

r = 2, 3, ...; i = −1, 0, ..., k − r + 5

(1.3)

Para splines cubicos, vease en Valderrama et al. (2000), tienen nodos igualmente

espaciados dentro del intervalo [0, T ], es decir, tj = h × j, siendo h = T/k, si bien

esta condicion de equidistancia entre nodos no es, en absoluto, necesaria. Denotemos

S3(π) al espacio de dimension k + 3 de los splines cubicos sobre la particion π y

consideraremos en el la base de B-splines, los cuales, insertando seis nodos adicionales

en π : t−3 < t−2 < t−1 < t0 < ... < tk < tk+1 < tk+2 < tk+3, se definen de la forma:

Bi(t) =

(t− ti−2)3/h3, t ∈ [ti−2, ti−1]

1 + 3h−1(t− ti−1) + 3h−2(t− ti−2)2 − 3h−3(t− ti−1)3, t ∈ [ti−1, ti]

1 + 3h−2(ti+1 − t) + 3h−2(ti+1 − t)2 − 3h−3(ti+1 − t)3, t ∈ [ti, ti+1]

(ti+2 − t)3/h3, t ∈ [ti+1, ti+2]

0, t 6∈ [ti−2, ti+2]

Ası, la base de S3(π) sera B−1(t), B0(t), B1(t), ..., Bk(t), Bk+1(t), y facil observar

que todas estas funciones pertenecen a la clase C2[0, T ]; ademas verifican:

Bi(tj) =

4, si j = 1

1, si j = 1 o j = i+ 1

0, si j 6= i, i− 1, i+ 1

Por tanto, cada trayectoria del proceso se interpola en los puntos (tj, Xw(tj) mediante

el spline cubico

IXw(t) =k+1∑i=−1

γi(w)Bi(t) (1.4)



Para que este problema de tipo interpolatorio tenga solucion unica es necesario anadir

como condicion adicional que todas las funciones muestrales del proceso admitan

derivada de segundo orden en los extremos del intervalo [0, T ].

Podemos observar un ejemplo en la Figura 1.1 B-splines definido en el intervalo [0, 10],

que tienen polinomios de orden 2, orden 3 y orden 4 respectivamente construidos en el

programa R. El que corresponde a splines cubicos es la que tiene polinomio de orden

4.

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

Orden 2

t

B(t

)

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

Orden 3

t

B(t

)

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

Orden 4

t

B(t

)

Figura 1.1: B- Splines igualmente espaciados de diferentes ordenes en el intervalo [0, 10].

B) Bases de Fourier

Generalmente las bases de Fourier son utilizadas cuando las trayectorias a estimar

son regulares y periodicas, sin embargo, presentan inconvenientes cuando se sospecha

que existe algun grado de discontinuidad en las trayectorias a aproximar. Esta dada

por la siguiente expresion:

1, sin(ωt), cos(ωt), sin(2ωt), cos(2ωt), ..., sin(kωt), cos(kωt), ....



En la figura Figura 1.2 podemos observar K = 5 funciones de base de Fourier cons-

truido en el programa R con un perıodo de 12.

0 2 4 6 8 10 12

−0.

4−

0.2

0.0

0.2

0.4

t

B(t

)

Figura 1.2: Funciones de base de Fourier construido en el programa R con un perıodo de 12

C) Bases wavelets

Mencionaremos ahora a las bases wavelets que son muy utilizadas como funciones

basicas a la hora de representar los datos funcionales. Una base de wavelets se obtiene

mediante dilataciones y traslaciones de una funcion madre apropiada φ

φkj(t) = 2k/2φ(2ky − j),

con h, j y k enteros. A diferencia de las bases de Fourier, las bases wavelests no

asumen que los datos sean periodicos. Se utilizan sobre todo para representar curvas

muestrales con un caracter local muy fuerte.



D) Bases de potencias y exponenciales

Las bases de funciones compuestas por monomios que se utilizan para construir series

de potencias y tiene la siguiente forma:

1, t, t2, ..., tk, ... k = 1, 2, ...

Los sistemas de base exponencial consisten en una serie de funciones exponenciales,

eλ1t, eλ2t, ..., eλjt j = 1, 2, ...

donde, los parametros λj son todos distintos, y a menudo λ1 = 0. Las ecuaciones

diferenciales lineales con coeficientes constantes tienen como soluciones, expansiones

en terminos de bases exponenciales.


Capıtulo 2

Estimacion de los coeficientes basicos

Despues de elegir la base adecuada para la forma funcional de las trayectorias mues-

trales se pueden presentar dos tipos de observaciones que pueden ser: con error o sin

error.

Si el predictor es observado con error tendrıa la siguiente forma:

xik = xi(tik) + εk k = 0, ...,mi, (2.1)

Se supone que εk tiene media cero, varianza constante, y la covarianza cero para valores

de argumentos distintos, para la aproximacion de los coeficientes basicos podemos uti-

lizar algun metodo de suavizacion como aproximacion mınimos cuadrados o proyeccion

ortogonal.

Por otro lado, si tenemos en cuenta que los datos se observan sin error en este caso

podrıamos utilizar algun metodo de interpolacion como por ejemplo los splines cubicos.

La ecuacion tendrıa la siguiente forma:

xik = xi(tik) k = 0, ...,mi, (2.2)

10

Capıtulo 2. Estimacion de los coeficientes basicos

Ambos metodos, suavizacion e interpolacion, nos permiten obtener la forma funcio-

nal de las trayectorias muestrales mediante la aproximacion de los coeficientes basicos aip

de la Ecuacion 1.2 a partir de las observaciones discretas.

A continuacion presentamos los diferentes metodos de aproximacion de los coeficien-

tes basicos.

2.1 Aproximacion por mınimos cuadrados

Mınimos cuadrados es una tecnica de analisis numerico enmarcada dentro de la op-

timizacion matematica, se intenta encontrar la funcion continua, dentro de dicha familia,

que mejor se aproxime a los datos (un “mejor ajuste”), de acuerdo con el criterio de

mınimo error cuadratico.

Supongamos que tenemos observaciones para una sola curva,

yi = xti + ε

y queremos estimar,

x(t) ≈k∑j=1

cjφj(t)

la idea de la aproximacion de mınimos cuadrados consiste en minimizar la suma de los

errores al cuadrado de:

SSE =n∑i=1

(yi − x(ti))2 =

n∑i=1

(yi − Φ(ti)c)2

Para el ajuste de curvas a los datos discretos xik, utilizamos la Ecuacion 2.1, se

consideraran que los errores son independientes y estan identicamente distribuidos. Ex-



presando en terminos de bases de funciones tenemos la Ecuacion 1.2, es decir,

xi(tk) =

p∑p=1

aipφp(tk) k = 0, ..., K i = 1, ..., N

expresando en forma matricial tenemos,

xi = Φiai (2.3)

donde ai = (ai1, ..., aip)′ y Φi = (φ(tk))K×P y xi el vector que representa a los vectores con

los datos discretos observados como xi = (xi1, ..., xik)′, donde los coeficientes de la expre-

sion basica, aip, se aproxima mediante el criterio de mınimos cuadrados. Matricialmente

viene dado por:

ECM(xi|ai) = (xi − Φiai)′(xi − Φiai)

derivando con respecto a ai e igualando a cero se obtiene,

2ΦΦ′iai − 2Φ′ixi = 0

una vez resuelto esta ecuacion para ai, tenemos el estimador de mınimos cuadratico del

vector de coeficientes basicos ai dado por:

ai = (Φ′iΦi)−1Φ′ixi

y por ultimo se ha calculado el vector xi con los valores aproximados y la curva ajustada

por:

xi = Φiai = Φi(Φ′iΦi)

−1Φ′ixi

de modo que cada curva muestral es aproximada por:

xi(t) = a′iφ(t) (2.4)



2.2 Interpolacion B-splines

Como dijimos anteriormente los splines cubicos son los mas utilizados para datos

no periodicos dado que es la interpolacion mas natural de las trayectorias del proceso

cuando son regulares, es decir continuas y diferenciables. Este metodo sirve cuando los

datos fueron observados sin error representados en la Ecuacion 2.2.

Vamos a considerar los mismos tiempos de observacion t0 < t1 < ... < tk pa-

ra todas las trayectorias muestrales (Ki = K, ∀i). Cuando se realiza interpolacion

spline cubico la curva ajustada pasa por todos los puntos y la dimension de la base

coincide con el numero de las observaciones de cada curva mas dos. Entonces, la fun-

cion spline cubico que interpola a cada una de las trayectorias muestrales xi(t) sobre

los nodos de observacion, se puede expresar en terminos de la base de B-splines cubicos

B−1(t), B0(t), B1(t), ..., Bk(t), Bk+1(t) en la forma

xi(t) =k+1∑j=−1

aijBj(t),

donde los coeficientes basicos se obtienen resolviendo el siguiente sistema de ecuacion

lineal

xik = xi(tk) =k+1∑j=−1

aijBj(tk) k = 0, ...,m. (2.5)

La Ecuacion 2.5 es un sistema de ecuaciones que contiene (m+1) ecuaciones y (m+3)

variables. Dependiendo de las condiciones impuestas, la interpolacion spline cubico recibe

varios nombres. A continuacion mencionamos los distintos nombres y condiciones que

reciben.

A) Spline cubico natural

Es la mas usada y lo que se va considerar en este trabajo, la cual impone que la

derivada de segundo orden del spline de interpolacion sea cero en los nodos extremos



del intervalo [0, T ] , es decir,

x′′i (t0) = 0

x′′i (tk) = 0(2.6)

Aquı si consideramos todas las curvas muestrales para el spline cubico natural x1(t), ..., xn(t)

observadas en los nodos t0, ..., tm, la Ecuacion 2.5 y las condiciones dado en la Ecua-

cion 2.6 nos lleva a XI = AB′ donde A es una matriz cuyas filas son los coeficientes

basicos de cada una de las trayectorias muestrales interpoladas xi(t), XI = (0|χ|0)

con 0 = (0, ..., 0)′ y χn×(m+1) = [xi(tk)], i = 1, ..., n, k = 0, ...,m, con B definido

por:

B =

B2)−1(t0) B

2)0 (t0) · · · B

2)m+1(t0)

B−1(t0) B0(t0) · · · Bm+1(t0)

......

......

B−1(tm) B0(tm) · · · Bm+1(tm)

B2)−1(tm) B

2)0 (tm) · · · B

2)m+1(tm)

(2.7)

donde B2)i (t) es la derivada de segundo orden del i-esimo B-spline en el tiempo t. Al

resolver la Ecuacion 2.7 se obtiene la matriz A con el resultado de la aproximacion

de los coeficientes basicos de todas las trayectorias muestrales, dada por:

A = X(B′)−1

B) Spline cubico periodico

Se llama spline cubico periodico si recibe la condicion

x′i(t1) = x′i(tk)

x′′i (t1) = x′′i (tk)



C) Cuasi natural

Es otro tipo de interpolacion introducida por Escabias et al. (2005) donde se propone

interpolacion cuasi natural, que utiliza valores generados uniformemente (proximos

a cero) como condiciones lımite, donde se abordo problemas de regresion logıstica

funcional y analisis de componentes principales. Aquı la matriz de interpolacion es

XI = (u1|χ|u2) donde tanto u1 como u2 son vectores de valores uniformemente gene-

rados en el intervalo [0, 1].

2.3 Proyeccion ortogonal

Otra tecnica de suavizacion para estimar los coeficientes basicos es la de la proyec-

cion ortogonal que consiste en aproximar cada curva muestral por su proyeccion ortogonal

sobre el subespacio de L2(T ) generado por una base ortonormal φ1(t), ..., φp(t) . Esta

tecnica resulta particularmente adecuada cuando tenemos alguna informacion adicional

sobre la naturaleza de la solucion exacta, vease en Aguilera (1993). La proyeccion orto-

normal de cada curva muestral xi(t) en este subespacio p-dimensional viene dado por:

Pp [xi(t)] =

p∑j=1

[∫T

xi(t)φj(t)dt

]φj(t) i = 1, ..., n j = 1, ..., p

El problema es estimar los coeficientes base aij =∫Txi(t)φj(t)dt a partir de obser-

vaciones en tiempo discreto de las trayectorias muestrales.

Se puede aproximar numericamente y consiste en aplicar metodos de cuadratura

compuesta, como el metodo de integracion de Romberg. Para aplicar este metodo es ne-

cesario aproximar los valores de las funciones muestrales en particiones cada vez mas finas

del intervalo de observacion. Estos valores pueden ser aproximados mediante interpolacion

spline cubica natural, vease en Aguilera et al. (1995).


Capıtulo 3

Analisis funcional en componentes

principales

Analisis Funcional en Componentes Principales (AFCP) es una extension del Ana-

lisis en Componentes Principales (ACP) donde las componentes principales estan repre-

sentadas por vectores. Hotelling (1936) definio las componentes principales como combi-

naciones lineales de las variables originales, ası obtenemos un nuevo conjunto de variables

denominadas componentes principales.

El objetivo del ACP clasico es transformar un conjunto de variables originales, en un

nuevo conjunto de variables de menor dimension denominadas componentes principales

que se caracterizan por estar incorreladas entre sı, al igual que para en el caso ACP clasico,

en el AFCP el objetivo es tambien reducir la dimension de las variables del proceso.

3.1 Procesos estocasticos de segundo orden

Dado el proceso estocastico x(t), t ∈ [0, T ] definidos sobre el espacio probabilıstico

(Ω, A, P ), de segundo orden, continuo en media cuadratica y cuyas trayectorias pertenecen

16

Capıtulo 3. Analisis funcional en componentes principales

al espacio de Hilbert L2(T ) de funciones de cuadrado integrable con producto escalar

definido por:

〈f, g〉 =

∫T

f(t)g(t)dt ∀f, g ∈ L2(T )

llamaremos µ(t) a su funcion media y C(t, s) a su funcion covarianza. A continuacion

presentamos las siguientes funciones:

• Funcion media

µ(t) = E[X(t)]

• La funcion de varianza

V (t) = E[(X(t)− µ(t))2]

• La funcion de covarianza

C(t, s) = E[(X(t)− µ(t))(X(s)− µ(s))]

3.2 Analisis en componentes principales de un pro-

ceso estocastico

Sin perdida de generalidad se asume que la funcion media del proceso es constante

e igual a cero, µ(t) = 0 , ∀t ∈ T y si el proceso no fuese centrado se obtendrıa mediante

AFCP del proceso centrado X(t)− µ(t).

Asociado a la funcion de covarianza del proceso C(t, s), se define el operador de

covarianza R : L2(T ) −→ L2(T ) dado por:

R[f(t)] =

∫ T

0

C(t, s)f(s)ds ∀f ∈ L2(T ) (3.1)



donde el operador R es compacto, autoadjunto y positivo (Deville, 1974). Como conse-

cuencia a estas propiedades, el teorema de Mercer da la siguiente representacion unifor-

memente convergente para la funcion de covarianza.

C(t, s) =∑i

λifi(t)fi(s), ∀t, s ∈ [0, T ], (3.2)

siendo λi la sucesion decreciente de valores propios de C y fi la sucesion de de funciones

propias de C asociadas a los λi que constituyen una base ortonormal en L2[0, T ] . Es

decir, forman un conjunto ortonormal completo de soluciones de la ecuacion

∫ T

0

C(t, s)fi(s)ds = λifi(t)

Entonces se obtiene la siguiente representacion ortonormal del proceso. Sea ξi la

familia de variables aleatorias definida por:

ξi =

∫T

fi(t)X(t)dt

Los componentes principales ξi se definen como combinaciones lineales generaliza-

das de la variable funcional que tienen las siguientes propiedades: son incorreladas entre

sı, tienen maxima varianza y estan normalizadas.

Ası, la funcion peso f1 asociada a la primera componente principal se obtiene bus-

cando la combinacion lineal generalizada de varianza maxima. La j-esima componente

principal se obtiene se obtiene resolviendo la optimizacion MaxV ar[ξ] y teniendo en

cuenta las siguientes restricciones:

‖ f(t) ‖= 1 y

∫T

f(t)fi(t)dt = 0 ∀i = 1, ..., j − 1



Por lo tanto, la j-esima componente principal viene dada por:

ξj =

∫T

X(t)fj(t)dt,

siendo el autovalor asociado la varianza de la componente principal

λj = V ar[ξi]

La mejor aproximacion en media cuadratica de X(t) dada por Fukunaga (1990),

truncado en q-esimo termino del desarrollo de Karhunen- Loeve.

Xq(t) =

q∑i=1

fi(t)ξi

y proporciona una representacion ortogonal de la variable funcional en terminos de las q

primeras componentes principales.

Varianza total X(t) : t ∈ T

VT =

∫T

C(t, t)dt =∞∑j=1

λj

la proporcion de varianza acumulada esta dada por la expresion:

V q =

∑qi=1 λiVT

,

En la practica, la informacion proporcionada por las variables del proceso quedara

resumida en las primeras componentes principales tales que la suma de las varianzas sea

cercano como posible a 1.



3.3 Estimacion puntual del AFCP

A continuacion se presenta un resumen de estimacion del AFCP a partir de la

informacion obtenida por una muestra de trayectorias del proceso x1(t), x2(t), ..., xN(t)

del proceso estocastico X(t) : t ∈ T. Las demostraciones de los siguientes resultados se

pueden encontrar, vease en Aguilera (1993).

A) Estimacion puntual de la media del proceso

Sin perder generalidad asumimos que las curvas observadas estan centradas, entonces

la media muestral igual a cero y viene dada por la siguiente expresion:

xi =1

N

N∑i=1

xi(t) = 0

A continuacion se detallan sus principales propiedades:

• x es un estimador insesgado para µ, es decir E[x] = µ.

• x converge casi seguramente a µ.

• x converge en media cuadratica a µ.

• x es un estimador consistente para µ.

B) Estimacion puntual de la covarianza del proceso

El estimador natural de la funcion de covarianza es la funcion de covarianza muestral

definida por:

C(t, s) =1

N − 1

N∑i=1

[xi(t)− x(t)][xi(s)− x(s)]

Sus principales propiedades son:

• C es un estimador insesgado para C, es decir E[C(t, s)] = C(t, s).

• C converge casi seguramente a C.



• C converge en media cuadratica a C.

• C es un estimador consistente para C.

C) Estimacion puntual de los valores y factores principales

Una vez demostrados que C converge en media cuadratica a C, es natural pensar

que los elementos propios de C seran buenos estimadores de los de C cuando N

sea grande. Si denotamos por J al conjunto de ındices de los valores propios de

C; Ji = j ∈ J , λj = λi, cuyo cardinal es la multiplicidad ki del valor propio λi; y

J ′ = i ∈ J, Ji = i siendo su cardinal igual al numero de valores propios simples

de C.

En general, si λi es un valor propio de C con multiplicidad ki, el estimador natural

de λi se define promediando los correspondientes valores propios de C en la siguiente

forma:

λi =1

ki

∑j∈Ji

λj

al que llamaremos i-esimo valor principal muestral. En el caso particular en que λi es

un valor propio simple de C el i-esimo valor principal muestral es λi, el i-esimo valor

propio de C.

Analogamente, si fi es la familia ortonormal de funciones propias de C asociada

a la sucesion decreciente de sus valores propios λi, estimaremos la i-esima funcion

propia fi mediante la i-esima funcion propia fi de C asociada al i-esimo valor propio

de λi, eligiendo fi de modo que 〈fi, fi〉 ≥ 0, y lo denominaremos i-esimo factor

principal muestral. Es necesario recordar que si no todos los λi son simples, entonces

los factores principales fi no estan determinados de forma unica, y por lo tanto sus

estimadores fi tampoco.

A continuacion las propiedades mas importantes de los valores propios muestrales:

• λi son, en general, estimadores sesgados, es decir: E[λi] 6= λi.

• Para cada i ∈ J , el estimador λi converge casi seguramente al i-esimo valor principal

de λi.



• Para cada i ∈ J ′, el estimador λi converge en media cuadratica al i-esimo valor

principal de λi y , en consecuencia, λi es un estimador consistente para λi.

Analogamente, las propiedades mas importantes de los factores principales muestra-

les,

• Para cada i ∈ J ′, el estimador fi converge casi seguramente al i-esimo valor principal

de fi.

• Para cada i ∈ J ′, es decir para cada valor propio de multiplicidad uno, el estimador

fi converge en media cuadratica al i-esimo factor principal fi, y como consecuencia,

fi es un estimador consistente para fi.

Despues de obtener los buenos estimadores para los valores y factores principales es-

timaremos los componentes principales del proceso. Entonces, la j-esima componente

principal muestral es un vector de dimension N cuyas componentes vienen dadas por:

ξij =

∫ T

0

xi(t)fj(t)dt, i = 1, 2, ..., N


Capıtulo 4

Analisis de regresion multiple

En este trabajo la idea que se llevara a cabo es el de modelo regresion lineal donde

se dispondra de variables dependientes funcionales Y (t) y variables independientes fun-

cionales x1(t), x2(t), ..., xk(t) que son componentes principales respectivamente, entonces

obtendrıamos la siguiente expresion:

Yi(t) = β0(t) +k∑j=1

Xij(t)βj(t) + εi(t) i = 1, 2, ..., n (4.1)

La Ecuacion 4.1 esta en notacion escalar y se puede expresar en forma matricial,

segun Seber and Lee (2003) la ecuacion de regresion lineal se puede expresar matricial-

mente escribiendo las n ecuaciones de la forma:

Y1

Y2

...

Yn

=

x10 x11 x12 · · · x1,p−1

x20 x21 x22 · · · x2,p−1

......

......

...

xn0 xn1 xn2 · · · xn,p−1

β0

β1

...

βp−1

+

ε0

ε1

...

εn

(4.2)

23

Capıtulo 4. Analisis de regresion multiple

o de forma equivalente

Y = Xβ + ε, (4.3)

donde, Y es un vector (N × 1) de las observaciones, X es una matriz (n × p) de

los niveles de las variables independientes, β es un vector (p × 1) de los coeficientes de

regresion y ε es un vector (n× 1) de los errores aleatorios. A continuacion analizaremos

los puntos importantes dentro del analisis de regresion multiple.

4.1 Estimacion de parametros

Es mas sencillo resolver las ecuaciones normales si se expresan en forma matricial, en-

tonces procederemos de esa forma utilizando la Ecuacion 4.3 y suponiendo que el termino

del error ε del modelo tiene E(ε) = 0 y V (ε) = σ2 y que las εi son variables aleatorias

independientes. A continuacion detallamos los siguientes metodos de mınimos cuadrados

y maxima verosimilitud.

A) Metodo de mınimos cuadrados

Se quiere encontrar el vector de los estimadores de mınimos cuadrados β que minimize

la expresion:

L =n∑i=1

ε2i = ε′ε = (Y −Xβ)′(Y −Xβ)

L tambien se puede expresar de la siguiente manera:

L = Y ′Y − 2β′X ′Y + β′X ′Xβ

ya que β′X ′Y es una matriz (1× 1, o un escalar, y su transpuesta (β′X ′Y )′ = Y ′Xβ

es el mismo escalar. Los estimadores de mınimos cuadrados deben satisfacer,

∂L

∂β

∣∣∣∣β

= −2X ′Y + 2X ′Xβ = 0



y simplificando se obtiene:

X ′Xβ = X ′Y (4.4)

La Ecuacion 4.4 es la forma matricial de las ecuaciones normales de mınimos cua-

drados. Para resolver las ecuaciones normales, ambos miembros de la Ecuacion 4.4 se

multiplican por la inversa de XX ′ , por lo tanto el estimador de mınimos cuadrados

de β esta dada por la siguiente expresion:

β = (X ′X)−1X ′Y

El modelo de regresion ajustado en notacion matricial es

Y = Xβ

La diferencia entre la observacion real Yi y el valor ajustado Yi es el residual, es decir,

εi = Yi − Yi . El vector (n× 1) de los residuales se denota por

ε = Y − Y

B) Estimador de maxima verosimilitud

La estimacion por maxima verosimilitud de β y σ2 en el modelo de la Ecuacion 4.3, se

toman como estimadores a aquellos valores que maximizan la probabilidad de obtener

las observaciones de una muestra dada.

Vamos a ver el procedimiento para obtener los estimadores de maxima verosimilitud

β y σ2 . De acuerdo con los supuestos del MLC

ε ∼ N(0, σ2I)

La esperanza y la varianza de la distribucion de Y estan dadas por



E(Y ) = E[Xβ + ε] = Xβ + E[ε] = Xβ

V ar(Y ) = E [(Y −Xβ)(Y −Xβ)′] = E [εε′] = σ2I

Por lo tanto,

Y ∼ N(Xβ, σ2I) (4.5)

La funcion de densidad de Y (o funcion de verosimilitud), considerando X e Y fijas

y β y σ2 variables, sera de acuerdo con la Ecuacion 4.5 igual a

L = f(Y |β, σ2) =1

(2πσ2)n/2exp

[−(1/2σ2)(Y −Xβ)′(Y −Xβ)

]Dado que el maximo para L se alcanza en el mismo punto que ln(L), por ser la funcion

logaritmo monotona, podemos, a efectos de maximizacion, trabajar con ln(L) en lugar

de con L. Entonces,

ln(L) = −nln(2π)

2− nln(σ2)

2− 1

2σ2− (Y −Xβ)′(Y −Xβ) (4.6)

Para maximizar ln(L), hay que derivar con respecto a β y σ2:

∂ln(L)

∂β= − 1

2σ2(−2X ′Y + 2X ′Xβ) (4.7)

∂ln(L)

∂σ2= − n

2σ2+

(Y −Xβ)′(Y −Xβ)

2σ4(4.8)

Igualando a cero la Ecuacion 4.7, vemos que el estimador de maxima verosimilitud

de β, denotado por β , satisface que

X ′Xβ = X ′Y



Como se supone que XX ′ es invertible, tenemos que

β = [X ′X]−1

X ′Y

En consecuencia, el estimador de maxima verosimilitud de β, bajo los supuestos del

MLC, coincide con el estimador MCO, es decir,

β = β

Por lo tanto,

(Y −Xβ)′(Y −Xβ) = (Y −Xβ)′(Y −Xβ) = ε′ε (4.9)

Igualando la Ecuacion 4.8 a cero y sustituyendo β por β , obtenemos:

− n

2σ2+ε′ε

2σ4= 0 (4.10)

donde hemos designado por σ2 al estimador de maxima verosimilitud de la varianza

de las perturbaciones aleatorias. De la Ecuacion 4.10 se deduce que

σ2 =ε′ε

n(4.11)

Si tomamos esperanzas en la Ecuacion 4.11,

E[σ2]

=1

nE [ε′ε] =

n− pn

σ2 (4.12)

Es decir, el estimador de maxima verosimilitud, σ2, es un estimador sesgado, aunque

su sesgo tiende a cero cuando n tiende a infinito, ya que

lımn−→∞

n− pn

= 1



4.2 Bondad de Ajuste

Una vez que se han aplicado los mınimos cuadrados o de maxima verosimilitud, es

conveniente tener alguna medida de la bondad del ajuste del modelo a los datos. En el

caso de que se hayan estimado varios modelos alternativos, las medidas de la bondad del

ajuste podrıan ser utilizadas para seleccionar el modelo mas apropiado, existen numerosas

medidas de bondad del ajuste. La mas popular es el coeficiente de determinacion, que se

designa por R2 o R cuadrado, y el coeficiente de determinacion ajustado, que se designa

por R2 o R2 ajustado. Dado que estas medidas tienen algunas limitaciones, nos referiremos

tambien al criterio de informacion de Akaike (AIC) y al criterio de Schwarz (SC).

A) Coeficiente de determinacion

El coeficiente de determinacion se basa en la siguiente descomposicion de la varianza

de la variable endogena, a la que denominaremos varianza total.

SCT = SCE + SCR (4.13)

donde, SCT es la suma de cuadrados totales, SCE es la suma de cuadrados explicados

y SCR es la suma de cuadrados residual.

Basandose en la Ecuacion 4.13, el coeficiente de determinacion se define como:

R2 =SCE

SCT

Los valores de R2 esta en el intervalo [0, 1], es decir, 0 cuando la varianza explicada es

cero y 1 cuando la varianza residual es cero, en este caso cuando el ajuste es perfecto.

El R2, es una medida muestral. Ahora bien, si deseamos una medida poblacional

(R2POB), esta se podrıa definir como

R2POB = 1− σ2

ε

σ2Y

(4.14)



En su lugar, vamos a utilizar estimaciones insesgadas de estas varianzas:

R2 = 1− SCR/(n− p)SCT/(n− 1)

= 1− (1−R2)n− 1

n− p(4.15)

Esta medida se denomina R cuadrado ajustado, o R2. El principal atractivo del R2

es que impone una penalizacion al anadir otros regresores a un modelo. Si se anade

un regresor al modelo la SCR decrece o, en el peor de los casos queda igual. Por otra

parte, los grados de libertad de la regresion (n− p) siempre disminuyen.

B) Criterio de informacion de Akaike (AIC) y criterio de Schwarz (SC)

El estadıstico AIC, propuesto por Akaike (1974) y basado en la teorıa de la informa-

cion, tiene la siguiente expresion:

AIC = −2l

n+

2p

n(4.16)

donde l es el logaritmo de la funcion de verosimilitud (suponiendo que las pertur-

baciones tengan una distribucion normal) evaluada para los valores estimados de los

coeficientes.

El estadıstico SC propuesto por Schwarz (1978), tiene la siguiente expresion:

SC = −2l

n+p ln(n)

n(4.17)

Los estadısticos AIC y SC, a diferencia de los coeficientes de determinacion R2 y R2,

indican mejores ajustes cuanto mas bajos sean sus valores. Es importante destacar

que los estadısticos AIC y SC no tienen cotas, a diferencia del R2.



4.3 Contrastes de significacion

Estos procedimientos requieren que los errores εi del modelo lo sigan una distribucion

normal e independiente con media cero y varianza σ2. Como resultado de este supuesto,

las observaciones Yi tienen una distribucion normal e independiente con media β0 +∑kj=1Xijβj y varianza σ2.

A) Prueba de significacion de la regresion

Es un procedimiento para determinar si existe una relacion lineal entre las variables

de respuesta y un subconjunto de regresores x1, x2, ..., xp.

Hipotesis de significacion del modelo de regresion

H0 : β1 = β2 = ... = βp = 0

H1 : No todos los βp son nulos(4.18)

El rechazo de H0 de la Ecuacion 4.18 implica que al menos uno de los regresores

x1, x2, ..., xp contribuye de manera significativa al modelo. El procedimiento de prueba

incluye un analisis de varianza en el que se hace la particion de la suma de cuadrados

total SST en una de cuadrados debida al modelo y una suma de cuadrados debida a

los residuales. Por lo general la prueba se resume en una tabla de analisis de varianza,

vease la Tabla 4.1.

Tabla 4.1: Analisis de varianza de la significacion de la regresion.

Fuente de variacion SC Grado de libertad CM F0

Regresion SSR p MSRMSR

MSE

Error o residual SSE n− p− 1 MSETotal SST n− 1



B) Contraste de un parametro individual

Varias veces el interes se centra en probar las hipotesis sobre los parametros en forma

individual, estas pruebas sirven para determinar el valor de cada uno de los regresores

del modelo de regresion para incluir o excluir variables dentro del modelo.

Adicionar una variable en el modelo surge un efecto de aumento en la suma de

cuadrados de regresion y disminucion en la suma de cuadrados del error.

Las hipotesis para probar la significacion de cualquier coeficiente de regresion indivi-

dual es

H0 : βj = 0

H1 : βj 6= 0

Si H0 : βj = 0 no se rechaza, entonces esto indica que xj puede eliminarse del modelo.

Se puede utilizar un estadıstico con distribucion t de Student para probar la hipotesis

dada por la Ecuacion 4.19.

t0 =βj√σ2Cij

(4.19)

donde Cij es el elemento de la diagonal de (X ′X)−1 correspondiente a βj y√σ2Cij

es el error estandar (se) del coeficiente βj, por lo tanto la Ecuacion 4.19 se puede

escribir en forma equivalente como

t0 =βj

se(βj)

La hipotesis nula H0 : βj = 0 se rechaza si |t0| > tα/2,n−p−1, lo cual en realidad se

trata de una prueba parcial o marginal, ya que el coeficiente de regresion βj depende

de todos los demas regresores xi(i 6= j) que estan en el modelo.



C) Contraste de un subconjunto de parametros

Para estudiar la contribucion de un subconjunto de regresores al modelo, consideremos

el modelo de la Ecuacion 4.3 de regresion con p regresores, es decir,

Y = Xβ + ε

Queremos determinar si el subconjunto de regresores x1, x2, ..., xr(r < p) contribuye

significativamente al modelo de regresion. Sea que se haga la particion del vector de

los coeficientes de regresion de la siguiente manera:

β =

β1

β2

donde β1 es (r × 1) y β2 es [(p− r)× 1], se quiere probar las hipotesis

H0 : β1 = 0

H1 : β1 6= 0

El modelo puede escribirse como

Y = Xβ + ε = X1β1 +X2β2 + ε (4.20)

donde X1 representa las columnas de X asociadas con β1 y X2 representa las columnas

de X asociadas con β2.

Para el modelo completo (incluyendo a β1 y β2) se sabe que β = (X ′X)−1X ′Y .

Ademas, la suma de cuadrados de regresion para todas las variables incluyendo la

ordenada al origen es SSR(β) = β′X ′Y (p grados de libertad) y MSE = Y ′Y−β′X′Yn−p .



A SSR(β) se le llama la suma de cuadrados de regresion debida a β. Para encontrar

la contribucion de los terminos en β1 a la regresion, se ajusta el modelo suponiendo

que la hipotesis nula H0 : β1 = 0 es verdadera.

El modelo reducido se encuentra a partir de la Ecuacion 4.20 con β1 = 0:

Y = X2β2 + ε

El estimador de mınimos cuadrados de β2 es β2 = (X ′2X2)−1X ′2Y , y SSR(β2) =

β2′X ′2Y (p− r grados de libertad).

La suma de cuadrados de regresion debida a β1 dado que β2 esta ya en el modelo es

SSR(β1|β2) = SSR(β)− SSR(β2)

Esta suma de cuadrados tiene r grados de libertad. Es la suma de cuadrados extra

debida a β1. Observe que SSR(β1|β2) es el incremento en la suma de cuadrados de

regresion debido a la inclusion de las variables x1, x2, ..., xr en el modelo.

Ahora bien, SSR(β1|β2) es independiente de MSE, y la hipotesis nula β1 = 0 puede

probarse con el estadıstico

F0 =SSR(β1|β2)/r

MSE

Si F0 > Fα,r,n−p, se rechaza H0, y se concluye que al menos uno de los parametros en

β1 es diferente de cero y por consiguiente, al menos unas de las variables x1, x2, ..., xr

en X1 contribuye significativamente al modelo de regresion.

4.4 Prediccion

Un proposito fundamental de la regresion lineal multiple es predecir observaciones

futuras de la respuesta Y que corresponden a valores particulares de los regresores, por



ejemplo x01, x02, ..., x0k. Si x′0k = [1, x01, x02, ..., x0k], entonces una estimacion puntual de

la observacion futura Y0 en el punto x01, x02, ..., x0k se calcula con la Ecuacion 4.21.

Y (x0) = x′0β (4.21)

Un intervalo de prediccion de 100(1− α) por ciento para esta observacion futura es

Y (x0)− tα/2,n−p√σ2(1 + (X ′X)−1x0) ≤ Y0 ≤ Y (x0) + tα/2,n−p

√σ2(1 + (X ′X)−1x0)


Capıtulo 5

Analisis de datos funcionales en R

Una referencia basica para trabajar en el programa R Core Team (2016) con datos

funcionales es sin lugar a dudas, el paquete fda de Ramsay et al. (2009) donde aparece

una introduccion sobre el tema y ejemplos, ası como tambien los libros de Ramsay and

Silverman (2002, 2005) son muy conocidos en este ambito, en estos libros las tecnicas uti-

lizadas se limitan al espacio de funciones L2 (espacio de Hilbert de cuadrado integrable).

Otra referencia importante cuando se incorpora enfoques no parametricos es el libro de

Ferraty and Vieu (2006).

Tambien existe el paquete fda.usc de Febrero-Bande et al. (2013) que integra y

complementa la librerıa fda con medidas de profundidad, deteccion de outliers funcio-

nales, modelos de regresion funcional, metodos de clasificacion de un conjunto de datos

funcionales, ası como un ANOVA para datos funcionales.

35

Capıtulo 5. Analisis de datos funcionales en R

5.1 Descripcion basica del paquete fda

Para empezar consideraremos dos bases muy utilizadas, primeramente las bases de

funciones B-splines que se obtienen mediante la funcion create.bspline.basis en el

programa R con los siguientes argumentos mas importantes:

basisobj=create.bspline.basis(rangeval=NULL, nbasis=NULL,

norder=4,breaks=NULL)

donde,

rangeval: Vector con el mınimo y maximo de los valores de evaluacion (o argu-

mentos) de las funciones.

nbasis: Numeros de funciones basicas.

norder: Orden del polinomio considerado.

breaks: Un vector que especifica los puntos de quiebre que definen el B-spline.

Tambien se llama nodos, estos son una secuencia estrictamente creciente de los

puntos de union entre segmentos polinomicos a trozos.

La otra base de funciones son los de Fourier que se obtiene mediante la funcion

create.fourier.basis con los siguientes argumentos mas importantes:

basisobj = create.fourier.basis(rangeval, nbasis, period)

donde,

rangeval: Vector con el mınimo y maximo de los valores de evaluacion (o argu-

mentos) de las funciones.



nbasis: Numeros de funciones basicas.

period: La anchura de cualquier intervalo en el que las funciones de Fourier se

repiten o son periodicas.

Para la obtencion de la forma funcional se utiliza la funcion Data2fd que tiene los

siguientes argumentos:

data.fd=Data2fd(argvals=NULL, y=NULL, basisobj=NULL)

argvals: vector con los valores de evaluacion (argumento) de las funciones t1 =

1, ..., tm = m.

y: Normalmente una matrix de dimension (n,m) que contiene un conjunto de n

curvas discretizadas en m puntos o argvals.

basisobj: Es la base de funciones creadas previamente utilizando unas de las

funciones que puede ser como ejemplo base de Fourier, B-splines u otras.

Una vez obtenido la forma funcional podemos hallar las siguientes funciones:

Funcion media con mean.fd(data.fd).

La funcion desviacion tıpica mediante con std.fd(data.fd).

Y la matriz de covarianzas con var.fd(data.fd).

La funcion pca.fd calcula AFCP y tiene como objetivo realizar un analisis explora-

torio de datos, esta funcion arroja resultados como la proporcion de varianza explicada

por cada componente y las bases consideradas ya sea periodicos, no periodicos, entre

otros. La funcion pca.fd posee como argumentos principales:

acp=pca.fd(fdobj=data.fd, nharm = n)



fdobj: El objeto funcional.

nharm: Indica el numero de componentes principales para calcular.

5.2 Implementacion en el programa R

Utilizaremos como ejemplo las observaciones de los datos discretos de la temperatura

media diaria de 35 estaciones meteorologicas de Canada durante 365 dıas y representamos

inicialmente los datos discretos correspondiente a las temperaturas medias mensuales en

grados celsius de 4 estaciones meteorologicas que se puede observar en la Figura 5.1.

2 4 6 8 10 12

−30

−20

−10

010

20

Meses

Tem

pera

tura

med

ia

Pr. RupertMontrealEdmontonResolute

Figura 5.1: Las temperaturas medias en cuatro estaciones meteorologicas canadienses durante12 meses.

Para la obtencion de la forma funcional utilizaremos las bases de funciones de Fourier

dado que son datos periodicos, donde como argvals (argumento) tenemos los 12 meses es

decir m=12 que indican los meses de registros de las temperaturas, en consecuencia obte-

nemos rangeval teniendo como mınimo 1 y como maximo 12 de los valores de evaluacion

(o argumentos) de las funciones, por ultimo elegimos 5 como numero de funciones basicas

que corresponde a nbasis . En la Figura 5.2 tenemos para las 35 trayectorias muestrales



y en la Figura 5.3 podemos observar para una trayectoria muestral y su reconstruccion

con bases de Fourier que corresponde a la linea roja.

2 4 6 8 10 12

−30

−20

−10

010

20

Meses

Tem

pera

tura

med

ia

Figura 5.2: Las temperaturas medias en las 35 estaciones meteorologicas canadienses durante12 meses.

Ahora hallamos la funcion media funcional con mean.fd. Observamos en la Figu-

ra 5.4.

La funcion desviacion tıpica funcional mediante std.fd, observamos en la Figu-

ra 5.5 las representaciones graficas de dichas funciones para las 35 estaciones canadienses

durante 12 meses.

Calculamos y representamos graficamente los componentes principales funcionales

de las temperaturas medias canadienses durante 12 meses, en la Figura 5.6 se puede

observar que con cuatro componentes extraıdos ya se explica el 99.9 % de la variabilidad

total de los datos.

Otro ejemplo como data(Tecator) proporciona datos funcionales en la que el domi-

nio de la funcion no es el tiempo. En la literatura se utilizan solo las primeras 129 curvas

como muestra training y se consideran 2 grupos de curvas en funcion de su contenido

en grasa: menos del 20 % y mas del 20 %. En la Figura (5.7a) podemos observar los que



2 4 6 8 10 12

24

68

1012

Meses

Tem

pera

tura

med

ia

Figura 5.3: Aproximacion por mınimos cuadrados de bases de Fourier de la temperatura men-sual de “Pr. Rupert”durante 12 meses.

2 4 6 8 10 12

−10

−5

05

1015

Mes

Tem

pera

tura

med

ia

Figura 5.4: Funcion media funcional



2 4 6 8 10 12

45

67

89

Mes

Tem

pera

tura

med

ia

Figura 5.5: Desviacion tıpica funcional

contienen menos del 20 % de grasa y en la Figura 5.7b los que contienen mas del 20 %

de grasa.

Para la obtencion de la forma funcional (por mınimos cuadrados) utilizaremos B-

splines cubicos para datos de naturaleza suaves teniendo como 100 nodos de observacion.

En la Figura 5.8a podemos observar la forma funcional de Tecator para menos del 20 %

de grasa y en la Figura 5.8b para mas del 20 %.



2 4 6 8 10 12

−0.

6−

0.2

0.2

0.6

PC 1 (89.1%)

Mes

Val

or d

e la

cur

va C

P

2 4 6 8 10 12

−0.

6−

0.2

0.2

0.6

PC 2 (8.5%)

Mes

Val

or d

e la

cur

va C

P

2 4 6 8 10 12

−0.

6−

0.2

0.2

0.6

PC 3 (1.9%)

Mes

Val

or d

e la

cur

va C

P

2 4 6 8 10 12

−0.

6−

0.2

0.2

0.6

PC 4 (0.4%)

Mes

Val

or d

e la

cur

va C

P

Figura 5.6: Representacion grafica de las cuatro componentes principales consideradas.



0 20 40 60 80 100

23

45

6

nm

Abs

orba

ncia

(a) Bajo contenido en grasa

0 20 40 60 80 100

23

45

6nm

Abs

orba

ncia

(b) Alto contenido en grasa

Figura 5.7: Las curvas discretas de Tecator de acuerdo a su contenido de grasa.

850 900 950 1000 1050

2.5

3.0

3.5

4.0

4.5

5.0

nm

Abs

orba

ncia

(a) Forma funcional bajo contenido en gra-sa

850 900 950 1000 1050

2.5

3.0

3.5

4.0

4.5

5.0

5.5

nm

Abs

orba

ncia

(b) Forma funcional alto contenido en gra-sa

Figura 5.8: Forma funcional de las curvas discretas de Tecator de acuerdo a su contenido degrasa.


Capıtulo 6

Aplicacion del AFCP

En este apartado se construye un modelo para modelizar la serie del Ibex a partir de

las empresas que la componen, los datos que se analizaran son las cotizaciones diarias de

varios anos de dichas empresas. Se aplicara las teorıas mencionadas en capıtulos anteriores

a los datos reales y una vez obtenidas las componentes principales de todas las empresas

se utilizara Modelo de Regresion Multiple para estudiar la relacion existente entre el Ibex

y las distintas empresas en terminos de las componentes principales.

Se tendra como variable dependiente a la empresa Ibex , lo cual se utilizara sus 5

primeros componentes y como variables independientes, en nuestro caso utilizaremos 33

empresas espanolas con sus 5 primeros componentes. En la Figura 6.1 podemos observar

las cotizaciones diarias de Ibex al cierre en la bolsa durante el ano 2007 hasta el ano 2013.

6.1 Descripcion de la base de datos

El Ibex 35 es el principal ındice bursatil de referencia de la bolsa espanola elaborado

por Bolsas y Mercados Espanoles (BME). Esta formado por las 35 empresas con mas

44

Capıtulo 6. Aplicacion del AFCP

0 500 1000 1500

8.8

9.0

9.2

9.4

9.6

Días

Cot

izac

ione

s

Figura 6.1: Logaritmo de Ibex de las cotizaciones diarias al cierre en la bolsa (2007-2013).

liquidez que cotizan en el Sistema de Interconexion Bursatil Electronico (SIBE) en las

cuatro bolsas espanolas (Madrid, Barcelona, Bilbao y Valencia).

Los datos seleccionados son las cotizaciones diarias de 33 empresas del Ibex, y del

propio Ibex, vease la Tabla 6.1, en total tenemos 1440 datos en un data.frame compren-

didos desde el ano 2007 al 2013. Cada columna tiene las cotizaciones de una empresa y

la ultima columna la cotizacion del Ibex propiamente dicho. Despues hemos traspuesto

dicho data.frame, para tener los individuos por filas y las empresas por columnas que lo

hemos llamado Cotizaciones.

Tabla 6.1: Las 33 empresas del Ibex seleccionadas.

Abengoa Bolsa y Mercados MapfreAbertis Enagas MetrovacesaAcciona ENDESA NHHotelesAcerinox FCC OHLACS Ferrovial PRISAAntena 3 Gamesa Red Electrica EspanolaBanco Popular Gas Natural RepsolBanco Sabadell Grifolsa Sacyr VallehermosoBanco Santander Iberdrola Tecnicas ReunidasBanesto Inditex TelefonicaBankinter Indra BBVA



Tomamos las rentabilidades a 10 dıas de las distintas empresas y del Ibex dada por

la Ecuacion 6.1. De este modo creamos una matriz de 34 filas para las distintas empresas

y 1440 columnas para las rentabilidades.

Ri =Ci − Ci−10Ci−10

, (6.1)

donde Ri son las rentabilidades y Ci las cotizaciones diarias.

6.2 Tratamiento de datos funcionales

Consideramos la rentabilidad a 10 dıas y cortamos la serie de 20 en 20, entonces se

dispondran de 72 curvas muestrales de cada empresa para el analisis de datos funcionales

mediante interpolacion spline cubico. Extraemos los 5 primeros componentes de las 33

empresas del Ibex, y del propio Ibex. Las componentes principales de todas las empresas

se ordenaran en forma decreciente segun su correspondiente varianza explicada.

Seguidamente analizamos las correlaciones entre las 5 componentes del Ibex con las

5 componentes de todas las demas empresas. Se seleccionaron las empresas que tenıan

mayor grado de correlacion y significativas en terminos de los componentes de Ibex y se

excluyeron aquellos que tenıan correlaciones muy pequenas y no significativas.

El procedimiento fue comparar primer componente de Ibex con los primeros compo-

nentes de las demas empresas, segunda componente de Ibex con las segundas componentes

de las demas empresas y ası sucesivamente hasta la quinta componente, se detallan dichas

correlaciones en las Tabla 6.2.

En la Tabla 6.3 podemos observar las empresas seleccionadas para la formulacion

de los modelos de regresion, es decir las significativas para el modelo, con sus respectivas

varianzas explicadas acumuladas.



Tabla 6.2: Correlaciones de Ibex con las demas empresas en terminos de las componentes.

Componente Correlacion Empresa Componente Correlacion Empresa

1 0,894 BBVA 3 0,952 BBVA1 0,863 Santander 3 0,859 Santander1 0,849 Iberdrola 3 0,732 Mapfre1 0,817 Telefonica 3 0,702 Popular1 0,808 Mapfre 4 0,929 BBVA1 0,794 Repsol 4 0,906 Santander1 0,793 RedElectrica 4 0,800 Popular1 0,775 ACS 4 0,773 Repsol1 0,765 FCC 4 0,764 Bankinter1 0,758 Acciona 4 0,762 Iberdrola1 0,753 Abertis 4 0,736 Abertis1 0,735 OHL 4 0,734 Banesto1 0,721 Banesto 4 0,726 Sabadell1 0,710 Acerinox 5 0,923 BBVA1 0,703 Gamesa 5 0,899 Santander2 0,932 BBVA 5 0,852 Telefonica2 0,869 Santander 5 0,821 Iberdrola2 0,736 Mapfre 5 0,814 Popular2 0,728 Banesto 5 0,776 Repsol2 0,719 ACS 5 0,753 Abertis2 0,709 Abertis 5 0,712 Gamesa2 0,704 Acerinox 5 0,701 Acciona2 0.675 Ferrovial

Tabla 6.3: Proporcion de varianza explicada acumulada por cada componente.

Empresas 1 2 3 4 5

Ibex 0.4806554 0.7192023 0.8816534 0.9253445 0.9551129Red Electrica Espanola 0.4927538 0.7453543 0.8876286 0.9358543 0.9581421Mapfre 0.5242329 0.7658765 0.8833405 0.9296943 0.9539771Acciona 0.5928001 0.7691061 0.9146142 0.9469638 0.9675901Acerinox 0.5047573 0.7807840 0.9125702 0.9453301 0.9645457Ferrovial 0.5199911 0.7697972 0.9039709 0.9406513 0.9624219Tecnicas Reunidas 0.5377797 0.7814031 0.9065747 0.9405936 0.9599856BBVA 0.4289670 0.7229704 0.8857093 0.9361519 0.9602449Banesto 0.4747387 0.8014432 0.9032365 0.9418629 0.9658811Bankinter 0.5283585 0.7904753 0.8947555 0.9386328 0.9583735Banco Popular 0.5254124 0.7905885 0.9112614 0.9492845 0.9714045Gamesa 0.4734703 0.7603740 0.9026338 0.9418104 0.9672443



Para mejor interpretacion de nuestros modelos , llamaremos a las curvas de las

rentabilidades consideradas, a las componentes principales y a las autofunciones de la

forma que escribimos en la Tabla 6.4.

Tabla 6.4: Notacion de las empresas consideradas.

Empresas Curvas Componentes Autofunciones

Ibex x(Ibex)i(t) ξ(Ibex)ij f(Ibex)j(t)Red Elec. Esp. x(REE)i(t) ξ(REE)ij f(REE)j(t)Mapfre x(Map)i(t) ξ(Map)ij f(Map)j(t)Acciona x(Acc)i(t) ξ(Acc)ij f(Acc)j(t)Acerinox x(Ace)i(t) ξ(Ace)ij f(Ace)j(t)Ferrovial x(Ferr)i(t) ξ(Ferr)ij f(Ferr)i(t)Tecnicas Reunidas x(Tecn)i(t) ξ(Tecn)ij f(Tecn)i(t)BBVA x(BBV A)i(t) ξ(BBV A)ij f(BBV A)i(t)Banesto x(Bane)i(t) ξ(Bane)ij f(Bane)i(t)Bankinter x(Bank)i(t) ξ(Bank)ij f(Bank)i(t)Banco Popular x(Popu)i(t) ξ(Popu)ij f(Popu)i(t)Gamesa x(Game)i(t) ξ(Game)ij f(Game)i(t)

Entonces se pueden expresar las curvas de cada empresa en terminos de sus cinco

primeras componentes principales como:

x(Ibex)i(t) =5∑j=1

ξ(Ibex)ijf(Ibex)j(t), i = 1, ..., n

x(REE)i(t) =5∑j=1

ξ(REE)ijf(REE)j(t), i = 1, ..., n

x(Map)i(t) =5∑j=1

ξ(Map)ijf(Map)j(t), i = 1, ..., n

x(Acc)i(t) =5∑j=1

ξ(Acc)ijf(Acc)j(t), i = 1, ..., n

x(Ace)i(t) =5∑j=1

ξ(Ace)ijf(Ace)j(t), i = 1, ..., n



x(Ferr)i(t) =5∑j=1

ξ(Ferr)ijf(Ferr)j(t), i = 1, ..., n

x(Tec)i(t) =5∑j=1

ξ(Tec)ijf(Tec)j(t), i = 1, ..., n

x(BBV A)i(t) =5∑j=1

ξ(BBV A)ijf(BBV A)j(t), i = 1, ..., n

x(Bane)i(t) =5∑j=1

ξ(Bane)ijf(Bane)j(t), i = 1, ..., n

x(Bank)i(t) =5∑j=1

ξ(Bank)ijf(Bank)j(t), i = 1, ..., n

x(Popu)i(t) =5∑j=1

ξ(Popu)ijf(Popu)j(t), i = 1, ..., n

x(Game)i(t) =5∑j=1

ξ(Game)ijf(Game)j(t), i = 1, ..., n

6.3 Ajustes de modelos

Tenemos los cinco modelos de regresion lineal, estimados mediante aproximacion

por mınimos cuadrados compuestos de las siguientes formas:

Modelo 1: Observamos las correlaciones en la Tabla 6.2 correspondientes a las

primeras componentes, se seleccionaron aquellas variables significativas para el modelo

mediante regresion lineal multiple. Las estimaciones de los parametros del modelo de

regresion lineal podemos observar en la Tabla 6.5, cuya salida proporcionada por el pro-

grama R , con Adjusted R-squared: 0.8363 , se observa que todos los coeficientes son



significativos a nivel del 5 % menos la constante y F-statistic: 91.66 on 4 and 67

DF, p-value: < 2.2e-16 que indica que el modelo es significativo.

Tabla 6.5: Estimaciones de los coeficientes del Modelo 1.

Coefficients Estimate Std. Error t value Pr(>| t |)β0 -4.311e-18 7.284e-03 0.000 1.00000β1 2.593e-01 7.746e-02 3.347 0.00134β2 2.906e-01 4.294e-02 6.768 3.94e-09β3 1.474e-01 5.328e-02 2.767 0.00730β4 1.197e-01 4.102e-02 2.918 0.00479

Entonces el modelo 1 queda de la siguiente forma representado en la Ecuacion 6.2.

ξ(Ibex)i1 = 0,2593ξ(REE)i1 + 0,2906ξ(Map)i1 + 0,1474ξ(Ace)i1 + 0,197ξ(Acc)i1 (6.2)

Observamos que en la Ecuacion 6.2 el parametro mas importante es β2 = 0,2906 de

Mapfre, esto significa que por cada unidad que cambie el valor de la primera componente

de Mapfre, se estima puntualmente que la primera componente del Ibex cambiara en

0.2906 unidades, siempre que permanezcan el resto de las variables constantes y se analiza

analogamente para los demas parametros.

Modelo 2: Observamos las correlaciones en la Tabla 6.2 en terminos de las segundas

componentes, seleccionamos las variables significativas para el modelo quedando de la si-

guiente forma: Segunda componente del Ibex en terminos de las segundas componentes de

Ferrovial y Tecnicas Reunidas, vease la Ecuacion 6.3. Las estimaciones de los parametros

del modelo de regresion lineal podemos observar en la Tabla 6.6, cuya salida proporcio-

nada por el programa R , con Adjusted R-squared: 0.5673 , se observa que todos los

coeficientes son significativos a nivel del 5 % menos la constante y F-statistic: 47.54

on 2 and 69 DF, p-value: 1.049e-13 que indica que el modelo es significativo.

ξ(Ibex)i2 = −0,2489ξ(Ferr)i2 + 0,3062ξ(Tec)i2 (6.3)




Coefficients Estimate Std. Error t value Pr(>| t |)β0 5.278e-18 8.342e-03 0.000 1.000000β1 -2.489e-01 6.417e-02 -3.879 0.000237β2 3.062e-01 6.777e-02 4.519 2.51e-05

Observamos que en la Ecuacion 6.3 el parametro mas importante es β2 = 0,3062 que

corresponde a la empresa Tecnicas Reunidas, esto significa que por cada unidad que cam-

bie el valor de la segunda componente de Tecnicas Reunidas, se estima puntualmente que

la segunda componente del Ibex cambiara en 0.3062 unidades, siempre que se mantenga

constante la variable Ferrovial.

Modelo 3: Tercera Componente del Ibex en terminos de la Tercera componente de

BBVA, vease la Ecuacion 6.4. Las estimaciones de los parametros del modelo de regresion

lineal podemos observar en la Tabla 6.7, cuya salida proporcionada por el programa R

, con Adjusted R-squared: 0.9047, se observa que el coeficiente β1 es significativo a

nivel del 5 %, pero la constante β0 no es significativo y F-statistic: 674.9 on 1 and

70 DF, p-value: < 2.2e-16 que indica que el modelo es significativo.


Coefficients Estimate Std. Error t value Pr(>| t |)β0 -2.615e-18 3.231e-03 0.00 1.000000β1 5.989e-01 2.306e-02 25.98 < 2e-16

ξ(Ibex)i3 = 0,5989ξ(BBV A)i3 (6.4)

Observamos que en la Ecuacion 6.4 consta de un solo parametro que es β1 = 0,5989

que corresponde a la empresa BBVA, esto significa que por cada unidad que cambie el

valor de la tercera componente de BBVA, se estima puntualmente que la tercera compo-

nente del Ibex cambiara en 0.5989 unidades.



Modelo 4: Siguiendo el mismo procedimiento del modelo anterior, tenemos cuarta

componente del Ibex en terminos de las cuartas componentes de Banesto y Bankinter,

vease la Ecuacion 6.5. Las estimaciones de los parametros del modelo de regresion lineal

podemos observar en la Tabla 6.8, cuya salida proporcionada por el programa R , con

Adjusted R-squared: 0.6604 , se observa que todos los coeficientes son significativos

a nivel del 5 % menos la constante y F-statistic: 70.04 on 2 and 69 DF, p-value:

< 2.2e-16 que indica que el modelo es significativo.


Coefficients Estimate Std. Error t value Pr(>| t |)β0 8.327e-20 3.163e-03 0.000 1.000000β1 2.972e-01 6.988e-02 4.253 6.5e-05β2 2.879e-01 5.485e-02 5.250 1.6e-06

ξ(Ibex)i4 = 0,2972ξ(Bane)i4 + 0,2879ξ(Bank)i4 (6.5)

En la Ecuacion 6.5 los parametros practicamente tienen el mismo peso, analizemos el

parametro β1 = 0,2972 que corresponde a la empresa Banesto, esto significa que por cada

unidad que cambie el valor de la cuarta componente de Banesto, se estima puntualmente

que la cuarta componente del Ibex cambiara en 0.2972 unidades, siempre que se mantenga

constante la variable Bankinter.

Modelo 5: Quinta Componente del Ibex en terminos de las quintas componentes

de Banco Popular y Gamesa, vease la Ecuacion 6.6. Las estimaciones de los parametros

del modelo de regresion lineal podemos observar en la Tabla 6.9, cuya salida proporcio-

nada por el programa R , con Adjusted R-squared: 0.7028 , se observa que todos los

coeficientes son significativos a nivel del 5 % menos la constante y F-statistic: 84.96

on 2 and 69 DF, p-value: < 2.2e-16 que indica que el modelo es significativo.

ξ(Ibex)i5 = 0,3738ξ(Popu)i5 + 0,1587ξ(Game)i5 (6.6)




Coefficients Estimate Std. Error t value Pr(>| t |)β0 3.886e-18 2.442e-03 0.000 1.00000β1 3.738e-01 5.354e-02 6.982 1.44e-09β2 1.587e-01 4.689e-02 3.385 0.00118

Por ultimo en la Ecuacion 6.6 el parametro mas importante es β1 = 0,3738 que

corresponde a la empresa Banco Popular, esto significa que por cada unidad que cambie

el valor de la quinta componente de Banco Popular, se estima puntualmente que la quinta

componente del Ibex cambiara en 0.3738 unidades, siempre que se mantenga constante

la variable Gamesa.

6.4 Validacion

Una vez que tenemos los modelos ajustados procedemos con sus respectivos diagnosti-

cos, que se realiza a traves del analisis de los residuos, con los valores ajustados en forma

grafica. Se puede observar que los residuos de los cinco modelos forman nubes de puntos

sin patrones formados y con, aproximadamente, la misma variabilidad por todas las zo-

nas como se muestra en la Figura 6.2, entonces, podemos constatar que las hipotesis de

linealidad, homocedasticidad e independencia de los residuos se cumplen para los cinco

modelos.

Observando la Figura 6.3 podemos decir que en los cinco modelos existe normali-

dad en los residuos estandarizados, las lineas rojas representan las cotas a un nivel de

significacion del 5 % , existen algunos casos que sobresalen la linea roja que representan

un porcentaje muy bajo y esto no deberıa ser motivo de preocupacion, podemos cons-

tatar que todos los modelos tienen medias cero y varianzas constantes, esto nos permite

concluir que el modelo se ajusta bien tanto globalmente como dato a dato.



−0.4 −0.2 0.0 0.2

−0.

10−

0.05

0.00

0.05

0.10

Modelo 1

Ajustados

Res

iduo

s

−0.2 −0.1 0.0 0.1

−0.

2−

0.1

0.0

0.1

Modelo 2

Ajustados

Res

iduo

s

−0.3 −0.2 −0.1 0.0 0.1 0.2

−0.

06−

0.02

0.00

0.02

0.04

Modelo 3

Ajustados

Res

iduo

s

−0.10 −0.05 0.00 0.05

−0.

050.

000.

05

Modelo 4

Ajustados

Res

iduo

s

−0.05 0.00 0.05 0.10

−0.

04−

0.02

0.00

0.02

0.04

0.06

Modelo 5

Ajustados

Res

iduo

s

Figura 6.2: Graficos de los residuos con los valores ajustados de los cinco modelos de regresion.

0 10 20 30 40 50 60 70

−2

−1

01

2

Modelo 1

Tiempo

Res

iduo

s es

tand

ariz

ados

0 10 20 30 40 50 60 70

−3

−2

−1

01

2

Modelo 2

Tiempo

Res

iduo

s es

tand

ariz

ados

0 10 20 30 40 50 60 70

−2

−1

01

2

Modelo 3

Tiempo

Res

iduo

s es

tand

ariz

ados

0 10 20 30 40 50 60 70

−2

−1

01

23

Modelo 4

Tiempo

Res

iduo

s es

tand

ariz

ados

0 10 20 30 40 50 60 70

−2

−1

01

23

Modelo 5

Tiempo

Res

iduo

s es

tand

ariz

ados

Figura 6.3: Graficos de los residuos estandarizados de los cinco modelos de regresion.



6.5 Conclusion

Los resultados obtenidos en el trabajo ilustran la capacidad de las componentes prin-

cipales funcionales para destacar caracterısticas importantes de un conjunto de series de

tiempo. Extrajimos cinco componentes de cada unas de las expresas que explican un 95 %

de la variabilidad total del Ibex de las ventas de las acciones a lo largo del perıodo anali-

zado. Se obtuvieron grupos de empresas para formular los modelos de regresion multiple

de acuerdo a sus correspondientes correlaciones en terminos de las componentes. Despues

de realizar todos los analisis de ajustes y diagnosticos, a continuacion tenemos los cinco

modelos ajustados mediante regresion lineal multiple que detallamos a continuacion,

ξ(Ibex)i1 = 0,2593ξ(REE)i1 + 0,2906ξ(Tec)i1 + 0,1474ξ(Ace)i1 + 0,197ξ(Acc)i1

ξ(Ibex)i2 = −0,2489ξ(Ferr)i2 + 0,3062ξ(Tec)i2

ξ(Ibex)i3 = 0,5989ξ(BBV A)i3

ξ(Ibex)i4 = 0,2972ξ(Bane)i4 + 0,2879ξ(Bank)i4

ξ(Ibex)i5 = 0,3738ξ(Popu)i5 + 0,1587ξ(Game)i5

Sabemos que se pueden aproximar las curvas del Ibex mediante la Ecuacion 6.7 :

x(Ibex)i(t) =5∑j=1

ξ(Ibex)ijf(Ibex)j(t), i = 1, ..., n (6.7)

Entonces se tiene que los coeficientes de regresion son los coeficientes de la aproxi-

macion del Ibex.

x(Ibex)i(t) = [ξ(Ibex)i1] f(Ibex)1(t) + [ξ(Ibex)i2] f(Ibex)2(t) + [ξ(Ibex)i3] f(Ibex)3(t)

+ [ξ(Ibex)i4] f(Ibex)4(t) + [ξ(Ibex)i5] f(Ibex)5(t), i = 1, ..., n


Bibliografıa

Aguilera, A. M. (1993). Metodos de aproximacion de estimadores en el acp de un proceso

estocastico.

Aguilera, A. M., Gutierrez, R., Ocana, F. A., and Valderrama, M. J. (1995). Compu-

tational approaches to estimation in the principal component analysis of a stochastic

process. Applied stochastic models and data analysis, 11(4):279–299.

Akaike, H. (1974). A new look at the statistical model identification. IEEE transactions

on automatic control, 19(6):716–723.

De Boor, C., De Boor, C., De Boor, C., and De Boor, C. (1978). A practical guide to

splines, volume 27. Springer-Verlag New York.

Deville, J.-C. (1974). Methodes statistiques et numeriques de l’analyse harmonique. In

Annales de l’INSEE, pages 3–101. JSTOR.

Escabias, M., Aguilera, A. M., and Valderrama, M. J. (2005). Modeling environmental

data by functional principal component logistic regression. Environmetrics, 16(1):95–

107.

Febrero-Bande, M., de la Fuente, M. O., and de la Fuente, M. M. O. (2013). Package fda.

usc.

Ferraty, F. and Vieu, P. (2006). Nonparametric functional data analysis: theory and

practice. Springer Science & Business Media.

56

Bibliografıa

Fukunaga, R. (1990). Statistical pattern recognition.

Hotelling, H. (1936). Simplified calculation of principal components. Psychometrika,

1(1):27–35.

Mitsch, W. J. G. and James, G. (2000). Wetlands. Technical report, New York, US:

Wiley.

R Core Team (2016). R: A Language and Environment for Statistical Computing. R

Foundation for Statistical Computing, Vienna, Austria.

Ramsay, J. O., Hooker, G., and Graves, S. (2009). Functional data analysis with R and

MATLAB. Springer Science & Business Media.

Ramsay, J. O. and Silverman, B. W. (2002). Applied functional data analysis: methods

and case studies, volume 77. Citeseer.

Ramsay, J. O. and Silverman, B. W. (2005). Functional Data Analysis. Springer.

Rice, J. A. and Wu, C. O. (2001). Nonparametric mixed effects models for unequally

sampled noisy curves. Biometrics, 57(1):253–259.

Schwarz, G. (1978). Estimating the dimension of a model. The annals of statistics,

6(2):461–464.

Seber, G. A. and Lee, A. J. (2003). Linear regression analysis. hoboken. NJ: Wiley. doi,

10:9780471722199.

Valderrama, M. J., Aguilera, A. M., and Ocana, F. A. (2000). Prediccion Dinamica

Mediante Analisis de Datos Funcionales: Introduccion a Los Modelos PCP. La Muralla.


M aster en Estad stica Aplicada Departamento de Estad ...

Documents

Transcript of M aster en Estad stica Aplicada Departamento de Estad ...