Practica 5 Series

10
  1 Estadística Industrial Universidad Carlos III de Madrid Series temporales Práctica 5 Objetivo: Análisis descriptivo, estudio de funciones de autocorrelación simple y parcial de series temporales estacionales. Formulación, predicción y estimación de modelos ARIMA estacionales. Diagnosis y validación. Fichero de datos: Practica5Series.sf  Series temporales estacionales: En la práctica 1 vimos series temporales que presentaban pautas que se repetían en forma de ciclos. Es habitual que muchas series tengan patrones estacionales cada s periodos. En series mensuales, en general, el orden de la estacionalidad es s=12; en series trimestrales s=4, cuatrimestral s=3, etc… La metodología ARIMA también nos permite estudiar estas series estacionales. En este caso la formulación ARIMA es: ( , , ) ( , , ) parte regular  parte estacional  A RIMA s  p d q P D Q ×    Ejemplo: IPI Inglaterra  Importar datos: FILE -> OPEN -> OPEN DATA FILE   Representación de la serie temporal: SPECIAL -> TIME-SERIES ANALYSIS -> DESCRIPTIVE METHODS  Al introducir la serie a analizar: debemos especificar que la periodicidad de la serie:  SAMPLING INTERVAL -> MONTH -> STARTING AT -> SEASONALITY  Si la serie es mensual s=12

description

tarea

Transcript of Practica 5 Series

  • 1

    Estadstica Industrial

    Universidad Carlos III de Madrid Series temporales

    Prctica 5 Objetivo: Anlisis descriptivo, estudio de funciones de autocorrelacin simple y parcial de series temporales estacionales. Formulacin, prediccin y estimacin de modelos ARIMA estacionales. Diagnosis y validacin. Fichero de datos: Practica5Series.sf

    Series temporales estacionales: En la prctica 1 vimos series temporales que presentaban pautas que se repetan en forma de ciclos. Es habitual que muchas series tengan patrones estacionales cada s periodos. En series mensuales, en general, el orden de la estacionalidad es s=12; en series trimestrales s=4, cuatrimestral s=3, etc La metodologa ARIMA tambin nos permite estudiar estas series estacionales. En este caso la formulacin ARIMA es:

    ( , , ) ( , , )parte regular parte estacional

    ARIMA sp d q P D Q

    Ejemplo: IPI Inglaterra

    Importar datos: FILE -> OPEN -> OPEN DATA FILE Representacin de la serie temporal: SPECIAL -> TIME-SERIES ANALYSIS

    -> DESCRIPTIVE METHODS

    Al introducir la serie a analizar: debemos especificar que la periodicidad de la serie:

    SAMPLING INTERVAL -> MONTH -> STARTING AT -> SEASONALITY Si la serie es mensual s=12

  • 2

    Figura 1. Grfico temporal de la serie original IPI Inglaterra

    La Figura 1, presenta el grfico de la serie IPI Inglaterra. Se observa la falta de estacionariedad, ya que la serie tiene tendencia y ciclo. La variabilidad no presenta problemas y podemos concluir que la serie es homocedstica. Se puede estudiar algo ms detalladamente las caractersticas del ciclo estacional mediante el grfico de descomposicin estacional visto en la prctica 1.

    La FAS y FAP de la serie original se muestra en la siguiente figura:

    Como puede observarse hay mucha estructura en ambas funciones. Esto es debido a la falta de estacionariedad de la serie. Como se estudi en prcticas anteriores es preciso tomar una diferencia para quitar la tendencia (parte regular, Non-seasonal order), para eliminar la estacionalidad tomaremos diferencias estacionales (Seasonal order). Para ello, en el botn derecho en ANALYSIS OPTIONS, podemos comenzar tomando una diferencia regular (1) y posteriormente una diferencia estacional (1). NOTA: como al especificar la serie con periodicidad mensual (s=12), la diferencia estacional que tomemos la tomaremos como 1.

    1/50 1/53 1/56 1/59 1/62 1/6582

    92

    102

    112

    122

    132

    lag0 5 10 15 20 25

    -1

    -0,6

    -0,2

    0,2

    0,6

    1

    FAS IPI Inglaterra

    lag 0 5 10 15 20 25

    -1

    -0,6

    -0,2

    0,2

    0,6

    1

    FAP IPI Inglaterra

  • 3

    Figura 2. Serie IPI Inglaterra con una diferencia regular ( 1IPI )

    La figura 2 muestra la serie IPI Inglaterra una vez eliminada la tendencia con una diferencia regular, sin embargo observamos que an existe estacionalidad. El ciclo se aprecia en el grfico de la serie, y en la FAS en la que las autocorrelaciones separadas por 12 retardos son significativas y decrecen lentamente, esto se refleja en su FAS y FAP (Figura 3),

    Figura 3. FAS (izquierda) y FAP (derecha) de la serie 1IPI

    Para eliminar los ciclos aplicaremos una diferencia estacional, es decir 1 12IPI , en ANALYSIS OPTIONS-> DIFFERENCING -> SEASONAL ORDER (1). El resultado de se presenta en la Figura 4, donde ya tenemos una serie estacionaria (sin tendencia ni ciclos), adems podemos asegurar que es homocedstica.

    1/50 1/53 1/56 1/59 1/62 1/65-15

    -5

    5

    15

    25

    lag0 5 10 15 20 25

    -1 -0,6 -0,2 0,2 0,6

    1

    lag0 5 10 15 20 25

    -1

    -0,6

    -0,2

    0,2

    0,6

    1

  • 4

    Figura 4. Serie IPI Inglaterra sin tendencia ni ciclo, 1 12IPI

    Figura 5. FAS y FAP de la serie 1 12IPI

    Estudiaremos los primeros retardos para analizar la parte regular: se observa en la FAS que existen en decaimiento lento hasta el quinto retardo. En la FAP hay dos retardos significativos. Podemos por tanto, estar ante un AR(2) en la parte regular. Si analizamos los retardos estacionales: en la FAS vemos que el retardo 12 es significativo, pero no los son ni el 24 ni el 36. Por otro lado, en la FAP se aprecian que los retardos 12 y 24 son significativos. Es posible por tanto que estemos ante un MA(1)12 en la parte estacional. Alternativamente, podramos haber eliminado primeramente la estacionalidad,

    tomando la diferencia estacional 12IPI .

    1/50 1/53 1/56 1/59 1/62 1/65-8

    -4

    0

    4

    8

    FAP

    lag 0 5 10 15 20 25

    -1

    -0,6

    -0,2

    0,2

    0,6

    1

    lag

    FAS

    0 5 10 15 20 25-1

    -0,6 -0,2 0,2 0,6

    1

  • 5

    Figura 6. Grfico de la serie IPI Inglaterra con una diferencia estacional

    Figura 7. FAS y FAP de la serie IPI Inglaterra con una diferencia estacional

    Aunque hemos eliminado los ciclos, la serie no es estacionaria, puesto que an se observa tendencia (Figura 6). La FAS presenta un decaimiento lineal, pero no hay retardos estacionales significativos. Estimacin de un modelo ARIMA(p,d,q)x(P,D,Q)s

    Un vez que la serie 1 12IPI es estacionaria, podemos estimar un modelo ARIMA(2,1,0)x(0,1,1)12. En SPECIAL-> TIMES-SERIES ANALYSIS -> FORECASTING, introducimos la serie IPI Inglaterra. Por defecto, el nmero de periodos a predecir (Number of forecasts) es 12. Para estimar el modelo ARIMA, procedemos de la misma forma que hicimos en la prctica anterior. Ahora, como hemos especificado la serie como mensual. El modelo ARIMA permite ajustar diferencias y parmetros AR y MA estacionales.

    1/50 1/53 1/56 1/59 1/62 1/65-8

    -5

    -2

    1 4 7

    10

    FAS

    lag0 5 10 15 20 25

    -1

    -0,6

    -0,2

    0,2

    0,6

    1

    lag0 5 10 15 20 25

    -1

    -0,6

    -0,2

    0,2

    0,6

    1

    FAP

  • 6

    Figura 8. Especificacin de un modelo ARIMA(2,1,0)x(0,1,1)12

    En ARIMA Model, podemos ahora especificar (Figura 8): o Nonseasonal order: Nmero de diferencias regulares d o Seasonal order: Numero de diferencias estacionales D o AR: Orden del autorregresivo regular p o MA: Orden de la media mvil regular q o SAR: Orden del autorregresivo estacional P o SMA: Orden de la media mvil estacional Q Los parmetros estimados los podemos obtener en el ANALYSIS SUMMARY, ARIMA Model Summary Parameter Estimate Stnd. Error t P-value ---------------------------------------------------------------------------- AR(1) -0,563995 0,0894862 -6,3026 0,000000 AR(2) -0,271194 0,0897455 -3,02182 0,003092 SMA(1) 0,891669 0,0305606 29,1771 0,000000 Mean -0,0199986 0,0259359 -0,771075 0,442230 Constant -0,0367011 ---------------------------------------------------------------------------- En la tabla observamos que los parmetros son significativos, ya que el valor de la t-student es mayor que 2 en valor absoluto y los p-valores menores a 0.05. El modelo se puede escribir como:

    1 2 120.5639 0.2712 0.8917t t t t ty c y y a a = + (-6.30) (-3.021) (29,177)

    donde ty es la serie estacionaria

    1 12IPI y entre parntesis se indica el valor crtico de la t-student. Alternativamente, en trmino del operador de retardos B.

    2 121 2 12(1 ) (1 )t tB B y B a =

  • 7

    Reemplazando los valores estimados:

    2 12(1 0.5639 0.2712 ) (1 0.8917 )t tB B y B a+ + =

    La FAS y FAP de los residuos del modelo ajustado se muestran en la figura 9. Figura 9. FAS y FAP de los residuos del modelo ARIMA(2,1,0)x(0,1,1)12

    En la Figura 9, observamos que aparentemente no existen retardos significativos ni en FAS ni FAP de los residuos del modelo ajustado, por lo que tenemos evidencia de que pueden ser ruido blanco. Para ver si hay evidencia suficiente de que son ruido blanco, analizamos el test de Box-Pierce. En TABULAR OPTIONS, marcamos las opciones de RESIDUAL TEST OF RANDOMNESS y de MODEL COMPARISONS si queremos comparar el modelo con otros alternativos. El resultado del test de Box-Pierce es de 0.82907 y por tanto tenemos evidencias de que los residuos s son ruido blanco. Prediccin y validacin: Una vez ajustado un modelo paramtrico a la serie original podemos utilizarlo para realizar predicciones futuras. En TABULAR OPTIONS, la opcin FORECAST TABLE, nos permite obtener la prediccin del modelo para los periodos siguientes.

    Lower 95,0% Upper 95,0% Period Forecast Limit Limit ------------------------------------------------------------------------------ 2/61 121,243 117,797 124,689 3/61 123,095 119,335 126,854 4/61 111,843 107,732 115,954 5/61 110,098 105,482 114,714 6/61 112,787 107,828 117,745 7/61 105,346 100,051 110,64 8/61 101,928 96,3004 107,556 9/61 115,466 109,536 121,395 10/61 118,947 112,728 125,166 11/61 123,111 116,614 129,609 12/61 111,011 104,248 117,774 1/62 111,576 104,557 118,594 ------------------------------------------------------------------------------

    FAS ARIMA(2,1,0)x(0,1,1)12 with constant

    0 5 10 15 20 25lag

    -1 -0,6 -0,2 0,2

    0,6

    1

    FAPARIMA(2,1,0)x(0,1,1)12 with constant

    0 5 10 15 20 25lag

    -1

    -0,6

    -0,2

    0,2

    0,6

    1

  • 8

    Por defecto la prediccin se realizar para 12 periodos. En la primera columna tenemos los periodos que predecimos, en la segunda columna, la prediccin de nuestro modelo y por ltimo los lmites superior e inferior de los intervalos de prediccin. La Figura siguiente muestra las predicciones y sus intervalos.

    El modelo ARIMA propuesto, presenta los valores ms bajos para el Error Cuadrtico Medio (MSE), y para el Error Medio Absoluto (MAE). ------------------------------------------------------------------------ Models ------ (A) ARIMA(2,1,0)x(0,1,1)12 with constant (B) Constant mean = 106,045 (C) Linear trend = 96,3582 + 0,144581 t (D) Simple moving average of 5 terms (E) Simple exponential smoothing with alpha = 0,1521 Estimation Period Model MSE MAE MAPE ME MPE ------------------------------------------------------------------------ (A) 2,70114 1,30257 1,2257 -0,139977 -0,154921 (B) 88,9745 7,69823 7,41176 3,00244E-14 -0,81525 (C) 58,3711 6,30245 5,99201 3,25888E-14 -0,523815 (D) 60,1705 6,81859 6,45562 0,432344 -0,0166134 (E) 52,2074 6,22291 5,87358 0,816373 0,36154 Model RMSE RUNS RUNM AUTO MEAN VAR ----------------------------------------------- (A) 1,64352 OK OK OK OK OK (B) 9,43263 *** *** *** *** OK (C) 7,6401 *** *** *** OK OK (D) 7,75696 *** *** *** OK OK (E) 7,22547 *** ** *** OK OK ------------------------------------------------------------------------

    ARIMA(2,1,0)x(0,1,1)12 with constant

    actual forecast 95,0% limits

    1/50 1/53 1/56 1/59 1/62 1/6582

    92

    102

    112

    122

    132

  • 9

    Otro posible anlisis que permite validar el modelo ARIMA propuesto, consiste en realizar predicciones sobre la muestra. Este procedimiento consiste en coger del total de n observaciones de la serie temporal, las n-k primeras. Y una vez elegido el modelo validar su capacidad predictiva sobre la submuestra formada por las k ltimas observaciones.

    En la opcin de INPUT DIALOG, , introducimos en la casilla de WITHHOLD FOR VALIDATION el tamao de submuestra que deseamos , en el caso de series mensuales para que este anlisis sea vlido cogeremos un ciclo completo de k=12 observaciones. Con este anlisis la tabla de predicciones (FORECAST TABLE), incluye el residuo de la prediccin sobre esta submuestra. ------------------------------------------------------------------------------ Period Data Forecast Residual 2/60 117,3 116,651 V0,648852 3/60 119,5 118,988 V0,511876 4/60 107,7 107,844 V-0,144126 5/60 108,9 105,914 V2,9865 6/60 109,1 110,035 V-0,935361 7/60 103,3 102,039 V1,26059 8/60 100,0 99,5207 V0,479278 9/60 112,6 112,938 V-0,337917 10/60 117,7 116,379 V1,32145 11/60 123,2 120,996 V2,20382 12/60 110,3 109,785 V0,514985 1/61 110,6 110,914 V-0,313729 ------------------------------------------------------------------------------ La tabla de comparacin de modelos (MODELS COMPARISON), incluye una tabla adicional para los valores del MSE y MAE o de la raz cuadrada del MSE (RMSE). Models ------ (A) ARIMA(2,1,0)x(0,1,1)12 with constant (B) Constant mean = 105,486 (C) Linear trend = 95,6334 + 0,161517 t (D) Simple moving average of 5 terms (E) Simple exponential smoothing with alpha = 0,1573 Estimation Period Model MSE MAE MAPE ME MPE ------------------------------------------------------------------------ (A) 2,86055 1,33577 1,26573 -0,250186 -0,261454 (B) 90,1904 7,73979 7,47792 3,25323E-14 -0,830492 (C) 58,5864 6,2433 5,96621 3,55859E-14 -0,528323 (D) 60,3762 6,84534 6,51942 0,372931 -0,0730557 (E) 52,3767 6,26727 5,95175 0,71585 0,268722 Model RMSE RUNS RUNM AUTO MEAN VAR ----------------------------------------------- (A) 1,69132 OK * OK OK OK (B) 9,49686 *** *** *** *** OK (C) 7,65418 *** *** *** OK OK (D) 7,77021 *** *** *** OK OK (E) 7,23717 *** ** *** OK OK Validation Period Model MSE MAE MAPE ME MPE ------------------------------------------------------------------------ (A) 1,61646 0,971541 0,864741 0,683018 0,602253 (B) 80,2806 7,47603 6,49719 6,19738 5,23018 (C) 62,7841 6,78328 6,2743 -4,54348 -4,41941 (D) 58,1818 6,56 5,83885 1,00667 0,528996 (E) 50,5692 5,98881 5,29789 1,56345 1,04989

  • 10

    Este procedimiento nos permitir de una manera ms precisa discriminar entre modelos ARIMA alternativos, en el caso de tener modelos que cumplan todas las hiptesis de manera satisfactoria (significatividad de los parmetros, test de Box-pierce), nos intereser ms tener un modelo cuya capacidad predictiva sea mejor (menores valores del RMSE, MSE y/o MAE). Cuestiones: Analiza el resto de las series del fichero Practica5Series.sf3. Propn uno o varios modelos ARIMA. Formula la ecuacin del modelo y su representacin en trminos del operador de retardos. Realiza una validacin del modelo ARIMA en funcin de la capacidad predictiva de cada uno de ellos.