Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de...

59
Dpto. Tecnología Electrónica Universidad de Málaga SHORT-TERM LOAD FORECASTING USING SHORT-TERM LOAD FORECASTING USING ARTIFICIAL NEURAL NETWORKS ARTIFICIAL NEURAL NETWORKS Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne

Transcript of Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de...

Page 1: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

SHORT-TERM LOAD FORECASTING USINGSHORT-TERM LOAD FORECASTING USING

ARTIFICIAL NEURAL NETWORKSARTIFICIAL NEURAL NETWORKS

Francisco SandovalDepartamento de Tecnología Electrónica

Universidad de Málaga, Espagne

Page 2: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

1. Introduction1. Introduction

Page 3: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

INTRODUCTIONINTRODUCTION

• Electric industry needs to predict load consumption inthe short, medium and long term.• Short term is important for: economic scheduling of generation capacity, security analysis, final price in deregulated markets, etc.

• Load forecasting is a difficult task: ➪ Load series is complex and exhibits several level of seasonality. ➪ Many exogenous variables, specially weather- related variables.

Page 4: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

INTRODUCTIONINTRODUCTION

Non-linear cost function

Page 5: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

INTRODUCTIONINTRODUCTION

• Conventional statistical forecasting models belong to:

➪ Time series (univariate) models, where the load ismodeled as a function of its past observed values:

multiplicative autoregressive models, dynamic linear and non linear models, method based on Kalman filtering, etc. ➪ Causal models: the load is modeled as a function of some exogenous factors, specially weather and social variables: Box and Jenkins transfer function, ARMAX models, non parametric regression, etc.

Page 6: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

INTRODUCTIONINTRODUCTION

• Artificial intelligence techniques applied to the load forecasting:

➪ Expert systems. ➪ Fuzzy inference. ➪ Artificial neural networks. ➪ Hybrids of the above techniques.

• ANNs have not entirely convinced to researches andutilities. Why?

Page 7: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

INTRODUCTIONINTRODUCTION

• ANNs are considered as a “black box”, and it is difficult tomanipulate and to know what happens inside.• Proposed ANN architectures that seem to be too large forthe data samples available to model.• Models are not systematically tested, and the results ofthe test not always are satisfactory presented.• It is difficult to establish benchmarks where to compare procedures and results.

• What could we do to properly design ANN-basedforecasting systems?

Page 8: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

2. On Artificial Neural Networks2. On Artificial Neural Networks

Page 9: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ON ARTIFICIAL NEURAL NETWORKSON ARTIFICIAL NEURAL NETWORKS

•• ANNs are a biologically-inspired attractive paradigm of computation for many applications: pattern recognition, system identification, cognitive modeling, etc.

•• Properties of ANNs are:➪ Capability of “learning” and “self-organizing” to carry out a given task: ill-defined and input/output mapping.➪ Potential for massively parallel computation.➪ Robustness in the presence of noise.➪ Resilience to the failure of components.

Page 10: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ON ARTIFICIAL NEURAL NETWORKSON ARTIFICIAL NEURAL NETWORKS

•• The basic unit is the neuron: inputs, weights, bias, and ouput.•• Many topologies.

Page 11: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

•• Topologies of ANN Topologies of ANN::

Sigmoid activation function

Page 12: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ON ARTIFICIAL NEURAL NETWORKSON ARTIFICIAL NEURAL NETWORKS

•• Neural learning:

➪ Supervised learning: perceptron learning algorithm;Least Mean Square (LMS) rule and delta rule; andbackpropagation algorithm and its derivatives.

➪ Unsupervised learning: Hebbian learning; competitive learning (WTA, vector quantization, andlearning vector quantization); self-organizationfeatures maps (SOMs).

Page 13: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ON ARTIFICIAL NEURAL NETWORKSON ARTIFICIAL NEURAL NETWORKS

•• Suitability of ANN for load forecasting:

➪ ANN are able to approximate numerically anycontinuous function to the desired accuracy. ANNscould be seen as multivariate, nonlinear andnonparametric methods. ➪ ANNs are data-driven method, i.e., it is not necessary to postulate tentative models and then toestimate their parameters, so ➪ Given a sample of input and output vectors, ANNsare able to automatically map the relationshipbetween them.

Page 14: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ANNsANNs and STATISTICS and STATISTICS

Statistics

Learning Model Estimation

Supervised Learning Non-linear regression

Unsupervised Learning Cluster Analysis

Weights Parameters

Inputs Independent Variables

Outputs Dependent Variables

Neural Networks

ON ARTIFICIAL NEURAL NETWORKSON ARTIFICIAL NEURAL NETWORKS

Page 15: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ON ARTIFICIAL NEURAL NETWORKSON ARTIFICIAL NEURAL NETWORKS

•• What do ANNs offer with respect statistical methods?•• The answer is not entirely clear, however:

➪ ANNs are more attractive for many non-specialists. ➪ Statisticians are mainly concentrated on linear models and a small number of parameters. ➪ ANNs are easy to implement and can be easily tuned to particular problems. ➪ ANNs can be implemented in hardware. ➪ ANN can be used as modules in hybrid systems.

•• ANNs and statistics are not competitive techniques.

Page 16: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

3. ANN-based forecasting systems3. ANN-based forecasting systems

Page 17: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ANN-BASED FORECASTING SYSTEMSANN-BASED FORECASTING SYSTEMS

•• Two main architectures: one output node or severaloutput nodes.•• One output node:

➪ Next hour’s load; next day’s peak; next day’sintegral load. ➪ Forecast load profile: repeatedly forecasting onehourly load at a time; or using a system with 24ANNs in parallel, one for each hour of the day.

•• Several output nodes: 24 nodes to forecast the loadprofile.

•• Other situations

Page 18: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ANN-BASED FORECASTING SYSTEMSANN-BASED FORECASTING SYSTEMS

Khotanzad et Al, IEEE Trans. Power Systems, 13(4), 1998

- 153 inputs- 38 ANNs

- 24 outputs

Page 19: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ANN-BASED FORECASTING SYSTEMSANN-BASED FORECASTING SYSTEMS

- 90 inputs- 24 ANNs - 24 outputs

Page 20: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ANN-BASED FORECASTING SYSTEMSANN-BASED FORECASTING SYSTEMS

- 2x79 inputs- 2 ANNs

24 outputs

Page 21: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ANN-BASED FORECASTING SYSTEMSANN-BASED FORECASTING SYSTEMS

Holiday forecasts

Page 22: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

ANN-BASED FORECASTING SYSTEMSANN-BASED FORECASTING SYSTEMS

•• Fuzzy logic:

➪ Front-end fuzzy processor

➪ Fuzzy engine after ANN

Page 23: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

4. Problems in designing ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

Page 24: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• Designing an ANN is not a simple task:

➪ Data preprocessing

➪ ANN designing itself

➪ ANN implementation

➪ Validation

Page 25: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

4.1. Data preprocessing4.1. Data preprocessing

Page 26: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• Data preprocessing: to make the forecasting problem moremanageable•• To reduce the dimension of the input vectors.•• To ‘clean’ the data (removing outliers, missing values orany irregularities, ...)•• Partitioning the input space: classification of the input data (past load profiles or weather data).

➪ Holidays and special days pose a mayor problem. ➪ Not many classes to have enough data in each profile.

•• Input data covering all the Input data covering all the input spaceinput space..•• Analog and digital input data problem.•• Normalization

Page 27: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

4.2. ANN design4.2. ANN design

Page 28: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN design:

•• Selecting architecture: mainly the multilayer perceptron (MLP) (feedforward or recurrent networks).

•• Number of hidden layers, neurons per layer, type of activation function, number of output neurons

•• Automatic design using evolutionary techniques (Geneticalgorithms, evolution strategies and evolutionary programming).

Page 29: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN design: Number of output neurons

•• One output ANN to produce one-step-ahead forecasts.•• Forecasting profiles:

➪ Iterative forecasting. Forecasts of the last hours willbe based on the forecast of the earlier ones. ➪ Multi-model forecasting. One model for each hour of the day. ➪ Single-model multivariate forecasting. A multivariatemethod to forecast all the loads at once, so eachprofile is represented by a 24-dimensional vector.

Page 30: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN design: Number of input nodes

•• The load itself, as the load series is strongly autocorrelated ➪ Forecasting profiles as 24-dimension vectors: data from one or two past days ➪ Forecasting hourly loads: select lagged load valuesby the analysis of autocorrelation functions (risk ofdiscarding lagged variables with strong nonlinearcorrelation)

•• Exogenous variables. Temperature, which is non-linearly related with the load.•• Other weather variables (cloudiness, humidity, wind, ..) are usually unavailable.

Page 31: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN design: Number of hidden neurons

•• There is little theoretical basis for the decision and very few successful heuristics:

➪ If there are too few neurons, the model will not be able to model the data well. ➪ If there are too many, the model will overfit the data.

•• In most cases, the selection is performed by trial and error.

•• In very few cases using evolutionary techniques.

Page 32: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN design: Overfitting and Overparameterization

•• Overfitting means estimating a model that fits the data so well that it ends including the noise and then produces poorforecasting. This comes about because the model was over-trained or it was too complex.•• To avoid overtraining:

➪ Cross-validation: the sample set is split into a trainingset and a validation set. ➪ Regularization techniques: modifying the cost functionto be minimized by adding a term that penalizes for thecomplexity of the model

Page 33: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN design: Overfitting and Overparameterization

•• Overparameterization: it produces overfitting due to the complexity of the model. •• The user adds to the ANN a large number of variables andneurons, without taken into account the number of parametersto be estimated.•• The adequate rate between the number of sample points required for training and the number of weights in the networkhas not yet clearly identified.•• It is difficult to establish how many parameters are too many for a given sample size.

Page 34: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

4.3 ANN implementation4.3 ANN implementation

Page 35: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN implementation: Once the ANN has been designed, itmust be trained to estimate its parameters.

•• To select the training algorithm: backpropagation, quick-propagation, Levenberg-Marquard, ...•• When training must stop?

➪ After a fixed number of iterations ➪ After the error reaches some specific value

•• The above criteria are not adequate since they may leadto overfitting of the model.•• Training samples must be appropriately selected.

Page 36: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN implementation: Evaluating the effectiveness ofimplementation.

•• Was the ANN properly trained and tested, so that its performance was the best it could achieve?

➪ The ANN was well fitted to the data: the errors in thetraining sample must be reported. ➪ The ANN performances in the training and in the test samples were comparable. ➪ The ANN performances across different test samples were coherent

Page 37: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions

4.4. ANN validation4.4. ANN validation

Page 38: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN validation: To examine the ANN errors with samples other than those used for parameter estimation (out of sample errors, as opposed to insample errors).•• Was the performance method fairly compared to that of somewell-accepted method? Four requirements are needed:

a) its performance should be compared to that of well accepted methods

➪ Compared to some “naïve” method, which provides abenchmark. ➪ Compared to that of a good standard method (?): ARMAX, regression model, other ANN, fuzzy engines, ..

Page 39: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

PROBLEMS IN DESIGNING ANN-BASEDPROBLEMS IN DESIGNING ANN-BASEDFORECASTING SYSTEMSFORECASTING SYSTEMS

•• ANN validation:

b) the comparison must be based on the performance on testsamples.c) the size of the test samples must be adequate, so that someinference might be drawn.d) to examine the error using standard techniques:

➪ Mean Absolute Percent Errors (MAPE). Relationshipbetween MAPE and cost function. ➪ Standard deviation (STD) of the errors. ➪ Error distribution.

Page 40: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions 5. A specific proposal5. A specific proposal

Page 41: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

•• The forecasting process is developed in three phases:

1) Using historical data, days are classified accordingto their load profile (Kohonen’s SOM).

2) For each class, an ANN is built and trained.

3) Recall phase, where prediction is carried out.

Page 42: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

HISTORICALDATA

. . .KOHONEN CLASSIFIER

OFF-LINE LEARNING RECALL

PRE-PROCESSING

ELMAN’s NN

PRE-PROCESSING

ELMAN’s NNRECALL PHASE

LOADFORECASTING

POST-PROCESSING

HISTORICALDATA

CLASS 2

HISTORICALDATA

CLASS 1

HISTORICALDATA

CLASS N

DAILYand

HOURLY

MODULES

DAILYand

HOURLY

MODULES

WORKINGDATA

TRAINING:TOPOLOGY AND

WEIGHTS

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

Page 43: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Topologiex x x xk k k kn= ( , , ... , )1 2

- Présentation d’un patron d’entrée

max w xj j k( )⋅- Mise à jour des poids dans le voisinage V du neurone le plus actif

w t w t a x wj j k j( ) ( ) ( )+ = + −1- Normalisation de w- Mise à jour de a y V

- Choix des valeurs initiales de a et V- Initialisation aléatorire des poids . - -- Normalisation- Répéter jusqu’à convergence

L’algorithme

w w w wj j j jn= ( , ,..., )1 2

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

- Détermination du neurone le plus actif

•• Kohonen’s algorithm (SOM)

Page 44: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL•• Clasification

Page 45: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

Lunes deOctubre,Noviembre,Diciembre,Enero,Fecbrero y½ Marzo.

Martes a Viernes en Horariode Invierno (e.d., primeros deNoviembre a finales demarzo).

Domingos (yFestivos) deOctubre aMarzo.

Sábados deOctubre aMarzo.

Domingos (yFestivos) ½Marzo, Abril,Mayo ySeptiembre.

Domingos (yFestivos) de Junio,Julio y Agosto.

Lunes 2ª Marzo,Abril, Mayo y Septiembre.Lunes de Junio y

Julio.

Martes a Viernes Abril, Mayo,½ Junio, Septiembre yOctubre.

Martes aViernes ½Junio y Julio.

Sábados Abril,Mayo ySeptiembre.

Sábados deAgosto.Sábados deJunio y Julio

Lunes a Viernesde Agosto.

S.C. 1

S.C. 3

S.C. 2

S.C. 4

S.C. 5

S.C. 6S.C. 7

S.C. 8

S.C. 9

S.C. 10

S.C. 11

S.C. 12

S.C. 13

S.C. 14

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL•• Two dimensional view:

- Easter class does not appear

Page 46: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

•• Learning phase: a different ANN for each class.•• Input data: the hourly demand, the integral demand and the daily temperatures at 6:00 and 18:00, from January 1989till February 1999.•• Training: 1989-1995; cross-validation: 1996; testing: 1997-February 1999.

•• Correlation between series to predict and other variables isperformed.•• As inputs to the ANN, we use the previous daily load of itsclass (24 inputs) and the predicted integral demand. Only analog inputs are used. The output is the predicted load profile (24 outputs).

Page 47: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL•• Elman recurrent neural networks has been used: feedforward nets with their hidden layer recycled back as inputs.

•• Selection of the number of hidden neurons by experimentation.

Page 48: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

•• Normalization of the input data:

•• Re-training: demand patterns are changing due to long term trends (life-span). In our system the re-learning process is periodic (every year), automatically performedand completely transparent to the user.

Page 49: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

•• Results: MAPE and STD

Page 50: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

Page 51: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

0 5 10 15 20 25 0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

TIME (HOURS)

M A P E (%)

MAPE forclass 12,February 1998

MAPE=0.8%

STD=0.62

Page 52: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

0 5 10 15 20 25 0

0.5

1

1.5

2

2.5

3

TIME (HOURS)

M A P E (%)

MAPE for 2nd fortnight October1998, class 13

MAPE=1.20%

STD= 0.86

Page 53: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

0 5 10 15 20 25 0.6

0.8

1

1.2

1.4

1.6

1.8

2

TIME (HOURS)

M A

P E

(%)

Training, 1989- -1996 Testing, 1997 Testing, 1998

Training and testing error for class 14

Page 54: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

! "! #! $! %! &! '! (! )! *! "!!#&!!

$!!!

$&!!

%!!!

%&!!

&!!!

+,-./012"&23,412"**(22222222222!"#$%&'()*+22222222222567/012")23,412"**(

,(-

.%#

/0+

589:;<=+:>2?8<><;+@<?2?8<>2222

MAPE=0.61%

Page 55: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

0

0,5

1

1,5

2

2,5

OCT NOV DEC JAN FEB MAR

MA

PE (%

)

1997 1998Comparisons ofload forecastingerrors for monthsof class 1, years1997 and 1998

Page 56: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

A SPECIFIC PROPOSALA SPECIFIC PROPOSAL

! &! "!! "&! #!! #&! $!!#&!!

$!!!

$&!!

%!!!

%&!!

&!!!

&&!!

'!!!

'&!!

567/012$6/2<A6742"**)2+BC:DE8@9F222222+,-./012"%GH2<A6742"**)

?8<

>2DC

IF

1(*$2-3!$.&,(-.-2!)-,&,(-.&&&&Easter week 1998

Page 57: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONTENTS CONTENTS1. Introduction2. On Artificial Neural Networks3. ANN-based forecasting systems4. Problems in designing ANN-based forecasting systems

4.1. Data preprocessing4.2. ANN design4.3 ANN implementation4.4. ANN validation

5. A specific proposal6. Conclusions 6. Conclusions6. Conclusions

Page 58: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

CONCLUSIONSCONCLUSIONS

•• Input pattern should be as homogeneous as possible.

•• ANN design must avoid overfitting and overparameterization.

•• Error of ANNs shoul be performed using standard techniques

•• More research on the behavior of large ANN is needed.

•• More rigorous standards should be adopted in the reporting of experiments.

Page 59: Francisco Sandoval Departamento de Tecnología Electrónica ...Francisco Sandoval Departamento de Tecnología Electrónica Universidad de Málaga, Espagne. Dpto. Tecnología Electrónica

Dpto. Tecnología ElectrónicaUniversidad de Málaga

SHORT-TERM LOAD FORECASTING USINGSHORT-TERM LOAD FORECASTING USING

ARTIFICIAL NEURAL NETWORKSARTIFICIAL NEURAL NETWORKS

Francisco SandovalDepartamento de Tecnología Electrónica

Universidad de Málaga, Espagne