analiza predictiva

PPRROOIIEECCTT DDEE TTIIPP „„IINNOOVVAARREE”” NNRR.. 111177--22000077 ((UUMMAAPPIIDD))

UUUnnniiitttaaattteee mmmooobbbiiilllăăă dddeee aaaccchhhiiizzziiiţţţiiieee,,, ppprrreeellluuucccrrraaarrreee,,, iiidddeeennntttiiifffiiicccaaarrreee şşşiii dddiiiaaagggnnnooozzzăăă dddeee ssseeemmmnnnaaalll

AAAlllgggooorrriiitttmmmiii dddeee iiidddeeennntttiiifffiiicccaaarrreee,,, ppprrreeedddiiicccţţţiiieee şşşiii dddiiiaaagggnnnooozzzăăă pppeee bbbaaazzzăăă dddeee ssseeemmmnnnaaallleee nnneeessstttaaaţţţiiiooonnnaaarrreee

RRAAPPOORRTT DDEE CCEECCEETTAARREE

AAMMCCSSIITT..UUPPBB--PP55..111177--22000077..IIIIII//DDSS..JJCC..CCPP..AADD--0099..22000099

AAuuttoorrii:: DDaann ŞŞTTEEFFĂĂNNOOIIUU JJaanneettttaa CCUULLIIŢŢĂĂ CCăăttăălliinn PPEETTRREESSCCUU AAlleexx DDUUMMIITTRRAAŞŞCCUU

ASTI CONTROL SA RO-060011 Bucureşti, Calea Plevnei 139, Bloc B

Tel: +(4 021) 317 4732 Fax: +(4 021) 317 4733

E-mail: [email protected] www.asticontrol.ro

EEttaappaa IIIIII ((ffiinnaallăă)) –– 22000099 RRReeeaaallliiizzzaaarrreeeaaa,,, ttteeessstttaaarrreeeaaa,,, îîîmmmbbbuuunnnăăătttăăăţţţiiirrreeeaaa şşşiii pppuuunnneeerrreeeaaa îîînnn fffuuunnncccţţţiiiuuunnneee aaa

ppprrroootttoootttiiipppuuullluuuiii (((ssseeerrriiiaaa 000))) uuunnniiitttăăăţţţiiiiii mmmooobbbiiillleee

RRAAPPOORRTT DDEE CCEERRCCEETTAARREE AAMMCCSSIITT..UUPPBB--PP55..111177--22000077..IIIIII//DDSS..JJCC..CCPP..AADD--0099..22000099

Dan ŞTEFĂNOIU∗, Janetta CULIŢĂ,

Cătălin PETRESCU, Alexandru DUMITRAŞCU Universitatea „Politehnica” din Bucureşti Facultatea de Automatică şi Calculatoare

Centrul de cercetare ACPC (partener al proiectului) www.pub.ro, www.acs.pub.ro

E-mails: [email protected], [email protected] [email protected], [email protected]

Rezumat

Ajuns la final, proiectul, intitulat Unitate mobilă de achiziţie, prelucrare, identificare şi diagnoză de semnal (UMAPID), a avut ca obiectiv realizarea unui sistem de achiziţie şi prelucrare a datelor, cu deschidere către mai multe categorii de semnale, avînd naturi diferite. În precedentele rapoarte de cercetare a fost descrisă structura hardware şi (parţial) software a acestui sistem. În ultima etapă a proiectului (a treia), s-a urmărit finalizarea lucrărilor privind sistemul UMAPID, ca produs de inovare valorificabil în perioada următoare de timp. Principalele activităţi ale etapei, prevăzute în planul de realizare, sunt următoarele:

Proiectarea şi implementarea algoritmilor evoluaţi de tip timp-frecvenţă-scală. (Tip: CI.) Personalizarea pachetelor de senzori. (Tip: DE.) Testarea şi punerea în funcţiune. (Tip: DE.) Pregătirea demonstrării funcţionării. (Tip: DE.) Redactarea manualului de utilizare. (Tip: DE.) Omologarea şi introducerea în fabricaţie (seria 0). (Activitate susţinută prin cofinanţare, fără implicarea sursei bugetare alocate acestui proiect.)

Se poate constata cu uşurinţă că singura activitate care incumbă cercetare şi inovare este prima. Celelalte activităţi se referă la finalizarea efectivă a produsului. Din acest motiv, raportul de cercetare prezentat în continuare este constituit din două părţi: ∗ Director de proiect. www.geocities.com/dandusus/Danny.html

Descrierea riguroasă a algoritmilor şi programelor software cu care a fost dotat produsul. Manualul de utilizare şi documentaţia de produs.

Aceste părţi sunt despărţite net una faţă de alta, avînd în vedere că a doua (manulaul de utilizare şi documentaţia de produs) constituie o entitate de sine stătătoare, care însoţeşte produsul. Ea conţine însă numeroase detalii privind structura şi funcţionarea acestuia, în scopul facilitării exploatării de către utilizatori cu o minimă pregătire în domeniu (inclusiv lista comentată a programelor şi rutinelor implementate în urma descrierii din prima parte a raportului).

Echipa de cercetare și inovare a proiectului își exprimă gratitudinea faţă de AMCSIT Politehnica pentru susţinerea financiară fără de care acest produs nu ar fi putut vedea lumina zilei. Totodată, ea continuă să spere într-o reducere drastică și benefică unei minţi creator-inovatoare a birocraţiei căreia a trebuit să i se facă faţă, cu greu, pe toată durata proiectului.

1/2

PPrreecciizzăărrii ssuupplliimmeennttaarree pprriivviinndd ffiinnaalliizzaarreeaa

EEttaappeeii aa IIIIII--aa,, ddiinn 22000099 RRReeeaaallliiizzzaaarrreeeaaa,,, ttteeessstttaaarrreeeaaa,,, îîîmmmbbbuuunnnăăătttăăăţţţiiirrreeeaaa şşşiii pppuuunnneeerrreeeaaa îîînnn fffuuunnncccţţţiiiuuunnneee aaa

ppprrroootttoootttiiipppuuullluuuiii uuunnniiitttăăăţţţiiiiii mmmooobbbiiillleee

Aşa cum s-a precizat în rezumatul raportului ştiinţifico-tehnic AAMMCCSSIITT..UUPPBB--PP55..111177--22000077..IIIIII//DDSS..JJCC..CCPP..AADD--0099..22000099, depus la AMCSIT Politehnica, odată cu documentele de finalizare a Etapei a III-a (ultima a proiectului), principalele activităţi ale etapei, prevăzute în planul de realizare, sunt următoarele:

Proiectarea şi implementarea algoritmilor evoluaţi de tip timp-frecvenţă-scală. (Tip: CI.) Personalizarea pachetelor de senzori. (Tip: DE.) Testarea şi punerea în funcţiune. (Tip: DE.) Pregătirea demonstrării funcţionării. (Tip: DE.) Definitivarea documentaţiei de execuţie şi redactarea manualului de utilizare. (Tip: DE.) Omologarea şi introducerea în fabricaţie. (Activitate susţinută prin cofinanţare, fără implicarea sursei bugetare alocate acestui proiect.)

Vom oferi cîteva explicaţii suplimentare, pe marginea acestora.

1. Proiectarea şi implementarea algoritmilor evoluaţi de tip timp-frecvenţă-scală Algoritmii sunt descrişi în capitolele 2-4 ale raportului mai sus amintit. Descrierea se referă atît la fundamentul teoretic, cît şi la aspecte de natură practică privind implementarea acestora. Algoritmii vizaţi sunt următorii:

PARMAX – identificare şi predicţie de date cu ajutorul unor modele de tip autoregresiv, cu medie alunecătoare şi control exogen;

FORWAVER – predicţie pe baza unui model de semnal construit cu ajutorul undinelor, în combinaţie cu un model auto-regresiv de zgomot;

GAMP – diagnoză de defecte pe baza unui dicţionar de forme de undă. Aceşti algoritmi sunt originali şi integrează două tehnici de optimizare evoluţionară, care permit eficientizarea lor: aglomerarea de particule şi urmărirea prin potrivire cu ajutorul unui algoritm genetic. Complexitatea lor este relativ ridicată, fapt pentru care a fost necesară o manieră de programare profesională, de nivel înalt.

2. Personalizarea pachetelor de senzori Chiar dacă reducerea resurselor bugetare ale proiectului a afectat extinderea reţelei de senzori din viziunea proiectului iniţial (cu atît mai mult cu cît senzorii avînd comunicaţie radio sunt relativ rari şi scumpi pe piaţă), a fost totuşi posibilă personalizarea unui pachet principal de senzori – cel ecologic. Acesta include senzorii descrişi pe larg în raportul ştiinţifico-tehnic al etapei precedente sau în manualul de utilizare. Cu toate acestea, a fost personalizată şi o (mini-)reţea de senzori de vibraţie (accelerometre), cu transmisie prin fir (nu radio), menită să permită achiziţia de date pentru programul de diagnoză GAMP. În raportul aferent acestei etape (mai sus amintit), la secţiunea 5.3., este descrisă o platformă de lucru în care a fost integrată reţeaua de accelerometre.

2/2

Se are în vedere extinderea sub-sistemului de senzori cu alte pachete specializate, în măsura bugetului disponibil, chiar şi după finalizarea acestui proiect. Manualul de utilizare include o descriere extrem de detaliată privind maniera în care utilizatorul poate să îşi construiască şi personalizeze propria sa reţea de senzori, pe baza unor principii cunoscute în ştiinţa calculatoarelor.

3. Testarea şi punerea în funcţiune Au fost efectuate măsurători specifice şi teste (în special de anduranţă) ale produsului UMAPID în integralitatea lui şi, în particular, ale subansamblului constituit de interfaţa de achiziţie de date VISA (descrisă pe larg în cadrul raportului ştiinţifico-tehnic al etapei precedente). În cadrul dosarului de omologare anexat se găseşte un buletin de măsurători şi teste efectuat de către o firmă specializată, în colaborare cu partenerii proiectului. Au fost testate caracteristicile tehnice ale produsului, performanţele sale uzuale şi capacitatea de a rezista la condiţii grele de exploatare. În paralel, au fost testate programele software implementate la nivelul unităţii mobile, pe o serie de studii de caz cu date reale, provenite de la diferite fenomene naturale. Rezultatele acestor teste sunt prezentate atît în Capitolul 5 al raportului mai sus menţionat, cît şi în compendiul anexat dosarului de omologare. Unele dintre aceste studii de caz au fost utilizate şi în cadrul manualului de utilizare, pentru exemplificarea funcţionării produsului. Punerea în funcţiune a constat în conectarea celor 3 subsisteme, mici reglaje hardware ale interfeţei VISA şi configurări software ale reţelei de senzori cu transmisie radio. Toate aceste operaţii sunt descrise pe larg în manualul de utilizare, unde utilizatorul este învăţat cum să pună în funcţiune produsul UMAPID.

4. Pregătirea demonstrării funcţionării A fost imaginat un protocol de demonstrare a funcţionării produsului, cu ocazia prezentării acestuia la două expoziţii. În raportul mai sus amintit, la pagina 92, au fost ilustrate 4 fotografii ale produsului expus la una dintre aceste expoziţii. Obiectivul principal urmărit în cursul pregătirii demonstrării a fost acela de a ilustra capacităţile unităţii mobile prin intermediul a două interfeţe grafice conviviale, proiectate şi implementate de către echipa proiectului:

eKo-View – care permite configurarea reţelei de senzori ecologici; Forecast – care permite iniţializarea şi rularea programelor de predicţie/diagnoză.

5. Definitivarea documentaţiei de execuţie şi redactarea manualului de utilizare În urma mai multor teste de produs, a fost posibilă corectarea unor mici deficienţe de proiectare (în special a interfeţei VISA), cum ar fi: recalibrarea unor circuite, schimbarea unor contacte defectuoase sau simplificarea unor circuite. Acestea au condus la definitivarea documentaţiei de execuţie. Manualul de utilizare al produsului a fost anexat raportului mai sus menţionat şi include toate informaţiile necesare instalării şi utilizării produsului (împreună cu o serie de caracteristici tehnice ale acestuia).

6. Omologarea şi introducerea în fabricaţie Împreună cu această notă explicativă, au fost anexate şi:

procesul verbal de omologare internă a produsului; dosarul care a stat la baza procesului verbal amintit.

O cerere de brevet de invenţie a fost de asemenea înaintată, asa cum s-a specificat în documentele de finalizare a etapei.

PPRROOCCEESS

Comisia de omologare vederea omologării prototiDiagnoză de Semnal” (pe centrală de prelucrare, intede senzori cu transmisie rad Obiectul omologării estenr. A-00779/29.09.2009. El prin AMCSIT Politehnicanr. 117/2007. Comisia:

a ascultat expunereastructura produsuluiacestuia; a examinat dosarul d a examinat prototipu a examinat manualul

Comisia a constatat că: realizarea unei unităspaţiu deschis sau în produsul corespunde verificările efectuate consorţiu, asupra prototipului sunt conv prototipul corespundomologare; prototipul este funcmanualul de utilizare manualul de utilizare proba de anduranţă100 de zile de funcţio

AR

T

EU

STI CONTROL SA O-060011 Bucureşti, Calea Plevnei 139, Bloc B el: +(4 021) 317 4732 Fax: +(4 021) 317 4733 -mail: [email protected] RL: www.asticontrol.ro

1/2

VVEERRBBAALL DDEE OOMMOOLLOOGGAARREE IINNTTEERRNNĂĂ

ÎÎnncchheeiiaatt aazzii,, 2299..0099..22000099

internă s-a reunit la sediul S.C. ASTI CONTROL S.A., în pului „Unităţii Mobile de Achiziţie, Prelucrare, Identificare şi scurt, UMAPID), constituit din 3 module principale: unitatea

rfaţa de achiziţie de date cu transmisie radio (VISA) şi reţeaua io. înaintat ca propunere de brevet de invenţie la OSIM, cu a fost realizat în cadrul Programului Naţional „Inovare”, finanţat – Bucureşti, cu Proiectul nr. 1081/2007 şi Contractul

directorului de proiect, dl. profesor Dan Ştefănoiu, cu privire la şi principiile care au condus la conceperea şi realizarea

e omologare; l produsului, acesta fiind pus în funcţiune; de utilizare a produsului.

ţi mobile de monitorizare şi diagnosticare a unor sisteme în chis este justificată sub raport ştiinţific şi tehnic; datelor şi caracteristicilor tehnice din manualul de utilizare; de către S.C. ASTI CONTROL S.A., împreună cu partenerii din preciziei şi repetabilităţii rezultatelor testelor cu ajutorul ingătoare şi corespund exigenţelor ştiinţifice în domeniu; e cu prevederile proiectului, prezentat în documentaţia de

ţional, fiind echipat cu toate componentele specificate în ; este explicit şi pe deplin lămuritor pentru utilizatori; a fost efectuată prin monitorizarea produsului pe durata a nare continuă, fără defect.

2/2

În urma discuţiilor purtate, Comisia omologhează produsul UMAPID atît din punct de vedere hardware, cît şi software, în vedrea utilizării în special în aplicaţii de ecologie şi protecţie a mediului, cu recomandarea de a extinde sistemul de senzori radio şi către alte domenii. Prezentul proces verbal a fost încheiat în 4 exemplare – cîte unul pentru fiecare partener din proiect (S.C. ASTI CONTROL S.A (coordonator), Universitatea „Politehnica” din Bucureşti – Centrul de Cercetare ACPC (partenerul 1) şi S.C. DIGITAL CONTROL S.R.L. (partenerul 2)) şi unul pentru AMCSIT Politehnica Bucureşti.

COMISIA Semnături Preşedinte:

Ing. Sabin STAMATESCU Administrator S.C. ASTI CONTROL S.A.

Membri: Prof.dr.ing. Dumitru POPESCU Decan, Facultatea de Automatică şi Calculatoare, din cadrul UPB

Ing.drd. Octavian NICULA Director S.C. DIGITAL CONTROL S.R.L.

Ing. Adrian ECATERINESCU S.C. ASTI CONTROL S.A.

Secretar: Ing. Veronica Barbulea S.C. ASTI CONTROL S.A.

I

Cuprins

1. Scurtă introducere 1

2. Predicţia datelor multi-dimensionale cu ajutorul modelelor ARMAX 3 2.1. Reprezentarea discretă, de stare, a unei reţele de senzori 3 2.2. Modelul discret, de tip intrare-ieşire, al unei reţele de senzori 4 2.3. Construcţia predictorului PARMAX 9 2.4. Selectarea predictorului PARMA(X) optimal prin strategia PSO 14 2.5. Algoritmul PARMAX 22

3. Predicţia datelor uni-dimensionale cu ajutorul undinelor 29 3.1. Paradigma deparazitării semnalelor 29 3.2. Scurtă privire asupra undinelor ortogonale şi structurii multi-rezoluţie 34 3.3. Alegerea pachetelor de undine optimale prin minimizarea entropiei 39 3.4. Modelul de predicţie bazat pe undine ortogonale 43 3.5. Selecţia unui predictor optimal prin maximizarea calităţii predicţiei 43 3.6. Algoritmul FORWAVER 46 3.7. Detalii privind implementarea Algoritmului FORWAVER 51

3.7.1. Observaţii generale 51 3.7.2. Evaluarea suporturilor corespunzătoare coeficienţilor undină 55 3.7.3. Evaluarea valorilor unei undine utilizînd bancul de filtre 58 3.7.4. Evaluarea suporturilor corespunzătoare coeficienţilor undină 56

4. Diagnoză de defecte cu ajutorul dicţionarelor timp-frecvenţă-scală 61 4.1. Despre dicţionarele timp-frecvenţă-scală 61 4.2. Construcţia şi configurarea unui dicţionar timp-frecvenţă-scală 63 4.3. Algoritmul urmăririi prin potrivire 71 4.4. Căutarea atomilor celor mai potriviţi cu ajutorul unui Algoritm Genetic 74 4.5. Algoritmul GAMP 88

5. Rezultate obţinute cu ajutorul sistemului UMAPID în funcţiune 93 5.1. Predicţia datelor multi-dimensionale 93 5.2. Predicţia datelor uni-dimensionale 94

5.2.1. Predicţia seriei de timp a şomajului în SUA 94 5.2.2. Predicţia seriei de timp a conştiinţei colective 95

5.3. Diagnoză de defecte mecanice 106 5.3.1. Caracteristici ale vibraţiilor emise de sisteme mecanice 106 5.3.2. Platforma şi parametrii de lucru ai aplicaţiei 110 5.3.3. Rezultatele programului de diagnoză GAMP 115

6. Concluzii finale şi perspective 120

Anexa A. Redefiniri ale criteriului calităţii predicţiei (PQ) 121 Anexa B. Algoritmi de eşantionare stocastică universală 123

B.1. Algoritmul original al lui Baker 123 B.2. Algoritmul generalizat al lui Baker 126

Anexa C. Publicaţii selectate 129

Bibliografie 153

Algoritmi de identificare, predicţie şi diagnoză pe bază de semnale nestaţionare

II

Lista figurilor

1.1. Structura sistemului UMAPID. 1 2.1. Evoluţia unei populaţii către punctul de optim

în cadrul Algoritmului PSO. 15 2.2. Reprezentarea tridimensională a populaţiilor de particule

în cadrul Algoritmului PARMAX. 21 2.3. Reprezentarea tridimensională a populaţiilor de particule

în cadrul Algoritmului PARMA multi-dimensional. 22 2.4. Reprezentarea tridimensională a populaţiilor extinse de particule

în cadrul Algoritmului PARMAX. 27 3.1. Principiul deparazitării semnalelor cu ajutorul proiecţiilor ortogonale. 30 3.2. Harta României reprezentată la diferite scale şi nivele de rezoluţie. 33 3.3. Proprietatea de reconstrucţie perfectă a undinelor ortogonale. 37 3.4. Corespondenţa timp-frecvenţă în Algoritmul lui Mallat. 37 3.5. Corespondenţa generalizată timp-frecvenţă. 38 3.6. Strategia de căutare din cadrul procedurii IDA*. 41 3.7. Meta-arborele utilizat pentru optimizarea unui banc QMF

pe ramura de analiză. 42 3.8. Principiul actualizării matricii informatice a frunzelor binare. 53 3.9. Configuraţia matricii informatice a coeficienţilor undină. 53 3.10. Utilizarea bancului de filtre pentru calcularea valorilor undinelor. 59 4.1. Efectul operatorilor atomici aplicaţi asupra unei ferestre de bază. 64 4.2. Laticea curentă din planul timp-frecvenţă-scală. 68 4.3. Atomi timp-frecvenţă-scală Gaussieni şi spectrele asociate. 71 4.4. Principiul deparazitării semnalelor

folosind un dicţionar timp-frecvenţă-scală. 72 4.5. Principiul urmăririi prin potrivire. 74 4.6. Definiţia unui cromozom timp-frecvenţă-scală. 76 4.7. Definiţia încrucişării genetice. 78 4.8. Definiţia mutaţiei genetice. 78 4.9. Definiţia inversiunii genetice. 78 4.10. Principiul strategiei elitiste de selecţie. 82 4.11. Un exemplu de variaţie a temperaturii de călire. 85 FOTO: Participarea sistemului UMAPID la Salonul inovării,

Bucureşti, 28-29 iulie 2009. 92

5.1. Seria de timp Y1, împreună cu tendinţa şi componenta sezonieră. 96 5.2. Y1: Vedere globală asupra predicţiei clasice şi a performanţei asociate. 96 5.3. Y1: Vedere detaliată asupra orizontului de predicţie clasică. 97 5.4. Y1: Undinele tată şi mamă ale predictorului bazat pe undine. 97 5.5. Y1: Arborele binar optimal asociat Transformatei Undină. 98 5.6. Y1: Scalograma seriei de timp (reprezentare în plan). 98 5.7. Y1: Scalograma seriei de timp (reprezentare în spaţiu). 99 5.8. Y1: Suprafaţa de calitate a predicţiei şi punctul de maxim. 99 5.9. Y1: Vedere globală asupra predicţiei cu undine şi a performanţei asociate. 100 5.10. Y1: Vedere detaliată asupra orizontului de predicţie cu undine. 100

RAPORT DE CERCETARE [AAMMCCSSIITT..UUPPBB--PP55..111177--22000077..IIIIII//DDSS..JJCC..CCPP..AADD--0099..22000099] <28-Sep-09>

III

5.11. Seria de timp Y11, împreună cu tendinţa şi componenta sezonieră. 101 5.12. Y11: Vedere globală asupra predicţiei clasice

şi a performanţei asociate. 101 5.13. Y11: Vedere detaliată asupra orizontului de predicţie clasică. 102 5.14. Y11: Undinele tată şi mamă ale predictorului bazat pe undine. 102 5.15. Y11: Arborele binar optimal asociat Transformatei Undină. 103 5.16. Y11: Scalograma seriei de timp (reprezentare în plan). 103 5.17. Y11: Scalograma seriei de timp (reprezentare în spaţiu). 104 5.18. Y11: Suprafaţa de calitate a predicţiei şi punctul de maxim. 104 5.19. Y11: Vedere globală asupra predicţiei cu undine

şi a performanţei asociate. 105 5.20. Y11: Vedere detaliată asupra orizontului de predicţie cu undine. 105 5.21. Principiul genezei vibraţiilor mecanice. 106 5.22. Spectrul tipic al unui accelerometru. 108 5.23. Imagini intuitive ale efectului de rezonanţă

din funcţionarea accelerometrelor. 109 5.24. Modelul cu purtătoare de rezonanţă

al vibraţiei codificatoare de defect. 109 5.25. O platformă de testare şi diagnoză a rulmenţilor. 110 5.26. Caracteristicile constructive ale rulmenţilor testaţi. 111 5.27. Segmente de vibraţie achiziţionate de la 4 rulmenţi cu bile. 113 5.28. Segmente de vibraţie prelucrate primar,

provenite de la 4 rulmenţi cu bile. 114 5.29. Rezultate de deparazitare a vibraţiilor

cu ajutorul unui dicţionar de undine. 116 5.30. Reprezentarea timp-scală-frecvenţă a vibraţiei <B3850610>. 117 5.31. Reprezentarea timp-scală-frecvenţă a vibraţiei <I3850610>. 117 5.32. Reprezentarea timp-scală-frecvenţă a vibraţiei <E3850610>. 118 5.33. Reprezentarea timp-scală-frecvenţă a vibraţiei <M3850610>. 118

B.1. Mecanismul SUS simulat cu ajutorul unei rulete virtuale ideale. 123 B.2. Mecanismul SUS implementat cu ajutorul unei rulete virtuale. 124

Lista tabelelor

4.1. Parametri care definesc un dicţionar timp-frecvenţă-scală discret. 71 4.2. Parametri care configurează un Algoritm Genetic. 88 5.1. Frecvenţele naturale (caracteristice) ale unui rulment cu bile. 111


IV

Lista algoritmilor

2.1. PARMAX – un algoritm de predicţie a proceselor stocastice, cu ajutorul modelelor MISO-ARMAX, folosind tehnica PSO. 23

2.2. Testul de stabilitate Schür-Cohn. 28 3.1. FORWAVER – un algoritm de predicţie a seriilor de timp nestaţionare,

folosind pachete de undine ortogonale, cu suport compact. 47 3.2. Algoritmul lui Daubechies de generare a undinelor ortogonale,

cu suport compact. 49 3.3. Algoritmul Daubechies-deRham de rezolvare a EDL finite,

cu rezoluţie controlată. 50 4.1. GAMP – un algoritm genetic de urmărire prin potrivire. 88 B.1. Algoritmul (clasic al) lui Baker. 125 B.2. Algoritmul generalizat al lui Baker. 126


1

11.. SSccuurrttăă iinnttrroodduucceerree Ultima etapă (a treia) a proiectului “Unitate mobilă de achiziţie, prelucrare, identificare şi diagnoză de semnal” (UMAPID), are ca obiectiv principal finalizarea produsului. Pentru aceasta, au fost desfăşurate două tipuri majore de activităţi: de cercetare-inovare (înzestrarea produsului cu programe software adecvate) şi de dezvoltare (efectuarea de teste şi elaborarea manualului de utilizare, însoţit de documentaţia de produs). În cadrul acestui raport de cercetare, va fi descrisă pe larg prima activitate a etapei, cu referire la rezultatele testării (numite rezultate de simulare). Ce-a de-a doua categorie de activităţi a condus la manualul de utilizare anexat (extins cu documentaţia de produs). Înainte de a ataca problematica de la baza programelor software proiectate şi implementate, este utilă o scurtă privire de ansamblu asupra sistemului UMAPID. În rapoartele tehnice precedente, [PNS07] şi [SPD08], a fost descrisă pe larg structura hardware a sistemului. Ea este ilustrată sugestiv în Figura 1.1.

Figura 1.1. Structura sistemului UMAP

Există 3 nivele ierarhice privind transferul şi prelucrarea dinterfaţa VISA şi calculatorul portabil. Reamintim ca principal(care s-a dovedit şi un impediment important în achiziţionareade a transmite date pe calea undelor radio. Există puţini transmisie radio. Interfaţa VISA a fost de asemenea îmbunătăţprincipiile care au stat la proiectarea ei (descrise în [SPD08]curs de omologare la OSIM.)

Calculator portabil ACER

1 procesor dual core

Interfaţă de achiziţie de date VISA

Transmisie radio

Nod de comunicaţie Transmisie radio

SenzoTransmisie

i
Valea Albă din Alpii francez
ID.

e date: reţeaua de senzori, a caracteristică a senzorilor acestora) este capacitatea producători de senzori cu

ită, fără a fi totuşi schimbate ). (Dealtfel, interfaţa este în

r radio


2

În afara descrierii configuraţiei hardware, în raportul tehnic precedent, [SPD08], a fost prezentat şi primul pas în direcţia înzestrării sistemului cu programe software de identificare, predicţie şi diagnoză a fenomenelor care furnizează date, achiziţionate cu ajutorul senzorilor. A fost, astfel, implementat un prim algoritm, numit PARMA (Predicţie pe bază de modele de identificare ARMA), care constituie o procedură rapidă (deşi nu foarte precisă) de prognozare a datelor uni-dimensionale (numite serii de timp) achiziţionate prin intermediul senzorilor. Datele achiziţionate prezintă însă alte două caracteristici importante: pot fi grupate în blocuri multi-dimensionale şi au un caracter nestaţionar. Vom explica deîndată semnificaţia acestor termeni. Senzorii sistemului UMAPID sunt grupaţi în truse specializate. În Figura 1.1, este ilustrat un exemplu de astfel de trusă în acţiune. Este vorba despre senzori ecologici, care măsoară temperatura şi umiditatea (două mărimi fizice corelate, aşa cum s-a arătat în [NDS07]). Mărimile de acelaşi tip (de exemplu, temperaturi la sol sau ambiante), eşantionate în diferite locaţii ale unui micro-climat conduc la un bloc de date unitar, în care fiecare serie de timp reprezintă un canal de măsură. Este foarte probabilă existenţa unei corelaţii între seriile de timp ale unui astfel de bloc de date. Aceasta ar putea fi exploatată pentru a creşte precizia de predicţie de pe fiecare canal. Algoritmul PARMA nu ia în considerare o astfel de proprietate, el acţionînd pe fiecare canal de măsură ca şi cum ar fi izolat faţă de celelalte. De aceea, a fost necesară proiectarea unui algoritm de predicţie bazat tot pe modele de identificare, dar de complexitate mai mare, în care să fie pusă în valoare posibila corelaţie existentă între canalele de măsură ale aceleiaşi mărimi fizice. Pe scurt, este vorba despre modelul ARMAX [SoSt89], [SCS05], care a condus la Algoritmul PARMAX (descris pe larg în acest raport de cercetare). Acesta apelează la o tehnică de neconvenţională de optimizare, de tip euristic (heuriskein = a căuta, în limba greacă) [KeEb95]. Datele numerice care provin de la fenomene naturale posedă, în marea lor majoritate, o proprietate care, de regulă, limitează precizia modelelor matematice construite: nestaţionaritatea. Ideal ar fi ca datele să fie staţionare, adică să aibă spectrul de frecvenţă [PrMa96] constant în timp. Ori, această ipoteză (ca şi cea a liniarităţii modelelor matematice) s-a dovedit a fi nerealistă. Spectrul unei serii de timp cu un număr suficient de mare de date variază în timp. Cu alte cuvinte, seria de timp este nestaţionară. Pentru ca acest fenomen să nu se înregistreze, este necesar ca perioada de eşantionare să aibă valori foarte mici (la nivel de milisecunde) şi numărul de date măsurate să fie, de asemenea, mic (cîteva zeci, cel mult). Cu un astfel de bloc de date nu se pot construi însă modele matematice suficient de precise în scopul predicţiei şi al diagnozei. (Această abordare apare totuşi în aplicaţii de telecomunicaţie bazate pe compresia datelor cu modele auto-regresive.) Rezultă că este necesară o abordare bazată pe tehnici de prelucrare a semnalelor nestaţionare. Aceste tehnici fac parte dintr-un cîmp de cercetare relativ nou şi extrem de dinamic al domeniului Prelucrării Semnalelor (PS): analiza de semnal de tip timp-frecvenţă [CoL95], [StD95]. Unul dintre cele mai interesante instrumente din acest cîmp îl constituie undina [StSt07], [SSP09]. Ce sunt undinele şi cum au fost ele utilizate în cadrul acestui proiect va fi explicat în secţiunile următoare. Cert este faptul că ele au condus la doi algoritmi de prelucrare a datelor achiziţionate avînd complexitate ridicată: FORWAVER (de predicţie uni-canal pe bază de undine ortogonale cu suport compact) şi GAMP (de diagnoză a defectelor mecanice pe bază de dicţionare de forme de unde, care includ undine). Aceşti algoritmi sunt detaliaţi în cadrul raportului de cercetare de faţă. Aşa cum se va observa, ei sunt conjugaţi cu tehnici euristice de optimizare provenind din Inteligenţa Artificială [RuNo95] sau din domeniul Programării Evoluţionare [MiM95]. De notat că algoritmii bazaţi pe modele de identificare (PARMA şi PARMAX) iau de asemenea în considerare caracterul nestaţionar al datelor achiziţionate, deşi nu într-o


3

manieră directă. Modelele de identificare din clasa ARMAX (care include ARMA) au o caracteristică importantă: pot fi adaptive. Aceasta înseamnă că ele se adaptează permanent noilor date măsurate, adică au parametri variabili în timp. Este binecunoscută corelaţia directă între modelele ARMA(X) de identificare şi operaţia de filtrare din PS: ele sunt de fapt filtre de semnal. Ca orice filtru, ele posedă caracteristici în frecvenţă. Variind parametrii unui filtru, este variată şi caractertistica sa în frecvenţă, adică spectrul. Am făcut această precizare pentru a justifica titlul reportului de cercetare. Semnalele nestaţionare constituie punctul de plecare pentru ambele categorii de modele matematice: cele bazate pe tehnici de identificare a sistemelor (PARMA, PARMAX) şi cele bazate pe tehnici de prelucrare de semnal (FORWAVER, GAMP). Acest raport de cercetare se concentrează aşadar pe descrierea în detaliu a primei activităţi din cadrul etapei, cu referire, în final la activitatea de testare a produsului, prin cîteva dintre rezultatele de simulare obţinute. Unele publicaţii ale echipei de cercetare, publicaţii care au legătură cu acest subiect, au fost de asemnea anexate raportului. Ele descriu şi alte rezultate de simulare decît cele din raport.

22.. PPrreeddiiccţţiiaa ddaatteelloorr mmuullttii--ddiimmeennssiioonnaallee ccuu aajjuuttoorruull mmooddeelleelloorr AARRMMAAXX Sistemul de senzori ai UMAPID are capacitatea de furniza două mari categorii de date: uni-dimensionale (cînd este măsurată o singură mărime fizică într-o singură locaţie) şi multi-dimensionale (cînd operaţia de măsurare se efectuează asupra uneia sau mai multe mărimi fizice, spaţial localizate în mai multe puncte). Desigur, datele din a doua categorie pot fi văzute ca o colecţie de serii de timp uni-dimensionale care prezintă sau nu corelaţii între ele. Dacă aceste corelaţii există, predictorul PARMA descris în raportul tehnic precedent ([SPD08]) nu le ia în considerare, fapt care poate conduce la limitarea performanţelor sale. Din acest motiv, în cazul blocurilor de date multi-dimensionale, este necesară proiectarea şi implementarea unui predictor adecvat, care să exploateze proprietatea de inter-corelare a diferitelor canale de măsură, în vederea creşterii perormanţei de predicţie. În această secţiune, va fi descris Algoritmul de predicţie PARMAX, care se bazează pe un model de identificare multi-dimensional, adică de tip MIMO (Multi-Input-Multi-Output – cu intrări şi ieşiri multiple).

2.1. Reprezentarea discretă, de stare, a unei reţele de senzori

Senzorii cu repartizare geografică (cum ar putea fi şi cei ai sistemului UMAPID în anumite aplicaţii – de exemplu, de monitorizare ecologică a unui areal) nu furnizează doar valori eşantionate în timp ale parametrilor sistemului investigat, ci şi valori ale acestora eşantionate spaţial. Cu alte cuvinte, sistemul investigat este, în acest caz, o entitate ale cărei stări variază continuu atît în timp, cît şi în spaţiu. Prin alegerea adecvată a ratelor de eşantionare, se rezolvă problema succesiunii temporale a datelor provenite de la stările sistemului [PrMa96], [StD96]. Prin distribuirea adecvată a senzorilor în cadrul arealului, se rezolvă problema eşantionării spaţiale a sistemului, adică a alegerii stărilor sale reprezentative. Dacă pentru prima problemă există o serie de rezultate de eşantionare ajutătoare (în speţă, Regula de eşantionare Kotelnikov-Shannon-Nyquist [StD96]), pentru cea de-a doua, după cunoştinţele noastre, nu au fost încă propuse reguli atît de generale. Intuitiv, senzorii amplasaţi spaţial ar trebui să constituie o reţea cît mai densă, pentru a putea surprinde corelaţiile intime ale stărilor sistemului (chiar dacă o parte dintre senzori se vor dovedi redundanţi). Ca şi în cazul stabilirii ratelor de eşantionare, alegerea unei anumite densităţi a senzorilor este condiţionată de raţiuni economice. Deosebirea constă însă în faptul că adăugarea unui nou senzor în reţea se poate dovedi a fi o decizie mult mai scumpă decît cea de creştere a ratei de eşantionare. În [ASTI09] este descrisă maniera în care poate fi achiziţionat un bloc de date multi-dimensionale cu ajutorul trusei de senzori specializaţi în ecologie (numiţi şi eKo-senzori).


4

Predicţia blocului de date multi-dimensional este aşadar abordată în accepţia că el este alcătuit prin eşantionarea spaţio-temporală a stărilor entităţii care furnizează datele şi care are o distribuţie spaţială. Dinamica stărilor poate fi descrisă prin ecuaţii diferenţiale de ordine relativ reduse (maxim 3), aşa cum s-a arătat, de exemplu, în [NDS07]. Multe dintre aceste ecuaţii prezintă, de regulă, neliniarităţi. Deoarece modelarea neliniarităţilor constituie un demers care poate conduce uşor la rezultate imprecise, s-a apelat la un mecanism adaptiv care să suplinească aceste neliniarităţi. Mai precis, chiar dacă modelul asociat furnizorului de date este liniar, se consideră că parametrii săi variază în timp. Această caracteristică este sinonimă cu alegerea celui mai apropiat model liniar dintr-o clasă, la fiecare moment de adaptare. Astfel, neliniarităţile, dacă există, conduc la o problemă de identificare adaptivă multi-model. Odată ce modelul intrare-ieşire a fost stabilit ca exprimare, urmează determinarea/reactualizarea acestuia şi rezolvarea sistemului de ecuaţii diferenţiale (de fapt, cu diferenţe, deoarece modelul este discret), în vederea predicţiei. O reţea de senzori (cum este şi cea din Figura 1.1) poate fi considerată sistem de măsură directă a stărilor unui proces stocastic. Cu alte cuvinte, ieşirea acestui sistem este direct conectată la stări. Această reprezentare are următoarea exprimare matematică:

[ 1] [ ] [ ] [ ][ ] [ ] [ ]

n n n

n n

n n n nn n n+ = + +⎧

⎨ = +⎩

x A x B u F wy C x D v

, n∀ ∈N , (2.1)

unde:

• nx nxn

×∈A R , nx nun

×∈B R , ny nxn

×∈C R , ny nvn

×∈D R şi nx nwn

×∈F R sunt matrici care includ toţi parametrii variabili (dar deja estimaţi) ai procesului stocastic;

• nx∈x R este vectorul necunoscut al stărilor procesului; • nu∈u R este vectorul semnalelor de intrare (măsurabile sau nu); • ny∈y R este vectorul semnalelor de ieşire măsurabile;

• nw∈w R este zgomotul perturbator intern (endogen), necunoscut, al procesului; • nv∈v R este zgomotul perturbator extern (exogen), necunoscut, care afectează

măsurătorile ieşirilor procesului. În cazul seriilor de timp, intrările din ecuaţiile (2.1) sunt cel puţin nemăsurabile (dacă nu necunoscute). Este aproape imposibil de măsurat semnalul (sau semnalele) care guvernează dinamica unui anumit parametru monitorizat. De aceea, intrările pot fi cel mult estimate, ca şi stările. În acest caz, zgomotul endogen poate juca rol de intrare parazită, care însoţeşte intrarea utilă. Ambele sunt însă necunoscute şi trebuie estimate. În schimb, zgomotul exogen este întotdeauna considerat o perturbaţie care corupe datele măsurate şi apare în mod inevitabil asociat cu operaţia de măsurare. Reprezentarea pe stare (2.1) nu este utilă decît în condiţiile în care se precizează anumite caracteristici ale celor două tipuri de zgomote. De aceea, se consideră verificate următoarele ipoteze, larg acceptate în aplicaţii:

H1 Toate zgomotele au media nulă şi sunt de tip Gaussian [SCS05]. H2 Cele două tipuri de zgomote sunt necorelate între ele. H3 Zgomotul endogen este neauto-corelat, dar componentele sale pot fi corelate

între ele la acelaşi moment de timp. H4 Componentele zgomotului exogen sunt albe şi necorelate între ele.

Ultimele două ipoteze se exprimă matematic astfel:

[ ] [ ] [ ]T nw nwn E n n ×= ∈wΨ w w R , respectiv [ ] [ ] [ ]T nv nvn E n n ×= ∈vΨ v v R , n∀ ∈N , (2.2)

unde E este operatorul de mediere statistică. Cele două matrici definite în (2.2) sunt diferite nu doar ca dimensiune, ci şi ca structură. Prima ( [ ]nwΨ ) este o matrice strict


5

pozitiv definită (nu neapărat diagonală), în timp ce a doua ( [ ]nvΨ ) este o matrice

diagonală, cu diagonala strict pozitivă. Evident, ipoteza H4 are accente restrictive. O variantă relaxată a acesteia ar fi chiar ipoteza H3, adaptată la zgomotul exogen. În acest caz, matricea [ ]nvΨ nu mai este neapărat diagonală, dar continuă să fie strict pozitiv definită. Diagonalitatea acestei matrici asigură doar o viteză mai bună de convergenţă a algoritmului de rezolvare a ecuaţiei (2.1). Renunţarea la diagonalitate, va conduce doar la o creştere a timpului necesar calculatorului pentru rezolvarea ecuaţiei (2.1). Nu este afectată în mod sesizabil precizia rezultatului final, astfel încît se poate considera, fără a face un compromis prea mare, că zgomotul exogen verifică, la rîndul lui, cel puţin ipoteza H3. De notat că ambele matrici (2.2) sunt necunoscute şi pot fi cel mult estimate. Revenind la modelul (2.1), este clar că vectorul ieşirilor y are un număr de componente ny egal cu numărul senzorilor. Elementele sale se mai numesc şi canale de măsură. Vectorul stărilor are rolul de a codifica toate corelaţiile existente între senzori. Nu este obligatoriu ca numărul stărilor procesului stocastic ( nx ) să fie egal cu numărul senzorilor. Sistemul de ecuaţii cu diferenţe (2.1) este doar de ordin I, în timp ce legile de variaţie ale parametrilor de proces monitorizaţi pot fi exprimate prin ecuaţii diferenţiale de ordine superioare. Aceasta măreşte numărul de stări ale procesului (este adevărat, unele dintre ele fiind doar virtuale), avînd în vedere binecunoscuta manieră de a obţine un sistem diferenţial de ordin I dintr-unul de ordin superior. În consecinţă, nx ny≥ . În schimb, există tot atîtea surse de zgomot exogen cîte canale de măsură au fost instalate (dimensiunea vectorului nD v este egală cu cea a vectorului y ). Fiecare senzor cu zgomotul său exogen.

Zgomotul endogen nF w se pliază însă pe cel al stărilor, avînd aceeaşi dimensiune ( nx ). În ceea ce priveşte intrările, în general, ele pot fi în număr arbitrar, necorelat cu nx şi ny . În particular, în cazul seriilor de timp distribuite, dimensiunea intrărilor este determinată de numărul de senzori şi de anumiţi indici structurali ai modelelor de identificare auto-regresive asociate reprezentării pe stare. Această proprietate va fi explicitată în paragrafele următoare. Pentru a ajunge la algoritmii de predicţie bazaţi pe moldelul (2.1), este necesar să fie rezolvate 2 probleme: proiectarea unui mecanism de adaptare parametrică şi rezolvarea numerică a ecuaţiilor cu diferenţe, eventual prin intermediul unui model echivalent de tip intrare-ieşire. Le vom aborda pe rînd, în continuare, începînd cu maniera de echivalare a modelului de stare cu un model de tip intrare-ieşire.

2.2. Modelul discret, de tip intrare-ieşire, al unei reţele de senzori

Dacă se pleacă de la modelul cu reprezentare pe stare:

[ 1] [ ] [ ] [ ][ ] [ ] [ ]k k k kk k k+ = + +⎧

⎨ = +⎩

x Ax Bu Fwy Cx Dv , k∀ ∈N , (2.3)

cu aceleaşi notaţii ca în definiţia (2.1) (dar cu parametri constanţi), atunci, pentru a obţine ecuaţia intrare-ieşire echivalentă, se poate apela la Transformata Z (TZ). Ea va conduce la un model de tip MIMO-ARMAX. Folosind Teorema întîrzierii (proprietate a TZ), ecuaţiile (2.3) devin:

( ) ( ) ( ) ( )( ) ( ) ( )

nxz z z zz z z− = ⋅ + ⋅⎧

⎨ = ⋅ + ⋅⎩

I A X B U F WY C X D V

, z∀ ∈C , (2.4)

unde ⊂CC este o coroană circulară centrată în origine, care joacă rol de zonă de convergenţă pentru funcţiile complexe rezultate. Introducînd prima egalitate în cea de-a doua (pentru a elimina TZ a vectorului de stare), se obţine TZ a ieşirii, fără intervenţia directă stărilor:


6

( ) ( )1 1( ) ( ) ( ) ( )nx nxz z z z z z− −= − ⋅ + − ⋅ + ⋅Y C I A B U C I A F W D V , z∀ ∈C , (2.5)

Ecuaţia (2.5) pune în evidenţă doi termeni: unul determinat de intrarea în sistem şi altul care filtrează zgomotele endogen şi exogen. Din primul termen, se obţine funcţia de transfer utilă a sistemului modelat:

( ) 1( )( )( )

def

nxzz zz

−= = −YH C I A BU

, z∀ ∈C , (2.6)

care, după inversarea matricii ( )nxz −I A (prin metode de descompunere spectrală

[DPJ98]), va conduce la o matrice de dimensiune ny nu× exprimată printr-un raport de polinoame (adică raţională). Mai mult, rapoartele de polinoame pot fi obţinute direct în forma de exprimare cu fracţii simple, polii fiind valorile proprii ale matricii A , iar numitorul fiind chiar polinomul caracteristic al acestei matrici, notat prin χA . Polinomul caracteristic

χA este de fapt numitorul comun al tuturor elementelor matricii H , astfel că:

1( ) ( )( )

z zz

=χ B,C

A

H Q , z∀ ∈C , (2.7)

unde ( )ny nu z×∈B,CQ R este o matrice de polinoame de grad cel mult egal cu ( 1)nx − , unic

determinată de matricile B şi C (dar şi cu intervenţia indirectă a lui A , prin matricile de trecere la forma diagonală). Trecînd la operatorii de deplasare temporală ( 1 1qz− −⇒ , tot conform Teoremei întîrzierii), matricea utilă de sistem este următoarea:

( ) ( ) ( ) ( )( )

1 11 1 1

1 1

q q1q q qq q q

defnx

nx

− −− − −

− −= =

χ χB,C

B,CA A

QH Q , (2.8)

unde simbolul ”~” indică operatorul de trecere la polinomul reciproc. (Prin definiţie, dacă A este un polinom de grad n , atunci polinomul reciproc are exprimarea: ( )A( ) An nx x x−= ,

gradul său fiind tot egal cu n .) Aşa cum era de aşteptat, polinoamele de la numărător nu au termen liber, indicînd faptul că intrările sistemului suferă o întîrziere de cel puţin un pas în traseul lor către ieşire. Din definiţia (2.8), rezultă că partea utilă a ieşirii sistemului are exprimarea:

( ) ( )( )

1 11

1

q qq

q

def − −−

−≡ =

χB,C

uA

Qy H u u , (2.9)

ceea ce permite aducerea la forma MIMO-ARX [SCS05], în care matricea părţii auto-regresive este diagonală, cu diagonala ocupată de acelaşi polinom reciproc χA :

( )

( )( )

( ) ( )

( ) ( )( )1 1

1 1 11,1 1,

1 1 1,1 ,

q q

q 0 B q B q

0 q B q B q

nu

nx nx nu

− −

− − −

− − −

⎡ ⎤ ⎡ ⎤χ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥≡⎢ ⎥ ⎢ ⎥

χ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

A

u

A

A B

y u . (2.10)

Expresia (2.10) arată că abordarea legată de sistemele multi-dimensionale din cadrul mediului de programare MATLAB (despre care vom vorbi puţin mai tîrziu) nu este întîmplătoare. Plecînd de la o reprezentare pe stare a unui sistem, se ajunge în mod natural la un sistem de ecuaţii cu diferenţe, în care ieşirile nu mai sunt amestecate. În MATLAB este chiar surprinsă o situaţie mai bună, din punctul de vedere al Principiului


7

parsimoniei [SCS05]: pe fiecare linie a matricii raţionale H se procedează la simplificarea zerorurilor şi polilor comuni, după care linia este adusă la acelaşi numitor. Numărul de parametri ai numărătorilor liniei poate astfel să scadă. În consecinţă, ecuaţia (2.10) devine:

( )

( )( )

( ) ( )

( ) ( )( )1 1

1 1 11 1,1 1,

1 1 1,1 ,

q q

A q 0 B q B q

0 A q B q B q

nu

nx nx nx nu

− −

− − −

− − −

⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥≡⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

u

A B

y u , (2.11)

cu polinoame eventual diferite pe diagonală. Un ultim artificiu conduce la forma canonică din exprimarea modelelor MIMO-ARX: se împarte fiecare linie a celor două matrici cu termenul liber al polinomului A j corespunzător şi se renotează coeficienţii.

Se pot identifica şi indicii structurali ai modelului MIMO-ARX: jna (gradul polinomului

A j , care este maxim egal cu nx ) şi , 1,j i i nunb

∈ (gradele polinoamelor , 1,

B j i i nu∈, care sunt

cel mult egale cu 1nx − ), pentru fiecare canal de măsură 1,j ny∈ . Ultimii doi termeni din egalitatea (2.5) se referă la componenta de medie alunecătoare din modelul MIMO-ARMAX. Pentru a obţine funcţia de transfer corespunzătoare, trebuie efectuate cîteva aranjări preliminare ale acestora. Astfel, se poate evalua matricea:

( ) ( ) 1( )def

nx nxz z z −= − −C I A C I A , z∀ ∈C , (2.12)

care permite următoarea exprimare:

( ) 1( ) ( ) ( ) ( )def

nxz z z z z−= − ⋅ + ⋅eY I A C F W D V , z∀ ∈C . (2.13)

În definiţia (2.13), se poate scoate factorul comun forţat ( ) 1nxz −−I A , la stînga ambilor

termeni:

( ) ( )1( ) ( ) ( ) ( )def

nx nxz z z z z z− ⎡ ⎤= − ⋅ + − ⋅⎣ ⎦eY I A C F W I A D V , z∀ ∈C . (2.14)

Să presupunem că există o precizare privind legătura dintre cele două zgomote (endogen şi exogen) şi zgomotele albe, de exemplu, de forma:

( )1( ) ( )z z z−= xW G E & ( )1( ) ( )z z z−= yV G E , z∀ ∈C , (2.15)

unde ( )nw ny z×∈xG R şi ( )nv ny z×∈yG R sunt funcţii de transfer polinomiale cauzale (adică

produse de filtre cu răspuns finit la impuls), iar ( )ny z∈E R este TZ a secvenţei de zgomote albe care afectează canalele de măsură. Atunci, din (2.14), se poate pune în evidenţă funcţia de transfer perturbatoare:

( ) ( ) ( ) ( )( ) ( ) ( )

1 1 1

1 1 1

( )( ) ( )( )

, .

def

nx nx

nx

zz z z z z zz

z z z z

− − −

− − −

⎡ ⎤= = − + − =⎣ ⎦

= − + ∀ ∈

ex y

x y

YG I A C FG I A DGE

C I A FG DG C (2.16)

Dacă informaţia de filtrare (2.15) nu este disponibilă, atunci se poate considera pur şi simplu că ambele perturbaţii sunt constituite din zgomote albe. În acest caz:

( ) ( )

( )

1

1

( )( ) ( )( )

, .

def

nx nx

nx

zz z z zz

z z

−

−

⎡ ⎤= = − + − =⎣ ⎦

= − + ∀ ∈

eYG I A C F I A DE

C I A F D C (2.17)


8

Indiferent de caz, se poate observa că funcţia de transfer este raţională şi numitorul comun al rapoartelor de polinoame este tot polinomul caracteristic χA . Cu alte cuvinte,

1( ) ( )( )

z zz

=χ C,D,F

A

G Q , z∀ ∈C , (2.18)

unde, de această dată, ( )ny ny z×∈C,D,FQ R este o matrice de polinoame Laurent în care

gradul maxim în z este cel mult egal cu nx (gradul maxim în 1z− fiind nul sau oricît de mare, dar finit). Matricea este unic determinată de matricile B şi C (dar şi cu intervenţia indirectă a lui A , prin matricile de trecere la forma diagonală). Trecînd la operatorii de deplasare temporală, matricea utilă de sistem este următoarea:

( ) ( ) ( ) ( )( )

11 1

1 1

q1q q qq q q

defnx

nx

−− −

− −= =

χ χC,D,F

C,D,FA A

QG Q , (2.19)

unde ( )1q−C,D,FQ este acum un polinom veritabil în 1q− , al cărui grad poate fi inferior, egal

sau superior lui nx . (Practic, în polinomul ( )zC,D,FQ , a fost scos ca factor comun forţat

monomul nxz ; cum gradul său în z este cel mult egal cu nx , polinomul rezultat nu mai are puteri ale lui z , ci puteri ale lui 1z− .) Din definiţia (2.19), rezultă că partea perturbatoare a ieşirii sistemului are exprimarea:

( ) ( )( )

11

1

qq

q

def −−

−≡ =

χC,D,F

eA

Qy G e e , (2.20)

ceea ce permite aducerea la forma MIMO-ARMA, în care matricea părţii auto-regresive este diagonală, cu diagonala ocupată de polinomul χA :

( )

( )( )

( ) ( )

( ) ( )( )1 1

1 1 11,1 1,

1 1 1,1 ,

q q

q 0 C q C q

0 q C q C q

ny

ny ny ny

− −

− − −

− − −

⎡ ⎤ ⎡ ⎤χ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥≡⎢ ⎥ ⎢ ⎥

χ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

A

e

A

A C

y e . (2.21)

Ca şi în cazul componentei utile, sistemul are ieşiri neamestecate. Pentru a aplica Principiul parsimoniei, trebuie apelat la polinoamele

1,A j j ny∈

din exprimarea (2.11) (şi nu

altele). Acestea se obţin din (2.21) numai dacă este posibilă simplificarea aceloraşi poli de pe liniile j ale matricilor ( )1q−A şi ( )1q−C ca şi în cazul matricilor ( )1q−A şi ( )1q−B . Altfel,

ecuaţia (2.21) forţează revenirea ecuaţiei (2.11) la ecuaţia (2.10), pentru a conserva unicul polinom χA , care trebuie să intervină atît în partea utilă, cît şi în partea perturbatoare a ieşirii. Dacă este posibilă aplicarea Principiului parsimoniei, ecuaţia ieşirilor perturbatoare devine:

( )

( )( )

( ) ( )

( ) ( )( )1 1

1 1 11 1,1 1,

1 1 1,1 ,

q q

A q 0 C q C q

0 A q C q C q

ny

nx ny ny ny

− −

− − −

− − −

⎡ ⎤ ⎡ ⎤⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥≡⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

e

A C

y e . (2.22)

Şi în acest caz, se poate aplica normalizarea prin împărţirea polinoamelor cu termenii lor liberi şi renotarea coeficienţilor (coeficienţii liberi intră practic în valorile zgomotelor).


9

Este clar însă că matricea ( )1q−C ar putea să nu mai fie diagonală, ca în cazul modelelor

MISO-ARMAX. Cu toate acestea, gradele polinoamelor ei, , , 1,j i j i nync

∈, pot, eventual,

depăşi numărul de stări ale sistemului iniţial.

2.3. Construcţia predictorului PARMAX

Paragraful precedent a arătat ca se poate renunţa la serviciile modelului cu reprezentarea pe stare (mai dificil de manevrat în scopul predicţiei), în favoarea unui model discret de tip intrare-ieşire din clasa ARMAX. Pentru a putea identifica un astfel de model, sunt necesari doi paşi. La primul, se determină un model grosier de tip ARMA, al cărui rol este de a oferi posibilitatea estimării zgomotului exogen v . Odată acest zgomot estimat, el va juca rol de intrare pentru sistemul investigat, avînd în vedere că datele măsurate la ieşire sunt serii de timp. Aşadar, în cadrul intrării u din ecuaţiile de stare (2.1), vor fi înglobate şi versiunile estimate ale zgomotelor exogene, grupate în vectorul v . (Aşa cum se cunoaşte, simbolul ”^” înseamnă „estimat”.) La pasul doi, se determină modelul ARMAX multi-dimensional (adică MIMO-ARMAX), pe baza datelor măsurate de la senzori şi a valorilor estimate ale zgomotului exogen (cu rol de intrări). Modelul ARMA multi-dimensional (MIMO-ARMA) grosier se poate construi relativ simplu, considerînd că senzorii nu sunt corelaţi unul cu altul. Cu alte cuvinte, modelul este total decuplat, matricile sale fiind diagonale. Aşa cum s-a precizat şi în [SPD08], modelul ARMA are următoarea exprimare matematică:

( ) ( )1 1A q C qj j j jy e− −≡ , 1,j ny∀ ∈ , (2.23)

unde A j şi C j sunt polinoame de forma:

( )( )

1 1,1 ,

1 1,1 ,

A q 1 q q

C q 1 q q

j

j

j

j

defna

j j j na

defnc

j j j nc

a a

c c

−− −

−− −

⎡ = + + +⎢⎢

= + + +⎢⎣

, (2.24)

cu jna şi jnc indici structurali optimali (minimali) care trebuie determinaţi odată cu

parametrii, prin aplicarea unei srategii de optimizare şi a Metodei Minimizării Erorii de Predicţie (MMEP) [SCS05]. Optimalitatea este apreciată în raport cu PQ – calitatea predicţiei – un criteriu definit în [SPD08], care, în urma numeroaselor simulări efectuate, a necesitat redefinirea, ca în Anexa A. Mai precis, pentru fiecare canal 1,j ny∈ , se variază indicii jna şi jnc într-o anumită

gamă de variaţie (de exemplu: min max,j j jna na na∈ şi min max,j j jnc nc nc∈ ), alegîndu-se ca valori

optime cele pentru care PQ este maxim. Pentru uşurinţă, cele două game de variaţie pot fi

aceleaşi, indiferent de canalul de măsură. Astfel, prin convenţie, min mindef

j jna na Na= = ,

min mindef

j jnc nc Nc= = , max maxdef

j jna na NA= = şi max maxdef

j jnc nc NC= = , 1,j ny∀ ∈ . În vederea evaluării

criteriului PQ, este necesar să se adopte aceeaşi strategie de rezervare a ultimelor date de pe fiecare canal (de exemplu, în număr de ⎣ ⎦/ 2K , dar nu mai puţine de 4) ca şi în cazul predictorului PARMA (unde 1K ≥ este dimensiunea orizontului de predicţie). (În [SPD08] a fost descrisă această strategie, astfel că ea nu va fi reluată aici.) Revenind, funcţia de sistem grosieră asociată este diagonală:

( ) ( ) ( )1 1 10 1,

q diag C q A qj j j ny

− − −

∈⎡ ⎤= ⎣ ⎦G . (2.25)


10

Cu alte cuvinte, modelul ARMA grosier multi-dimensional are următoare exprimare:

( )10 q−≡y G e , (2.26)

unde ny∈e R este vectorul zgomotelor albe Gaussiene de medie nulă care provoacă variaţia datelor măsurate de la senzori. De notat că MMEP oferă, în plus, estimaţii atît

pentru dispersiile necunoscute ale zgomotelor albe ( 2, 1,

ˆe j j ny∈

λ ), cît şi pentru valorile

efective ale zgomotelor albe ( e ), pînă la momentul curent. Acestea din urmă sunt, de fapt erorile de predicţie estimate, folosind modelul ARMA grosier. După estimarea parametrilor polinoamelor (2.24) (efectuată separat, pe fiecare canal de măsură, cu date staţionarizate (adică centrate în jurul mediei de canal)), se pot determina valorile aproximative ale zgomotelor exogene:

( ) ( )1 1ˆ ˆˆ ˆA q 1 C qj j j j jv y v− −⎡ ⎤≡ + −⎣ ⎦ , unde: ˆ ˆ[ ] [ ]j jv n e n= , 1, jn nc∀ ∈ , 1,j ny∀ ∈ . (2.27)

Acestea sunt, de fapt, estimaţii mai precise ale unor zgomote albe, care urmează să fie filtrate de către fiecare canal de măsură în parte. Zgomotele (2.27) sunt în continuare utilizate pe post de intrări în modelul mai rafinat, de tip MIMO-ARMAX, de mai jos:

( ) ( ) ( )1 1 1ˆq q q− − −≡ +A y B v C e , (2.28)

în care ( )1qny ny× −∈A R , ( )1qny ny× −∈B R şi ( )1qny ny× −∈C R sunt matrici polinomiale de grade

na , nb , respectiv nc , iar diagonala lui B este nulă (zgomotul canalului curent lipseşte):

( )( )( )

1 11

1 11

1 11

q q q

q q q

q q q

defna

ny na

defnb

nb

defnc

ny nc

− − −

− − −

− − −

⎡ = + + +⎢⎢

= + +⎢⎢

= + + +⎢⎣

A I A A

B B B

C I C C

. (2.29)

Coeficienţii matriciali ai polinoamelor (2.29) sunt necunoscuţi (mai puţin nyI , care este

matricea unitate de ordin ny ) şi trebuie determinaţi cu ajutorul datelor măsurate. La fel şi indicii structurali na , nb şi nc . Cele două funcţii de sistem asociate modelului (2.28) sunt următoarele:

( ) ( ) ( )1 1 1 1q q q− − − −=H A B (utilă) & ( ) ( ) ( )1 1 1 1q q q− − − −=G A C (reziduală). (2.30)

Spre deosebire de modelul grosier ARMA, cel rafinat, de tip ARMAX, codifică şi corelaţiile existente între senzorii din reţea. Acesta este motivul principal pentru care a fost necesară rafinarea modelului ARMA. Este drept, însă, că efectuarea inversării matricii polinomiale A nu beneficiază de o procedură comodă din punct de vedere numeric. De asemenea, identificarea tuturor parametrilor celor 3 matrici ridică numeroase probleme de implementare. De aceea, se apelează la o abordare simplificată legată de MMEP. În mediul de programare MATLAB, identificarea modelelor multi-dimensionale este supusă unui principiu simplificator, care ar putea fi adoptat şi în cazul modelului (2.28). Pentru aceasta, se poate utiliza funcţia armax (care, de fapt, implementează MMEP –

una dintre cele mai complexe metode de identificare a sistemelor). Să presupunem că procesul de identificat are nu canale de intrare şi ny canale de ieşire, fiind descris de

modelul MIMO-ARMAX general:


11

( ) ( ) ( )1 1 1q q q− − −≡ +A y B u C e (2.31)

(cu u în loc de v şi aceleaşi matrici polinomiale (2.29)). Atunci, în loc să fie determinaţi coeficienţii matriciali ai polinoamelor (2.29) dintr-o dată, se determină, pe rînd, polinoamele unidimensionale ale cîte unui model ARMAX de de tip MISO (mai multe intrări şi o ieşire):

( ) ( ) ( )1 1 1,

1

A q B q C qnu

j j j i i j ji

y u e− − −

=

≡ +∑ , 1,j ny∀ ∈ . (2.32)

Cu alte cuvinte, se identifică doar modelul parţial al influenţei pe care o au toate canalele de intrare asupra canalului de ieşire din poziţia j . După aceea, se pot preciza direct elementele funcţiilor de sistem (2.30), sub forma:

( )( )( )

( )( )( )1 1

,

1 1,

1 11

H q G q

B q C q

A q A q

j i j

nuj i j

j i ji j j

y u e

− −

− −

− −=

≡ +∑ , 1,j ny∀ ∈ . (2.33)

În detaliu, cele două funcţii de sistem multi-dimensionale au exprimarea următoare:

( )

( )( )

( )( )

( )( )

( )( )

( )( )

( )( )

( )( )

( )( )

( )( )

1 1 11,1 1,2 1,

1 1 11 1 1

1 1 1,1 ,2 ,1

1 1 1

1 1 1,1 ,2 ,

1 1 1

B q B q B q

A q A q A q

B q B q B qq

A q A q A q

B q B q B q

A q A q A q

nu

j j j nu

j j j

ny ny ny nu

ny ny ny

− − −

− − −

− − −−

− − −

− − −

− − −

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

H & ( )

( )( )

( )( )

( )( )

11

11

11

1

1

1

C q

A q

C qq diag

A q

C q

A q

j

j

ny

ny

−

−

−−

−

−

−

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

G . (2.34)

În acest mod, este evitată inversarea matricii polinomiale A . Preţul plătit îl constituie scăderea preciziei modelului multi-dimensional, prin faptul că nu sunt surprinse toate tipurile de corelaţii dintre intrări, ieşiri şi zgomote, ci doar a corelaţiilor dintre setul de intrări şi fiecare ieşire în parte. În cazul seriilor de timp distribuite, se poate presupune însă că zgomotul de măsură al unei anumite ieşiri nu influenţează altă ieşire, iar interferenţele dintre senzori (care ar cauza corelaţii şi între ieşirile măsurate) sunt neglijabile în contextul tehnologiilor actuale de fabricaţie. De notat că, alegînd ca vector de intrare chiar vectorul zgomotelor colorate v (deci nu ny= ), este permisă identificarea influenţei pe care o au perturbaţiile tuturor canalelor de măsură asupra unui anumit canal. Aşadar, pentru a determina modelul ARMAX asociat procesului ecologic, plecînd de la colecţia de modele ARMA independente, se va adopta principiul de mai sus, care oferă elementele celor două funcţii de sistem (2.30) după ecuaţiile (2.33)-(2.34). De altfel, aşa cum s-a menţionat în paragraful precedent, colecţia de modele MISO-ARMAX (care formează modelul global MIMO-ARMAX) corespunde şi transformării echivalente de la reprezentarea pe stare la reprezentarea de tip intrare-ieşire. Evident, pentru o mai mare eficienţă, MMEP poate fi implementată în variantă adaptivă. Cu alte cuvinte, la fiecare pas de predicţie, parametrii curenţi ai modelelor ARMA grosier şi ARMAX rafinat se pot reactualiza în funcţie de noile date măsurate, în loc să fie determinaţi complet folosind întregul set de date achiziţionate pînă atunci. Această operaţie deşi relativ complicată, din cauza formei destul de laborioase a modelului de identificare, conduce la o mai mare precizie a predictorului.


12

Să presupunem, în continuare, că indicii structurali ai modelului MIMO-ARMAX (3.34) au fost fixaţi şi că parametrii săi au fost estimaţi. Pentru a efectua predicţia datelor, este clar că fiecare canal de măsură poate fi tratat separat. Modelul generic de predicţie este, în acest caz, de tip MISO-ARMAX. Fie 1,j ny∈ indicele curent al canalelor de măsură. Din (2.32), rezultă că ecuaţia modelului de predicţie asociat canalului j este următoarea:

( ) ( ) ( )1 1 1,

1

ˆ ˆˆ Â q B q C qnu

j j j i i j ji

y v e− − −

=

≡ +∑ (cu ( )1,B q 0j j

− ≡ ). (2.35)

În consecinţă, predictorul optimal ideal are exprimarea de mai jos:

( ) ( ) ( )1 1 1,

1

ˆ ˆˆ ˆ1 A q B q C qnu

j j j j i i j ji

y y v e− − −

=

⎡ ⎤≡ − + +⎣ ⎦ ∑ . (2.36)

Ceea ce împiedică utilizarea directă a ecuaţiei (2.36) pentru a produce valorile predictate este componenta de medie alunecătoare (mai precis, zgomotul alb necunoscut je ). De

aceea, predictorul va trebui să opereze cu estimaţii ale acesteia. Pentru a le evalua, se apelează la un model MISO-ARX aproximant, descris de ecuaţia:

( ) ( )1 1,

1

Â q B qnu

n nj j j i i j

i

y v eα − β −

=

≡ +∑ (cu ( )1,B q 0n

j jβ − ≡ ), (2.37)

unde gradele polinoamelor Anjα şi ,Bn

j iβ sunt:

( ) min 3 ,j j yn na nc Nα = + , respectiv ,1,

min 3 ,ny

j j j i yi i j

n na nc nb N= ≠

⎧ ⎫⎛ ⎞⎪ ⎪β = + +⎨ ⎬⎜ ⎟⎪ ⎪⎝ ⎠⎩ ⎭

∑ , (2.38)

sensibil mai mari decît oricare dintre indicii structurali ai modelului MISO-ARMAX. (Pentru simplitate, a fost omis indicele j din notaţia lor.) Plecînd de la datele măsurate ale canalului j , după staţionarizarea acestora, se poate identifica modelul MISO-ARX (2.37). (Mediile datelor de pe fiecare canal de măsură vor fi reţinute, deoarece ele trebuie adăugate valorilor predictate.) Ecuaţia modelului MISO-ARX poate fi acum exprimată sub forma de tip eroare de ieşire:

( ) ( )1 1,

1

ˆ Â q B qnu

n nj j j j i i

i

e y vα − β −

=

≡ −∑ . (2.39)

Aceasta oferă chiar valorile estimate ale zgomotului alb de pe canalul j . Abia acum se poate efectua predicţia (în doi paşi), prin tandemul ecuaţiilor (2.36) şi (2.39). Pentru sincronizarea calculelor, este foarte important să se aplice următoarea strategie: la fiecare pas de predicţie ( k ) se predictează toate canalele (adică variind j între 1 şi ny ). Astfel, predicţia avansează simultan pe toate canalele. Această strategie

asigură posibilitatea de a predicta intrările 1,j j ny

v∈

în paralel cu ieşirile, fără a utiliza

modelele ARMA grosiere. Ecuaţiile predictorului multi-dimensional, numit ad hoc PARMAX, sunt descrise în continuare.

a. Pe orizontul de măsură ( 1, yk N∈ ):

,

,1 ,2 ,

, ,1 , , ,1,

,1 ,

ˆ ˆ ˆ ˆ| [ 1] [ 2]

ˆ ˆˆ ˆ[ 1]

ˆ ˆ ˆ ˆ[ 1] ;

j

j i

j

j y j j j j j na j j

ny

j i i j i nb i j ii i j

j j j nc j j

y k N a y k a y k a y k na

b v k b v k nb

c e k c e k nc= ≠

⎡ ⎡ ⎤ ⎡ ⎤= − − − − − − − +⎣ ⎦ ⎣ ⎦⎢⎢ ⎡ ⎤⎡ ⎤+ − + + − +⎢ ⎣ ⎦⎣ ⎦⎢⎢ ⎡ ⎤+ − + + −⎣ ⎦⎣

∑


13

,1 ,

, ,1 , ,1,

ˆ ˆˆ [ ] [ ] [ 1] [ ]

ˆ ˆˆ ˆ[ 1] [ ] , 1, .

j j j j j n j

ny

j i i j i n ii i j

e k y k y k y k n

v k v k n j ny

α

β= ≠

= + α − + +α − α −⎡⎢⎢ ⎡ ⎤− β − + +β − β ∀ ∈⎣ ⎦⎢⎣

∑ (2.40)

b. Pe orizontul de predicţie ( 1,y yk N N K∈ + + ):

b1. pentru 1, min ,y y jk N N K na∈ + + :

,

,1 , 1

, ,

, ,1 , , ,1,

,1 ,

ˆ ˆ ˆ ˆ ˆ| 1 | 1 |

ˆ ˆ

ˆ ˆˆ ˆ[ 1]

ˆ ˆ ˆ ˆ[ 1] ;

y

y j

j i

j

j y j j y j k N j y y

j k N j y j na j j

ny


j j j nc j j

y k N a y k N a y N N

a y N a y k na

b v k b v k nb

c e k c e k nc

− −

−

= ≠

⎡ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤= − − − − + −⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎢⎢ ⎡ ⎤ ⎡ ⎤− − − − +⎣ ⎦ ⎣ ⎦⎢⎢ ⎡ ⎤⎡ ⎤+ − + + − +⎣ ⎦⎣ ⎦

⎡ ⎤+ − + + −⎣ ⎦⎣

∑⎢⎢⎢

(2.41)

b2. pentru 1,y j yk N na N K∈ + + + (numai dacă na K< ):

,

,1 ,

, ,1 , , ,1,

,1 ,

ˆ ˆ ˆ ˆ ˆ| 1 | |

ˆ ˆˆ ˆ[ 1]

ˆ ˆ ˆ ˆ[ 1] ;

j

j i

j

j y j j y j na j j y

ny


j j j nc j j

y k N a y k N a y k na N

b v k b v k nb

c e k c e k nc= ≠

⎡ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤= − − − − − +⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎢⎢ ⎡ ⎤⎡ ⎤+ − + + − +⎢ ⎣ ⎦⎣ ⎦⎢⎢ ⎡ ⎤+ − + + −⎣ ⎦⎣

∑ (2.42)

b3. predicţia zgomotelor (presupunînd în mod natural că n Kα > ):

,1 , 1

, ,

, ,1 , ,1,

ˆ ˆˆ ˆ ˆ ˆ ˆ[ ] [ ] | 1 | 1 |

ˆ ˆ [ ]

ˆ ˆˆ ˆ[ 1] [ ] , 1, .

y

y

j j j y j j y j k N j y y

j k N j y j n j

ny

j i i j i n ii i j

e k v k y k N y k N y N N

y N y k n

v k v k n j ny

− −

− α

β= ≠

⎡ ⎡ ⎤ ⎡ ⎤ ⎡ ⎤= = +α − + +α + +⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎢⎢ ⎡ ⎤+ α + +α − α −⎣ ⎦⎢⎢ ⎡ ⎤− β − + +β − β ∀ ∈⎢ ⎣ ⎦⎣

∑

(2.43)

În afara valorilor predictate, se pot evalua şi dispersiile erorilor de predicţie, ca în cazul modelelor ARMA. Prima operaţie constă în estimarea dispersiei erorii de predicţie pe orizontul de măsură:

( )22

1

1ˆ ˆ[ ] |yN

j j j yky

y k y k NN =

⎡ ⎤λ = − ⎣ ⎦∑ , 1,j ny∀ ∈ . (2.44)

Apoi, se evaluează coeficienţii polinomului trunchiat obţinut prin împărţirea infinită dintre polinoamele C j şi A j :

( )( )

11 2 1

,1 ,2 , 1 1

1

Cˆ ˆ ˆ1 q q q

A

def jKj j j K

j K

z

z

−− − −

− −

−

⎢ ⎥+ γ + γ + + γ = ⎢ ⎥

⎢ ⎥⎣ ⎦, 1,j ny∀ ∈ . (2.45)

În fine, dispersiile erorilor de predicţie se evaluează după cum urmează:

( )2 2 2 2 2 2 2, ,1 , 1 , 1 , 1

ˆ ˆˆ ˆ ˆˆ ˆ1def

j k j j j k j k j j k− − −σ = λ + γ + + γ = σ +λ γ , 1,k K∀ ∈ , 1,j ny∀ ∈ . (2.46)

Acum, există toate condiţiile pentru a evalua criteriul PQ (A.8), după ce se măsoară datele pe orizontul de predicţie. El trebuie însă adaptat contextului modelelor multi-dimensionale prin extinderea la un criteriu multi-dimensional. Mai precis, criteriul PQ asociat canalului 1,j ny∈ va ocupa aceeaşi poziţie într-un vector:


14

1PQ PQdef T

ny⎡ ⎤= ⎣ ⎦PQ , (2.47)

unde fiecare PQ j este definit ca în (A.8). Evident, modelul optimal este cel care

maximizează norma vectorului (2.47).

2.4. Selectarea predictorului PARMA(X) optimal prin strategia PSO

Identificarea modelului MIMO-ARMAX presupune cunoaşterea indicilor structurali

1,j j ny

na∈

, , , 1, ,j i j i ny i jnb

∈ ≠ şi

1,j j nync

∈. Este evident că, pentru selecţia lor, trebuie utilizat

acelaşi criteriu PQ. Sunt posibile mai multe strategii: 1. Fixarea indicilor

1,j j nyna

∈ şi

1,j j nync

∈ la valorile optimale din cazul modelelor ARMA

grosiere şi varierea doar a indicilor , , 1, ,j i j i ny i jnb

∈ ≠ într-o gamă de valori.

2. Varierea tuturor indicilor în anumite game de valori. Varierea indicilor , , 1, ,j i j i ny i j

nb∈ ≠

(care consumă cea mai mare parte a timpului de căutare)

se poate realiza, la rîndul ei, în diferite moduri. Ca mai mare durată de căutare este cauzată de varierea independentă a indicilor. În acest caz, pentru fiecare jna şi jnc

( 1,j ny∈ ) numărul de modele care trebuie testat este egal cu 2( 1)( 1) nyNB Nb −− + , dacă

indicii , , 1, ,j i j i ny i jnb

∈ ≠ variază în gama ,Nb NB . Acest număr se reduce la 1( 1)nyNB Nb −− + ,

dacă indicii , 1, ,j i i ny i jnb

∈ ≠ de pe linia 1,j ny∈ a matricii ( )1q−H (definiţia (2.34)) sunt egali. În

fine, numărul de modele care trebuie testate se reduce şi mai mult, la valoarea ( 1)NB Nb− + , dacă toţi indicii , , 1, ,j i j i ny i j

nb∈ ≠

sunt egali. Însă, pe măsură ce scade efortul de

căutare, se reduce şi precizia predictorului. Este evident că prima strategie conduce la un efort de calcul mai mic faţă de cea de-a doua, deoarece spaţiul de căutare este redus de ( 1) ( 1)ny nyNA Na NC Nc− + − + ori. Preţul plătit îl constituie degradarea performanţelor predictorului multi-dimensional. De exemplu, pentru o reţea de 6 senzori, dacă se aleg limitele de variaţie 1Na Nc Nb= = = şi

100NA NC NB= = = , atunci numărul de modele care trebuie testate prin varierea independentă a tuturor indicilor este de ordinul 7410 . Variind numai indicii , , 1, ,j i j i ny i j

nb∈ ≠

(tot

independent unul faţă de altul), numărul de modele de test este de ordinul 5010 (încă foarte mare). O reducere semnificativă a efortului de căutare s-ar obţine observînd că, de fapt, indicii structurali ai unui canal pot fi aleşi independent de cei ai altui canal. Cu alte cuvinte, căutarea indicilor structurali optimi se poate efectua în paralel, pe toate canalele odate. În acest caz, varierea independentă a acestora pe oricare dintre canale ar conduce la un spaţiu de căutare cu 1( 1)( 1) ( 1)nyNA Na NB Nb NC Nc−− + − + − + modele. În cazul exemplului

anterior, acest număr este de ordinul 1410 . Din păcate, însă, calculatorul mobil nu dispune decît de două procesoare în paralel, astfel că determinarea indicilor structurali ai modelului printr-o căutare exhaustivă, într-un timp rezonabil (de ordinul orelor, cel mult) este un deziderat imposibil de realizat. O tehnică de căutare care ar putea reduce efortul de calcul este de tip evoluţionar. De exemplu, s-ar putea utiliza fie un Algoritm Genetic [MiM05], fie, mai simplu, o tehnică bazată pe algoritmul de optimizare prin algomerare de particule (Particle Swarm Optimisation – PSO) [KeEb95]. Chiar dacă soluţia oferită este sub-optimală, în acest caz, utilizatorul poate cel puţin controla compromisul dintre durata de căutare şi calitatea soluţiei optimale.


15

Vom dezvolta în continuare o metodă de selecţie a indicilor structurali bazată pe strategia PSO. Spaţiul de căutare, notat cu S , este un hiper-paralelipiped din laticea multi-dimensională niN , unde ni este numărul de indici structurali ai modelului de identificare-predicţie. În acest spaţiu, se defineşte un vector de poziţie asociat unei particule: ∈x S . Subliniem că vectorul trebuie să aibă numai componente cu valori întregi, nu fracţionare. De aceea, eventualele valori fracţionare rezultate din calcul trebuie aproximate la cel mai apropiat întreg. Pe spaţiul de căutare, se defineşte o funcţie de potrivire (sau concordanţă) (fitness), care trebuie optimizată. În varianta originală a algoritmului PSO (propusă în [KeEb95]), funcţia de potrivire este nenegativă şi trebuie minimizată. În contextul predictorilor din cadrul acestui proiect, funcţia de potrivire este chiar criteriul PQ (re)definit în (A.8), care va trebui maximizat în raport cu vectorul indicilor structurali x . Din acest motiv, algoritmul PSO original va fi modificat şi adaptat criteriului PQ. Există şi alte modificări originale importante ale variantei de bază din [KeEb95], care vor fi punctate la momentul potrivit. Principiul care stă la baza tehnicii de căutare de tip PSO este următorul: punctul de optim al funcţiei de potrivire este aproximat cu ajutorul unei populaţii de particule, care evoluează incremental, pe parcursul mai multor generaţii. Vom explica pe rînd termenii utilizaţi în această aserţiune. Se pleacă de la o populaţie de particule cu poziţii prestabilite:

00 1,

def

p p P∈= ⊂xP S , (2.48)

unde P ∗∈N este numărul de membri ai populaţiei, iar indicele 0 (zero) arată că evoluţia acesteia se găseşte în stadiul iniţial (adică la generaţia 0 ). De regulă, generaţia iniţială a populaţiei caută să acopere în mod uniform spaţiul de căutare. Dacă există indicii preliminare legate de o anumită zonă din spaţiul de căutare în care se presupune că s-ar găsi punctul de optim, atunci generaţia iniţială ar putea popula mai dens acea zonă. Chiar dacă indiciile sunt false, după cîteva generaţii, populaţia poate migra către zona unde se găseşte punctul de optim, dar căutarea va fi mai îndelungată. Uzual, 20,200P∈ , în funcţie de dimensiunea spaţiului de căutare. Populaţia iniţială trebuie să evolueze în manieră incrementală. Aceasta înseamnă că, de la generaţia avînd indicele de evoluţie m∈N , se va produce o generaţie ulterioară, de indice 1m + (incrementat cu o unitate). Astfel, generaţiei 0P îi succede generaţia 1P , care,

la rîndul ei este părintele generaţiei 2P , etc. Succesiunea generaţiilor se realizează după un program prestabilit, aşa cum se va vedea în continuare. Obiectivul acestei evoluţii este acela de a forţa particulele să se grupeze din ce în ce mai mult în jurul unui punct de optim al funcţiei de potrivire, aşa cum sugerează Figura 2.1.

Figura 2.1. Evoluţia unei populaţii către punctul de optim în cadrul Algoritmului PSO.

Pentru a atinge obiectivul dorit, este necesar să se asigure un bun compromis între două proprietăţi opuse ale populaţiei: diversitate (care permite evitarea stagnării în puncte locale de optim ale funcţiei de potrivire) şi viteză de convergenţă (care depinde de viteza de grupare a populaţiei în jurul unui optim). Raportul dintre aceste proprietăţi va fi relevat în finalul descrierii Algoritmului PSO.


16

Cum se realizează evoluţia populaţiei de particule de la o generaţie la alta? Operaţia principală o constituie reactualizarea poziţiilor particulelor din generaţia curentă (să spunem mP ) prin intervenţia unui termen corector aditiv:

1 1m m mp p p+ += + ∆x x x , 1,p P∀ ∈ . (2.49)

Corecţiile se evaluează pe baza vitezelor de deplasare ale particulelor (considerînd deplasarea uniformă de la o generaţie la alta). Mai precis:

1 1 10.5def

m m nyp p T+ + +⎢ ⎥∆ = ⋅∆ + ∈⎣ ⎦x v Z , 1,p P∀ ∈ , (2.50)

unde 1 1m nyp+ +∈v R este viteza reactualizată a particulei (care nu are neapărat valori întregi),

iar 0T∆ > este durata de timp necesară populaţiei din generaţia curentă pentru a produce generaţia următoare. De regulă, pentru simplitate, T∆ este ales de valoare unitară (adică joacă rol de unitate de măsură a timpului). În definiţia (2.50), se remarcă utilizarea operaţiei de rotunjire la cel mai apropiat întreg (care nu este precizată în algoritmul PSO general). Aşa cum s-a menţionat, însă, spaţiul de căutare este o submulţime a unei latici de întregi, astfel că operaţia de rotunjire este obligatorie în contextul predictorului MIMO-ARMAX. Mai mult, valorile poziţiilor (2.49) trebuie şi limitate la frontierele mulţimii S , pentru a nu depăşi spaţiul de căutare. Vitezele de deplasare ale particulelor se reactualizează, la rîndul lor, prin trei tipuri de corecţii: una multiplicativă numită factor de mobilitate (care ţine cont de inerţia particulei), una aditivă numită cognitivă (determinată de istoria evoluţiei particulei) şi alta, tot aditivă, dar numită socială (în care intervine evoluţia întregii populaţii din care face particula). Matematic, relaţia de reactualizare a vitezelor este următoarea:

,0 ,01, 1 1

,

m m m mp p pm m m m m

p p p p c sm mp c s

++ +

− −= µ ⋅ + λ ⋅ + λ ⋅

τ τx x x x

v v P , 1,p P∀ ∈ , (2.51)

unde: [0,1]m

pµ ∈ este factorul de mobilitate a particulei;

,0mp ∈x S este cea mai bună poziţie atinsă de particulă în cursul evoluţiei, pînă la

momentul curent; ,0

m ∈xP S este cea mai bună poziţie atinsă de întreaga populaţie în cursul evoluţiei,

pînă la momentul curent; , [0,2]m

p cλ ∈ este varianţa normalizată în intervalul [0,2] a tuturor poziţiilor atinse de

particulă în cursul evoluţiei sale, în raport cu cea mai bună poziţie a sa pînă la momentul curent, ,0

mpx ; ea se mai numeşte şi varianţă cognitivă;

[0,2]msλ ∈ este varianţa normalizată în intervalul [0,2] a tuturor poziţiilor atinse de

populaţia de particule în cursul evoluţiei sale, în raport cu cea mai bună poziţie atinsă pînă în momentul curent, ,0

mxP ; ea se mai numeşte şi varianţă socială;

1,

mp c T+τ ≥ ∆ este durata de care ar avea nevoie particula să migreze din poziţia curentă

în cea mai bună poziţie atinsă de ea pînă atunci, ,0mpx ;

1ms T+τ ≥ ∆ este durata de care ar avea nevoie întreaga populaţie ca să migreze în cea

mai bună poziţie atinsă pînă atunci, ,0mxP , dacă ea ar fi concentrată în poziţia curentă a

particulei curente. Vor fi explicitaţi pe rînd parametrii enumeraţi mai sus.


17

Factorul de mobilitate al unei particule depinde, de fapt, în mod opus de inerţia acesteia. Inerţia de valori mari trebuie să inducă valori mici ale factorului de mobilitate şi reciproc. Inerţia particulei trebuie sa fie mare cînd ea se găseşte în apropierea punctului de optim şi mică atunci cînd distanţa pînă la acesta este mare. De asemenea, factorul de mobilitate trebuie să aibă modul cel mult unitar, deoarece, în realitate, relaţia de reactualizare (2.51) este o ecuaţie cu diferenţe de ordin I. Soluţia acesteia este stabilă numai dacă factorul de mobilitate se găseşte în intervalul [0,1] (valoarea unitară a

acestuia producînd soluţii la limita de stabilitate). Pentru a specifica relaţia de reactualizare a factorului de mobilitate, trebuie mai întîi evaluată inerţia particulei curente 1,p P∈ :

,1

,0 ,1

PQ PQ

PQ PQ

m mdef p pmp m m

p p

⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦η =⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦

x x

x x, (2.52)

unde ,1mp ∈x S este poziţia cea mai slabă a particulei în cursul evoluţiei pînă în momentul

curent (adică acea poziţie de pe traiectoria particulei care produce valoarea cea mai mică a criteriului PQ). Este evident că inerţia astfel definită nu poate lua decît valori în intervalul [0,1] . Ea este nulă atunci cînd poziţia curentă a particulei produce cea mai mică valoare a criteriului PQ şi unitară cînd ea produce cea mai mare valoare a acestuia. Cu alte cuvinte, inerţia particulei se măreşte odată cu apropierea de optimul criteriului PQ. Menţionăm că definiţia (3.16) oferă posibilitatea ajustării adaptive a mobilităţii particulei, spre deosebire de articolul original în care a fost introdusă tehnica PSO, unde mobilitatea ia valori constante. De altfel, în abordarea noastră, s-a urmărit asigurarea caracterului adaptiv al tuturor parametrilor relaţiei de reactualizare (2.51), care se pretează la această manieră de variaţie. Odată inerţia evaluată, factorul de mobilitate se reactualizează după următoarea regulă simplă:

,0

,0 ,1

PQ PQ1

PQ PQ

m mp pm m

p p m mp p

⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦µ = − η =⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦

x x

x x. (2.53)

Varianţa cognitivă a unei particule se poate evalua în doi paşi. La primul, se estimează varianţa absolută a poziţiilor particulei, în raport cu poziţia cea mai bună atinsă pînă la momentul curent:

2

, ,00

11

mdefm i mp c p p

im =

σ = −+ ∑ x x . (2.54)

(În definiţia (2.54), a fost utilizată norma Euclidiană.) Al doilea pas constă în normalizarea varianţei absolute în intervalul [0,2]:

, , ,min,

, ,max , ,min

2m mdefp c p cm

p c m mp c p c

σ − σλ =

σ − σ, (2.55)

unde , ,minmp cσ şi , ,max

mp cσ sunt valorile minimă, respectiv maximă ale varianţei cognitive

absolute de la momentul iniţial de evoluţie, pînă la cel curent, considerînd inclusiv ,mp cσ .

Dacă se adoptă definiţia (2.55), aceasta prezintă un mare dezavantaj practic: ea necesită importante resurse de memorie pentru a putea fi implementată pe un mijloc automat de calcul. Mai precis, această implementare solicită memorarea tuturor generaţiilor de la iniţializare pînă la momentul curent. Din acest motiv, se propune definiţia alternativă de mai jos, care permite implementarea cu ajutorul unei relaţii recursive:


18

( )

2 2 2 2

, ,0 ,00 0

2 2

,00

1 11 1

1 ,1

m mdefm m m i m ip c p p p p p

i i

mm ip p

i

m m

m

= =

=

⎛ ⎞σ = ε − = − =⎜ ⎟+ +⎝ ⎠

= −+

∑ ∑

∑

x x x x

x x

(2.56)

unde mpε este semnul diferenţei din paranteza care îi urmează. De această dată, varianţa

cognitivă este exprimată ca o medie a distanţelor dintre norma poziţiei celei mai bune obţinute de particulă în cursul evoluţiei sale pînă în prezent ( ,0

mpx ) şi normele tuturor

poziţiilor de pe traseu (tot pînă în prezent). Evidenţierea semnului este utilă în calculele care urmează, unde este vizată o relaţie recursivă de determinare a varianţei. Mai întîi, se poate observa că:

( )1 22 21 1 1

,0 ,0

mi m m mp p p p c

i

m−

− − −

=

⎡ ⎤= − ε σ⎢ ⎥⎣ ⎦∑ x x . (2.57)

În consecinţă, din (2.56) şi (2.57) rezultă:

( )

( )( )( )

12 2 2 2 2 2

, ,0 ,00 0

22 2 21 1 1,0 ,0 ,

2 2 2 21 1 1, ,0 ,0

1 11 1

11

1 ,1 1 1

m mm m m i m m i mp c p p p p p p p

i i

m m m m m mp p p p p c p

m m m m m mp p p c p p p

m m

mm

m mm m m

−

= =

− − −

− − −

⎡ ⎤⎛ ⎞ ⎛ ⎞σ = ε − = ε − + =⎢ ⎥⎜ ⎟ ⎜ ⎟+ +⎝ ⎠ ⎝ ⎠⎣ ⎦⎡ ⎤⎡ ⎤= ε − − ε σ + =⎢ ⎥⎢ ⎥⎣ ⎦+⎣ ⎦⎡ ⎤= ε ε σ + − −⎢ ⎥+ + +⎣ ⎦

∑ ∑x x x x x

x x x

x x x

(2.58)

unde mpε nu poate fi altceva decît semnul expresiei din paranteza dreaptă care îi urmează.

Evident, expresia (2.58) este acum implementabilă cu o ocupare rezonabilă a memoriei (se reţin doar caracteristicile generaţiei precedente). În manieră similară, se determină varianţa socială a populaţiei. Mai întîi se calculează valoarea absolută a acestei varianţe, ţinînd cont de poziţiile curente ale tuturor particulelor populaţiei, faţă de poziţia cea mai bună atinsă de o particulă a populaţiei, pînă la momentul curent:

2

,01

1 Pdefm m ms p

pP =

σ = −∑ x xP . (2.59)

Urmează normalizarea acesteia în intervalul [0,2]:

,min

,max ,min

2m mdefs sm

s m ms s

σ − σλ =

σ − σ, (2.60)

unde ,minmsσ şi ,max

msσ sunt valorile minimă, respectiv maximă ale varianţei sociale absolute

de la momentul iniţial de evoluţie, pînă la cel curent, considerînd inclusiv msσ .

Duratele de migrare ale particulei, respectiv populaţiei nu pot fi cunoscute, de aceea ele vor fi alese de o manieră pseudo-aleatoare. Tot ce se poate cunoaşte este faptul că ele nu pot fi inferioare duratei de schimb a unei generaţii cu alta ( T∆ ), deoarece migrarea în poziţiile cele mai bune (ale particulei sau populaţiei) nu se poate produce decît cel mai devreme după schimbarea unei generaţii cu alta. Dacă la momentul curent se ating chiar poziţiile cele mai bune, atunci termenii corectori corespunzători sunt nuli şi duratele de migrare îşi pierd însemnătatea. Aşadar, 1

,mp c+τ şi 1m

s+τ trebuie generate pseudo-aleator în


19

intervalul [ , )T∆ +∞ . Cum gama de variaţie este infinită, se vor genera pseudo-aleator

inversele acestor durate (numite frecvenţe de tranziţie) în intervalul ( ]0,1/ T∆ .

Algoritmul PSO bazat pe relaţiile (2.49)-(2.51) diferă destul de mult de cel original propus în [KeEb95] sau de alte variante propuse de-a lungul timpului, în cei aproape 15 ani de la apariţie. În algoritmul original sunt utilizate alte notaţii pentru parametrii ecuaţiei (2.51). Mai mult, aceştia nu au semnificaţiile pe care le-am atribuit noi mai sus. Astfel, 1m

p+µ

(notat prin w ) este considerat un factor de inerţie (dar variaţia lui contrazice definiţia comună a inerţiei, care se opune schimbării parametrilor mişcării), ,

mp cλ şi m

sλ (notate prin

1c , respectiv 2c ) sunt două constante alese în intervalul [0,2] pentru a stabili ponderea

fiecărei componente aditive (cognitivă şi socială), iar în loc de 1,

mp c+τ şi 1m

s+τ se operează cu

inversele 1r , respectiv 2r , care sunt numere pseudo-aleatoare în intervalul [0,1] . După cum sugerează relaţiile algoritmului, este clar că, pe lîngă populaţia de particule care evoluează, trebuie reţinute şi o serie de rezultate auxiliare: valori maxime/minime ale criteriului PQ şi poziţii care produc aceste valori. Este aşadar util să se menţină în memorie şi să se reactualizeze nu doar populaţia curentă, ci şi alte două populaţii:

• o elită ,0 1,

defm

m p p P∈= ⊂xE S , formată din poziţiile particulelor care au produs cele mai

bune valori ale criteriului PQ; evident, cea mai bună poziţie atinsă de populaţia de particule se va regăsi în mE ; cu alte cuvinte, ,0

mm∈xP E ; în subsidiar, vor fi memorate

şi reactualizate inclusiv aceste valori (sub-)optimale;

• o anti-elită ,1 1,

defm

m p p P∈= ⊂xA S , formată din poziţiile particulelor care au produs cele

mai slabe valori ale criteriului PQ; în subsidiar, vor fi memorate şi reactualizate inclusiv aceste valori anti-optimale.

Elita joacă un rol important în oprirea mecanismului de căutare al algoritmului. Există mai multe teste de stop care pot fi imaginate. Tradiţional, se impune atingerea unui număr maxim de generaţii M ∗∈N , fără a ţine cont de alte considerente. (În mod uzual

10,100M ∈ .) Există însă şi teste de stop mai puţin rudimentare. De exemplu, se poate evalua dispersia elitei în jurul poziţiei optimale ,0

mm∈xP E , aşa cum sugerează Figura 3.1.

Dacă ea devine suficient de mică sau dacă descreşterea ei relativă devine nesemnificativă (scade sub un prag impus), atunci poziţia optimală a elitei este cea căutată. Un alt exemplu face referire la conceptul de supravieţuire a unei particule în cadrul elitei. Dacă particula care produce poziţia optimală din cadrul elitei reuşeşte să supravieţuiască unui anumit număr de generaţii (adică nu este înlocuită cu altă particulă mai bună), atunci algoritmul se poate opri la acea particulă. Probabil că nici unul dintre testele de stop nu este perfect, avînd în vedere că nu s-a demonstrat riguros convergenţa algoritmului către punctul de optim global. (Ca şi în cazul Algoritmilor Genetici, sunt formulate doar conjecturi de convergenţă, care par a funcţiona în majoritatea aplicaţiilor.) Din acest motiv, se poate opta pentru un test de stop combinat, de exemplu, de forma:

Algoritmul PSO se opreşte dacă: în evoluţia populaţiei s-au înregistrat M generaţii SAU particula optimală din elită a supravieţuit peste un anumit număr de generaţii (de exemplu 5-10) SAU dispersia relativă a elitei are o descreştere sub un prag dat (de exemplu de 3-5%) SAU un procent mare din populaţia curentă face parte şi din elită (de exemplu, peste 85%), după schimbarea unui număr suficient de mare de generaţii, etc. (se mai pot adăuga şi alte condiţii de tip SAU).


20

Performanţele algoritmului PSO depind în mare măsură de compromisul dintre diversitatea populaţiei şi viteza de convergenţă. Aceste două caracteristici ar putea fi chiar cuantificate, cu ajutorul celor două populaţii mP (dinamică) şi mE (elitistă). Astfel, varianţa

populaţiei dinamice mP în jurul valorii optimale a acesteia poate constitui o măsură a

diversităţii. Cu cît varianţa este mai mare, cu atît diversitatea este mai mare şi şansa de a depista optimul global este mai mare. În schimb, inversa varianţei populaţiei elitiste mE ar

putea măsura viteza de convergenţă a algoritmului. Cu cît aceasta are valoare mai mare, cu atît particulele elitiste sunt mai grupate în jurul celei optimale şi şansa de a opri rapid căutarea într-un optim local este mai mare. Cele două varianţe se pot evalua astfel:

2

,01

1 Pdefm m m

ppP =

σ = −∑ x xP P , respectiv 2

,0 ,01

1 Pdefm m m

ppP =

σ = −∑ x xE E , (2.61)

unde ,0mxP este cea mai bună poziţie a particulelor dinamice curente, iar ,0

mxE este cea mai

bună poziţie a particulelor elitiste curente. Ambele poziţii sunt egale, deoarece, din relaţiile (2.51) şi (2.53), rezultă că viteza particulei care ocupă această poziţie este nulă. Ţinînd cont de valorile cuantificate empiric cu ajutorul varianţelor (3.23) ale diversităţii populaţiei şi vitezei de convergenţă, se poate interveni în cazul în care situaţia devine dezechilibrată. O diversitate prea mare produce oscilaţii ale algoritmului, în timp ce o viteză de convergenţă prea mare poate bloca algoritmul într-un optim local. În aceste condiţii, se poate monitoriza produsul celor două varianţe, m mσ σP E . Acesta ar trebui să varieze în jurul unei constante, după cîteva generaţii de la iniţializare. Dacă se înregistrează creşteri rapide ale sale, atunci probabil că diversitatea este prea mare şi algoritmul tinde să devină oscilant. Dacă, din contră, se înregistrează scăderi rapide, probabil că algoritmul tinde să fie capturat într-un optim local. Pentru a remedia tendinţele excentrice ale algoritmului, se poate apela la mai multe operaţii. Una dintre ele este inspirată de Algoritmii Genetici: încrucişarea particulelor. Dacă

1x şi 2x sunt două particule numite generic părinţi, iar vitezele lor instantanee sunt 1v ,

respectiv 2v , atunci ele pot produce doi urmaşi prin încrucişare. Pentru a realiza încrucişarea, se generează în prealabil un număr aleator (0,1)γ∈ , care stabileşte ponderile părinţilor. Apoi, urmaşii sunt produşi astfel:

1 1 2(1 ) 0.5def= γ ⋅ + − γ ⋅ +⎢ ⎥⎣ ⎦x x x , respectiv 2 2 1(1 ) 0.5

def= γ ⋅ + − γ ⋅ +⎢ ⎥⎣ ⎦x x x . (2.62)

Acestora le sunt imprimate vitezele instantanee de mai jos:

1 1 2(1 )def= γ ⋅ + − γ ⋅v v v , respectiv 2 2 1(1 )

def= γ ⋅ + − γ ⋅v v v . (2.63)

Încrucişarea se poate aplica astfel:

a. Dacă produsul m mσ σP E înregistrează o creştere semnificativă, atunci diversitatea este

prea mare. În acest caz, populaţia dinamică mP trebuie încrucişată cu populaţia

elitistă mE , pentru a produce 3 noi populaţii (dinamică, elitistă şi anti-elitistă). În noile populaţii dinamică şi elitistă, se va conserva totuşi particula optimală curentă. În noua populaţie elitistă, se vor înlocui celelalte particule cu urmaşii cei mai buni. În noua populaţie anti-elitistă, se vor reactualiza doar urmaşii cei mai slabi.

b. Dacă produsul m mσ σP E înregistrează o scădere semnificativă, atunci riscul de blocare

într-un optim local este ridicat. În acest caz, populaţia dinamică mP trebuie

încrucişată cu populaţia anti-elitistă mA , pentru a creşte diversitatea. Sunt produse


21

tot 3 noi populaţii ca şi în cazul precedent (după aceleaşi reguli). Tot pentru a creşte diversitatea populaţiei dinamice, se poate apela şi la un transfer direct al unora dintre particulele anti-elitiste către aceasta, cu înlăturarea unora dintre particulele mai bune. Transferul poate fi efectuat şi prin generarea pseudo-aleatoare a unor poziţii, vitezele aferente fiind conservate.

Aşadar, algoritmul funcţionează pe baza a 3 populaţii: dinamică, elitistă şi anti-elitistă. Din punct de vedere informatic, într-o populaţie trebuie memorate: poziţiile particulelor, vitezele instantanee aferente şi valorile corespunzătoare ale criteriului PQ, cu indicarea optimului curent (pentru populaţiile dinamică şi elitistă). În plus, se mai pot memora varianţele populaţiilor şi varianţele extreme din definiţiile (2.55) şi (2.60). Iniţializarea algoritmului (care încheie descrierea lui) constă în următoarele:

generarea unei populaţii dinamice de generaţie nulă ( 0P ), care va fi deopotrivă populaţie elitistă şi anti-elitistă la momentul iniţial; stabilirea vitezelor iniţiale nule pentru toate particulele.

Revenind la predictorul PARMAX, Spaţiul de căutare al fiecărui canal 1,j ny∈ , notat cu

ARMAXS , este un hiper-paralelipiped din laticea multi-dimensională 2 1ny+N , deoarece indicii structurali sunt în număr de 2 1ny + . Primii 1ny + indici pot fi consideraţi principali: unul

este jna , altul este jnc şi restul de 1ny − indici sunt ai ansamblului , 1, ,j i i ny i jnb

∈ ≠. Ultimii ny

indici provin de la modelul MISO-ARX aproximant: jnα şi , 1, ,j i i ny i jn

∈ ≠β .

În acest spaţiu, se defineşte următorul vector generic de poziţie a unei particule:

,1 , 1 , 1 ,

,1 , 1 , 1 , .

def

j j j j j j j ny jj

Tj j j j j j j ny ARMAX

na nb nb nb nb nc

n n n n n

− +

− +

⎡= ⎣

α β β β β ⎤ ∈⎦

x

S (2.64)

Reamintim că vectorul trebuie să aibă numai componente cu valori întregi, nu fracţionare. De aceea, eventualele valori fracţionare rezultate din calcul trebuie aproximate la cel mai apropiat întreg. Populaţia curentă, elita şi anti-elita, fiecare de dimensiune P , sunt reprezentate în acest caz ca blocuri tridimensionale cu 2 1ny + linii, P coloane şi ny straturi, ca în Figura 2.2.

P

Model ARMAX

Model ARX aproximant

ny

Figura 2.2. Reprezentarea tridimensională a populaţiilor de particule

în cadrul Algoritmului PARMAX.


22

Fiecare tăietură verticală de-a lungul grosimii blocului tridimensional reprezintă o combinaţie de indici structurali care permit identificarea modelului de predicţie de tip MIMO-ARMAX. Strategia PSO poate fi (şi a fost) integrată şi în cazul modelelor MIMO-ARMA, fapt care a condus la versiunea a doua a Algoritmului PARMA. Faţă de prima versiune, descrisă în [SPD08], acum predictorul poate furniza valori de predicţie multi-canal, chiar dacă ele sunt independente una faţă de alta. Populaţia de particule este foarte asemănătoare celei din Figura 2.2. Ea este ilustrată în Figura 2.3.

ny

Tendinţă

Model ARMA

Model AR aproximant

P

Figura 2.3. Reprezentarea tridimensională a populaţiilor de particule în cadrul Algoritmului PARMA multi-dimensional.

Singura deosebire o constituie faptul că indicele structural al tendinţei poate lipsi, dacă utilizatorul a optat astfel. Cu alte cuvinte, modelul ARMA poate fi identificat direct din datele măsurate, fără a construi componenta deterministă a acestuia (constituită din tendinţă şi, eventual, dacă există, variaţia sezonieră). Au fost date explicaţii detaliate în legătură cu acest subiect în [SPD08], astfel că ele nu vor fi reluate şi în acest context.

2.5. Algoritmul PARMAX

Există 3 variante de implementare ale Algoritmului PARMAX. Vom detalia în continuare numai varianta cea mai eficientă, Algoritmul 2.1. Aceasta se bazează pe idea fundamentală că, deşi sistemul de senzori ar trebui considerat ca un tot unitar, complexitatea algoritmilor de identificare a modelului MIMIO-ARMA asociat este inacceptabil de mare. În consecinţă, va fi construit cîte un model MISO-ARMAX pentru fiecare canal, în paralel. Modelele sunt aparent independente, însă, în realitate, există corelaţii subtile între ele. Complexitatea acestui algoritm este superioară celei a algoritmului precedent de predicţie, PARMA. La Cu toate acestea, paşii strategiei PSO sunt similari, deşi ei au fost detaliaţi doar în acest context. Este însă evident că durata de rulare creşte. Pentru a o scădea, ar trebui iniţiate în paralel tot atîtea rulări cîte canale de măsură există, cu focalizarea predicţiei pe cîte un canal separat. Aceasta ar fi posibil numai în condiţiile în care programele ar fi găzduite de o maşină paralelă de calcul. Simulările au arătat însă că versiunea de predicţie globală nu este neapărat superioară versiunilor cu predicţie direcţionată pe un anumit canal. Implementarea de facto a Algoritmului 2.1 incumbă utilizarea multor artificii informatice. Ne vom referi numai la cîteva dintre ele, cele mai importante.


Algoritmul 2.1. PARMAX – un algoritm de predicţie a proceselor stocastice, cu ajutorul modelelor MISO-ARMAX, folosind tehnica PSO.

1

2

3

4

Date de intrare: un conglomerat de serii de timp distribuite 1,j j ny

y∈

, de durată finită, yN ;

lungimea orizontului de predicţie K (unde yK N<< ); de regulă, 7K ≤ ; parametri de configurare:

valorile maxime ale indicilor structurali din modelele grosiere ARMA 0 0,NA NC ∈N (implicit: 0 0 30NA NC= = , dar 0 100NA = dacă 0nc = , iar

0 100NC = dacă 0na = ); valorile maxime ale indicilor structurali din modelele MIMO-ARMAX

, ,NA NB NC∈N (implicit: 30NA NB NC= = = , dar 100NA = dacă 0jnb nc= = , 1,j ny∀ ∈ , 100NB = dacă 0na nc= = şi 100NC = dacă 0jnb na= = , 1,j ny∀ ∈ );

numărul P de particule din populaţia algoritmului PSO (implicit: 100P = ); numărul maxim de generaţii ale populaţiei, M (implicit: 100M = ); numărul minim de supravieţuire pentru stoparea algoritmului PSO, S (implicit: max 5, 0.05S M= ⋅⎢ ⎥⎣ ⎦ ); nivelul de alarmare pentru aplicarea încrucişării între particule, (0,1]ξ∈ (implicit, 0.15ξ = ); durata tranziţiei între generaţii, 0T∆ > (implicit, 1T∆ = ).

. Prelucrări primare:

se evaluează mediile 1,j j ny

y∈

şi deviaţiile standard 1,jy j ny∈

σ ale datelor

distribuite; se staţionarizează datele: j j jy y y← − .

. Se estimează modelul ARMA grosier ale fiecărui canal de măsură, folosind criteriul PQ pentru alegerea indicilor structurali optimali. Se obţin astfel modelele:

( ) ( )1 1ˆ ˆA q C qj j j jy e− −≡ , 1,j ny∀ ∈

şi valorile zgomotelor albe, 1,ˆ j j nye

∈, estimate grosier (cu modelele AR aproximante).

. Se rafinează estimările zgomotelor albe, cu ajutorul modelelor ARMA identificate. Notînd cu 1,

ˆ j j nyv

∈ noile estimaţii, acestea se determină ca în (2.27).

. Algoritmul PSO pentru determinarea indicilor structurali optimali ai modelelor MISO-ARMAX care constituie modelul MIMO-ARMAX. Paşii care urmează se parcurg (secvenţial sau în paralel) pentru fiecare canal de măsură 1,j ny∈ .

4.1. Se stabileşte forma generică a particulei de canal, ca în definiţia (2.64). Particula generică globală este o matrice cu ny coloane.

4.2. Se stabileşte 0m = (indicele dinamic) şi se formează generaţia iniţială a populaţiei dinamice, 0

0 1,p p P∈= xP . Populaţia are P particule matriciale ca în

Figura 3.3, (aproximativ) uniform distribuite în spaţiul de căutare ARMAXS .

23


Algoritmul 2.1. PARMAX – un algoritm de predicţie a proceselor stocastice... (continuare).

4.3.

4.4.

4.5.

4.6.

4.7.

4.8.

Populaţia dinamică va iniţializa deopotrivă populaţia elitistă 0E şi pe cea anti-

elitistă 0A . Particulele primesc vitezele iniţiale nule: 0 0p =v , 1,p P∀ ∈ .

Se evaluează şi se memorează PQ pentru toate particulele (prin identificareaşi predicţia cu modelul MISO-ARMAX). Desigur, la acest pas, pentru fiecareparticulă, poziţiile extreme curente coincid cu poziţia sa iniţială: 0 0 0

,0 ,1p p p= =x x x .

Generaţia următoare a populaţiei dinamice se generează amestecînd pseudo-aleator coordonatele de poziţie ale fiecărei particule din populaţia curentă. Seobţine astfel populaţia 1

1 1,p p P∈= xP , cu viteze tot nule ( 1 0p =v , 1,p P∀ ∈ ),

pentru care se evaluează valorile PQ. Fiecare particulă a parcurs astfel otraiectorie formată din două poziţii distincte. În consecinţă, se pot reactualizaelita 1E şi anti-elita 1A , care vor fi acum diferite. Particula sub-optimală

curentă (care a produs valoarea maximă a PQ) este 1 1,0 ,0=x xP E . Indicele ei

iniţial de supravieţuire în populaţia elitistă este stabilit la valoarea nulă ( 0s = ).

Pentru fiecare particulă, se evaluează varianţa cognitivă absolută maximă1

, ,maxp cσ , folosind cele două generaţii 0P şi 1P şi definiţia (2.56). (Evident,1

, ,min 0p cσ = , 1,p P∀ ∈ ; ele vor rămîne nule pe tot parcursul algoritmului.)

Tot cu ajutorul generaţiilor 0P şi 1P , se evaluează şi varianţele sociale absolute

minimă şi maximă ( 1,minsσ , 1

,maxsσ ), pe baza definiţiei (2.59). (De această dată,1

,min 0sσ > , indiferent în ce generaţie a fost ea atinsă.)

Se incrementează indicele dinamic: 1m = .

Cît timp m M≤ sau indicele s de supravieţuire a particulei sub-optimale ,0mxE

este cel mult egal cu S : 4.8.1. Se evaluează varianţele populaţiilor mP şi mE , cu ajutorul definiţiilor

(2.61) şi se calculează media produsului lor de la iniţializare pînă lamomentul anterior, notată prin 1 1m m− −σ σP E . Pentru 2m ≥ , această medie

se poate doar reactualiza: 2 2 1 1

1 1 ( 1) m m m mm m m

m

− − − −− −

− σ σ + σ σσ σ = P E P E

P E ,

avînd în vedere că 0 0 0 0σ σ = σ σP E P E .

4.8.2. Dacă / 3m M≥ ⎢ ⎥⎣ ⎦ , se testează abaterea produsului m mσ σP E faţă de media1 1m m− −σ σP E :

a. Dacă 1 1(1 )m m m m− −σ σ > + ξ σ σP E P E , atunci diversitatea este prea mare şi

populaţia dinamică mP trebuie încrucişată cu populaţia elită mE(conform definiţiilor (2.62) şi (2.63)).

b. Dacă 1 1(1 )m m m m− −σ σ < − ξ σ σP E P E , atunci riscul de blocare într-un optim

local este prea mare şi populaţia dinamică mP trebuie încrucişată cu

populaţia anti-elită mA (tot conform definiţiilor (2.62) şi (2.63)).

24


Algoritmul 2.1. PARMAX – un algoritm de predicţie a proceselor stocastice... (continuare).

c

4.8.3. P

a

b

c

d

ef.

4.8.4. S

p p

x

A

su4.8.5. S

sl p

4.8.6. S4.9. Particula

MISO-A5. Pentru indicii

modele MISOARMAX. La a

6. Se evaluează7. Predicţie mult

Pentru k∈

Pentru

7.1. Pe

recu

. Rezultatul oricăreia dintre încrucişările de la paşii anteriori îl constituieo populaţie cu 2P particule. Din aceasta, vor fi alese primele 1P − înordinea descrescătoare a criteriului PQ. Ele vor înlocui particulele maislabe decît cea sub-optimală din populaţia dinamică mP . (Cu alte

cuvinte, ,0mxP este conservat în mP , chiar dacă şi el participă la

încrucişări.) Ca urmare, vor fi reactualizate şi populaţiile elită mE şi

anti-elită mA .

entru 1,p P∈ (secvenţial sau în paralel), se trece la generaţia 1m+P :

. Se evaluează factorul de mobilitate mpµ prin relaţia (2.53).

. Se evaluează varianţa cognitivă prin relaţiile (2.58) şi (2.55) şi se

generează numărul ( ]1 1, ,1/ 0,1/

defm mp c p c T+ +τ = ν ∈ ∆ (numit ad hoc frecvenţă

cognitivă de tranziţie) în manieră pseudo-aleatoare. . Se evaluează varianţa socială prin relaţiile (2.59) şi (2.60) şi se

generează numărul ( ]1 11/ 0,1/def

m ms s T+ +τ = ν ∈ ∆ (numit ad hoc frecvenţă

socială de tranziţie) în manieră pseudo-aleatoare. . Se evaluează viteza instantanee 1m

p+v a particulei în poziţia

următoare, cu ajutorul relaţiei (2.51). . Se corectează poziţia particulei cu ajutorul relaţiilor (2.50) şi (2.49). Se limitează coordonatele poziţiei la limitele spaţiului de lucru, dacăeste cazul.

e reactualizează populaţia elită 1m m+←E E , reţinînd cele mai bune

oziţii atinse de particule în traiectoriile lor de la iniţializare pînă înrezent. Se detectează noua particulă sub-optimală 1 1

,0 ,0m m+ +=x xE P . Dacă

1,0 ,0

m m+ = xE E , atunci se incrementează indicele de supravieţuire: 1s s← + .

ltfel (adică dacă 1,0 ,0

m m+ ≠x xE E ), se reiniţializează indicele de

pravieţuire: 0s = . e reactualizează populaţia anti-elită 1m m+←A A , reţinînd cele mai

abe poziţii atinse de particule în traiectoriile lor de la iniţializare pînă înrezent. e incrementează indicele dinamic: 1m m← + . (sub-)optimală a populaţiei elită oferă indicii structurali ai modelului

RMAX. structurali optimali determinaţi la pasul anterior, se identifică cele ny-ARMAX, care alcătuiesc împreună modelul de predicţie MIMO-

cest pas, intervin toate datele măsurate, pe toate canalele. coeficienţii cîtului trunchiat (2.45), pentru fiecare canal de măsură. i-pas, multi-canal. 1, yN K+ :

1,j ny∈ (secvenţial sau în paralel):

orizontul de măsură, adică pentru 1, yk N∈ , se implementează relaţiile

rsive (2.40).

25


Algoritmul 2.1. PARMAX – un algoritm de predicţie a proceselor stocastice... (final).

O primă mpopulaţiei (dePARMA. Mai

unde spaţiul

dimensionalăutilizatotului pajutorul cărutridimensiona Motivul peaceastă manansamblu de cîte o procedde timp de ru IniţializareaPARMA-PSODe aceea, s-a

7.2.

7.3.

7.4.

Date de i• mulţim

• dispers

Se evaluează dispersia erorii de predicţie pe orizontul de măsură, cuajutorul definiţiei (2.46).

Pe orizontul de predicţie, pentru 1,y yk N N K∈ + + :

7.3.1. Se efectuează o predicţie pe termen scurt, adică pentru

1, min ,y y jk N N K na∈ + + , prin implementarea relaţiei recursive

(2.41). 7.3.2. Se efectuează o predicţie pe termen lung (dacă este cazul, adică

dacă na K< ), pentru 1,y j yk N na N K∈ + + + , prin implementarea

relaţiei recursive (2.42). 7.3.3. Se reactualizează valorile predictate ale zgomotului de canal, prin

implementarea relaţiei recursive (2.43). 7.3.4. Se estimează dispersiile erorilor de predicţie (pe orizontul de

predicţie) folosind relaţia recursivă (2.44). Se adaugă media de canal jy (evaluată la pasul 1) tuturor valorilor

predictate.

eşire: ea valorilor predictate:

1, , 1,ˆ |j y y k K j nyy N k N

∈ ∈⎡ ⎤+⎣ ⎦ ;

iile erorii de predicţie 2, 1, , 1,j k k K j ny∈ ∈

σ .

26

odificare faţă de fluxul logic o constituie faptul că particula generică a finită în (2.64)) a fost extinsă cu particula generică din cazul Algoritmului precis, forma actuală a particulei de canal este următoarea:

,1 , 1 , 1 ,

,1 , 1 , 1 , ,

defARMA ARMA ARMA

j j j j j

j j j j j j j ny j

T ej j j j j j j ny ARMAX

p na nc n

na nb nb nb nb nc

n n n n n

− +

− +

⎡= α⎣

α β β β β ⎤ ∈⎦

x

S

(2.65)

de căutare extins eARMAXS este un hiper-paralelipiped din laticea multi-

2 4,2 5ny ny+ +N . Prima componentă poate lipsi sau nu, în funcţie de opţiunea rivind determinarea componentei deterministe a modelului MIMO-ARMA (cu

ia se estimează intrările modelului MIMO-ARMAX). În consecinţă, blocul l al populaţiei se extinde pe verticală ca în Figura 2.4. ntru care s-a extins configuraţia particulelor este unul foarte simplu: în ieră este iniţiată o singură procedură euristică de tip PSO pentru întregul indici structurali ai tandemului modelelor de identificare ARMA-ARMAX şi nu

ură separată pentru fiecare dintre ele. Se obţine astfel o importantă economie lare. procedurii PSO este uşor mai complicată decît în cazul Algoritmului , avînd în vedere numărul mai mare de dimensiuni ale spaţiului de căutare. adoptat următoarea strategie:


27

P

Model ARMAX

Model ARX aproximant

ny

Tendinţă

Model ARMA

Model AR aproximant

Figura 2.4. Reprezentarea tridimensională a populaţiilor extinse de particule

în cadrul Algoritmului PARMAX.

se generează toate numerele reprezentate în baza P , care au (2 4 )ny d+ + cifre, unde 0,1d ∈ codifică opţiunea utilizatorului privind evaluarea componentei deterministe; se aleg doar P dintre acestea, aproximativ echidistante, exceptînd extremele (eventual, dacă P este prea mic în raport cu numărul de cifre, el se măreşte corespunzător); fiecare dintre numerele selectate are aşadar (2 4 )ny d+ + cifre – cîte una pentru fiecare dintre indicii structurali ai particulei generice de canal (definiţia (2.65)); o astfel de cifră variază între 0 şi 1P − ; fie 0 0

1,2 4i i ny dn

∈ + += ⎡ ⎤⎣ ⎦N un număr din mulţimea celor selectate anterior, în care

0 0, 1in P∈ − este chiar cifra de pe poziţia 1,2 4i ny d∈ + + ; atunci particula

corespunzătoare este de forma 0 01,2 4i i ny d

x∈ + +

= ⎡ ⎤⎣ ⎦x , unde:

( )0

0 min max min 0.51

defi

i i i inx x x x

P⎢ ⎥= + ∈+−⎢ ⎥−⎣ ⎦

N , 1,2 4i ny d∀ ∈ + + , (2.66)

unde min max,i ix x ∈N este plaja de variaţie a indicelui structural corespunzător.

Modelele de identificare estimate pot fi sau nu stabile (în sensul că polinomul AR – primul din definiţiile (2.24)) poate avea polii în afara discului unitar. Utilizatorul are posibilitatea de a preciza încă de la început dacă se va opera numai cu modele stabile sau dacă stabilitatea modelelor nu va fi testată. Testul de stabilitate este binecunoscut în comunitatea Teoriei Sistemelor. El are două variante: Testul Hurwitz (pentru sisteme continue) şi Testul Schür-Cohn (pentru sisteme discrete) [IoV85], [SCS05]. În cadrul Algoritmului PARMAX, a fost integrat Testul Schür-Cohn (Algoritmul 2.2). Testarea stabilităţii unui model de identificare revine adesea la verificarea proprietăţii unui polinom:


28

1 1,1 ,( ) 1 M

M M MA z a z a z− − −= + + + (2.67)

de a avea rădăcinile în interiorul discului unitar al planului complex. Procedura care verifică această proprietate se numeşte Criteriul (Testul) de stabilitate Schür-Cohn [ScI17], [GoI86], [PrMa96]. Aşa cum am precizat, acesta este analogul din cazul sistemelor discrete al Criteriului lui Hurwitz, utilizat în contextul sistemelor continuale. Criteriul Schür-Cohn se bazează pe conceptele de polinom reciproc şi coeficient de reflexie. Astfel,aşa cum am mai menţionat, polinomul reciproc al celui din (2.67) este, prin definiţie, următorul:

1 1 1,1 ,( ) ( )

defM M M

M M MA z z a z a z A z− − − − += + + + = , (2.68)

iar coeficientul de reflexie corespunzător este MM

def

M ak ,= .

Algoritmul 2.2 descrie paşii Testului de stabilitate Schür-Cohn.

Algoritmul 2.2. Testul de stabilitate Schür-Cohn.

Practic, polinomul (2.67) este stabil dacă toţi coeficienţii de reflexie ( 1, m m Mk ∈ ) se

situează în interiorul discului unitar al planului complex (sau în intervalul [ 1, 1]− + , în cazul în care polinomul iniţial are coeficienţi reali). Se poate arăta că polinoamele succesive

1, m m MA ∈ au grade proporţionale cu indicii care le definesc.

Simulările pe diferite seturi de date au arătat că operarea numai cu modele stabile nu conduce întotdeauna la cele mai bune rezultate de predicţie. Aceasta, deoarece componenta ARMA a modelului ARMAX este cu precădere utilizat pentru identificarea sursei de zgomot care corupe datele. Predicţia precisă a datelor revine, de fapt, la predicţia cu suficientă acurateţe a acestui zgomot. Ori, zgomotele sunt adesea generate de fenomene de instabilitate, care sunt mai bine modelate de modele ARMA instabile sau la limita de stabilitate. De aceea, implicit, dacă utilizatorul nu are o opţiune în ceea ce priveşte proprietatea de stabilitate, testul de mai sus este inhibat. (De altfel, el conduce la creşterea duratei de rulare, fără a îmbunătăţi în mod obligatoriu calitatea predicţiei.) Strategia euristică PSO se bazează pe trei rutine fundamentale: PSO_ARMAX (aplicarea strategiei PSO), PARMAX_model (identificarea unui model ARMAX) şi PSO_fitness_PQ (evaluarea calităţii predicţiei). Lista programelor şi rutinelor utilizate pentru implementarea Algoritmului PARMAX este inclusă în manualul de utilizare [ASTI09]. Fiecare dintre ele include un set de comentarii care oferă principalele detalii de implementare, legate, mai

Date de intrare: Polinomul 1 1,1 ,( ) 1 M

M M MA z a z a z− − −= + + + .

1. Iniţializare: m M= , ,M M Mk a= (primul coeficient de reflexie) şi 1 1( ) ( )MA z A z− −=

(primul polinom furnizor de coeficient de reflexie). 2. Cît timp | | 1mk < şi 0m > , se efectuează următoarele operaţii:

2.1. Dacă 1m > : a. Se calculează polinomul următor, care foloseşte atît polinomul curent, cît şi

polinomul reciproc asociat: 1 1

11 2

( ) ( )( )1

m m mm

m

A z k A zA zk

− −−

−−

=−

.

Evident: 1 1 11 1,1 1, 1( ) 1 m

m m m mA z a z a z− − −− − − −= + + + .

b. Se evaluează coeficientul următor de reflexie: 1 1, 1m m mk a− − −= .

2.2. Se decrementează indicele curent: 1m m← − . Test. Dacă 0m > polinomul este instabil. Altfel, polinomul este stabil.


29

ales, de structurile de date utilizate. Toate sursele informatice ale acestui pachet sunt complet comentate, pentru uşurinţa înţelegerii fluxului logic în care se desfăşoară calculele. Există cîteva publicaţii ale echipei de cercetare care fac referire la predictorul PARMAX. Cea mai importantă este [StCu09] (indexată ISI), anexată în finalul acestui raport de cercetare.

33.. PPrreeddiiccţţiiaa ddaatteelloorr uunnii--ddiimmeennssiioonnaallee ccuu aajjuuttoorruull uunnddiinneelloorr Algoritmii PARMA şi PARMAX caracterizează prin faptul că apelează la modele de identificare a sistemelor, în scopul predicţiei. Algoritmii prezentaţi în această secţiune şi în următoarea apelează la modele de semnale nestaţionare stocastice. Aceasta înseamnă că semnalele considerate nu sunt doar afectate de perturbaţii nedeterministe, ci au şi proprietatea de a poseda spectru variabil în timp. Prelucrarea Semnalelor [PrMa96] este un domeniu de cercetare cel puţin tot atît de vast ca şi Identificarea Sistemelor [SoSt89], cu care are numeroase corelaţii. Algoritmul FORWAVER, care va fi descris în continuare, constituie de fapt o aplicaţie a unor tehnici din cîmpul de cercetare al analizei de semnal de tip timp-frecvenţă-scală [CoL95]. Acesta a cunoscut o puternică dezvoltare în ultimii ani, prin numeroasele aplicaţii în care intervine cu succes. O direcţie de cercetare aparte a acestui domeniu o constituie cea al undinelor. Cuvîntul undină a fost tradus în limba română în teza de doctorat [StD95], a fost acceptat de către Academia Română şi corespunde cuvintelor wavelet din limba engleză sau ondelette din limba franceză. Cărţile [StSt07] şi [SSP09] (în curs de apariţie la Editura Academiei Române) oferă o imagine destul de detaliată asupra acestui cîmp de cercetare interesant. Există, desigur, numeroase publicaţii în alte limbi decît română, care descriu undinele sub diferite aspecte. În cadrul acestei secţiuni, va fi făcută numai o foarte succintă prezentare legată de undine, suficientă, totuşi, pentru a înţelege fundamentul algoritmului de predicţie FORWAVER.

3.1. Paradigma deparazitării semnalelor

Reprezentarea la scară este o operaţie cunoscută încă din antichitate, în special în domeniul Cartografiei, unde obiectivul principal este de acela a reda hărţile (geografice) cu un anumit grad de detaliere. De exemplu, la o scară de 1:2 500 000, harta României se poate reprezenta pe o coală de hîrtie de format A4 (21×29.7 cm2), în poziţie orizontală, unde 1 cm corespunde unei distanţe reale de 25 km. La o astfel de scară, localităţile mici şi mijlocii sau detaliile de relief nu pot fi reprezentate, deoarece rezoluţia grafică a hărţii este prea mică. Mărind scala de reprezentare 25 de ori (la 1:100 000), harta ocupă acum o coală de hîrtie de peste 5 m lăţime şi 7.4 m lungime, iar 1 cm corespunde unei distanţe de 1 km. Avînd în vedere densitatea de localităţi şi variaţia de relief din România, noua hartă permite acum reprezentarea oricărei localităţi şi a majorităţii formelor de relief, cursurilor de apă, etc. Mai mult, localităţile care nu sunt foarte mici beneficiază acum de o rezoluţie grafică suficient de bună, permiţînd reprezentarea lor la nivel de străzi. Pentru a putea fi utilizată, însă, harta trebuie împachetată într-un atlas cu 625 de pagini avînd formatul A4. La scala 1:1, atlasul României ar cuprinde 62.5 milioane de pagini de format A4. Gradul de detaliere corespunde acum celui din realitatea percepută, dar atlasul este evident inutilizabil, rezoluţia grafică fiind mult prea mare. O hartă uşor de utilizat şi precisă trebuie să dovedească un bun compromis între scala de reprezentare şi rezoluţia grafică. Şi în alte domenii operaţia de scalare este frecvent utilizată. Este vorba de exemplu de Chimie, Medicină sau Nano-inginerie, unde, de această dată, scalele sunt de forma 25:1, 100:1, 1000:1, etc. Rezoluţia de reprezentare a entităţilor din aceste domenii (de regulă, imagini) creşte odată cu scala de reprezentare, ca şi în Cartografie, numai că efectul scalării este de mărire şi nu de micşorare.


30

Corelaţia care există între scala şi rezoluţia de reprezentare a unui semnal este surprinsă în cadrul unei teorii dezvoltate de către Stéphane Mallat (în urma întîlnirii cu Yves Meyer) la mijlocul anilor ’80: Teoria multi-rezoluţie [MaS89]. Aceasta a condus la o abordare extrem de interesantă pentru aplicaţiile practice, concretizată într-o serie de algoritmi de analiză-sinteză bazaţi pe structura multi-rezoluţie a spaţiului semnalelor

uzuale (stabile şi de energie finită – 1 2def= ∩H L L , de tip Hilbert). Colecţia acestor

algoritmi constituie nucleul Analizei multi-rezoluţie. În PS, existenţa posibilităţii de a proiecta diferite semnale pe anumite subspaţii din H a condus în mod natural la formularea uneia dintre cele mai interesante probleme: cea a deparazitării semnalelor de perturbaţii nedorite. Semnalele din aplicaţiile practice sunt de regulă afectate de perturbaţii cu caracter determinist şi/sau stocastic. Un astfel de semnal transportă aşadar nu numai o informaţie utilă, ci şi una parazită. Problema care se ridică este aceea a separării componentei utile a semnalului de componenta sa parazită. Două aspecte ridică mult gradul de dificultate al acestei probleme. În primul rînd, maniera în care perturbaţiile se combină cu semnalul util este necunoscută. Pentru comoditate, se consideră adesea că aceste semnale îşi adună contribuţiile (eventual, de o manieră ponderată), deşi multe aplicaţii au demonstrat că modelul care respectă principiul superpoziţiei este inadecvat. În al doilea rînd, nu există o definiţie generală a conceptului de perturbaţie. Aceasta împiedică o metodă de deparazitare care funcţionează cu o anumită precizie în cazul unei clase de semnale să funcţioneze cu aceeaşi precizie şi în cazul altei clase de semnale. În general, oricare ar fi metoda de deparazitare de semnal, nu poate fi împiedicată manifestarea următorului fenomen: o parte din informaţia utilă este tratată ca parazită şi se pierde, în timp ce o parte din informaţia parazită este interpretată ca utilă şi continuă să distorsioneze semnalul. Nu se poate trasa o linie clară de demarcaţie între cele două tipuri de informaţie, dar se poate diminua procentajul de informaţie utilă pierdută sau parazită conservată. De regulă, aceasta se realizează prin creşterea complexităţii metodei de deparazitare. Unul dintre principiile care stă la baza metodelor de deparazitare în cazul modelelor de superpoziţie este cel de proiecţie a semnalului corupt pe un subspaţiu închis, generat de semnale utile cunoscute şi nedistorsionate de prezenţa perturbaţiilor. Figura 3.1 ilustrează acest principiu.

][][ 0gD ξ

yr

yr∆

yr

U=<u1,u2,...,un>

f

fU

fε U ⊥

Figura 3.1. Principiul deparazitării semnalelor cu ajutorul proiecţiilor ortogonale.

În acest exemplu, semnalul original f ∈H este corupt de o perturbaţie necunoscută. Cu toate acestea, informaţia pe care o transportă ar putea fi reprezentată cu ajutorul unui


31

sistem de semnale ortonormate 1,i i nu

∈, în număr finit. Aceste semnale – numite ad hoc de

bază – pot fi cunoscute sau se pot construi după anumite reţete. De exemplu, ele pot constitui o colecţie de armonice elementare de diferite frecvenţe (caz în care problema deparazitării revine la determinarea unei representări armonice clasice, de tip Fourier). Fiind în număr finit, aceste semnale de bază nu pot genera întregul spaţiu de semnale, ci un subspaţiu închis al acestuia, 1 2, , , nu u u= …U . Semnalul util este atunci ”definit” prin

proiecţia semnalului original pe subspaţiul U :

1

,n

i ii

f f u u=

≡ ∑U . (3.1)

Diferenţa dintre semnalele original şi util este declarată semnal parazit: f f fε ≡ − U . Acesta este ortogonal pe semnalul util, dovedind astfel neredundanţa cu acesta, proprietate care justifică termenul de deparazitare. Calitatea separării celor două semnale depinde sensibil nu numai de maniera în care este ales sistemul de semnale ortonormate 1,i i n

u∈

, prin

intermediul căruia va fi codificată mai departe informaţia utilă, ci şi de natura semnalului şi a perturbaţiilor. Din acest motiv, găsirea unor metode generale de deparazitare a semnalelor rămîne o problemă deschisă. Problema concretă este însă aceea a stabilirii unei metode clare de construcţie a subspaţiilor de tipul lui U . În general s-a arătat (şi acesta este probabil meritul lui Mallat şi Meyer) că spaţiul H poate găzdui o structură imbricată de subspaţii liniare închise, strict incluse unul în altul, de forma:

0 1 2 1m m+⊂ ⊂ ⊂ ⊂ ⊂ ⊂ ⊂V V V V V H , (3.2) cu proprietatea: 1m m m

⊥+ = ⊕V V V , m∀ ∈N . (3.3)

Complementul ortogonal din (3.3), notat alternativ prin mW , este evaluat în raport cu

subspaţiul următor şi nu cu întregul spaţiu H . Această proprietate permite descompunerea iterativă a spaţiului H după cum urmează:

0 0 1 2 0m mm∈= ⊕ ⊕ ⊕ ⊕ ⊕ ⊕ = ⊕ ⊕

NV W W W W V WH . (3.4)

Dacă dimensiunea lui H este finită, atunci numărul subspaţiilor (3.3) este la rîndul lui finit, deoarece 0V nu poate avea dimensiune inferioară unităţii. De exemplu, dacă H este

spaţiul Euclidian 3R , atunci 1V poate fi planul orizontal principal, iar lui 0V nu-i mai rămîne

decît să se identifice cu o oblică oarecare din 1V trecînd prin origine. Evident, 1⊥V este axa

verticală a spaţiului, în timp ce 0⊥V este axa perpendiculară pe 0V din planul 1V .

Maniera în care se poate realiza descompunerea (3.4) nu este unică. Una dintre cele mai interesante (inclusiv pentru predicţie) este cea legată logic de conceptele de scală şi rezoluţie de reprezentare. Într-o astfel de descompunere, proiecţia unui element oarecare f ∈H pe subspaţiul mV , notată prin mf (pentru m∈N ) se numeşte aproximare la nivelul

de rezoluţie m a lui f . Elementul mf este similar unei ”hărţi” a lui f reprezentate la o scală crescătoare în raport cu nivelul de rezoluţie. Pentru a trece la nivelul următor de rezoluţie, se poate proiecta f direct pe subspaţiul 1m+V , obţinîndu-se aproximarea 1mf + .

Ţinînd cont de proprietatea (3.3), diferenţa dintre cele două aproximaţii succesive 1mf + (de

rezoluţie mai mare) şi mf (de rezoluţie mai mică) este constituită de un element m mf ⊥ ∈W

obţinut prin proiecţia lui 1mf + sau a lui f pe complementul ortogonal mW . Astfel, se poate scrie că:


32

11 Pr ( ) Pr ( ) Pr ( )

m m mm m mf f f f f f+

⊥+ = = + = +V V W , m∀ ∈N . (3.5)

Relaţia recursivă (3.5) relevă mecanismul de creştere a rezoluţiei de reprezentare favorizat de ortogonalitate: pentru a sări la nivelul următor de rezoluţie, aproximaţiei curente trebuie să i se adauge noi detalii. De aceea, elementul mf

⊥ se numeşte detaliu la nivelul de rezoluţie 1m + al lui f . Nivelul de rezoluţie al detaliului nu este m , deoarece complementul ortogonal mW este un subspaţiu al lui 1m+V , disjunct cu mV . Adăugarea

detaliului necesar saltului de rezoluţie poate fi privită şi ca o creştere a scalei de reprezentare a elementului original, similar cazului hărţilor geografice la care s-a făcut referire în deschiderea paragrafului. Prin mărirea nivelului de rezoluţie (sau a scalei de reprezentare), elementul original este mai bine aproximat. Această proprietate rezultă în urma unui raţionament destul de simplu, după cum urmează. Pentru un anumit nivel de rezoluţie arbitrar fixat m∈N , elementele mf

(aproximaţia) şi mf⊥ (detaliul) sunt evident ortogonale ( m mf f ⊥⊥ ). Mutual, este indusă şi

ortogonalitatea elementului de eroare 1mf f +− pe subspaţiul 1m+V (deoarece

11 Pr ( )mmf f++ = V ). În consecinţă, ( )1m mf f +− ⊥ W , ceea ce implică, în particular, că:

( )1m mf f f ⊥+− ⊥ , adică ( ) ( )1 1m m mf f f f+ +− ⊥ − . Deoarece ( ) ( )1 1m m m mf f f f f f+ +− = − + − , se

poate aplica Teorema Pitagora-Hilbert [SSP09], care conduce la:

2 2 2 21 1 1m m m m mf f f f f f f f+ + +− = − + − ≥ − , m∀ ∈N . (3.6)

Inegalitatea (3.6) probează proprietatea de îmbunătăţire a preciziei de aproximare odată cu mărirea rezoluţiei de reprezentare (sau a scalei). Ea nu se bazează decît pe ortogonalitate şi nu pe definiţia explicită a subspaţiilor componente ale spaţiului Hilbert. Mai mult, ea se verifică şi în absenţa interpretării legate de rezoluţia sau scala de reprezentare. Totuşi, în condiţiile în care subspaţiile componente sunt construite în corelaţie directă cu primul concept (cel de rezoluţie), atunci structura realizată de ele în cadrul spaţiului Hilbert se numeşte multi-rezoluţie a acestui spaţiu. Numele este sugerat de următoarea egalitate evidentă obţinută prin iterarea identităţii (3.5):

1

00

m

m ii

f f f−

⊥

=

= +∑ , m ∗∀ ∈N . (3.7)

Cu alte cuvinte, aproximarea la nivelul de rezoluţie curent mf se obţine plecînd de la o

versiune grosieră 0f a elementului original f , prin adăugarea tuturor detaliilor de la nivele

de rezoluţie inferioare. În evaluarea lui mf sunt astfel implicate mai multe rezoluţii de

reprezentare cu nivele succesive. De regulă creşterea rezoluţiei de reprezentare este însoţită de o creştere a scalei, ca în şirul de imagini succesive din Figura 3.2. Fiecare dintre hărţile Figurii 3.2 este o aproximare la un anumit nivel de rezoluţie a hărţii naturale (reprezentate la scala 1:1). Adăugarea de noi detalii îmbogăţeşte fiecare imagine nu numai în ceea ce priveşte informaţia codificată, ci şi ca număr de pixeli, fapt care forţează creşterea scalei de reprezentare. Se observă cu uşurinţă că, faţă de aproximrea grosieră (la scala cea mai mică), unde se distinge practic doar conturul graniţelor ţării, pe măsură ce rezoluţia şi scala de reprezentare cresc, se adaugă noi detalii în interiorul acestui contur. În ultima aproximare, care este cea mai rafinată dintre cele prezentate, se pot deja distinge contururile judeţelor, localizarea marilor oraşe, reţeaua de căi rutiere, cursurile importante de apă, etc.


33

Figura 3.2. Harta României reprezentată la diferite scale şi nivele de rezoluţie.

Pentru construcţia unei structuri multi-rezoluţie există mai multe abordări. În acest proiect, ne-am oprit la o construcţie ingenioasă propusă de Stéphane Mallat în [MaS89] şi Ingrid Daubechies în [DaI88a], [DaI88b] şi [DaI90], care a fost ulterior generalizată de Ronald Coifman şi Mladen Victor Wickerhauser în [CoWi92]. Reamintim că, în modelarea unei serii de timp [SPD08], au intervenit două componente cu naturi diferite: una deterministă (constituită dintr-o tendinţă Ty şi o variaţie sezonieră

Sy ) şi alta nedeterministă (constituită dintr-un semnal stocastic v , identificat cu ajutorul

unui model AR sau ARMA, ˆVy ). Cu alte cuvinte, expresia completă a modelului unei astfel de serii de timp este:

ˆ ˆT S Vy y y y≡ + + . (3.8)

Unul dintre impedimentele obţinerii unei precizii foarte înalte a valorilor predictate cu ajutorul modelului (3.8) îl constituie faptul că semnalul determinist T Sy y+ are o natură staţionară. (În plus, el este şi afectat de un anumit grad de subiectivism din partea utilizatorului, aşa cum s-a arătat în [SPD08].) Cu alte cuvinte, spectrul acestui semnal este considerat constant în timp, cu energia concentrată în special în jurul frecvenţelor


34

caracteristice ale variaţiei sezoniere. Aceasta face, de exemplu, ca modelul (3.8) să sesizeze numai o periodicitate de 12 luni (sau un multiplu al acestei valori) în seria de timp a şomajului înregistrat într-o ţară, nu şi alte componente sezoniere, ale căror perioade nu fac parte din mulţimea multiplilor lui 12. Explicaţia acestei limitări rezidă în faptul că spectrul componentei deterministe este constant în timp. O abordare opusă este cea în care semnalul determinist staţionar este înlocuit de unul tot determinist, dar nestaţionar (cu spectru variabil în timp). Suma T Sy y+ , care defineşte

semnalul determinist de identificare, corespunde de fapt semnalului util fU din Figura 3.1, în care semnalele de bază sunt polinoame şi armonice de diferite frecvenţe, dar staţionare. Pentru a înlocui această componentă din modelul (3.8), va trebui schimbat setul de semnale de bază cu unul în care elementele sunt nestaţionare. De exemplu, cu undine ortogonale. Cu alte cuvinte, modelul de predicţie alternativ, nestaţionar şi stocastic este următorul:

ˆ ˆW Vy y y≡ + , (3.9)

unde Wy va corespunde acum semnalului util fU din Figura 3.1. Desigur, zgomotul colorat

v continuă să se identifice cu fε – proiecţia ortogonală a semnalului original pe subspaţiul parazit (ca în cazul modelului (3.8)).

3.2. Scurtă privire asupra undinelor ortogonale şi structurii multi-rezoluţie

Subspaţiul U din abordarea nestaţionară este generat prin utilizarea pachetelor de undine [CoWi92]. Astfel, subspaţiul posedă o structură multi-rezoluţie. În domeniul undinelor, este bine cunoscut faptul că o structură multi-rezoluţie [MaS89] poate fi generată cu ajutorul unei perechi de semnale ortogonale cu suport compact: o (aşa numită) undină tată φ şi o (aşa numită) undină mamă ψ [DaI88]. De regulă, ele constituie soluţiile următoarelor două ecuaţii (duale) de dilatare laticeale (abreviate prin EDL, respectiv EDL⊥):

2 1

0

( ) 2 (2 )N

nn

t h t n−

=

φ = φ −∑ , 0,2 1t N∀ ∈ − , (3.10)

1

12 2

( ) 2 ( 1) (2 )nn

n N

t h t n−= −

ψ = − φ −∑ , 1 ,t N N∀ ∈ − . (3.11)

Definiţiile (3.10) şi (3.11) se bazează pe existenţa unei secvenţe de lungime finită

0,2 1n n Nh

∈ −, cu următoarele proprietăţi:

Normalizare:

2 1

0

2N

nn

h−

=

=∑ , 2 1

0

(1 ) 0N

nn

n

h−

=

− =∑ ; (3.12)

Condiţii Nyquist[2] (de ortogonalitate) :

2 1

2 00

[ ]N

n n kn

h h k−

−=

= δ∑ , k∀ ∈Z , (3.13)

unde 0δ este impulsul unitar discret.

De fapt, ortogonalitatea undinelor este o consecinţă directă a condiţiilor Nyquist[2]. Mai mult, ortogonalitatea este echivalentă următoarei proprietăţi: spectrele lui φ şi ψ sunt aproape disjuncte, fiind esenţial localizate în sub-benzi de joasă şi respectiv înaltă frecvenţă, în concordanţă cu rezultatele lui Battle şi Lemarié [BaG87], [LePG88].


35

Determinarea cu o precizie finită a undinelor de bază φ şi ψ , ca soluţii ale ecuaţiilor (3.10) şi (3.11), avînd coeficienţii stabiliţi a priori, poate fi realizată prin intermediul unei proceduri iterative iniţiată de Daubechies (şi Lagarias) în [DaLa88a] şi [DaLa88b]. Procedura urmăreşte exemplul cunoscut de generare a formelor fractale ale lui deRham, plecînd de la variaţii mici, cu ajutorul unei ecuaţii de tip EDL. De aceea, această procedură este cunoscută sub numele de Algoritm Daubechies-deRham. Algoritmul este descris în detaliu în [StSt07] şi [SSP09]. Coeficienţii 0,2 1n n N

h∈ −

ai ecuaţiei EDL sunt valori ale răspunsului la impuls ale unui

filtru trece-jos, în timp ce 1 2 2 ,1( 1)n

n n n Ng h − ∈ −

= − sunt valorile răspunsului la impuls ale

unui filtru trece-sus. Cele două filtre sunt oglindite în cuadratură (quadratic mirrored filters – QMF) [PrMa96], [VaPP93]. Daubechies a introdus în [DaI88] un algoritm de construire a coeficienţilor ecuaţiei EDL, pentru diferite valori ale parametrilor suport

N ∗∈N , care permit undinelor φ şi ψ să genereze baze ortonormale de undine cu suport compact. Algoritmul Daubechies poate fi găsit în [StSt07] şi [SSP09]. Ambii algoritmi Daubechies-deRham şi Daubechies joacă roluri importante în construirea modelului de predicţie. Asupra unui semnal f (şi, prin urmare, a unei undine), se pot aplica două tipuri de operaţii, pentru a îi schimba rezoluţia în timp: scalare şi deplasare/decalare temporală (sau translatare). Ele sunt definite mai jos (respectiv), pentru orice t∈R :

( ) ( )( ) 2 2m m mf t f t− −σ = , m∀ ∈Z ; (3.14)

( )q ( ) ( )n f t f t n− = − , n∀ ∈Z . (3.15)

Prin scalarea (3.14), orice semnal poate fi dilatat (pentru 0m > ) sau contractat (pentru 0m < ). Un semnal dilatat este considerat o versiune aproximată grosier a semnalului

original, în termenii rezoluţiei în timp. Mai mult, conform Principiului de Incertitudine Gabor-Heisenberg [StSt07], spectrul unui semnal dilatat/contractat este o versiune contractată/dilatată a spectrului original. Astfel, în principiu, prin micşorarea rezoluţiei în timp, creşte rezoluţia în frecvenţă (şi invers). Prin translatarea (3.15), variaţia semnalului original este întîrziată (pentru 0n > ) sau anticipată (pentru 0n < ). Un semnal f poate aşadar genera o familie de undine scalate şi translatate

, ,q n m

m n m nf f−

∈= σ

Z, unde:

( ) ( )q ( ) 2 2 ( )n m m mf t f t n− − −σ = − , t∀ ∈R . (3.16)

Structura multi-rezoluţie a lui Mallat pentru semnale stabile de energie finită este bazată pe familii de tip (3.16). Ea constă într-o colecţie m m∈ZW de subspaţii ortogonale generate

de toate translaţiile temporale aplicate versiunilor scalate ale undinei mamă. Cu alte

cuvinte, orice mW este generat de familia , q n mm n n

−

∈ψ = σ ψ

Z, care, în plus, este o bază

ortogonală de undine. Undina tată joacă un rol similar. Astfel, baza ortogonală

, q n mm n n

−

∈φ = σ φ

Z generează subspaţiul mV şi:

1 1m m+ +⊥V W & 1 1m m m+ += ⊕V V W , m∀ ∈Z . (3.17)

Prin convenţie, mV este subspaţiul tuturor semnalelor cu rezoluţie temporală 2 m− , iar

mW este subspaţiul care include semnale de detaliu, cu aceeaşi rezoluţie în timp ca


36

semnalele lui 1m−V , adică 12 m− (dublă). De aceea, conform proprietăţilor (3.17), orice

semnal m mf ∈ V (cu rezoluţia 2 m− ) poate fi exprimat printr-o sumă de două semnale

ortogonale: versiunea dilatată 1 1m mf + +∈ V (cu rezolutie 12 m− − ) şi versiunea detaliată

1 1m mf ⊥+ +∈W (cu rezoluţie 2 m− ).

În aplicaţii, numai un număr finit de subspaţii sunt utilizate. De regulă, analiza şi sinteza se bazează pe următoarea structură multi-rezoluţie:

0 1 2 M M= ⊕ ⊕ ⊕ ⊕V W W W V , (3.18)

unde 1M ≥ este cel mai mic nivel scalar care poate fi considerat. Proprietatea (3.18) conduce la următoarea reprezentare asociată unui semnal f :

0 0, 0, , , , ,1

M

n n M n M n m n m nn n m n

f c c d∈ ∈ = ∈

≡ φ ≡ φ + ψ∑ ∑ ∑∑Z Z Z

, (3.19)

unde 0f este proiecţia lui f pe 0V iar coeficienţii undină sunt calculaţi în mod natural

astfel:

0, 0,,n nc f= φ & , ,,M n M nc f= φ & , ,,m n m nd f= ψ . (3.20)

O implementare eficientă a ecuaţiilor (3.19) (de analiză) şi (3.20) (de sinteză) a fost propusă de către Mallat in [MaS89], cu ajutorul a trei operaţii cu timp discret: filtrare (sau

convoluţie, ∗), decimare ( 2↓ ) şi interpolare ( 2↑ ). Prin decimare, se elimină fiecare eşantion par din date, iar prin interpolare este inserată o valoare nulă între oricare două eşantioane consecutive. Dacă, în general, secvenţa de coeficienţi ai EDL⊥ se notează prin g , pot fi definiţi operatorii liniari de mai jos:

( ) 2x x h≡ ∗ ↓I ⇔ ( ) 2[ ] [ ]k nk

x n h x k−∈

= ∑Z

I , n∀ ∈Z ; (3.21)

( ) 2x x g≡ ∗ ↓H ⇔ ( ) 2[ ] [ ]k nk

x n g x k−∈

= ∑Z

H , n∀ ∈Z . (3.22)

În aceste ecuaţii, x este o secvenţă arbitrară cu timp discret şi x corespunde versiunii oglindite ( [ ] [ ]x n x n= − , n∀ ∈Z ). Definiţiile (3.21) si (3.22), împreună cu EDL (3.10) şi

EDL⊥ (3.11), conduc la următoarele ecuaţii recursive, verificate de coeficienţii undină:

1m mc c+ ≡ I & 1m md c+ ≡ H , 0, 1m M∀ ∈ − . (3.23)

De fapt, ecuaţiile (3.23) sunt utilizate în analiza semnalului. Pe de altă parte, sinteza semnalului este exprimată, de asemenea, recursiv:

1 1m m mc c d∗ ∗+ +≡ +I H , 1,0m M∀ ∈ − . (3.24)

unde ∗I şi ∗H sunt operatorii adjuncţi exprimaţi mai jos:

( )2x x h∗ ≡ ↑ ∗I ⇔ ( ) 2[ ] [ ]n kk

x n h x k∗−

∈

= ∑Z

I , n∀ ∈Z ; (3.25)

( )2x x g∗ ≡ ↑ ∗H ⇔ ( ) 2[ ] [ ]n kk

x n g x k∗−

∈

= ∑Z

H , n∀ ∈Z . (3.26)

Ecuaţiile de analiză şi sinteză (3.23) şi (3.24) constituie nucleul Algoritmului lui Mallat (AM). Operatorii liniari şi adjuncţii lor verifică unele proprietăţi remarcabile (echivalente cu normalizarea (3.12) şi condiţiile Nyquist[2] (3.13)):


37

∗ ∗≡ ≡II HH J & ∗ ∗≡ ≡IH HI P , (3.27)

unde J este operatorul de identitate şi P este operatorul nul.

Mai mult, ecuaţia de sinteză (3.24) este verificată graţie următoarei proprietăţi de reconstrucţie perfectă:

∗ ∗+ ≡I I H H J , (3.28)

ca în Figura 3.3.

Analiză

↓2

x

∗g

↓2 ∗h xH

xG

+ Sinteză

↑2 ∗g

↑2 ∗h

x

H!

I!

H+

I+

~

~

Figura 3.3. Proprietatea de reconstrucţie perfectă a undinelor ortogonale.

Această figură ilustrează o caracteristică suplimentară interesantă: AM poate fi implementat utilizînd bancuri de filtre oglindite în cuadratură (adică de tip QMF) [VaPP93]. Analiza bancurilor de tip QMF este unic asociată unui arbore binar, unde nodurile interioare au cîte 2 urmaşi, corespunzători operatorilor I şi H . Este binecunoscut faptul că bancurile de tip QMF realizează o segmentare unică în sub-benzi de frecvenţă. De exemplu, în Figura 3.3, Hx este un semnal de frecvenţă joasă, iar Gx este un semnal de

frecvenţă înaltă. Astfel, ramura de analiză a Algoritmului lui Mallat corespunde unei configuraţii în frecvenţă unde doar sub-benzile de joasă frecvenţă sunt divizate în 2 părţi, ca în Figura 3.4.

π π/2

ω frecvenţă

înaltă 0 (0,0)

2

1 (1,1)

(1,0)

Spectru

0

4

3 (2,1)

(2,0) im im+1+1

im+1 (m+1,1)

(m+1,0) (m,0)

frecvenţă joasă

. . .

. . . iM-1 iM+1

iM (M,1)

(M,0) (M-1,0)

π/4 ... 2-Mπ

2 4 ... iM+1 iM

Figura 3.4. Corespondenţa timp-frecvenţă în Algoritmul lui Mallat.


38

Rafinarea în sub-benzi de frecvenţă înseamnă creşterea rezoluţiei în frecvenţă, dar pe seama descreşterii rezoluţiei în timp. Dacă şi sub-benzile de frecvenţă medie sau înaltă trebuie rafinate, structura multi-rezoluţie trebuie generalizată. Din fericire, în [CoWi92] a fost demonstrat că oricare din subspaţiile mW poate fi divizat în două subspaţii ortogonale.

De această dată, rolul undinei tată este jucat de către undina ,0mψ . Iterînd această

poprietate, rezultă că orice subspaţiu, care face parte în mod curent din structura multi-rezoluţie, poate fi de asemenea rafinat. Pentru a descrie o structură multi-rezoluţie generalizată, se porneşte de la un arbore binar, unde fiecare nod (nu numai cele corespunzătoare sub-benzilor de joasa frecvenţă) poate fi expandat. Nodurile sunt indexate ca în Figura 3.4, atît după o etichetă ( , )mm p ,

unde 0,m M∈ este adîncimea (nivelul) şi 0,2 1mmp ∈ − este azimutul în cadrul

arborelui, cît şi după un singur index 2 1mm mi p= + − . Arborele corespunde unei

segmentări unice în frecvenţă, ca în Figura 3.5. Tot unic asociate acestuia sunt şi bancul de tip QMF sau structura multi-rezoluţie.

π π/2

ω

frecvenţă înaltă

0 (0,0)

2

1

(1,1)

(1,0)

Spectru

0 frecvenţă

joasă

π/4 2-4π

6

15

15 (4,0)

3 (2,0)

4 (2,1)

7 (3,0) 16

(4,1) 8

(3,1) 9

(3,2) 10 (3,3)

21 (4,6)

22 (4,7)

23 (4,8)

24 (4,9)

12 (3,5)

6 (2,3)

5 (2,2) 11 (3,4)

frec

venţă

med

ie

3π/4

12 8

22 21 23 24

9

16

Figura 3.5. Corespondenţa generalizată timp-frecvenţă.

Se consideră că nodul ( , )mm p furnizează coeficienţii undină corespunzători proiecţiei

semnalului original pe subspaţiul , mm pS , generat de familia de undine , ,mm p n n∈ψ

Z. Familia

este de fapt o bază ortogonală, referită de asemenea, ca pachet de undine. Pachetul de undine generic, , ,0mm pψ , poate fi generat prin utilizarea EDL sau EDL⊥, depinzînd de

paritatea azimutului:

, ,0 1, / 2 ,0( ) 2 (2 )m mm p n m p

n

t t n− ⎢ ⎥⎣ ⎦∈

ψ = γ ψ −∑Z

, t∀ ∈R , (3.29)

unde hγ ≡ dacă mp este par, sau gγ ≡ , altfel. Evident, ecuaţia recursivă (3.29)


39

porneşte de la 0,0,0ψ ≡ φ şi continuă cu 1,0,0 1,0ψ ≡ φ , 1,1,0 1,0ψ ≡ ψ . Celelalte pachete de

undine , ,mm p n n∈ψ

Z sunt doar versiuni decalate ale lui , ,0mm pψ .

Structura multi-rezoluţie produsă de arborele binar poate fi exprimată astfel:

0 ,( , ) m pm p ∈ ⊗= ⊕

M PV S , (3.30)

unde ⊗M P este produsul direct al mulţimilor finite care includ toate nivelurile de adîncime şi azimuturile frunzelor arborelui (care sunt noduri ale frontierei arborelui). În consecinţă, reprezentarea asociată semnalului f este următoarea:

0 , , , ,( , )

m p n m p nm p n

f c∈ ⊗ ∈

≡ ψ∑ ∑ZM P

, (3.31)

unde 0f este proiecţia lui f pe 0V . Coeficienţii undină sunt calculaţi natural ca mai jos:

, , , ,,m p n m p nc f= ψ , ( , )m p∀ ∈ ⊗M P , n∀ ∈Z . (3.32)

Interesant, coeficienţii undină pot fi, de asemenea, calculaţi recursiv, ca în cazul Algoritmului lui Mallat (vezi ecuaţiile de analiză şi sinteză (3.23) şi (3.24)):

1,2 ,m mm p m pc c+ ≡ I & 1,2 1 ,m mm p m pc c+ + ≡ H , (3.33)

, 1,2 1,2 1m m mm p m p m pc c c∗ ∗+ + +≡ +I H , (3.34)

pentru orice 0, 1m M∈ − şi 0,2 1mmp ∈ − . Implementarea ecuaţiilor (3.33) şi (3.34)

poate fi realizată tot prin intermediul bancurilor QMF, fapt care închide cercul. Evident, subspaţiul U este identificat cu 0V şi Wy cu 0y . Proiecţia serie de timp pe 0V

(i.e. 0y ) este calculată uşor ca în prima identitate din (3.19), prin:

( ) ( )0, 0,0, 0,0,1

,yNdef def

n n n k kk

c c y y t t n=

= = φ = φ −∑ , n∀ ∈Z . (3.35)

Numărul coeficienţilor undină (3.35) este totuşi finit, deoarece undina tată are suport compact.

3.3. Alegerea pachetelor de undine optimale prin minimizarea entropiei

Odată ce cadrul structurii multi-rezoluţie a fost stabilit (prin specificarea perechii de undine φ şi ψ ), singura problemă rămasă este alegerea unei colecţii adecvate de pachete de undine. Pentru a rezolva această problemă, trebuie utilizată o măsură a informaţiei. Astfel, arborele de analiză va fi construit adaptiv, depinzînd de caracteristicile principale ale spectrului datelor. O măsura introdusă în [ShCE48] de Claude Shannon este entropia semnalului. În cazul unui semnal discret determinist x , entropia este definită astfel:

( ) ( )2

| [ ] | | [ ] |( ) logn

x n x nxx x∈

= −∑ E EZH , (3.36)

unde:

( ) 2| [ ] |def

n

x x n∈

= ∑Z

E , (3.37)

este energia semnalului. Entropia (3.36) cuantifică numărul mediu de biţi necesari codificării unui eşantion al semnalului. De asemenea, entropia exprimă atît redundanţa


40

semnalului cît şi ordinea intrinsecă. Cu cît entropia este mai mică, cu atît semnalul este mai puţin redundant şi mai ordonat. Redundanţa este o caracteristică importantă pentru performanţele compresiei de date. De regulă, semnalele puternic redundante sunt comprimate cu o rată mai mare decît cele slab redundante. Totuşi, în cazul analizei bazate pe undine, redundanţa slabă permite informaţiei semnalului să fie concentrată într-un număr mic de coeficienţi, datorită ordinii intrinseci mari a mulţimii lor. Entropia poate fi evaluată pentru semnalul rezultat din concatenarea coeficienţilor undină care corespund frontierei arborelui binar curent. Se pleacă de la entropia datelor originale:

( ) ( ) ( )0,0, 0,0,

0,0 20,0 0,0

| | | |logn n

n

c cc

c c∈

= −∑E EZH , (4.38)

unde suma este finită. Mai departe, se calculează entropia semnalului concatenat

1,0 1,1c c c⎡ ⎤= ⎣ ⎦ :

( ) ( ) ( ) ( ) ( )1,0, 1,0, 1,1, 1,1,

2 2

| | | | | | | |log logn n n n

n n

c c c cc

c c c c∈ ∈

= − −∑ ∑Z ZE E E E

H . (3.39)

Se observă că ( )1,0 1,1c c⎡ ⎤⎣ ⎦H nu este aditivă, adică nu este nepărat egală cu

( ) ( )1,0 1,1c c+H H .

Deoarece analiza se concentrează asupra a două sub-benzi de frecvenţă, entropia (3.39) este cel mult egală cu entropia (3.38). Mai departe, prin expandarea nodurilor (1,0)

şi/sau (1,1) trebuie comparate trei semnale în termeni de entropie: 2,0 2,1 1,1c c c⎡ ⎤⎣ ⎦ ,

1,0 2,2 2,3c c c⎡ ⎤⎣ ⎦ şi 2,0 2,1 2,2 2,3c c c c⎡ ⎤⎣ ⎦ . Doar configuraţia cu entropie minimă trebuie

selectată din cele trei menţionate. Pe măsură ce expandarea arborelui avansează, din ce în ce mai multe semnale trebuie comparate între ele. De fapt, numărul de posibilităţi creşte exponenţial. Astfel, o căutare exhaustivă a arborelui de entropie minimă devine ineficientă chiar pentru un nivel mic de adîncime. De aceea, problema selectării bazei de undine de entropie minimă este echivalentă cu căutarea optimului în cadrul unui arbore în care se asociază costuri arcelor. O astfel de problemă poate fi rezolvată prin intermediul unei tehnici care provine din domeniul Inteligenţei Artificiale [RuNo95]. O tehnică rapidă numită IDA* (Iterative Deepening Approach Star) este descrisă succinct în continuare. Se consideră un arbore cu noduri etichetate după indici n∈N , unde rădăcina are indexul 0 . Un drum de la nodul n către părintele său p este notat cu n p . Tranziţiile între noduri şi copiii lor direcţi sunt penalizate cu un cost. Costul total al drumului 0 n este notat cu [ ]nh , unde h este o aplicaţie numită euristică. Fundamental, euristica poate produce două tipuri de costuri:

a. realizate, [ ]nh , atunci cînd drumul 0 n a fost efectiv expandat;

b. estimate, [ ]nh , pe drumul 0 n , unde p este o frunză, cînd nodul n nu a fost încă expandat.

Practic, [ ]nh este o predicţie a preţului plătit dacă nodul n ar fi expandat pe calea 0 n . Dacă prediciţia nu se poate realiza, euristica estimată primeşte valoarea zero.

Costul total al nodului n este [ ] [ ] [ ]n n n= +H h h şi nu poate depăşi valoarea adevărată,

dar necunoscută ∗H . De aici provine simbolul stea (∗) asociat numelui IDA. Totuşi, H trebuie să fie, de asemenea, crescătoare:

RAPORT DE CERCETARE [AAMMCCSSIITT..UUPPBB--PP55..111177--22000077..IIIIII//DDSS..JJCC..CCPP..AASS--0099..22000099] <28-Sep-09>

41

[ ] [ ] [ ] [ ] [ ] [ ]n n n p p p= + ≤ = +H h h H h h , (3.40)

unde p este un descendent al nodului n . În acest context, problema este de găsi un drum de la rădăcină către o frunză (nod) cu cost global minim. Pentru a căuta drmul optim, strategia IDA* se bazează pe schema ilustrată în Figura 3.6.

n

Zona explorată

Zonă ne-explorată

[ ] [ ] [ ]n n n= +H h h

[ ]nh

nod curent

Următorul nod curent

p

Orizont de predicţie

[ ]nh

Figura 3.6. Strategia de căutare din cadrul procedurii IDA*.

Ea constă în următorii paşi, în ceea ce priveşte nodul curent n : Cît timp nu sunt îndeplinite unele condiţii referitoare la euristica nodului curent

[ ]nH :

1. Expandează oricare nod m al frontierei arborelui curent cu [ ] [ ]m n≤H H

(incluzînd nodul n ), pînă la primul descendent p pentru care [ ] [ ]p n>H H . 2. Frontiera noului arbore fiind astfel generată, nodul următor al căii optime este unul

de pe frontiera cu cost minim. Procedura poate fi oprită cu ajutorul unor condiţii variate. Iată cîteva dintre acestea, destul de simple: 0[ ]n ≥H H (cu 0H setată a priori); n a atins o adîncime maximă;

[ ]nH se incrementează cu mai puţin de 0ε > comparativ cu valoarea euristicii anterioare, etc. Pot fi considerate, de asemenea, combinaţii între aceste condiţii. În Figura 4.6, nodurile arborelui au fost grupate în două zone: explorată (incluzînd doar nodurile cu euristica estimată) şi ne-explorată (care se referă la noduri pentru care euristica nu a fost încă estimată). Pentru uşurinţa înţelegerii, zonele sunt reprezentate circular. Raza zonei expandate (care devine astfel un disc) este egală cu [ ]nH – valoarea minimă a euristicei pentru toate nodurile incluse în acea zonă. Trecerea la nivelul următor impune ca toate nodurile care au euristica estimată (cel mult) egală cu raza să fie expandate pînă cînd euristica urmaşilor (noile frunze ale arborelui) devine superioară. Raza primeşte după aceea valoarea euristicei minime a noilor frunze ale arborelui. Dacă


42

raza creşte semnificativ, de regulă, procedura se opreşte. Astfel, procedura IDA* se bazează pe mecanismul de curăţare a arborelui de ramurile inutile (cunoscut sub denumirea de pruning în limba engleză), mecanism care permite saltul peste expandarea unor noduri. În cazul bancurilor QMF şi a euristicii entropice, căutarea unei configuraţii de entropie minimă a arborelui binar asociat trebuie adaptată la contextul procedurii IDA*. Astfel, căutarea este realizată în cadrul unui meta-arbore definit aşa cum sugerează Figura 3.7.

••• ••• ••• ••• •••

0

[1 2]

[3 4 2] [1 5 6]

[7 8 4 2] [3 9 10 2] [3 4 5 6] [1 11 12 6] [1 5 13 14]

Figura 3.7. Meta-arborele utilizat pentru optimizarea unui banc QMF pe ramura de analiză.

Meta-arborele este construit după următoarele reguli: a. se asociază meta-noduri formei (adică frontierei) arborelui binar; b. fiecare meta-nod este generat prin expandarea unui nod din arborele binar pînă la

urmaşii săi direcţi; c. fiecare meta-nod primeşte o etichetă definită de setul de indici asociaţi frunzelor

arborelui binar; d. costul unei tranziţii de la un meta-nod la unul dintre copiii săi este entropia

coeficienţilor undină care formează frontiera bancului QMF asociat meta-copilului; e. fiecărui meta-nod i se asociază o valoare euristică egală cu suma costurilor

tranziţiilor pe calea de la meta-rădăcină la meta-nod; f. euristica estimată este mereu nulă.

Astfel, euristica meta-nodului, ca sumă de entropii, este o aplicaţie crescătoare, conform restricţiei impuse de strategia IDA*. De exemplu:

[ ]( ) [ ]( ) [ ]( )1 2 3 4 2 3 9 10 2[3 9 10 2] c c c c c c c c c= + +H H H H , (3.41)

unde: ,m mi m pc c≡ , 2log ( 1)mm i= +⎢ ⎥⎣ ⎦ şi 2 1mm mp i= − + . Procedura IDA* este iniţiată să

ruleze în cadrul meta-arborelui astfel construit. Rezultatul este un meta-nod cu o euristică entropică minimală, care returnează structura optimală a arborelui QMF, ⊗M P (corespunzătoare frontierei acestuia).


43

3.4. Modelul de predicţie bazat pe undine ortogonale

După ce forma optimală a arborelui binar a fost selectată, prima versiune a modelului determinist al seriei de timp Wy este exprimat ca în ecuaţia (3.31). Evident, suma

interioară din (3.31) este finită, deoarece şi seria de timp şi răspunsurile la impuls ale QMF au lungime finită. Forma finală a lui Wy este obţinută doar după înlăturarea coeficienţilor undină slabi din reprezentarea (3.31). Există cîteva criterii care stabilesc care coeficienţi sunt slabi şi care nu. De exemplu, pentru orice ( , )m p ∈ ⊗M P , se poate obţine media ,m pα şi varianţa

2,m pσ a secvenţei ,m pc . Atunci, toţi coeficienţii undină inferiori lui , ,m p m pα −µσ (unde nivelul

de mascare 0µ ≥ este stabilit a priori) sunt consideraţi slabi şi trebuie eliminaţi. (De regulă, 3µ = , în cazul în care coeficienţii sunt normal distribuiţi.) Un alt criteriu este pur energetic. Pentru orice ( , )m p ∈ ⊗M P , toţi coeficienţii cu amplitudini mai mici decît un

nivel de mascare [0,1)µ∈ aplicat amplitudinii maxime a coeficienţilor sunt eliminaţi. În orice caz, modelul determinist al seriei de timp este:

,

, , , ,( , )

( ) ( )m p

W m p n m p nm p n

y t c tµ∈ ⊗ ∈

= ψ∑ ∑M P N

, t∀ ∈R , (3.42)

unde ,m pµN este mulţimea finită de indici de translatare temporală rezultată după

eliminarea coeficienţilor slabi din secvenţa ,m pc , prin utilizarea nivelului de mascare µ .

Păstrarea doar a coeficienţilor undină puternici conduce la o compresie de date (dacă ei ar trebui transmişi pe un canal de comunicaţie). Compresia ar putea fi efectuată pe seama alterării modelului. Simulările au arătat totuşi că eliminarea coeficienţilor slabi poate îmbunătăţi modelul de predicţie global. Acest fenomen este explicat prin faptul că modelul bazat pe undine a conţinut prea mult zgomot, codificat de către coeficienţii slabi. După cum s-a precizat, există doar o limită fină între componenta utilă din date şi perturbaţiile care le corup. Dacă modelul global a fost îmbunătăţit prin eliminarea unor coeficienţi undină, înseamnă că separarea dintre cele două componente a devenit mai precisă.

3.5. Selecţia unui predictor optimal prin maximizarea calităţii predicţiei

Plecînd de la o serie de timp dată, pot fi construiţi mai mulţi predictori, prin varierea următorilor parametri:

• N – parametrul de suport al undinelor; • φ – undina tată (de fapt, indexul de rezoluţie al undinei, notat cu L∈N );

• criteriul de stop al procedurii IDA* (de regulă, pragul euristic 0ε > ); • nivelul de mascare al coeficienţilor undină (notat cu [0,1)µ∈ );

• na , nc –indicii structurali ai modelului ARMA ; • nα – gradul polinomului al modelului aproximant AR.

Parametrii ε , µ şi nα sunt mai puţin importanţi decît ceilalţi. Exemple tipice de alegere sunt următoarele:

710−ε = ; 0µ = (la început); min 3( ), yn na nc Nα = + . (3.43)

După ce a fost selectat un predictor cu ajutorul criteriului PQ, prin varierea celorlalţi parametri, nivelul de mascare µ poate fi incrementat, pentru a îndepărta coeficienţii undină paraziţi. Limita superioară a lui µ depinde de degradarea acceptată a lui PQ.


44

Totuşi, după cum s-a menţionat deja, prin creşterea nivelului de mascare, predictorul îşi poate îmbunătăţi performanţele. Se consideră acum ceilalţi parametri enumeraţi mai sus. De regulă, parametrul de suport al undinei, N , variază între 2 şi 25. Acesta conduce la un filtru cu un număr de 4 pînă la 50 valori ale răspunsului la impuls. Depinzînd de natura seriei de timp, nu este obligatoriu ca filtrele cu memorie lungă (adică avînd răspuns cauzal la impuls de lungime mare) să fie mai performante decît cele cu memorie scurtă, în termeni de PQ. De regulă, datele fractale necesită undine fractale, ceea ce conduce la valori mici ale lui N . Dacă 1N = , se obţin undinele Haar [DaI88], [StSt07]. Simulările au demonstrat că acele undine nu au putut conduce la valori mari ale PQ şi de aceea ele au fost eliminate. Toate undinele ortonormale cu suport compact din clasa Daubechies cu

25N ≥ s-au comportat aparent similar, în special datorită faptului că indexul lor de regularitate Hölder (estimat în [DaI88] la o valoare de aproximativ 0.1936 N× ) este superior celui al seriei de timp. Cu alte cuvinte, undinele cu 25N ≥ sunt prea netede pentru seriile de timp prelucrate şi nu pot codifica caracteristicile lor fractale. Evident, există şi aici o demarcaţie fină între comportamentul fractal determinist al seriei de timp şi perturbaţiile stocastice. Ori, este de dorit ca modelul bazat pe undine să fie capabil să extragă natura fractală intrinsecă a seriei de timp, cu minim de zgomot posibil, pentru a efectua o extrapolare precisă. De aceea, undinele prea netede trebuie eliminate din analiză. Pentru un N dat, undina tată φ este construită cu o rezoluţie finită utilizînd algoritmul

Daubechies-deRham [DaI88], [StSt07]. Conform acestui algoritm, undina poate fi evaluată

cu precizie mare la orice perioadă de eşantionare de tipul 2 L− , unde L∈N . Dacă 0L = , undina este evaluată la momente de timp discrete. Pentru 1L = , rezoluţia creşte la jumătăţi de întregi, după aceea, pentru 2L = , se obţin valorile la sfert de întregi, etc. În mod normal, indicele de rezoluţie L trebuie setat conform ratei de eşantionare a seriei de timp, dacă este cunoscută. Undina tată este necesară pentru a proiecta seria de timp pe subspaţiul 0V , cu ajutorul

ecuaţiei (3.35). Simulările au dovedit că doar setarea 0L = (adică rata de eşantionare unitară) poate să nu conducă la predictori de calitate înaltă. Deoarece axa timpului nu are o unitate impusă în cazul undinelor, cea mai potrivită versiune eşantionată a undinei tată poate fi găsită pentru 0L > . De aceea, indicele L al rezoluţiei trebuie să varieze, pentru a îl găsi pe cel mai bun (în sensul maximizării lui PQ). Deoarece 2N ≥ (adică indicele de regularitate Hölder este cel puţin 0.3872 ) caracteristicile fractale globale ale undinei sunt obţinute cînd L atinge limita superioară egală cu 6 . Peste această limită, noile eşantioane nu aduc nici o informaţie nouă privind discontinuităţile microscopice la nivelul derivatelor undinei, de aceea, trebuie evitată supra-eşantionarea. În cazul unei eşantionări neuniforme, unele (sau toate) momentele de timp ale seriei de

timp pot fi diferite de multiplii întregi ai lui 2 L− (adică de momentele de eşantionare ale undinei tată). De aceea, proiecţia seriei de timp pe 0V poate fi doar aproximată prin

regăsirea celor mai apropiate eşantioane ale undinei de eşantioanele sale, pentru o anumită rezoluţie. Predicţia cu undine poate fi totuşi realizată, indiferent de tipul de eşantionare. Este suficient să se asocieze indici corespunzători datelor numerice (seria de timp şi undina tată), adică să se considere cazul de eşantionare uniform, prin simpla enumerare a datelor. După aceasta, se alege eşantionarea uniformă pentru a simplifica abordarea şi a aplica avantajos algoritmul Daubechies-deRham. În acest caz, perioada de eşantionare


45

este fixată la 2 L− , utilizînd rezoluţia undinei tată. Astfel, ecuaţia (3.35) trebuie rescrisă ca mai jos:

( )0,0, 0,0, 0,0,1 1

, [ ] 2 ( ) [ ] [ ]y yN Ndef

L L Ln n n

k k

c y y k k n y k k−

= =

= φ = φ − = φ∑ ∑ , n∀ ∈Z , (3.44)

unde:

( ) 0,0, [ ] 2 ( ) ,def

L Ln

n

k k n k−

∈

φ = φ − ∀ ∈Z

Z (3.45)

este familia de undine tată discretizate, translatate. Întrebarea care se pune în cazul eşantionării undinei tată este următoarea: are familia (3.45) calitatea de bază ortonormală a subspaţiului 0V (în contextul semnalelor discrete

stabile, de energie finită)? Pentru a da un răspuns corect, ar trebui dezvoltat un raţionament complicat, bazat pe rezultatele obţinute în special de Mallat [MaS99], Daubechies [DaI90] şi Meyer [MeY87]. Dezvoltarea unei teorii care a fost deja abordată în trecut nu constituie scopul acestui raport de cercetare. În schimb am preferat un răspuns simplu, direct şi intuitiv:

a. Dacă undina este eşantionată la momente de timp întregi ( 0L = ), atunci familia (3.45) este o bază ortogonală a lui 0V . Pentru a obţine o bază ortonormală, este

necesară normalizarea cu 00,0,0φ .

b. Dacă undina este eşantionată cu 0L > , atunci familia (3.45) este un cordaj dens (tight frame) al lui 0V .

Conceptul de cordaj dens a fost probabil introdus în contextul undinelor de către Daubechies [DaI90] şi dezvoltat mai departe de W.M. Lawton în [LaWM90]. (Mai tîrziu, Daubechies şi colaboratorii ei au introdus de asemenea numele de cordeline (framelets) pentru cordajele dense ale undinelor [DHRS03].) Prin definiţie, o familie de vectori n n

v∈Z

este un cordaj dens (tight frame) dacă generează un spaţiu Hilbert H şi orice element u∈H poate fi extins astfel:

1 , n n

n

u u v vA ∈

= ∑Z

, (3.46)

unde A ∗∈R este constanta cordajului (independentă de u ). (Alte definiţii pot fi de asemenea enunţate, dar toate sunt echivalente cu (3.46).) Reprezentarea (3.46) este foarte similară cu cea unui vector într-o bază ortonormală. Cordajele dense sunt baze cu redundanţă, deoarece vectorii lor nu sunt lineari independenţi. Din acest motiv, ele se mai numesc şi supra-baze. Din fericire, în cazul undinelor discretizate, deşi necunoscută, constanta cordajului este invariantă la variaţia scalei de reprezentare. În consecinţă, este suficient să se determine constanta cordajului pentru reprezentarea seriei de timp cu ajutorul cadrul familiei (3.45):

0,0, 0,0,1 L

n nn

y cA ∈

≡ φ∑Z

. (3.47)

Suma din (3.47) este totuşi finită, deoarece atît seria de timp cît şi undina tată discretizată sunt secvenţe de lungime finită.


46

Două abordări pot conduce la estimarea valorii lui A . Deoarece aceasta nu depinde de seria de timp, ar trebui adoptat un raţionament riguros, bazat pe proprietăţile undinei tată. Dar această abordare este mai mult teoretică şi greoaie, astfel că va fi evitată în acest context. O abordare mai rapidă de estimare a lui A se bazează pe Metoda celor mai mici pătrate (MCMMP), care este mai practică. Conform MCMMP, trebuie minimizată parabola:

2

0,0, 0,0,1 1[ ] [ ]

defL

p pn p

y n c nA A∈ ∈

⎛ ⎞⎛ ⎞ = − φ⎜ ⎟⎜ ⎟⎝ ⎠ ⎝ ⎠

∑ ∑Z Z

V . (3.48)

După cîteva calcule algebrice, unica rădăcină a primei derivate a parabolei (ca funcţie de 1/ A şi nu de A ) poate fi exprimată astfel:

0,0, 0,0,

2

0,0, 0,0,

[ ] [ ]1

[ ]

Lp p

n p

Lp p

n p

c n y n

Ac n

∈ ∈

∈ ∈

φ=

⎛ ⎞φ⎜ ⎟

⎝ ⎠

∑∑

∑ ∑

Z Z

Z Z

. (3.49)

Deşi constanta cordajului pare să depindă de seria de timp analizată, simulările pe cîteva serii de timp de provenienţă diferită au arătat că variaţia este nesemnificativă, fiind cauzată în special de erorile numerice. De altfel, utilizarea MCMMP nu poate conduce decît la o estimaţie a constantei cordajului, care moşteneşte o parte din zgomotul seriei de timp. Aceasta este proprietatea care crează dependenţa dintre estimaţie şi datele măsurate. Se observă că ecuaţia (3.49) poate fi utilizată chiar şi în cazul în care undina tată este eşantionată la momente întregi, pentru a creşte precizia modelului. Revenind la problema abordată în cadrul acestui paragraf, construcţia predictorului optimal se poate realiza printr-o căutare exhaustivă în mulţimea definită de plajele de variaţie ale parametrilor principali. De notat că predictorul se adaptează la datele măsurate, deoarece bancul de QMF din implementarea transformării undină este determinat prin minimizarea entropiei din frunzele acestuia. Intervenţia Algoritmului IDA* reduce sensibil durata de căutare, fapt care permite evaluarea lui PQ pentru toţi predictorii.

3.6. Algoritmul FORWAVER

Descrierea din paragrafele anterioare ale acestei secţiuni este sumarizată în Algoritmul 3.1, numit şi (predictor) FORWAVER (forecasting with orthogonal wavelets). Undinele utilizate în acest algoritm sunt ortogonale. În viitor, se preconizează a fi proiectat şi implementat un algoritm alternativ, care utilizează undine biortogonale [CDF92]. Acestea pot genera în mod natural cordaje dense de constantă unitară, ceea ce poate conduce la o uşoară creştere a preciziei de predicţie. Paşii principali ai Algoritmului 3.1 sunt discutaţi în detaliu în următorul paragraf. Aici ne concentrăm doar asupra etapei 2, deoarece este invocat predictorul clasic PARMA. Acest predictor a fost integrat din două motive. În primul rînd, pentru a stabili o referinţă în raport cu care se pot compara valorile predictate pe bază de undine. În al doilea rînd, deoarece extensiile oferite de undinele ortogonale sunt extrem de adaptive la semnalul analizat. Acestea înseamnă că o astfel de extindere va încerca să urmărească nu numai datele măsurate, ci şi valorile nule în afara orizontului de măsură. Astfel, fără a avea vreo informaţie despre valorile seriei de timp pe orizontul de măsură, modelul bazat pe undine,

Wy , va furniză valori extrapolate extrem de mici sau chiar nule. De aceea, sunt absolut necesare unele date suplimentare, chiar şi grosier predictate.


Algoritmul 3.1. FORWAVER – un algoritm de predicţie a seriilor de timp nestaţionare, folosind pachete de undine ortogonale, cu suport compact.

1

23

4

Date de intrare: o serie de timp y de lungime finită yN ;

momentele de eşantionare 1, yn n N

t∈

sau perioada de eşantionare sT (implicit,

n st nT= , 1, yn N∀ ∈ şi/sau 1sT = ); lungimea orizontului de predicţie, K (cu yK N<< ); de regulă, 7K ≤ ;

momentele de predicţie 1,yN k k K

t +∈

(implicit, ( )yN k y st N k T+ = + , 1,k K∀ ∈ );

parametri de configurare: valoarea maximă a parametrului suport al undinei max \1N ∗∈N (implicit,

max 25N = ); valoarea maximă a indicelui de rezoluţie maxL ∈N (implicit, max 6L = ); pragul euristic 0ε > (implicit, 710−ε = ); valoarea minimă a nivelului de mascare [0,1)µ∈ (implicit, 0µ = ); valoarea maximă a indicilor structurali ARMA ,NA NC∈N (implicit,

25NA NC= = ); expresia gradului nα corespunzător împărţirii infinte între polinoamele AR şi MA (implicit, min 3( ), yn na nc Nα = + ).

. Prelucrarea preliminară a datelor.

1.1. Se ordonează datele: ( )[ ] ny n y t↔ , 1, yn N∀ ∈ .

1.2. Se calculează media datelor, y şi deviaţia standard yσ .

1.3. Se centrează datele pe medie: y y y← − .

. Se construieşte predictorul clasic PARMAy , prin invocarea Algoritmului PARMA.

. Se efectuează o predicţie grosieră a datelor utilizînd modelul clasic. Se notează

valorile predictate cu PARMA 1,ˆ y k Ky N k

∈⎡ ⎤+⎣ ⎦ .

. Pentru orice max2,N N∈ :

4.1. Se generează răspunsurile la impuls h şi g ale QMF (fiecare de lungime 2N ),utilizînd Algoritmul lui Daubechies.

4.2. Pentru orice max0,L L∈ , execută:

4.2.1. Se evaluează undina tată 0,0,0Lφ (corespunzătoare indicelui de rezoluţie

L ) utilizînd Algoritmul Daubechies-deRham.

4.2.2. Se proiectează datele extinse PARMA1, 1,ˆ[ ]

y yn N k Ky n y N k

∈ ∈⎡ ⎤∪ +⎣ ⎦ pe

subspaţiul 0V , prin intermediul familiei de undine discretizate 0,0,L

n n∈φ

Z,

adică se calculează coeficienţii din rădăcina arborelui binar 0,0,n nc

∈Z,

utilizînd ecuaţiile (3.44)-(3.45).

47


Algoritmul 3.1. FORWAVER – un algoritm de predicţie a seriilor de timp ... (continuare)

4.2.3.

4.2.4.

4.2.5.

4.2.6.

4.2.7.

4.2.8.

Se estimează constanta cordajului dens A , utilizînd MCMMP, conformrelaţiei (3.49). Se determină bancul de filtre optimal utilizînd prcedura IDA* cu pragul

euristic ε . Intrarea bancului de filtre este secvenţa 0,0,n nc

∈Z şi ieşirea

este o colecţie de coeficienţi undină corespunzători frunzelor sale.Mulţimea de etichete ale frunzelor este ⊗M P , iar indicii coeficienţilor

undină sunt grupaţi în seturi finite 0, ( , )m p m p ∈ ⊗M P

N .

Dacă 0µ > , se elimină coeficienţii undină paraziţi (slabi) corespunzatori. Coeficienţii undină aparţin atunci mulţimii finite restrînse

, ( , )m p m p

µ

∈ ⊗M PN .

Se construieşte modelul bazat pe undine Wy , pe orizontul de măsură şi predicţie (extrapolare), cu ajutorul relaţiei (3.42):

,

, , , ,( , )

[ ] [ ]m p

LW m p n m p n

m p n

y k c kµ∈ ⊗ ∈

= ψ∑ ∑M P N

, 1, yk N K∀ ∈ + ,

unde , ,Lm p nψ sunt undinele evaluate plecînd de la undina tată 0,0,0

Lφ ,

utilizînd bancul de filtre. Evident, graţie ordonării datelor, valoarea

extrapolată [ ]Wy k corespunde ( )W ky t , pentru orice 1, yk N K∈ + .

Se extrage zgomotul colorat pe orizontul de măsură restrîns:

[ ] [ ] [ ]K Wv n y n y n= − , 1, yn N K∀ ∈ − .

Pentru 0,na NA∈ şi 0,nc NC∈ :

a. Dacă 0na = şi 0nc > , se estimează modelul MA al zgomotului colorat Kv , prin Metoda Wiener-Hopf.

b. Dacă 0na > şi 0nc = , se estimează modelul AR al zgomotuluicolorat Kv , prin MCMMP sau Algoritmul Levinson-Durbin.

c. Dacă 0na > şi 0nc > , se estimează modelul ARMA al zgomotului colorat Kv , prin MMEP.

d. Dacă există un model valid al zgomotului colorat (oricare din paşii anteriori pot eşua), se construieşte predictorul clasic stochastic ,ˆV Ky

utilizînd ecuaţiile predictorului PARMA. (În cazul modelelor AR, nu mai este necesară estimarea zgomotului alb.)

e. Se predictează ultimele K date:

,ˆ ˆ[ ] [ ] [ ]K W V Ky n y n y n= + , 1,y yn N K N∀ ∈ − + .

f. Se estimează dispersia erorii de predicţie, 2, 1,

ˆK k k K=

λ , utilizînd

modelul ARMA. (În cazul modelelor MA, doar nc valori ale varianţei predicţiei sunt nenule.)

e. Se evaluează calitatea predicţiei (PQ) pentru ultimele K date,folosind definiţia (A.8).

48


Algoritmul 3.1. FORWAVER 1 – un algoritm de predicţie a seriilor de timp ... (final)

Se poate înţelege acum de ce, la pasul 4.2.2., nu datele măsurate 1,[ ]yn Ny n

∈ sunt

proiectate pe subspaţiul 0V , ci setul extins de date, PARMA1, 1,ˆ[ ]

y yn N k Ky n y N k

∈ ∈⎡ ⎤∪ +⎣ ⎦ ,

unde PARMA 1,ˆ y k Ky N k

∈⎡ ⎤+⎣ ⎦ sunt valori suplimentare produse de predictorul clasic.

Pentru a completa Algoritmul 3.1, în continuare, sunt sumarizaţi Algoritmii Daubechies şi Daubechies-deRham, care au fost invocaţi. Detaliile privind proiectarea acestor algoritmi sunt precizate, de exemplu, în [StSt07] sau [SSP09].

Algoritmul 3.2. Algoritmul lui Daubechies de generare a undinelor ortogonale, cu suport compact.

4.2.9.

4.2.10.

5. Se selectecriteriului P

cît şi perech

6. Se extrage

7. Se estimea nc (ca în p

8. Se construi

9. Se predicte

şi evalueaz

Date de ieş

• mulţime

• varianţe

1

Date de intrare: parametrul de control al duratei undinelor cu suport compact: 2,20N ∈ .

. Iniţializare:

1.1. Se construieşte polinomul caracteristic ( )1

10

CNdef

n nN n

n

P x x−

+ −=

= ∑

(adică se evaluează coeficienţii acestuia). 1.2. Se evaluează rădăcinile polinomului caracteristic: 1, 1n n N

x∈ −

.

1.3. Se iniţializează mulţimile rădăcinilor TZ: = ∅S (reale); = ∅D (complexe).

Se selectează şi memorează indicii structurali 0na şi 0nc corespunzători valorilor maxime ale calităţii predicţiei calculate anterior.

Se păstrează în memorie valoarea maximă a calităţii predicţiei.

ază parametrii N şi L corespunzători maximului tuturor valorilor Q memorate. Acesta este unic asociat atît modelului bazat pe undine Wy

ii de indici structurali ,na nc .

zgomotul colorat pe întregul orizont de măsură: Wv y y= − .

ză modelul ARMA al zgomotului colorat v , pentru indicii structurali na ,aul 4.2.8.).

eşte predictorul stochastic ˆVy utilizînd ecuaţiile predictorului PARMA.

ază seria de timp:

ˆ ˆy W y V yy N k y y N k y N k⎡ ⎤ ⎡ ⎤ ⎡ ⎤+ = + + + +⎣ ⎦ ⎣ ⎦ ⎣ ⎦ , 1,k K∀ ∈ .

ă dispersia erorii de predicţie, 2

1,ˆ

k k K=λ .

ire:

a valorilor predictate ( ) 1,

ˆ ˆyy N k

k Ky N k y t +

∈⎡ ⎤+ ↔⎣ ⎦ ;

le corespunzătoare ale erorii de predicţie 2

1,ˆ

k k K=λ .

49


Algoritmul 3.2. Algoritmul lui Daubechies de generare a undinelor ortogonale, cu suport compact (final).

2

3

1

. Pentru 1, 1n N∈ − , se efectuează următoarele operaţii:

2.1. Se evaluează rădăcinile ecuaţiei: 1 2 4 nz z x−+ = − , notate prin ,1nz şi ,2nz . Evident,

1,2 ,1n nz z−= .

2.2. Dacă rădăcinile ,1nz şi ,2nz sunt reale, ele se adaugă mulţimii S , adică:

1,1 ,1,n nz z−= ∪S S .

2.3. Dacă rădăcinile ,1nz şi ,2nz sunt complexe, ele se adaugă mulţimii D , adică:

1,1 ,1,n nz z−= ∪D D . (Se pot adăuga şi conjugatele lor complexe, caz în care pasul

2.1. nu se va mai efectua pentru ecuaţia 12

4 nz z x

−− −= .)

. Finalizare. Rădăcinile TZ se regăsesc printre elementele mulţimilor 1,2 rn n Nr

∈=S şi

1,2,

cm m m N

z z∈

=D (cu 2 1r cN N N+ = − ).

3.1. Se aleg în manieră pseudo-aleatoare rN rădăcini reale din mulţimea S şi cN

perechi de rădăcini complex conjugate din mulţimea D (cu respectarea

restricţiilor de selecţie): 1, 1,

,k k k

r cn m mk N k Nr z z

∈ ∈∪ .

3.2. Se construieşte TCFD a secvenţei coeficienţilor EDL (pentru ω∈R ):

( ) ( )( )( )( )1 1

e ee1 ee 22 1 1 1

crk kk

k k k

N j jj NNjdef m mnj

k kn m m

z zrC

r z z

− ω − ω− ω− ωω

= =

⎛ ⎞− −⎛ ⎞−⎛ ⎞+ ⎜ ⎟= ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟− − −⎝ ⎠ ⎝ ⎠⎝ ⎠∏ ∏

3.3. Se extrag coeficienţii EDL din expresia anterioară.

Date de ieşire: • secvenţa coeficienţilor EDL: c (în număr par).

Algoritmul 3.3. Algoritmul Daubechies-deRham de rezolvare a EDL finite, cu rezoluţie controlată.

0,2 1n n N∈ −

Date de intrare: parametrul de control al dimensiunii suportului undinelor: 2,20N ∈ sausecvenţa coeficienţilor EDL: 0,2 1n n N

c∈ −

;

pragul minimal de rezoluţie: 2LM = (de regulă, 22 logL N≥ + ).

. Iniţializare: 1.1. Dacă nu este furnizată secvenţa coeficienţilor EDL (adică 0,2 1n n N

c∈ −

), ea se

construieşte cu ajutorul Algoritmului lui Daubechies (Algoritmul 4.2). 1.2. Se construieşte matricea NC a coeficienţilor EDL:

⎡ ⎤

50


51

Algoritmul 3.3. Algoritmul Daubechies-deRham de rezolvare a EDL finite, cu rezoluţie controlată (final).

3.7. Detalii privind implementarea Algoritmului FORWAVER

Pentru a implementa eficient Algoritmul 3.1, trebuie exploatate cîteva proprietăţi. Cele mai importante dintre ele sunt prezentate în cele ce urmează, în ordinea paşilor algoritmului.

3.7.1. Observaţii generale

La etapa 1., pasul 1.1., datele sunt simplu ordonate. Aceasta înseamnă că eşantionarea neuniformă nu este tratată. Principalul motiv este următorul: bancul de filtre nu poate fi

1 0

3 2 1 0

2 3 2 4 2 5 2 6 3 2 1 0

2 1 2 2 2 3 2 4 5 4 3 2

2 1 2 2 7 6 5 4

2 1 2 2 2 3 2 4

2 1 2 2

0 0 0 0 0 0

0 0 0 0

0 0

0 0 0 0

0 0 0 0 0 0

N N N Ndef

N N N NN

N N

N N N N

N N

c c

c c c c

c c c c c c c c

c c c c c c c c

c c c c c c

c c c c

c c

− − − −

− − − −

− −

− − − −

− −

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥=⎢ ⎥⎢ ⎥⎢ ⎥⎢⎢⎢⎢⎢⎣ ⎦

C

⎥⎥⎥⎥⎥

.

1.3. Se determină vectorul propriu normat corespunzător valorii proprii unitare a acestei matrici.

1.4. Se iniţializează indicele de rezoluţie: 1k = . 1.5. Se iniţializează numărul de valori ale undinei: 1, 4( 1)NM N= − (pragul iniţial de

rezoluţie).

2. Cît timp ,k NM M< , se efectuează următoarele operaţii:

2.1. Se determină undina tată cu rezoluţia 2k∼ folosind relaţia:

( ) ( )2 1

11

0

2 2N

k kk n k

n

m c m n−

− − −+

=

φ = φ −∑ , ,0, k Nm M∀ ∈ .

2.2. Se incrementează indicele de rezoluţie: 1k k← + . 2.3. Se reactualizează pragul de rezoluţie: " 1",k k NM ← + .

3. Se corectează indicele de rezoluţie: 1k k← − .

4. Se determină marginile de variaţie 0,N kM şi 1

,N kM .

5. Se determină undina mamă cu rezoluţia 2k∼ folosind relaţia:

( ) ( )1

11 1

2 2

2 ( 1) 2k n kk n k

n N

m c m n− − −+ −

= −

ψ = − φ −∑ , 0 1, ,,k N k Nm M M∀ ∈ .

Date de ieşire: • perechea de undine tată şi mamă , φ ψ determinate cu rezoluţia de

reprezentare 2k∼ .


52

utilizat în cazul eşantionării neuniforme a seriei de timp, pentru a construi modelul bazat pe undine. În acest caz, se păstrează doar ecuaţia de predicţie de mai jos:

( ) ( ) ( ),

, , , ,( , )

ˆ ˆm p

n m p n m p n n V nm p n

y t c t y tµ∈ ⊗ ∈

= ψ +∑ ∑M P N

, 1, yn N K∀ ∈ + . (3.50)

Implementarea acestei ecuaţii necesită, pe de o parte, calcularea coeficienţilor undină cu ajutorul produselor scalare şi, pe de altă parte, estimarea undinelor utilizînd recursiv EDL şi EDL⊥, combinate cu criteriul entropic (3.38). Deşi posibilă, această abordare conduce către o procedură consumatoare de timp şi nu produce o creştere semnificativă a valorilor PQ. Mai mult, modelul ARMA fiind numeric, este invariant la tipul eşantionării. Ultimul pas al etapei 1. constă în centrarea datelor pe media lor. Este bine cunoscut că structura multi-rezoluţie ortogonală include închiderea intersecţiei dintre două spaţii

Lebesque: semnale stabile şi semnale de energie finită (adică 1 2def= ∩H L L , cum s-a

menţionat deja). Evident, semnalele constante nu pot aparţine acestei intersecţii. Însă, orice semnal practic poate fi exprimat ca o sumă între o constantă şi o variaţie staţionară cu medie nulă. Media eliminată este utilizată numai la sfarşit (în etapa 9.), pentru a corecta valorile predictate. Se observă totuşi că centrarea datelor nu este aplicată în cazul predictorulu clasic, deoarece tendinţa polinomială include un coeficient liber, care codifică informaţia despre media semnalului. În bucla principală 4., la pasul 4.1., doar răspunsul la impuls h este generat cu

Algoritmul lui Daubechies, corespunzător valorii curente a lui max2,N N∈ (deoarece

celălalt răspuns la impuls este definit de: 1 2 2 ,1( 1)n

n n n Ng h − ∈ −

= − ). (La fel se procedează

şi în Algoritmul 3.2.). Daubechies a demonstrat că, pentru orice 2N ≥ , pot fi construite mai multe secvenţe h (de lungime 2N ), astfel încît să se verifice condiţiile (3.12) şi (3.13). În realitate, există un grad de libertate în selectarea valorilor lui h . De aceea, în implementarea algorimului Daubechies, parametrul liber este ales (pseudo-)aleator. Rulări succesive pot produce diferite secvenţe h . În consecinţă, trebuie testate mai multe undine tată cu aceeaşi durată. Simulările au demonstrat totuşi că varierea undinei de bază φ în cadrul aceluiaşi suport nu produce variaţii semnificative ale valorilor criteriului PQ, chiar dacă arborele asociat bancului de filtre optimal poate fi modificat. Astfel, orice undină tată cu suport [0,2 1]N − poate fi selectată cu aproximativ aceleaşi perfomanţe. În algoritmul invocat în pasul 4.2.1. al buclei 4.2. (Daubechies-deRham – Algoritmul 3.3) există două tipuri de iniţializări: inconsistentă şi consistentă. Iniţializarea inconsistentă este un impuls unitar poziţionat în mijlocul suportului undinei. Iniţializarea consistentă este furnizată rezolvînd ecuaţia spectrală. Astfel, valorile undinei tată la momente întregi sunt împachetate într-un vector propriu de normă unitară corespunzătoare valorii proprii unitare a unei matrici generate utilizînd valorile lui h (a se consulta [DaLa88a], [DaLa88b], [StSt07] pentru detalii). Procedura implementată pentru Algoritmul 3.1 începe cu iniţializarea consistentă, ceea ce conduce la uşoară scădere a duratei de rulare. La pasul 4.2.2., proiecţia semnalului extins pe subspaţiul 0V poate fi simplu evaluată

transformînd undina tată într-o fereastră glisantă de-a lungul datelor. Astfel, valorile nenule ale coeficienţilor undină (3.44) sunt localizate pe un suport de lungime finită. Lungimea secvenţei de coeficienţi este mai mare decît yN K+ , datorită suportului undinei tată.

Evaluarea permanentă a suporturilor coeficienţilor undină este o operaţie extrem de importantă pentru sincronizarea bancurilor de filtre şi precizia modelului de predicţie. Această operaţie este detaliată la punctul 4.7.2. (care urmează) al paragrafului.


53

Implementarea procedurii IDA* (invocată la pasul 4.2.4.) necesită o reprezentare clară a arborelui binar şi a parametrilor săi. Sunt posibile cîteva abordări, dependente în general de limbajul de programare utilizat pentru implementarea procedurii. Reprezentarea descrisă în cele ce urmează ţine cont de caracteristicile limbajului MATLAB. Astfel, fiecărui meta-nod i se asociază o celulă cu 4 cîmpuri, descrisă mai jos.

• Matricea L de tip 22 L× codifică adîncimea şi azimutul frontierei curente a arborelui

binar, unde 2L ∗∈N este numărul de frunze. Practic, matricea L include mulţimea

curentă M (de valori ale adîncimii frunzelor) pe prima linie şi mulţimea curentă P (de

valori ale azimutului frunzelor) pe a doua linie. Cînd o frunză devine nod intern al

arborelui binar (prin expandare), coloana sa corespunzătoare este eliminată din L şi

la sfîrşit se adaugă două noi coloane (corespunzătoare nodurilor nou expandate –

urmaşii acesteia). Figura 3.8 ilustrează acest principiu.

p m

Pright Mright

Pleft Mleft L

2p m+1

2p+1 m+1

Pright Mright

Pleft Mleft

2p m+1

2p+1 m+1

Figura 3.8. Principiul actualizării matricii informatice a frunzelor binare.

• Matricea C de tip 2 2N L× include toate secvenţele de coeficienţi undină

corespunzători nodurilor matricii L . Secvenţele sunt enumerate pe coloane, începînd cu primul coeficient nenul. Secvenţele scurte sunt completate cu zerouri pînă la lungimea maximă 2N . O astfel de matrice arată ca în Figura 3.9. Este actualizată în

acelaşi mod şi timp cu matricea L .

C

0 0

0 0

0 0

0

Figura 3.9. Configuraţia matricii informatice a coeficienţilor undină.

Secvenţele scurte corespund frunzelor înalte, în timp ce secvenţele lungi sunt asociate frunzelor apropiate de rădăcina arborelui. Evident, există cel puţin două coloane care includ secvenţa cu cea mai mică lungime. Ordinea în care secvenţele sunt aranjate în matricea C este dată de ordinea coloanelor din matricea L . • Matricea S de tip 22 L× conţine limitele suportului. Suportul secvenţei de coeficienţi

undină ,m pc este convenţional reprezentat ca: 0 min max, , ,,

def

m p m p m pN N=N . Limitele inferioare


54

sunt aranjate pe prima linie a matricii S iar limitele superioare pe a doua linie. Evident, matricea S este sincronizată cu matricile L şi C în ceea ce priveşte actualizarea. • Mărimea scalară H memorează entropia totală a căii de la meta-rădăcină la meta-nodul curent (suma entropiilor corespunzătoare tuturor meta-nodurilor de pe cale).

Un vector de celule v este asociat frontierei curente a meta-arborelui. De fiecare dată cînd un meta-nod este expandat (el ar putea avea mai mult de doi meta-urmaşi), celula lui este eliminată din vectorul v şi celulele noilor meta-frunze generate sunt adăugate la sfîrşit (urmînd acelaşi principiu de actualizare a matricii L , ilustrat în Figura 3.8). Raza curentă a zonei explorate este egală cu valoarea totală a entropiei stocate într-una dintre celulele incluse în vectorul meta-frontierei v . De fapt, raza este minimum tuturor meta-entropiilor găsite prin inspectarea celulelor lui v . Meta-nodurile de expandat sunt cele din v , cu entropia totală minimă, adică egală cu raza. Fie , , ,i i i i i=v L C S H meta-nodul de

expandat. Expandarea constă atunci în generarea unui număr de meta-noduri egal cu numărul de coloane incluse în matricea iL . Fiecare nou meta-nod este obţinut prin aplicarea operaţiilor următoare:

a. Se reţine coloana curentă din iL . Dacă adîncimea curentă nu a atins o frontieră maximă, se înlocuieşte valoarea maximă cu etichetele copiilor săi, conform principiului ilustrat în Figura 3.8. Adîncimea maximă a unui arbore binar, yM ,

depinde de lungimea secvenţei de coeficienţi 0,0c . Cu alte cuvinte:

( )max min2 0,0 0,0log 1yM N N⎢ ⎥= − +⎣ ⎦ . (3.51)

b. Se calculează noile secvenţe ale coeficienţilor undină începînd cu coloana curentă din iC , utilizînd blocul elementar al bancului de filtre de analiză, din Figura 4.3.

c. Se evaluează suporturile noilor secvenţe (ca în paragraful următor) şi se extrag limitele lor.

d. Se înlocuieşte coloana curentă din iC cu coloanele noilor secvenţe, după completarea corespunzătoare cu zerouri.

e. Se înlocuieşte coloana curentă din iS cu două noi coloane care conţin limitele suporturilor.

f. Se evaluează entropia noului arbore binar generat şi se adaugă la meta-entropia curentă, iH .

g. Se înlocuieşte meta-entropia curentă iH cu noua entropie.

Pentru a opri procedura IDA*, se utilizează un prag euristic 0ε > . Fie R valoarea razei

chiar înainte de expandarea unui meta-nod şi , , ,j j j j j=v L C S H – noul meta-nod

(după expandare), selectat ca un candidat pentru expandare. Înainte de efectuarea noii expandări, se testează următoarea inegalitate:

j − < εH R

R. (3.52)

Meta-nodul este expandat numai dacă nu se verifică inegalitatea (3.52), adică testul de oprire eşuează. De asemenea, chiar în acest caz, procedura poate fi oprită cînd toate nodurile binare ale lui jL au atins adîncimea maximă (3.51). Dacă testul de stop (3.52)

reuşeşte, meta-nodul final este jv .


55

La pasul 4.2.5., dacă nivelul de mascare [0,1)µ∈ nu este nul, se efectuează eliminarea coeficienţilor slabi. Eliminarea înseamnă în acest context înlocuirea cu valori nule. De aceea, coeficienţii slabi nu sunt eliminaţi, ci doar mascaţi prin utilizarea valorilor nule. Mai precis, coeficientul , ,m p nc al secvenţei ,m pc este mascat cînd condiţia de

mascare de mai jos este verificată:

0,

, , , ,maxm p

m p n m p ii

c c∈

< µN

. (3.53)

Se observă că nivelul de mascare produce anularea unui anumit procent din masa coeficienţilor undină. De exemplu, alegerea 5%µ = poate conduce la mascarea a 70% dintre coeficienţii undinei originale, ale căror amplitudini se situează sub 5% din amplitudinea maximă.

Singura problemă de rezolvat la pasul 4.2.6. este regăsirea valorilor undinelor , ,Lm p nψ .

Ele pot fi evaluate prin intermediul bancului de filtre, după cum este explicat la punctul 4.7.3. (care urmează) din acest paragraf. Se sare direct la bucla 4.2.8. Singura observaţie care ar trebui evidenţiată aici este faptul că seria de timp ar putea conduce la modele ARMA invalide, pentru unii indici structurali (datorită discrepanţelor puternice dintre date şi modelul selectat). Modelele invalide sunt tratate ca vide iar PQ corespunzător este înlocuit cu EQ (definiţia (3.9)). De regulă, EQ are valori inferioare lui PQ pentru majoritatea modelelor ARMA valide. Mai mult, dacă NA şi NC sunt destul de mari, numărul de modele invalide este sensibil mai mic decît numărul de modele valide, astfel că selectarea unui predictor optimal nu este afectată.

4.7.2. Evaluarea suporturilor corespunzătoare coeficienţilor undină

Se introduce notaţia cunoscută min maxSupp( ) ,x xx N N= pentru suportul oricărui semnal

discret de lungime finită x . Primul pas în evaluarea suporturilor corespunzătoare coeficienţilor undină este setarea suporturilor semnalelor implicate în ecuaţii ca (3.44) sau

(3.45). Pentru a extinde generalitatea, se consideră că min maxSupp( ) ,y yy N N= şi

( ) min max0,0, , ,Supp ,L

n L LN Nφ φφ = . Astfel, coeficienţii corespunzători rădăcinii arborelui sunt:

max

min0,0, 0,0, 0,0,, [ ] [ ]

y

y

NdefL L

n n nk N

c y y k k=

= φ = φ∑ , n∀ ∈Z . (3.54)

Evident, valoarea curentă 0,0,nc este eventual nenulă dacă şi numai dacă:

min max, ,L LN k n Nφ φ≤ − ≤ , min max,y yk N N∀ ∈ , (3.55)

ceea ce implică:

( ) min max max min0,0 , ,Supp ,y L y Lc N N N Nφ φ⎡ ⎤ ⎢ ⎥⊆ − −⎢ ⎥ ⎣ ⎦ . (3.56)

Operatorii parte întreagă •⎢ ⎥⎣ ⎦ (inferioară) şi •⎡ ⎤⎢ ⎥ (superioară) nu sunt neapărat necesari în

relaţie (3.56), deoarece argumentele lor sunt valori întregi. Totuşi, operatorii se aplică foarte bine în cazul în care acele argumente lor nu au neapărat valori întregi. De aceea, relaţia (3.56) va fi foarte utilă pentru pasul următor al raţionamentului.


56

Continuăm să presupunem că argumentele operatorilor parte întreagă nu sunt neapărat

întregi. Din relaţia (3.56), rezultă limitele lui ( )0,0Supp c :

min min max0,0 ,y LN N Nφ⎡ ⎤= −⎢ ⎥ & max max min

0,0 ,y LN N Nφ⎢ ⎥= −⎣ ⎦ . (3.57)

Se observă că difrenţele ( )min max,y LN Nφ− şi/sau ( )max min

,y LN Nφ− pot fi negative. Indiferent

de semnul lor, proprietăţile operatorilor parte întreagă furnizează următoarele expresii ale limitelor suportului (3.57):

( )( )

min min max min max0,0 , ,

max min max max min0,0 , ,

sign

sign

y L y L

y L y L

N N N N N

N N N N N

φ φ

φ φ

⎡ ⎢ ⎥= − −⎣ ⎦⎢⎢ ⎡ ⎤= − −⎢ ⎥⎣

. (3.58)

Expresiile (3.57) şi (3.58) pot fi combinate, pentru a exprima adecvat limitele (utilizînd doar

operatorul inferior •⎢ ⎥⎣ ⎦ ), în cazul în care ( )max minyN Nφ− este nenegativ:

( )min min max min max

0,0 , ,

max max min0,0 ,

sign y L y L

y L

N N N N N

N N N

φ φ

φ

⎡ ⎢ ⎥= − −⎣ ⎦⎢⎢ ⎢ ⎥= −⎣ ⎦⎣

. (3.59)

Acesta este cazul în care se utilizează undine ortogonale ale clasei Daubechies şi seriei de timp, deoarece:

Supp( ) 1, yy N= & ( ) max0,0, ,Supp 1,L

n LNφφ = . (3.60)

Limita superioară a lui ( )0,0,Supp Lnφ depinde atît de parametrul suport N , cît şi de indicele

de rezoluţie L , după cum se poate obţine direct:

max, 2 (2 1) 1LLN Nφ = − − . (3.61)

În (3.60) şi (3.61), se ţine seama de proprietatea elementară a undinei tată originale φ (al cărei support este [0,2 1]N − ) de a fi nulă în 0 şi 2 1N − , datorită continuităţii. De

aceea, în acest caz:

min0,0 2 2 (2 1)LN N= − − & max max

0,0 1yN N= − . (3.62)

În (3.62), se pot recunoaşte uşor poziţiile extreme ale ferestrei glisante a undinei tată pentru care valorile nenegative ar urmări valorile seriei de timp, ca să se poată calcula produsul scalar (3.54). Prima etapă de calcul fiind încheiată, limitele suportului altor coeficienţi undină pot fi obţinuţi successiv, conform unui raţionament inductiv. Reamintim maniera în care coeficienţii undină sunt calculaţi utilizînd bancul de filtre (ca în Figura 3.3), datorită proprietăţilor (3.23). Începînd cu secvenţa generică ,m pc , cu

( ) min max, , ,Supp ,m p m p m pc N N= , secvenţele rezultate prin expandare 1,2m pc + şi 1,2 1m pc + + sunt

produse printr-o pereche de operaţii succesive: filtrare şi decimare. Filtrarea este efectuată cu ajutorul QMF oglindite. Mai precis, înainte de decimare, rezultă secvenţa intermediară următoare:


57

max

min

01,2 , , ,[ ]

h

h

Ndef

m p n m p n kk N

c h k c+ −=

= ∑ &

max

min

01,2 , , ,[ ]

g

g

Ndef

m p n m p n kk N

c g k c+ −=

= ∑ , n∀ ∈Z . (3.63)

Evident, ambele ecuaţii din (3.63) sunt similare ecuaţiei (3.54), cu semnale diferite, însă. În consecinţă, suporturile secvenţelor intermediare au următoarele limite:

min min min1,2 ,0 ,

max max max1,2 ,0 ,

def

m p m p h

def

m p m p h

N N N

N N N

+

+

⎡ = +⎢⎢

= +⎢⎣

&

min min min1,2 1,0 ,

max max max1,2 1,0 ,

def

m p m p g

def

m p m p g

N N N

N N N

+ +

+ +

⎡ = +⎢⎢

= +⎢⎣

. (3.64)

(Sumele din (3.63) sunt totuşi convoluţii şi nu produse scalare ca (3.54).) Prin decimare, lungimea secvenţei este aproximativ înjumătăţită. De aceea, limtele suporturilor corespunzătoare secvenţelor urmaşilor rezultă din (3.64) şi (3.58):

( )

( )

min min,min min min

1,2 ,

max max,max max max

1,2 ,

sign2

sign2

def m p hm p m p h

def m p hm p m p h

N NN N N

N NN N N

+

+

⎡ ⎢ ⎥+⎢ = + ⎢ ⎥⎢ ⎢ ⎥⎣ ⎦⎢

⎢ ⎥⎢ += + ⎢ ⎥⎢

⎢ ⎥⎢ ⎣ ⎦⎣

; (3.65)

( )

( )

min min,min min min

1,2 1 ,

max max,max max max

1,2 1 ,

sign2

sign2

def m p gm p m p g

def m p gm p m p g

N NN N N

N NN N N

+ +

+ +

⎡ ⎢ ⎥+⎢ = + ⎢ ⎥⎢ ⎢ ⎥⎣ ⎦⎢

⎢ ⎥⎢ += + ⎢ ⎥⎢

⎢ ⎥⎢ ⎣ ⎦⎣

. (3.66)

Ecuaţiile (3.65) şi (3.66) sunt relaţii recursive care permit evaluarea limitelor suporturilor pentru orice secvenţă de coeficienţi undină. Iniţializarea este dată de (3.57). În cazul undinelor ortogonale cu suport compacr ale lui Daubechies, deoarece:

min

max

1 2

0h

h

N N

N

⎡ = −⎢

=⎢⎣ &

min

max

1

2 2g

g

N

N N

⎡ = −⎢

= −⎢⎣, (3.67)

următoarele ecuaţii recursive rezultă direct din (3.65) şi (3.66):

( )

( )

min,min min

1,2 ,

max,max max

1,2 ,

2 1sign 2 1

2

sign2

def m pm p m p

def m pm p m p

N NN N N

NN N

+

+

⎡ ⎢ ⎥− +⎢ = − + ⎢ ⎥⎢ ⎢ ⎥⎣ ⎦⎢

⎢ ⎥⎢= ⎢ ⎥⎢

⎢ ⎥⎢ ⎣ ⎦⎣

; (3.68)

( )

( )

min,min min

1,2 1 ,

max,max max

1,2 1 ,

1sign 1

2

2 2sign 2 2

2

def m pm p m p

def m pm p m p

NN N

N NN N N

+ +

+ +

⎡ ⎢ ⎥−⎢ = − ⎢ ⎥⎢ ⎢ ⎥⎣ ⎦⎢

⎢ ⎥⎢ + −= + − ⎢ ⎥⎢

⎢ ⎥⎢ ⎣ ⎦⎣

. (3.69)

De această dată, iniţializarea este dată de (3.62).


58

4.7.3. Evaluarea valorilor unei undine utilizînd bancul de filtre

Revenim la reprezentarea de la pasul 4.2.6. a Algoritmului 3.1. Pentru a construi

modelul bazat pe undine, trebuie evaluate undinele discretizate , ,Lm p nψ , oricare ar fi

eticheta ( , )m p ∈ ⊗M P şi deplasamentul ,m pn µ∈ N , începînd cu undina tată discretizată

0,0,0Lφ . Legătura dintre undinele unui pachet şi undina tată trebuie exploatată în acest scop.

Fie ( , )m p eticheta unui nod al arborelui binar, ales arbitrar. Unui astfel de nod i se

asociază atît o secvenţă de coeficienţi undină de lungime finită ,m pc , cît şi un pachet

, ,m p n n∈ψ

Z de undine continue. Reamintim că adîncimea m este asociată operaţiei de

scalare (definiţia (3.14)), în timp ce n este deplasamentul de decalare temporală (definiţia

(3.15)). Azimutul 0,2 1mp∈ − joaca aici un rol dublu. În primul rînd, el indică poziţia exactă a pachetului în arborele binar. În al doilea rînd, în funcţie de paritate, sunt diferenţiate pachete de înaltă şi de joasă frecvenţă. Mai precis, dacă p este par (adică

2p∈ N ), atunci pachetul se referă la frecvenţe locale joase, iar dacă p este impar (adică

2 1p∈ +N ), sunt referite frecvenţe locale înalte. Aici local înseamnă divizarea oricărei sub-benzi, la rîndul său, în două noi sub-benzi: una de joasă frecvenţă şi una de înaltă frecvenţă, ca în Figurile 3.4 şi 3.5. Cîteva prelucrări directe aplicate asupra EDL şi EDL⊥ conduc la următoarele ecuaţii recursive între pachetul de undine al nodului ( , )m p şi cel al nodului părinte:

max

min

max

min

1, ,22

, ,

11, ,22

, 2

, 2 1

h

h

g

g

N

k pm n kk N

m p n N

k pm n kk N

h p

g p

− +=

−− +

=

⎧ψ ∈⎪

⎪ψ ≡ ⎨

⎪ ψ ∈ +⎪⎩

∑

∑

N

N, n∀ ∈Z . (3.70)

Evident, 0,0,0ψ ≡ φ (undina tată) şi 0,1,0ψ ≡ ψ (undina mamă). Aşadar, teoretic, undinele

discretizate rezultă prin utilizarea ecuaţiilor recursive (3.70). Există două abordări în acest sens: implementarea directă a ecuaţiei (3.70) sau utilizarea bancului de filtre. Deşi a doua abordare necesită mai multe prelucrări, este mai elegantă şi conduce la o procedură eficientă. De aceea, este descrisă în continuare. Oricare ecuaţie dintre cele două ale ansamblului (3.70) poate fi analizată separat, dar utilizînd acelaşi raţionament. După o schimbare naturală de indice, prima din ele devine:

max max

min min

2 2

, , 1, , 1, ,2 22 2

( ) [ 2 ] ( ) [2 ] ( )h h

h h

N n N n

m p n p pm k m kk N n k N n

t h k n t h n k t+ +

− −= + = +

ψ = − ψ = − ψ∑ ∑ , t∀ ∈R . (3.71)

Interpretarea ecuaţiei (3.71) este următoarea: indicele de sumare nu are influenţă asupra timpului continuu t∈R , dar modifică deplasamentul undinelor. Mai precis, din (3.71), rezultă direct următoarea identitate:

, , 1, ,2

( ) ( ) 2m p pmt h t•

− •

⎛ ⎞ψ ≡ ∗ψ ↓⎜ ⎟

⎝ ⎠, t∀ ∈R . (3.72)

Ecuaţiile (3.68) şi (3.72) arată că, pentru orice moment de timp t∈R , răspunsul la

impuls oglindit al filtrului trece jos ( h ) este în convoluţie cu secvenţa discretă de lungime finită de mai jos:


59

min min max

1, / 2 1, / 2 1, / 21, , 1, , 1 1, ,2 2 2

( ), ( ), , ( )m p m p m p

p p pm N m N m Nt t t

− − −− − + −

⎧ ⎫ψ ψ ψ⎨ ⎬⎩ ⎭

. (3.73)

Rezultatul (de asemenea o secvenţă de lungime finită) este după aceea decimat, pentru a obţine următoarea secvenţă:

min min max, , ,, , , , 1 , ,

( ), ( ), , ( )m p m p m pm p N m p N m p N

t t t+

ψ ψ ψ . (3.74)

Se observă din nou că momentul de timp este pasiv în relaţiile (3.72)-(3.74), adică nu joacă un rol major în calcularea secvenţelor. Similar, a doua ecuaţie din (3.70) implică:

, , 11, ,2

( ) ( ) 2m p pmt g t• −

− •

⎛ ⎞ψ ≡ ∗ψ ↓⎜ ⎟

⎝ ⎠, t∀ ∈R . (3.75)

Reunind ecuaţiile (3.72) şi (3.75) şi incrementînd adîncimea, procesul recursiv poate fi reprezentat ca în Figura 3.10.

min1,2

min1,2

max1,2

1,2 ,

1,2 , 11,2

1,2 ,

( )

( )( )

( )

m p

m p

m p

m p N

defm p N

m p

m p N

t

tt

t

+

+

+

+

+ ++

+

ψ⎡ ⎤⎢ ⎥ψ⎢ ⎥

=⎢ ⎥⎢ ⎥⎢ ⎥ψ⎢ ⎥⎣ ⎦

Ψ

min1,2 1

min1,2 1

max1,2 1

1,2 1,

1,2 1, 11,2 1

1,2 1,

( )

( )( )

( )

m p

m p

m p

m p N

defm p N

m p

m p N

t

tt

t

+ +

+ +

+ +

+ +

+ + ++ +

+ +

ψ⎡ ⎤⎢ ⎥ψ⎢ ⎥

=⎢ ⎥⎢ ⎥⎢ ⎥ψ⎢ ⎥⎣ ⎦

Ψ

Analiză

↓2 min

,

min,

max,

, ,

, , 1,

, ,

( )

( )( )

( )

m p

m p

m p

m p N

defm p N

m p

m p N

t

tt

t

+

ψ⎡ ⎤⎢ ⎥ψ⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥ψ⎢ ⎥⎣ ⎦

Ψ

↓2

H

I

∗g ~

∗h ~

Figura 3.10. Utilizarea bancului de filtre pentru calcularea valorilor undinelor.

Intrarea şi ieşirea procedurii sunt împachetate adecvat în vectori (sau secvenţe de lungime finită). Undina tată contribuie la iniţializarea procedurii. Astfel, dacă 0m p= = , vectorul iniţial al intrării este următorul:

( ) ( ) ( )

min min max0,0 0,0 0,0

0,0 0,0, 0,0, 1 0,0,

min min max0,0 0,0 0,0

( ) ( ) ( ) ( )

1 , .

Tdef

N N N

T

t t t t

t N t N t N t

+⎡ ⎤= ψ ψ ψ =⎣ ⎦

⎡ ⎤= φ − φ − − φ − ∀ ∈⎣ ⎦ R

Ψ (3.76)

Evaluarea undinei tată la toate momentele specificate în (3.76) poate fi realizată utilizînd Algorithmul Daubechies-deRham (Algoritmul 3.3) Astfel, în cazul în care undina tată este discretizată cu rezoluţia L , vectorul iniţial devine:

[ ] min min max0,0 0,0 0,0 0,0 0,0 0,0 0,01

def TL L L Lk k N k N k N⎡ ⎤⎡ ⎤ ⎡ ⎤ ⎡ ⎤= φ − φ − − φ −⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎣ ⎦Ψ , k∀ ∈Z . (3.77)


60

În consecinţă, schema de calcul din Figura 3.10 poate fi direct utilizată, cu următoarele uşoare modificări formale: momentul de timp t devine momentul normalizat k , şi vectorii (ca şi undinele pe care le includ) primesc de asemenea indicele superior L . Evident, nu toate valorile vectorului iniţial (3.77) sunt nenule. Dimpotrivă, pentru că lungimea serie de timp originale, yN , este, de regulă, mult mai mare decît lungimea

suportului undinei tată, doar puţine elemente ale vectorului [ ]0,0L kΨ sunt nenule. Este

adevărat, totuşi, că, pe măsură ce indicele rezoluţiei L creşte, numărul de elemente nenule creşte de asemenea.

Dacă [ ]0,0L kΨ este un vector nul, ieşirile schemei de calcul sunt evident nule. Pentru a

evita acest comportament, este suficient ca timpul normalizat k să aparţină mulţimii:

min min max max0,0 , 0,0 ,,L LN N N Nφ φ+ + . (3.78)

De exemplu,în cazul undinelor ortogonale ale lui Daubechies, definite de parametrul N şi

indicele de rezoluţie 0L = , vectorii iniţiali ( )0 min0,0 0,0 1N +Ψ , ( )0 min

0,0 0,0 2N +Ψ ,

( )0 min0,0 0,0 3N +Ψ şi ( )0 max

0,0 0,0 1N +Ψ arată ca mai jos:

( ) ( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

0 min0,0 0,0

0 min0,0 0,0

0 min0,0 0,0

0 max0,0 0,0

1 1 0 0 0

2 2 1 0 0 0

3 3 2 1 0 0 0

1 0 2 1 0 2 2 2 1

T

T

T

T

N

N

N

N N N

⎡ + = φ φ =⎡ ⎤⎣ ⎦⎢⎢ + = φ φ φ =⎡ ⎤⎣ ⎦⎢⎢ + = φ φ φ φ =⎡ ⎤⎣ ⎦⎢⎢

+ = φ − = φ − φ φ⎡ ⎤⎢ ⎣ ⎦⎣

Ψ

Ψ

Ψ

Ψ

. (3.79)

Se poate vedea cum este construit vectorul iniţial: fereastra inversată a undinei tată gliseaza pe el, începînd de sus. Astfel, chiar şi vectorul iniţial poate fi construit recursiv. Paralelismul Algoritmului 3.1 este o proprietate intrinsecă a acestuia, derivată din utilizarea bancurilor de QMF. Este clar că expandarea atît a arborelui binar utilizat pentru evaluarea coeficienţilor undină, cît şi a meta-arborelui utilizat în determinarea Transformatei Undină de entropie minimă, beneficiază de procesarea în paralel a urmaşilor oricărui nod, respectiv meta-nod. Deocamdată, predictorul FORWAVER este proiectat în versiunea uni-canal. Cu alte cuvinte, seria de timp este uni-dimensională. El ar putea fi rulat în paralel în cadrul mini-reţelei de calculatoare, pentru fiecare canal al oricărui bloc de date multi-dimensional. Cu toate acestea, se anvizajează proiectarea unei versiuni multi-canal a acestui algoritm, care, probabil, va apela din nou la strategia PSO pentru a determina modelul MIMO-ARMA inclus în modelul cu undine.

Lista programelor şi rutinelor pachetului FORWAVER este inclusă în anexele manualului de utilizare [ASTI09]. Principalele rutine ale predictorului sunt: Daub (Algoritmul lui Daubechies), dwt_analysis (implementarea Transformatei Undină Discrete pe ramura de analiză), dwt_model (construcţia modelului de predicţie bazat pe undine ortogonale cu suport compact) IDA_star (procedura IDA*), phi_Rham, psi_Rham (Algoritmul Daubechies-deRham), rough_model (construcţia modelului ARMA grosier) şi prediction_quality (evaluarea calităţii predicţiei). Algoritmul FORWAVER a fost publicat în [SCI08] (indexată ISI) – lucrare anexată în finalul acestui raport de cercetare. El este de asemenea inclus în partea de aplicaţii a cărţii [SSP09], în curs de apariţie la Editura Academiei Române.


61

44.. DDiiaaggnnoozzăă ddee ddeeffeeccttee ccuu aajjuuttoorruull ddiiccţţiioonnaarreelloorr ttiimmpp--ffrreeccvveennţţăă--ssccaallăă Sistemul UMAPID nu este destinat doar identificării şi predicţiei de date. El poate rezolva şi unele probleme legate de diagnoză de defecte – operaţie care este în mod natural conectată cu proprietatea de mobilitate. Noile tehnologii de proiectare a sistemelor (în special automate) prevăd includerea toleranţei la defecte printre prescripţiile iniţiale. Aceasta nu este întotdeauna o cerinţă comodă, atît din punctul de vedere al costurilor de fabricaţie (care poate creşte sensibil), cît şi din cel al proiectării în sine (care trebuie să fie predictivă şi să se bazeze pe experienţa apariţiei de defecte în cursul utilizării de sisteme similare cu cel proiectat). Probabil că domeniul aviaţiei şi al tehnicii spaţiale este cel mai avansat în direcţia integrării toleranţei la defect, avînd în vedere gradul de periculozitate la care este expus operatorul uman sau pierderile materiale importante pe care le-ar cauza funcţionarea defectuoasă. Totuşi, o largă categorie de sisteme artificiale sau naturale nu includ mecanisme de prevenţie şi combatere a defectelor. Pentru o parte dintre acestea, este utilă existenţa unor „doctori”, care să se deplaseze la faţa locului şi să ofere măcar un prim diagnostic al funcţionării anormale a sistemului „pacient”. Acesta este şi rolul unităţii mobile care a făcut obiectul proiectului de faţă. În această secţiune, va fi descris un algoritm complex de detecţie de defecte, numit GAMP, implementat la nivelul sistemului UMAPID. El este destinat în special sistemelor mecanice, dar poate fi extins, pe baza aceloraşi principii, către alte tipuri de sisteme cu expunere la apariţia de defecte. Provenienţa numele algorimului va fi dezvăluită mai tîrziu, după înţelegerea conceptelor care îl fundamentează.

4.1. Despre dicţionarele timp-frecvenţă-scală

Proprietatea de ortogonalitate care guvernează abordarea anterioară poate fi relaxată. În 1992, a apărut o idee extrem de interesantă, care, aparent, iese din cadrul Teoriei multi-rezoluţie. Rezultatul obţinut plecînd de la această idee a fost publicat la finele anului 1993 de către Stéphane Mallat, în colaborare cu Siefen Zhong (un doctorand al său la acea dată) [MaZh93]. Noua idee se referă la organizarea familiilor de undine nu în pachete, ci într-un dicţionar de forme de undă. Un cuvînt în acest dicţionar îl reprezintă o versiune scalată, translatată în timp şi, eventual, modulată armonic, a unei ferestre mamă, adică un atom timp-frecvenţă-scală. Cuvintele pot sau nu să fie ortogonale, dar ele trebuie să genereze spaţiul uzual de semnale sau, cel puţin, sub-spaţiul din care face parte semnalul analizat. În acest context, analiza de semnal este similară traducerii unei propoziţii sau fraze dintr-o limbă în alta, cu ajutorul unui dicţionar. De exemplu, se încearcă traducerea în limba română a unei celebre aserţiuni a lui Arhimede: Εν αρχεωσ αρηθµωσ. Prima operaţie constă în găsirea unui dicţionar adecvat. Urmează căutarea celor 3 cuvinte în dicţionar şi traducerea lor. Astfel, se găsesc următoarele semnificaţii:

• εν (citit [en]) = în; • αρχεωσ (citit [arheos]) = vechime, antichitate; • αρηθµωσ (citit [aritmos]) = număr, aritmetică.

Plecînd de la asamblarea brută a cuvitelor traduse şi ţinînd cont de stilul limbii române, se găseşte o traducere acceptabilă: La început a fost numărul. Etapele parcurse pentru traducerea aserţiunii lui Arhimede pot fi întîi adaptate şi apoi adoptate în analiza de semnal cu un dicţionar de undine. Adaptarea se bazează în principal pe definirea unui criteriu de potrivire (matching) cu ajutorul căruia se poate identifica o posibilă colecţie de cuvinte din care este formată fraza reprezentată de semnal. În definirea criteriului, rolul principal îl joacă proprietatea de proiecţie. Un cuvînt al dicţionarului de forme de undă este mai potrivit decît altul, pentru un semnal dat, dacă proiecţia sa pe semnal are energie mai mare. Odată acest criteriu stabilit, urmează


62

identificarea celor mai potrivite cuvinte în urma unui proces iterativ numit urmărire (pursuit). În final, semnalul este înlocuit de colecţia de cuvinte potrivite extrase din dicţionar (împreună cu valorile coeficienţilor de proiecţie), iar semnalul rezidual rămas este ignorat. Ideea urmăririi prin potrivire este descrisă pe larg în următoarele paragrafe ale secţiunii. Ortogonalitatea nu mai joacă rolul principal în cursul urmăririi prin potrivire. Din contră, aşa cum dicţionarele lingvistice sunt redundante (unui cuvînt putîndu-i-se asocia mai multe sensuri), dicţionarul de forme de undă include o familie redundantă de cuvinte (atomi timp-frecvenţă-scală nu neapărat ortogonali). Redundanţa – ca proprietate opusă ortogonalităţii (sinonimă neredundanţei) – este chiar necesară în anumite aplicaţii, cum ar fi cele de interpretare a imaginilor sau diagnoză de defect. Alte aplicaţii – de exemplu de compresie şi codaj ale semnalelor – nu suportă redundanţa, performanţele fiind cu atît mai bune cu cît realizările efective ale cuvintelor din dicţionar sunt mai aproape de ortogonalitate. Aşa cum s-a menţionat în secţiunea precedentă, una dintre cele mai interesante şi importante paradigme din PS se referă la separarea dintre componenta utilă şi componenta parazită (uzual afectată de diferite perturbaţii numite zgomote) care sunt combinate (de o manieră necunoscută) într-un semnal. Reamintim că această paradigmă este referită şi sub numele de problemă a deparazitării (denoising). Vom relua discuţia pe scurt, în contextul dicţionarelor de forme de undă. De regulă, datele utile codifică informaţia principală transportată de un semnal, în timp ce zgomotul are o natură nedeterministă şi distorsionează această informaţie. Zgomotul este considerat principala cauză a aspectului fractal relevat de semnalele practice, deşi datele utile pot avea de asemenea o natură fractală. Dificultatea separării este astfel cu atît mai mare, chiar şi în cazul ipotezei simplificatoare a superpoziţiei liniare dintre cele două componente (ipoteză infirmată, totuşi, în numeroase aplicaţii). De fapt, precizia separării depinde sensibil de maniera în care sunt definite cele două componente. Ori, formularea de definiţii clare, riguroase şi, mai ales, generale, ale componentelor de semnal se dovedeşte a fi extrem de dificilă, dacă nu imposibilă. Din acest motiv, orice metodă care oferă o soluţie problemei de deparazitare (deci, care propune o tehnică de deparazitare) nu poate evita următorul efect: o parte a componentei utile este interpretată ca zgomot, fiind atenuată, în timp ce o parte a zgomotului este considerată utilă, fiind moştenită de semnalul (pseudo-)deparazitat. Cantitatea de zgomot care afectează un semnal este cuantificată de raportul semnal-zgomot, notat tradiţional prin SNR (de la denumirea în limba engleză Signal-to-Noise Ratio). Acesta nu poate fi determinat cu precizie, dar poate fi estimat, folosind un model matematic al sursei de zgomot. Dacă f este un semnal uzual, iar v este zgomotul integrat, atunci SNR se poate defini astfel:

2

2SNR( , ) 10 lgdef

f

v

f v⎛ ⎞σ

= ⎜ ⎟σ⎝ ⎠

(4.1)

(măsurat în dB). În definiţia (4.1) (neunică, totuşi) 2fσ şi 2

vσ desemnează dispersiile

semnalului, respectiv zgomotului. Acestea sunt entităţi statistice care pot fi aproximate folosind Ipoteza ergodică. De exemplu, dacă semnalul este discret şi are N eşantioane, o aproximaţie a dispersiei acestuia este dată de raportul dintre energie şi numărul de eşantioane. Prin urmare, în practică, o aproximaţie a SNR este dată de:

( )SNR( , ) 10 lg( )ff vv

⎛ ⎞≅ ⎜ ⎟

⎝ ⎠

EE

. (4.2)

Cu cît SNR se apropie de valoarea nulă, cu atît ponderea zgomotului în cadrul semnalului este mai mare. Absenţa zgomotului este exprimată de valoarea ideală, infinită, a SNR.


63

În mare, zgomotele pot fi descrise prin intermediul unui număr finit de parametri. De aceea, modelele asociate sursei de perturbaţii se află adesea la intersecţia dintre PS şi IS [SoSt89], [PrMa96], [SCS05]. Este vorba despre modelele auto-regresive (utilizate în cadrul algoritmilor precedenţi, bazaţi pe modele de identificare). Acestea sunt de fapt funcţii de sistem ale unor filtre care funcţionează la intrare cu zgomotul total necorelat şi impredictibil numit alb. Filtrele oferă la ieşire un alt zgomot dar colorat. Acesta este cel care se suprapune peste datele utile. Odată un model al sursei de zgomot determinat, se pot estima, cu precizie controlată, valorile zgomotului din cadrul unui semnal. Printre altele, se poate evalua (tot aproximativ) SNR. Este evident că, dacă o tehnică de deparazitare funcţionează corect, SNR înainte de deparazitare este inferior SNR de după deparazitare. Cum ambele valori sunt finite, rezultă imediat că nu se poate trage o line de demarcaţie clară între componenta utilă şi cea parazită a unui semnal. Această ambiguitate de separare este deliberat conservată în denumirea alternativă a perturbaţiei: reziduu de semnal. Este posibilă creşterea SNR în manieră controlată, pînă la o valoare acceptabilă, prin diminuarea energiei reziduurilor. Aceasta este şi proprietatea cea mai importantă a metodei de analiză cu ajutorul unui dicţionar de undine. Problema deparazitării devine mai dificilă în cazul în care anumite zgomote sunt chiar dorite în componenta utilă. În acest caz, problema este aceea a separării zgomotelor cu naturi diferite. De exemplu, semnalul de vibraţie emis de un sistem mecanic sau biologic relevă următoarea caracteristică interesantă: dacă sistemul funcţionează normal, vibraţia este cvasi-staţionară, cu natură armonică şi un SNR relativ ridicat; dacă sistemul este ameninţat de unul sau mai multe defecte, vibraţia devine din ce în ce mai nestaţionară şi natura ei armonică este afectată de un semnal fractal, din ce în ce mai puternic, pe măsură ce defectul/defectele devine/devin mai severe, scăzînd SNR. Zgomotele datorate defectelor se combină într-o manieră necunoscută între ele şi cu zgomotul extern din mediul înconjurător în care evoluează sursa de vibraţii. Distincţia dintre zgomotele produse de diferite tipuri de defecte este extrem de importantă în detecţia automată acestora, dar nu este uşor de realizat. Prin definiţie, operaţia care constă în deparazitatea (parţială) simultan cu compresia semnalului se numeşte compactare (de semnal). Complexitatea unei metode de compactare depinde de valoarea iniţială a SNR. Cu cît zgomotul în care este scufundată partea utilă a semnalului este mai intens, cu atît metoda compactare trebuie să fie mai complexă.

4.2. Construcţia şi configurarea unui dicţionar timp-frecvenţă-scală

Semnalul original poate fi considerat o frază rostită de către o persoană într-o limbă necunoscută. Mai mult, dacă semnalul este afectat de perturbaţii, este ca şi cum persoana nu stăpîneşte acea limbă, vorbind cu un anumit accent şi, eventual, cu greşeli de pronunţie şi/sau gramaticale. Problema care se ridică este atunci aceea de a descompune fraza în cuvinte corecte, cu înţeles bine precizat, extrase dintr-un dicţionar şi, eventual, de a comprima semantica frazei într-un număr cît mai mic de cuvinte. Prima condiţie pentru rezolvarea problemei este aceea de a găsi un dicţionar corespunzător. În cazul utilizării undinelor, acesta va putea fi construit şi configurat plecînd de la o fereastră mamă, prin aplicarea în ordine a 3 operatori: scalare ( ασ , de factor

0α > ), translaţie temporală (q−τ , de ecart τ ∈R ) şi modulaţie armonică ( ωµ , de pulsaţie ω∈R ). Aceste operaţii se definesc astfel:

( )q ( ) ( )def

f t f t−τ = − τ , ,t∀ τ∈R . (4.3)

( ) 1( )def tf t fα ⎛ ⎞σ = ⎜ ⎟αα ⎝ ⎠

, t∀ ∈R , ∗+∀α ∈R . (4.4)


64

( )( ) e ( )def

j tf t f tω ωµ = , ,t∀ ω∈R . (4.5)

Prin discretizare, primele două au expresiile (3.14) şi (3.15). Pentru ultima, se poate scrie că:

( ) 2( ) e ( )k tdef jk f t f tπµ = , k +∀ ∈Z , t∀ ∈R . (4.6)

De notat că, în definiţiile (3.14), (3.15) şi (4.6), timpul păstrează variaţia continuă. Prin discretizarea acestuia, se obţine un veritabil dicţionar discret. Fiecare dintre cei 3 operatori atomici produce o schimbare a poziţiei, formei sau numărului de oscilaţii într-o fereastră mamă. Aceasta atrage după sine modificarea corespunzătoare a segmentului de semnal decupat. În Figura 4.1, este ilustrată maniera în care o fereastră mamă (de exemplu de tip Gaussian) poate fi modificată prin aplicarea operatorilor atomici.

t

t t0

d i latare

t 0

w

t0 t 0

w

t0 0

w

întîrziere

tt00++ττ t 0

q-τw

t0

τ>0

devansare

t0-|τ| t 0

q-τw

t0

τ<0

0

Re(µωw)

t

contracţie

αt0 0

σαw

α(t0+3σ)

t0-3σ t0+3σ

α(t0-3σ)

0<α<1

t αt0 0

σαw

α(t0+3σ) α(t0-3σ)

α>1

A

A/α

A/α

Translaţie temporală Modulaţie armonică Scalare

t 0

Im(µωw)

t0

t0

t0

t0

Figura 4.1. Efectul operatorilor atomici aplicaţi asupra unei ferestre de bază.

Semnul ecartului indică şi sensul translaţiei temporale: ”>”0 înseamnă deplasare spre dreapta (adică întîrziere), în timp ce ”<”0 înseamnă deplasare spre stînga (adică devansare). Acesta este motivul pentru care operatorul de translaţie temporală (4.3) este notat prin q−τ (cu minus) şi nu prin qτ (cu plus). În ceea ce priveşte operatorul de scalare (4.4), raportul în care se află factorul de scalare faţă de unitate este de asemenea sugestiv. Astfel, factorii subunitari (”<”1) indică o deplasare spre interior a flancurilor ferestrei (adică o contracţie), în timp ce factorii supraunitari (”>”1) sunt responsabili de deplasarea spre exterior (adică o dilatare). Se observă cu uşurinţă că translaţia temporală şi modulaţia armonică nu modifică dimensiunea suportului ferestrei, în timp ce scalarea are efectul unei camere cu oglinzi care produce diferite deformări caricaturale ale ferestrei. Matematic, efectul operatorilor asupra suportului ferestrei (finit sau infinit) este următorul:


65

( ) ( ) ( )Supp q Supp q Suppdef

w w w−τ +τ= + τ = , ∀τ∈R ; (4.7)

( ) ( )Supp Suppw wασ = α⋅ , ∗+∀α ∈R . (4.8)

( ) ( )Supp Suppw wωµ = , ∀ω∈R ; (4.9)

Ultima definiţie din (4.7) este pur convenţională, pentru a permite o exprimare elegantă. De notat că efectul scalării suportului din (4.8) (adică de-a lungul abscisei) este însoţit şi de o scalare a amplitudinii ferestrei în sens opus (adică de-a lungul ordonatei). Aceasta este o consecinţă a proprietăţii de conservare a energiei, verificată de către toţi operatorii atomici (aşa cum s-a arătat în [StSt07] sau [SSP09]). Dicţionarul conţine astfel o infinitate (triplă, de puterea continuului) de cuvinte indexate după cei 3 parametri ai operatorilor elementari. În varianta originală publicată de Mallat şi Zhong [MaZh93], dicţionarul este construit folosind numai operaţiile de scalare şi translaţie temporală. Extinderea dicţionarului prin utilizarea operaţiei de modulaţie armonică poate conduce însă atît la îmbunătăţirea performanţelor de compactare a semnalelor, cît şi la lărgirea clasei de semnale ce pot fi traduse cu ajutorul acestuia. Pentru a ilustra principiul urmăririi prin potrivire, se va construi, la început, un dicţionar continuu indexat. În aplicaţii, acest dicţionar trebuie discretizat, fiind necesară o indexare discretă a celor 3 parametri de indexare. Dicţionarul poate fi chiar de tip discret cînd, în plus, include atomi timp-frecvenţă-scală ca semnale discrete. Construcţia dicţionarului pleacă aşadar de la o fereastră mamă stabilă, de energie unitară, w . Aceasta poate fi o undină mamă, o undină tată sau o altă fereastră de semnal. Alegerea ei se efectuează luînd în considerare clase de semnale care urmează a fi analizate (traduse). Energia este unitară pentru a distorsiona minimal semnalul tradus. (Reamintim că fiecare dintre cei 3 operatori elementari este conservativ, astfel că fiecare cuvînt al dicţionarului va avea energie unitară.) Faptul că fereastra mamă are spectrul concentrat într-o anumită bandă de frecvenţe nu este esenţial, deoarece, prin modulaţia armonică, spectrul atomilor din dicţionar culisează, putînd ocupa orice poziţie. Mai mult, orice atom poate fi considerat o fereastră mamă a dicţionarului. De exemplu, rolul de fereastră mamă poate fi asumat de către semnalul Gaussian de energie unitară definit prin:

2

024

( )1( ) exp2

def t tw t⎡ ⎤−

= −⎢ ⎥λπ λ ⎣ ⎦, t∀ ∈R . (4.10)

Semnalul este centrat în momentul 0t ∈R , iar deschiderea clopotului este controlată de parametrul 0λ > . Se poate arăta că momentul central verifică următoarea proprietate de medie:

2 2

20

2

( ) ( )( )

( )( )

deft w t dt t w t dt

t t w t dt tw

w t dt

+∞ +∞

+∞−∞ −∞+∞

−∞

−∞

= = = =∫ ∫

∫∫

E, (4.11)

unde ( )wE este energia ferestrei w (integrala modulului la pătrat). La trecerea în frecvenţă, fereastra mamă (4.387) conservă caracterul Gaussian:

0

2 2

4( ) e exp

2j tW j + Ω ⎡ ⎤λ λ Ω

Ω = −⎢ ⎥π ⎣ ⎦, ∀Ω ∈R , (4.12)

dar deschiderea clopotului este controlată de inversul parametrului λ (cu respectarea Principiului de incertitudine). De această dată, pulsaţia centrală este nulă. Ea verifică însă următoarea proprietate de medie:


66

2 2

20

2

( ) ( )0 ( )

( )( )

defW j d W j d

W j dW

W j d

+∞ +∞

+∞−∞ −∞

+∞−∞

−∞

Ω Ω Ω Ω Ω Ω= Ω = = = Ω Ω Ω = Ω

Ω Ω

∫ ∫∫

∫E . (4.13)

Proprietăţile (4.11) şi (4.13) sunt verificate de către toţi atomii dicţionarului şi pot fi extinse cu caracter de definiţii la dicţionarele generate de alte ferestre mamă decît cea Gaussiană. Cu ajutorul lor se vor putea evalua momentul central şi pulsaţia centrală a oricărui atom. Fereastra mamă Gaussiană este preferată în multe aplicaţii, datorită bunei localizări în timp şi frecvenţă în jurul acestor parametri centrali (proprietate descrisă în [StSt07] sau [SSP09]). Se poate arăta că suporturile practice ale semnalelor (4.10) şi (4.12) au lărgimea 6λ , respectiv 6 / λ . Astfel, fereastra Gaussiană de bază are o lărgime practică de bandă egală cu [ 3/ ,3/ ]− λ λ . Lărgimile de bandă ale celorlalţi atomi constituie versiuni scalate şi translatate în pulsaţie ale acesteia. În cazul altor ferestre, se apelează adesea la conceptul de lărgime de bandă la

jumătatea puterii (spectrale): 1/ 2

def

c c+ −∆Ω = Ω − Ω . Pulsaţiile de tăiere c

−Ω şi c+Ω sunt soluţii ale

ecuaţiei:

22

01( ) ( )2

W WΩ = Ω , (4.14)

care arată de unde provine terminologia utilizată. În cazul ferestrei Gaussiene, ln 2 /c c

+ −Ω = −Ω = λ , ceea ce conduce la 1/ 2 2 ln 2 /Ω = λ .

Aplicînd cei 3 operatori elementari (în ordinea: scalare, translaţie temporală, modulaţie armonică), se obţine cuvîntul generic, în timp continuu, al dicţionarului:

( )( , , ) 1( ) q ( ) edef

j t tw t w t wα τ ω ω −τ α ω − τ⎛ ⎞= µ σ = ⎜ ⎟αα ⎝ ⎠, t∀ ∈R , (4.15)

Indexul triplu ( , , )α τ ω se mai notează prin ξ , pentru uşurinţa exprimării. Ţinînd cont de

proprietăţile Operatorului Fourier (OF) [PrMa96], [StD96], relativ la operatorii elementari, efectul său asupra atomului (4.15) este următorul:

( ) ( )

( )

1/

( )

q ( ) q ( )

e ( ) , .j

w j w j

W j

ω −τ α −ω −τ α

− Ω−ω τ

µ σ Ω = µ σ Ω =

= α α Ω − ω ∀Ω ∈R

G G (4.16)

Ecuaţia (4.16) arată, de fapt, că dicţionarul acoperă întreaga plajă de frecvenţe, prin operaţii de scalare şi translatare a benzii principale specifice ferestrei mamă (de exemplu, banda la jumătate de putere sau intervalul 3/ λ , în cazul ferestrei Gaussiene).

Dicţionarul poate fi notat prin *( )def

w wξ+= ξ ∈ × ×R R RE , unde (1,0,0)w w≡ . Se poate

arăta că, dacă fereastra mamă satisface restricţia de bună localizare în timp şi frecvenţă, ( )wE este un cordaj (dens) al spaţiului semnalelor uzuale (stabile şi de energie finită) H .

Cum acest spaţiu este separabil (adică admite baze numărabile), din dicţionarul ( )wE

se poate extrage o mulţime numărabilă de atomi, notată natural prin ( )0 0 0 0, , ( ) ( )w wα τ ω ξ=E E , care, în anumite condiţii, continuă să fie un cordaj. Condiţiile sunt impuse asupra parametrilor de discretizare ( ) * * *

0 0 0 0, , + + +ξ = α τ ω ∈ × ×R R R . (În [DaI90], sunt precizate astfel

de condiţii pentru familiile discretizate de undine.) De exemplu, se poate impune restricţia ca paşii de discretizare în timp şi pulsaţie să verifice inegalitatea:


67

00

2πω ≤

τ, (4.17)

provenită direct din Principiul de incertitudine (dar şi dintr-un rezultat publicat în [DaI90]). De asemenea, alegerea cea mai frecventă a bazei de scalare este 0 1/ 2α = (sau 0 2α = ). În fine, potrivit rezultatelor din [DaI90], dacă pasul de discretizare temporală nu depăşeşte un anumit prag (care depinde de 0α ), atunci familia discretizată de atomi este un cordaj al

spaţiului H . Elementul generic al dicţionarului discretizat 0 ( )wξE se poate exprima ca mai jos:

( ) ( )( )0 0 0 0[ , , ] / 20 0 0( ) q ( ) e

mdefk n j k tm n k m mw t w t w t nω − τ α ω− −= µ σ = α α − τ , t∀ ∈R , (4.18)

unde, de această dată, indicii sunt discreţi ( , ,m n k ∈Z ), iar [0,0,0]w w≡ . Dicţionarul discretizat constituie sursa unei familii discrete de atomi timp-frecvenţă-scală, care va juca rolul de dicţionar discret. Spre deosebire de dicţionarele anterioare, acesta va trebui să aibă, în plus, un număr finit de cuvinte, întocmai ca un dicţionar lingvistic. Numărul finit de atomi discreţi este o consecinţă directă a faptului că semnalele analizate sunt de bandă limitată şi au un număr finit de eşantioane. Aceasta implică automat că dicţionarul discret nu poate genera întregul spaţiu al semnalelor uzuale discrete, H , dar poate fi configurat să genereze un subspaţiu al acesuia care conţine partea utilă a semnalului analizat. În acest fel, dicţionarul discret are o natură adaptivă la semnalul analizat sau la clasa din care face parte acesta. Configurarea se bazează pe acordarea dintre spectrele ferestrei mamă şi semnalului analizat, aşa cum arată raţionamentul care urmează. Atomii discreţi se obţin prin discretizarea atomilor continuali ai dicţionarului 0 ( )wξE cu perioade de eşantionare adaptate scalei. Dacă fereastra mamă este eşantionată cu perioada 0sT > , atunci elementul generic al dicţionarului discret se exprimă prin:

( ) ( )( )0 0 0 0[ , , ] / 20 0 0[ ] q [ ] e

ms

defk n j kp Tm n k m m

sw p w p w pT nω − τ α ω− −= µ σ = α α − τ , p∀ ∈Z , (4.19)

Familia atomilor discreţi (4.19) este notată prin 0 [ ]wξE . Din această familie trebuie să facă parte numai atomii pentru care fenomenul de aliere în frecvenţă [StD96] este insesizabil sau suficient de atenuat. De exemplu, se pot reţine numai atomii a căror amprentă spectrală este inclusă în banda [ ]/ , /s sT T−π +π . Amprenta spectrală se poate

evalua în diferite moduri, dar, în acest context, ea va fi identică benzii la jumătate de putere. Cum spectrul atomului (4.19) este centrat în jurul pulsaţiei normalizate

[ , , ] 0m n k kω = ω , pulsaţiile normalizate de tăiere la jumătate de putere depind de aceasta, dar

nu depind de indicele translaţie temporală, n . De exemplu, în cazul ferestrei Gaussiene, pulsaţiile de tăiere sunt: ,[ , , ] 0 0 ln 2 /m

c m n k k± −ω = ω ± α λ . În consecinţă, dicţionarul discret 0 [ ]wξE va include numai atomii care verifică cel puţin una dintre cele două perechi de

inegalităţi de mai jos:

,[ , , ]c m n ks sT T

−π π− ≤ ω ≤ ; ,[ , , ]c m n k

s sT T+π π

− ≤ ω ≤ . (4.20)

Acestea nu limitează ambele game de variaţie a indicilor de scală m şi modulaţie k la mulţimi finite, dar una dintre ele este finită pentru fiecare valoare a indicelui pereche. De exemplu, în cazul ferestrei Gaussiene, pentru orice indice de scală m∈Z , indicele de

modulaţie k variază în mulţimea finită ,m mK K− + , unde:


68

0 0 0

ln 2m m

s s

KT T

− ⎡ ⎤π= − −⎢ ⎥λα ω ω⎢ ⎥

& 0 0 0

ln 2m m

s s

KT T

+ ⎢ ⎥π= +⎢ ⎥λα ω ω⎣ ⎦

. (4.21)

Pentru a găsi şi limitele de variaţie ale celorlalţi doi indici, este necesară acordarea dicţionarului la semnalul analizat. Această operaţie se referă la localizarea atomilor în planul timp-frecvenţă-scală, obţinut prin concatenarea tuturor planelor timp-frecvenţă corespunzătoare cîte unei scale constante. În acest fel, se evită precizarea unei relaţii explicite între scală şi frecvenţă, menţinînd un grad de libertate în plus atît în reprezentare, cît şi în interpretarea acesteia. Se consideră că semnalul original (discret) cu yN eşantioane este esenţial localizat în

banda normalizată [ ],l hω ω (eventual, cu l hω = −ω ). Dacă se cunoaşte perioada de

eşantionare a acestuia, atunci valoarea ei va fi utilizată şi la eşantionarea ferestrei mamă. Atunci, pentru fiecare indice de scală m∈Z , planul timp-frecvenţă corespunzător scalei

0mα (numit ad hoc şi latice timp-frecvenţă curentă) conţine maxim y mN K× celule

dreptunghiulare de arie constantă asociate perechilor de indici , n k sau, mai precis,

atomilor [ , , ]m n kw , aşa cum ilustrează Figura 4.2.

α0m t0+N l,mτ0

Timp

Frec

venţă

Scala: α0m

α0m t0+(N l,m+1)τ0 α0

m t0+N r,mτ0

ω l + ω 0,m ω l

ω h

ω l + (Km-1)ω 0,m

n

k

ω l + Km ω 0,m

Figura 4.2. Laticea curentă din planul timp-frecvenţă-scală.

Aşadar, pentru fiecare latice timp-frecvenţă, , ,,l m r mn N N∈ , iar 0, mk K∈ , unde:

0,

12

defh l

mm

K⎢ ⎥ω − ω

= +⎢ ⎥ω⎣ ⎦. (4.22)

În definiţia (4.22) a numărului maxim de sub-benzi, ar fi trebuit utilizat parametrul de discretizare în frecvenţă 0ω , ca pas de eşantionare a benzii [ ],l hω ω . Însă acesta trebuie să

depindă de scala curentă, avînd în vedere că fiecare celulă a laticii este în mod unic asociată unui atom [ , , ]m n kw din dicţionarul discret. Astfel, atomii adiacenţi [ , , ]m n kw şi [ , , 1]m n kw + (care corespund unei perechi de celule vecine în latice) au spectre învecinate, centrate în

0kω , respectiv 0( 1)k + ω . Nici un alt atom nu se interpune, în sensul că spectrul oricărui

atom diferit de cele două nu poate fi centrat în nici o pulsaţie din banda 0 0[ ,( 1) ]k kω + ω . În consecinţă, este natural să se considere că sub-benzile la jumătate de putere ale spectrelor atomilor adiacenţi sunt disjuncte şi corespund sub-benzilor asociate celulelor vecine ale laticii. Spectrele se suprapun totuşi în afara sub-benzilor la jumătate de putere, fapt care atestă redundanţa dicţionarului. (Reamintim că ortogonalitatea este sinonimă cu sub-benzi disjuncte.)


69

Condiţia de disjuncţie la jumătate de putere revine practic la egalitatea pulsaţiilor de tăiere consecutive, ,[ , , ] ,[ , , 1]c m n k c m n k

+ −+ω = ω , din care rezultă clar că parametrul 0ω depinde de

indicele de scală. De exemplu, pentru fereastra mamă Gaussiană, rezultă:

0 00 0

ln 2 ln 2( 1)m mk kω + = + ω −λα λα

⇔ 0 0,0

2 ln 2 def

mmω = = ωλα

. (4.23)

Soluţia (4.23) relevă că, în general, există o legătură indirectă între scală şi frecvenţă. În particular, pentru fereastra Gaussiană, frecvenţa variază exponenţial în raport cu scala, fenomen aşteptat, avînd în vedere localizarea atomilor în planul timp-scală, descrisă în [SSP09]. De altfel, în contextul dicţionarului 0 [ ]wξE , pavajul rectangular variabil al planului timp-scală este acum rafinat prin înlocuirea fiecărui grup de celule corespunzătoare unei scale constante cu un pavaj rectangular constant, a cărui granularitate depinde de factorul de scală. Acesta este, de fapt, planul timp-frecvenţă-scală. Considerînd că dicţionarul 0 [ ]wξE conţine numai atomii [ , , ]m n kw redefiniţi prin:

( )

( ) ( )( )

0, 0 0

0,

[ , , ]

/ 20 0 0

[ ] q [ ]

e , ,

ml m

l m s

defk nm n k

j p k Tm ms

w p w p

w pT n p

ω + ω − τ α

ω + ω− −

= µ σ =

= α α − τ ∀ ∈Z (4.24)

pentru ,l rm M M∈ , , ,,l m r mn N N∈ şi 0, mk K∈ , rămîn de evaluat limitele de variaţie ale

indicilor de scală şi translaţie temporală. Fiecare celulă din laticea timp-frecvenţă a Figurii 4.2 este asociată elementelor principale ale unui atom timp-frecvenţă la scală constantă: momentul central 0,[ , , ]m n kt (evaluat mai jos, în ecuaţia (4.27)), respectiv pulsaţia

centrală, 0,[ , , ] 0,m n k l mkω = ω + ω . Avînd în vedere însă că expresiile acestora conţin constante

cunoscute, exprimarea axelor laticii poate fi simplificată considerînd numai indicii de ecart temporal şi de modulaţie armonică. Astfel, aşa cum este sugerat şi în figură, fiecare atom timp-frecvenţă poate fi localizat în latice pur şi simplu de coordonatele întregi ( , )n k . Înainte de a determina numerele întregi lM , rM , ,l mN şi ,r mN , trebuie precizat pasul de

translaţie temporală, 0τ . Pentru a menţine un grad de redundanţă suficient de ridicat,

acest pas poate fi ales egal cu perioada de eşantionare, sT . Dacă aceasta nu este precizată pentru semnalul analizat (discret), atunci ea poate fi evaluată plecînd de la numărul de eşantioane ale acestuia şi dimensiunea suportului ferestrei mame continuale. De regulă, numărul de eşantioane yN este o putere a lui 2, avînd în vedere că factorul de

scală este 0 1/ 2α = (dar aceasta nu constituie o restricţie). Împărţind dimensiunea

suportului practic al ferestrei mamă la ( )1yN − , rezultă valoarea perioadei de eşantionare.

În urma eşantionării cu această perioadă, fereastra mamă discretizată va avea yN

eşantioane, ca şi semnalul original. De exemplu, în cazul ferestrei Gaussiene, perioada de eşantionare se poate evalua folosind suportul de dimensiune 6λ , ceea ce conduce la:

( )6 / 1def

s yT N= λ − . Dacă nici λ nu poate fi precizat, atunci se alege arbitrar 1sT = , rezultînd

automat: ( )1 / 6def

yNλ = − . Tot în cazul acestei ferestre, momentul central trebuie poziţionat

la jumătatea suportului: ( )0 1 / 2y st N T= − .

Fereastra mamă poate fi considerată cel mai dilatat atom din dicţionar, avînd în vedere că atomii participă la evaluarea produselor scalare cu semnalul original. Astfel, 0lM = . Ceilalţi atomi vor fi contractaţi (adică indicele de scală va fi nenegativ).


70

Limita de contracţie este dată de spectrul cel mai dilatat, care corespunde atomului nemodulat armonic celui mai contractat. Evident, amprenta spectrală a acestui atom trebuie cel mult să se suprapună peste spectrului semnalului original. Cu alte cuvinte, lărgimea benzii la jumătate de putere ( ,[ , ,0] ,[ , ,0]c m n c m n

+ −ω − ω ) trebuie să fie cel mult egală cu

lărgimea de bandă a semnalului ( r lω − ω ). Din această ecuaţie va rezulta valoarea maximă

a indicelui de scalare, rM M= . De exemplu, în cazul ferestrei Gaussiene:

,[ , ,0] ,[ , ,0]c m n c m n r l+ −ω − ω ≤ ω − ω ⇔

( )0

log2 ln 2

r lm Mα

⎢ ⎥⎛ ⎞λ ω − ω≤ − =⎢ ⎥⎜ ⎟

⎝ ⎠⎣ ⎦, (4.25)

ţinînd cont că 0 1/ 2 1α = < .

În fine, pentru fiecare indice de scală 0,m M∈ , fereastra mamă contractată aferentă se

poate deplasa temporal între limitele date de următoarea restricţie marginală: momentul central (4.11) nu trebuie să depăşească limitele suportului temporal al semnalului original. Acestă restricţie are ca scop diminuarea efectelor marginale provocate de excentricitatea suporturilor semnalului original şi atomilor aflaţi în poziţii extreme, în evaluarea produselor scalare. Cîteva calcule elementare arată că momentul central al atomului [ , , ]m n kw este:

0,[ , , ] 0 0 0 0 0m m

m n k st t n t nT= α + τ = α + , (4.26)

unde 0t este momentul central al undei mamă. Restricţia marginală conduce atunci la următoarele inegalităţi:

0,[ , , ]0 ( 1)m n k st N T≤ ≤ − ⇔ 0 0 0 0, , ( 1)

m m

l m r ms s

t tN n N NT T

⎢ ⎥ ⎡ ⎤α α− = ≤ ≤ = − −⎢ ⎥ ⎢ ⎥

⎣ ⎦ ⎢ ⎥. (4.27)

Se observă cu uşurinţă că ecarturile limită , 0l mN ≤ şi , 1r m yN N≥ − au amplitudini maxime

pentru 0m = , respectiv m M= , iar diferenţa dintre ele este constantă şi egală cu 2yN − .

Dicţionarul de forme de undă este acum construit şi configurat în funcţie de caracteristicile principale ale semnalului original. Parametrii necesari efectuări acestor operaţii sunt enumeraţi în Tabelul 4.1. Lista acestora este redundantă, în sensul că o parte dintre ei se pot deduce (folosind raţionamentul de mai sus) dacă ceilalţi sunt precizaţi a priori. Plecînd de la fereastra mamă Gaussiană (4.10), în stînga Figurii 4.3 sunt ilustraţi cîţiva atomi ai dicţionarului generat de aceasta. Spectrele atomilor sunt figurate în partea dreaptă. De exemplu, dacă semnalul original este de tip audio CD şi are 112 2048yN = =

eşantioane achiziţionate cu frecvenţa de 44.1 kHz (specifică datelor stocate pe CD), acest dicţionar include aproximativ 4.4 milioane de cuvinte organizate pe 9 nivele de scalare. Figura pune în evidenţă anvelopa atomilor ilustraţi, pentru a putea sesiza cu mai multă uşurinţă efectul Principiului de incertitudine. Dicţionarul discret 0 [ ]wξE defineşte o structură multi-rezoluţie redundantă locală a

spaţiului H . Subspaţiul generat de acesta este considerat suficient de bogat pentru a include şi partea utilă a semnalului analizat, tocmai datorită operaţiei de acordare. De altfel, definirea dicţionarului 0 [ ]wξE constituie o manieră de definire indirectă a

componentei utile. Cu toate acestea, construcţia acesteia nu este o operaţie simplă, în special din cauza numărului mare de cuvinte ale dicţionarului.


Tabelul 4.1. Parametri care definesc un dicţionar timp-frecvenţă-scală discret.

4.3. A În

mod

pune

dicţio

semndintre

Fa

exploFigur

fec m n fr pω

b e p in in

n

reastra sau undina generatoare: w (de exemplu, Gaussiană, caz în care ea este onfigurată precizînd parametrul de deschidere λ ); omentul central al ferestrei generatoare: 0t ;

umărul eşantioanelor semnalului original: 2PN = ; ecvenţa de eşantionare: 1/s sF T= ;

ulsaţiile normalizate de tăiere (estimate) ale semnalului original: lω (joasă) şi

h (înaltă);

aza de scalare: 0α ;

cartul temporal de discretizare: 0τ ;

ulsaţia fundamentală de modulaţie armonică (la scală nulă): 0,0ω ;

dicele maxim de scalare: M ; dicii extremi de ecart temporal: , 0,l m m M

N∈

& , 0,r m m MN

∈;

umărul de sub-benzi de frecvenţă ale fiecărei latici: K .

71

Figura 4.3. Atomi timp-frecvenţă-scală Gaussieni şi spectrele asociate.

lgoritmul urmăririi prin potrivire

pofida operaţiei de acordare, semnalul original discret, notat prin y , nu aparţine în

necesar subspaţiului generat de dicţionarul cu care este acordat, 0 [ ]wξE . Pentru a

în evidenţă faptul că şi semnalul y contribuie la construcţia şi configurarea

narului, acesta poate fi renotat prin 0 [ ]y wξE . Astfel, în general, 0 [ ]yy wξ∉ E (adică

alul nu face parte din subspaţiul generat de dicţionar), dar, datorită acordării, distanţa y şi 0 [ ]y wξE este minimală.

ptul că 0 [ ]yy wξ∉ E nu este însă întotdeauna dezavantajos. Proprietatea poate fi

atată pentru a defini componenta parazită (perturbatoare) a semnalului original, ca în a 4.4.

0,m m M∈


72

y ∆y

yE

0 [ ]y wξE

Figura 4.4. Principiul deparazitării semnalelor folosind un dicţionar timp-frecvenţă-scală.

Astfel, componenta utilă, notată prin yE , se obţine proiectînd semnalul original pe

subspaţiul 0 [ ]y wξE . Semnalul rezidual, y∆ se determină efectuînd diferenţa dintre

semnalul original şi componenta utilă. Acesta corespunde componentei parazite care trebuie înlăturată sau analizată separat. Evident, între cele două componente (definite doar convenţional în această manieră) există o diferenţă clară numai dacă proiecţia yE se

poate evalua cu precizie infinită. Altfel, între cele două componente nu se poate trasa o linie de demarcaţie clară. Cu toate acestea, demarcajul este cu atît mai clar cu cît componenta utilă este estimată mai precis, utilizatorul avînd astfel posibilitatea să controleze cantitatea de zgomot care mai poate corupe componenta utilă. Redundanţa dicţionarului îngreunează în mod esenţial determinarea componentei utile, chiar dacă, aparent, evaluarea proiecţiei semnalului original nu ar trebui să ridice probleme. Pentru evaluarea acestei componente cu precizie controlată, Mallat şi Zhong au introdus conceptul de cel mai potrivit atom (cuvînt). Acesta este un atom al dicţionarului cu proprietatea de a avea cea mai mare valoare absolută a coeficientului de proiecţie pe semnalul curent analizat. Plecînd de la semnalul original y , se caută mai întîi atomul cel mai potrivit

corespunzător, notat prin 0wγ , unde, prin definiţie, [ ]0 0 0 0, ,m n kγ = . Astfel,

0, ,y w y wγ γ≥ , 0 [ ]yw wξγ∀ ∈E . (4.28)

Odată găsit, atomul cel mai potrivit traduce o parte din informaţia transportată de semnal, astfel că proiecţia semnalului pe acest atom poate fi înlăturată prin scădere:

0 01 ,

defy y y w wγ γ∆ ≡ − . (4.29)

În definiţia (4.29), 1 y∆ este prima aproximare a reziduului y∆ , aproximare care, probabil, continuă să transporte o cantitate importantă de informaţie utilă. De altfel, chiar şi semnalul original poate fi considerat o astfel de aproximare, notată prin 0 y∆ .

Noul semnal pentru care se caută acum cel mai potrivit atom este acum 1 y∆ . Atomul,

notat prin 1wγ (cu [ ]1 1 1 1, ,m n kγ = ), verifică proprietatea:

11 1, ,y w y wγ γ∆ ≥ ∆ , 0 [ ]yw wξγ∀ ∈E . (4.30)

iar reziduul următor este:

1 12 1 1 ,

defy y y w wγ γ∆ ≡ ∆ − ∆ . (4.31)

În general, şirul de reziduuri succesive care aproximează reziduul ideal y∆ verifică următoarea relaţie de recurenţă (numită şi relaţie de urmărire):

1 , i idef

i i iy y y w wγ γ+∆ ≡ ∆ − ∆ , 0i∀ ≥ , (4.32)


73

unde atomul curent cel mai potrivit, iwγ (cu [ ], ,i i i im n kγ = ), verifică proprietatea:

, ,ii iy w y wγ γ∆ ≥ ∆ , 0 [ ]yw wξγ∀ ∈E , (4.33)

Procedeul iterativ continuă pînă cînd se verifică următoarea inegalitate:

( ) ( )

( )

2 21 1

2i i i i

ii

y y y yyy

+ +∆ − ∆ ∆ − ∆= < ε

∆∆

E EE

, (4.34)

unde 0ε > este un prag de precizie predefinit. Dacă inegalitatea (4.34) se verifică pentru un indice Iε , atunci componenta utilă a semnalului este aproximată de combinaţia liniară a

celor mai potriviţi 2Iε + atomi determinaţi anterior:

1

0

, i i

I

ii

y y w wε +

γ γ

=

≅ ∆∑E , (4.35)

Mai mult, componenta parazită este aproximată de reziduul 2I yε +

∆ , care este aproape

ortogonal pe subspaţiul 0 [ ]y wξE . Împreună, ele reconstituie, prin superpoziţie, întregul

semnal original:

1

20

, i i

I

i Ii

y y w w yε

ε

+γ γ

+=

≡ ∆ + ∆∑ . (4.36)

Este acest procedeu iterativ convergent? Cu alte cuvinte, este posibilă verificarea testului de stop (4.34)? Răspunsul afirmativ la aceste întrebări este oferit de o proprietate remarcabilă, corelată intim cu o formă de ortogonalitate (deşi reamintim că nu toţi atomii dicţionarului sunt ortogonali între ei). În [MaZh93] s-a demonstrat că energia reziduurilor succesive scade pe măsură ce procesul iterativ avansează. Demonstraţia se bazează pe o egalitate aparent surprinzătoare, similară relaţiei lui Pitagora într-un un triunghi dreptunghic:

22 2

1 , ii i iy y y wγ

+∆ = ∆ + ∆ ⇔ ( ) ( )2

1 , ii i iy y y wγ

+∆ = ∆ + ∆E E , 0i∀ ≥ . (4.37)

Remarcabil este faptul că identitatea se verifică indiferent dacă atomii dicţionarului sunt sau nu ortogonali între ei. Ortogonali sunt însă reziduul 1i y+∆ şi proiecţia reziduului i y∆ pe atomul cel mai potrivit corespunzător, aşa cum catetele unui triunghi dreptunghic sunt ortogonale. Mai precis, folosind definiţia (4.32) şi proprietatea atomilor din dicţionar de a avea energie unitară, se probează imediat proprietatea de ortogonalitate invocată:

1

2 2

, , , , , , ,

, , 0 , 0.

i i i i i i i i

i i

i i i i i i

i i

y y w w y y w w y w w y w w

y w y w i

γ γ γ γ γ γ γ γ+

γ γ

∆ ∆ = ∆ ∆ − ∆ ∆ =

= ∆ − ∆ = ∀ ≥ (4.38)

Identitatea (4.37) arată că, treptat, energia semnalului original este disipată în coeficienţii de proiecţie ai atomilor celor mai potriviţi. Acest fenomen este ilustrat şi în Figura 4.5, unde grosimea vectorilor succesivi scade, sugerînd diminuarea energiei reziduurilor sau proiecţiilor pe care le reprezintă. Pragul 0ε > este de fapt cel care controlează maniera de separare dintre cele două componente ale semnalului original sau cantitatea de zgomot care mai poate distorsiona componenta utilă. De notat totuşi că proprietatea (4.37), de conservare a energiei, se verifică pentru orice atom din dicţionar, nu neapărat pentru cel mai potrivit dintre ei. Dacă se aleg însă atomii cei mai potriviţi, energia se disipă într-un număr sensibil mai mic de coeficienţi de proiecţie.


74

2 y∆1y∆

1I yε +

∆

, I II y w wε ε

ε

γ γ∆

1 11 ,y w wγ γ∆

0 0,y w wγ γ

y

I yε

∆

Figura 4.5. Principiul urmăririi prin potrivire.

Rezultă că se poate realiza nu doar deparazitarea, ci eventual şi compresia semnalului original, prin memorarea doar a coeficenţilor de proiecţie şi a indicilor acestora. Însă, pentru a evalua coeficienţii de proiecţie, sunt folosite reziduuri succesive şi nu semnalul original. Adică, în general:

, ,i ii y w y wγ γ∆ ≠ , i∀ ∈N . (4.39)

În ceea ce priveşte indicii atomilor celor mai potriviţi, ei pot induce un efort semnificativ de memorare, în special dacă numărul atomilor este mare. Astfel, fiecare atom este reprezentat nu doar de valoarea sa, ci şi de 3 valori întregi asociate poziţiei sale în dicţionar. Şi în dicţionarele lingvistice, fiecărui cuvînt i se asociază nu doar explicaţia semantică, ci şi pagina plus poziţia pe pagină a cuvîntului.

4.4. Căutarea atomilor celor mai potriviţi cu ajutorul unui Algoritm Genetic

Algoritmul urmăririi prin potrivire este practic reprezentat de relaţiile (4.33) (întîi se determină atomul cel mai potrivit), (4.32) (apoi se evaluează reziduul următor) şi (4.34) (iar în final se testeză dacă urmărirea poate înceta). Problema cea mai dificilă o constituie determinarea atomului celui mai potrivit, care, teoretic, revine la evaluarea proiecţiilor reziduului curent pe toţi atomii dicţionarului. Dacă dicţionarul posedă un număr redus de atomi (cel mult de ordinul zecilor de mii), găsirea celui mai potrivit dintre ei se poate realiza printr-o căutare exhaustivă. În aplicaţii, însă, dicţionarele trebuie să fie suficient de bogate pentru a realiza o deparazitare satisfăcătoare a semnalului original. Complexitatea unui dicţionar timp-frecvenţă-scală creşte extrem de sensibil odată cu indicele de scală, aşa cum ilustrează şi exemplul din Figura 4.3, unde, pentru numai 9 nivele de scalare, se obţin peste 4 milioane de atomi. Căutarea exhaustivă a celui mai potrivit atom pentru fiecare reziduu este evident ineficientă în acest caz. De aceea, se apelează la alte tehnici de căutare. Determinarea celui mai potrivit atom este o problemă granulară de optimizare, în care se doreşte maximizarea funcţiei cost reprezentate de modulul produsului scalar dintre un semnal şi atomii dicţionarului. Funcţia cost este puternic neliniară şi poate prezenta un număr de extreme comparabil cu numărul total al valorilor sale. Pentru maximizarea ei, se poate utiliza fie o tehnică euristică (cum este, de exemplu, IDA*), fie o strategie evoluţionară, cum este PSO sau cea specifică Algoritmilor Genetici (AG) [MiM95]. În continuare, va fi descrisă maniera de configurare a unui AG utilizat pentru rezolvarea problemei de urmărire în dicţionarul timp-frecvenţă-scală. Acum se poate justifica numele de GAMP asociat algoritmului rezultat: Genetic Algorithm for Matching Pursuit (Algoritmul Genetic al Urmăririi prin Potrivire).


75

Plecînd de la dicţionarul 0 [ ]y wξE , mulţimile de variaţie ale indicilor atomilor pot fi notate

prin: 0,def

M=M (pentru indicii de scală), def

mm∈

= ∪M

N N cu , ,,def

m l m r mN N=N , m∀ ∈M (pentru

indicii de ecart temporal) şi def

mm∈

= ∪M

K K cu 0,def

m mK=K , m∀ ∈M (pentru indicii de

modulaţie armonică). Atunci problema granulară de optimizare se poate formula astfel:

arg max , arg max [ ] [ ]i i ip

y w y p w pγ γ

γ∈ × × γ∈ × × ∈

γ = ∆ = ∆∑ZM N K M N K

, i∀ ∈N . (4.40)

Suma din ecuaţia (4.40) este în realitate finită, deoarece suportul semnalului original este finit, iar atomii dicţionarului sunt esenţial localizaţi tot într-un suport finit. De altfel, modulul acestei sume este chiar funcţia de potrivire (fitness), care trebuie maximizată. Strategiile evoluţionare care pot fi utilizate pentru maximizarea funcţiei de potrivire se bazează pe două concepte inspirate de comportamentul sistemelor biologice: evoluţie şi adaptare. Ambele concepte ascund procese de optimizare ale sistemelor biologice, dar printr-o abordare mai degrabă paralelă decît secvenţială. Într-o accepţie generală, un sistem biologic este constituit din una sau mai multe populaţii de entităţi dotate cu viaţă, care, interacţionînd între ele şi cu mediul înconjurător, evoluează şi se adaptează de la o generaţie la alta, potrivit unui program (în general) necunoscut. Generaţia unei populaţii este constituită în mare parte din indivizi selectaţi natural, capabili să codifice, modifice şi transmită generaţiei următoare cele mai valoroase experienţe de viaţă. Prin evoluţie se înţelege un proces îndelungat, de-a lungul mai multor generaţii, în urma căruia nivelul de viaţă al sistemului biologic este îmbunătăţit, pe seama transmiterii între generaţii a celor mai valoroase experienţe moştenite şi (eventual) trăite. Adaptarea este un proces mai scurt, eventual, pe durata de viaţă a unei generaţii, care constă adesea în modificarea experienţelor de viaţă ale sistemului biologic, provocată de necesitatea creşterii eficienţei acţiunilor populaţiei şi/sau a nivelului de viaţă a acesteia într-un anumit mediu. Grosso modo, evoluţia este un şir de etape de adaptare succesive parcurse de către sistemul biologic de-a lungul timpului, pentru optimizarea nivelului său de viaţă. Cercetările privind corelaţiile dintre evoluţie şi adaptare au început cu mult timp în urmă, probabil mai intens după introducerea de către Charles Darwin a controversatei (la acea dată şi chiar şi astăzi) Teorii a Evoluţiei [DaC1859], [DaC1871]. Abordările mai recente au însă ca obiectiv modelarea şi simularea evoluţiei prin adaptări succesive ale unui sistem biologic folosind tehnica de calcul. Acesta a favorizat apariţia şi dezvoltarea domeniului Strategiilor Evoluţionare, care este constituit din modele şi tehnici de simulare ale fenomenului de evoluţie prin adaptare, indiferent dacă sistemele modelate includ entităţi înzestrate cu viaţă sau nu. Acest domeniu face parte din Ştiinţa Calculatoarelor. Dintre tehnicile evoluţionare, AG se disting atît prin apropierea lor de fenomenele biologice intime care stau la baza evoluţiei şi adaptării, cît şi prin ideea modelării fenomenului de selecţie naturală (care, potrivit lui Darwin, stă la baza evoluţiei). Astfel stările optime ale sistemului sunt atinse de către acele generaţii care includ indivizii cei mai bine selectaţi natural. Cu toate acestea, subliniem încă o dată că strategiile evoluţionare (deci şi AG) nu pot garanta determinarea optimului, dar acesta este urmărit (poate chiar atins) printr-un proces iterativ. Primele concepte legate de AG au fost introduse în 1975 de către John Holland [HoJH75], dar o foarte bună descriere a domeniului AG a fost realizată după 20 de ani, în 1995, de către Melanie Mitchell [MiM95]. (După cum afirma John Holland, cartea publicată în 1995 de Melanie Mitchell este cea mai bună lucrare despre Algoritmi Genetici scrisă pînă la acea dată.) Astfel, un AG este definit ca o procedură cu ajutorul căruia se poate simula procesul de evoluţie prin adaptare a unui sistem (biologic sau nu). Convergenţa


76

acestei proceduri nu a fost însă niciodată demonstrată riguros. Cu toate acestea, în decursul timpului, au fost formulate o serie de ipoteze care redefinesc noţiunea de convergenţă: convergenţa genetică. Ipotezele de convergenţă genetică au fost formulate şi de către Holland în [HoJH75], ele fiind completate ulterior în publicaţii ca [NiVo91] sau [RaWh93]. Pe baza acestora, sunt studiate o serie de proprietăţi legate de convergenţă, ca efecte ale operatorilor genetici aplicaţi în cursul selecţiei candidaţilor la optim. Convergenţa este o proprietate determinată practic de compromisul dintre numărul de indivizi candidaţi la optim ai unei populaţii şi diversitatea acelei populaţii. Cu cît o populaţie conţine mai mulţi astfel de candidaţi, ea este mai puţin diversă şi creşte riscul ca optimul să fie doar unul local, capturat de aceşti indivizi. Cu cît diversitatea populaţiei este mai mare, numărul de candidaţi la optim ai acesteia este mai mic şi cresc atît incertitudinea cît şi timpul de căutare în determinarea optimului. AG nu constituie instrumente universale în rezolvarea problemelor granulare de optimizare. Proiectarea lor este delicată, necesită precizarea a numeroşi parametri (în general în urma unui mare număr de simulări) şi performanţele lor pot fi neaşteptat de scăzute (chiar şi după o proiectare atentă). Cu toate acestea, AG s-au dovedit a funcţiona surprinzător de bine într-o serie de aplicaţii, printre care se numără şi cea de rezolvare a problemei (4.40), descrisă în continuare. În proiectarea unui AG, sunt utilizate concepte inspirate de Ştiinţele Naturale, cum ar fi: cromozom, genă, alele, genom, genotip, fenotip, diploid, haploid, populaţie, generaţie, părinţi, urmaşi, selecţie naturală, încrucişare, mutaţie, inversiune, viabilitate, fertilitate, potrivire, etc. Definiţiile acestor concepte sunt sumarizate în [MiM95], astfel că nu vor fi formulate decît cele strict necesare în proiectarea AG utilizat în rezolvarea problemei granulare (4.440). Primul concept de interes în contextul dicţionarului timp-frecvenţă-scală 0 [ ]y wξE este cel

de cromozom. În general, în orice AG, cromozomii reprezintă indivizii unei populaţii. Dintre aceştia se recrutează candidaţii la punctele de optim. În particular, pentru dicţionarul

0 [ ]y wξE , cromozomii sunt asociaţi indicilor atomilor componenţi, γ ∈ × ×M N K . Orice

cromozom este format din gene. Dată fiind structura dicţionarului, cromozomii timp-

frecvenţă-scală, notaţi prin , ,m n kγ , sunt formaţi din cîte 3 gene: , , | |def

m n k m n k⎡ ⎤γ = γ γ γ⎣ ⎦ . Fiecare

genă este asociată unuia dintre cei 3 indici, într-o manieră foarte directă: ea constituie reprezentarea binară a indicelui, aşa cum ilustrează Figura 4.6.

21 log #+ ⎢ ⎥⎣ ⎦M γ n

21 log #+ ⎢ ⎥⎣ ⎦N 21 log #+ ⎢ ⎥⎣ ⎦K γ m γ k

Figura 4.6. Definiţia unui cromozom timp-frecvenţă-scală.

Pe figură sunt marcate lungimile genelor măsurate în numere de biţi de reprezentare, luînd în considerare numărul de valori ale indicilor asociaţi sau cardinalele mulţimilor M , N şi K . Pentru gena de scalare, mγ , mulţimea M conţine 1M + valori. Gena de

translaţie temporală, nγ , trebuie să beneficieze de un număr de biţi corespunzător diferenţei dintre maximul indicelui de extremă dreaptă ,r mN şi minimul indicelui de extremă

stîngă ,l mN , pentru a lua în considerare toate valorile posibile. Conform inegalităţii (4.27),

ştiind că 0 1/ 2 1α = < , valorile extreme se ating pentru m M= , respectiv 0m = , astfel că:

0 0 0 0 0#2

M

y y Ms s s s

t t t tN NT T T T

⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎢ ⎥α= − + = − +⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥

⎢ ⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦N . (4.41)


77

În fine, numărul maxim valori care defineşte lungimea genei de modulaţie armonică, kγ , se atinge pentru 0m = , conform ecuaţiilor (4.22) şi (4.23). Astfel, 0# 1K= +K . În general, lungimea genei de scalare este mult mai mică decît lungimile celorlalte două gene (ea nu depăşeşte 4 biţi). Aceasta permite restricţionarea cromozomului la ultimele

două gene ( , |def

n k n k⎡ ⎤γ = γ γ⎣ ⎦ ) şi proiectarea unei tehnici euristice hibride, în care căutarea

optimului se va efectua în două etape succesive. Mai întîi se caută cromozomii optimi cu ajutorul unui AG la nivelul fiecărei scale (eventual în paralel). Apoi se caută exhaustiv cromozomul optim dintr-un şir cu doar 1M + valori, cîte una pentru fiecare scală. Restrîngerea cromozomului timp-frecvenţă-scală la un cromozom timp-frecvenţă are şi alte avantaje (în afara posibilităţii de a acţiona în paralel pe toate scalele odată, deci de a reduce semnificativ timpul de căutare). Astfel, cromozomii produşi prin operaţii genetice nu mai riscă să fie asociaţi unor indici de ecart sau de modulaţie cu valori incorecte (adică din afara mulţimilor de variaţie pentru un anumit indice de scală). De asemenea, lungimile celor două gene rămase pot fi reduse adaptiv, în funcţie de indicele de scală. Mai precis, pentru fiecare m∈M , lungimea genei nγ este dată de:

0 0 0 0, ,# 1 1

m m

m r m l m y ys s

t tN N N NT T

⎡ ⎤ ⎢ ⎥α α= − + = − + = −⎢ ⎥ ⎢ ⎥

⎢ ⎥ ⎣ ⎦N , (4.42)

dacă 0 0 /mst Tα nu este întreg sau de # m yN=N dacă 0 0 /m

st Tα este întreg. Acoperitor, se

poate considera că lungimea acestei gene este 21 log yN⎢ ⎥+ ⎣ ⎦ biţi, indiferent de indicele de

scalare. În ceea ce priveşte gena kγ , pentru fiecare m∈M , lungimea acesteia este egală

cu 21 log ( 1)mK+ +⎢ ⎥⎣ ⎦ biţi.

La nivelul unei scale de indice oarecare m∈M , căutarea cromozomului optim (care va corespunde atomului celui mai potrivit la iteraţia i∈N ) se efectuează prin rezolvarea problemei de optimizare (4.440), adică prin maximizarea funcţiei de potrivire curente:

, [ , , ], [ ] [ ]def

n k m n ki i

p

m y p w p∈

⎡ ⎤γ = ∆⎣ ⎦ ∑Z

g , (4.43)

în raport cu ,n kγ . Aşadar, funcţia de potrivire se modifică la fiecare iteraţie a procesului de

urmărire prin potrivire. Cromozomul candidat la optim face parte dintr-o populaţie mΓ avînd o anumită

dimensiune, mult mai mică, în general, decît numărul de atomi timp-frecvenţă ai dicţionarului, de la scala de indice m . De exemplu, pentru dicţionarul din care au fost extraşi atomii ilustraţi în Figura 4.3, cele 1 9M + = populaţii de cromozomi vor fi de ordinul sutelor sau cel mult de ordinul miilor (pe scalele joase, unde se află mai mulţi atomi – a se vedea numerele de atomi ai fiecărei scale pe coloana din stînga a figurii). O astfel de populaţie conservă un număr constant de cromozomi, dar, în cursul căutării celui optim, cromozomii din populaţie nu sunt mereu aceiaşi. Populaţia evoluează prin înlăturarea unora dintre cromozomii care nu mai pot constitui candidaţi la optim şi înlocuirea lor cu alţii selectaţi natural, cu valori mari ale funcţiei de potrivire. Pentru a realiza reîmprospătarea populaţiilor, se utilizează operaţii genetice aplicate cromozomilor pe care acestea îi conţin. Există 3 astfel de operaţii genetice folosite frecvent în cadrul unui AG, care vor fi descrise în continuare: încrucişare (crossover) cu probabilitatea croP , mutaţie (mutation) cu probabilitatea mutP şi inversiune (inversion) cu

probabilitatea invP .


78

Pentru a descrie maniera în care acţionează cele 3 operaţii genetice, se consideră un cromozom binar oarecare γ , de lungime L . Fiecare dintre aceste operaţii este determinată de 2 parametri (în afara probabilităţii aferente): lungimea zonei din cromozom care va fi afectată, numită ad hoc genă de operare şi un pointer numit pivot, care indică începutul acestei zone. Pentru acelaşi cromozom, pot fi selectate mai multe gene de operare şi pivoţi. În principiu, oricare dintre biţii cromozomului are aceeaşi probabilitate de a fi selectat ca pivot, dar operaţia genetică aleasă nu poate fi aplicată pentru orice pivot selectat. De exemplu, bitul cel mai puţin semnificativ, adică LSB (Least Significant Bit) – situat în extrema dreaptă a cromozomului – nu pote fi pivot pentru încrucişări şi inversiuni, deoarece lungimea genei de operare trebuie să fie cel puţin egală cu 2. În schimb, LSB poate fi ales ca pivot pentru o mutaţie, unde lungimea genei este egală cu 1. Definiţiile celor 3 operatori sunt ilustrate sugestiv în Figurile 4.7, 4.8 şi 4.9.

pivot

P1L P1R P1C

P2L P2R P2C

P1L P1R

P2L P2R P2C P1C P1L P1R P2C

P2L P2R P1C

Cromozomi părinţi

Cromozomi urmaşi

lungime

Figura 4.7. Definiţia încrucişării genetice.

pivoţi

Cromozom părinte

Cromozom urmaş

Figura 4.8. Definiţia mutaţiei genetice.

pivot

Cromozom părinte

Cromozom urmaş

lungime

Figura 4.9. Definiţia inversiunii genetice.

Încrucişare genetică (Figura 4.7). Această operaţie necesită doi cromozomi, numiţi părinţi. Prin încrucişare, ei vor genera doi cromozomi urmaşi (offspring). Aşa cum ilustrează şi Figura 4.7, încrucişarea constă în schimbarea între cei doi cromozomi părinţi a zonelor genetice selectate şi la fel poziţionate. Prin aceasta, cele două reprezentări binare produc alte două reprezentări binare, în general diferite de cele originale. Numai biţii din poziţiile 2 ,3 , ..., L pot fi selectate ca pivoţi, considerînd că LSB se află pe poziţia 1 . Probabilitatea de a selecta un pivot în poziţia oarecare

2,p L∈ este constantă şi egală cu /( 1)cro L −P . Probabilitatea de a selecta LSB ca

pivot este egală cu probabilitatea de a anula operaţia de încrucişare, adică 1 cro−P .


79

De altfel, dacă LSB este selectat, atunci încrucişarea cromozomilor se anulează. Prin această atribuire de probabilităţi la nivelul biţilor, s-a definit o distribuţie de probabilitate asociată cromozomilor părinţi, exprimată sintetic astfel:

| 1

1 1 11 2 | 1

defcro cro cro

cro croL L Lp L p L p p

⎡ ⎤= −⎢ ⎥− − −⎣ ⎦= = − = =

P P PPp

. (4.44)

Aceasta serveşte la selecţia pivoţilor cu probabilitate predeterminată sau inhibarea operaţiei de încrucişare, cu ajutorul unui mecanism care va fi descris ulterior (tot în cadrul acestui paragraf). Acelaşi mecanism este utilizat pentru a selecta lungimea genei de operare. Mai precis, pentru pivotul din poziţia 2,p L∈ , lungimea genei de

operare aparţine mulţimii 2, p . Acesteia i se atribuie o densitate de probabilitate uniformă de valoare /( 1)cro p −P (ţinînd cont de numărul de lungimi posibile).

Mutaţie genetică (Figura 4.8). Pentru această operaţie, este suficient un singur cromozom părinte, care, printr-un mecanism de auto-flagelare, se va transforma în propriul său urmaş. Mecanismul constă în selectarea unui anumit număr de pivoţi şi în schimbarea valorilor biţilor pe care aceştia îi indică, în valori opuse: bitul 0 devine 1 şi bitul 1 devine 0. Probabilitatea de a selecta un pivot în poziţia oarecare 1,p L∈ (inclusiv LSB poate juca acest rol) este constantă şi egală cu mutP . Rezultă că

probabilitatea de a sări peste bitul respectiv este 1 mut−P . Prin această atribuire de probabilităţi, selecţia pivoţilor s-ar putea efectua considerînd densitatea de probabilitate [ ]| 1mut mut−P P la nivelul fiecărui bit al cromozomului părinte. Mutaţia nu

ar mai avea loc atunci cînd nu s-ar selecta nici un pivot. O altă abordare, mai eficientă din punctul de vedere al mecanismului de selecţie, constă în construcţia unei distribuţii de probabilitate la nivel de cromozom şi nu la nivel de bit. Astfel densitatea de probabilitate a fiecărui bit sugerează definirea unei densităţi de probabilitate asociată cromozomului, după cum urmează:

1 1

1 1

defmut mut mut mut

mut L L L Lp L p p L p

− −⎡ ⎤= ⎢ ⎥⎣ ⎦

= = = =

P P P Pp. (4.45)

Lungimea acesteia este dublă, pentru a permite ca orice bit să poată fi ales ca pivot sau, din contră să nu joace rol de pivot. Dacă bitul selectat este poziţionat în prima jumătate a distribuţiei (4.45), el îşi va asuma rolul de pivot, altfel, el nu va fi afectat de mutaţie. În cazul în care acelaşi bit este selectat de două ori şi beneficiază de cîte o selecţie în fiecare jumătate, el nu va fi afectat de mutaţie (selecţiile sale se anihilează reciproc). Pentru a juca rolul de pivot, numărul selecţiilor sale din prima jumătate trebuie să fie mai mare decît numărul selecţiilor din a doua jumătate. De regulă, probabilitatea de a efectua mutaţii este mult mai mică decît probabilitatea de a efectua încrucişări. Astfel, dacă încrucişarea este evitată, aproape sigur şi mutaţia va fi evitată. Mai precis, biţii selectaţi vor face parte din a doua jumătate a distribuţiei (4.45) într-un număr covîrşitor de selecţii. Pentru a nu irosi timp de calcul fără a efectua operaţii genetice asupra cromozomilor, dacă operaţia de încrucişare a fost inhibată, automat, probabilitatea de a aplica inversiuni trebuie să crească. De exemplu, în acest caz, se poate considera că mut cro=P P . De altfel, mutaţia poate fi

vazută ca o încrucişare a unui părinte cu el însuşi, genele de operare avînd lungime unitară.


80

Inversiune genetică. (Figura 4.9). Şi pentru această operaţie este suficient un singur cromozom părinte, care se va transforma în propriul său urmaş. Transformarea constă în selectarea unei gene de operare în interiorul căreia biţii sunt enumeraţi în ordine inversă. Astel, în cadrul genei, LSB devine MSB (Most Significant Bit – bitul cel mai semnificativ) şi reciproc. Probabilitatea de a selecta un pivot în poziţia oarecare 2,p L∈ (cu convenţia din cazul încrucişarii) este constantă şi egală cu

/( 1)inv L −P . Probabilitatea de a selecta LSB ca pivot este egală cu probabilitatea de a

anula operaţia de inversiune, adică 1 inv−P . Ca şi încazul încrucişării, inversiunea se anulează dacă LSB este selectat. Distribuţia de probabilitate asociată biţilor din cromozom este similară lui (4.44):

| 1

1 1 11 2 | 1

definv inv inv

inv invL L Lp L p L p p

⎡ ⎤= −⎢ ⎥− − −⎣ ⎦= = − = =

P P PPp

. (4.46)

Selecţia lungimii genei de operare se realizează ca în cazul încrucişarii genetice. Astfel, pentru pivotul din poziţia 2,p L∈ , lungimea genei de operare aparţine mulţimii

2, p . Acesteia i se atribuie o densitate de probabilitate uniformă de valoare /( 1)inv p −P . Şi în acest caz, probabilitatea invP este cu mult inferioară probabilităţii

croP . Dacă nici încrucişarea şi nici mutaţia nu au fost selectate, atunci probibilitatea

de efectuare a unei inversiuni trebuie să crească, de exemplu, la valoarea croP .

În mod uzual, cele 3 probabilităţi variază în intervalele de mai jos:

[0.5,1]cro ∈P ; (0,0.1]mut ∈P ; (0,0.05]inv ∈P . (4.47)

Aceasta conduce la o aplicare mult mai frecventă a încrucişării decît a mutaţiei sau inversiunii, la fel cum se întîmplă şi în cazul sistemelor biologice. În mod normal, urmaşii sunt rezultatul încrucişării a doi părinţi diferiţi. Rareori se produc mutaţii sau inversiuni genetice, caz în care urmaşii se numesc mutanţi şi prezintă anomalii genetice care îi împiedică să treacă de procesul de selecţie naturală. Cu toate acestea, s-a demonstrat că unele specii au evoluat tocmai prin mutanţii acestora, ca urmare a unei necesităţi acute de adaptare la mediul lor de viaţă. Este posibil ca acest lucru să se fi înregistrat (şi să se mai înregistreze şi în viitor) în anumite etape ale evoluţiei speciei umane. De exemplu, expunerea prelungită la un mediu nociv (cu numeroşi agenţi chimici agresivi, dar neletali), obligă organismele vii să se adapteze treptat la acesta şi să-şi dezvolte un mecanism de protecţie împotriva noxelor sau asimlare a acestora. (Acesta se realizează mai mult prin mutaţii genetice decît prin alte modificări genetice.) De aceea, producerea de mutanţi nu este complet exclusă în cadrul unui AG, dar probabilităţile de apariţie a acestora trebuie să fie mult inferioare celor de apariţie a urmaşilor pe cale naturală, prin încrucişare. De regulă, încrucişarea este asociată evoluţiei, în timp ce mutaţia şi inversiunea sunt asociate mai degrabă adaptării. Pentru cromozomii timp-frecvenţă, operaţiile genetice se aplică fiecăreia dintre cele două gene, pentru a minimiza riscul de a produce urmaşi invalizi (adică indicînd cuvinte care nu există în dicţionar). În urma încrucişării sunt produşi 4 urmaşi (prin combinarea urmaşilor temporali cu cei frecvenţiali), în timp ce prin mutaţie sau inversiune se produce cîte un urmaş. Avînd în vedere că reprezentarea binară a indicilor este acoperitoare, cromozomul timp-frecvenţă mai poate lua şi valori invalide. Valorile invalide ale genei temporale nu sunt critice, deoarece ele indică atomi timp-frecvenţă-scală cu suportul prea excentric (centrat în jurul unui moment aflat mult în afara suportului semnalului analizat). Rezultă că valorile funcţiei de potrivire au amplitudini neglijabile (practic nule). În schimb, invaliditatea genelor frecvenţiale poate produce fenomenul de aliere în frecvenţă.


81

De aceea, pentru gena frecvenţială, valorile invalide pot fi corectate prin limitarea lor la valoarea maximă ( mK ) sau, mai corect, prin evaluarea restului împărţirii acestuia la

valoarea maximă ( % mk K ).

Urmaşii rezultaţi au, de regulă, valori de potrivire diferite de ale părinţilor. Un părinte este dominant dacă valoarea sa de potrivire este superioară celei a urmaşilor săi. Punctele de optim sunt recrutate din rîndurile cromozomilor dominanţi. Alegerea pivoţilor, a lungimii genelor de operare şi a cromozomilor, în vederea aplicării de operaţii genetice, se realizează cu ajutorul unui algoritm de generare de numere cu probabilitate prestabilită. Acesta se bazează pe o procedură ingenioasă de selectare a

unui element dintr-o mulţime 1,n n La

∈=A căreia i se asociază o distribuţie de probabilitate

1 2[ ]L=p p p p . Cu alte cuvinte elementul generic na are probabilitatea np de a fi

selectat. Procedura exprimă un mecanism de selecţie care simulează funcţionarea unei rulete şi a fost propusă de către J.E. Baker în [BaJE87] sub numele de Eşantionare Universală Stocastică (SUS – Stochastic Universal Sampling). (O comunicare interesantă pe această temă este şi [BaJE85].) În Anexa B este descrisă atît varianta originală a mecanismului SUS (reprezentată de Algoritmul lui Baker), cît şi o generalizare imaginată de noi pentru adaptarea acestui mecanism la contextul discţionarului timp-frecvenţă-scală. Generalizarea constă în înlocuirea distribuţiei de probabilitate p cu un set de numere nenegative a căror sumă nu

mai este în mod necesar egală cu 1. Astfel, selecţia unui element din A se va realiza în conformitate cu profilul p . Aşa cum se va observa în continuare, Algoritmul lui Baker va fi utilizat nu doar pentru selecţiile cerute de operaţiile genetice (unde intevine in varianta originală), ci şi în selectarea cromozomilor părinţi dintr-o populaţie dată (unde este necesară varianta generalizată). Construcţia şi reîmprospătarea populaţiilor de cromozomi se poate realiza după mai multe strategii posibile. În cadrul acestui paragraf a fost imaginată o strategie adaptată la contextul dicţionarului timp-frecvenţă-scală: strategia elitistă cu selecţie adaptivă bazată pe fenomenul călirii simulate de tip Boltzmann. Fenomenul călirii metalelor (adică al răcirii cu temperatură controlată) a sugerat o procedură de optimizare numită călire simulată (simulated annealing), utilizată în special în aplicaţii de Inteligenţă Artificială. (O descriere a acestei proceduri se găseşte în [RuNo95].) În contextul AG, va fi utilizată doar ideea fundamentală a călirii simulate, în care temperatura va fi controlată prin intermediul funcţiei Boltzmann. Strategia este descrisă în detaliu mai jos. Etapa cea mai importantă a unui AG o constituie selecţia cromozomilor care vor suferi operaţii genetice şi vor produce urmaşi. Ca principiu general, este de dorit ca mecanismul de selecţie să fie cît mai apropiat de cel al selecţiei naturale. Acest lucru va conduce la împrospătarea generaţiei curente a unei populaţii de cromozomi, notată ad hoc prin tΠ

(adică la momentul oarecare t∈N ). (Populaţiile de cromozomi conţin candidaţii la punctele de optim ale funcţiei de potrivire.) În urma împrospătării, noua generaţie a populaţiei este 1t+Π . De regulă, toate generaţiile au acelaşi număr de cromozomi, P ∗∈N ,

astfel că împrospătarea nu presupune doar adăugarea cromozomilor urmaşi rezultaţi din operaţiile genetice, ci şi eliminarea unor cromozomi care nu mai pot constitui candidaţi viabili. Astfel, în cadrul generaţiilor succesive, este păstrată în mod majoritar doar elita cromozomilor. Sunt totuşi conservaţi şi o serie de cromozomi comuni, pentru ca, prin operaţii genetice (în special încrucişare), să fie evitată degenerarea populaţiei, adică gruparea acesteia în jurul unui optim local al funcţiei de potrivire. Proporţia ocupată de elita cromozomilor în cadrul generaţiilor este notată prin [0,1)e ∈p . De exemplu, 10% dintre


82

cromozomii dominanţi (dar nu mereu aceiaşi!) sunt transferaţi nemodificat între generaţiile succesive, în timp ce restul de 90% trebuie produşi prin operaţii genetice. Principiul strategiei elitiste de selecţie este ilustrat în Figura 4.10.

∆t

Πt Πt+1

Elită Figura 4.10. Principiul strategiei elitiste de selecţie.

Astfel, un număr de eP⎢ ⎥⎣ ⎦p cromozomi distincţi ai generaţiei curente tΠ sunt moşteniţi

direct de către generaţia următoare, 1t+Π . Ei constituie elita curentă a populaţiei, dar unii

dintre ei (sau chiar toţi) pot pierde acest atribut în generaţia următoare, după completarea populaţiei. Restul de eP P− ⎢ ⎥⎣ ⎦p cromozomi ai generaţiei următoare 1t+Π (care trebuie să

fie tot distincţi) pot fi produşi prin operaţii genetice sau selecţii la întîmplare. În acest scop, este construită o populaţie temporară, t∆ , numită şi ∆ -populaţie. Ea conţine cromozomi

apţi pentru a se reproduce. Orice cromozom cu un grad de potrivire suficient de bun va migra în cadrul ∆ -populaţiei şi va căuta o pereche în vederea reproducerii. Numărul de cromozomi din t∆ este chiar eP P P∆ = − ⎢ ⎥⎣ ⎦p . Cînd se produc cromozomii urmaşi, ei sunt

trimişi în 1t+Π tot printr-o strategie elitistă, după cum urmează:

• în cazul încrucişării, sunt selectaţi primii 2 cromozomi dominanţi dintre cei 2 părinţi şi cei 4 urmaşi; • în cazul mutaţiei sau inversiunii este ales cromozomul dominant dintre părinte şi urmaşul său.

Strategia propusă mai sus este diferită de cea adoptată în cadrul majorităţii AG, unde urmaşii îi înlocuiesc pur şi simplu pe părinţi, indiferent de valoarea funcţiei de potrivire. Ea este însă mai eficientă din punctul de vedere al timpului de calcul. În plus, strategia elitistă reduce şansa de a nu detecta sau chiar de a înlătura optimul global prin selecţie. Există totuşi un pericol: elita poate opri evoluţia populaţiei, dominînd-o peste mai multe generaţii. Pentru a diminua acest efect negativ, un număr de cromozomi distincţi ai generaţiei 1t+Π

vor fi aleşi la întîmplare. Aceasta permite cromozomilor dominanţi să se poată împerechia cu cromozomi dominaţi, comuni, pentru a asigura diversitatea populaţiei şi a evita capturarea acesteia de către un optim local. Locurile libere din cadrul generaţiei 1t+Π care

trebuie ocupate de cromozomi distincţi aleşi la întîmplare sunt rezervate prin impunerea unei restricţii naturale: numai un număr de cel mult goM ∗∈N operaţii genetice sunt

permise, în vederea completării generaţiei. Dacă după epuizarea celor goM operaţii


83

genetice generaţia 1t+Π este incompletă (adică nu s-au produs P∆ cromozomi distincţi),

locurile rămase libere trebuie ocupate de către cromozomi aleşi la întîmplare. De regulă, pentru a permite intrarea cromozomilor întîmplători în cadrul populaţiei, este suficientă alegerea lui goM în gama 3 ,6P P . Aceasta permite ca, în medie, circa 10% dintre

cromozomii generaţiei următoare să fie aleşi la întîmplare. (Desigur, acest procent poate fi impus încă de la început.) Cum se construieşte totuşi ∆ -populaţia? Spre deosebire de generaţiile tΠ şi 1t+Π (care

trebuie să includă numai cromozomi distincţi), cele P∆ locuri din cadrul ∆ -populaţiei vor fi

ocupate de către cromozomii cei mai reprezentativi ai generaţiei tΠ , un cromozom putînd

ocupa mai multe locuri. Teoretic, reprezentativitatea ar trebui să reflecte capacitatea de reproducere a cromozomilor. Fiecare cromozom va fi reprezentat în t∆ de un număr de

clone ale sale proporţional cu posibilităţile sale reproductive (sau cu reprezentativitatea aferentă). Cel mai reprezentativ cromozom al generaţiei tΠ va ocupa numărul cel mai

mare de locuri în cadrul lui t∆ (adică va fi clonat de un număr maxim de ori în cadrul lui

t∆ ). Practic, reprezentativitatea unui cromozom trebuie cuantificată şi estimată prin

intermediul unei funcţii :t t +Π → RR . Odată determinată reprezentativitatea ( ),n kt γR a

fiecărui cromozom ,n ktγ ∈Π , se poate folosi Algoritmul generalizat al lui Baker pentru a

construi populaţia t∆ cu P∆ indivizi (adică mulţimea NU de cardinal M P∆= – a se vedea

Algoritmul B.2) din populaţia de generaţie tΠ cu P indivizi (adică din mulţmea NA de

cardinal N P= ), pe baza profilului de reprezentativitate ( ),n kt γR (avînd tot N P= valori).

Aceasta justifică generalizarea procedurii originale propuse de Baker, cu atît mai mult cu cît tR nu este în mod necesar o distribuţie de probabilitate.

Reprezentativitatea cromozomilor dintr-o populaţie poate fi cuantificată cu ajutorul funcţiei de potrivire. În literatura de specialitate, există mai multe definiţii propuse. Unele dintre acestea sunt formulate în [MiM95], cum ar fi: reprezentativitate proporţională cu funcţia de potrivire (bazată pe ideea originală a lui Holland din [HoJH75]), sigma-scalare (bazată pe un concept nou, de varianţă a unei populaţii), reprezentativitate proporţională cu rangul cromozomilor în cadrul populaţiei, reprezentativitate evaluată în urma unui turnir organizat între cromozomi, etc. Toate definiţiile apelează direct sau indirect la funcţia de potrivire. Pentru contextul dicţionarului timp-frecvenţă-scală, a fost imaginată o definiţie combinată, care utilizează călirea simulată şi funcţia Boltzmann de control al temperaturii de călire. Deşi combinaţia dintre funcţia Boltzmann şi strategia turnirului a mai fost utilizată în [GoDE90], iar combinaţia dintre aceeaşi funcţie şi călirea simulată a fost comunicată în [YaX91], abordarea noastră, prezentată mai jos, este diferită. Reprezentativitatea poate fi definită astfel încît rata de selecţie să se adapteze la fiecare generaţie. Un scenariu de selecţie ideal este următorul. La primele generaţii, cînd populaţia include un spectru larg de cromozomi, este mai propice o selecţie liberală decît una conservatoare, pentru a nu afecta prea rapid diversitatea populaţiei. Astfel, cromozomi dominanţi au şanse substanţiale să se împerechieze cu alţi cromozomi avînd valori modeste de potrivire. Deîndată ce populaţia atinge o generaţie cu un număr suficient de mare de cromozomi dominanţi (adică deîndată ce s-a conturat o elită), selecţia va deveni mai conservatoare, considerînd că diversitatea populaţiei a fost asigurată anterior. A continua să fie combinaţi cromozomi din elita proaspăt conturată cu unii comuni înseamnă a nu reuşi consolidarea elitei în cadrul populaţiei, ceea ce revine la o căutare aproape exhaustivă a optimului, adică ineficientă.


84

Acest scenariu corespunde foarte bine fenomenului de călire a oţelului. Este binecunoscut faptul că performanţele oţelului depind esenţialmente de programul de răcire controlată. Obiectivul principal al acestui program de răcire îl constituie obţinerea unui oţel cu un minim de tensiuni interne. Dacă răcirea se efectuează prea rapid, oţelul rezultat este dur, dar casant şi puţin tenace (din cauza tensiunilor interne prea mari). Dacă, din contră, răcirea se efectuează prea lent, componentele chimice adăugate fierului pentru a forma oţelul riscă să fie arse şi acesta va avea mai degrabă caracteristicile fierului. Astfel, scăderea temperaturii trebuie efectuată după un program precis, care să conducă la atingerea obiectivului de optimizare: minimizarea tensiunilor interne. (Aceasta justifică utilizarea călirii simulate ca procedură euristică de optimizare.) Procesul de călire a oţelului sugerează un scenariu de selecţie a cromozomilor pe bază de reprezentativitate, după cum urmează. Se notează prin cT temperatura de călire (variabilă în timp). Aceasta va fi utilizată pentru a adapta rata de selecţie la caracteristicile fiecărei generaţii. La primele generaţii, cT trebuie să aibă valori mari, aceasta forţînd rate mici de selecţii pentru toţi cromozomii, aproape indiferent de gradul lor de potrivire. Pe măsură ce cT scade, funcţia de potrivire începe să facă distincţia între cromozomi. Apar cromozomii din elită, recunoscuţi prin faptul că supravieţuiesc de-a lungul mai multor generaţii. Reprezentativitatea care exprimă acest fenomen este definită cu ajutorul funcţiei Boltzmann prin:

( )

( ),

,

exp[ ]

( )exp

[ ]t

n k

def cn kt

c

T tP

T tγ∈Π

⎡ ⎤γ⎢ ⎥⎢ ⎥⎣ ⎦γ =

⎡ γ ⎤⎢ ⎥⎣ ⎦

∑

g

gR , ,n k

t∀γ ∈Π , t∀ ∈N , (4.48)

unde g este funcţia de potrivire. Următorul pas îl constituie precizarea unei legi de variaţie corespunzătoare a temperaturii din definiţia (4.48). Tradiţional, aceasta se bazează pe conceptul de varianţă a unei generaţii (care, de fapt, cuantifică diversitatea populaţiei la un anumit de timp). Varianţa generaţiei tΠ se defineşte astfel:

( )22 1 ( ) ( )

t

def

t tP γ∈Π

⎡ ⎤σ Π = γ − Π⎣ ⎦∑g g g , t∀ ∈N , (4.49)

unde media generaţiei este:

1( ) ( )

t

def

t P γ∈Π

Π = γ∑g g , t∀ ∈N . (4.50)

În vecinătatea optimului, varianţa (4.49) trebuie să aibă valori cît mai mici, indicînd gruparea populaţiei în jurul acestuia, populaţia fiind formată din cromozomi cu grade mari de potrivire. La primele generaţii, varianţa prezintă valori importante, ceea ce arată că elita nu a fost încă bine conturată şi nu poate domina populaţia. Astfel, varianţa populaţiei (eventual normalizată cu un anumit factor) poate juca rolul temperaturii de călire. Mai general, temperatura poate fi definită astfel:

( )20

0[ ] ( ) ( )t

c t tTT t TP

α

α

αγ∈Π

⎧ ⎫⎪ ⎪⎡ ⎤= σ Π = γ − Π⎨ ⎬⎣ ⎦⎪ ⎪⎩ ⎭∑g g g , t∀ ∈N . (4.51)

unde 0α > este un factor de scală fixat.


85

Evaluarea varianţei la fiecare generaţie poate fi însă consumatoare de timp. În plus, nu este neapărat necesar ca varianţa să scadă de-a lungul generaţiilor, chiar pe termen lung. De aceea, temperatura de călire poate fi definită mai simplu prin:

max ( )

[ ]( )

tdef

ct

T t γ∈Πγ

=Π

g

g, t∀ ∈N , (4.52)

avînd în vedere că maximul funcţiei de potrivire trebuie oricum evaluat în fiecare generaţie (printr-o căutare exhaustivă). În plus, şansa ca media populaţiei să crească de-a lungul generaţiilor este mai mare decît şansa ca varianţa acesteia să scadă. În oricare dintre definiţiile anterioare, temperatura de călire nu înregistrează neapărat o scădere, ci o adaptare la caracteristicile fiecărei generaţii. De fapt variaţia înregistrată de temperatură poate cunoaşte mai multe salturi de-a lungul evoluţiei populaţiei. Ori de cîte ori generaţia curentă pare a se grupa în jurul unui optim, prin reîmprospătare, se deschide posibilitatea de a ieşi din captura acelui optim local, către altul, mai performant. Aceasta se produce prin intrarea în cadrul elitei a unui cromozom puternic dominant. Funcţia sa de potrivire poate fi departe de media generaţiei, fapt care produce creşterea temperaturii de răcire. Acest fenomen este ilustrat şi în Figura 4.11, pentru dicţionarul timp-frecvenţă-scală Gaussian din care au fost extraşi atomii Figurii 4.3.

Figura 4.11. Un exemplu de variaţie a temperaturii de călire.

Temperatura este definită în acest exemplu de (4.51). La fiecare scală a fost iniţiat un proces de evoluţie plecînd de la o populaţie cu un număr redus de cromozomi timp-frecvenţă ( 100P = ). Aşa cum ilustrează şi Figura 4.4, numărul total de cromozomi este sensibil mai mare la scale joase decît la scale înalte. Din acest motiv, diversitatea populaţiilor se menţine mai mult timp la scalele joase. Acest fenomen este ilustrat şi de variaţia temperaturii de călire din Figura 4.11, unde, în zona scalelor joase, există cîteva

0 1 2 3 4 5 6 7

1

2

3

4

5

6

7

Variation of annealing temperature for the first 3 best matching atoms

Scale index

Ann

ealin

g te

mpe

ratu

re

36 34 24 21 21 13 14 14

Number of generations per scale

0 1 2 3 4 5 6 7

1

2

3

4

5

6

7

Variation of annealing temperature for the first 3 best matching atoms

Scale index

Ann

ealin

g te

mpe

ratu

re

36 34 24 21 21 13 14 14

Number of generations per scale

Indice de scală

Tem

per

atu

ră d

e că

lire

Variaţia temperaturii de călire pînă la atomii cei mai potriviţi

Număr de generaţii la fiecare scală


86

salturi importante ale temperaturii din cauza schimbării dramatice a elitei. La scale înalte, însă, se ajunge mai repede la elita optimală (într-un număr mai redus de generaţii), deoarece numărul de atomi timp-frecvenţă-scală este mai redus. Strategia de selecţie bazată pe călire simulată asigură astfel şi un echilibru între diversitatea populaţiei şi viteza de convergenţă către optim. Reprezentativitatea calculată cu ajutorul uneia dintre definiţiile (4.51) sau (4.52) cuantifică fertilitatea fiecărui cromozom, în funcţie de potrivirea sa şi de capacitatea de reproducere ale celorlalţi cromozomi din generaţia curentă. Populaţia temporară t∆ este

practic construită prin selecţie naturală, pe baza fertilităţii cromozomilor. După construcţia acesteia, urmează aplicarea operaţiilor genetice pentru completarea locurilor libere din cadrul generaţiei următoare 1t+Π . Acestea se aplică astfel: întîi încrucişare, apoi mutaţie

asupra celor 2 cromozomi urmaşi dominanţi (selectaţi dintre cei 6 participanţi la încrucişare) şi în final inversiune tot asupra urmaşilor dominanţi selectaţi. De cele mai multe ori, mutaţia şi încrucişarea nu se mai aplică, din cauza probabilităţilor mici asociate. Cu toate acestea, dacă operaţia de încrucişare eşuează (este selectat LSB ca pivot), probabilitatea mutaţiei creşte şi se aplică perechii de părinţi care nu au putut fi încrucişaţi. Dacă nici mutaţia nu s-a putut efectua, atunci trebuie să crească probabilitatea inversiunii, care se va aplica tot asupra celor doi părinţi. Urmaşii selectaţi prin strategia elitistă ajung în generaţia 1t+Π numai dacă sunt diferiţi de oricare alt cromozom deja existent în cadrul

acesteia. Cromozomii selectaţi pentru aplicarea setului de operaţii genetice pot sau nu să continue să mai participe la alte operaţii genetice. Dacă ei sunt înlăturaţi, există pericolul ca, la sfîrşit, cînd au mai rămas numai cîţiva cromozomi în t∆ , aceştia să fie identici. În

acest caz, fie lor li se aplică numai mutaţii şi/sau inversiuni, fie locurile libere din 1t+Π sunt

pur şi simplu ocupate de către cromozomi întîmplători distincţi, aleşi din afara generaţiei

tΠ . Dacă nu se înlătură nici un cromozom din populaţia t∆ , cei mai apţi pentru

reproducere tind să domine scena şi să producă numai ei urmaşi. Înlăturarea cromozomilor care au participat deja la o operaţie genetică este o opţiune care asigură un mai bun echilibru între diversitatea populaţiei şi viteza de convergenţă. Pentru a încheia acest paragraf, este necesară referirea la iniţializarea şi la maniera de oprire a AG. Procesul de evoluţie al unei populaţii de cromozomi începe cu o generaţie iniţială a populaţiei, care ar trebui să fie cît mai diversă. Spre deosebire de mulţi algoritmi de optimizare, AG sunt aproape insensibili la iniţializare, ceea ce le conferă un mare avantaj. Pentru dicţionarul timp-frecvenţă-scală, populaţiile iniţiale se pot genera pentru fiecare scală în parte, cu ajutorul laticii timp-frecvenţă din Figura 4.2. Deoarece este dificilă localizarea punctului de optim în latice fără un algoritm preliminar, iniţializarea cea mai naturală constă în repartizarea uniformă a celor P cromozomi peste întreaga latice. Pentru fiecare indice de scală m∈M , laticea timp-frecvenţă este eşantionată cu perioada

0 sTτ = de-a lungul axei timpului şi cu lărgimea de bandă 0,mω de-a lungul axei frecvenţei.

Numărul de celule ale laticii este egal cu ( )( )1 1y mN K− + . Cum ( )( )1 1y mP N K<< − + , se

impune o re-eşantionare a laticii în vedere iniţializării AG. Aceasta se realizează simplu, redefinind parametrii de eşantionare prin multiplicarea cu ( )1 /yN P− (pentru axa

timpului), respectiv ( )1 /mK P+ (pentru axa frecvenţei). Cromozomii situaţi acum la

mijlocul fiecărei noi celule din laticea re-eşantionată reprezintă generaţia iniţială a populaţiei. Desigur, indicii corespunzători acestora trebuie evaluaţi ţinînd cont de eşantionarea originală a laticii. În general, dacă celula generică din laticea re-eşantionată


87

are poziţia normalizată ( , )p q , cu , 0, 0.5 1p q P⎢ ⎥∈ + −⎣ ⎦ (poziţie care indică centrul

acesteia), ei îi corespunde cromozomul ,,p m qn kγ , cu:

( )(2 1) 1

2y

p

p Nn

P

⎢ ⎥+ −= ⎢ ⎥⎢ ⎥⎣ ⎦

şi ,(2 1)( 1)

2m

m qq Kk

P+ +⎢ ⎥= ⎢ ⎥⎣ ⎦

. (4.53)

Interesant este faptul că, în cazul procesului de urmărire prin potrivire, deşi funcţia de potrivire se schimbă la fiecare iteraţie (conform definiţiei (4.43)), nu este necesară iniţializarea AG decît la prima iteraţie. Pentru fiecare iteraţie, generaţia iniţială poate fi chiar generaţia finală a iteraţiei anterioare. Simulările au demonstrat că atomul cel mai potrivit al iteraţiei curente se găseşte doar la cîteva generaţii ulterioare ale geneaţiei finale din iteraţia anterioară. Mai precis, dacă la iteraţia 1i − populaţia de cromozomi din care s-a extras cromozomul optim se află la generaţia 1,i t−Π , atunci, plecînd cu aceasta ca

generaţie iniţială pentru iteraţia i (adică ,0 1,i i t−Π = Π ), cromozomul optim se obţine în

generaţia ,i t n+Π , cu n de ordinul unităţilor sau zecilor (cel mult). Aceasta permite

reducerea semnificativă a timpului de căutare. Dacă s-ar pleca din nou de la generaţia iniţială neutră (cu repartizare uniformă peste laticea timp-frecvenţă), atunci optimul s-ar obţine după cel puţin cîteva sute de generaţii. Explicaţia pentru acest fenomen rezidă în însăşi forma funcţiei de potrivire şi maniera de evaluare a reziduului următor. Faptul că din semnalul rezidual curent a fost eliminată contribuţia unui atom, nu modifică valoarea de potrivire a acelor cromozomi din generaţia 1,i t−Π care au suporturi disjuncte în timp sau

frecvenţă cu atomul cel mai potrivit eliminat (adică sunt, practic, ortogonali cu acesta). Fenomenul este cu atît mai evident cu cît scala curentă este mai mare (atomii sunt mai comprimaţi, avînd suporturi mai scurte). Pentru a opri evoluţia unei populaţii în cadrul unui AG, există mai multe teste de stop utilizate în diferite aplicaţii. Tradiţional, evoluţia populaţiei de cromozomi este oprită după un număr T ∗∈N suficient de mare de generaţii (de regulă, de ordinul sutelor sau miilor). Un alt test de stop se poate imagina apelînd la conceptul de supravieţiuire a unui cromozom dominant de-a lungul mai multor generaţii. Astfel, dacă acesta supravieţuieşte peste \1S ∗∈N generaţii (de circa 10 ori mai mic decît T ), atunci el este declarat cromozomul optim. La început, însă, durata de viaţă impusă a unui cromozom ar trebui să fie mai mare decît cea din generaţiile finale, deoarece diversitatea populaţiei este de asemenea mare. Durata de viaţă ar putea să se adapteze treptat la procesul de evoluţie. De exemplu, se pot impune condiţiile următoare: pentru generaţia iniţială, S T= ; pentru generaţiile de la momentul 0 1t T S= − + pînă la momentul t T= , durata de viaţă este egală

cu 0S (constantă, de circa 10 ori mai mică decît T ); descreşterea duratei de viaţă impuse

să fie exponenţială. Acestea conduc la următorul profil al duratei de viaţă impuse:

00

010 1[ ] max ,

tdefT S

t T SSS t ST

− +− + −

⎧ ⎫⎡ ⎤⎪ ⎪= ⎢ ⎥⎨ ⎬⎢ ⎥⎪ ⎪⎢ ⎥⎩ ⎭

, t∀ ∈N . (4.54)

Din motive de siguranţă, ambele teste ar putea fi considerate. De exemplu, evoluţia populaţiei încetează atunci cînd fie s-au produs T generaţii, fie a apărut un cromozom dominant care a supravieţuit timp de [ ]S t generaţii consecutive, pînă la generaţia tΠ

inclusiv (pentru t∈N ). În orice caz, odată evoluţia oprită, cromozomul dominant din cadrul ultimei generaţii produse este desemnat optim. Parametrii uzuali în proiectarea unui AG sunt enumeraţi în Tabelul 4.2.


Tabelul 4.2. Parametri care configurează un Algoritm Genetic.

4.5. A Com

1

2

dimensiunea populaţiei: 50,200P∈ ;

probabilitatea de încrucişare: [0.5,1]cro ∈P ;

probabilitatea mutaţiei: [0 ,0.1]mut ∈P (cu creştere la croP , dacă este cazul);

probabilitatea inversiunii: [0,0.05]inv ∈P (cu creştere la croP , dacă este cazul);

proporţia elitei în cadru generaţiilor: [0.01,0.3]e ∈p ;

numărul maxim de generaţii ale evoluţiei populaţiei: 50,200T ∈ ; numărul maxim de operaţii genetice necesar pentru completarea generaţiei următoare: 3 ,6goM P P∈ ;

factorul de supravieţuire de bază: 0 2, /10S T∈ .

lgoritmul GAMP

binaţia dintre urmărirea prin potrivire şi AG este sumarizată în Algoritmul 4.1.

Algoritmul 4.1. GAMP – Un algoritm genetic al urmăririi prin potrivire.

Date de intrare: Dicţionarul 0 [ ]x wξE , reziduul i x∆ (pentru i∈N arbitrar fixat) şi

parametrii AG din Tabelul 4.2. Operaţiile care urmează se pot implementa în paralel la nivelul fiecărei scale, de indice 0,m M∈ .

. Iniţializare. Se construieşte populaţia iniţială 0Π (de dimensiune P ) prin re-

eşantionarea laticii timp-frecvenţă (pentru 0i = ) sau prin preluarea ultimei generaţii de la iteraţia ( 1)i − . Se detectează cromozomul dominant al populaţiei 0Π (prin

utilizarea funcţiei de potrivire ig – definiţia (4.43)) şi se iniţializează indexul său de

supravieţuire: 1s = . Se începe procesul de evoluţie cu generaţia iniţială (pentru

0t = ).

. Cît timp t T≤ şi [ ]s S t≤ , se efectuează următoarele operaţii:

2.1. Se extrage elita generaţiei curente tΠ şi se transferă direct generaţiei

următoare 1t+Π . Elita este formată din primii eP⎢ ⎥⎣ ⎦p cromozomi dominanţi.

2.2. Se evaluează reprezentativitatea tR a cromozomilor din tΠ (cu ajutorul

definiţiilor (4.48), (4.50), (4.51), şi (4.52) (unde i≡g g ).

2.3. Se construieşte ∆-populaţia curentă t∆ (cu eP P− ⎢ ⎥⎣ ⎦p cromozomi), utilizînd

Algoritmul generalizat al lui Baker (Algoritmul B.2), în care mulţimea de plecareeste tΠ , iar profilul asociat de distribuţie este tR .

2.4. Se repetă paşii următori pînă la completarea populaţiei următoare, 1t+Π :

2.4.1. Fie 0gon = numărul iniţial de operaţii genetice. Pentru go gon M≤ :

a. Se extrage la întîmplare o pereche de cromozomi , tξ λ ⊂ ∆ (care vor fi

înlăturaţi din ∆ după utilizare).

88

t


89

Algoritmul 4.1. GAMP – Un algoritm genetic al urmăririi prin potrivire (final).

Algoritmul GAMP a fost utilizat într-o aplicaţie de diagnoză a defectelor unor sisteme mecanice simple (rulmenţi, roţi dinţate), descrisă în secţiunea de rezultate de simulare. Alte implementări şi adaptări ale acestui algoritm au fost realizate la Universitatea Politehnică din Lausanne (Elveţia), aplicaţia abordată referindu-se la prelucrarea de imagini furnizate de sateliţi [FiVa01], [FVF01], [FVF02]. Implementarea adoptată în acest proiect a necesitat un mare număr de artificii informatice, ale căror detalii sunt prea tehnice şi numeroase pentru a fi descrise în raportul de cercetare de faţă. Lista programelor şi rutinelor implicate se găseşte într-o anexă a manulalului de utlizare [ASTI09].

b. Dacă ξ ≠ λ , li se aplică încrucişarea genetică de probabilitate croP la

nivel de genă şi se incrementează gon cu 1. Se selectează 2

cromozomi dominanţi cξ şi cλ , dintre cei maxim 6 disponibili (2 părinţi

şi 4 urmaşi, dacă încrucişarea a fost efectiv aplicată sau cei 2 părinţi dacă încrucişarea nu a fost aplicată).

c. Se aplică o mutaţie de probabilitate mutP asupra lui cξ şi, dacă este

diferit de acesta, asupra lui cλ (valoarea probabilităţii fiind croP dacă

c cξ = λ ). Se incrementează gon cu 1. Se selectează 2 cromozomi

dominanţi cmξ şi cmλ , dintre cei maxim 4 disponibili (2 părinţi şi 2

urmaşi, dacă mutaţia s-a aplicat efectiv sau numai 2 părinţi, dacă mutaţia nu s-a aplicat).

d. Se aplică o inversiune de probabilitate invP asupra lui cmξ şi, dacă este

diferit de acesta, asupra lui cmλ (valoarea probabilităţii fiind croP dacă

cm cmξ = λ ). Se incrementează gon cu 1. Se selectează 2 cromozomi

dominanţi cmiξ şi cmiλ , dintre cei maxim 4 disponibili (2 părinţi şi 2

urmaşi, dacă inversiunea s-a aplicat efectiv sau numai 2 părinţi, dacă inversiunea nu s-a aplicat).

e. Se adaugă cmiξ şi cmiλ generaţiei 1t+Π şi se elimină toate clonele

acestora din 1t+Π , dacă există. (Generaţia 1t+Π nu poate conţine decît

cromozomi distincţi). 2.4.2. Dacă generaţia 1t+Π include mai puţin de P cromozomi, aceasta se

completează cu un număr corespunzător de cromozomi aleşi la întîmplare din dicţionar (dar la scala corespunzătoare populaţiei).

2.5. Se incrementează t cu 1. Se determină cromozomul dominant al populaţiei

1t+Π . Dacă acesta coincide cu cel al populaţiei tΠ , se incrementează şi indexul

de supravieţuire s cu 1. Altfel, acesta este reiniţializat cu valoarea unitară, pentru noul cromozom dominant.

3. Se alege cromozomul timp-frecvenţă dominant, ,m mn kγ , din populaţia finală tΠ şi se

declară optim pentru scala de indice 0,m M∈ .

4. Se determină cromozomul timp-frecvenţă-scală optim , ,i i im n kγ , prin căutare

exhaustivă în mulţimea ,

0,m mn k

m M∈γ .

Date de ieşire: Atomul cel mai potrivit la iteraţia i∈N adică: [ ], ,i i im n kw .


90

Algoritmul GAMP se sprijină pe două programe principale: VIBRA_PF (care realizează o serie de prelucrări preliminare a semnalelor de la baza diagnozei de defect; în aplicaţia descrisă, aceste semnale sunt vibraţii mecanice, achiziţionate cu ajutorul accelerometrelor) şi GENIC_MP (care implementează efectiv Algoritmul GAMP). Cele mai importante rutine ale acestor programe sunt: atom (extrage un atom din dicţionarul timp-frecvenţă-scală), fitness (realizează proiecţia unui semnal pe un atom şi calculează funcţia de potrivire) şi genetics (implementează nucleul Algoritmului Genetic). Publicaţia care include atît descrierea Algoritmului GAMP, cît şi rezultate de diagnoză obţinute cu ajutorul acestuia, este cartea [SSP09], în curs de apariţie la Editura Academiei Române. Echipa de cercetare este în curs de pregătire a unei serii de articole pe această temă, care vor fi propuse, începînd cu anul 2010, unor conferinţe internaţionale şi reviste de specialitate, de nivel ISI.

Algoritmii descrişi pînă acum au fost testaţi pe diferite seturi de date achiziţionate, din domenii diverse. În secţiunea următoare, sunt prezentate cîteva dintre rezultatele acestor teste. De asemenea, cele două publicaţii anexate descriu studii de caz, finalizate cu rezultate de simulare, în care sunt implicaţi algoritmii PARMAX şi FORWAVER, prin comparaţie cu algoritmul PARMA. Utilizatorul beneficiază de o interfaţă grafică de dialog, convivială, numită FORECAST. Ea este descrisă în manalul de utilizare [ASTI09] şi permite rularea oricăruia dintre cele 4 programe prezentate (PARMA, PARMAX, FORWAVER şi GAMP). Trusa de senzori specializaţi în meteorologie şi ecologie (singura avînd capacitatea de a transmite datele pe cale undelor radio) are de asemenea o interfaţă grafică uşor de accesat şi utilizat, numită eKo-View. Ea este descrisă tot în cadrul manualului de utilizare [ASTI09].

Sistemul UMAPID a fost prezentat în cadrul expoziţiei de produs organizate cu ocazia simpozionului „Inovarea – o şansă pentru România”, organizat la Universitatea „Politehnica” din Bucureşti de către AMCSIT Politehnica, în zilele de 28 şi 29 iulie 2009. Imaginile care urmează ilustrează standul la care a fost expus sistemul mobil, împreună cu o parte dintre membrii echipei de cercetare. Se pot observa: unitatea mobilă de calcul împreună cu interfaţa grafică de predicţie, interfaţa VISA (conectată şi la un osciloscop, pentru testare) şi senzorii amplasaţi în apropierea unor plante de interior din salonul expoziţional. Fotografiile surprind maniera în care se desfăşoară monitorizarea multi-canal a doi parametri corelaţi din ecosistemul plantelor: temperatura şi umiditatea.


91

Figura FOTO. Participarea sistemului UMAPID la Salonul inovării, Bucureşti, 28-29 iulie 2009.

Algoritmi evoluaţi de identificare şi predicţie a fenomenelor ecologice

92


93

55.. RReezzuullttaattee oobbţţiinnuuttee ccuu aajjuuttoorruull ssiisstteemmuulluuii UUMMAAPPIIDD îînn ffuunnccţţiiuunnee Studiile de caz abordate în cadrul acestei secţiuni demonstrează funcţionalitatea algoritmilor implementaţi în cadrul sistemului UMAPID. Au fost considerate 3 aplicaţii:

Predicţia unui bloc de 4 canale de măsură a temperaturilor ambiante zilnice (minimă şi maximă) din oraşele Bucureşti şi Ploieşti (relativ apropiate între ele şi fără forme de relief abrupte care să le separe). Programe utilizate: PARMAX şi PARMA. Predicţia unor serii de timp uni-dimensionale din cîteva domenii diferite (curs de schimb, şomaj, intensitatea conştiinţei colective). Programe utilizate: FORWAVER şi PARMA. Diagnoza de defecte multiple, efectuată asupra unor rulmenţi cu bile. Program utilizat: GAMP.

5.1. Predicţia datelor multi-dimensionale

Pentru simulările cu date multi-dimensionale (în care intervine predictorul PARMAX, prin comparaţie cu predictorul PARMA), au fost anexate în finalul raportului de cercetare articolele următoare:

[StCu09] (publicaţie indexată ISI) – în care este predictat un bloc de 4 temperaturi ambiante (două maxime şi două minime zilnice) măsurate cu ajutorul eKo-senzorilor în oraşele Bucureşti şi Ploieşti;

[SSCM09] (acceptată la conferinţă internaţională IEEE, indexată ISI) – în care blocul de date provine din medicină şi conţine tot 4 canale (glicemie şi ioni de sodiu pentru un pacient de sex masculin şi altul de sex feminin).

Aşa cum arată şi concluziile acestor articole, aparent, predictorul PARMAX oferă rezultate de predicţie superioare predictorului PARMA. În primul caz, aceasta se datorează în special corelaţiei destul de pronunţate care există între temperaturile celor două oraşe, aflate la numai 60 km depărtare unul faţă de altul şi nedespărţite de forme de relief abrupte. Alte simulări cu blocuri de date de temperatură ambiantă din oraşe îndepărtate (de exemplu, Bucureşti şi Arad, Timişoara sau Braşov) au condus la performanţe mai slabe ale predictorului PARMAX în raport cu PARMA. Este clar că, dacă între canalele de măsură nu există corelaţii sau acestea sunt foarte slabe, utilizarea unor predictori de complexitate ridicată, cum este PARMAX, nu se recomandă. În acest caz, PARMA este mai precis şi mai rapid. În ceea ce priveşte datele din medicină, rezultatul de predicţie a confirmat ceea ce se ştie de multă vreme: glicemia şi cantitatea de ioni de sodiu ai unei persoane sunt doi parametri corelaţi între ei. Corelaţia este însă destul de complexă şi subtilă. Cu toate acestea, predictorului PARMAX nu i-a scăpat. Mai mult, el a pus în evidenţă un nou tip de corelaţie – între analizele unor pacienţi care, fie sunt înrudiţi, fie le-au efectuat în aproximativ aceleaşi condiţii. În cazul celor doi pacienţi de sexe opuse, neînrudiţi, singura explicaţie pentru corelarea analizelor lor o constituie faptul că au fost investigaţi în acelaşi spital, în aceleaşi condiţii şi în aceeaşi perioadă. Predicţia evoluţiei glicemiei unui pacient este de maximă importanţă pentru medic (mult mai importantă decît predicţia temperaturii ambiante). El poate astfel interveni înainte ca parametrul să atingă valori letale pentru pacient. De notat că multe dintre datele provenind din diferite domenii sunt destul dificil de predictat, din cauza perturbaţiilor care le-au corupt. În acest sens, de exemplu, datele din meteorologie sau ecologie se pot încadra în categoria celor netede, în care zgomotele nu depăşesc limite normale. De aceea, ele sunt relativ mai precis predictate. Datele medicale, însă, au o variaţie mai puţin netedă, fiind mai greu de predictat. Ceea ce încă nu se poate predicta precis cu aceste modele numerice (indiferent de domeniu) este variaţia bruscă, avînd efecte catastrofice în anumite cazuri (de exemplu, o tornadă bruscă sau un cutremur, o înrăutăţire bruscă a valorilor glicemiei).


94

5.2. Predicţia datelor uni-dimensionale

Scopul principal al experimentelor efectuate cu date uni-dimensionale a fost acela de a testa performanţele predictorului FORWAVER, în raport cu cele ale predictorului PARMA. Spre deosebire de predictorul PARMAX, cel bazat pe undine este în mod constant superior lui PARMA (desigur, cu preţul creşterii sensibile a complexităţii). Prima aplicaţie selectată provine din economie şi se referă la rata de schimb dintre EURO şi dolarul american (USD), de la punerea în circulaţie a monedei europene. Publicaţia [SCI08] (indexată ISI şi anexată în finalul raportului) prezintă rezultatele superioare de predicţie obţinute de FORWAVER, în raport cu PARMA. De notat că predicţia acestui curs de schimb nu a fost una banală, avînd în vedere inversarea saportului dintre cele două monede într-un timp relativ scurt. Următoarele două experimente vor fi prezentate pe larg în continuare. Ele sunt descrise şi în cartea [SSP09] (în curs de apariţie la Editura Academiei Române). Datele asupra cărora va fi focalizată discuţia care urmează fac parte dintr-un corpus variat de serii de timp, care au mai degrabă o natură statistică. Este vorba despre:

Y1 Rata lunară medie a şomajului în SUA, estimată între ianuarie 1973 şi iulie 1985 (151 de eşantioane).

Y11 Evoluţia conştiinţei colective a omenirii, conform unor măsurători efectuate la Kings College din Londra, între iulie 2000 şi septembrie 2004 (128 de eşantioane).

Cele mai multe dintre seriile de timp ale acestui corpus posedă doar un număr relativ redus de date (ca şi cele selectate), fiind totodată afectate de zgomote relativ importante. Aceste caracteristici sunt extrem de utile în vederea testării algoritmilor în condiţii dificile. Unele serii de timp posedă componentă sezonieră vizibilă, altele nu, iar altele necesită intervenţia unor modele sofisticate (cum este şi cel bazat pe undine) pentru a le fi detectată această componentă. Alte serii de timp, cum este şi Y11, sunt relativ surprinzătoare (sub rezerva corectitudinii metodei de măsurare). Ineditul seriei Y11 (conştiinţa colectivă a umanităţii) este dat de faptul că ea posedă două minime foarte adînci, corespunzătoare evenimentelor tragice din septembrie 2001 (în SUA) şi martie 2003 (în Spania). Cu alte cuvinte, potrivit cercetătorilor de la Kings College din Londra, tonusul general al omenirii a înregistrat scăderi bruşte şi extrem de pronunţate în preajma şi din cauza acestor evenimente. Cele două serii de timp precizate mai sus au fost selectate din anumite motive: Y1 - pentru detecţia relativ dificilă a componentei sezoniere şi Y11 – nu atît pentru ineditul său cît, mai ales, pentru a ilustra o limită importantă a algoritmilor numerici de predicţie, care este incapacitatea de a prognoza catastrofe în timp util. În continuare, pentru fiecare dintre cele 2 serii de timp vor fi ilustrate comparativ performanţele de predicţie ale perechii de algoritmi PARMA – FORWAVER. Cîteva comentarii succinte preced imaginile prezentate.

5.2.1. Predicţia seriei de timp a şomajului în SUA

În cazul acestei serii de timp, ilustrate în Figura 5.1, performanţa superioară a predictorului FORWAVER este evidentă: o valoare de 87.95% a criteriului PQ pentru modelul ARMA clasic (Figura 5.3), faţă de 94.82% pentru modelul cu undine (Figura 5.10). Se observă că modelul cu undine îmbunătăţeşte nu doar precizia de predicţie (în special la primele 3 momente), ci şi tubul de încredere (care este mai îngust). În afara predicţiei, modelul cu undine realizează şi o compresie de rată grosieră egală cu aproximativ 49.23%, pentru un nivel de mascare de 2%. Astfel, 49.23% dintre coeficienţii undină au fost anulaţi, informaţia codificată de ei fiind transferată zgomotului colorat. Performanţa superioară a predicţiei se datorează aşadar faptului că nivelul de mascare a reuşit să traseze o linie de demarcaţie mai clară între componenta deterministă şi cea nedeterministă a seriei de timp, faţă de demarcaţia realizată de modelul clasic.


95

Scalograma asociată fiecărui model cu undine este utilă în selectarea nivelului de mascare. (Scalograma este definită ca o aplicaţie bidimensională care surprinde variaţia pătratelor modulelor coeficienţilor undină peste planul timp-frecvenţă. Cu alte cuvinte, scalograma reprezintă o distribuţie a energiei seriei de timp peste acest plan, fiind similară unui spectru variabil în timp.) În cazul acestei serii de timp, scalograma (trasată în dB) este ilustrată în Figurile 5.6 (în plan) şi 5.7 (în spaţiu), fiind corelată cu arborele binar optimal asociat Transformatei Undină (determinat cu ajutorul procedurii IDA*), reprezentat în Figura 5.5. Nivelul de mascare este ridicat treptat, pînă cînd valoarea estimată a SNR descreşte brusc. (În acest context, SNR este evaluat prin efectuarea raportului dintre energia seriei de timp şi cea a zgomotului colorat.) Această descreştere a fost înregistrată pentru 0.02µ > . Arborele binar ilustrează de asemenea că, pentru această serie de timp, informaţia deterministă asociată predicţiei pare a fi localizată în zona de frecvenţe medii, focalizată pînă la o adîncime egală cu 5. Undinele tată şi mamă care definesc Transformata Undină sunt ilustrate în Figura 5.4 şi corespund parametrului de suport 12N = (cel mai bun, în sensul valorii maxime a PQ). Acestea sunt reprezentate la rezoluţia grosieră ( 0L = , de asemenea cea mai bună, în sensul valorii maxime a PQ), astfel că ele formează o bază ortonormată. Graficul suprafeţei calităţii predicţiei (din Figura 5.8) a fost trasat pentru diferite valori ale componentei stocastice de tip ARMA, prin varierea indicilor structurali aferenţi ( na şi nc ). Pentru a-l trasa, s-a apelat la strategia rezervării ultimelor / 2K⎢ ⎥⎣ ⎦ date, despre care s-a

amintit în secţiunea 2. Evident, punctul de maxim al suprafeţei simulate oferă predictorul optimal (de ordine 23na = şi 18nc = ), care este re-identificat folosind întregul set de date. Pentru el, se speră obţinerea unei performanţe de predicţie superioare în afara orizontului de măsură. Cu toate acestea, valoarea maximă a PQ din cazul simulat (de 99.56%) a scăzut pe orizontul real de predicţie (în care datele măsurate sunt necunoscute) la 94.82%. În acest caz, scăderea nu este atît de pronunţată ca în cel al seriei de timp următoare. În general, însă, fenomenul de scădere a valorii PQ este inevitabil, tocmai din cauza faptului că datele măsurate nu pot codifica întreaga informaţie despre viitor.

5.2.2. Predicţia seriei de timp a conştiinţei colective

Seria de timp este ilustrată în Figura 5.11. Chiar dacă predictorul bazat pe undine (Figura 5.20) îmbunătăţeşte performanţa predictorului clasic (Figura 5.13), creşterea valorii PQ este mică (de la 87.42% la 89.63%). Îmbunătăţirea constă mai mult în îngustarea tubului de încredere. Mai mult, faţă de valoarea de simulare a criteriului PQ (de 99.2%, din Figura 5.18), scăderea la valoarea reală de 89.63% este semnificativă. Această serie de timp nu este uşor de predictat, în special din cauza existenţei evenimentelor catastrofice (variaţii bruşte de durată scurtă şi amplitudini mari, înregistrate la momente de timp aparent aleatoare). Dificultatea predicţiei este accentuată şi de aliura seriei de timp din afara celor două perioade de apariţie a catastrofelor, asemănătoare variaţiei unui semnal seismic. Nivelul de mascare µ a fost ridicat tot la 2% (ca în cazul seriei de timp precedente). Acesta a condus la mascarea a 63.76% dintre coeficienţii undină. Scalograma seriei de timp (trasată în dB) este ilustrată în Figurile 5.16 (în plan) şi 5.17 (în spaţiu). Ea corespunde arborelui binar reprezentat în Figura 5.15. Se relevă faptul că, în cazul acestei serii de timp, informaţia deterministă se află localizată în zona de frecvenţe joase spre medii, unde adîncimea de focalizare este egală cu 5. Undinele tată şi mamă ale modelului sunt ilustrate în Figura 5.14. Ele au fost construite plecînd de la parametrul optimal de suport 21N = , astfel că au o regularitate ridicată – fapt care corespunde variaţiei liniştite a seriei de timp în afara zonelor de catastrofă. Ca şi în cazul seriei precedente, rezoluţia optimală reprezentare a acestor undine este tot cea grosieră ( 0L = ), astfel că ele formează o bază ortonormată.


96

Figura 5.1. Seria de timp Y1, împreună cu tendinţa şi componenta sezonieră.

Figura 5.2. Y1: Vedere globală asupra predicţiei clasice şi a performanţei asociate.


97

Figura 5.3. Y1: Vedere detaliată asupra orizontului de predicţie clasică.

Figura 5.4. Y1: Undinele tată şi mamă ale predictorului bazat pe undine.


98

Figura 5.5. Y1: Arborele binar optimal asociat Transformatei Undină.

Figura 5.6. Y1: Scalograma seriei de timp (reprezentare în plan).


99

Figura 5.7. Y1: Scalograma seriei de timp (reprezentare în spaţiu).

Figura 5.8. Y1: Suprafaţa de calitate a predicţiei şi punctul de maxim.


100

Figura 5.9. Y1: Vedere globală asupra predicţiei cu undine şi a performanţei asociate.

Figura 5.10. Y1: Vedere detaliată asupra orizontului de predicţie cu undine.


101

Figura 5.11. Seria de timp Y11, împreună cu tendinţa şi componenta sezonieră.

Figura 5.12. Y11: Vedere globală asupra predicţiei clasice şi a performanţei asociate.


102

Figura 5.13. Y11: Vedere detaliată asupra orizontului de predicţie clasică.

Figura 5.14. Y11: Undinele tată şi mamă ale predictorului bazat pe undine.


103

Figura 5.15. Y11: Arborele binar optimal asociat Transformatei Undină.

Figura 5.16. Y11: Scalograma seriei de timp (reprezentare în plan).


104

Figura 5.17. Y11: Scalograma seriei de timp (reprezentare în spaţiu).

Figura 5.18. Y11: Suprafaţa de calitate a predicţiei şi punctul de maxim.


105

Figura 5.19. Y11: Vedere globală asupra predicţiei cu undine şi a performanţei asociate.

Figura 5.20. Y11: Vedere detaliată asupra orizontului de predicţie cu undine.


106

5.3. Diagnoză de defecte mecanice

Aplicaţia prezentată pe scurt în cadrul acestui paragraf abordează o problemă de detecţie şi identificare a defectelor care apar şi se pot dezvolta în cadrul unui sistem mecanic de complexitate medie. Studiul de caz luat în considerare este cel al rulmenţilor cu bile. În pofida aparenţelor, defectele singulare posibile ale acestora sunt grupate în circa 12 clase, astfel că identificarea unui anumit comportament anormal nu reprezintă o problemă banală. De altfel, unii dintre marii producători de rulmenţi (cum este şi FAG din Germania [FAG97a]), şi-au dezvoltat propriile sisteme de testare şi detecţie de defecte (de exemplu testorul FAG-2000 [FAG97b]). Una dintre cele mai populare metode adoptate de industrie este cea a Analizei de anvelopă spectrală aplicată vibraţiilor mecanice măsurate la nivelul rulmentului testat [ABY94]. Metoda este de complexitate redusă şi se bazează pe utilizarea unor filtre speciale, cunoscute sub numele de o treime de octavă (ai căror parametri sunt totuşi relativ dificil de acordat). În urma aplicării ei, este posibilă detecţia oricăruia dintre cele 12 tipuri de defecte, dacă se manifestă izolat. Metoda nu este capabilă să identifice defectele multiple (combinaţii de defecte singulare). Însă, ea furnizează în plus o estimaţie a duratei medii de viaţă a rulmentului pînă la momentul cînd acesta trebuie înlocuit. Înlocuirea la timp a pieselor afectate de defecte este una dintre cele mai importante operaţii de întreţinere a unui sistem mecanic. Costurile demontării şi remontării unei piese defecte cresc în raport cu durata faţă de momentul optim la care ar trebui efectuată schimbarea acesteia. Schimbarea prematură conduce la o cantitate mai mare de piese consumate în decursul timpului, în timp ce schimbarea întîrziată expune şi alte componente ale sistemului la defecte datorate în special supra-solicitării. Metodele de analiză timp-frecvenţă aplicate vibraţiilor mecanice au fost utilizate pentru detecţia de defecte în cuplajele de roţi dinţate încă de la începutul anilor ’90 [WaFa93a], [WaFa93b]. Tot pentru roţi dinţate au fost utilizate şi undinele ortogonale ale lui Daubechies cîţiva ani mai tîrziu [WaFa95], [WaFa96]. Performanţele acestora sunt însă relativ modeste, probabil tocmai din cauza ortogonalităţii. Redundanţa în informaţie este factorul cheie pentru aplicaţiile de detecţie de defecte. Metoda descrisă succint în continuare apelează la dicţionare timp-frecvenţă-scală şi Algorimul GAMP. Va fi demonstrată capabilitatea sistemului UMAPID nu doar de a detecta defecte multiple, ci şi de a estima gradul de severitate al acestora, adică (indirect) gradul de uzură a rulmenţilor (ceea ce permite luarea unei decizii privind momentul înlocuirii lor).

5.3.1. Caracteristici ale vibraţiilor emise de sisteme mecanice

Sistemele mecanice în funcţiune emit vibraţii care pot fi măsurate cu ajutorul unor traductoare (senzori) numite accelerometre. Acestea transformă acceleraţiile locale ale mişcărilor părţilor mecanice pe care sunt aplicaţi în semnale electrice, numite ad hoc vibraţii. În general, mai muţi factori concură la formarea vibraţiilor, aşa cum este ilustrat în Figura 5.21.

Ambient e

x u d

w v

Sistem mecanic Mixer Senzor

e = zgomot ambiental

u = interferenţe d = zgomot de defect

x = oscilaţie naturală w = vibraţie mecanică brută v = vibraţie electrică (date)

Figura 5.21. Principiul genezei vibraţiilor mecanice.


107

Astfel, sistemul mecanic poate genera 3 clase de semnale: oscilaţii naturale (modelate prin ecuaţii diferenţiale adecvate), semnale de interferenţă cu alte (sub)sisteme mecanice şi zgomote de defect (care indică starea de sănătate a sistemului). Împreună cu zgomotul ambiental, aceste semnale sunt combinate într-o manieră necunoscută pentru a forma vibraţia mecanică brută, convertită apoi în vibraţie (electrică) prin intermediul senzorului. La rîndul lui, senzorul poate distorsiona transformarea prin caracteristicile sale (masă, neliniaritate, etc.) Mai multe modele de combinare între semnalele menţionate au fost propuse de-a lungul timpului (în special în cazul rulmenţilor sau al cuplajelor cu roţi dinţate). În mod natural, s-a încercat întîi aplicarea Principiului superpoziţiei, conform cărora semnalele pot fi adunate:

def

w x u d e≡ + + + . (5.1)

Carenţele acestui model s-au făcut vizibile cu uşurinţă, în special în aplicaţiile de diagnoză de defect. Numeroase experimente efectuate cu ajutorul unei mari varietăţi de sisteme mecanice au sugerat că zgomotele (ambiental şi de defect) modulează de fapt celelalte semnale (şi nu se adună la ele):

( )( )def

w d e x u≡ + + . (5.2)

Un alt model (considerat mai realist de către unii autori) este următorul:

(1 )( )def

w d e x u≡ + + + . (5.3)

Acesta a apărut ca urmare a similarităţilor de comportament observate între sistemele mecanice rotative şi valurile mării. Modelele (5.1)-(5.3) au avantajul de a fi simple şi uşor de manipulat, chiar dacă nu sunt foarte precise. Un model de complexitate şi precizie crescută este cel bazat pe operaţia de modulare în frecvenţă:

( )( ) ( )def

kw t t kT t

∈

= α + λ∑Z

, t∀ ∈R , (5.4)

unde: x uα ≡ + este semnalul armonic modulat cu perioada medie 0T > , în timp ce 1 d eλ ≡ + + este componenta modulatoare, formată din cele două zgomote.

În cadrul aplicaţiei de diagnoză de defecte, discuţia se concentrează pe modelarea zgomotului de defect d . Un astfel de model a fost propus, de exemplu, în [FaSm84]:

0( ) ( )def

kd t A t kT

∈

= δ +∑Z

, t∀ ∈R . (5.5)

În definiţia (5.5), zgomotul d se formează prin însumarea unor impulsuri periodice produse de şocurile datorate apariţiei defectelor. Perioada 0T > şi amplitudinea 0A > ale acestor şocuri depind de mai mulţi factori, cum ar fi: viteza principală de rotaţie, încărcarea sistemului mecanic, localizarea defectelor sau gradul lor de severitate. Ipoteza şocurilor periodice nu se dovedeşte a fi însă viabilă, deoarece există defecte care pot avea efecte (pseudo)aleatoare. De exemplu, dacă o bilă de rulment este cariată, şocurile apar numai atunci cînd zona afectată atinge una dintre cele două căi de rulare (numite cămăşi), acest fenomen producîndu-se de o manieră aleatoare. De asemenea, modelul (5.5) poate fi imprecis în cazul zgomotelor produse de uzura componentelor mecanice, de imperfecţiunile de execuţie sau de montarea lor greşită. Cu toate acestea, ideea că zgomotul de defect este produs de şocuri microscopice (micro-şocuri) cvasi-aleatoare este larg acceptată astăzi. Elementul cheie în achiziţia vibraţiilor îl constituie senzorul specializat numit accelerometru. Acesta ar trebui să aibă masă şi dimensiuni mult mai mici decît ale


108

componentei mecanice testate. Tototdată, caracteristica sa ar trebui să fie cît mai apropiată de liniaritate (ideal este ca vibraţia achiziţionată să depindă liniar de vibraţia mecanică). În acest fel, distorsiunile introduse nu pot influenţa major informaţia principală referitoare la defecte. Accelerometrele se bazează pe efectul piezo-electric, care oferă posibilitatea de a scoate în evidenţă anumite fenomene de rezonanţă. Ori, majoritatea defectelor mecanice aduc accelerometrul în zona de rezonanţă, ceea ce permite nu numai semnalarea, ci şi identificarea lor (cu metode adecvate de prelucrare de semnal). Acest comportament poate fi mai bine pus în evidenţă dacă se analizează răspunsul în frecvenţă al accelerometrului. Funcţia de transfer care redă cel mai bine funcţionarea reală a acestuia este următoarea:

( )( )0 1 2

1( ) sH s Gs s s s s s

=− − −

. (5.6)

Ecuaţia (5.6) pune în evidenţă două sub-sisteme în cascadă: unul electric, de ordin I (descris de prima fracţie) şi altul mecanic, de ordin II (descris de a doua fracţie). În frecvenţă, sistemul este caracterizat de aliura spectrală ilustrată în Figura 5.22.

2ν1ν0ν

1

a b c (2 )dB

H jπ ν

0 ν

Figura 5.22. Spectrul tipic al unui accelerometru.

Astfel, sunt puse în evidenţă 3 benzi principale: de joasă, medie şi înaltă frecvenţă. Banda de joasă frecvenţă are lărgime relativ redusă (pînă la 100 Hz) şi aplică o atenuare accentuată către origine. Ca urmare, componenta continuă a vibraţiei mecanice este eliminată, iar zgomotele de joasă frecvenţă sunt atenuate treptat (mai puţin către limita superioară a benzii, 0ν ). Banda de frecvenţă medie este considerată principală şi ocupă cea mai largă plajă de frecvenţe (care se poate întinde pînă la 60 kHz, nescăzînd totuşi sub 10 kHz). Vibraţia mecanică suferă în această zonă cele mai mici distorsiuni, spectrul său fiind replicat cu acurateţe destul de mare. Distorsiunile se înregistrează în capetele benzii (în special cel de joasă frecvenţă). În fine, în banda de frecvenţă înaltă se poate înregistra fenomenul de rezonanţă, în jurul frecvenţei critice a accelerometrului ( 2ν ). Ori de cîte ori spectrul vibraţiei mecanice se etalează dincolo de limita superioară a benzii principale, 1ν , este favorizată apariţia rezonanţei. Este drept, însă că, în această zonă, spectrul vibraţiei mecanice este puternic distorsionat, accelerometrul acţionînd ca o lupă, prin accentuarea liniilor spectrale originale din jurul frecvenţei de rezonanţă. Extinderea spectrului vibraţiei mecanice dincolo de limita 1ν se poate datora în mare măsură micro-şocurilor introduse de diferite defecte şi, într-o măsură mai mică, zgomotului ambiental (care, chiar dacă poate fi de frecvenţă înaltă, are energia mult inferioară celei a vibraţiei). Cu toate acestea, anumite interferenţe dintre vibraţiile emise de diferite componente mecanice pot de asemenea să provoace rezonanţa. O explicaţie intuitivă relativă la funcţionarea senzorului se sprijină pe imaginile din Figura 5.23.


109

0Ω Ω1Ω

1

0

Viteza = 0

a

Viteza ≠ 0

b

Figura 5.23. Imagini intuitive ale efectului de rezonanţă din funcţionarea accelerometrelor.

Se consideră pendulul din cele două imagini, care are un pahar de cristal (sau un diapazon) la capătul liber. Pendulul oscilează în faţa unui zid. Dacă zidul are suprafaţa netedă (ca în imaginea a), pendulul este reglat ca, la atingerea lui, paharul/diapazonul să aibă viteza nulă. În consecinţă, oscilaţiile pendulului sunt silenţioase. Dacă, însă, dintr-o cauză oarecare, zidul capătă o protuberanţă (ca în imaginea b), de fiecare dată cînd este atins de pahar/diapazon, este emis un sunet datorat rezonanţei proprii a acestuia, semnalînd neregularitatea. Mai mult, cu cît protuberanţa este mai înaltă, cu atît sunetul emis are intensitatea mai mare, indicînd prin aceasta şi nivelul ei de dezvoltare. Practic, semnalul v este format din două componente (combinate într-o manieră necunoscută): ndv – care nu conţine informaţii relative la defecte şi dv – care codifică

informaţia referitoare la defecte. În general, energia componentei ndv este concentrată în

zona de frecvenţă joasă, în timp ce energia componentei dv – în zona de frecvenţă înaltă, deşi cele două spectre nu sunt disjuncte. Componenta de interes pentru diagnosticarea sistemului mecanic este, evident, dv . Conform manierei de funcţionare a senzorului, este plauzibil să se considere că micro-şocurile şi interferenţele sunt purtate de către semnalul de rezonanţă, ca în Figura 5.24. Practic, dv este reprezentat ca o colecţie de semnale de rezonanţă modulate în amplitudine, cu amortizare. Semnalele apar la diferite momente de timp (nu neapărat echidistante), în funcţie de micro-şocuri şi/sau interferenţe de frecvenţă înaltă.

Timp

Semnal de rezonanţă purtător

Anvelopă

t1 t2 t3

vd

0

Figura 5.24. Modelul cu purtătoare de rezonanţă al vibraţiei codificatoare de defect.


110

Pentru a atenua interferenţele care maschează apariţia defectelor, se poate utiliza metoda relativ simplă şi eficace din [CaDL96a] sau [CaDL96a] (un patent înregistrat în SUA). În general, însă, dacă senzorii pot fi şi sunt amplasaţi cît mai aproape de componenta mecanică testată, influenţa interferenţelor este redusă sensibil. Gradul de severitate al defectului este corelat cu amplitudinile semnalelor purtătoare de rezonanţă şi este cuantificat cu ajutorul a 10 trepte. Defectele incipiente se situează pe treptele 1-2, în timp ce ultima treaptă (a 10-a) indică defectele majore.

5.3.2. Platforma şi parametrii de lucru ai aplicaţiei

Aplicaţia de diagnoză s-a desfăşurat cu ajutorul unui mini-stand de încercări pus la dispoziţia noastră de către Institutul de Mecatronică de la Universitatea de Ştiinţe Aplicate din Konstanz, Germania. Mini-standul a fost completat cu cîteva elemente pînă la configuraţia platformei de test din Figura 5.25.

Figura 5.25. O platformă de testare şi diagnoză a rulmenţilor.

Platforma include 3 sisteme interconectate: un stand mecanic de test, un aparat de achiziţie şi prelucrare primară a datelor (vibraţii) şi UMAPID. Componentele principale ale standului mecanic sunt următoarele:

a. Un motor de tip Siemens cu viteză maximă de rotaţie de 2740 rot/min (aproximativ 45.67 Hz) şi o putere de 370 W, alimentat la reţeaua trifazică de 380 V. Motorul a fost dotat cu un comutator care întrerupe alimentarea electrică, în vederea rotirii libere amortizate, timp în care se efectuează achiziţia de date. Această facilitate permite înlăturarea interferenţelor dintre vibraţiile măsurate şi armonicele de 50 Hz induse de surse de alimentare.

Încărcare: ~ 200 N

LMS Roadrunner

Transfer de date (vibraţie)

Motor Siemens: 2740 rot/min

370 W 380 V, 3ϕ

Accelerometre

Rulment testat

Rulment de înaltă calitate

Cuplaj elastic


111

b. O pereche de rulmenţi cu aceeaşi geometrie, montaţi în lagăre aferente, demontabile. Rulmentul din apropierea motorului este selectat astfel încît să fie fără defecte şi de calitate înaltă. Celălalt rulment este supus testelor şi poate avea defecte în diferite faze de dezvoltare (singulare sau multiple). Geometria şi frecvenţele naturale ale rulmenţilor testaţi sunt ilustrate în Figura 5.26. În figură, au fost utilizate notaţiile din Tabelul 5.1. Frecvenţele enumerate sunt determinate de caracteristicile geometrice ale rulmentului şi frecvenţa principală de rotaţie, FR. Ele s-au dovedit a fi extrem de importante în identificarea posibilelor defecte ale rulmentului.

Figura 5.26. Caracteristicile constructive ale rulmenţilor testaţi.

Tabelul 5.1. Frecvenţele naturale (caracteristice) ale unui rulment cu bile.

Acronim Semnificaţie FR Frecvenţa de Rotaţie a axului central FTCI Frecvenţa de Trecere (a unei bile) pe Cămaşa Interioară FTCE Frecvenţa de Trecere (a unei bile) pe Cămaşa Exterioară FRB Frecvenţa de Rotaţie a unei Bile FCCI Frecvenţa de rotaţie a Coliviei faţă de Cămaşa Interioară FCCE Frecvenţa de rotaţie a Coliviei faţă de Cămaşa Exterioară

c. O pereche de discuri metalice montate axial care aplică o încărcare constantă (de aproximativ 200 N) asupra rulmenţilor. De asemenea, inerţia discurilor permite prelungirea sensibilă a duratei de rotaţie în regim amortizat (după întreruperea tensiunii de alimentare a motorului). În acest fel, pe durata primelor 5 secunde de regim amortizat, viteza de rotaţie este aproximativ constantă, ceea ce permite o achiziţie a datelor cu acurateţe.

d. Un cuplaj elastic axial, care permite atenuarea influenţelor datorate imperfecţiunilor sau uzurii motorului.

Vibraţiile sunt achiziţionate cu ajutorul a două accelerometre uşoare montate în cuadratură pe carcasa exterioară a lagărului rulmentului de test. Astfel, semnalul achiziţionat are valori complexe. Partea reală este convenţional atribuită vibraţiei orizontale, în timp ce vibraţia verticală completează partea imaginară. Deoarece acceleormetrele nu au facilitatea transmisiei radio (nu a fost găsită încă o firmă producătoare), achiziţia se efectuează cu ajutorul unui aparat suficient de complex şi precis: LMS Roadrunner, de producţie belgiană [LMS99], pus la dispoziţie tot de către gazdele noastre din Germania. Caracteristicile sale sunt mult superioare celor necesare în această aplicaţie: achiziţie independentă pe cel puţin 4 canale, compatibilitate cu o gamă largă de senzori, plajă de frecvenţe de eşantionare de la 1 Hz la 100 kHz, filtrare preliminară a datelor, interfaţă prietenoasă cu utilizatorul, metode de trasare a spectrelor şi spectrogramelor şi, mai ales, conexiune radio la internet, etc. În această aplicaţie,

38.5

10 bile

Frecvenţe caracteristice:

FR = 44.3 Hz FTCI = 224.8 Hz FTCE = 173.9 Hz FRB = 139.8 Hz FCCI = 25 Hz FCCE = 19.3 Hz


112

frecvenţa de eşantionare a fost stabilită la: 22.707sν = kHz. Datele sunt salvate în format .CSV (tabelat), cu 22 de biţi de reprezentare pentru fiecare eşantion şi apoi transferate la nivelul calculatorului mobil al sistemului UMAPID, prin intermediul interfeţei VISA (care aplică o serie de pre-filtrări). Datele pot fi transmise şi direct calculatorului mobil (via internet), însă această metodă nu mai beneficiază de pre-filtrare (care trebuie executată ulterior). Primele achiziţii de date au fost efectuate asupra unui rulment fără defecte (standard), etichetat prin <B3850610>, conform caracteristicilor sale geometrice. Următoarele date au provenit de la 3 rulmenţi cu aceeaşi geometrie, dar prezentînd defecte: <I3850610> (cu o crăpătură pe cămaşa interioară – defect singular), <E3850610> (avînd cămaşa exterioară uzată neuniform într-o anumită zonă – defect singular) şi <M3850610> (cu ciobituri repartizate neuniform pe ambele cămăşi – defect multiplu). Datele achiziţionate au următoarele caracteristici generale:

a. precizie de achiziţie de aproximativ 10–3 în gama de variaţie a senzorilor de [ 0.1 , 0.1]− + cm/s2;

b. lungime de 2.048 eşantioane (aproximativ 90 ms), achiziţionate pe durata a 40 de rotaţii complete libere ale axului central (după întreruperea tensiunii de alimentare a motorului);

c. SNR relativ scăzut, în special în cazul rulmenţilor cu defecte, estimat la valori de cel mult 6 dB (aproximativ 30% din energia semnalului este constituită de perturbaţii);

d. variaţia vitezei de rotaţie în gama ( ) 3.44%151 ×± Hz, datorită unei uşoare excentricităţi a discurilor de încărcare.

În Figura 5.27 sunt ilustrate: partea reală a cîte unui segment de semnal de vibraţie (de durată egală cu aproximativ o treime din durata totală de 90 ms), un detaliu din mijlocul segmentului şi spectrul corespunzător segmentului, pentru fiecare dintre cei 4 rulmenţi. Vibraţiile sunt reprezentate înaintea oricăror prelucrări primare, cu excepţia celor aplicate implicit de către aparatul de achiziţie de date, de aceea apar corupte de un zgomot important. Se observă imediat că vibraţiile şi spectrele corespunzătoare rulmenţilor cu defecte sunt diferite de cea a rulmentului standard (ceea ce indică prezenţa defectelor), dar sunt relativ dificil de deosebit între ele, în special la nivelul spectrelor. Spectrul rulmentului standard se etalează pe toată gama de frecvenţe cu o descreştere aproape liniară, fără a prezenta linii spectrale dominante la frecvenţă înaltă. În schimb, spectrele rulmenţilor cu defecte indică foarte clar funcţionarea anormală prin prezenţa unei concentrări anormale de energie la frecvenţă înaltă. Prin simpla inspecţie a acestor spectre, un utilizator obişnuit nu poate sesiza decît faptul că 3 dintre cei 4 rulmenţi testaţi au defecte, fără a putea preciza natura, localizarea şi gradul de severitate ale acestora. Un operator uman expert ar putea realiza această distincţie, dar experienţa sa trebuie să fie extrem de vastă (sute de mii de rulmenţi observaţi). În [StIo02], [IoSt05], sau [StIo06], au fost publicate rezultatele unei abordări în care experienţa operatorului uman şi maniera sa de a raţiona în legătură cu identificarea unui defect au fost automatizate cu ajutorul unui model combinat fuzzy-statistic. Cu toate acestea, în cadrul aplicaţiei descrise în continuare, rezultatele nu se sprijină pe experienţa unui operator uman. Datele achiziţionate sunt supuse unor prelucrări primare, în vederea netezirii formelor de undă şi a izolării informaţiei despre defecte. Prima operaţie este cea de filtrare numerică folosind un filtru trece-sus (FTS), pentru a elimina armonicele principale datorate frecvenţelor naturale ale rulmenţilor. Din Figura 5.26, rezultă că frecvenţa cea mai mare este de aproximativ 225 Hz, astfel că filtrul a fost proiectat să atenueze toate armonicele sub 500 Hz. Astfel, sunt eliminate cel puţin două linii spectrale corespunzătoare fiecărei frecvenţe naturale şi multiplilor acesteia. A doua operaţie de prelucrare primară este cea de netezire, prin intermediul unei tehnici de mediere în frecvenţă combinată cu Metoda verosimilităţii maxime [SoSt89], [SCS05], tehnică descrisă în [StIo03].


113

Figura 5.27. Segmente de vibraţie achiziţionate de la 4 rulmenţi cu bile.

0 0.05 0.1 0.15 0.2 0.25 0.3

-0.02

0

0.02

0.04

Time (s)

Mag

nitu

de (

cm/s

2 )

* Sampling rate: 20000 Hz

0.16 0.165 0.17 0.175 0.18

-0.02

0

0.02

Time (s)

Mag

nitu

de (

cm/s

2 )

Zoom on a full rotation vibration data

0 0.05 0.1 0.15 0.2 0.25 0.3

-0.02

0

0.02

0.04

Time (s)

Mag

nitu

de (

cm/s

2 )


0.16 0.165 0.17 0.175 0.18

-0.02

0

0.02

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-50

-40

-30

-20

-10

0

10

20

30

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-50

-40

-30

-20

-10

0

10

20

30

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 0.05 0.1 0.15 0.2 0.25 0.3

-0.05

0

0.05

0.1

Time (s)

Mag

nitu

de (

cm/s

2 )


0.16 0.165 0.17 0.175 0.18

-0.05

0

0.05

Time (s)

Mag

nitu

de (

cm/s

2 )


0 0.05 0.1 0.15 0.2 0.25 0.3

-0.05

0

0.05

0.1

Time (s)

Mag

nitu

de (

cm/s

2 )


0.16 0.165 0.17 0.175 0.18

-0.05

0

0.05

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-50

-40

-30

-20

-10

0

10

20

30

40

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-50

-40

-30

-20

-10

0

10

20

30

40

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 0.05 0.1 0.15 0.2 0.25 0.3-0.04

-0.02

0

0.02

0.04

0.06

Time (s)

Mag

nitu

de (

cm/s

2 )


0.16 0.165 0.17 0.175 0.18

-0.02

0

0.02

0.04

Time (s)

Mag

nitu

de (

cm/s

2 )


0 0.05 0.1 0.15 0.2 0.25 0.3-0.04

-0.02

0

0.02

0.04

0.06

Time (s)

Mag

nitu

de (

cm/s

2 )


0.16 0.165 0.17 0.175 0.18

-0.02

0

0.02

0.04

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-40

-30

-20

-10

0

10

20

30

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-40

-30

-20

-10

0

10

20

30

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 0.05 0.1 0.15 0.2 0.25 0.3-0.05

0

0.05

Time (s)

Mag

nitu

de (

cm/s

2 )


0.16 0.165 0.17 0.175 0.18-0.04

-0.02

0

0.02

0.04

0.06

Time (s)

Mag

nitu

de (

cm/s

2 )


0 0.05 0.1 0.15 0.2 0.25 0.3-0.05

0

0.05

Time (s)

Mag

nitu

de (

cm/s

2 )


0.16 0.165 0.17 0.175 0.18-0.04

-0.02

0

0.02

0.04

0.06

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-50

-40

-30

-20

-10

0

10

20

30

40

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-50

-40

-30

-20

-10

0

10

20

30

40

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

<B3850610>

<I3850610>

<E3850610>

<M3850610>

Vibraţii Spectre

×100 ms

×100 ms

×100 ms

×100 ms

×100 ms

×100 ms

×100 ms

×100 ms


114

Figura 5.28. Segmente de vibraţie prelucrate primar, provenite de la 4 rulmenţi cu bile.

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.015

-0.01

-0.005

0

0.005

0.01

0.015

0.02

Time (s)

Mag

nitu

de (

cm/s

2 )

* 4 full rotations * Sampling rate: 20000 Hz

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.015

-0.01

-0.005

0

0.005

0.01

0.015

0.02

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-60

-50

-40

-30

-20

-10

0

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-60

-50

-40

-30

-20

-10

0

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

<B3850610>

Vibraţii Spectre

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.04

-0.02

0

0.02

0.04

0.06

Time (s)

Mag

nitu

de (

cm/s

2 )


0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.04

-0.02

0

0.02

0.04

0.06

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-50

-40

-30

-20

-10

0

10

20

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-50

-40

-30

-20

-10

0

10

20

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

<I3850610>

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.04

-0.03

-0.02

-0.01

0

0.01

0.02

0.03

0.04

0.05

Time (s)

Mag

nitu

de (

cm/s

2 )


0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.04

-0.03

-0.02

-0.01

0

0.01

0.02

0.03

0.04

0.05

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-70

-60

-50

-40

-30

-20

-10

0

10

20

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-70

-60

-50

-40

-30

-20

-10

0

10

20

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.04

-0.03

-0.02

-0.01

0

0.01

0.02

0.03

0.04

Time (s)

Mag

nitu

de (

cm/s

2 )


0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-0.04

-0.03

-0.02

-0.01

0

0.01

0.02

0.03

0.04

Time (s)

Mag

nitu

de (

cm/s

2 )


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-50

-40

-30

-20

-10

0

10

20

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

-50

-40

-30

-20

-10

0

10

20

Frequency (Hz)

Spe

ctra

l pow

er (

dB)

<E3850610>

<M3850610>


115

Semnalele pregătite pentru Algoritmul GAMP sunt ilustrate în Figura 5.28. Netezirea se poate observa la nivelul spectrelor, prin reducerea densităţii oscilaţiilor. Aceasta va conduce la reprezentări timp-frecvenţă-scală de asemenea netezite, mai uşor de vizualizat. Dicţionarul de forme de undă rezultat (generat cu ajutorul ferestrei Gaussiene (4.10)) conţine peste 4.2 milioane de atomi. Întregul algoritm a fost implementat cu ajutorul mediului de programare MATLAB, în manieră secvenţală (deşi mult mai adecvată ar fi fost implementarea sa pe o maşină paralelă de calcul). Din acest motiv, timpul de rulare pentru un segment de vibraţie de 90 ms variază între 1 şi 3 ore la nivelul calculatorului portabil. Pentru a putea iniţia algoritmul, este necesară precizarea unui întreg set de parametri, după cum urmează (conform Tabelului 4.2):

mărimea populaţiei de cromozomi: 100P = ; probabilitatea de încrucişare: 0.85cro =P ;

probabilitatea de mutaţie: 0.08mut =P sau 0.85mut cro= =P P

(dacă încrucişarea nu s-a produs); probabilitatea de inversiune: 0.02inv =P sau 0.85inv cro= =P P ;

(dacă nici încrucişarea, nici mutaţia nu s-au produs); proporţia de selecţie elitistă: 0.1e =p ;

numărul maxim de generaţii ale evoluţiei populaţiei: 100T = ; numărul maxim de operaţii genetice necesare pentru completarea generaţiei următoare: 450goM = ;

factorul de supravieţuire pentru populaţiile iniţiale: 0 5S = ; factorul de supravieţuire pentru celelalte populaţii: 0 3S = .

5.3.3. Rezultatele programului de diagnoză GAMP

Simulările efectuate pentru fiecare rulment au condus la semnalele din Figura 5.29. Pe primele linii sunt trasate graficele semnalelor originale (aceleaşi ca în Figura 5.28). Urmează semnalele utile, obţinute cu ajutorul celor mai potriviţi atomi din dicţionar. Pe ultimele linii este figurat zgomotul rezidual, rămas după scăderea semnalelor utile din semnalele originale aferente. Procedeul de deparazitare a fost oprit atunci cînd energia semnalelor reziduale a scăzut la mai puţin de 30% din energia semnalelor originale aferente (adică pentru o valoare de aproximativ 6 dB a SNR). În acest fel, zgomotul care codifică informaţia despre defecte este incus în mare parte în componenta utilă. Zgomotul rezidual se datorează de regulă interferenţelor, perturbaţiilor ambientale, distorsiunilor introduse de cuantificarea pe un număr finit de biţi, etc. Se observă că prezenţa defectelor este semnalată de numărul de atomi necesari pentru a reprezenta semnalul util în condiţiile unui acelaşi SNR: numai 252 atomi pentru rulmentul standard, şi 494, 414, respectiv 452, pentru ceilalţi 3 rulmenţi în ordinea I,O,M. Analiza nu se opreşte aici, deoarece defectele nu pot fi încă identificate doar din inspectarea semnalelor menţionate. Pentru aceasta, este necesară reprezentarea timp-frecvenţă-scală a vibraţiilor, cu ajutorul coeficienţilor de proiecţie peste atomii cei mai potriviţi sau, mai precis, cu ajutorul funcţiei de potrivire. Cele 4 reprezentări sunt ilustrate în Figurile 5.30-5.33. Acestea se bazează pe maniera în care a fost organizat dicţionarul de forme de undă. Atomii sunt grupaţi pe 9 scale, indexate de la 0 la 8, în ordinea de creştere a factorului de contracţie. În consecinţă, rezoluţia în frecvenţă (numărul de sub-benzi) şi numărul de atomi alocaţi fiecărei scale descresc odată cu creşterea indicelui de scală. Pe scala #8 se găsesc numai 6165 atomi – cei mai contractaţi ai dicţionarului. Aceasta permite o căutare exhaustivă a atomilor celor mai potriviţi, fără utilizarea AG. Pentru celelalte scale, căutarea acestor atomi se efectuează însă cu ajutorul AG, iar optimele sunt determinate după cel mult 25 de generaţii.


116

Figura 5.29. Rezultate de deparazitare a vibraţiilor cu ajutorul unui dicţionar de undine.

-20 0 20 40 60 80 100

-0.01

0

0.01 * Sampling rate: 22707 Hz

-20 0 20 40 60 80 100

-0.01

0

0.01

Denoised signal. Energy ratio: 70.0386 %.

Acc

eleration (cm/s

2 )

* Number of atoms: 252

-20 0 20 40 60 80 100

-0.01

0

0.01

Residual (noise). Energy ratio: 29.9614 %

Time (ms)

-20 0 20 40 60 80 100

-0.01

0


-20 0 20 40 60 80 100

-0.01

0

0.01


Acc

eleration (cm/s

2 )


-20 0 20 40 60 80 100

-0.01

0

0.01


Time (ms)

-40 -20 0 20 40 60 80 100 120-0.05

0


-40 -20 0 20 40 60 80 100 120-0.05

0

0.05Denoised signal. Energy ratio: 70.0356 %.

Acc

eleration (cm/s

2 )


-40 -20 0 20 40 60 80 100 120-0.05

0

0.05Residual (noise). Energy ratio: 29.9644 %

Time (ms)

-40 -20 0 20 40 60 80 100 120-0.05

0


-40 -20 0 20 40 60 80 100 120-0.05

0

0.05Denoised signal. Energy ratio: 70.0356 %.

Acc

eleration (cm/s

2 )


-40 -20 0 20 40 60 80 100 120-0.05

0

0.05Residual (noise). Energy ratio: 29.9644 %

Time (ms)

-40 -20 0 20 40 60 80 100 120

-0.02

0


-40 -20 0 20 40 60 80 100 120

-0.02

0

0.02


Acc

eleration (cm/s2 )


-40 -20 0 20 40 60 80 100 120

-0.02

0

0.02


Time (ms)

-40 -20 0 20 40 60 80 100 120

-0.02

0


-40 -20 0 20 40 60 80 100 120

-0.02

0

0.02


Acc

eleration (cm/s2 )


-40 -20 0 20 40 60 80 100 120

-0.02

0

0.02


Time (ms)

-20 0 20 40 60 80 100 120 140

-0.02

0


-20 0 20 40 60 80 100 120 140

-0.02

0

0.02


Acc

eleration (cm/s2 )


-20 0 20 40 60 80 100 120 140

-0.02

0

0.02


Time (ms)

-20 0 20 40 60 80 100 120 140

-0.02

0


-20 0 20 40 60 80 100 120 140

-0.02

0

0.02


Acc

eleration (cm/s2 )


-20 0 20 40 60 80 100 120 140

-0.02

0

0.02


Time (ms)

<B3850610> original

util

zgomot

original

util

zgomot

<I3850610>

original

util

zgomot

<E3850610>

original

util

zgomot

<M3850610>


117

Figura 5.30. Reprezentarea timp-scală-frecvenţă a vibraţiei <B3850610>.

-80

-75

-70

-65

-60

0 1 2 3 4 5 6 7 8

-40

-20

0

20

40

60

80

Scale order

Tim

e (m

s)

T ime-frequency-scale distribution for signal <I3850609> Fitness (dB)

Removed noise: 15.26%

# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3

Frequency band/scale:[0.5 ... 11.3533] kHz

-80

-75

-70

-65

-60

0 1 2 3 4 5 6 7 8

-40

-20

0

20

40

60

80

Scale order

Tim

e (m

s)

T ime-frequency-scale distribution for signal <I3850609> Fitness (dB)


# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3


Figura 5.31. Reprezentarea timp-scală-frecvenţă a vibraţiei <I3850610>.

-95

-90

-85

-80

-75

-70

0 1 2 3 4 5 6 7 8

-40

-20

0

20

40

60

80

Scale order

Tim

e (m

s)T ime-frequency-scale distribution for signal <B3850609> Fitness (dB)


# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3


-95

-90

-85

-80

-75

-70

0 1 2 3 4 5 6 7 8

-40

-20

0

20

40

60

80

Scale order

Tim

e (m

s)T ime-frequency-scale distribution for signal <B3850609> Fitness (dB)


# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3


<B3850610>

Concentrări anormale

<I3850610


118

Figura 5.32. Reprezentarea timp-scală-frecvenţă a vibraţiei <E3850610>.

Figura 5.33. Reprezentarea timp-scală-frecvenţă a vibraţiei <M3850610>.

-85

-80

-75

-70

-65

-60

0 1 2 3 4 5 6 7 8

-50

0

50

100

Scale order

Tim

e (m

s)T ime-frequency-scale distribution for signal <O3850609> Fitness (dB)


# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3


-85

-80

-75

-70

-65

-60

0 1 2 3 4 5 6 7 8

-50

0

50

100

Scale order

Tim

e (m

s)T ime-frequency-scale distribution for signal <O3850609> Fitness (dB)


# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3


<E3850610>


-85

-80

-75

-70

-65

0 1 2 3 4 5 6 7 8-40

-20

0

20

40

60

80

Scale order

Tim

e (m

s)

T ime-frequency-scale distribution for signal <M3850609> Fitness (dB)


# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3

Frequency band/scale:[0.5 ... 11.3533] kHz -85

-80

-75

-70

-65

0 1 2 3 4 5 6 7 8-40

-20

0

20

40

60

80

Scale order

Tim

e (m

s)

T ime-frequency-scale distribution for signal <M3850609> Fitness (dB)


# of

sub

-ban

ds

| ----- 616 308 154 77 39 20 10 5 3



<M3850610>


119

În Figurile 5.30-2.33, planul timp-frecvenţă a fost replicat pentru fiecare scală de reprezentare, fiind indicat totodată numărul de sub-benzi aferent. Din acest motiv, suprafaţa alocată reprezentării valorilor în dB ale funcţiei de potrivire variază de la o scală la alta (creşte odată cu indicele de scală), ilustrînd rezoluţia variabilă de reprezentare. Culorile asociate valorilor funcţiei de potrivire sunt ilustrate în dreapta planului timp-frecvenţă-scală, pentru a putea identifica mai uşor zonele unde acestea prezintă valori importante. Cele 4 figuri ilustrează maniera în care energia vibraţiei este disipată peste planul timp-frecvenţă-scală. Studiind cu atenţie această distribuţie, aparent, scalele de indice scăzut (în care acţionează atomi dilataţi, dar cu spectru contractat) par a include informaţia referitoare la zgomotele structurale interne ale sistemului mecanic, din componenţa semnalului util, în timp ce în zona scalelor de indice mare reflectă mai mult comportamentul mediat al acestuia. Cu toate acestea, zgomotul de defect se poate manifesta la orice scală, în funcţie de natura şi intensitatea sa. În absenţa defectelor (Figura 5.30), funcţia de potrivire relevă o distribuţie cvasi-uniformă peste planul timp-frecvenţă-scală, cu valori aproximativ constante, aşa cum era de aşteptat. În prezenţa defectelor, însă, distribuţia se schimbă, punînd în evidenţă concentrări anormale de valori ale funcţiei de potrivire, în general mari, în anumite zone ale planului timp-frecvenţă-scală. În cazul rulmentului <I3850610> (afectat de o crăpătură pe cămaşa interioară), distribuţia din Figura 5.31 ilustrează o concentraţie anormală de energie (peste 12% din energia semnalului original), într-un număr relativ redus de valori mari de potrivire, la scala de indice nul. Cele două grupuri de concentrare sunt localizate în sub-banda #571, care, la scala #0, corespunde frecvenţei centrale de 10.569 kHz. Ori, aceasta este practic un multiplu întreg al FTCI (mai precis, este egală aproximativ cu 47×FTCI), ceea ce conduce la localizarea defectului cu uşurinţă. Mai mult, efectuînd o mediere a valorilor de potrivire din aceste grupuri, se poate estima gradul de severitate al defectului. În acest caz, defectul se situează aproximativ la nivelul 3.8 (din cele 10 nivele posibile), atingînd maturitatea. Pentru rumentul <E3850610> (care prezintă o uzură neuniformă a cămăşii exterioare), concentrări anormale de energie sunt semnalate la două scale succesive în Figura 5.32: #0 şi #1. Sub-benzile de frecvenţă corespunzătoare acestora sunt: #512 (la scala #0) şi #256 (la scala #1). Frecvenţele centrale ale acestor sub-benzi au aceeaşi valoare, 9.56 kHz, ceea ce reprezintă aproximativ 55×FTCO (multiplu întreg). De notat că frecvenţa centrală a sub-benzii #571 de pe scala #0, de la rulmentul precedent, este egală cu aproximativ 60.78×FTCO, în timp ce frecvenţa centrală din cazul acestui rulment este egală cu 42.55×FTCI. Localizarea defectului este astfel neambiguă şi simplu de efectuat, chiar dacă FTCI şi FTCO au valori relativ apropiate. În ceea ce priveşte gradul de severitate, în cazul uzurii, în general, el nu poate fi determinat cu precizie prea mare, fiind estimat aici la nivelul 3 (matur, de asemenea). În fine situaţia cea mai interesantă este reprezentată în Figura 5.33, pentru rulmentul <M3850610> (cu ciobituri repartizate neuniform pe ambele cămăşi). În acest caz, pot fi puse în evidenţă 5 concentrări anormale de energie, în sub-benzile: #571 (la scala #0), #256 (la scala #1), #129 (la scala #2) şi #64 (la scala #3). Avînd în vedere frecvenţele centrale ale acestor sub-benzi (10.569 kHz la scala #0 şi 9.56 kHz la celelalte scale), este evident că sunt puse în evidenţă defectele de pe ambele cămăşi ale rulmentului, deşi informaţia relativă la acestea a fost combinată în zgomotul de defect într-o manieră necunoscută. Mai mult, analizînd valorile medii ale acestor concentrări, se constată că defectele de pe cămaşa interioară au un grad de severitate estimat la 2.7 (incipiente spre mature), în timp ce defectele de pe cămaşa exterioară – la 1.9 (incipiente, dar cu tendinţă de maturizare). După demontarea rulmenţilor defecţi, rezultatele de diagnoză au fost confirmate atît în ceea ce priveşte localizarea defectelor, cît şi în ceea ce priveşte gradul relativ de


120

severitate (crăpătura de pe cămaşa interioară a rulmentului <I3850610> era mai severă decît uzura rulmentului <E3850610>, iar ciobiturile de pe cămaşa interioară a rulmentului <M3850610> erau mai multe decît cele de pe cămaşa exterioară, unele dintre ele ocupînd cavităţi mai mari). Această aplicaţie evidenţiază capacitatea undinelor de a decodifica informaţii mai puţin clare, relativ la comportamentul (anormal) unor sisteme. Extragerea acestor informaţii se bazează pe focalizarea în frecvenţă a semnalelor. Calculatorul portabil al sistemului UMAPID posedă două procesoare în paralel, fapt care a condus la o uşoară scădere a duratei de rulare, faţă de un calculator de birou cu un singur procesor şi aproximativ aceeaşi frecvenţă de funcţionare. Aceasta sugerează că Algoritmul GAMP poate fi implementat mai eficient în manieră paralelă, pentru a reduce semnificativ durata de diagnosticare.

66.. CCoonncclluuzziiii ffiinnaallee şşii ppeerrssppeeccttiivvee La capătul celor doi ani alocaţi acestui proiect, se poate afirma că bilanţul general echipei de cercetare este unul pozitiv. Faţă de planul de realizare iniţial, nu au fost modificări de substanţă, din punctul de vedere al abordării ştiinţifice şi inovative, în pofida reducerii drastice treptate a resurselor financiare preconizate (ajungînd în final la numai 51% din valoarea stipulată în contract). Există totuşi nerealizări, în special legate de achiziţia de senzori – activitatea cea mai afectată de această reducere. Trusele de senzori sunt mai slab reprezentate decît s-a estimat la începutul proiectului. Aceasta s-a datorat nu doar diminuării finanţării, ci şi faptului că există extrem de puţini producători de senzori cu transmisie radio în alte domenii decît cel meteorologic-ecologic, care, în plus, să ofere preţuri corecte. Adaptarea senzorilor cu transmisie prin fir la transmisia radio este o activitate anvizajată de noi pentru viitor, avînd în vedere versatilitatea interfaţei VISA. (Această activitate nu a fost prevăzută explicit în planul de realizare iniţial.) Pe parcursul celor 2 ani, echipa de cercetare-inovare s-a ghidat după cuvintele cheie din titlul proiectului, pentru a realiza sistemul UMAPID: mobilitate, achiziţie de date (eventual, transmise pe calea undelor radio), prelucrare a datelor, identificarea sursei care a generat datele, diagnosticarea acestei surse. Mobilitatea este asigurată prin faptul că sistemul poate fi transportat cu uşurinţă de către o singură persoană, în vecinătatea sau în mijlocul sursei generatoare de date. Achiziţia de date este realizată atît prin intermediul internetului, cît şi direct, pe calea undelor radio, cu ajutorul interfeţei VISA (în curs de omologare la OSIM). Prelucrarea datelor se realizează pe două nivele: inferior, în zona senzorilor şi a plăcii de achiziţie; superior, în zona calculatorului mobil. Identificarea şi diagnosticarea sunt operaţii complexe efectuate cu ajutorul unor programe special concepute şi implementate în acest scop, la nivelul calculatorului mobil. Perspectivele tehnice ale acestui produs constau în extinderea truselor de senzori şi a capabilităţilor lui de diagnoză, către alte domenii (în special în medicină). În ceea ce priveşte valorificarea sistemului UMAPID, se speră ca, după depăşirea perioadei actuale de criză economică traversată de majoritatea ţărilor, acesta să aibă un impact mai mare pe piaţă.


121

AAnneexxaa AA.. RReeddeeffiinniirrii aallee ccrriitteerriiuulluuii ccaalliittăăţţiiii pprreeddiiccţţiieeii ((PPQQ))

Fiecare dintre modelele de identificare utilizate ca predictori poate fi optimizat cu ajutorul unui criteriu numit calitatea predicţiei (PQ – Prediction Quality), definit în [SPD08]. Justificarea acestor definiţii a fost precizată tot în [SPD08]. Simulările ulterioare cu ajutorul algoritmilor de predicţie implementaţi au relevat însă posibilitatea de a redefini acest criteriu, astfel încît precizia de predicţie să crească. Deficienţa majoră a definiţiilor amintite o constituie faptul că normalizarea sumei de la numitor se efectuează cu factori care anihileaza în mare parte caracteristicile predictorului (sau extrapolatorului). De exemplu, dacă tubul de încredere este foarte larg, criteriul PQ continuă să fie mare, deoarece valorile mari ale dispersiei erorii de predicţie la fiecare pas sunt anihilate de valoarea mare a mediei lor. În cazul extrapolării, dispersia semnalului fiind adesea mult mai mare decît suma pe care o ponderează, diferenţele dintre doi extrapolatori diferiţi sunt adesea insesizabile în valorile lui EQ (Extrapolation Quality – definit tot în [SPD08]). Definiţiile alternative care urmează încearcă să atenueze aceste deficienţe. Ele se bazează pe următoarele variabile (cu notaţiile din [SPD08], pe care nu le mai reluăm):

raportul semnal-zgomot:

2 2

221

SNR ˆ ˆ

defy y

e

σ σ= =

σλ; (A.1)

varianţa semnalului predictat/extrapolat pe orizontul de predicţie:

( )2

ˆ1

1 ˆ ˆKdef

Ky y K

k

y N k yK =

⎡ ⎤σ = + −⎣ ⎦∑ , cu 1

1ˆ ˆKdef

yKk

y y N kK =

⎡ ⎤= +⎣ ⎦∑ ; (A.2)

varianţa semnalului măsurat pe orizontul de predicţie:

( )2

1

1 KdefKy y K

k

y N k yK =

⎡ ⎤σ = + −⎣ ⎦∑ , cu 1

1 Kdef

yKk

y y N kK =

⎡ ⎤= +⎣ ⎦∑ . (A.3)

Astfel, definiţiile lui PQ şi EQ din [SPD08] pot fi înlocuite cu definiţiile de mai jos, respectiv:

1

ˆ

100PQ [%]ˆ ˆ

1+SNR

def

K

k y yk

K Ky y

y N k y N k=

=⎡ ⎤ ⎡ ⎤σ + − +⎣ ⎦ ⎣ ⎦

σ σ

∑; (A.4)

1

ˆ

100EQ [%]ˆ

1+SNR

def

K

y yk

K Ky y

y N k y N k=

=⎡ ⎤ ⎡ ⎤+ − +⎣ ⎦ ⎣ ⎦

σ σ

∑. (A.5)

Aceste definiţii prezintă de asemenea un inconvenient. Este normal ca funcţiile PQ şi EQ să crească odată cu SNR. Este însă anormal ca ele să scadă odată ce valorile măsurate devin mai plate pe orizontul de predicţie (adică odată ce K

yσ înregistrează o

creştere). Normal ar fi ca ele să crească odată cu creşterea SNR pe orizontul de predicţie. Acesta se defineşte astfel:

( )( )

2

2

ˆ

SNRKdef yK

Ky y−

σ=

σ, (3.6)


122

unde:

( )2

ˆ1

1 ˆKdef

Ky y y y

k

y N k y N kK−

=

⎡ ⎤ ⎡ ⎤σ = + − +⎣ ⎦ ⎣ ⎦∑ . (A.7)

În aceste condiţii, calitatea predicţiei se poate redefini ca mai jos:

2

1

100PQ [%]ˆ

1+ˆ SNR SNR

def

K

kk

Ke

=

=

σ

λ

∑. (A.8)

Analog, calitatea extrapolării devine:

100EQ [%]11+

SNR SNR

def

K

= . (A.9)

Definiţiile (A.8) şi (A.9) au condus la cele mai bune rezultate de predicţie în numeroasele experimente de simulare desfăşurate. Din acest motiv, în acest raport de cercetare, ele vor înlocui vechile definiţii din raportul tehnic [SPD08].


123

AAnneexxaa BB.. AAllggoorriittmmii ddee eeşşaannttiioonnaarree ssttooccaassttiiccăă uunniivveerrssaallăă

B.1. Algoritmul original al lui Baker

Tehnica SUS (Stochastic Universal Sampling) este utilizată în mod tradiţional utilizată pentru generarea de secvenţe pseudo-aleatoare cu distribuţie de probabilitate dată în cadrul AG [MiM95] şi va fi descrisă în continuare, în versiunea ei originală publicată în [BaJE85] şi [BaJE87]. Procedura bazată pe această tehnică se numeşte Algoritmul lui Baker. Acest algoritm rezolvă de fapt problema generării unei valori numerice cu o probabilitate dată. Pentru a formula mai precis această problemă, se pleacă de la o mulţime finită de

valori numerice 1, def

N n n Na ∈=A , pentru care este atribuită următoarea densitate de

probabilitate (de tip frecvenţă de apariţie):

: [0,1]

( ) .

Ndef

n n na a p

→⎡⎢⎢ =⎣

Ap

p (B.1)

Evident, mulţimea valorilor frecvenţei de apariţie, 1, def

N n n Np ∈=P , are următoarea

proprietate:

11

=∑=

N

nnp ⇔ NNp

N

nn =∑

=1

. (B.2)

Egalitatea (B.2) poate fi generalizată prin:

MpN

nn =∑

=1

, (B.3)

unde M ∗∈N este un număr arbitrar fixat. Egalitatea (B.3) arată că numerele mulţimii NP pot să nu verifice proprietatea (B.2), adică pot să nu constituie valorile unei densităţi de probabilitate. Aceasta se regăseşte imediat, prin normalizarea fiecăruia dintre numerele mulţimii NP cu suma valorilor lor.

După normalizare, fiecare valoare np se înmulţeşte cu întregul M ∗∈N şi se renotează

prin np . Astfel, rezultă egalitatea (B.3). În acest context, problema este de a implementa mecanismul SUS, care constă în generarea de numere din mulţimea NA cu frecvenţele de apariţie corespunzătoare

valorilor din NP (fie că aceste valori sunt sau nu returnate de o densitate de probabilitate). Acest mecanism este simulat cu ajutorul unei rulete virtuale, ca în Figura B.1.

p1

Selector

p2

pn

pN

Figura B.1. Mecanismul SUS simulat cu ajutorul unei rulete virtuale ideale.

Discul ruletei este segmentat în N sectoare avînd suprafeţe proporţionale cu valorile frecvenţelor de apariţie din mulţimea NP . Astfel, suprafaţa totală a discului este fie 1, fie,


124

mai general, M (în funcţie de maniera în care mulţimea NP verifică egalităţile (B.2) sau

(B.3)). Fiecare sector corespunde unui număr din mulţimea de selecţie NA . Un selector (bila ruletei) se mişcă liber, dar amortizat, în jurul discului. În momentul cînd selectorul s-a oprit, este ales un anumit sector de disc, care indică numărul ce trebuie extras din NA .

Astfel, fiecare dintre numerele mulţimii NA are şansa de a fi selectat (chiar dacă frecvenţa sa de apariţie este mică), numai că această şansă este proporţională cu aria sectorului care îl reprezintă. Pe termen lung, dacă se efectuează suficient de multe extrageri de numere din NA folosind ruleta, histograma numerelor selecţionate se apropie de graficul densităţii de probabilitate p . Pentru implementarea mecanismului ruletei virtuale (de fapt a mecanismului SUS) nu se poate opera cu valori fracţionare ale ariilor sectoarelor de disc. De aceea, mecanismul anterior este reconsiderat astfel:

• discul ruletei va trebui să conţină un număr de sectoare echivalente (adică de arii identice) egal cu N (în cazul egalităţii (B.2)) sau M (în cazul egalităţii (B.3)); • aria unui sector nu mai are importanţă, deoarece fiecare sector este ocupat de cîte un număr din mulţimea NA ;

• numărul de sectoare pe care le poate ocupa o aceeaşi valoare na din mulţimea NA ,

număr notat cu ns ∈N , este determinat de valoarea np corespunzătoare; practic,

mulţimea 1,

def

N n n Ns

∈=S constituie histograma dorită a valorilor din NA .

Valorile histogramei verifică astfel una dintre egalităţile următoare, în funcţie de proprietatea (B.2), respectiv (B.3), a mulţimii NP :

NsN

nn =∑

=1

, respectiv MsN

nn =∑

=1

. (B.4)

De notat că unii dintre întregii ns care participă la sumele din (B.4) pot fi nuli, dacă valorile

np corespunzătoare sunt prea mici în raport cu valorile mari ale mulţimii NP . În noua formulare, mecanismul ruletei este sugerat de Figura B.2.

Selector

a1a2

an

aN

an

aN

Figura B.2. Mecanismul SUS implementat cu ajutorul unei rulete virtuale.

Astfel, de exemplu, numerele 1a şi 2a ocupă cîte un sector de disc, în timp ce numerele

na şi Na ocupă cel puţin două sectoare de disc, conform distribuţiei de probabilitate sugerate de Figura B.1. Noul mecanism funcţionează acum similar celui anterior, numai că selectorul alege unul dintre sectoarele echivalente care indică în mod direct o anumită valoare din NA . De notat că nu este necesar ca sectoarele ocupate de o anumită valoare să fie adiacente sau grupate în aceeaşi zonă a discului. Ele pot fi repartizate arbitrar pe suprafaţa discului, cu condiţia să se respecte numărul lor. Acest mecanism poate fi folosit şi la generarea unei secvenţe pseudo-aleatoare cu distribuţie uniformă (dacă fiecare sector este ocupat de o altă valoare decît celelalte).


125

Practic, mecanismul generării de secvenţe pseudo-aleatoare cu distribuţie de probabilitate dată se poate implementa cu ajutorul unui algoritm care generează o secvenţă pseudo-aleatoare de numere uniform distribuite [SCS05]. (În mediul de simulare MATLAB, rutina de generare a secvenţelor de numere cu distribuţie uniformă este rrraaannnddd .) În general, mulţimea de valori ale secvenţei este notată prin NU . În mod convenţional, această mulţime poate conţine elemente care se repetă de un anumit număr de ori. Evident, N N⊇A U (deoarece unele valori din NA pot lipsi în NU ). Dacă cel puţin una

dintre valorile lui NA se repetă în NU de un număr de ori diferit de ale celorlalte valori, distribuţia de probabilitate este neuniformă, altfel ea este uniformă. Revenind la implementarea efectivă a mecanismului SUS, practic, algoritmul aferent va returna mulţimea NU şi numerele NS , plecînd de la mulţimile NA şi NP . Odată mulţimea

NU construită, alegerea unei valori din cadrul acesteia se poate efectua folosind orice algoritm de generare a unei secvenţe uniform distribuite. Procedura originală al lui Baker (corespunzătoare proprietăţii (B.2)) este descrisă de Algoritmul B.1.

Algoritmul B.1. Algoritmul (clasic al) lui Baker.

Au fost utilizate denumiri sugestive ale variabilelor pentru a uşura înţelegerea logicii sale. Indicatorul de altitudine µ pleacă iniţial de la o valoare mică, situată între 0 şi 1 (dar nu unitară). Dacă valoarea este nenulă şi 1 1p N < , este posibil ca numărul 1a să nu fie

selecţionat în mulţimea finală NU , deşi poate că el ar fi fost selecţionat în cazul în care ar

fi ocupat o altă poziţie în mulţimea NA . Acesta nu este însă un dezavantaj major (oricum

se poate iniţializa indicatorul de altitudine cu valoarea nulă), mai ales că şi situate în alte poziţii, numerele cu frecvenţe extrem de mici de apariţie (mai mici decît 1/ N ) pot să nu fie selecţionate.

Date de intrare: Mulţimile 1, N n n Na ∈=A (valorile secvenţei pseudo-aleatoare) şi

1, N n n Np ∈=P (frecvenţele de apariţie, cu 1

1N

nn

p=

=∑ ).

1. Iniţializare. Se alege arbitrar un număr [0,1)µ∈ (eventual, generat folosind o distribuţie uniformă) care va juca rol de indicator de altitudine. Se iniţializează: ştacheta 0ν = , mulţimea valorilor efective (finale) ale semnalului N =∅U şi

mulţimea numerelor de sectoare de disc ocupate de valorile din NA , adică

1, 0N n n Ns ∈= =S .

2. Pentru 1,n N∈ , se efectuează următoarele operaţii: 2.1. Ridicarea ştachetei: nNpν ← ν + . 2.2. Cît timp indicatorul de altitudine este sub ştachetă, adică µ < ν , reactualizează

celelalte variabile: a. Adaugă valoarea curentă la mulţimea finală N N na← ∪U U .

b. Incrementează numărul corespunzător de sectoare: 1n ns s← + . c. Ridică altitudinea cu paşi unitari: 1µ←µ + .

Date de ieşire: Mulţimea NU a valorilor efective ale semnalului şi mulţimea

1, N n n Ns ∈=S a numerelor de sectoare de disc ocupate de valorile din NA .


126

Ştacheta ν este ridicată cu incremente definite de produsele 1, n n Np N ∈ . Pînă cînd ea

nu este depăşită de indicatorul de altitudine (care este incrementat cu valori unitare), numărul de sectoare ocupate pe disc de valoarea curentă na creşte (cu un increment unitar de asemenea). Se poate arăta că:

n n np N s p N≤ ≤⎢ ⎥ ⎡ ⎤⎣ ⎦ ⎢ ⎥ , 1,n N∀ ∈ şi 1

N

nn

s N=

=∑ . (B.5)

Din această proprietate rezultă că întregii ns sunt aproape proporţionali cu frecvenţele de

apariţie np . Desigur, unii dintre întregii ns pot mări, alţii pot micşora şansele numerelor pe care le reprezintă, în raport cu frecvenţele de apariţie. Dar eroarea este de cel mult un sector în plus, respectiv în minus. Dacă numărul total de sectoare este suficient de mare, atunci eroarea de frecvenţă de apariţie poate fi neglijată. De notat că numărul total de sectoare este chiar N , acesta fiind şi cardinalul mulţimii NU .

B.2. Algoritmul generalizat al lui Baker

O variantă generalizată a Algoritmului B.1 este prezentată în Algoritmul B.2, pentru cazul în care proprietatea (B.2) nu se verifică, dar se poate forţa verificarea proprietăţii (B.3).

Algoritmul B.2. Algoritmul generalizat al lui Baker.

Date de intrare: Mulţimile 1, N n n Na ∈=A (valorile secvenţei pseudo-aleatoare),

1, N n n Np ∈=P (valori proporţionale cu frecvenţele de apariţie ale secvenţei) şi

M ∗∈N (numărul de sectoare echivalente ale ruletei virtuale).

1. Normalizarea mulţimii NP prin:

1

nn N

ii

pp Mp

=

←

∑, 1,n N∀ ∈ .

(Noua mulţime NP verifică acum proprietatea (B.3).)

2. Iniţializare. Se alege arbitrar un număr [0,1)µ∈ (eventual, generat folosind o distribuţie uniformă) care va juca rol de indicator de altitudine. Se iniţializează: ştacheta 0ν = , mulţimea valorilor efective (finale) ale semnalului N = ∅U şi

mulţimea numerelor de sectoare de disc ocupate de valorile din NA , adică

1, 0N n n Ns ∈= =S .

3. Pentru 1,n N∈ , se efectuează următoarele operaţii: 3.1. Ridicarea ştachetei: npν ← ν + . 3.2. Cît timp indicatorul de altitudine este sub ştachetă, adică µ < ν , se

reactualizează celelalte variabile: a. Adaugă valoarea curentă la mulţimea finală N N na← ∪U U .

b. Incrementează numărul corespunzător de sectoare: 1n ns s← + . c. Ridică altitudinea cu incremente unitare: 1µ ←µ + .

Date de ieşire: Mulţimea NU a valorilor efective ale semnalului şi mulţimea

1, N n n Ns ∈=S a numerelor de sectoare de disc ocupate de valorile din NA .


127

În acest caz, se poate arăta că:

n n np s p≤ ≤⎢ ⎥ ⎡ ⎤⎣ ⎦ ⎢ ⎥ , 1,n N∀ ∈ şi 1

N

nn

s M=

=∑ . (B.6)

Generalizarea permite operarea cu un număr de sectoare de disc diferit de numărul maximal al valorilor secvenţei pseudo-aleatoare. Unul dintre motivele pentru care este necesară această generalizare este legat de creşterea variabilităţii semnalului pseudo-aleator rezultat (sau a lărgimii sale de bandă), în special cînd numărul posibil de valori ale acestuia, N , nu este suficient de mare. Conform algoritmului clasic (Algoritmul B.1), este posibil ca unele dintre numerele din NS să fie nule, datorită valorilor prea mici ale frecvenţelor de apariţie corespunzătoare. Aceasta înseamnă că secvenţa pseudo-aleatoare rezultată conţine doar o parte din elementele mulţimii NA , variabilitatea ei fiind astfel diminuată. Prin amplificarea frecvenţei de apariţie cu un număr suficient de mare ( M ), care conduce totodată şi la creşterea numărului de sectoare echivalente ale ruletei virtuale, este posibil ca toate elementele mulţimii NA să se regăsească în mulţimea NU , cele care anterior fuseseră eliminate ocupînd acum cel puţin un sector de disc. De notat că algoritmul poate să nu funcţioneze foarte corect pentru distribuţia de probabilitate uniformă în cazul în care M N< .


128


129

AAnneexxaa CC.. PPuubblliiccaaţţiiii sseelleeccttaattee

[SCI08] Ştefănoiu D., Culiţă J., Ionescu F. – FORWAVER – A Wavelet-Based Predictor

for Non Stationary Signals, Industrial Simulation Conference ISC-2008, Lyon, France, A publication of EUROSIS-ETI, pp. 377-381, June 9–11, 2008 (ISI-Thomson and INSPEC referenced).

[StCu09] Ştefănoiu D., Culiţă J. – PARMAX – A Predictor for Distributed Time Series, Industrial Simulation Conference ISC-2009, Loughborough, U.K., A publication of EUROSIS-ETI (ISBN 978-90-77381-4-89), pp. 5-12, June 1–3, 2009 (ISI-Thomson and INSPEC referenced).

[SSCM09] Ştefănoiu D., Seraficeanu C., Culiţă J., Muscă Gh. – Identification of MIMO-ARMAX Models for Glycemia and Sodium Ions Tests, through Particle Swarm Optimization, accepted at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009 (ISI-Thomson referenced).


130

Industrial Simulation Conference ISC-2008, Lyon, France, June 9–11, 2008

377

FORWAVER – A WAVELET-BASED PREDICTOR FOR NON STATIONARY SIGNALS

Dan Stefanoiu 1, Janetta Culita 1, Florin Ionescu 2

1 „Politehnica” University of Bucharest, ROMANIA

Dept. of Automatic Control and Computer Science (www.acs.pub.ro) 2 University of Applied Sciences in Konstanz, GERMANY

Dept. of Mechatronics (www.htwg-konstanz.de) E-mails: [email protected], [email protected], [email protected]

KEYWORDS Prediction, orthogonal wavelet packets, prediction quality. ABSTRACT FORWAVER is a simulator that provides high accuracy time series forecasting with the help of wavelet-based models. Within this paper, the models rely on signal bases consisting of Daubechies orthogonal wavelet packets and ARMA modeling. Such a basis is adaptively selected, depending on data, while the ARMA model is obtained by maximizing a cost function, namely the prediction quality. Simulation on real time series have proven that, when comparing to the classical time series model (built by adding the deterministic trend, the seasonal component and the stochastic auto-regressive component) the wavelet-based model is more accurate and less subjective. 1. INTRODUCTION Prediction of natural phenomena (seismic, climatic, celestial, etc.) is nowadays of great importance, because of unexpected and rapid changes they might exhibit. Many engineering processes also require quality forecasting in order to be modeled, simulated, automatically controlled, etc. Some of such phenomena or processes reveal their behavior through finite length data strings 1,[ ] n Ny n

∈ referred to as time series

(ts). Although the governing dynamics of such a ts is unknown, the entity providing the data can be associated to a non stationary model (i.e. with variable frequency contents). Any ts is subsuming two types of behaviors: deterministic and stochastic. Classically, the deterministic component consists of a trend Ty and a seasonal (periodic) signal Sy , whereas the stochastic component is an auto-regressive (AR) process ARy [Söderström, 1989], [Stefanoiu, 2005]. The classical model is then: ˆ T S ARy y y y≡ + + . (1)

The trend is a low degree polynomial, estimated by using the Least Squares Method (LSM). The periodic behavior is perhaps the most difficult to decode, although the LSM can be employed as well. Finally, a Levinson-Durbin Algorithm (LDA) returns the stochastic component. The accuracy of ts prediction is sensitive to the accuracy of deterministic component. Expressing the deterministic behavior like in (1), inhibits the modeling of non stationary behavior. Thus, the classical model is quite accurate only in case of quasi-

stationary ts. Moreover, the user has to select the optimal period (if any) by considering three sources: the closest average periodic waveform to the ts (in the least squares sense), the maximum point of spectral representation (periodogram) and the preliminary information about the process that generated the data. Therefore, when detecting and selecting the seasonal component, the user’s subjectivism is crucial and can sensibly increase the prediction error. The non stationary behavior of a ts is more suitably decoded through a time-frequency-scale analysis [Cohen, 1995]. Wavelets are typical instruments of this analysis in context of multi-resolution theory. This theory has mostly been devised within the works of S. Mallat and I. Daubechies, in the late ’80s [Daubechies, 1988], [Mallat, 1989]. (A generalization has been introduced in [Coifman, 1992].) Orthogonal wavelets are employed to build bases within the multi-resolution structure endowing the space of stable, finite energy signals. Such a wavelet basis is uniquely associated to a filter bank that produces a specific sub-band segmentation of ts spectrum. Moreover, the filter bank can be configured according to the energy distribution of ts, both in time and frequency. Two modifications are proposed in this paper: the classical deterministic model of a ts is replaced by a wavelet-based model and the AR modeling is replaced by ARMA modeling (auto-regressive, with moving average). 2. ON THE WAVELET-BASED MODEL The deterministic modeling with wavelets is actually a problem of data denoising. Thus, the original data are projected on a subspace of signal space, U , generated by a finite collection of wavelet packets, like in Figure 1.

][][ 0gD ξ

yr

yr∆

yr

U

y v U ⊥

yW

Figure 1: Data Denoising Principle

The projection, Wy , is associated not only to the deterministic component of ts, but also to its useful


378

(denoised) part. The overall model is then: ˆ W ARMAy y y≡ + . (2)

The colored noise corrupting the data, Wv y y≡ − , is orthogonal on the wavelet subspace and, thus, on the useful component Wy , as illustrated in Figure 1. The problem is to build and use the overall model (2). This goal can be reached after completing the following steps: (a) estimate the useful component Wy according to the data y and to a given multi-resolution structure; (b) estimate the ARMA (stochastic) component ARMAy starting from the colored noise v ; (c) predict the ts by means of best predictor. All together constitute the core of FORWAVER simulator. The details of its construction can be found in [Stefanoiu, 2007]. Hereafter, only a short description of the three steps above is provided. The U subspace is generated by using wavelet packets and an entropy based criterion. More specifically, the deterministic (useful) component is:

,

, , , ,( , )

( ) ( )m p

W m p n m p nm p n

y t c t∈ ⊗ ∈

= ψ∑ ∑M P N

, t∀ ∈R , (3)

where: t is the continuous time,

, , 0 , ,,m p n m p nc y= ψ , ( , )m p∀ ∈ ⊗M P , ,m pn∀ ∈N (4)

are wavelet coefficients, , ,m p nψ is a generic wavelet from the current packet and 0y is the projection of ts y on the subspace 0≡U V from the multi-resolution structure [Mallat, 1989]. Coefficients are computed by means of the filter bank corresponding to the multi-resolution structure. The finite sets M , P and ,m pN determine the structure of such filter bank. Figure 2 displays an example of filter bank (binary tree) together with the frequency segmentation it realizes.

π π/2

ω

high frequency

0 (0,0)

2

1

(1,1)

(1,0)

Spectrum

0 low

frequency

π/4 2-4π

6

15

15 (4,0)

3 (2,0)

4 (2,1)

7 (3,0) 16

(4,1) 8

(3,1) 9

(3,2) 10 (3,3)

21 (4,6)

22 (4,7)

23 (4,8)

24 (4,9)

12 (3,5)

6 (2,3)

5 (2,2) 11 (3,4)

mid

dle

freq

uenc

y

3π/4

12 8

22 21 23 24

9

16

Figure 2: A Wavelet Tree and its Frequency Effect

In this example, the set of direct product depth-azimuth is: (2,3), (3,1), (3,2), (3,5), (4,0), , (4,9)⊗ = …M P (corres-

ponding to tree leaves), while the time offsets ,m pN are determined by accounting the supports of ts and basic couple of father-mother wavelets ,φ ψ [Daubechies, 1988]. On the tree branches lie mirrored versions of QMF filters h (low-pass) and g (high-pass), followed by decimators. Wavelet coefficients are provided by the tree leaves, after entering the first projection coefficients (on time-shifted father wavelets):

( )0,0, 0,0,1

, [ ]N

n nk

c y y n k n=

= φ = φ −∑ . (5)

Interestingly, the filter bank can be employed to compute wavelet values as well, according to the recursive equation below:

, ,0 1, / 2 ,0( ) 2 (2 )m p n m pn

t t n− ⎢ ⎥⎣ ⎦∈

ψ = γ ψ −∑Z

, t∀ ∈R , (6)

where hγ ≡ , if p is even, or gγ ≡ , otherwise. The recursive equation (6) starts from the father wavelet

0,0,0ψ ≡ φ . The other wavelets of packet , ,m p n n∈ψ

Z are just

time-shifted versions of , ,0m pψ . The structure of filter bank can adaptively be set, by minimization of wavelet coefficients entropy. By definition, the entropy of a discrete time signal x is:

( ) ( )2

| [ ] | | [ ] |( ) logn

x n x nxx x∈

= −∑Z E E

H , (7)

where ( ) 2| [ ] |n

x x n∈

=∑ ZE is the signal energy. According

to Shannon’s interpretation (given in 1948, see [Shannon, 1948]), the entropy (7) quantifies the average number of bits that are necessary to encode a signal sample. Also, the entropy expresses both the signal redundancy and its intrinsic order. The smaller the entropy, the less redundant and the more ordered the signal. Small redundancy allows the signal information to be concentrated in a small number of samples, due to their high intrinsic order. Note that the entropy is not an additive measure, i.e. the entropy of a signal built by concatenation of two or more signals is different, in general, from the sum of each concatenating signal entropy. Finding the tree leaves that yield minimum entropy is a problem that can be solved by using IDA* from Artificial Intelligence [Russel, 1995]. Hence, the problem of minimum entropy wavelet basis selection is equivalent to searching for the optimum within a tree endowed with costs on the arcs. IDA* strategy relies on a tree pruning mechanism that allows the optimum path to be found very efficiently. In case of QMF banks and the signal entropy, the search of minimum entropy configuration of associated binary tree must be adapted to the context of IDA*. Thus, the search is realized within a meta-tree defined as follows (see Figure 3): (a) meta-nodes are associated to a binary tree shape (or boundary); (b) a meta-node is generated by expanding a binary tree node up to its two children; (c) the meta-node label is the string of indexes associated to binary tree leaves; (d) the cost of a transition from a meta-node to one of its children is the entropy of the wavelet coefficients lying on the boundary of the QMF bank associated to the meta-child; (e) the estimated cost is null. The optimal filter bank corresponds to a meta-leaf for which the total entropy on the path from root is minimal. The final version of Wy is obtained only after removing the weak wavelet coefficients from representation (3). Thus, for any ( , )m p ∈ ×M P , all wavelet coefficients whose

amplitudes are inferior to ( ),m pcµE (where 0µ ≥ is the masking threshold) have to be removed (or masked).


379

••• ••• ••• ••• •••

0

[1 2]

[3 4 2] [1 5 6]

[7 8 4 2] [3 9 10 2] [3 4 5 6] [1 11 12 6] [1 5 13 14]

Figure 3: The Meta-Tree of Analysis QMF Banks

And yet, the removed information has not been lost, but just transferred to the colored noise Wv y y≡ − . This noise is subsequently identified to an ARMA model, by using the Minimum Prediction Error Method [Söderström, 1989], [Stefanoiu, 2005]. More specifically, the colored noise is supposed to verify the following differences equation:

1 2

1 2

[ ] [ 1] [ 2] [ ][ ] [ 1] [ 2] [ ],

na

nc

v k a v k a v k a v k nae k c e k c e k c e k nc

+ − + − + + − == + − + − + + −

k ∗∀ ∈N , (8)

where e is a Gaussian white noise with null mean and 2λ variance (unknown), while 1,i i na

a∈

and 1,j j nc

c∈

are model

parameters (unknown, as well as their number). For any couple of structural indices , na nc , one can estimate both the parameters from colored noise data and the values of white noise. The ARMA model allows prediction of colored noise, according to the recipe below:

1

1

1

ˆ ˆ ˆ ˆ ˆ[ ] [ 1] [ ]ˆ ˆ ˆ ˆ[ 1] [ ]

ˆ ˆˆ ˆ ˆ ˆ[ ] [ ] [ 1] [ ]

V V na V

nc

V V n V

y n a y n a y n nac e n c e n nc

e n y n y n y n nα

= − − − − − +⎡⎢ + − + + −⎢⎢ = + α − + + α − α⎣

, (9)

where: ˆV ARMAy y≡ on the prediction horizon 1,N N K+ +

(for 1K ≥ ) and ˆVy v≡ , on the measure horizon 1, N . Notations with a hat mean estimated values. In order to estimate white noise values, a long AR model has been used (with 3( )na nc+ parameters). The model can then be determined by means of LDA. The white noise corrupting the data constitutes the unpredictable part of ts and is not included into the overall model (2). However, its variance, 2λ (that can also be estimated), plays a major role in setting the prediction accuracy. Actually, the accuracy is inversely proportional to

2λ and decreases as the prediction instant increases. More specifically, if ˆ

p p∈β

N are the coefficients of polynomial

resulted by infinite division:

1

1

ˆ ˆ ˆ1( ) ˆˆ ˆ ˆ1( )

ncpnc

pnapna

c z c zC z za z a zA z ∈

+ + += = β

+ + + ∑N

, (10)

then the accuracy of each predicted value is inversely proportional to its variance, defined as below:

( )2 2 2 2 20 1

ˆ ˆ ˆ ˆ ˆk kλ = λ β +β + +β , 1,k K∀ ∈ . (11)

By assembling equations (3) and (9), the overall prediction model is then:

( )

,

, , , ,( , )

ˆ[ ]

ˆ [ ], 1, .m p

m p n m p nm p n

V

y N k c N k

y N k k K

∈ ⊗ ∈

+ = ψ + +

+ + ∀ ∈

∑ ∑M P N (12)

(The accuracy of predicted values (12) is given by (11).) Usually, the accuracy of predicted values is represented by means of the confidence intervals:

[ ]ˆ ˆ[ ] , [ ]k k kI y N k y N k= + −βλ + +βλ , 1,k K∀ ∈ . (13)

In case of normally distributed noises, in definition (13), 3β = and the true value [ ]y N k+ belongs to kI with a

probability superior to 95%. The larger the confidence interval, the less accurate the prediction. Several predictors are available, by varying the structural indices na and nb . In order to select the best one, the prediction quality criterion has to be employed. This cost function has been introduced in [Stefanoiu, 2007] with the following definition (for a K -length prediction horizon):

[ ] [ ]

1

1

100PQ[ ] [%]ˆ ˆ

1+ˆ

def

K

kk

K

y kk

Ky N k y N k

=

=

=λ + − +

σ λ

∑

∑

, (14)

where yσ is the standard deviation of ts. According to criterion (14), the predictor improves its performance when the confidence tube tightens and/or the predicted values are closer to the true ones. The only problem is to implement definition (14), because the true values are unknown on the prediction horizon. Clearly, the only way is to preserve the last K data of ts, as if they were unknown. The wavelet-based and ARMA models are then built by using N K− data only. The other K data are used to select the best predictor, by maximizing PQ surface, as function of na and nb . 3. SIMULATION RESULTS AND DISCUSSION The FORWAVER simulator has been implemented within MATLAB 7.04 environment. Some parameters have to be set in advance, in order to tune the simulation, such as: the support length of father wavelet, 2Nφ (which leads to the analysis wavelets , φ ψ , according to Daubechies’ algorithm [Daubechies, 1988]), the stop test for IDA* procedure ( 0ε > ) and the masking threshold for awavelet coefficients ( [0,1)µ∈ ). Usually, 2,25Nφ ∈ and 710−ε = , whereas the masking threshold can be increased up to 10% . A technical parameter is also employed: the resolution index L∈N of father wavelet. Thus the projection (5) is computed by using values of wavelet father, which are sampled with period 10 L− . Usually, 0,6L∈ . If 0L > , the wavelet family of expansion (3) becomes a tight frame of signals space; its


380

constant is determined by means of LSM (see [Stefanoiu, 2007] for details). The predictor has been tested on a collection of 15 ts extracted from various natural phenomena. Note that all the signals are genuine and not artificially generated, as artifacts. The following pictures exhibit the performance of classical and wavelet-based predictors for one of them, representing the evolution of USD-EURO exchange rate, since the formal introduction of European currency. In order to compare the two predictors, the last 5K = data has completely been removed from the models construction. From the N K− remaining data, another K (the most recent ones) have been removed, such that the optimal predictors be found. Thus, the models are actually built by using the oldest 2N K− data. Figure 4 displays the ts variation and the corresponding trend, whereas Figure 5 reveals the performance of classical best predictor.

Figure 4: USD-EURO Exchange Rate

Figure 5: Performance of Classical Predictor

The PQ criterion has been employed to find the best polynomial degree of trend and AR order. One can see that the value of evaluated PQ on the last K data (which did not partake to the model construction or selection) is quite modest: 73.49%. Thereby, Figure 5 shows that the measured data hardly fall inside the confidence tube.

Figure 6 exhibits the performance of wavelet based predictor.

Figure 6: Performance of Wavelet-Based Predictor

The improvement is quite obvious, since PQ jumped to 93.86% and the predicted values are close enough to the measured ones, even for far away prediction instants. The father and mother wavelets selected by the simulator after varying Nφ from 2 to 25 are illustrated in Figure 7. Wavelets correspond to the maximum of Nφ in this case (i.e. 25). Also, the resolution index L has been varied in order to reach for the optimal predictor, in PQ sense. One has been found that the optimal value is 6 (which generated a very dense tight frame).

Figure 7: Optimal Wavelets Selected by FORWAVER

Selection has been made by using the maxima of PQ surface, as shown in Figure 8. One can see that the overall maximum of PQ is 90.3%, for 11na = and 2nc = . Interestingly, in this case, the effective PQ is higher (93.86%). (Usually, the PQ decreases after considering the last K data.) In Figure 9, the structure of filter bank corresponding to minimum entropy of wavelet coefficients is displayed. Beside the fact the structure is quite simple and effective, it reveals an interesting phenomenon: the information about prediction is seemingly concentrated into the middle frequency sub-bands for this ts (recall the time-frequency


381

correspondence of Figure 2). This characteristic is confirmed by the scalogram represented in Figure 10.

Figure 8: Prediction Quality Surface and Optimal Indices

Figure 9. Optimal Filter Bank Selected by IDA* procedure

Figure 10: Time Series Scalogram

It would be dishonest to claim that the performance of wavelet-based predictor is by far superior to the one exhibited by the classical predictor for all 15 tested ts. For some ts, PQ gained only few percents. This is the case of ts for which the seasonal component is quite easy to determine by classical methods. It seems that wavelets tremendously improve the classical predictor performance when the

seasonal component is difficult to detect and/or derive or the ts does not exhibit periodic variations (like the one taken as example in this paper). While the wavelet-based model can naturally decode the repeatable patterns carried by the ts, the seasonal component is critical for classical prediction (and requires user’s intervention). In general, the wavelet-based predictor is very likely superior to the classical one, at the expense of complexity increase. 4. CONCLUSION This paper integrated two types of signal modeling in order to perform data compression and especially accurate prediction. The deterministic model is concerned with wavelets and adaptive frequency sub-band configurations, while the stochastic model is of ARMA class. The combination led to an overall prediction model with higher prediction accuracy, comparing to the classical model, on all tested ts. Future improvements are concerned with replacing the orthogonal wavelets by a dictionary of waveforms, from which the most fitted ones have to be selected. Removing the orthogonal nature of wavelets might produce superior performance in terms of prediction. REFERENCES Cohen L. 1995. Time-Frequency Analysis, Prentice Hall,

New Jersey, USA. Coifman R., Wickerhauser M.V. 1992 – “Entropy-Based

Algorithms for Best basis Selection”, IEEE Transactions on Information Theory, Vol. 38, No. 2, pp. 713–718.

Daubechies I. 1988. “Orthonormal Bases of Compactly Supported Wavelets,” Communications on Pure and Applied Mathematics, No. XLI, pp. 909–996.

Mallat S. 1989. “A Theory for Multi-resolution Signal Decomposition: the Wavelet Representation”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 11, No. 7, pp. 674-693.

Russel S.J., Norvig P. 1995. Artificial Intelligence – A Modern Approach. Prentice Hall, Upper Saddle River, New Jersey, USA.

Shannon C.E. 1948. “A Mathematical Theory of Communication”, Bell Systems Technical Journal, Vol. 27, pp. 379-423 & 623-656.

Söderström T., Stoica P. 1989. System Identification, Prentice Hall, London, UK.

Stefanoiu D., Culita J., Stoica P. 2005. A Foundation to System Modeling and Identification, Printech Press, Bucharest, Romania.

Stefanoiu D., Ionescu F. 2007. “Modeling and Prediction of Natural Phenomena by Using Adaptive Orthogonal Wavelet Packets”, Research Report HTWG.KN-AvH-STIO-09-07, University of Applied Sciences in Konstanz, Germany, (Sep.).

ACKNOWLEDGMENTS This research has been partly supported by Alexander von Humboldt Foundation (Germany) and, subsequently, by AMCSIT Politehnica (Romania). The authors are extremely grateful to both of them.


382

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 1–3, 2009

5

PARMAX – A PREDICTOR FOR DISTRIBUTED TIME SERIES

Dan Stefanoiu, Janetta Culita Dept. of Automatic Control and Computer Science

„Politehnica” University of Bucharest, 313 Splaiul Independetei 060032 Bucharest, ROMANIA

E-mails: [email protected], [email protected]

KEYWORDS Prediction, MIMO-ARMAX models, distributed signals, prediction quality, Particle Swarm Optimization. ABSTRACT Within this article, the problem of multi-variable signals prediction is approached. Such signals are provided especially by natural phenomena with geographical distribution. Presumably, the set of time series generated by the same source are more or less correlated each other. Instead of processing each time series independently, they can be seen as measurable outputs provided by some open MIMO system. Therefore, modeling and forecasting of system behavior can rely on multi-dimensional ARMAX models. The research based on this idea led us to construction of PARMAX predictor. Optimal structural indices of MIMO-ARMAX model can be found by means of an evolutionary strategy: Particle Swarm Optimization. 1. INTRODUCTION Evolution of many natural phenomena can be monitored with higher accuracy when the observation and measurement are accounting not only the time variation of some parameter, but also its distribution over a geographical area. Take for example the snow thickness monitoring application on White Valley from French Alps (see Figure 1).

Figure 1: Snow Thickness Measuring on White Valley

The monitoring system consists of 3 layers. The lowest level layer includes on-field wireless sensors (eco-sensors). Signals are first gathered by eco-nodes, then labeled and transmitted at middle level layer – a versatile acquisition interface referred to as VISA [Stefanoiu 2008a]. VISA performs primary filtering and data organizing, before sending them to the highest level layer – a laptop in charge

with monitoring. In this context, by monitoring, one understands data prediction mainly. When using a stand alone sensor, the main problem is to locate it in such a vast environment. As Figure 1 is suggesting, the thickness varies both in time and space. A network of wireless sensors is seemingly more suitable to perform monitoring than isolated sensors. Several time series (ts), from different locations are thus provided. Data coming from different channels are in general more or less correlated. For example, the snow melting on top may increase the thickness at the bottom of the valley (especially when avalanches are produced). Assume that the monitoring goal is to predict the snow thickness in order to prevent avalanches. It is very likely that better prediction results be obtained when considering the collection of all data sets, rather than when building independent prediction models for each of them. A quick approach to the prediction problem is to use data fusion techniques [Wang 2005], followed by prediction. After fusion, a unique ts results [Stefanoiu 2008a] and, thus, on one hand, some prediction model can easily be implemented. On the other hand, after fusing the data, much of the prediction information provided by each sensor is lost, which strongly limits the prediction accuracy. A different approach is described within this paper. One considers that sensors provide data as result of unknown colored noises that stimulate an open and quasi-ubiquitous system. The system has in fact a continuous collection of variable states. Placing a finite set of sensors at different locations, in order to perform measuring, is equivalent to sampling the system both in time and space. While the time sampling is governed by Shannon-Nyquist rules, sampling the system over space is by far more empirical. To the best of our knowledge, no general rules of space sampling are currently available. However, apparently, simulations have shown that the prediction quality is less affected by the sensors location than by their number. This paper is structured as follows. Section 2 succinctly describes the construction of MIMO-ARMAX predictors. Section 3 is devoted to Particle Swarm Optimisation (PSO) [Kennedy 1995] – an evolutionary technique to find optimal structural indices of prediction model. The performance of PARMAX predictor is demonstrated within the last section, within an application of temperature monitoring. A conclusion and the references list complete the article. (More details can be found in [Stefanoiu 2008c].)

Monitoring laptop/notebook

VISA Wireless data acquisition interface

eco-node (wireless)

eco-sensor (wireless)


6

2. KERNEL OF PARMAX: MIMO-ARMAX MODELS In a previous research [Stefanoiu 2008c], a comparison between classical prediction methods (based on ARMA modeling) and a wavelet-based method has been realized. But the analyzed ts were mono-variable. In case of multi-variable ts, the SISO-ARMA model can be extended to a MIMO-ARMAX model [Söderström 1989], according to the rationale described in this section. Let 1,j j ny

y∈

=Y be the set of ny ts provided by some

distributed set of sensors and denote the maximum number of acquired data by yN . Before any other operation, data of Y have to be synchronized. Synchronization may involve

interpolation (e.g. spline type) and re-sampling, such that each data set includes exactly yN samples. This allows

construction of output vector 1T

nyy y⎡ ⎤= ⎣ ⎦y , which belongs to some MIMO system. Thus, a general MIMO-ARMAX model can be assigned to data set Y :

( ) ( ) ( )1 1 1q q q− − −≡ +A y B u C e . (1)

In equation (1), ( )1qny ny× −∈A R , ( )1qny nu× −∈B R and

( )1qny ny× −∈C R are matrix polynomials, nu∈u R is the input

vector ( nu channels) and ny∈e R is the vector of Gaussian uncorrelated white noises. Two main problems have to be solved, to identify the model (1) from data Y : specifying the model structure and estimating the input signals. If all polynomials of matrices A , B and C are non null, then identification is extremely difficult to perform. Firstly, because the number of parameters to estimate is quite large (even for small number of input-output channels). Secondly, because the output channels are mixed within the AR part (the left side of equation (1)). Therefore, some simplifying hypotheses are necessary. One of the most natural assumptions has been adopted within MATLAB environment: each output vary independently on the other outputs, solely as result of stimulation with inputs and noises. This means the matrix A is diagonal. The second assumption regards the white noises: since they are uncorrelated each other, only one noise per output channel can be kept. Thus, the matrix C is diagonal as well. As direct consequence of the two hypotheses, the MIMO-ARMAX model can be split into ny MISO-ARMAX models (with natural notations): ( ) ( ) ( )1 1 1A q q C qj j j j jy e− − −≡ +B u , 1,j ny∀ ∈ . (2)

This time, ( )1 1qnuj

× −∈B R is a row vector of polynomials. Identification of MIMO-ARMAX model reduces now to estimation of parameters for each MISO-ARMAX model, separately. Although models (1) and (2) are not equivalent (in the second one, correlation between outputs was removed), identification is now affordable. Despite output channels isolation, as it will be shown, prediction can be performed only when solving all equations (2) at each step. Thus, correlations between outputs are indirectly encoded by the collection of MISO-ARMAX models. Obviously, since only the output data set Y is available, it is necessary to derive a method for estimating the inputs u .

The main idea is to come back to the unknown perturbations that stimulate the system to evolve. Since the hidden correlations between output channels have been removed, they can partially be reconsidered by selecting colored noises of measured data as inputs. More specifically, let 1,j j ny

e∈

be the white noises corrupting the measured data. By filtering, they are producing colored noises that corrupted output channels. Since the perturbation of channel j has already been accounted by the MA part of equations (2) (the second right term), only noises of the other output channels, 1, ,i i ny i je

∈ ≠, are affecting the data through input channels.

Consequently, 1nu ny= − and i iu e≡ , 1, ,i ny i j∀ ∈ ≠ . Practically, matrix B (of (1)) has null diagonal, in this case. The colored noises are then: ≡v Be . Since the filters are unknown, estimating inputs means estimating filters parameters. Fortunately, the measured data encode the information regarding colored noises. This allows identification of filters with some accuracy. Given the equations of model (2), it is natural to consider that filters belong to the same models class. A simple assumption yields expressing the filters equations: each output data set is a colored noise produced by the corresponding white noise. Consequently, data for each channel can roughly be modeled by means of a (SISO-)ARMA filter: ( ) ( )1 1A q C qs s

j j j jy e− −≡ , 1,j ny∀ ∈ , (3)

where A sj and Cs

j are (singleton) polynomials for each

output channel 1,j ny∈ . Identification of models (3) is simply performed via Minimum Prediction Error Method (MPEM) [Söderström 1989]. Moreover, the procedure based on MPEM returns estimates of white noise values. (By convention, estimated parameters or signals carry a hat over their notations.) After identification of models (3), the prediction error on each channel can roughly be estimated. This error actually stands for the input on some channel: ( ) ( )1 1ˆ ˆˆ ˆ Â q 1 C qs s

i i i i i iu e y e− −⎡ ⎤≡ ≡ + −⎣ ⎦ , 1,i ny∀ ∈ , (4)

Equations (4) allow not only estimating the inputs of model (2), but also predicting them with sufficient accuracy. The final running MIMO-ARMAX models are then: ( ) ( ) ( )1 1 1Â q q C qj j j j jy e− − −≡ +B u , 1,j ny∀ ∈ , (5)

where ˆ ny∈u R gathers all rough estimates of white noises and ,B 0j j ≡ , 1,j ny∀ ∈ . After estimation of inputs, identification of model parameters and white noise values relies on MPEM as well. Actually, approximating ARX models return more refined estimated values of white noises:

( ) ( )1 1,

1,

ˆ ˆˆ Â q B qny

n nj j j j i i

i i j

e y uα − β −

= ≠

≡ − ∑ , 1,j ny∀ ∈ , (6)

where Anjα and ,Bn

j iβ are polynomials with degrees nα and

nβ , respectively. (Usually, nα and nβ are sensibly larger than the degrees of polynomials in (5).) After estimation of parameters, the optimal predictor can be enabled. The following equations show how the output predicted data are recursively computed, on a prediction horizon of length 1K ≥ (for any 1,y yk N N K∈ + + ):


7

,

,1 ,

, ,1 , , ,1,

ˆ ˆ ˆ ˆ ˆ| 1 | |

ˆ ˆˆ ˆ[ 1]

j

j i


ny



b u k b u k nb= ≠

⎡ ⎤ ⎡ ⎤ ⎡ ⎤= − − − − − +⎣ ⎦ ⎣ ⎦ ⎣ ⎦

⎡ ⎤⎡ ⎤+ − + + − +⎣ ⎦⎣ ⎦∑

,1 ,ˆ ˆ ˆ ˆ[ 1] ;jj j j nc j jc e k c e k nc⎡ ⎤+ − + + −⎣ ⎦ (7)

,1 , 1

, ,

ˆ ˆˆ ˆ ˆ ˆ[ ] | 1 | 1 |

ˆ ˆ [ ]y

y

j j y j j y j k N j y y

j k N j y j n j

e k y k N y k N y N N

y N y k n

− −

− α

⎡ ⎤ ⎡ ⎤ ⎡ ⎤= + α − + + α + +⎣ ⎦ ⎣ ⎦ ⎣ ⎦

⎡ ⎤+ α + + α − α −⎣ ⎦

, ,1 , ,1,

ˆ ˆˆ ˆ ˆ[ 1] [ ] [ ].ny

j i i j i n i ji i j

u k u k n u kβ= ≠

⎡ ⎤− β − + +β − β =⎣ ⎦∑ (8)

By definition, predicted outputs are equal to measured outputs on measuring horizon 1, yN . Obviously, as the last equation shows, predicted inputs are equal to predicted white noises on prediction horizon 1,y yN N K+ + . Equations (7) and (8) have to be iterated successively for any prediction instant k . Moreover, next predicted values cannot be estimated unless all output channels have previously been predicted (since all inputs must first be predicted). So, before approaching the next prediction step, all channels have to be predicted at the current step. This mechanism expresses the attempt to consider correlations between different outputs, even though the MIMO-ARMAX model is composed by several MISO-ARMAX models. (In case of isolated SISO-ARMA models, each channel can independently be predicted on the whole prediction horizon, without waiting for the other channels.) The performance of PARMAX predictor can be assessed by means of prediction quality (PQ) criterion, which is defined as follows, for any channel 1,j ny∈ :

2

,1

, , ,

100PQˆ

1+ˆ SNR SNR

j K

j kk

m j m j p j

=

=

σ

λ

∑ [%], (9)

where: ,SNRm j and ,SNR p j are signal-to-noise ratios of data on channel j , during the measuring horizon and prediction horizon, respectively; ,ˆ j kσ is the estimated standard deviation of current prediction error, on channel j ;

,ˆ

m jλ is the estimated standard deviation of noise je on measuring horizon. The SNRs are defined as follows:

2

,, 2

,

SNR ˆjm y

m jm j

σ=λ

& 2

,, 2

,

SNR ˆjp y

m jp j

σ=λ

, (10)

where: , jm yσ is the standard deviation of measured data,

, jp yσ is the standard deviation of data on prediction horizon

and 2,

ˆp jλ is the estimated variance of overall prediction error.

The latter is simply expressed below:

22

,1

1ˆ ˆ |K

p j j y j y yk

y N k y N k NK =

⎡ ⎤ ⎡ ⎤λ = + − +⎣ ⎦ ⎣ ⎦∑ . (11)

As of ,ˆ j kσ , the following recursive equation has been proven:

2 2 2 2, , 1 , , 1

ˆ ˆˆ ˆj k j k m j j k− −σ = σ + λ γ , 1,y yk N N K∀ ∈ + + , (12)

where 2,ˆ 0

yj Nσ = and ,ˆ j k k∈γ

N are the coefficients of endless

division between polynomials C j and A j (starting from their free terms). Obviously,

( ) ( )222,

1 1

1 1ˆ ˆ ˆ[ ] [ ] |y yN N

m j j j j yk ky y

e k y k y k NN N= =

⎡ ⎤λ = = − ⎣ ⎦∑ ∑ . (13)

The bigger the norm of vector 1PQ PQT

ny⎡ ⎤= ⎣ ⎦PQ , the better the performance of PARMAX algorithm. 3. SELECTING OPTIMAL PREDICTORS VIA PSO Despite the simplification applied to MIMO-ARMAX models, their complexity could still be high. Even in case of networks with small number of sensors, accurate prediction requires large number of parameters to be identified. For example, if 4ny = , and the maximum values of structural indices na (degree of A polynomials), nb (degree of B polynomials), and nc (degree of C polynomials) is 30, then the best predictor (in terms of PQ ) has to be selected

among more than 28 4130 2.29 10≅ ⋅ identification models (when accounting the rough SISO-ARMA models as well). One copes thus with an NP hard optimization problem. The problem can be approached by means of an evolutionary strategy, based on some heuristic. From all such strategies, the PSO [Kennedy 1995] has been preferred, for the convenient trade off between convergence speed and algorithm complexity it exhibits. The principle of PSO is illustrated in Figure 2.

Figure 2: Principle of Particle Swarm Optimization

A population of entities referred to as particles is initiated to run on some trajectories, starting from initial positions. Trajectories are adaptively adjusted on the run, according to some fitness function (that has to be optimized). The goal is to concentrate the population around some optimum of fitness function and to increase the chance that the optimum be global over the searching space.

The population of particles is denoted by 1,p p P∈= xP .

Positions of particles are actually accounted in P (as vectors of some Euclidean space). Usually, the number of particles ( P ) varies from 50 to 500. The population evolves towards optimum through generations. At every generation, particles take new positions, which can be updated by means of additive corrections, like below: 1 1m m m

p p p+ += + ∆x x x , 1,p P∀ ∈ , 0m∀ ≥ , (14)

where m is the generation index. Corrections are computed as displacements of particles with some speeds with T∆ delay, i.e.: 1 1m m

p p T+ +∆ = ∆x v . Speeds can also be updated:

,0 ,01, 1 1

,


p p p p c sm mp c s

++ +

− −= µ ⋅ + λ ⋅ + λ ⋅

τ τ

x x x xv v P ,

1,p P∀ ∈ , 0m∀ ≥ , (15)


8

where: [0,1]m

pµ ∈ is the particle mobility factor;

,0mpx is the best position of particle, on its way from the

beginning to the current generation; ,0

mxP is the best position reached by a particle of the whole population (from the beginning to the current generation);

, [0,2]mp cλ ∈ is the normalized cognitive variance of

particle positions with respect to its best position; [0,2]m

sλ ∈ is the normalized social variance of all particles positions with respect to the best population position;

1,

mp c T+τ ≥ ∆ is the delay of particle transition from

current position to its best position; 1m

s T+τ ≥ ∆ is the delay of population transition from current positions of its particles to the best population position.

The PSO algorithm has been modified from its traditional design, in order to match PARMAX. Thus, its parameters are adaptively set, according to PQ criterion. The particles are split in 4 parts, depending on the nature of structural indices in PARMAX (which are degrees of polynomials, in fact):

2 5TT T T nyARMA ARMAX amnt +⎡ ⎤= ∈⎣ ⎦x x x x N , (16)

where 0,5nt∈ is the degree of polynomial trend [Stefanoiu 2008c]. The other compounds in (16) are:

[ ] 20 0

TARMA na nc= ∈x N (for rough ARMA models); (17)

11 1

T nynyARMAX na nb nb nc +−= ∈⎡ ⎤⎣ ⎦x N

(for ARMAX models); (18) 1

0 1 1T ny

nyam n n n n +−α α β β= ∈⎡ ⎤⎣ ⎦x N

(for AR and ARX approximating models); (19) For example, if the number of channels is 4 ( 4ny = ), then every particle accounts 13 structural indices. Their values are integer, so that the corrections in (14) have to be rounded to the nearest integer. The following definitions are given for arbitrarily set 0m ≥ and 1,p P∈ , in order to express the variables in (15). The mobility factor is:

,0

,0 ,1

m mp pm

p m mp p

⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦µ =⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦

PQ x PQ x

PQ x PQ x, (20)

where ,1mpx is the worst position of particle, on its way from

the beginning to the current generation. The relative cognitive variance is computed in two steps. First, the absolute variance is evaluated:

( )2 2

, ,00

11

mm m ip c p p

im =

σ = −+ ∑ x x . (21)

Then the variance is normalized with respect to minimum and maximum values, after updating them with (21):

, , ,min,

, ,max , ,min

2m mdefp c p cm

p c m mp c p c

σ − σλ =

σ − σ. (22)

In a similar manner, the relative social variance can be evaluated. The absolute value leads to the relative value:

2

,01

1 Pdefm m ms p

pP =

σ = −∑ x xP ⇒ ,min

,max ,min

2m mdefs sm

s m ms s

σ − σλ =

σ − σ. (23)

It is practically impossible to detect the transition delays. Therefore, they are selected at random. More specifically, the transition frequencies 1 1

, ,1/m mp c p c+ +ν = τ (cognitive) and

1 11/m ms s+ +ν = τ (social) are randomly generated in ( ]0,1/ T∆ .

Equation (15) is the searching engine of PSO strategy. Three terms are contributing to update the speed. The first one is based on the current speed. The weight applied by the mobility factor shows that the former speed is strongly attenuated when the particle is close to its best position. This means the particle is rather attracted by such a position. The second term quantifies the cognitive motivation of particle to move, in terms of driven speed. As the population evolves, every particle acquires some experience that can determine its future behavior. As result of particle experience, the cognitive speed becomes important when the trajectory is drifted away with respect to its best position. Finally, the third term expresses the influence of population on each particle behavior, naturally referred to as social speed. Depending on particle position versus population best position and variance, the social speed increases either when the population is dispersed or the particle is far away from the best position. The evolutionary character of PSO algorithm is involved by the randomly selected transition frequencies. Population can thus escape from the capture of some local optimum, by jumping onto another zone. Like most of the evolutionary procedures based on populations, the trade-off between diversity and convergence is important. Diversity of population allows one to check for optimum in many zones of searching space and, thus, to increase the chance of global optimum finding. On the contrary, convergence (or particles swarm) is necessary to avoid searching oscillations. The key parameter of this trade-off monitoring is the absolute social variance. Three populations can evolve in parallel: the current one, the elite (that keeps all the best positions) and the anti-elite (that keeps all the worst positions). Every time the product between social variances of current generation and elite overflows or underflows some bounds, the diversity-convergence trade-off is unbalanced. Over-floating points to abnormal increase of population diversity, i.e. to oscillatory behavior. To reduce it, crossover between current generation and elite can be performed. Under-floating is caused by concentration of both populations around some optimum, which may decrease the chance to reach for the global optimum. In this case, diversity is increased by performing crossover between current generation and anti-elite. By crossing over two particles 1x and 2x with speeds

1v and 2v , respectively, two offspring are obtained:

1 1 2(1 )= γ + − γx x x & 2 2 1(1 )= γ + − γx x x , (24)

with corresponding speed values: 1 1 2(1 )= γ + − γv v v & 2 2 1(1 )= γ + − γv v v , (25)

where [0,1]γ∈ is selected at random (uniformly). When crossover is applied on current population and elite or anti-


9

elite, all of them of size P , the offspring population consists of 2P particles. Only the most fitted ( 1)P − offspring are selected to complete the current population, after removing all its particles, but the most fitted one. (Maybe this one is the global optimum and must be kept.) The PSO algorithm is initiated to run starting from some initial population (usually, uniformly distributed inside the searching space). To stop the procedure, several tests can be performed. Two very effective tests are the following: the maximum number of iterations was touched (say 100) or the most fitted particle succeeded to survive within the elite population for several generations (say at least 5). The overall strategy of PARMAX algorithm consists of the following main steps:

1. Perform data acquisition on several channels. 2. Estimate the optimal SISO-ARMA prediction model (3)

for every channel (independently on the other channels). In this case, the particle includes only the structural indices of ARMA models, i.e.: nt , 0na , 0nc and 0nα .

3. Perform prediction, like in (7) and (8). In this case, there are no inputs, so the corresponding terms have to be removed in equations (7) and (8).

4. Estimate the input signals (4) on measuring horizon, by means of SISO-ARMA prediction models.

5. Estimate the optimal MISO-ARMAX models (5) from output acquired data and input estimated data. This time, the particle configuration is given by definition (16), i.e. it includes the ARMA structural indices as well. (ARMA indices previously estimated in step 2 are cancelled.)

6. Perform prediction, according to equations (7) and (8). Recall that predicted inputs are actually estimated white noises.

Steps 2, 3 and 4 are not really necessary for PARMAX. (They belong to PARMA.) Step 5 actually includes them. Repeating them only for SISO-ARMA models allows comparing the performance of both predictors. Note however that optimal SISO-ARMA models in step 2 are usually different from optimal SISO-ARMA models estimated inside step 5, because the PQ criterion operates with different predicted data. 4. SIMULATION RESULTS AND DISCUSSION The PARMAX procedure has been implemented within MATLAB environment. There are many implementation details that cannot be described within this paper (but can be found in [Stefanoiu 2008c]). One can only mention here the strategy of optimal structural indices selection (for both PARMA and PARMAX predictors). Obviously, the PQ fitness function based on definitions (9) cannot be evaluated unless data on prediction horizon are acquired as well. It follows that all ARMA(X) models have to be identified from

y tN K− data, instead of yN data. The last tK data are preserved as test horizon for the PSO algorithm. More specifically, after identification of some ARMA(X) model, its prediction performance is tested on the last tK data (which have not been involved in identification). Usually,

max3, / 2,tK K K∈ . After selecting the best predictor on

the test data set, the optimal structural indices are just employed to identify a new model based on the whole data set (i.e. including the test data). Usually, the prediction performance decreases on the prediction horizon, comparing to the test horizon. The goal of implementation is to perform a comparison between PARMA and PARMAX algorithms in terms of prediction quality. If data from different channels are inter-correlated, PARMAX is expected to perform better than PARMA. The application consists of temperatures monitoring in two cities, which are located at 60 km each other, slightly below the latitude of 45º. For each city, minimum and maximum temperatures are daily acquired, starting from November 23, 2007, until March 24, 2009. Data look like in Figure 3 and were transmitted via internet to the central processing unit.

Figure 3: Minimum and maximum temperatu

Given the short distance between citgeographical position (in a middle of a planenotice correlations between the four channfeature, some other characteristics of datoutlined. For example, noises are corruptinmanner the channels. Therefore, data are, atapparently independent. Another property iseasonal behavior. Normally, the measuringshort to detect the main period (the acquisitiobe almost twice). It follows that PQ will incthe prediction model is able to detect thevariation of each ts.

One of the most important advantages of PSthe possibility to perform the search eithemachine or on several computers of a netwtime. When using a single regular laptop/notebook), finding the optimal structumodel might be a lengthy operation. Bumeteorological data are provided by slowexample, the temperature ts above are collectamount of 500 data per channel and a poparticles per channel, PARMA runs aboPARMAX needs about one hour on a regularparallel machine, the delays are reduced atimes. In this research, the simulations were regular computers in a network. The popuvaried in range 5:15 particles per channel. Tthe overall population included at least 2computer, which means at least 160 particonfiguration parameters have been set as fol

1

2

3

4

Channel

Channel

Channel

Channel

res of two cities

ies and their ), one can easily els. Beside this a can also be g in a different the same time, s related to the horizon is too n period should rease whenever right periodic

O algorithm is r on a parallel ork at the same computer (e.g. re of prediction t ecological or systems. For

ed daily. For an pulation of 10 ut 30’, while

computer. On a pproximately 8 performed on 8 lation size ( P ) hus, practically, 0 particles per cles. The other lows:


10

• prediction horizon length ( K ): 5; • maximum number of generations ( M ): 100; • minimum survival factor ( S ): 5; • maximum degree of trend ( NT ): 5; • maximum structural index for AR part ( NA ): / 3yN ; • maximum structural index for MA part ( NC ): / 3yN ; • maximum structural index for X part ( NB ): / 2yN ; • maximum structural index for AR part of approximating

models ( Nα ): / 2yN ; • maximum structural index for X part of approximating

models ( Nβ ): / 2yN . This leaves a large searching space for optimal structural indices. The last K data have been removed completely. They are accounted only after the final prediction data have been estimated, in order to compute PQ. (Thus, when searching for optimal structure of prediction model, only

y tN K K− − data are employed.) After running PARMA on the temperature ts (with

482yN = data), the best results are illustrated in Figures 4, 6, 8 and 10 (for each channel). In parallel, Figures 5, 7, 9 and 11 display the best results of PARMAX. Each of which includes 3 variations: the original ts together with its optimal trend (top), the estimated white noise on measuring horizon (middle) and the zoom on prediction horizon (bottom). The PQ values are depicted on the latter. One can see that: [67.83 53.66 49.11 66.52]T

ARMA =PQ ⇒ 119.65ARMA ≅PQ ;

[69.97 72.37 59.71 71.82]TARMAX =PQ ⇒ 137.32ARMAX ≅PQ .

(26) Since the correlation between channels is so obvious, the superior performance of PARMAX versus PARMA is an expected result. Beside this general remark, the simulation results yield several insights. The fact the measuring horizon is not large enough to allow detection of seasonal variation decreases the performance of both predictors. As one can see from Figures 4, 5 and 9, the trend tried to decode data periodicity by increasing the polynomial degree to its maximum value. However, for the other models the trend degree is bounded by 3. Normally, the trend should not include the periodic variation, because polynomials are unbounded in vicinity of infinity and, thus, the prediction can fail very easily. In this application, higher degree trend is accepted because the prediction horizon is quite short, comparing to the measuring horizon. PARMA detected a period on channel 3, since the ts is closer here to symmetry than for the other channels. The period is almost half of yN . Simulations have proven that, without seasonal compound, PARMA systematically fails on channel 3. Oppositely, PARMAX removed any seasonal variation and tried to replace its contribution by colored noises. As already mentioned, data are affected by different noises on different channels. The second variation of all figures shows that the estimated SNR varies along channels. In general, the higher PQ, the higher SNR and the smaller white noise variance.

The third variations of all figures are grouped in couples (one for each channel). In order to focus on details, the vertical axis has been scaled differently from a variation to another. Actually, scaling is uniquely determined by the confidence tube. Large aperture of tube usually involves small value of PQ, even though the predicted values might be close each other. Prediction on channels 2 and 3 is quite remarkable (even at eastern end of prediction horizon, where, usually, predicted values are less accurate). This is somehow surprising, since the ts belong to different cities and, moreover, are representing opposite temperatures (maximum and minimum, respectively). But the correlations between data are mostly hidden and cannot simply be “read” on time variation, regardless the user’s experience.

For data with less correlation than the above ones, the superior performance of PARMAX over PARMA is not so obvious. Usually, PARMAX performs better on some channels only and its fitness (the norm of PQ) can even fall below the PARMA fitness. In this case, PARMA should be preferred, due to its smaller complexity and higher speed.

5. CONCLUSION

Lately, there is an increasing interest in handling and monitoring distributed data, on different purposes. In case of ecological or meteorological data, prediction is an important goal. This article introduced a method of prediction based on multi-dimensional identification models from ARMAX class. An evolutionary strategy (PSO) was employed to speed up the searching for optimum prediction model. The resulting algorithm can be implemented on a mobile computer. Prediction can thus directly be performed inside the system that provides the data. Whenever the measuring channels are correlated, multi-dimensional prediction models should be constructed instead of singleton models for each channel in isolation.

REFERENCES

Kennedy J., Eberhart R. 1995. „Particle Swarm Optimization”, IEEE International Conference on Neural Networks, Piscataway – N.J., USA, pp. 1942-1948.

Söderström T., Stoica P. 1989. System Identification, Prentice Hall, London, UK.

Stefanoiu D., Petrescu C. 2008a. „VISA – A Versatile Interface of Signal Acquisition and Wavelet Based Data Fusion”, Proc. of the 5-th Europe-Asia Mechatronics Congress, Annecy, France, Paper no. 167.

Stefanoiu D., Culita J., Ionescu F. 2008b. „FORWAVER – A Wavelet-Based Predictor for Non Stationary Signals”, Proc. of EUROSIS-ISC-2008, Lyon, France, pp. 377-381.

Stefanoiu D., Petrescu C. et al. 2008c. „Numerical Models and Fast Methods of Ecological Phenomena Prediction”, Res. Rep. CNMP.UPB-P4.31050-2007.II/DS.CP. AD.JC-12.2008, “Politehnica” University of Bucharest, Romania.

Wang Z., Ziou D., et al. 2005. „A Comparative Analysis of Image Fusion Methods”, IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 6, pp. 1391-1402.

ACKNOWLEDGMENTS

This research was developed with the support of AMCSIT Politehnica (Romania), in the framework of grant #117/2007. The authors wish to address its team grateful and special thanks.


11

Figure 4: PARMA performance on channel 1


Figure 5: PARMAX performance on channel 1



12





Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

145

Identification of MIMO-ARMAX Models for Glycemia and Sodium Ions Tests, through Particle Swarm Optimization

Dan Stefanoiu, Cristian Seraficeanu, Janetta Culita, Gheorghe Musca

Abstract — In this article, the problem of multi-variable data autoregressive identification is approached, in view of prediction. Such data are especially provided by natural phenomena with geographical distribution, but could also be acquired from concentrated systems with several outputs, like medical records of one or more patients. Presumably, data are generated by the same source and exhibit more or less correlations to each other. Instead of processing each data set as an independent time series, the whole data block can be seen as the reaction of some open MIMO system to unknown stimuli. Therefore, modeling and forecasting of system behavior can rely on multi-dimensional ARMAX models. Optimal structural indices of MIMO-ARMAX model are found by means of an evolutionary strategy: Particle Swarm Optimization.

I. INTRODUCTION LTHOUGH the governing dynamics of many natural phenomena is unknown, they can be assigned to

identification models [1], for some purpose. In this article, the main purpose consists of behavior monitoring and/or prediction of some medical records (like e.g. sodium ions test and glycemia [2], [3]). The major requirement for the success of this attempt is to capture consistent and coherent data from patients. This involves performing accurate measurements (under specific conditions) and acquiring sufficient number of samples (at least few tens). Nowadays, in medical praxis, a complete set of lab data for one person relies on the basic metabolic panel (BMP), also referred to as CHEM-7, which consists of seven blood chemical tests [2]: four electrolytes (sodium Na + , potassium K+ , chloride Cl− , bicarbonate 3HCO− ), blood urea nitrogen (BUN), creatinine and glucose. (Some BMPs also include a

Manuscript received on April 15, 2009. This work was supported by the Romanian National Center for Programs Management (to which the authors are addressing grateful thanks), under Grant #31050/2007.

D. Stefanoiu (Ph.D.) is with the University “Politehnica” of Bucharest, Faculty of Automatic Control and Computer Science, SysId–SigPro Group (Splaiul Independentei no.313, Sector 6, Bucharest-060042, Romania, phone&fax: +40 21 316 9561; e-mail: [email protected]).

C. Seraficeanu (M.D.) is with "N. Paulescu" National Institute for Diabetes, Nutrition and Metabolic Diseases, Bucharest, Romania (e-mail: [email protected]).

J. Culita (Ph.D.) has the same affiliation as the first author above (e-mail: [email protected]).

G. Musca (Ph.D.) is with Fresenius Medical Care, Bucharest, Romania, (e-mail: [email protected]).

test for calcium 2Ca + .) Among them, the tests for sodium and glucose are extremely important. Sodium is highly correlated with the hydration status of the body, blood pressure and kidney function. The human body regulates sodium level through water ingestion and a hormone referred to as anti-diuretic. Hydration status is determined by natremia (sodium concentration in serum). Sodium also plays an essential role for the electrical activity at cellular level. They are in charge with transmission of nerve impulses, heart activity, and certain metabolic functions. (Interestingly, although sodium is needed by animals, which maintain high blood sodium and extra-cellular fluid sodium concentrations, the ions are not needed by plants and is generally phytotoxic.) The normal level of sodium varies between 135 and 147 mmol/L. Relative loss of body water will cause sodium concentration to rise higher than normal, a condition known as hypernatremia. This ordinarily results in thirst. Conversely, an excess of body water caused by drinking will result in smaller sodium concentration in the blood (hyponatremia), causing a loss of water. Cellular activity is however the most affected by abnormal concentration of sodium, which might result in irreversible damage of cell membranes. Glucose is the most important source of metabolic energy for the majority of cells, particularly for some of them (like e.g. neurons and erythrocytes, which are almost totally dependent on it). The concentration of glucose in the blood is referred to as glycemia and is controlled by several physiological processes. It tends to fluctuate to higher levels after meals, due to the gastric and intestinal absorption of carbohydrates of low molecular weight present in the diet or broken down from other kinds of foodstuffs, such as starches (polysaccharides). Lower levels are reached with usage by catabolism, particularly after stress, temperature regulation and physical exertion. Another input to glycemia levels is gluconeogenesis, whereby glycogen stored in the liver and skeletal muscles, or amino acids and lipids are converted to glucose via several metabolic chains. Excess glucose is converted to glycogen or to triglycerides for energy storage. Physiologically, glycemia normally fluctuates within a narrow range: 70-100 mg/dl. Excessively low levels are classed as hypoglycemia. These may result from poor diet, or as a side effect of diabetes medication. Excessively high levels (e.g., 250 mg/dl or more) are classed as hyperglycemia and are a particular threat to diabetes sufferers. The brain requires a fairly stable glycemia in order to function normally. Concentrations of less than about

A


146

30 mg/dl or greater than about 300 mg/dl can produce confusion, unconsciousness and convulsions. Our research aimed to exploit the fact BMP lab data are usually correlated, when provided by the same patient. Thus, its medical evolution can be monitored with higher accuracy by processing the BMP data in integrum than by processing each parameter in isolation. It is even possible that patients living together or being related each other provide correlated medical records, especially if they complied with the same testing rules, approximately at the same time. The goal of this article is to prove that multi-dimensional identification models (such as MIMO-ARMAX) are more accurate than singleton models (such as SISO-ARMA) [1], in terms of prediction quality, when processing BMP lab data. The problem is to build both types of models and to compare their performance on BMP data blocks. Two types of correlations have been considered: between BMP parameters and between related patients. The approach described hereafter starts from the remark that data are provided by an open and quasi-ubiquitous system, which is stimulated by a set of unknown colored noises. The system has in fact a continuous collection of variable states. Picking a finite set of data from different points (e.g. patients and their bodies) is equivalent to sampling the system both in time and non temporal dimensions (such as spatial). While the time sampling is governed by Shannon-Nyquist rules [4], sampling the system over other dimensions is by far more empirical. To the best of our knowledge, no general rules of non temporal (or spatial) sampling are currently available. However, apparently, simulations have shown that the prediction quality is less affected by the sensors location than by their number and patients’ condition. This paper is structured as follows. Section 2 succinctly describes the construction of MIMO-ARMAX predictors. Section 3 is devoted to Particle Swarm Optimisation (PSO) [5] – an evolutionary technique to find optimal structural indices of prediction model. The predictor performance is demonstrated within the last section, for sodium and glycemia monitoring. A conclusion and the references list complete the article. (More details regarding the construction of predictors can be found in [6].)

II. CONSTRUCTION OF MIMO-ARMAX PREDICTORS

In a previous research [7], a comparison between classical prediction methods (based on ARMA modeling) and a wavelet-based method has been realized. But the analyzed ts were mono-variable. In case of multi-variable time series (ts), the SISO-ARMA model can be extended to a MIMO-ARMAX model, according to the rationale described in this section. Let 1,j j ny

y∈

=Y be the set of ny ts, which are provided

by some synchronized distributed set of sensors and denote the maximum number of acquired data by yN . It is then

possible to construct the output vector 1T

nyy y⎡ ⎤= ⎣ ⎦y , which belongs to some MIMO system. Thus, a general

MIMO-ARMAX model can be assigned to data block Y :

( ) ( ) ( )1 1 1q q q− − −≡ +A y B u C e . (1)

In equation (1), ( )1qny ny× −∈A R , ( )1qny nu× −∈B R and

( )1qny ny× −∈C R are matrix polynomials, nu∈u R is the input

vector (with nu channels) and ny∈e R is a vector of Gaussian uncorrelated white noises. To identify the model (1) from data Y , two main problems have to be solved,: setting the model structure and estimating the input signals. If all polynomials of matrices A , B and C are non null, then identification is extremely difficult to perform. Firstly, because the number of parameters to estimate is quite large (even for small number of input-output channels). Secondly, because the output channels are mixed within the AR part (the left side of equation (1)). Therefore, some simplifying hypotheses are necessary. One of the most natural assumptions has been adopted within MATLAB environment: each output varies independently on the other outputs, solely as result of stimulation with inputs and noises. This means the matrix A is diagonal. The second assumption regards the white noises: since they are uncorrelated each other, only one noise per output channel can be kept. Thus, the matrix C is diagonal as well. As direct consequence of the two hypotheses, the MIMO-ARMAX model can be split into ny MISO-ARMAX models (with natural notations):

( ) ( ) ( )1 1 1A q q C qj j j j jy e− − −≡ +B u , 1,j ny∀ ∈ . (2)

This time, ( )1 1qnuj

× −∈B R is a row vector of polynomials. Identification of MIMO-ARMAX model reduces now to estimation of parameters for each MISO-ARMAX model, separately. Although models (1) and (2) are not equivalent (in the second one, correlation between outputs was removed), identification is now affordable. Despite the isolation of output channels, as it will be shown, prediction can be performed only when solving all equations (2) at each step. Thus, correlations between outputs are indirectly encoded by the collection of MISO-ARMAX models. Obviously, since only the output data block Y is available, it is necessary to derive a method for estimating the input u . The main idea is to come back to the unknown perturbations that stimulate the system to evolve. Since the hidden correlations between output channels have been removed, they can partially be reconsidered by selecting colored noises of measured data as inputs. More specifically, let 1,j j ny

e∈

be the white noises corrupting the measured

data. By filtering, they are producing colored noises that corrupt output channels. Since the perturbation of channel j has already been accounted by the MA part of equations (2) (the second right term), only noises of the other output channels, 1, ,i i ny i je

∈ ≠, are affecting the data through input

channels. Consequently, 1nu ny= − and i iu e≡ ,


147

1, ,i ny i j∀ ∈ ≠ . Practically, the matrix B (of (1)) has null diagonal, in this case. The colored noises are then: ≡v Be . Since the filters to produce colored noises are unknown, estimating inputs means estimating filters parameters. Fortunately, the measured data encode the information regarding colored noises. This allows identification of filters with some accuracy. Given the equations of model (2), it is natural to consider that filters belong to the same models class. A simple assumption yields expressing the filters equations: each output data set is a colored noise produced by the corresponding white noise. Consequently, data for each channel can roughly be modeled by means of a simple ARMA filter:

( ) ( )1 1A q C qs sj j j jy e− −≡ , 1,j ny∀ ∈ , (3)

where A sj and Cs

j are (singleton) polynomials for each

output channel 1,j ny∈ . Identification of models (3) is performed via Minimum Prediction Error Method (MPEM) [1]. Moreover, the procedure based on MPEM returns estimates of white noise values. (By convention, estimated parameters or signals carry a hat over their notations.) After identification of models (3), the prediction error on each channel can be estimated. This error actually stands for the input on some channel. More specifically:

( ) ( )1 1ˆ ˆˆ ˆ Â q 1 C qs si i i i i iu e y e− −⎡ ⎤≡ ≡ + −⎣ ⎦ , 1,i ny∀ ∈ , (4)

Equations (4) allow not only estimating the inputs of model (2), but also predicting them with sufficient accuracy. The final running MIMO-ARMAX models are then:

( ) ( ) ( )1 1 1Â q q C qj j j j jy e− − −≡ +B u , 1,j ny∀ ∈ , (5)

where ˆ ny∈u R gathers all rough estimates of white noises and ,B 0j j ≡ , 1,j ny∀ ∈ . After estimation of inputs, identification of model parameters and white noise values relies on MPEM as well. Approximating ARX models returns more refined estimated values of white noises:

( ) ( )1 1,

1,

ˆ ˆˆ Â q B qny

n nj j j j i i

i i j

e y uα − β −

= ≠

≡ − ∑ , 1,j ny∀ ∈ , (6)

where Anjα and ,Bn

j iβ are polynomials with degrees nα and

nβ , respectively. (Usually, nα and nβ are sensibly larger than the degrees of polynomials in (5).) The optimal predictor is available after parameters estimation. The following equations show how the output predicted data are recursively computed, on a prediction horizon of length 1K ≥ (for any 1,y yk N N K∈ + + ):

,

,1 ,

, ,1 , , ,1,

ˆ ˆ ˆ ˆ ˆ| 1 | |

ˆ ˆˆ ˆ[ 1]

j

j i


ny



b u k b u k nb= ≠

⎡ ⎤ ⎡ ⎤ ⎡ ⎤= − − − − − +⎣ ⎦ ⎣ ⎦ ⎣ ⎦

⎡ ⎤⎡ ⎤+ − + + − +⎣ ⎦⎣ ⎦∑

,1 ,ˆ ˆ ˆ ˆ[ 1] ;jj j j nc j jc e k c e k nc⎡ ⎤+ − + + −⎣ ⎦ (7)

,1 , 1

, ,

ˆ ˆˆ ˆ ˆ ˆ[ ] | 1 | 1 |

ˆ ˆ [ ]y

y

j j y j j y j k N j y y

j k N j y j n j

e k y k N y k N y N N

y N y k n

− −

− α

⎡ ⎤ ⎡ ⎤ ⎡ ⎤= + α − + + α + +⎣ ⎦ ⎣ ⎦ ⎣ ⎦

⎡ ⎤+ α + + α − α −⎣ ⎦

, ,1 , ,1,

ˆ ˆˆ ˆ ˆ[ 1] [ ] [ ].ny

j i i j i n i ji i j

u k u k n u kβ= ≠

⎡ ⎤− β − + + β − β =⎣ ⎦∑ (8)

By definition, predicted outputs are equal to measured outputs on measuring horizon 1, yN . Obviously, as the last

equation shows, predicted inputs are equal to predicted white noises on prediction horizon 1,y yN N K+ + . Equations (7)

and (8) have to be iterated successively for any prediction instant k . Moreover, next predicted values cannot be estimated unless all output channels have previously been predicted (since all inputs must first be predicted). So, before approaching the next prediction step, all channels have to be predicted at the current step. This mechanism expresses the attempt to consider correlations between different outputs, even though the MIMO-ARMAX model is composed by several MISO-ARMAX models. (In case of isolated SISO-ARMA models, each channel can independently be predicted on the whole prediction horizon, without waiting for the other channels.) Equations (7) and (8) are the kernel of multi-dimensional predictor, also referred to as PARMAX. Its performance can be assessed by means of prediction quality (PQ) criterion, which is defined as follows, for any channel 1,j ny∈ :

2

,1

, , ,

100PQˆ

1+ˆ SNR SNR

j K

j kk

m j m j p j

=

=

σ

λ

∑ [%], (9)

where: ,SNRm j and ,SNR p j are signal-to-noise ratios of data on channel j , during the measuring horizon and prediction horizon, respectively; ,ˆ j kσ is the estimated standard deviation of current prediction error, on channel j ;

,ˆ

m jλ is the estimated standard deviation of noise je on measuring horizon. The SNRs are defined as follows:

2

,, 2

,

SNR ˆjm y

m jm j

σ=

λ &

2,

, 2,

SNR ˆjp y

m jp j

σ=

λ, (10)

where: , jm yσ is the standard deviation of measured data,

, jp yσ is the standard deviation of data on prediction horizon

and 2,

ˆp jλ is the estimated variance of overall prediction error.

The latter is simply expressed below:

22

,1

1ˆ ˆ |K

p j j y j y yk

y N k y N k NK =

⎡ ⎤ ⎡ ⎤λ = + − +⎣ ⎦ ⎣ ⎦∑ . (11)

For ,ˆ j kσ , the following recursive equation has been proven:

2 2 2 2, , 1 , , 1

ˆ ˆˆ ˆj k j k m j j k− −σ = σ + λ γ , 1,y yk N N K∀ ∈ + + , (12)


148

where 2,ˆ 0

yj Nσ = and ,ˆ j k k∈γ

N are the coefficients of endless

division between polynomials C j and A j (starting from their free terms). Obviously,

( ) ( )222,

1 1

1 1ˆ ˆ ˆ[ ] [ ] |y yN N

m j j j j yk ky y

e k y k y k NN N= =

⎡ ⎤λ = = − ⎣ ⎦∑ ∑ . (13)

The bigger the norm of vector 1PQ PQT

ny⎡ ⎤= ⎣ ⎦PQ , the better the performance of PARMAX algorithm.

III. SELECTION OF STRUCTURAL INDICES VIA PSO Despite the simplification applied to MIMO-ARMAX models, their complexity could still be high. Even the number of data channels is small, accurate prediction requires a large number of parameters to be identified. For example, if 4ny = , and the maximum values of structural indices na (degree of A polynomials), nb (degree of B polynomials), and nc (degree of C polynomials) is 30, then the best predictor (in terms of PQ ) has to be selected

among more than 28 4130 2.29 10≅ ⋅ identification models (when accounting the rough SISO-ARMA models as well). One copes thus with an NP hard optimization problem. The problem can be approached by means of an evolutionary strategy, based on some heuristic. From all such strategies, the PSO [5] has been preferred, for the convenient trade off between convergence speed and algorithm complexity it exhibits. The principle of PSO is illustrated in Figure 1.

Fig. 1. Principle of Particle Swarm Optimization. A population of entities referred to as particles is initiated to run on some trajectories, starting from initial positions. Trajectories are adaptively adjusted on the run, according to some fitness function (that has to be optimized). The goal is to concentrate (swarm) the population around some optimum of fitness function and to increase the chance to find the global optimum.

The searching technique described next is sensibly modified with respect to the original algorithm from [5]. There are many new features that have been added and some of the genuine features have been modified, so that the searching algorithm matches the optimization problem of PARMAX predictor. The population of particles is denoted by 1,p p P∈

= xP .

Positions of particles are actually accounted in P (as vectors of some Euclidean space). Usually, the number of particles ( P ) varies from 50 to 500. The population evolves towards optimum through generations. At every generation, particles take new positions, which can be updated by means of additive corrections, like below:

1 1m m mp p p

+ += + ∆x x x , 1,p P∀ ∈ , 0m∀ ≥ , (14)

where m is the generation index.

Corrections are computed as displacements of particles with some speeds within some delay T∆ , i.e.:

1 1m mp p T+ +∆ = ∆x v . Speed values can also be updated:

,0 ,01, 1 1

,


p p p p c sm mp c s

++ +

− −= µ ⋅ + λ ⋅ + λ ⋅

τ τ

x x x xv v P ,

1,p P∀ ∈ , 0m∀ ≥ , (15) where:

[0,1]mpµ ∈ is the particle mobility factor;

,0mpx is the best position of particle, on its way from

the beginning to the current generation; ,0

mxP is the best position reached by a particle of the whole population (from the beginning to the current generation);

, [0,2]mp cλ ∈ is the normalized cognitive variance of

particle positions with respect to its best position; [0,2]m

sλ ∈ is the normalized social variance of all particles positions with respect to the best population position;

1,

mp c T+τ ≥ ∆ is the delay of particle transition from

current position to its best position; 1m

s T+τ ≥ ∆ is the delay of population transition from current positions of its particles to the best population position.

As a new feature, some of the parameters above are adaptively set, according to PQ criterion. The particles are split in 4 parts, depending on the nature of structural indices in PARMAX (degrees of polynomials, in fact):

2 5TT T T nyARMA ARMAX amnt +⎡ ⎤= ∈⎣ ⎦x x x x N , (16)

where 0,5nt ∈ is the degree of polynomial trend. The other compounds in (16) are: [ ] 2

0 0T

ARMA na nc= ∈x N (for rough ARMA models); (17)

11 1

T nynyARMAX na nb nb nc +

−= ∈⎡ ⎤⎣ ⎦x N (for ARMAX models); (18) 1

0 1 1T ny

nyam n n n n +−α α β β= ∈⎡ ⎤⎣ ⎦x N

(for AR and ARX approximating models); (19) For example, if 4ny = , then every particle accounts 13 structural indices. Their values are integer, so that the corrections in (14) have to be rounded to the nearest integer. The following definitions are given for arbitrarily set

0m ≥ and 1,p P∈ , in order to express the variables in (15). The mobility factor is:

,0

,0 ,1

m mp pm

p m mp p

⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦µ =⎡ ⎤ ⎡ ⎤−⎣ ⎦ ⎣ ⎦

PQ x PQ x

PQ x PQ x, (20)

where ,1mpx is the worst position of particle, on its way from

the beginning to the current generation. The relative cognitive variance is computed in two steps.


149

First, the absolute variance is evaluated:

( )2 2

, ,00

11

mm m ip c p p

im =

σ = −+ ∑ x x . (21)

Then the variance is normalized with respect to minimum and maximum values, after updating them with (21):

, , ,min,

, ,max , ,min

2m mdefp c p cm

p c m mp c p c

σ − σλ =

σ − σ. (22)

In a similar manner, the relative social variance can be evaluated. The absolute value leads to the relative one:

2

,01

1 Pdefm m ms p

pP =

σ = −∑ x xP ⇒ ,min

,max ,min

2m mdefs sm

s m ms s

σ − σλ =

σ − σ. (23)

It is practically impossible to detect the transition delays. Therefore, they are selected at random. More specifically, the transition frequencies 1 1

, ,1/m mp c p c

+ +ν = τ (cognitive) and 1 11/m m

s s+ +ν = τ (social) are randomly generated in ( ]0,1/ T∆

(with uniform distribution). Equation (15) is the searching engine of PSO strategy. Three terms are contributing to update the speed. The first one is based on the current speed. The weight applied by the mobility factor shows that the former speed is strongly attenuated when the particle is close to its best position. This means the particle is rather attracted by such a position. The second term quantifies the cognitive motivation of particle to move, in terms of driven speed. As the population evolves, every particle acquires some experience that can determine its future behavior. As result of particle experience, the cognitive speed increases when the trajectory is drifted away with respect to its best position. Finally, the third term expresses the influence of population on each particle behavior, naturally referred to as social speed. Depending on particle position versus population best position and variance, the social speed increases either when the population is dispersed or the particle is far away from the best position. The evolutionary character of PSO algorithm is involved by the randomly selected transition frequencies. Population can thus escape from the capture of some local optimum, by jumping onto another zone. Like most of the evolutionary procedures based on populations, the trade-off between diversity and convergence is important. Diversity of population allows one to check for optimum in many zones of searching space and, thus, to increase the chance of global optimum finding. On the contrary, convergence (or particles swarm) is necessary to avoid searching oscillations. The key parameter of this trade-off monitoring is the absolute social variance. Three populations can evolve in parallel: the current one, the elite (that keeps all the best positions) and the anti-elite (that keeps all the worst positions). Whenever the product between social variances of current generation and elite overflows or underflows some bounds, the diversity-convergence trade-off is unbalanced. Over-floating points to abnormal increase of population diversity, i.e. to

oscillatory behavior. To reduce it, crossover between current generation and elite can be performed. Under-floating is caused by concentration of both populations around some optimum, which may decrease the chance to reach for the global optimum. In this case, diversity is increased by performing crossover between current generation and anti-elite. By crossing over two particles 1x and 2x with speeds

1v and 2v , respectively, two offspring are obtained:

1 1 2(1 )= γ + − γx x x & 2 2 1(1 )= γ + − γx x x , (24)

with corresponding speed values: 1 1 2(1 )= γ + − γv v v & 2 2 1(1 )= γ + − γv v v , (25)

where [0,1]γ ∈ is selected at random (uniformly). When crossover is applied on current population and elite or anti-elite, all of them of size P , the offspring population consists of 2P particles. Only the most fitted ( 1)P − offspring are selected to complete the current population, after removing all its particles, but the most fitted one. (Maybe this one is the global optimum and must be kept.) The PSO algorithm is initiated to run starting from some initial population (usually, uniformly distributed inside the searching space). To stop the procedure, several tests can be performed. Two efficient tests are the following: the maximum number of iterations was touched (say 100) or the most fitted particle succeeded to survive within the elite population for several generations (say 8). The overall strategy of PARMAX algorithm consists then of the following main steps:

1. Perform data acquisition on several channels. 2. Estimate the SISO-ARMA prediction model (3) for

every channel (independently on the other channels), by using the structural indices: nt , 0na , 0nc and 0nα .

3. Estimate the input signals (4) on measuring horizon, by means of SISO-ARMA prediction models.

4. Estimate the optimal MISO-ARMAX models (5) from acquired output data and estimated input data. This time, the remaining indices of definition (16) have to be employed. Optimal indices are found via PSO.

5. Perform prediction, according to equations (7) and (8). Recall that predicted inputs are actually estimated white noises.

A similar (but simpler) procedure can lead to identification of SISO-ARMA models as independent predictors, also referred to as PARMA. Comparison between PARMAX and PARMA predictors becomes thus possible.

IV. SIMULATION RESULTS AND DISCUSSION Both algorithms (PARMA and PARMAX) have been implemented in MATLAB environment. They were tested on BMP lab data coming from several patients. In this article, a block of 4 channels has been selected. The signals are provided by 2 patients: a female (channels 1, 2) and a male (channels 3, 4). They have been monitored simultaneously for glycemia (channels 1, 3) and sodium (channels 2, 4), as displayed in Figure 2.


150

Fig. 2. BMP lab data from two patients. Data were sampled every 48 hours and the patients provided 193 samples. The last 5 samples were hidden, in order to evaluate the performance of predictors. There is a visible correlation between signals on the left side as well as between signals on the right side. Also, hidden correlation might exist between left and right sides.

There are many implementation details that cannot be described within this paper. One can only mention here the strategy of optimal structural indices selection (for both PARMA and PARMAX predictors). Obviously, the PQ fitness function based on definitions (9) cannot be evaluated unless data on prediction horizon are acquired as well. It follows that all ARMA(X) models have to be identified from

y tN K− data, instead of yN data. The last tK data are

preserved as test horizon for the PSO algorithm. Here, max3, / 2,tK K K∈ . After selecting the best predictor, the

optimal structural indices are just employed to identify a new model based on the whole data block (i.e. including the test data). Usually, the prediction performance decreases on the prediction horizon, comparing to the test horizon. One of the most important advantages of PSO technique is the possibility to perform the search either on a parallel machine or on several computers of a network at the same time. In this research, simulations were performed on 8 regular computers in a network. The population size ( P ) varied in range 5–15 particles per channel. Thus, practically, the overall population included at least 20 particles per computer, which means at least 160 particles. After running PARMA on the 4 signals above, the best results are illustrated in Figures 3, 5, 7 and 9 (for each channel). In parallel, Figures 4, 6, 8 and 10 display the best results of PARMAX. Each of which includes 3 variations: the original ts together with its optimal trend (top), the estimated white noise on measuring horizon (middle) and the zoom on prediction horizon (bottom). The PQ values are depicted on the latter. One can notice that: [42.09 42.68 49.62 52.2]T

ARMA =PQ ⇒ 93.7ARMA ≅PQ ;

[51.72 54.2 61.99 66.05]TARMAX =PQ ⇒ 117.55ARMAX ≅PQ .

(26) As a general remark, all 4 signals are corrupted by noises with different intensities (higher for female than for male).

The estimated SNR values confirm the visual observation. (In general, the higher PQ, the higher SNR and the smaller white noise variance.) Consequently, the prediction performance is rather modest. Sodium variation is however easier to predict than glycemia variation, as expected. Human body reacts faster to glucose variation than to salt variation. Also, male’s body is seemingly more stable than female’s. This is the reason the prediction performance is slightly superior for man’s data. Moreover, the prediction models are stable for man and at the stability limit for female (some poles are located nearby the unit circle). The third variations of all figures are grouped in couples (one for each channel). In order to focus on details, the vertical axis has been scaled differently from a variation to another. Actually, scaling is uniquely determined by the confidence tube. Although the predicted values apparently are close each other, large aperture of tube involves small value of PQ. PARMAX has superior performance than PARMA. This assessment is proven not only by the displayed predicted data, but by the fact that PARMAX was better than PARMA on the overwhelming simulations.

V. CONCLUSION Lately, there is an increasing interest in handling and monitoring distributed medical data records. This article introduced a method of prediction based on multi-dimensional identification models from ARMAX class. An evolutionary strategy (PSO) was employed to speed up the searching for prediction model, at the expense of sub-optimality. If the measuring channels are correlated, multi-dimensional identification models should be employed instead of singleton ones, in order to perform prediction. As future work, one can switch to wavelet based models or to Kalman filtering, in order to increase the prediction performance.

REFERENCES [1] Söderström T., Stoica P., System Identification, Prentice Hall, London,

UK, 1989. [2] Rao A.D. et al., First Aid for the USMLE – Step 1, McGraw-Hill

Medical, 2007. [3] Osanai T., Fujiwara N., et al., "Relationship between Salt Intake,

Nitric Oxide and Asymmetric Dimethylarginine and Its Relevance to Patients with End-Stage Renal Disease", Blood Purification, Vol. 20, pp. 466–468, 2002.

[4] Proakis J.G., Manolakis D.G., Digital Signal Processing. Principles, Algorithms and Applications., third edition, Prentice Hall, Upper Saddle River, New Jersey, USA, 1996.

[5] Kennedy J., Eberhart R., „Particle Swarm Optimization”, in Proc. of IEEE International Conference on Neural Networks, Piscataway – N.J., USA, 1995, pp. 1942-1948.

[6] Stefanoiu D., Petrescu C. et al., „Numerical Models and Fast Methods of Ecological Phenomena Prediction”, Res. Rep. CNMP.UPB-P4.31050-2007.II/DS.CP. AD.JC-12.2008, “Politehnica” University of Bucharest, Romania, 2008.

[7] Stefanoiu D., Culita J., Ionescu F., „FORWAVER – A Wavelet-Based Predictor for Non Stationary Signals”, in Proc. of EUROSIS-ISC-2008, Lyon, France, 2008, pp. 377-381.

Channel 1

Channel 2

Channel 3

Channel 4


151

Fig. 3. PARMA performance on channel 1 (glycemia female).

Fig. 5. PARMA performance on channel 2 (sodium ions female).

Fig. 4. PARMAX performance on channel 1 (glycemia female).

Fig. 6. PARMAX performance on channel 2 (sodium ions female).


152

Fig. 7. PARMA performance on channel 3 (glycemia male).

Fig. 9. PARMA performance on channel 4 (sodium ions male).

Fig. 8. PARMAX performance on channel 3 (glycemia male).

Fig. 10. PARMAX performance on channel 4 (sodium ions male).


153

BBiibblliiooggrraaffiiee

[ASTI09] ASTI S.A. – UMAPID – Manual de utilizare şi documentaţie tehnică, ASTI S.A., Bucureşti, România, 2009.

[ABY94] Azovtsev Y.A., Barkov A.V., Yudin I.A. – Automatic Diagnostics and Condition Prediction of Rolling Element Bearings Using Enveloping Methods, The 18-th Annual Meeting of the Vibration Institute, Saint Louis, Missouri, USA, pp. 249-258, June 1994.

[BaJE85] Baker J.E. – Adaptive Selection Methods for Genetic Algorithms, Proceedings of the first International Conference on GA and their Applications, Erlbaum Printing House, Ed. J.J. Grefenstette, 1985.

[BaJE87] Baker J.E. – Reducing Bias and Inefficiency in the Selection Algorithm, Proceedings of the second International Conference on GA and their Applications, Erlbaum Printing House, Ed. J.J. Grefenstette, 1987.

[BaG87] Battle G. – A Block Spin Construction of Ondelettes: I. Lemarié Functions., Communications in Mathematical Physics, No. 110, pp. 601-615, 1987.

[CaDL96a] Carter D.L. – A New Method of Processing Rolling Element Bearing Signals, The 20-th Annual Meeting of the Vibration Institute, Saint Louis, Missouri, USA, June 1996.

http://www.inteltek.com/articles/dlcvi96/anew.htm [CaDL96b] Carter D.L. – Rolling Element Bearing Condition Testing Method and

Apparatus, United States Patent No. 5,477,730, December 26, 1996. http://www.uspto.gov/go/ptdl/ [CDF92] Cohen A., Daubechies I., Feauveau J.C. – Biorthogonal Bases of Compactly

Supported Wavelets, Communications on Pure and Applied Mathematics, No. XLV, pp. 485-560, 1992.

[CoL95] Cohen L. – Time-Frequency Analysis, Prentice Hall, New Jersey, USA, 1995. [CoWi92] Coifman R., Wickerhauser M.V. – Entropy-Based Algorithms for Best Basis

Selection, IEEE Transactions on Information Theory, Vol. 38, No. 2, pp. 713-718, March 1992.

[DaC1859] Darwin C.R. – On the Origin of Species by Means of Natural Selection, London Press, UK, 1859.

http://www.literature.org/authors/darwin-charles/the-origin-of-species/. [DaC1871] Darwin C.R. – The Descent of Man and Selection in Relation to Sex, London

Press, UK, 1871. http://www.literature.org/authors/darwin-charles/the-descent-of-man/. [DaI88a] Daubechies I. – Orthonormal Bases of Compactly Supported Wavelets,

Communications on Pure and Applied Mathematics, No. XLI, pp. 909–996, 1988.

[DaI88b] Daubechies I. – Time-Frequency Localization Operators – A Geometric Phase-Space Approach. IEEE Transactions on Information Theory, Vol. 34, No. 4, pp. 605-612, July 1988.

[DaI90] Daubechies I. – The Wavelet Transform, Time-Frequency Localization and Signal Analysis. IEEE Transactions on Information Theory, Vol. 36, No. 9, pp. 961-1005, September 1990.

[DHRS03] Daubechies I., Han B., Ron A., Shen Z. – Framelets: MRA-Based Constructions of Wavelet Frames, Applied and Computational Harmonic Analysis, No. 14, pp. 1-46, 2003.


154

[DaLa88a] Daubechies I., Lagarias J. – Two Scale Difference Equations: I. Existence and Global Regularity of Solutions., SIAM Journal of Mathematical Analysis, Vol. 22, pp. 1388-1410, 1991.

[DaLa88b] Daubechies I., Lagarias J. – Two Scale Difference Equations: II. Local Regularity, Infinite Products of Matrices and Fractals. SIAM Journal of Mathematical Analysis, Vol. 23, pp. 1031-1079, 1992.

[DPJ98] Dumitrescu B., Popeea C., Jora B. – Metode de calcul numeric matriceal – Algoritmi fundamentali, Editura All Educational, Bucureşti, România, 1998.

[FaSm84] McFadden P.D., Smith J.D. – Vibration Monitoring of Rolling Element Bearings by the High-Frequency Resonance Technique. A Review., Tribology International, Vol. 17, No. 1, pp. 3-10, 1984.

[FAG97a] FAG OEM & Handel AG – Rolling Bearing Diagnosis with FAG Devices and Services, Technical Report Nr.WL 80-60 E, April 1997.

[FAG97b] FAG OEM & Handel AG – Rolling Bearings – FAG Detector 2000, Technical Report Nr.WL 80-62 E, April 1997.

[FiVa01] Figueras i Ventura R.M., Vandergheynst P. – Matching Pursuit through Genetic Algorithms, Technical Report, Signal Processing Laboratory (LTS), École Polytechnique Fédérale de Lausanne, Switzerland, 2001.

http://ltspc4.epfl.ch/F/PAPERS/REPORTS/R-2001-5.pdf [FVF01] Figueras i Ventura R.M., Vandergheynst P., Frossard P. – Evolutionary

Multiresolution Matching Pursuit and its relations with the Human Visual System, Technical Report 01.04., Signal Processing Laboratory (LTS), École Polytechnique Fédérale de Lausanne, Switzerland, April 2001.

http://ltspc4.epfl.ch/F/PAPERS/REPORTS/R-2001-3.pdf [FVF02] Figueras i Ventura R.M., Vandergheynst P., Frossard P. – Evolutionary

Multiresolution Matching Pursuit and its relations with the Human Visual System, Proceedings of EUSIPCO 2002, Toulouse, France, Vol. II, pp. 395-398, September 2002.

[GoI86] Gohberg I. – Schür Methods in Operator Theory and Signal Processing, Birkhauser Verlag, Stuttgart, Germania, 1986.

[GoDE90] Goldberg D.E. – A Note on Boltzmann Tournament Selection for Genetic Algorithms and Population-oriented Simulated Annealing, Complex Systems, No. 4, pp. 445–460, 1990.

[HoJH75] Holland J.H. – Adaptation in Natural and Artificial Systems, Prima ediţie: University of Michigan Press, USA, 1975. Ediţia a doua: The MIT Press, Cambridge, Massachusetts, USA, 1992.

[IoSt05] Ionescu F., Ştefănoiu D. – Intelligent and Allied Approaches to Hybrid Systems Modeling, chapter: Fuzzy-Statistical Reasoning in Faults Diagnosis, Steinbeis Press Edition (Editors: F. Ionescu, D. Ştefănoiu), Stuttgart/Berlin, Germany, December 2005.

[IoV85] Ionescu V. – Teoria Sistemelor. Sisteme Liniare., Editura Didactică şi Pedagogică, Bucureşti, România, 1985.

[KeEb95] Kennedy J., Eberhart R. – Particle Swarm Optimization, IEEE International Conference on Neural Networks, Piscataway – New Jersey, USA, pp. 1942-1948, 1995.

[LaWM90] Lawton W.M. – Tight Frames of Compactly Supported Wavelets, Journal of Mathematichal Physics, No. 31, pp. 1998-1901, 1990.

[LePG88] Lemarié P.G. – Ondelettes à localisation exponentielle, Journal des Mathématiques Pures et Appliqués, No. 67, pp. 227-236, 1988.

[LMS99] LMS International – LMS Scalar Instruments Roadrunner. User Guide, LMS Scalar Instruments Printing House, Leuven, Belgium, 1999.


155

[MaS89] Mallat S. – A Theory for Multiresolution Signal Decomposition: the Wavelet Representation., IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. ll, No. 7, pp. 674-693, July 1989.

[MaZh93] Mallat S., Zhong S. – Matching Pursuits with Time-Frequency Dictionaries, IEEE Transactions on Signal Processing, Vol. 41, No. 12, pp. 3397-3415, December 1993.

[MeY87] Meyer Y. – Les ondelettes, Pitman Res. Notes Math. Series, Vol. 155, pp. 158-171, 1987.

[MiM95] Mitchell M. – An Introduction to Genetic Algorithms, The MIT Press, Cambridge, Massachusetts, USA, 1995.

[NDS07] Nitu C., Dumitraşcu A., Ştefănoiu D. – Modele conceptuale şi analitice ale sistemelor ecologice, Raport tehnic CCNNMMPP..UUPPBB--PP44..3311005500..II//CCNN..AADD..DDSS--1122..22000077, Universitatea “Politehnica” din Bucureşti, Decembrie 2007.

http://www.geocities.com/endeavour_DS/Projects [NiVo91] Nix A.E., Vose M.D – Modeling Genetic Algorithms with Markov Chains,

Annals of Mathematics and Artificial Intelligence, No. 5, pp. 79-88, 1991. [PNS07] Petrescu C., Nicula O., Ştefănoiu D. – Unitate mobilă de achiziţie, prelucrare,

identificare şi diagnoză de semnal – Proiectarea interfeţei numerice a unităţii mobile, Raport tehnic AAMMCCSSIITT..UUPPBB--PP55..111177--22000077..II//CCPP..OONN..DDSS--1122..22000077, AMCSIT Politehnica & Universitatea “Politehnica” din Bucureşti, Decembrie 2007.

[PrMa96] Proakis J.G., Manolakis D.G. – Digital Signal Processing. Principles, Algorithms and Applications., third edition, Prentice Hall, Upper Saddle River, New Jersey, USA, 1996.

[RaWh93] Rawlins G., Whitley L.D – Foundations of Genetic Algorithms, Morgan Kaufmann, USA, 1991 & 1993.

[RuNo95] Russel S.J., Norvig P. – Artificial Intelligence – A Modern Approach, Prentice Hall, Upper Saddle River, New Jersey, USA, 1995.

[ScI17] Schür I. – On Power Series which Are Bounded in the Interior of the Unit Circle, Reine Angewandte Mathematik – Berlin, Vol. 147, pp. 205-232, 1917.

[ShC48] Shannon C. – A Mathematical Theory of Communication, Bell Systems Technical Journal, Vol. 27, pp. 379-423 & 623-656, 1948.

[SoSt89] Söderström T., Stoica P. – System Identification, Prentice Hall, London, UK, 1989.

[StD95] Ştefănoiu D. – Analiză de semnal prin metode de tip «frecvenţă-timp», Teză de doctorat, Universitatea “Politehnica” din Bucureşti, România, Aprilie 1995.

[StD96] Ştefănoiu D. – Introducere în Prelucrarea Numerică a Semnalelor (note de curs), Centrul de multiplicare al Universităţii “Politehnica” din Bucureşti, România, Februarie 1996.

[StCu09] Ştefănoiu D., Culiţă J. – PARMAX – A Predictor for Distributed Time Series, Industrial Simulation Conference ISC-2009, Loughborough, U.K., A publication of EUROSIS-ETI (ISBN 978-90-77381-4-89), pp. 5-12, June 1-3, 2009 (ISI-Thomson and INSPEC referenced).

[SCS05] Ştefănoiu D., Culiţă J., Stoica P. – Fundamentele Modelării şi Identificării Sistemelor, Editura Printech, Bucureşti, România, 2005.

[StIo02] Ştefănoiu D., Ionescu F. – Vibration Faults Classification by Fuzzy-Statistical Reasoning, Research Report AvH-FHKN-StIo0502, University of Applied Sciences in Konstanz (Dept. of Mechatronics) and Alexander von Humboldt Foundation, Konstanz, Germany, May 2002.


156

[StIo03] Ştefănoiu D., Ionescu F. – Maximum Verisimilitude Frequency Averaging of Signals, IMACS-IEEE Multi-conference on Computational Engineering in Systems Applications, CESA 2003, Lille, France, pp. 271–278, July 9-11, 2003.

[StIo06] Ştefănoiu D., Ionescu F. – Computational Intelligence in Fault Diagnosis, chapter: Fuzzy-statistical reasoning in fault diagnosis, Springer Verlag (editors: V. Palade, C.D. Bocănială, L. Jain), London, UK, 2006.

[SPD08] Ştefănoiu D., Petrescu C., Dumitraşcu A. – UMAPID – Proiectarea, construcţia şi realizarea unităţii mobile, Raport tehnic AAMMCCSSIITT..UUPPBB--PP55..111177--22000077..IIII//DDSS..CCPP..AADD--1100..22000088, AMCSIT Politehnica & Universitatea “Politehnica” din Bucureşti, Octombrie 2008.

[SSCM09] Ştefănoiu D., Seraficeanu C., Culiţă J., Muscă Gh. – Identification of MIMO-ARMAX Models for Glycemia and Sodium Ions Tests, through Particle Swarm Optimization, accepted at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009 (ISI-Thomson referenced).

[StSt07] Ştefănoiu D., Stănăşilă O. – Matematică şi Prelucrare de Semnal – Analiză timp-frecvenţă-scală cu undine, Editura Printech, Bucureşti, România, 2007.

[SSP09] Ştefănoiu D., Stănăşilă O., Popescu D. – Undine – Teorie şi aplicaţii, sub tipar la Editura Academiei Române, Bucureşti, România, 2009.

[VaPP93] Vaidyanathan P.P. – Multirate Systems and Filter Banks, Prentice Hall, S.P. Series (editor: A.V. Oppenheim), 1993.

[WaFa93a] Wang W.J., McFadden P.D. – Early Detection of Gear Failure by Vibration Analysis – I. Calculation of the Time-Frequency Distribution, Mechanical Systems and Signal Processing, Vol. 7, No. 3, pp. 193-203, 1993.

[WaFa93b] Wang W.J., McFadden P.D. – Early Detection of Gear Failure by Vibration Analysis – II. Interpretation of the Time-Frequency Distribution Using Image Processing Techniques, Mechanical Systems and Signal Processing, Vol. 7, No. 3, pp. 205-215, 1993.

[WaFa95] Wang W.J., McFadden P.D. – Application of Orthogonal Wavelets to Early Gear Damage Detection, Mechanical Systems and Signal Processing, Vol. 9, No. 5, pp. 497-507, 1995.

[WaFa96] Wang W.J., McFadden P.D. – Application of Wavelets to Gearbox Vibration Signals for Fault Detection, Journal of Sound and Vibration, Vol. 192, No. 5, pp. 927-939, 1996.

[YaX91] Yao X. – Optimization by Genetic Annealing, Proceedings of the second Australian Conference on Neural Networks, ACNN'91, Sydney, Australia, pp. 94–97, 1991.

analiza predictiva

Documents

Transcript of analiza predictiva