Algorithmes temporels rapides à point fixe pour la ...

195
HAL Id: tel-00268239 https://tel.archives-ouvertes.fr/tel-00268239 Submitted on 31 Mar 2008 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Algorithmes temporels rapides à point fixe pour la séparation aveugle de mélanges convolutifs et/ou sous-déterminés. Johan Thomas To cite this version: Johan Thomas. Algorithmes temporels rapides à point fixe pour la séparation aveugle de mélanges convolutifs et/ou sous-déterminés.. Astrophysique [astro-ph]. Université Paul Sabatier - Toulouse III, 2007. Français. tel-00268239

Transcript of Algorithmes temporels rapides à point fixe pour la ...

Page 1: Algorithmes temporels rapides à point fixe pour la ...

HAL Id: tel-00268239https://tel.archives-ouvertes.fr/tel-00268239

Submitted on 31 Mar 2008

HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, estdestinée au dépôt et à la diffusion de documentsscientifiques de niveau recherche, publiés ou non,émanant des établissements d’enseignement et derecherche français ou étrangers, des laboratoirespublics ou privés.

Algorithmes temporels rapides à point fixe pour laséparation aveugle de mélanges convolutifs et/ou

sous-déterminés.Johan Thomas

To cite this version:Johan Thomas. Algorithmes temporels rapides à point fixe pour la séparation aveugle de mélangesconvolutifs et/ou sous-déterminés.. Astrophysique [astro-ph]. Université Paul Sabatier - Toulouse III,2007. Français. �tel-00268239�

Page 2: Algorithmes temporels rapides à point fixe pour la ...

Ecole Doctorale MITT UFR PCAMathematiques, Informatique, Telecommunications Physique-Chimie-Automatique

Algorithmes temporels rapides a point fixepour la separation aveugle de melanges

convolutifs et/ou sous-determines

THESE

presentee et soutenue publiquement le 12 decembre 2007

pour l’obtention du

Doctorat de l’Universite de Toulousedelivre par l’Universite Toulouse III – Paul Sabatier

(specialite traitement du signal)

par

Johan Thomas

Composition du jury

President : Jean-Francois Cardoso Directeur de Recherche CNRS LTCI–ENST, Paris

Rapporteurs : Christian Jutten Professeur GIPSA–UJF, GrenobleDinh-Tuan Pham Directeur de Recherche CNRS LJK, Grenoble

Examinatrice : Christine Joblin Directrice de Recherche CNRS CESR, Toulouse

Directeurs : Yannick Deville Professeur LATT–UPS, ToulouseShahram Hosseini Maıtre de Conferences LATT–UPS, Toulouse

Laboratoire d’Astrophysique de Toulouse-Tarbes — UMR 5572

Page 3: Algorithmes temporels rapides à point fixe pour la ...

Mis en page ave la lasse thloria.

Page 4: Algorithmes temporels rapides à point fixe pour la ...

iRemer iementsEn premier lieu, je tiens à remer ier tout parti ulièrement Yanni kDeville et Shahram Hosseini pour m'avoir proposé d'e�e tuer ma thèse dansleur équipe de séparation de sour es. Leurs qualités s ienti�ques et humainesainsi que leur expérien e dans le domaine de la re her he ont représenté deréels atouts durant es trois années de thèse.Mes remer iements vont aussi à Christine Joblin et Olivier Berné du Centred'Etude Spatiale des Rayonnements pour la oopération que nous avons miseen pla e pendant ma thèse et qui a permis l'appli ation de ertaines de nosméthodes de séparation de sour es à l'étude des nuages de poussières interstel-laires.Je remer ie M. Jean-François Cardoso, Mme Christine Joblin, M. Chris-tian Jutten et M. Dinh-Tuan Pham pour avoir a epté d'être les membres demon jury de soutenan e ainsi que pour leurs remarques qui ont ontribué àl'amélioration de la qualité de e rapport.J'exprime toute ma re onnaissan e à mes parents pour m'avoir en ouragéet soutenu tout au long de mes études.Mes salutations à mes ollègues de bureau Rima, Matthieu et Hi ham ave qui il a été très agréable de travailler. Mes sentiments ami aux vont égale-ment à tous les membres de l'équipe S2I : Ali, Chahinez, Christophe, Denis,Eri , Guilhem, Hervé, Jean, Jean-François, Jean-Louis, José-Philippe, Karine,Laurent, Olivier, Paul, Rima, Sébastien, Sylvie et Truswin.Je remer ie tous les membres du LATT, permanents, do torants ou sta-giaires qui m'ont permis de travailler dans un ontexte de travail idéal, ainsique le servi e informatique du laboratoire pour son e� a ité et sa disponibilitépour répondre aux attentes des her heurs.Mes remer iements aux développeurs des logi iels libres Fedora Core, Tex-maker, SAOImage DS9, et de la lasse Thloria qui m'ont été d'une grandeutilité.Je remer ie en�n le Théâtre national du Capitole, la ville de Toulouse, ainsique les stations de ski et refuges pyrénéens pour m'avoir permis de mener mesétudes dans un environnement idéal.

Page 5: Algorithmes temporels rapides à point fixe pour la ...

ii

Page 6: Algorithmes temporels rapides à point fixe pour la ...

iii

Développe en toi l'indépendan e à tout moment, ave bienveillan e, simpli ité et modestie.Mar Aurèle

Page 7: Algorithmes temporels rapides à point fixe pour la ...

iv

Page 8: Algorithmes temporels rapides à point fixe pour la ...

Table des matièresTable des �gures ixListe des tableaux xiNotations xiiiIntrodu tion générale 1I Mélanges onvolutifs (sur-)déterminés 91 Mélanges onvolutifs : état de l'art 111.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.2 Position du problème . . . . . . . . . . . . . . . . . . . . . . 111.3 Hypothèses et ritères de séparation . . . . . . . . . . . . . 161.3.1 Statistiques roisées d'ordre supérieur . . . . . . . . . 171.3.2 La vraisemblan e . . . . . . . . . . . . . . . . . . . . 191.3.3 L'information mutuelle . . . . . . . . . . . . . . . . . 211.3.4 La non-gaussianité . . . . . . . . . . . . . . . . . . . 221.3.5 Statistiques roisées du se ond ordre . . . . . . . . . 251.3.6 La par imonie . . . . . . . . . . . . . . . . . . . . . . 261.3.7 La positivité . . . . . . . . . . . . . . . . . . . . . . 291.4 Classi� ation des méthodes de SAS onvolutives . . . . . . . 301.4.1 Les méthodes fréquentielles . . . . . . . . . . . . . . 301.4.2 Les méthodes temporelles . . . . . . . . . . . . . . . 321.5 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 Extension des méthodes de SAS basées sur la non-gaussianité 35v

Page 9: Algorithmes temporels rapides à point fixe pour la ...

vi Table des matières2.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.2 Position du problème . . . . . . . . . . . . . . . . . . . . . . 352.3 Appro hes existantes . . . . . . . . . . . . . . . . . . . . . . 372.4 Nouvelles méthodes pour extraire un pro essus d'innovation 392.5 Reformulation du mélange sous forme linéaire instantanée . 442.6 Performan es atteignables par le modèle linéaire instantanésous-déterminé . . . . . . . . . . . . . . . . . . . . . . . . . 462.7 Méthode globale de SAS proposée . . . . . . . . . . . . . . . 482.8 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 483 Résultats expérimentaux 513.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.2 Séparation de signaux de télé ommuni ations . . . . . . . . 513.3 Séparation de signaux audio . . . . . . . . . . . . . . . . . . 563.4 Tests statistiques . . . . . . . . . . . . . . . . . . . . . . . . 603.5 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 62II Mélanges sous-déterminés 654 Mélanges sous-déterminés : état de l'art 674.1 Estimation de la matri e de mélange . . . . . . . . . . . . . 684.2 Re onstru tion des sour es . . . . . . . . . . . . . . . . . . . 684.3 La séparation di�érentielle de sour es . . . . . . . . . . . . . 715 Méthode de SAS di�érentielle proposée pour les mélangesinstantanés 735.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 735.2 Un nouveau ritère de SAS basé sur le kurtosis di�érentiel . 735.3 Résumé des méthodes proposées . . . . . . . . . . . . . . . . 785.4 Preuves de onvergen e . . . . . . . . . . . . . . . . . . . . 805.5 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 826 Méthode de SAS di�érentielle proposée pour les mélanges onvolutifs 836.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

Page 10: Algorithmes temporels rapides à point fixe pour la ...

vii6.2 Utilisation du kurtosis di�érentiel dans le as onvolutif . . . 836.3 Résumé de la méthode proposée . . . . . . . . . . . . . . . . 886.4 Reformulation du mélange sous forme linéaire instantanée . 906.5 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 917 Résultats expérimentaux 937.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 937.2 Séparation de mélanges linéaires instantanés de signaux té-lé oms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 937.3 Séparation de mélanges linéaires instantanés de signaux audio 967.4 Séparation de mélanges onvolutifs de signaux télé oms . . . 987.5 Tests statistiques . . . . . . . . . . . . . . . . . . . . . . . . 1007.6 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 105III Mélanges linéaires instantanés ontenant un grandnombre d'é hantillons 1078 Algorithmes rapides optimisés pour les mélanges linéairesinstantanés 1098.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 1098.2 Position du problème . . . . . . . . . . . . . . . . . . . . . . 1098.3 Un algorithme optimisé rapide pour la SAS (sur-) déterminée1118.3.1 Prin ipes et limitations de l'appro he standard . . . 1118.3.2 Une nouvelle appro he pour optimiser le kurtosis . . 1128.3.3 Résumé de la méthode proposée . . . . . . . . . . . . 1158.4 Un algorithme optimisé rapide pour la SAS sous-déterminée 1158.4.1 Prin ipe et limitations de notre appro he DFICA . . 1158.4.2 Une nouvelle appro he pour optimiser le kurtosis dif-férentiel . . . . . . . . . . . . . . . . . . . . . . . . . 1178.4.3 Résumé de la méthode proposée . . . . . . . . . . . . 1188.5 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 1199 Résultats expérimentaux 1219.1 Introdu tion . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

Page 11: Algorithmes temporels rapides à point fixe pour la ...

viii Table des matières9.2 Appli ation à l'astrophysique . . . . . . . . . . . . . . . . . 1219.3 Tests statistiques . . . . . . . . . . . . . . . . . . . . . . . . 1269.4 Con lusion . . . . . . . . . . . . . . . . . . . . . . . . . . . 128Con lusion générale 131Annexes 137Annexe A : Blan himent 139Annexe B : Estimation des ontributions des sour es 143Annexe C : Dé�nitions des ritères SIRout, SIRin, SIRI etSNRin 145Annexe D : Gradient du kurtosis di�érentiel 147Annexe E : La orrélation di�érentielle 149Annexe F : Dé�nitions des ritères SIRout, SIRin et SIRI pourles méthodes de séparation partielle 151Annexe G : Choix de la famille de ve teurs d'extra tion 153Bibliographie 155Publi ations de l'auteur 173

Page 12: Algorithmes temporels rapides à point fixe pour la ...

Table des �gures1.1 Illustration d'un mélange onvolutif a oustique à 3 sour es et 3 apteurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.2 S héma-blo du pro essus de mélange. . . . . . . . . . . . . . . 141.3 S héma-blo d'un dispositif de séparation dire t. . . . . . . . . . 141.4 S héma-blo d'un dispositif de séparation ré urrent. . . . . . . . 151.5 Kurtosis non-normalisé et normalisé. . . . . . . . . . . . . . . . 232.1 S héma-blo du pro essus de dé�ation. . . . . . . . . . . . . . . 382.2 S héma-blo du pro essus de blan himent onvolutif. . . . . . . 403.1 Sour es utilisées 1 et 2 orrespondant à des signaux binaires. . . 523.2 Résultats de séparation d'un mélange onvolutif de signaux bi-naires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 533.3 Sour es utilisées 1 et 2 orrespondant à des signaux télé omsAM à 4 états. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543.4 Résultats de séparation d'un mélange onvolutif de signaux AM. 553.5 Réponses impulsionnelles de la matri e de �ltres de mélangeutilisée orrespondant aux azimuts 15�et -30�(ordre=256). . . . 563.6 Résultats de séparation d'un mélange onvolutif de signaux au-dio (1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573.7 Réponses impulsionnelles des �ltres de mélange utilisés orres-pondant aux azimuts 10�et 60�(ordre=256). . . . . . . . . . . . 583.8 Résultats de séparation d'un mélange onvolutif de signaux au-dio (2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593.9 SIRout des sour es extraites en fon tion de Q pour des sour es olorées arti� ielles dans le as de pro essus d'innovation uni-formes et en utilisant le ritère du kurtosis. . . . . . . . . . . . . 613.10 SIRout des sour es extraites en fon tion de Q pour des sour es olorées arti� ielles dans le as de pro essus d'innovation lapla- iens et en utilisant le ritère de la néguentropie. . . . . . . . . . 613.11 SIRout des sour es utiles extraites en fon tion du SNR d'entrée. 633.12 Temps d'extra tion moyen du premier pro essus d'innovation enfon tion de Q pour une optimisation de type Tugnait-Newtonet pour notre optimisation de type point �xe. . . . . . . . . . . 63ix

Page 13: Algorithmes temporels rapides à point fixe pour la ...

x Table des �gures4.1 S héma du prin ipe d'estimation des sour es à partir de la ma-tri e de mélange en onsidérant qu'une seule sour e ( elle d'in-di e 3) est a tive à l'instant n. . . . . . . . . . . . . . . . . . . . 694.2 S héma du prin ipe d'estimation des sour es à partir de la ma-tri e de mélange par la méthode du trajet le plus ourt. . . . . . 707.1 Résultats de séparation d'un mélange linéaire-instantané de si-gnaux télé oms. . . . . . . . . . . . . . . . . . . . . . . . . . . . 957.2 Résultats de séparation d'un mélange linéaire-instantané de si-gnaux audio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 977.3 Sour es utilisées 1 et 2 orrespondant à des signaux télé omsAM démodulés à 4 états. . . . . . . . . . . . . . . . . . . . . . . 987.4 Résultats de séparation d'un mélange onvolutif de signaux té-lé oms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 997.5 SIRout obtenus ave les versions à dé�ation de FastICA et DFICAen fon tion du SNR d'entrée. . . . . . . . . . . . . . . . . . . . 1017.6 Perf et SIRout obtenus ave les versions symétriques de Fas-tICA et DFICA en fon tion du SNR d'entrée. . . . . . . . . . . 1017.7 SIRout obtenus ave C-FICA et C-DFICA en fon tion du SNRd'entrée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1037.8 SIRout obtenus ave C-DFICA en fon tion du nombre d'é han-tillons. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1037.9 Temps d'extra tion moyen du premier pro essus d'innovationen fon tion de Q pour une optimisation de type Newton et pournotre optimisation de type point �xe (algorithme C-DFICA). . . 1049.1 Image de la nébuleuse NGC 2023 prise par le téles ope Hubbleà la longueur d'onde λ1=474 nm. . . . . . . . . . . . . . . . . . 1249.2 Image de la nébuleuse NGC 2023 prise par le téles ope Hubbleà la longueur d'onde λ2=631 nm. . . . . . . . . . . . . . . . . . 1249.3 Image séparée 1 obtenue ave l'algorithme FastICA en 115 se .et ave l'algorithme O-FICA en 4.5 se . . . . . . . . . . . . . . . 1259.4 Image séparée 2 obtenue ave l'algorithme FastICA en 115 se .et ave l'algorithme O-FICA en 4.5 se . . . . . . . . . . . . . . . 1259.5 Rapport t′/t des temps de al ul en fon tion du nombre Td'é hantillons. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1279.6 Indi e de performan es Perf en fon tion du temps de al ul. . . 1291 S héma-blo des étages de blan himent et de normalisation. . . 1402 S héma-blo du pro essus de blan himent et de normalisation. . 140

Page 14: Algorithmes temporels rapides à point fixe pour la ...

Liste des tableaux1.1 Tableau de synthèse des équations de mélange et de séparation. 161.2 Tableau ré apitulatif des avantages et in onvénients respe tifsdes méthodes de séparation temporelles et fréquentielles [150℄. . 34

xi

Page 15: Algorithmes temporels rapides à point fixe pour la ...

xii Liste des tableaux

Page 16: Algorithmes temporels rapides à point fixe pour la ...

Notations- SAS : Séparation Aveugle de Sour es (BSS : Blind Sour e Separation en anglais).- ACI : Analyse en Composantes Indépendantes (ICA : Indep. Component Analysis).- x(n) : ve teur olonne omposé de signaux d'observation xi(n).- X(z) : transformée en Z du ve teur x(n).- A : matri e de mélange instantané omposée de oe� ients s alaires réels aij .- G : matri e de performan es dé�nie par le produit des matri es de mélangeet de séparation (G est omposée de oe� ients gij).- Mt : matri e transposée de la matri e M.- A(z) : matri e de mélange onvolutif omposée de �ltres Aij(z).- H(z) : matri e de �ltres modélisant la oloration des pro essus d'innovationdes sour es et le mélange onvolutif des sour es.- N : nombre de sour es présentes dans le mélange.- P : nombre d'observations du mélange.- T : nombre d'é hantillons de haque observation.- Q : ordre de la matri e de �ltres H(z).- corrxy(n) : oe� ient de orrélation des signaux x et y à l'instant n.- Dcorrxy(n) : oe� ient de orrélation di�érentielle des signaux x et y entreles instants n1 et n2.- Rx(n) : matri e d'auto orrélation du ve teur x à l'instant n.- DRx(n1, n2) : matri e d'auto orrélation di�érentielle du ve teur x entre lesinstants n1 et n2.- rxy(n) : ve teur d'inter orrélation des signaux x et y à l'instant n.- �ltre RIF : �ltre à réponse impulsionnelle �nie ou �ltre à moyenne ajustée (MA).- �ltre RII : �ltre à réponse impulsionnelle in�nie ; �ltre autorégressif (AR) ou�ltre autorégressif à moyenne ajustée (ARMA).- δ(n) : symbole de Krone ker, dé�ni par δ(0) = 1 et δ(n 6= 0) = 0.- ∗ : opérateur de onvolution.- SIR : Rapport signal à interféren es (Signal to Interferen e Ratio).- SIRI : amélioration du SIR (Signal to Interferen e Ratio Improvement).- SNR : Rapport signal à bruit (Signal to Noise Ratio).- E {y(n)} : espéran e du signal y(n).- kurty(n) : kurtosis non-normalisé du signal y à l'instant n.- Dkurty(n1, n2) : kurtosis di�érentiel du signal y entre les instants n1 et n2.- kurtnory (n) : kurtosis normalisé du signal y à l'instant n.- Dkurtnor

y (n1, n2) : kurtosis normalisé di�érentiel du signal y entre n1 et n2.- powy(n) : puissan e du signal y à l'instant n.- Dpowy(n1, n2) : puissan e di�érentielle du signal y entre les instants n1 et n2.- i.i.d. : indépendant et identiquement distribué.xiii

Page 17: Algorithmes temporels rapides à point fixe pour la ...

xiv Notations

Page 18: Algorithmes temporels rapides à point fixe pour la ...

Introdu tion générale

1

Page 19: Algorithmes temporels rapides à point fixe pour la ...
Page 20: Algorithmes temporels rapides à point fixe pour la ...

3La grande majorité des te hnologies modernes, dans la plupart des dis i-plines, utilisent des apteurs pour mesurer des grandeurs utiles pour l'étude oule ontr�le d'un phénomène physique. Les mi rophones par exemple aptentles ondes sonores se propageant dans l'air, les antennes radio mesurent l'évolu-tion d'un hamp éle tromagnétique, les déte teurs photo-sensibles numérisentl'image obtenue par un système optique, en�n les éle trodes pla ées sur le râne d'un patient permettent d'enregistrer le hamp éle trique asso ié à sona tivité érébrale.En pratique, malheureusement, les signaux obtenus grâ e à es apteurssont souvent des mélanges de plusieurs ontributions issues de signaux origi-nels appelés sour es. Dans le as le plus général, es ontributions sont dessignaux obtenus par �ltrage non-linéaire des sour es physiques. Dans d'autres as plus simples, elles peuvent être des versions pondérées et/ou dé alées tem-porellement des sour es.La Séparation Aveugle de Sour es (SAS) onsiste à estimer les signauxsour es (ou éventuellement leurs ontributions) à partir des mélanges obte-nus sur haque apteur. Le orps humain possède un organe réalisant e typed'opération : le erveau. Celui- i peut en e�et se fo aliser sur un phénomèneextérieur parti ulier déte té par les sens. On peut ainsi é outer une personnes'exprimant dans une salle bruitée où d'autres personnes parlent en mêmetemps (un hall de onféren es par exemple). La zone du erveau dédiée à lavision peut aussi �xer notre attention sur une zone pré ise du hamp visuel.La séparation de sour es, en tant que dis ipline s ienti�que est relative-ment ré ente et s'est inspirée, à son ommen ement, du erveau humain et deson organisation en réseaux neuronaux [88℄ (1984). Elle s'est aussi basée surdes résultats obtenus en dé onvolution aveugle, en adaptant un ritère parti- ulier, le kurtosis ou auto umulant d'ordre 4 qui est aujourd'hui en ore l'undes plus utilisés. La SAS a ensuite onnu durant deux dé ennies des évolutions onstantes, et a trouvé un vaste hamp d'appli ations, e qui en fait a tuel-lement un domaine de re her he majeur en traitement du signal. On utiliseles te hniques de séparation aveugle de sour es dans des domaines aussi di-vers que le traitement de sour es audio, les télé ommuni ations multi anales,l'analyse de signaux biomédi aux, l'imagerie astrophysique multispe trale, letraitement de données géophysiques, la déte tion et la lo alisation radar etbien d'autres [64, 65, 102, 103, 106℄.Le pro essus de mélange entre sour es et apteurs est modélisé en généralpar l'équation ve torielle suivante :x(t) = A (s(t)) + b(t) (1)où- s(t) est le ve teur des signaux sour es que l'on her he à estimer.

Page 21: Algorithmes temporels rapides à point fixe pour la ...

4- x(t) est le ve teur des observations mesurées par les apteurs.- b(t) est le ve teur de bruit qui modélise les erreurs de mesure des apteurs.- A est l'opérateur de mélange.On peut lasser les problèmes de SAS en fon tion de la nature de l'opéra-teur A.a) Si et opérateur est linéaire, on parle de mélange linéaire. L'équation (1)s'é rit alorsx(t) = A(t) ∗ s(t) + b(t) (2)où � A(t) est une matri e de réponses impulsionnelles de �ltres.� ∗ est l'opérateur de onvolution ontinue.Si les signaux mesurés sont à temps dis ret, e qui est né essairement le aspour des signaux numériques enregistrés, la variable de temps t est rempla éepar un indi e temporel n entier et l'opérateur de onvolution ontinue estrempla é par une onvolution dis rète. L'équation (2) devient alors

x(n) = A(n) ∗ s(n) + b(n). (3)Parmi les mélanges linéaires, on peut isoler deux as parti uliers de mélanges :� Les mélanges sont linéaires instantanés quand la matri e de réponsesimpulsionnelles de �ltres A(n) est onstituée d'é hantillons unités δ en-trés en 0. La matri e A(n) s'é rit alors sous la forme A(n) = Aδ(n),où A est une matri e, et l'opérateur de onvolution devient une simplemultipli ation matri iellex(n) = As(n) + b(n). (4)� Les mélanges sont linéaires à atténuations et retards quand la fon tion

A(n) est onstituée d'é hantillons unités d'amplitudes di�érentes et en-trés à des instants di�érents suivant le ouple sour e- apteur onsidéré.b) Les mélanges non-linéaires sont les plus généraux mais aussi les plus dif-� iles à traiter. Ils ont d'abord été étudiés dans un as parti ulier : elui oùla non-linéarité est introduite uniquement au niveau du apteur du fait parexemple d'un phénomène d'é rêtage. Les observations onsistent alors en unesomme de ontributions qui subit une non-linéarité au moment de la onver-sion en signal éle trique. On parle alors de mélanges post-non-linéaires. Notonsque la zone auditive du erveau e�e tue la séparation de e type de mélanges.En e�et l'oreille humaine n'a pas une réponse parfaitement linéaire : l'in�uxnerveux du nerf auditif n'est pas proportionnel à la pression exer ée sur le

Page 22: Algorithmes temporels rapides à point fixe pour la ...

5tympan. Depuis, des on�gurations plus générales ont été traitées omme lesmélanges linéaires quadratiques [70℄ ou ertaines lasses parti ulières de mé-langes [76℄. La lasse des mélanges non-linéaires n'est pas été étudiée dans lasuite de e do ument.On peut aussi lasser les mélanges suivant le nombre d'observations rela-tivement au nombre de sour es. Les mélanges sont dits sur-déterminés quandle nombre d'observations est supérieur au nombre de sour es. Si le le nombred'observations est inférieur au nombre de sour es, on parle de mélanges sous-déterminés. En�n, si les nombres de sour es et d'observations sont égaux, lemélange est dit déterminé. Selon le as, la matri e de mélange A(n) a un plusgrand nombre de lignes (mélanges sur-déterminés), de olonnes (mélanges sous-déterminés), ou un nombre égal de lignes et de olonnes (mélanges déterminés).Dans la première partie de ette thèse, nous nous sommes intéressés auxmélanges onvolutifs (sur-)déterminés, pour lesquels nous proposons un al-gorithme à point �xe opérant dans le domaine temporel. Le hapitre 1 est onsa ré à un état de l'art de la séparation aveugle de sour es. Nous dé ri-vons l'ensemble des lasses de ritères utilisées dans la littérature jusqu'i i etévoquons pour ha un d'eux les extensions qui ont été proposées pour traiterles mélanges onvolutifs. Nous analysons ensuite les avantages et in onvénientsdes deux grandes appro hes fréquentielle et temporelle de séparation aveuglepour mélanges onvolutifs. Dans le hapitre 2, nous her hons à étendre letrès populaire algorithme FastICA aux mélanges onvolutifs. Pour ela, nousintroduisons un pro essus de blan himent spatio-temporel non- ausal, qui, eninitialisant d'une ertaine façon les paramètres d'extra tion, permet d'utiliserune pro édure d'optimisation de type point �xe analogue à elle de FastICA.L'estimation des ontributions des sour es dans les observations est réaliséeau moyen d'un ritère quadratique orrespondant à la di�éren e entre une ob-servation donnée et une version �ltrée du pro essus d'innovation extrait parl'optimisation à point �xe. L'optimisation de e ritère est réalisée au moyend'un pro essus de �ltrage de Wiener non- ausal. Dans le hapitre 3, nous vali-dons notre algorithme en e�e tuant des tests de séparation utilisant des signauxréels et simulés, puis nous e�e tuons une analyse statistique pour omparer sesperforman es en termes de séparation et de rapidité ave l'algorithme de Tu-gnait qui suppose les mêmes hypothèses de stationnarité et de non-gaussianitédes sour es. Cette première partie a fait l'objet d'une publi ation dans la revueIEEE SPL [203℄ (une première version de l'arti le a été présentée au WorkshopECMS qui a eu lieu à Toulouse en mai 2005 [202℄).Dans la deuxième partie, nous nous intéressons aux mélanges sous-déterminéslinéaires instantanés ou onvolutifs, pour lesquels nous her hons là aussi àétendre l'algorithme FastICA. Nous présentons dans le hapitre 4 un état del'art de la séparation aveugle de sour es sous-déterminée et onstatons quel'hypothèse de par imonie des sour es est utilisée pour la plupart des mé-

Page 23: Algorithmes temporels rapides à point fixe pour la ...

6thodes existantes. Dans le hapitre 5 onsa ré aux mélanges linéaires instanta-nés sous-déterminés, en nous basant sur le on ept de séparation di�érentiellede sour es, nous proposons un pro essus de blan himent di�érentiel des obser-vations qui permet l'emploi d'itérations à point �xe pour optimiser un ritèredi�érentiel orrespondant à la di�éren e entre deux instants du kurtosis dusignal de sortie. Deux versions de l'algorithme proposé, baptisé DFICA sontprésentées : une version à dé�ation et une version parallèle. Dans le hapitre 6,nous utilisons le même on ept de séparation di�érentielle de sour es pour lesmélanges onvolutifs sous-déterminés pour lesquels nous proposons un pro es-sus de blan himent spatio-temporel di�érentiel permettant d'extraire par unepro édure d'optimisation à point �xe les pro essus d'innovation de sour esdites utiles en présen e de sour es de bruit. L'estimation des ontributions dessour es utiles, superposées à des ontributions de sour es de bruit, est réaliséeau moyen d'un ritère quadratique di�érentiel dont l'optimisation est e�e tuéeau moyen d'un pro essus de �ltrage de Wiener dit di�érentiel. Nous appelonsC-DFICA et algorithme destiné aux mélanges onvolutifs sous-déterminés. Le hapitre 7 démontre l'utilité de nos algorithmes en présentant des tests de sépa-ration de mélanges de sour es réelles et arti� ielles ; des tests de Monte-Carlopermettent d'évaluer la résistan e de nos algorithmes di�érentiels DFICA etC-DFICA à la présen e de sour es de bruit. Nous omparons aussi la rapiditéde l'algorithme C-DFICA ave elle d'une version di�érentielle de l'algorithmede Tugnait développée auparavant dans l'équipe. Le ontenu de ette se ondepartie a donné lieu a une publi ation dans la revue IEEE TSP [204℄.La troisième partie est onsa rée aux mélanges linéaires instantanés desour es ontenant un grand nombre d'é hantillons. Cette on�guration est fré-quente notamment en séparation aveugle d'images du fait de l'augmentationdu nombre de pixels des apteurs photo-sensibles de types CCD ou CMOS.Le hapitre 8 met d'abord en éviden e une limitation de l'algorithme FastICAappli able aux mélanges linéaires instantanés (sur-)déterminés qui, à haqueitération de l'algorithme d'optimisation à point �xe, e�e tue un al ul de statis-tiques sur l'ensemble des é hantillons disponibles, e qui demande de réaliserun grand nombre d'opérations élémentaires. FastICA demande pour ela lesto kage en mémoire de signaux, qui, si le nombre d'é hantillons disponiblesest élevé, demande un espa e mémoire important. Après avoir onstaté quele ritère du kurtosis est polyn�mial relativement aux oe� ients d'extra tionà estimer, nous proposons une pro édure d'identi� ation de e polyn�me quipermet ensuite d'appliquer des itérations de type point �xe dans un espa e de al ul moins gourmand. Nous baptisons O-FICA et algorithme appli able auxmélanges linéaires instantanés de longs signaux de mélange. Nous reprenonsensuite le prin ipe d'identi� ation polyn�miale multivariable et l'appliquons àl'algorithme DFICA pour les mélanges linéaires instantanés sous-déterminés.Le kurtosis di�érentiel pouvant aussi être identi�é omme un polyn�me, unepro édure d'identi� ation similaire à elle d'O-FICA permet d'optimiser l'al-gorithme DFICA lorsque les mélanges ontiennent un grand nombre d'é han-

Page 24: Algorithmes temporels rapides à point fixe pour la ...

7tillons. Nous baptisons O-DFICA et algorithme proposé pour la séparationsous-déterminée de signaux longs. Le hapitre 9 permet de mesurer le gain entemps de al ul obtenu ave nos algorithmes optimisés omparé à leur versionstandard asso iée. Un arti le au sujet de l'algorithme O-FICA a été présentéà la onféren e GRETSI en Septembre 2007 [206℄ (une version anglaise a étéprésentée au Workshop ECMS en mai 2007 [205℄). Un arti le de revue est a -tuellement en ours de révision pour la revue IEEE TSP on ernant les deuxalgorithmes O-FICA et O-DFICA.

Page 25: Algorithmes temporels rapides à point fixe pour la ...

8

Page 26: Algorithmes temporels rapides à point fixe pour la ...

Première partieMélanges onvolutifs(sur-)déterminés

9

Page 27: Algorithmes temporels rapides à point fixe pour la ...
Page 28: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 1Mélanges onvolutifs : état de l'art1.1 Introdu tionLa séparation aveugle de mélanges onvolutifs est un domaine de re her heré ent et très prometteur. Elle étudie la séparation des mélanges linéaires gé-néraux, les mélanges linéaires instantanés et à atténuations et retards étantdes as parti uliers réalistes pour ertaines appli ations uniquement. En e�et,le temps de propagation entre une sour e et un apteur n'est jamais parfaite-ment nul, même s'il peut parfois être négligé. La sous- lasse des mélanges àatténuations et retards modélise es retards de propagation mais suppose quele signal n'est pas déformé par le milieu, e qui peut ne pas être onforme àla réalité. Pour les appli ations audio par exemple, on ne ren ontre e typede mélanges que lorsque l'enregistrement est réalisé dans une hambre ané- hoïque qui élimine les trajets multiples (ou réverbérations) entre les sour eset les apteurs. Très souvent, don , de nombreuses versions temporellement dé- alées d'une même sour e parviennent à haque apteur en raison de ré�exionsmultiples dans le milieu. Chaque version dé alée possède sa propre atténuationqui orrespond à un oe� ient de la réponse impulsionnelle du �ltre du ouplesour e- apteur onsidéré. Le phénomène de réverbération a oustique est illus-tré de façon simpli�ée par la �gure 1.1. Dans e hapitre, nous ommençonspar dé�nir le modèle de mélange onvolutif puis nous répertorions les di�é-rents types de ritères d'abord utilisés pour la séparation de mélanges linéairesinstantanés puis étendus à la lasse des mélanges onvolutifs. Nous divisonsensuite les méthodes onvolutives en deux types : les méthodes fréquentiellesutilisant la transformée de Fourier à ourt terme et les méthodes temporellesqui her hent à estimer des �ltres d'extra tion formulés temporellement.1.2 Position du problèmeLa lasse générale des mélanges onvolutifs tient ompte de la déformationdu signal propagé et la modélise par un �ltrage entre la sour e et l'observation,11

Page 29: Algorithmes temporels rapides à point fixe pour la ...

12 Chapitre 1. Mélanges onvolutifs : état de l'art

Fig. 1.1 � Illustration d'un mélange onvolutif a oustique à 3 sour es et 3 apteurs. e qui s'é rit mathématiquement sous la forme d'une onvolution. La ontri-bution d'une sour e d'indi e j sur un apteur i s'exprime don de la manièresuivante :xij(t) = aij(t) ∗ sj(t) (1.1)où ∗ est l'opérateur de onvolution1.Toutes les équations reliant les P observations aux N sour es (où P ≥ N)peuvent s'é rire de manière synthétique par la relation matri ielle suivante :x(t) = A(t) ∗ s(t) (1.2)où s(t) = [s1(t), · · · , sN(t)]t et x(t) = [x1(t), · · · , xP (t)]t sont respe tivementles ve teurs sour e et observation et où

A(t) =

a11(t) · · · a1N (t)... ...aP1(t) · · · aPN(t)

(1.3)regroupe les réponses impulsionnelles des �ltres présents entre sour es et ap-teurs. Lorsque l'on onsidère des signaux numériques, l'éq. (1.2) s'exprime àl'aide d'un indi e temporel dis ret n au lieu de la variable de temps ontinue

t :x(n) = A(n) ∗ s(n) (1.4)1Le terme de bruit de mesure b(n) n'est pas pris en ompte i i.

Page 30: Algorithmes temporels rapides à point fixe pour la ...

1.2. Position du problème 13où ∗ est ette fois l'opérateur de onvolution dis rète.Dans le domaine en Z, on obtient alorsX(z) = A(z)S(z) (1.5)où A(z) est une matri e de fon tions de transfert de �ltres qui est la transfor-mée en Z de A(n)

A(z) =

∑+∞k=−∞ a11(k)z−k · · ·

∑+∞k=−∞ a1N (k)z−k... ...

∑+∞k=−∞ aP1(k)z−k · · ·

∑+∞k=−∞ aPN(k)z−k

(1.6)Pour que le mélange soit réellement onvolutif ( .-à-d. pas seulement à at-ténuations et retards), il faut que pour au moins un ouple d'indi es (i, j),la fon tion Aij(z) =

∑+∞k=−∞ aij(k)z−k ait deux oe� ients aij(k) non nuls.La grande majorité des travaux de séparation aveugle de sour es dans le as onvolutif supposent un modèle de mélange faisant intervenir des �ltres au-saux à Réponses Impulsionnelles Finies (RIF). La matri e de �ltres A(z) seréé rit alors

A(z) =

∑Kk=0 a11(k)z−k · · ·

∑Kk=0 a1N (k)z−k... ...

∑Kk=0 aP1(k)z−k · · ·

∑Kk=0 aPN(k)z−k

(1.7)Notons toutefois les travaux de Ci ho ki qui supposent l'existen e d'une om-posante auto-régressive dans le pro essus de mélange [52℄. La �gure 1.2 repré-sente le pro essus de mélange sous forme de s héma-blo .Si toutes les fon tions de transfert ont un seul oe� ient non nul, le mé-lange est simplement à atténuations et retards et si de plus les fon tions d'unemême olonne de A(z) ont e oe� ient non nul au même indi e k, le mé-lange peut être réé rit de manière linéaire instantanée en dé alant si besoin lessour es.La séparation aveugle de sour es her he à estimer les sour es sj(n) formantle ve teur s(n). Dans le as d'un mélange onvolutif, ette estimation n'estpossible qu'à une indétermination de �ltrage près. En e�et, si l'on prend un�ltre quel onque F (z), la ontribution d'une sour e j sur un apteur i (1.1)peut se réé rire dans le domaine en Z sous la forme

Xij(z) =Aij(z)

F (z)

(F (z)Sj(z)

), (1.8)si bien que l'on peut réé rire (1.5) en remplaçant la sour e Sj(z) du ve teur

S(z) par F (z)Sj(z) et en remplaçant les éléments Aij(z) de la olonne j deA(z) par Aij(z)

F (z). Sans d'autres hypothèses sur les sour es, il n'y a au un moyende lever ette indétermination. Dans le as de sour es i.i.d. (indépendantes et

Page 31: Algorithmes temporels rapides à point fixe pour la ...

14 Chapitre 1. Mélanges onvolutifs : état de l'art

s2(n) x2(n)

x1(n)s1(n) A11(z)

A12(z)

A21(z)

A22(z)Fig. 1.2 � S héma-blo du pro essus de mélange.identiquement distribuées), ette indétermination peut être levée en partie. Onpeut alors identi�er les sour es à un retard et à un s alaire multipli atif près(éventuellement omplexe) [212℄.En fait il est parfois su�sant d'estimer un jeu de �ltres de séparation W(z)qui suppriment les interféren es des autres sour es introduites par le pro essusde mélange. Ces �ltres peuvent être à réponses impulsionnelles �nies ou àréponses impulsionnelles in�nies (RII). Le système de séparation RIF ausals'exprime par∀l = 1 . . . N, yl(n) =

P∑

i=1

K ′

k=0

wli(k)xi(n− k) (1.9) e qui peut s'é rire dans le domaine en ZY(z) = W(z)X(z). (1.10)

x1(n)

x2(n)

y1(n)

y2(n)

W11(z)

W12(z)

W21(z)

W22(z)Fig. 1.3 � S héma-blo d'un dispositif de séparation dire t.

Page 32: Algorithmes temporels rapides à point fixe pour la ...

1.2. Position du problème 15Le système de séparation de la �gure 1.3 est quali�é de dire t [97℄. Il existeaussi des systèmes de séparation de type ré urrent dont les sour es estiméessont données par les équation suivantes :∀l = 1 . . . N, yl(n) = xl(n) +

P∑

i=1

K ′

k=0

uli(k)yi(n− k) (1.11) e qui peut être exprimé matri iellement dans le domaine en Z parY(z) = X(z) + U(z)Y(z), (1.12)d'où on déduitY(z) = (I−U(z))−1X(z) (1.13)sous réserve que (I−U(z))−1 existe et que tous ses p�les soient dans le er leunité. La matri e de séparation 'dire te' équivalente est alors

W(z) = (I−U(z))−1 (1.14)La �gure 1.4 représente le dispositif de séparation ré urrent sous forme des héma-blo 2.

y2(n)

y1(n)x1(n)

x2(n)

U11(z)

U12(z)

U21(z)

U22(z)Fig. 1.4 � S héma-blo d'un dispositif de séparation ré urrent.Les réseaux dire ts et ré urrents peuvent être ombinés pour donner unréseau hybride où une stru ture dire te est suivie d'une stru ture ré urrente[50, 51℄. Dans ette thèse, nous avons développé des méthodes basées unique-ment sur les réseaux dire ts qui sont les plus utilisés en raison de leur stabilité,qui est toujours véri�ée ontrairement aux réseaux ré urrents.Les équations de mélange et de séparation dans le domaine temporel etdans le domaine en Z sont regroupées dans le tableau 1.1.2Le plus souvent, les �ltres dire ts Uii(z) sont hoisis égaux à des �ltres nuls.

Page 33: Algorithmes temporels rapides à point fixe pour la ...

16 Chapitre 1. Mélanges onvolutifs : état de l'artPro essus Domaine temporel Domaine en ZMélange RIF ausal ∀i = 1..P, xi(n) =∑N

j=1

∑Kk=0 aij(k)sj(n− k) X(z) = A(z)S(z)Séparation dire te ∀l = 1..N, yl(n) =

∑Pi=1

∑K ′

k=0 wli(k)xi(n− k) Y(z) = W(z)X(z)Séparation ré urrente ∀l = 1..N, yl(n) = xl(n)+∑P

i=1

∑K ′

k=0 uli(k)yi(n−k) Y(z) = (I−U(z))−1X(z)Tab. 1.1 � Tableau de synthèse des équations de mélange et de séparation.En pratique, on her he souvent à estimer des versions �ltrées parti ulièresdes sour es qui sont les ontributions sur les di�érents apteurs. Dans le asde signaux i.i.d. (en général des signaux de télé ommuni ations), on her he àestimer les sour es non �ltrées à un retard et à un fa teur d'é helle près.L'autre indétermination on erne l'ordre des sour es séparées : on ne saitpas à quel indi e de sour e j orrespond un signal séparé i. Cette indétermi-nation n'existe en fait que si l'on a numéroté de façon arbitraire les signauxsour es in onnus (dans le as ontraire, on peut ordonner les sour es à posté-riori de la même façon que les signaux séparés asso iés). Cette numérotationdes sour es à estimer est toutefois né essaire pour les méthodes fréquentielles omme nous le verrons.1.3 Hypothèses et ritères de séparationLes hypothèses généralement admises par les méthodes de séparation demélanges onvolutifs appartenant à la lasse de l'Analyse en ComposantesIndépendantes sont les suivantes :Hypothèse 1 Les sour es sont entrées. En pratique on peut toujours se ra-mener à un mélange de sour es entrées en entrant les observations.Hypothèse 2 Les signaux onsidérés sont stationnaires et ergodiques de sorteque l'on peut estimer les espéran es par des moyennages temporels.Hypothèse 3 La matri e de mélange A(z) est inversible à gau he et la ma-tri e inverse peut être appro hée à l'aide de �ltres RIF éventuellementnon ausaux d'ordres su�samment grands.Hypothèse 4 Les sour es sont statistiquement indépendantes, .-à-d. la den-sité de probabilité onjointe du ve teur signal (s1(n−d1), · · · , sN(n−dN ))est égale au produit des densités marginales :

p(s1(n− d1), · · · , sN(n− dN)) =N∏

i=1

p(si(n− di)), ∀d1, · · · , dN (1.15)

Page 34: Algorithmes temporels rapides à point fixe pour la ...

1.3. Hypothèses et ritères de séparation 17Hypothèse 5 Les sour es à estimer sont non-gaussiennes, sauf une éventuel-lement.Hypothèse 6 Les sour es à estimer résultent de la oloration de pro essusd'innovation par �ltrage RIF d'ordre su�samment grand.L'Hypothèse 3 exige que les sour es soient situées à des endroits di�érentsde l'espa e (ou au moins qu'elles émettent dans des dire tions di�érentes). Elleimplique aussi d'avoir un nombre d'observations P supérieur ou égal au nombrede sour es N . Nous éviterons ependant ette hypothèse dans la se onde par-tie de e manus rit, où l'on her hera à e�e tuer une séparation partielle desour es non-stationnaires en présen e de sour es de bruit stationnaires.La majorité des ritères de séparation de sour es pour mélanges onvolutifsont été utilisés d'abord par des méthodes appli ables aux mélanges linéairesinstantanés. Nous détaillons i i les prin ipaux ritères qui peuvent être las-sés en 7 atégories. Les 4 premières atégories sont historiquement les plusan iennes et exigent les hypothèses lassiques relatives à l'ACI dé rites plushaut. Les trois suivantes regroupent des ritères où ertaines des hypothèsespré édentes sont rempla ées par des hypothèses spé i�ques : non- orrélation, oloration des sour es, non-stationnarité, par imonie ou positivité.1.3.1 Statistiques roisées d'ordre supérieurL'annulation de statistiques roisées d'ordre supérieur est un ritère trèsutilisé en séparation de sour es. En e�et, une façon d'exprimer l'indépendan edes sorties du dispositif de séparation, si elles- i sont entrées et à densitéssymétriques, est d'annuler tous les moments roisés d'ordre impairE{yi(n)αyj(n− τ)β

}= 0, ∀i 6= j, ∀τ, ∀α, β = 1, 3, 5, 7 . . . (1.16)En fait, il n'est pas né essaire d'annuler tous es moments roisés pour réaliserla séparation. En lien ave e ritère, on peut utiliser deux familles de statis-tiques qui quanti�ent l'indépendan e des sorties :1) Les moments roisés non-linéaires sont dé�nis à partir de deux fon tions

f et g par la formule3C(f,g)(i, j) = E {f(yi(n))g(yj(n))} , ∀i 6= j (1.17)et ont donné lieu aux premiers algorithmes de séparation de sour es développéspar J. Hérault, C. Jutten et B. Ans [88�90,104℄.3Pour ne pas se ramener à un simple ritère de dé orrélation, f et g ne doivent pas êtretoutes les deux linéaires.

Page 35: Algorithmes temporels rapides à point fixe pour la ...

18 Chapitre 1. Mélanges onvolutifs : état de l'artPour annuler la fon tion C(f,g)(i, j), ils utilisent l'algorithme adaptatifcij(n + 1) = cij(n) + µnf(yi(n))g(yj(n)) (1.18)où i 6= j, µn est le pas d'adaptation, et cij(n) est le oe� ient de séparation

cij évalué à l'instant n.Pour la séparation de mélanges onvolutifs, l'algorithme de Hérault et Jut-ten a été transposé dans le domaine fréquentiel par A. Ba k et A. Tsoi [20℄,appro he qui a ensuite été approfondie dans [111℄. H. L. Nguyen-Thi et C.Jutten [105, 139℄ ont aussi proposé un algorithme onvolutif dans le domainetemporel qui re her he l'annulation des moments roisésE {f(yi(n))g(yj(n− k))} , ∀i 6= j, ∀k = 0 . . .Q. (1.19)Leur appro he suppose d'avoir un mélange à phase minimale ayant des �ltresunités entre les sour es et observations de même indi e. Cette méthode a étéétudiée de façon approfondie par C. Servière [185℄ et une étude sur la séparationdes mélanges onvolutifs par les réseaux de type Hérault-Jutten a été faite parBerthommier et Choi [31℄.Les fon tions f et g les plus utilisées sont f(x) = x3 et g(y) = y en raisonde leur simpli ité. L'utilisation de es fon tions f et g revient à l'annulationdu moment roisé (3,1) des signaux de sortie, qui ne permet que la séparationde sour es globalement sous-gaussiennes [46℄.Pour des mélanges onvolutifs à phase minimale, N. Charkani et Y. Devilleont montré qu'en optimisant les fon tions f et g, il est possible de séparer dessour es sur-gaussiennes et sous-gaussiennes [45�47℄.La dé orrélation non-linéaire est équivalente pour ertains hoix de f et

g à d'autres ritères de séparation. Ainsi, en hoisissant dans l'équation 1.17pour fon tions f et g les deux jeux de fon tions (f = scorei, g = id) et(f = id, g = scorej), où scorek, k ∈ {i, j} est la fon tion s ore de la sour ek, la dé orrélation non-linéaire est équivalente à la maximisation de vraisem-blan e [97℄.2) Le umulant roisé d'ordre 4, Cum (yi, yj, yj, yj) est un autre ritèred'indépendan e utilisé pour la première fois par J. L. La oume et P. Ruiz [112℄puis par P. Comon [54℄. Comme le moment roisé (3,1), il est nul dans le asde deux signaux yi et yj indépendants mais au une preuve de onsistan e du ritère n'a été établie [189℄.Une appro he plus générale d'utilisation des umulants roisés est baséesur l'analyse tensorielle. Considérons le tenseur T dé�ni par

Tijkl = Cum (yi, yj, yk, yl) (1.20)T est diagonal dans le as de signaux de sortie yi, yj, yk et yl indépendants. Ladiagonalisation de e tenseur T est réalisée en pratique grâ e à l'identi� ationde matri es propres pour la transformation linéaire

Fij(M) =∑

kl

mklCum (yi, yj, yk, yl) . (1.21)

Page 36: Algorithmes temporels rapides à point fixe pour la ...

1.3. Hypothèses et ritères de séparation 19On peut montrer que les matri es propres asso iées à des omposantes indé-pendantes s'é rivent sous la forme wiwti où wi est égal à une olonne de lamatri e de mélange blan hie, et que leur valeurs propres asso iées sont leskurtosis des omposantes indépendantes.Une façon rapide d'obtenir es matri es propres est la méthode de puis-san e qui onsiste à appliquer itérativement la transformation F jusqu'à la onvergen e. On peut montrer que ette méthode est équivalente à l'algorithmeFastICA basé sur le kurtosis.Une autre méthode est basée sur la propriété suivante : si on suppose lessorties yi, yj, yk et yl indépendantes entre elles, l'image de toute matri e M sui-vant (1.21) doit être diagonale e qui permet d'e�e tuer la séparation par unediagonalisation onjointe appro hée de plusieurs matri es F(Mr) dé�nies par(1.21). L'algorithme JADE [44℄, en hoisissant pour matri es Mr les matri espropres du tenseur T [97℄, se ramène à la minimisation du ritère

JJADE =∑

(ijkl)6=(iikl)

Cum(yi, yj, yk, yl)2 (1.22)Dans [151℄ l'algorithme JADE a été appliqué dans le domaine fréquentielpour séparer des mélanges onvolutifs.Une autre méthode, FOBI [41℄, très liée à JADE, onsiste à diagonaliser lamatri e de orrélation pondérée

Γ = E{z(n)z(n)t‖z(n)‖2

}. (1.23)où z(n) est une version blan hie et normalisée des observations. On peut mon-trer qu'une matri e réalisant ette diagonalisation est né essairement une ma-tri e de séparation. Pour que ette méthode s'applique, il faut ependant quetoutes les sour es aient des kurtosis normalisés di�érents.A. Ferréol et al. ont étendu la méthode SOBI à l'ordre 4 permettant ainsil'identi� ation de mélanges sous-déterminés (FOBIUM [77℄).1.3.2 La vraisemblan eM. Gaeta et J. L. La oume en 1990 [79℄ puis D. T. Pham et al. [162℄deux années plus tard ont introduit en séparation de sour es le ritère dumaximum de vraisemblan e qui a été largement utilisé depuis en séparationinstantanée [85, 86, 155, 159, 161℄ et onvolutive [14, 62, 137, 148, 149℄.Nous her hons i i les paramètres de mélange qui maximisent la probabilitéd'o urren e des observations. A partir de l'équation matri ielle de mélange

x(n) = As(n), (1.24)on peut exprimer la densité de probabilité du ve teur x(n) en fon tion desdensités de probabilité des sour es et du déterminant de l'inverse B de la

Page 37: Algorithmes temporels rapides à point fixe pour la ...

20 Chapitre 1. Mélanges onvolutifs : état de l'artmatri e de mélange A

px(x) = |detB|∏

i

pi(si) (1.25) e qui peut aussi être exprimé en fon tion du ve teur d'observation et deslignes bi de B parpx(x) = |detB|

i

pi(bix(n)). (1.26)Si on dispose de T é hantillons et que l'on onsidère qu'ils sont indépendants,la vraisemblan e V de l'obtention du ve teur x(n) s'é ritV =

T∏

n=1

|detB|∏

i

pi(bix(n)). (1.27)En général, on onsidère plut�t la log-Vraisemblan e dé�nie par le loga-rithme de la vraisemblan elogV =

n

i

log (pi(bix(n))) + T log|detB| (1.28) e qui donne en divisant haque terme par T et en supposant que le moyennagetemporel est égal à l'espéran e mathématique (ergodi ité)1

TlogV =

i

E {log (pi(bix(n)))}+ log|detB|

= −∑

i

H(bix(n)) + log|detB|, (1.29)où H(y(n)) est l'entropie di�érentielle du signal y(n) dé�nie parH(y(n)) = −

py(η)log (py(η)) dη. (1.30)Comme pour les ritères d'information mutuelle et de néguentropie quenous allons présenter ensuite, la di� ulté majeure du ritère de vraisemblan evient du fait que l'on ne onnaît pas la densité de probabilité des sour es etdes observations. On peut alors soit les supposer onnues à priori, soit suppo-ser qu'elles appartiennent à une famille donnée de distributions. Nous verronsplus loin que le ritère du maximum de vraisemblan e est équivalent au ri-tère d'information mutuelle et que si on suppose que le déterminant de B estrendu onstant par une dé orrélation et une normalisation des observations,la vraisemblan e est aussi équivalente à la néguentropie (voir ritères de non-gaussianité).J. F. Cardoso a montré [42℄ que la maximisation de vraisemblan e est équi-valente à la maximisation de l'entropie de g(y) où g1 . . . gN réalisent l'approxi-mation des fon tions de répartition des sour es. Cette appro he appelée Info-max a été utilisée [13,23,231℄ pour la séparation de mélanges linéaires instanta-nés et pour la séparation des mélanges onvolutifs [115,173,192,210,211,225℄.

Page 38: Algorithmes temporels rapides à point fixe pour la ...

1.3. Hypothèses et ritères de séparation 211.3.3 L'information mutuellePour des signaux indépendants, la densité de probabilité onjointe est égaleau produit des densités marginales. L'information mutuelle est un ritère quimesure la similitude entre la densité onjointe et le produit des densités mar-ginales.On peut mesurer la similitude entre p(y) et ∏i pi(yi) en al ulant leurdivergen e de Kullba k-Leibler dé�nie parI(y1, · · · , yN) = divK

(

p(y),∏

i

pi(yi)

)

=

y

p(y)log

(p(y)

i pi(yi)

)

dy (1.31)Comme l'argument du logarithme dans (1.31) vaut 1 partout si et seule-ment si la densité de probabilité mutuelle est égale presque partout au produitdes densités marginales, l'information mutuelle est nulle uniquement pour desvariables yi indépendantes [43℄.La divergen e de Kullba k-Leibler de la densité onjointe et du produit desdensités marginales du signal y est égale à la di�éren e entre la somme desentropies di�érentielles des variables marginales yi et l'entropie di�érentielledu ve teur y :I(y1, · · · , yN) =

i

H(yi)−H(y) (1.32)Si ette information mutuelle est nulle, les variables ne portent au uneinformation ommune.Sa hant que pour une transformation linéaire y = Bx

H(y) = H(x) + log|detB|, (1.33)on obtientI(y1, · · · , yN) =

i

H(yi)−H(x)− log|detB|. (1.34)Comme H(x) est onstante par rapport à la matri e de séparation B à estimer,la omparaison de (1.29) et (1.34) donneI(y1, · · · , yN) = −

1

TlogV + Cte. (1.35)L'information mutuelle I est don égale à une onstante près à l'opposé du ritère de log-Vraisemblan e.Le ritère d'information mutuelle a été introduit pour la première fois enACI par P. Comon [57℄ puis par K. Matsuoka et M. Kawamoto [130℄ pour laséparation de mélanges linéaires instantanés. Ce ritère a ensuite donné lieu àde nombreux travaux, en parti ulier de D. T. Pham [154,156℄.

Page 39: Algorithmes temporels rapides à point fixe pour la ...

22 Chapitre 1. Mélanges onvolutifs : état de l'artOn peut iter aussi les travaux de K. E. Hild, D. Erdogmus et al. [75,91,92℄ainsi que de S. Samadi, M. Babaie-Zadeh, C. Jutten et K. Nayebi [19, 181℄.Pour la séparation de mélanges onvolutifs, l'information mutuelle a étépeu utilisée. On peut iter toutefois quelques appro hes temporelles [93, 124,153, 157, 174℄ et l'appro he fréquentielle de D.T. Pham [158℄.1.3.4 La non-gaussianitéUn autre ritère très utilisé en séparation de sour es est la non-gaussianité.Ce ritère est fondamental en parti ulier dans le as de sour es blan hes sta-tionnaires puisque la non-gaussianité des sour es est alors né essaire pourpouvoir e�e tuer la séparation. En e�et, les signaux résultant d'un mélangeorthogonal de signaux gaussiens indépendants sont aussi indépendants e quiinterdit toute possibilité d'identi� ation par un ritère d'indépendan e. La sé-paration de sour es par maximisation de la non-gaussianité est basée sur unphénomène très intuitif : une ombinaison linéaire de signaux non-gaussiensde même distribution est davantage gaussienne que les signaux d'origine, lagaussianité d'un signal étant dé�nie omme l'é art de la distribution de e si-gnal par rapport à la distribution d'un signal gaussien de même puissan e. Onpeut don séparer les sour es d'un mélange linéaire instantané en maximisantla non-gaussianité du signal de sortie obtenu par une ombinaison linéaire desobservations.Le premier ritère pour évaluer la non-gaussianité fut historiquement l'au-to umulant d'ordre 4 ou kurtosis (non-normalisé) [61℄ qui a été utilisé aupa-ravant en dé onvolution aveugle de sour es en faisant en sorte que le signal desortie soit de puissan e unité. Il est dé�ni pour des signaux entrés à partirdes moments d'ordres 2 et 4 par l'équation :cum

(y(n), y(n), y(n), y(n)

)= E

{y4(n)

}− 3E

{y2(n)

}2 (1.36)Nous avons représenté en haut de la �gure 1.5 le kurtosis non-normalisé d'une ombinaison linéaire y(n) = as1(n) + bs2(n) de deux signaux s1(n) et s2(n)de puissan e unité et de kurtosis non-normalisés valant respe tivement −1 et2. Nous voyons que les extremums lo aux du kurtosis de y(n) sur le bordde la surfa e dé�nie par l'équation a2 + b2 = 1 sont les 4 points (a, b) ∈{(−1, 0), (0,−1), (1, 0), (0, 1)} qui orrespondent aux points séparants du er leunité.L'in onvénient majeur du kurtosis est que son estimation est très sensibleaux valeurs extrêmes ar le moment d'ordre 4 est alors mal estimé. On uti-lise don prioritairement e ritère pour des sour es sous-gaussiennes où les"outliers" sont peu présents.Une famille de ritères plus ré ente et qui évite e problème est basée surl'entropie di�érentielle dé�nie par (1.30).Un résultat fondamental de théorie de l'information établit que parmitoutes les distributions, la distribution gaussienne est elle qui a la plus grande

Page 40: Algorithmes temporels rapides à point fixe pour la ...

1.3. Hypothèses et ritères de séparation 23

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

1−1

−0.5

0

0.5

1

1.5

2

kurtosis non-normalise de

ab

y(n) = as1(n) + bs2(n)

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

1−1

−0.5

0

0.5

1

1.5

2

kurtosis normalise de

ab

y(n) = as1(n) + bs2(n)

Fig. 1.5 � Kurtosis non-normalisé (en haut) et kurtosis normalisé (en bas) dela ombinaison linéaire y(n) = as1(n) + bs2(n) de deux signaux s1(n) et s2(n)de puissan e unité et de kurtosis non-normalisés (ou normalisés) valant -1 et 2.-Abs isses et ordonnées : oe� ients a et b de la ombinaison linéaire.-Hauteur : valeur du kurtosis.

Page 41: Algorithmes temporels rapides à point fixe pour la ...

24 Chapitre 1. Mélanges onvolutifs : état de l'artentropie et peut don être onsidérée omme la plus aléatoire. Au ontraire,à varian e égale, les distributions très stru turées (très plates ou très piquées)auront une entropie faible. Un ritère de non-gaussianité peut don être ob-tenu en omparant l'entropie du signal de sortie normalisé y(t) ave l'entropied'une variable gaussienne ygauss(t) de puissan e unité. On nomme néguentropie e ritère dé�ni parneg(y(n)) = H(ygauss(n))−H(y(n)) (1.37)où H(y(n)) est l'entropie di�érentielle de y(n) dé�nie par (1.30). En onsi-dérant l'équation (1.29) on montre [97℄ que si le déterminant de B est rendu onstant par une dé orrélation et une normalisation des observations (B estalors orthogonale), la maximisation de la vraisemblan e et don la minimisa-tion de l'information mutuelle (1.29) sont équivalentes à la maximisation de lasomme des néguentropies des signaux de sortie. Cependant es ritères ne sontpas parfaitement équivalents ar dans le as de la néguentropie, que l'on peutdé�nir pour une unique sortie, il est possible d'extraire les sour es une à une, e qui est impossible pour la log-Vraisemblan e ou l'information mutuelle.La di� ulté de e ritère vient du fait qu'il est di� ilement estimable,faisant intervenir les densités de probabilité des sour es (estimées en pratiqueà partir des densités de probabilité des observations) in onnues à priori. Onutilise don en général une approximation dé�nie à partir d'une fon tion Gnon quadratique [95℄ :

neg(y(n)) ≈

(

E

{

G(ygauss(n)

)}

−E

{

G(y(n)

)})2 (1.38)Les méthodes basées sur l'optimisation de la non-gaussianité demandentune normalisation, soit du ritère, soit du signal extrait. En e�et le kurtosispar exemple augmente ave le fa teur d'é helle que l'on applique devant unsignal. Pour pallier e problème on peut normaliser le ritère du kurtosis etdé�nir le kurtosis normalisé par

kurtnory (n) =

kurty(n)

(E {y2(n)})2 . (1.39)Nous avons représenté sur la �gure 1.5 en bas le kurtosis normalisé d'une om-binaison linéaire y(n) = as1(n) + bs2(n) de deux signaux s1(n) et s2(n) depuissan e unité et de kurtosis non-normalisés (ou normalisés) valant respe ti-vement −1 et 2. Les extremums lo aux du kurtosis normalisé orrespondentaux droites (a, 0) et (0, b) où a, b ∈ [−1, 1]\0. Ce kurtosis normalisé, ontraire-ment au kurtosis standard, est indépendant du fa teur d'é helle.On peut aussi imposer au signal extrait d'être de norme unité. Le pro édéutilisé onsiste alors à dé orréler et à normaliser les observations a�n que lanormalisation de la sortie y(n) puisse s'e�e tuer en normalisant simplement leve teur d'extra tion de sour e appliqué au ve teur d'observations dé orrélé etnormalisé.

Page 42: Algorithmes temporels rapides à point fixe pour la ...

1.3. Hypothèses et ritères de séparation 25La non-gaussianité a été utilisée pour la séparation de mélanges linéairesinstantanés par P. Comon qui a proposé omme ritère la somme des valeurs au arré des kurtosis des signaux de sortie ainsi qu'un algorithme pour l'optimiser(COM2 [55�57℄). E. Moreau et O. Ma hi ont ensuite proposé omme ritèrela somme des kurtosis des sorties [136℄, ritère qui ne permet la séparation quedans le as où les kurtosis des sour es sont de même signe. P. Comon et E.Moreau ont par la suite donné une solution analytique à l'optimisation de e ritère (COM1 [59℄).N. Delfosse et P. Loubaton [61℄ ont ensuite proposé un algorithme à dé-�ation qui estime itérativement haque sour e en optimisant la valeur absolueou le arré du kurtosis d'une unique sortie. Hyvärinen et Oja ont par la suitedéveloppé une famille d'algorithmes de type point-�xe appelée FastICA utili-sant au hoix le kurtosis ou la néguentropie [96, 98℄ pour estimer les sour essoit simultanément par une appro he symétrique, soit itérativement par uneappro he à dé�ation.La non-gaussianité a aussi été largement utilisée pour la séparation demélanges onvolutifs, majoritairement en utilisant le ritère du kurtosis, non-normalisé [122, 141, 190℄ ou normalisé [40, 191, 212�214℄. En raison du nombrede oe� ients de �ltres d'extra tion à estimer, les algorithmes d'optimisationproposés pour es méthodes sont très lents en général, même en remplaçantl'algorithme à gradient par un algorithme de Newton [6℄.Notons aussi l'existen e de méthodes fréquentielles qui, grâ e à l'utilisationde la transformée de Fourier à ourt terme, reformulent le mélange de manièrelinéaire instantanée [110, 165℄. Nous verrons dans la pro haine se tion que etype d'appro he présente de nombreux in onvénients.L'obje tif de la première partie de ette thèse a été de développer un algo-rithme temporel rapide à point �xe onvolutif utilisant au hoix le kurtosis oula néguentropie suivant le type de sour es à séparer.1.3.5 Statistiques roisées du se ond ordreCe type de ritère exige d'autres hypothèses que elles évoquées en débutde hapitre. Les hypothèses 4 et 5 sont en e�et rempla ées par l'hypothèse denon- orrélation alliée aux hypothèses de oloration ou de non-stationnarité dessour es. Nous savons que la dé orrélation de signaux de sortie entre eux n'esten général pas su�sante pour e�e tuer la séparation de sour es [97℄. En e�et,si on multiplie le ve teur sour e par une matri e orthogonale quel onque (uni-taire dans la as omplexe), le ve teur résultant est aussi omposé de signauxdé orrélés mais non séparés.On peut ependant e�e tuer la séparation en supposant une des deux hy-pothèses suivantes :1) Si on suppose que les sour es sont olorées, il est possible de séparerles sour es grâ e à l'annulation de l'inter orrélation des signaux de sortie plus

Page 43: Algorithmes temporels rapides à point fixe pour la ...

26 Chapitre 1. Mélanges onvolutifs : état de l'artou moins dé alés entre eux :E {yi(n)yj(n− τ)} = 0, ∀i 6= j, ∀τ ∈ T (1.40)où T est un ensemble de valeurs entières.Ce ritère n'est pas appli able aux sour es blan hes puisque dans e as,

E {si(n)si(n− τ)} est nul quelle que soit la valeur de τ non nulle et don E {y(n)y(n− τ)t} = GE {s(n)s(n− τ)t}Gt = 0 quelle que soit la matri e deperforman esG dé�nie par le produit des matri es de mélange et de séparation.Les méthodes utilisant e ritère de séparation her hent en pratique àdiagonaliser simultanément les matri es

Cxτ = E

{x(n)x(n− τ)t

} (1.41) orrespondant à plusieurs valeurs de τ .Dans le as de AMUSE [207,208℄, on her he à diagonaliser onjointementCx

0 et Cxτ où τ 6= 0. Pour ela, l'algorithme AMUSE réalise d'abord un blan- himent des observations qui donne un nouveau ve teur d'observations z(n)véri�ant Cz

0 = I, puis diagonalise la matri e Czτ . Une version de AMUSE pourmélanges onvolutifs a été proposée [198℄.L'algorithme SOBI développé par Belou hrani et al. [24℄ her he lui à diago-naliser de façon appro hée Cx

0 et plusieurs matri es Cxτ . Comme pour AMUSE,une étape de blan himent pré ède la diagonalisation onjointe des matri es Cz

τ .Une version onvolutive temporelle de SOBI [37℄ ainsi qu'une version temps-fréquen e [25℄ ont été proposées par la même équipe.2) On peut aussi supposer que les sour es étudiées sont non-stationnaires[131,160,163,164,184,220,224℄, en travaillant éventuellement dans le domainefréquentiel.Les statistiques qui varient dans le temps fournissent alors de l'informationsupplémentaire. Dans e as, la dé orrélation des sour es entre elles à plusieursinstants n permet d'e�e tuer la séparation :E {yi(n)yj(n)} = 0, ∀i 6= j, ∀n (1.42)En e�et, en raison de la non-stationnarité à l'ordre 2 la ovarian e de y(n)dépend de l'instant n e qui engendre de nouvelles ontraintes par rapport aublan himent et permet même la séparation de sour es gaussiennes. Ce ritère(1.42) (éventuellement transposé dans le domaine fréquentiel) a été étendu au as onvolutif dans le adre de méthodes temporelles [38, 107, 108℄ et surtoutfréquentielles [38, 146, 147, 163, 164, 170�172℄.1.3.6 La par imonieL'utilisation de la par imonie des sour es est très populaire a tuellement enséparation aveugle de sour es (on parle de Sparse Component Analysis) [84℄. En

Page 44: Algorithmes temporels rapides à point fixe pour la ...

1.3. Hypothèses et ritères de séparation 27général, les observations sont transposées dans une représentation améliorant le ara tère par imonieux des sour es, .-à-d. leur nullité dans ertaines zones dela représentation, et permettant don une meilleure estimation des paramètresde mélange (on peut iter l'analyse temps-fréquen e, l'analyse temps-é helleet l'analyse multi-résolution). Contrairement à beau oup d'autres appro hes,elle permet l'estimation de sour es gaussiennes et/ou orrélées ainsi que laséparation des mélanges sous-déterminés.On distingue trois types d'appro hes tirant parti de la par imonie dessour es :1) Une méthode onsiste à identi�er séparément les olonnes de la ma-tri e de mélange grâ e à des te hniques de lustering appliquées au nuage depoints des observations pour estimer la matri e de mélange [35,36,94,119,120℄.Plusieurs te hniques de lustering peuvent être employées [228℄ pour identi�erles ve teurs olonnes (K-means [132℄, K-medians [200℄, C-means [228℄). Uneméthode de e type pour mélanges linéaires à atténuations et retards a étéproposée par P. Bo�ll [33℄.2) Une autre méthode suppose l'orthogonalité disjointe des sour es quiest une hypothèse relativement restri tive sur les sour es. Elle suppose ene�et que dans haque ase du plan temps-fréquen e, une seule sour e soita tive. On peut alors en al ulant des rapports d'observations identi�er les pa-ramètres d'amplitude et de phase de la matri e de mélange puis re onstituerles sour es à l'aide de masques temps-fréquen e binaires. L'algorithme DUETutilise e prin ipe et permet la séparation de mélanges linéaires à atténuationset retards [21, 22, 101, 175, 177�179, 229℄. Des versions onvolutives de DUETont été développées [32, 133, 134℄. Notons l'existen e d'appro hes similaires àDUET, par exemple l'utilisation par C. Choi [49℄ de l'algorithme de lusteringK-means et l'utilisation de la "basis pursuit" basée sur la norme ℓq par R.Saab [180℄. Ré emment, une appro he de type sous-espa e a été proposée parAissa-El-Bey et al., qui permet la re onstru tion des sour es lorsque le nombrede sour es a tives à haque point temps-fréquen e est stri tement inférieurau nombre d'observations [17,18℄. Une appro he bayésienne de DUET a aussiété étudiée pour e as où plusieurs sour es sont a tives dans une même zonetemps-fréquen e [128, 129℄.3) D'autres méthodes prennent elles en ompte la similitude des observa-tions entre elles pour e�e tuer l'estimation de la matri e de mélange dans deszones privilégiées du plan temps-fréquen e où une seule sour e est a tive. L'al-gorithme TIFROM [7,9,195℄ estime ette similitude en al ulant des varian esde rapports d'observations dans le plan temps-fréquen e (n, ω) :JTIFROM = V ar

{Xi(n, ω)

Xj(n, ω)

} (1.43)Si ette varian e est faible dans une zone du plan temps-fréquen e, on peut

Page 45: Algorithmes temporels rapides à point fixe pour la ...

28 Chapitre 1. Mélanges onvolutifs : état de l'artmontrer que la zone en question est mono-sour e e qui permet l'identi� ationd'une olonne de la matri e de mélange par moyennage de rapports d'observa-tions. Une version améliorée de et algorithme a été développée spé i�quementpour les mélanges à atténuations et retards [166, 168℄.L'algorithme TIFCORR [66, 71, 196℄ utilise le oe� ient de orrélation4entre 2 observations dans le plan temps-fréquen e :JTIFCORR =

|Rxixj(n, ω)|2

Rxixi(n, ω)Rxjxj

(n, ω), (1.44)où, si n1 · · ·nL sont les instants de la fenêtre temporelle d'indi e n,

Rxixj(n, ω) =

1

L

L∑

p=1

xi(np, ω)x∗j(np, ω). (1.45)Si le module de JTIFCORR est pro he de 1 dans une zone temps fréquen e, lesdeux observations ontiennent majoritairement une sour e dans ette zone, equi permet là en ore d'identi�er une olonne de la matri e de mélange. Chaque oe� ient de mélange est ette fois estimé en al ulant le rapport entre l'in-ter orrélation de deux observations et l'auto orrélation de l'une d'elles. Uneversion de TIFCORR utilisant un lustering de type médiane (K-medians)pour l'identi� ation de la matri e de mélange a été proposée [169℄ ainsi qu'uneversion pour mélanges à atténuations et retards [167℄.TIFCOHERE [10, 11℄ utilise une fon tion statistique appelée fon tion de ohéren e dé�nie par le rapport entre le module au arré de la densité inter-spe trale de puissan e et le produit des densités (auto-)spe trales de puissan esegmentées temporellement.

JTIFCOHERE =|Sxixj

(n, ω)|2

Sxixi(n, ω)Sxjxj

(n, ω)(1.46)Là en ore, une valeur de JTIFCOHERE élevée (pro he de 1), indique que l'on aune zone mono-sour e permettant l'identi� ation d'une olonne de la matri ede mélange. TIFCOHERE identi�e ensuite haque oe� ient de mélange parle al ul du rapport entre la densité interspe trale de puissan e de deux obser-vations et la densité autospe trale de l'une d'elles. Une version à atténuationset retards a aussi été proposée [10℄ ainsi qu'une version onvolutive [12℄.Notons que es trois algorithmes TIFROM, TIFCORR et TIFCOHEREsont transposables à d'autres domaines d'analyse que le domaine temps-fréquen e.Une version temps-é helle de TIFCORR a ainsi été proposée [68℄ ré emment.4Les auteurs ont proposé deux versions de TIFCORR ; l'une entre les observations dansla fenêtre d'analyse au préalable, et l'autre non. Nous ne présentons i i que la version non entrée.

Page 46: Algorithmes temporels rapides à point fixe pour la ...

1.3. Hypothèses et ritères de séparation 29M. Xiao, S. Xie et Y. Fu ont proposé une méthode de déte tion des zonesmono-sour es basée sur une normalisation du ve teur d'observation à haqueinstant et sur la dérivation temporelle de e nouveau ve teur. Si la dérivée duve teur normalisé est pro he de 0 dans une zone du domaine d'analyse, elaindique qu'une seule sour e est présente dans ette zone et que l'on peut yidenti�er une olonne de la matri e de mélange (par une appro he de type lustering ou par le al ul de rapports d'observations) [226℄.1.3.7 La positivitéLa positivité (ou non-négativité), appli able lorsque les matri es des é han-tillons des sour es et de mélange sont à oe� ients réels positifs ou nuls onduità une te hnique ré ente de séparation aveugle de sour es développée dans lemilieu des années 90 [1, 2, 15, 113, 114, 145℄.La fa torisation en matri es non-négatives (NMF : Non-negative MatrixFa torization en anglais) onsiste à dé omposer la matri e des observations Xde dimension P × T , P et T étant respe tivement les nombres d'observationset d'é hantillons, sous la formeX = WH (1.47)et sous ontrainte de positivité des oe� ients des matri es W et H, identi�éesrespe tivement omme les matri es de mélange et de sour es.La fa torisation en matri es non-négatives n'est en général pas unique.Toute matri e B inversible permet en e�et de réé rire l'équation (1.47) sous laforme :

X = WB−1BH (1.48)Si les matri es W1 = WB−1 et H1 = BH sont aussi à oe� ients positifs ounuls, on dé�nit ainsi une nouvelle fa torisation NMF de X. Dans le as le plussimple, B s'é rit sous la forme P∆ où ∆ est une matri e diagonale positive onstituée de fa teurs d'é helle et P est une matri e de permutation.Il existe plusieurs types de NMF qui di�èrent par la mesure de distan eutilisée pour évaluer l'é art entre X et WH, et éventuellement par le type derégularisation employée. Deux distan es relativement simples ont été proposéespar Lee et Seung : la norme de Frobenius de la di�éren e X−WH, dé�nie par‖X−WH‖2F =

ij

(Xij − (WH)ij)2 (1.49)et la divergen e entre X et WH dé�nie par

D(X |WH) =∑

ij

(Xijlog(Xij

(WH)ij−Xij + (WH)ij). (1.50)En adaptant les oe� ients de W et H de façon itérative [113, 114℄, es deux ritères donnent deux algorithmes de NMF di�érents. Les deux mises à jour

Page 47: Algorithmes temporels rapides à point fixe pour la ...

30 Chapitre 1. Mélanges onvolutifs : état de l'artproposées par Lee et Seung pour es ritères basés sur la norme de Frobenius(1.49) et sur la divergen e (1.50) sont respe tivement

Haµ ← Haµ(W tX)aµ

(W tWH)aµ

Wia ← Wia(XH t)ia

(WHH t)ia

(1.51)et

Haµ ← Haµ

i WiaXiµ/(WH)iµ∑

k Wka

Wia ← Wia

µ HaµXiµ/(WH)iµ∑

ν Waν

(1.52)En interprétant les sour es omme des spe tres de puissan e à séparer et enadaptant les équations de Lee et Seung (1.51-1.52), des extensions onvolutivesde la NMF ont été proposées ré emment [193, 194, 219℄.1.4 Classi� ation des méthodes de SAS onvo-lutivesOn distingue deux grandes lasses de méthodes pour la séparation de mé-langes onvolutifs : les méthodes fréquentielles qui utilisent la transformée deFourier pour se ramener à un problème de séparation aveugle de sour es ins-tantanée et les méthodes temporelles qui e�e tuent la séparation au moyen de�ltres dits d'extra tion estimés dans le domaine temporel. Dans ette se tion,nous présentons les prin ipes et les limitations respe tives de es deux typesd'appro he5.1.4.1 Les méthodes fréquentiellesLes méthodes fréquentielles [125℄ simpli�ent le modèle de mélange onvolu-tif en utilisant la transformée de Fourier. La relation de onvolution (1.2) dansle domaine temporel devient dans le domaine fréquentielx(f) = A(f)s(f) (1.53)En pratique, on utilise la transformée de Fourier à ourt terme [7, 71, 99, 135,146,147,163,164,170�172,182,183,192,229℄, pour obtenir plusieurs é hantillonspar fréquen e mais aussi pour tirer parti de la variabilité temporelle des signauxsour es, par exemple leur non-stationnarité [146,147,163,164,170�172℄ ou leur5Le tableau 1.2 en �n de se tion ré apitule les avantages et in onvénients des deux typesde méthodes.

Page 48: Algorithmes temporels rapides à point fixe pour la ...

1.4. Classi� ation des méthodes de SAS onvolutives 31par imonie dans le adre d'appro hes déterministes [7,71,229℄ (on montre quela transformée de Fourier à ourt terme est optimale pour les signaux de parole[176℄). On obtient alors l'équation de mélange suivante :x(f, t) = A(f)s(f, t) (1.54)Par es méthodes fréquentielles, on obtient don pour haque fréquen e un mé-lange linéaire instantané omplexe que l'on peut séparer en utilisant les mêmes ritères qu'en séparation de sour es instantanée. Ces méthodes fréquentiellesprésentent ependant trois di� ultés majeures :� Les indéterminations d'é helle et de permutation propres à la séparationde sour es font qu'un ve teur sour e obtenu pour une fréquen e donnéepeut être pondéré et ordonné de façon di�érente de elui obtenu à uneautre fréquen e. La re onstru tion des signaux dans le domaine temporelné essite de orriger et e�et.� En utilisant la transformée de Fourier à ourt terme, on obtient beau oupmoins de points pour haque fréquen e, e qui rend di� ile l'estimationdes statistiques [16℄. Pour ertains algorithmes en e�et, il est né essaireque la taille de fenêtre utilisée par la transformée de Fourier à ourt termesoit beau oup plus grande que l'ordre des �ltres de mélange, e qui en-gendre un faible nombre d'é hantillons par fréquen e. Une méthode quipallie e problème a été proposée par C. Servière [186℄.� Un autre problème vient du fait que l'équation (1.53) n'est parfaite-ment valide que si le mélange est modélisé en utilisant l'opérateur de onvolution ir ulaire alors que le mélange réel réalise une onvolutionlinéaire. Ce problème a été étudié par plusieurs auteurs qui ont mon-tré [16, 147℄ que l'approximation n'est a eptable que si la longueur desfenêtres temporelles est su�samment grande par rapport à l'ordre des�ltres de mélange (plus grande d'un fa teur 2 au moins).Notons que le problème des permutations évoqué plus haut peut être évitési une unique sour e a tive dans un intervalle de temps permet d'estimer lesparamètres de mélange de ette sour e pour toutes les fréquen es [10, 12℄.Un algorithme fréquentiel de type point �xe dire tement adapté de FastICAa été développé par R. Prasad et al. [165℄ pour la séparation de mélanges onvolutifs de signaux de parole.Dans la première partie de ette thèse, nous onsidérons les mélanges designaux stationnaires et her hons à éviter le problème des indéterminationsd'é helle et de permutation bande à bande en introduisant pour ela une mé-thode temporelle.

Page 49: Algorithmes temporels rapides à point fixe pour la ...

32 Chapitre 1. Mélanges onvolutifs : état de l'art1.4.2 Les méthodes temporellesLes méthodes temporelles à stru ture dire te her hent à estimer une sour eou une de ses ontributions à l'aide d'une ombinaison onvolutive des signauxd'observations :y(n) =

P∑

k=1

hk(n) ∗ xk(n). (1.55)Par rapport à la séparation de mélanges linéaires instantanés, on a don rempla é l'estimation d'un ve teur d'extra tion omposé de s alaires par l'es-timation d'un ve teur de P réponses impulsionnelles de �ltres hk(n) asso iésaux P observations. L'estimation est don rendue plus di� ile en raison dugrand nombre d'in onnues, en parti ulier si l'ordre élevé du mélange imposede hoisir des �ltres d'extra tion hk(n) d'ordre élevé.La séparation onvolutive de sour es dans le domaine temporel est très liéeaux problèmes de dé onvolution aveugle [72,100,187,188,221℄, la dé onvolution her hant à estimer à l'aide d'un �ltre une sour e unique i.i.d. ayant subi un�ltrage par le milieu de propagation.De plus, historiquement, un des premiers ritères de séparation de sour es(pour mélanges instantanés), l'auto umulant d'ordre 4 ou kurtosis fut introduitpar Wiggins en 1978 pour la dé onvolution aveugle de sour es sismiques [221℄.Il s'est inspiré du théorème de la limite entrale et du fait qu'une ombinaisonlinéaire de sour es aléatoires indépendantes non-gaussiennes de même distribu-tion est davantage gaussienne que les sour es d'origine. Le ritère qu'il proposepour mesurer ette non-gaussianité, le kurtosis normalisé (1.39), est maximumen valeur absolue lorsque le �ltre appliqué à l'observation restitue le signal i.i.d.à l'entrée du anal de propagation (le �ltre de dé onvolution est alors égal àl'inverse du �ltre du anal, à un retard et un fa teur multipli atif omplexeprès).De la même façon, N. Delfosse et P. Loubaton ont montré [61℄ en sépa-ration de mélanges linéaires instantanés que la valeur absolue ou le arré dukurtosis (non-normalisé) du signal de sortie normalisé est maximisée lorsqueles oe� ients d'extra tion utilisés orrespondent à un fa teur près à une lignede l'inverse de la matri e de mélange.Ce lien entre séparation de sour es et dé onvolution a induit des méthodestemporelles [212�214℄, dédiées aux mélanges onvolutifs et utilisant le ritèredu kurtosis normalisé. Cependant, les méthodes proposées étaient lentes du faitdu nombre important de paramètres à estimer et de l'utilisation d'algorithmesde type gradient pour optimiser le ritère. Un autre algorithme d'optimisation,utilisé par F. Abrard et Y. Deville [6, 8℄ et basé lui sur l'algorithme de New-ton, est plus rapide mais reste très lent lorsque l'ordre hoisi pour les �ltresd'extra tion est élevé. D'autre part, la onsistan e du ritère de séparation n'aété prouvée que pour des �ltres d'extra tion in�nis ou pour des �ltres d'ordre

Page 50: Algorithmes temporels rapides à point fixe pour la ...

1.5. Con lusion 33�ni dans des as parti uliers (pour des �ltres de mélange AR par exemple). S.Douglas et al. [73, 74℄ ont proposé en parallèle à nous un algorithme de typepoint �xe pour mélanges onvolutifs fon tionnant dans le domaine temporel.L'arti le ne donne pas de preuve de onvergen e et dé rit une pro édure deblan himent spatio-temporelle itérative dont la rapidité n'est pas étudiée. Deplus ses performan es n'ont pas été omparées à d'autres algorithmes onvolu-tifs utilisant les mêmes hypothèses de stationnarité et de non-gaussianité dessour es omme l'algorithme de Tugnait [212℄ par exemple.1.5 Con lusionDans e hapitre, nous avons présenté un état de l'art de la séparationaveugle de sour es. Après avoir répertorié les grands types de ritères exis-tant pour la séparation aveugle de mélanges linéaires instantanés et onvolu-tifs, nous avons lassé les algorithmes onvolutifs en deux grandes atégories.Les méthodes fréquentielles, qui utilisent la transformée de Fourier pour re-formuler les mélanges sous forme linéaire instantanée, sou�rent à haque fré-quen e des indéterminations d'é helle et de permutation bande à bande. Lesméthodes temporelles demandent elles l'estimation de �ltres dits d'extra tion ontenant un grand nombre de oe� ients à estimer, e qui fait que es mé-thodes sont lentes et moins utilisées en pratique que les méthodes fréquentiellesbien qu'elles n'imposent pas de résoudre les indéterminations d'é helle et depermutation bande à bande. Nous proposons dans la suite de ette partie unalgorithme temporel de type point �xe pour mélanges onvolutifs permettantla séparation rapide de mélanges onvolutifs RIF.

Page 51: Algorithmes temporels rapides à point fixe pour la ...

34 Chapitre 1. Mélanges onvolutifs : état de l'artMéthodes temporelles Méthodes fréquentiellesAvantages In onvénients Avantages In onvénients

• L'hypothèse d'in-dépendan e estmieux véri�ée dansle domaine temporel. • Les performan essont dégradées ena oustique dans unenvironnement àforte réverbération. • Les mélanges onvolutifs sonttransformés en mé-langes instantanés à haque fréquen e. • A haque fré-quen e, il y a uneambiguïté d'é helleet de permutationqui doit être résolue.• La onvergen evers le point optimalest plus pré ise. • Grâ e à la FFT, les al uls sont simpli�éspar rapport à une im-plémentation dans ledomaine temporel. • L'utilisation de latransformée de Fou-rier à ourt termeréduit le nombred'é hantillons à haque fréquen e.

• Lorsque l'on apeu d'é hantillonsà haque fréquen e,l'indépendan e estmal estimée enpratique.• La modélisa-tion sous forme de onvolution ir u-laire dégrade lesperforman es deséparation.Tab. 1.2 � Tableau ré apitulatif des avantages et in onvénients respe tifs desméthodes de séparation temporelles et fréquentielles [150℄.

Page 52: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 2Extension des méthodes de SASbasées sur la non-gaussianité2.1 Introdu tionCe hapitre présente une nouvelle méthode de séparation aveugle de sour espour les mélanges onvolutifs RIF de pro essus MA. Elle onsiste en une exten-sion dans le domaine temporel de l'algorithme FastICA développé par Hyväri-nen et Oja pour les mélanges linéaires instantanés. Nous proposons d'utiliserun blan himent onvolutif non- ausal des observations ainsi qu'une initialisa-tion parti ulière des paramètres d'extra tion a�n d'employer des algorithmesd'optimisation de type point �xe, asso iés aux ritères de kurtosis ou de né-guentropie, pour estimer les pro essus d'innovation des sour es. Les ontribu-tions des sour es sur les apteurs sont ensuite estimées en utilisant un ritèrequadratique orrespondant à la puissan e de la di�éren e entre une observa-tion donnée et une version �ltrée non- ausale du pro essus d'innovation d'unesour e.2.2 Position du problèmeComme indiqué dans le hapitre pré édent, la séparation aveugle de sour e(SAS) onsiste à estimer un jeu de N sour es in onnues à l'aide de P observa-tions onstituées de mélanges de es sour es quand les paramètres de mélangesont in onnus. Notons s(n) = [s1(n), · · · , sN(n)]t le ve teur des sour es etx(n) = [x1(n), · · · , xP (n)]t le ve teur des observations. Nous onsidérons i iles mélanges onvolutifs dé�nis par un jeu de �ltres in onnus dont les réponsesimpulsionnelles sont aij(n), où i = 1, · · · , P et j = 1, · · · , N . Les relations entreles sour es et les observations peuvent être é rites dans le domaine temporelsous la forme

xi(n) =N∑

j=1

∞∑

k=−∞

aij(k)sj(n− k), ∀i = 1, · · · , P. (2.1)35

Page 53: Algorithmes temporels rapides à point fixe pour la ...

36 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianitéLa relation globale dans le domaine en Z est alorsX(z) = A(z).S(z) (2.2)où X(z) et S(z) sont respe tivement les transformées en Z de x(n) et s(n), etla matri e A(z) de dimension P ×N est omposée des fon tions de transfert

Aij(z) = Z [aij(n)] des �ltres de mélange.Dans ette partie, haque sour e sj(n) est supposée être un pro essus MAet s'exprimer dans le domaine en Z suivantSj(z) = Fj(z).Uj(z) (2.3)où Fj(z) orrespond à un �ltre RIF ausal et Uj(z) est la transformée en Zd'un pro essus uj(n) qui est le pro essus d'innovation de sj(n).En notant U(z) = [ U1(z) , · · · , UN (z) ]t, nous pouvons exprimer l'équationde mélange (2.2) suivantX(z) = H(z).U(z) (2.4)où H(z) = A(z).F(z) ave F(z) =

F1(z) 0. . .0 FN (z))

.Nous faisons les hypothèses suivantes on ernant le modèle de mélange pré-senté i-dessus :� Le pro essus u(n) = [u1(n), · · · , uN(n)]t est réel, de moyenne nulle, tem-porellement i.i.d. et spatialement indépendant, .-à-d. ses omposantes

uj(n) sont statistiquement indépendantes entre elles mais n'ont pas né- essairement la même distribution. Nous supposons qu'une omposanteau plus est gaussienne.� Les matri es de �ltres F(z), A(z) et don H(z) sont ausales, RIF et nonsingulières. Notons que les systèmes RII peuvent aussi être approximéspar des modèles équivalents RIF (d'ordre élevé).Le but de la SAS onvolutive est typiquement d'estimer les ontributionsde toutes les sour es dans haque observation, .-à-d. Aij(z).Sj(z). Dans lesméthodes à dé�ation telles que [212℄, e i est réalisé en utilisant la pro éduresuivante :1. Extraire le pro essus d'innovation uj(n) d'une sour e sj(n) à partir desobservations.2. Identi�er P �ltres de oloration et les appliquer à uj(n) pour estimer les ontributions de sj(n) dans haque observation, .-à-d. Aij(z).Sj(z).

Page 54: Algorithmes temporels rapides à point fixe pour la ...

2.3. Appro hes existantes 373. Retenir la ontribution la plus puissante6 omme sortie orrespondant àl'une des sour es.4. Soustraire les ontributions de toutes les observations pour obtenir unnouveau jeu d'observations appelées observations réduites.5. Enlever l'observation réduite la moins puissante7. Si le nombre d'observa-tions réduites subsistant est supérieur à 1, réitérer la pro édure à partirde l'étape 1.Cette pro édure est représentée sous forme de s héma-blo dans la �gure2.1.Nous onsidérons i i les méthodes de SAS dans le domaine temporel quiutilisent la non-gaussianité omme ritère pour réaliser la première étape dela pro édure i-dessus et qui sont don basées sur l'Analyse en ComposantesIndépendantes (ACI) [98℄. Dans la pro haine se tion, nous analysons les prin- ipes et les limites des méthodes existantes et nous proposons dans les se tionssuivantes une appro he pour les étendre a�n d'obtenir pour les mélanges onvo-lutifs des méthodes à onvergen e rapide basées sur le kurtosis ou la néguen-tropie. Les performan es de séparation des méthodes proposées sont présentéesdans le hapitre 3 et des on lusions sont ensuite tirées de es travaux.2.3 Appro hes existantesComme nous l'avons mentionné au hapitre 1, N. Delfosse et P. Louba-ton [61℄ ont proposé la première méthode de SAS à dé�ation fondée sur lekurtosis pour les mélanges linéaires instantanés, où les �ltres Hij(z) sont rem-pla és par des oe� ients s alaires. Cette méthode onsiste premièrement àobtenir une version spatialement blan hie et normalisée z(n) du ve teur d'ob-servation x(n), .-à-d. un jeu de ombinaisons linéaires de es observations quisont mutuellement dé orrélées à l'instant n et qui ont des varian es unitaires8.Un premier signal de sortie est ensuite obtenu par une ombinaison linéairey(n) = wtz(n) des observations dé orrélées et normalisées, où w est un ve teurnormalisé de oe� ients, séle tionné de manière à maximiser le arré (ou lavaleur absolue) du kurtosis non-normalisé de y(n) dé�ni par l'équation (1.36)pour un signal à moyenne nulle. Delfosse et Loubaton ont prouvé dans [61℄que les maxima lo aux de e ritère orrespondent aux points de séparation.Ils ont utilisé une méthode de type gradient pour maximiser e ritère. Celané essite de séle tionner onvenablement le pas d'adaptation et implique detoute façon une onvergen e lente. Hyvärinen et Oja ont résolu e problème6Nous hoisissons de retenir la ontribution la plus puissante ar 'est elle qui est lamoins perturbée par une interféren e ou un bruit de puissan e donnée.7Nous hoisissons d'enlever l'observation réduite la moins puissante ar elle est sus eptiblede ontenir des ontributions faibles des sour es restant à estimer.8L'annexe A est onsa rée à ette première étape de blan himent et de normalisation desobservations.

Page 55: Algorithmes temporels rapides à point fixe pour la ...

38 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianité

processus d’innovation extrait

Estimation des contributions du

d’une source

Suppression de l’observation

Extraction du processus d’innovation

1

reduite la moins puissante

Soustraction des

contributions

(reduction)

y1(n)

Contribution la

plus puissante

y2(n)

y3(n)

(x1(n), · · · , xP (n))t

P − 2

P − 1

P

P

P

2

(x(1)1 (n), · · · , x

(1)P−1(n))t

(x(2)1 (n), · · · , x

(2)P−2(n))t

(x(P−2)1 (n), x

(P−2)2 (n))t

yP−1(n)

x(P−1)(n) = yP (n)Fig. 2.1 � S héma-blo du pro essus de dé�ation.

Page 56: Algorithmes temporels rapides à point fixe pour la ...

2.4. Nouvelles méthodes pour extraire un pro essus d'innovation 39en introduisant un algorithme de type point �xe pour optimiser le ritère i-dessus [98℄. Brièvement, et algorithme tire parti du fait que l'on réalise uneoptimisation sous ontrainte du ritère onsidéré et met à jour itérativementle ve teur w des oe� ients de la ombinaison linéaire ave une version nor-malisée du gradient de e ritère sur la surfa e de ontrainte. Cet algorithmene omprend au un paramètre à régler (tel que le pas d'adaptation pour lesméthodes de type gradient) et sa onvergen e est très rapide.Une appro he di�érente fut proposée par J. K. Tugnait pour les mélanges onvolutifs [212℄. Elle opère dire tement sur les observations, .-à-d. sans lesblan hir ni les normaliser, mais utilise alors la valeur absolue du kurtosis nor-malisé du signal de sortie y(n) dé�ni par (1.39), omme ritère de séparation.J. K. Tugnait a prouvé que les points séparants orrespondent aux maximalo aux de e ritère quand on re ombine les observations à l'aide de �ltresd'extra tion doublement in�nis. Il a proposé d'optimiser e ritère en utilisantune appro he de type gradient, e qui entraîne là en ore une onvergen e lente.Les tests réalisés dans notre équipe [6℄ ont montré que, même en utilisant unalgorithme d'optimisation de type Newton modi�é, la onvergen e reste lente,parti ulièrement pour les �ltres d'ordre élevé.Ce hapitre a pour but de ombler le manque mis en éviden e par ethistorique, .-à-d. d'introduire des méthodes rapides à base de kurtosis ou denéguentropie pour les mélanges onvolutifs. Dans e but, nous her hons om-ment étendre aux mélanges onvolutifs l'appro he basée sur un blan himentet une optimisation de type point �xe du kurtosis non-normalisé, proposéepré édemment pour les mélanges linéaires instantanés.2.4 Nouvelles méthodes pour extraire un pro- essus d'innovationToutes les méthodes itées dans la se tion pré édente demandent une nor-malisation, ar le kurtosis non-normalisé de y(n) tend vers l'in�ni quand lapuissan e de y(n) tend vers l'in�ni. Dans l'appro he de Tugnait, 'est le ritèrequi est normalisé ar la méthode onsiste à estimer un des pro essus d'innova-tion uj(n) à un retard et à un fa teur d'é helle près en maximisant la valeurabsolue du kurtosis normalisé d'une ombinaison onvolutive des observationsdé�nie par :y(n) =

P∑

p=1

kp(n) ∗ xp(n) =

P∑

p=1

R∑

r=−R

kp(r)xp(n− r) (2.5)où kp(n), p = 1 . . . P sont P �ltres RIF non ausaux.Au ontraire, les deux appro hes linéaires instantanées mentionnées dans la

Page 57: Algorithmes temporels rapides à point fixe pour la ...

40 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianitése tion pré édente utilisent le kurtosis non-normalisé et sont basées sur unenormalisation de la puissan e de y(n) :E{y(n)2

}= 1. (2.6)Cela est fa ilement réalisé grâ e à étape de blan himent et de normalisationdes observations fournissant le ve teur z(n), qui entraîne que y(n) = wtz(n)véri�e E {y(n)2} = ‖w‖2, si bien qu'en hoisissant w tel que ‖w‖2 = 1, ongarantit que E {y(n)2} = 1. Nous étendons i i ette méthode aux mélanges onvolutifs. Dans e but, la première étape de notre appro he réalise une or-thonormalisation onvolutive des observations, dé�nie omme suit.A haque instant n, nous onsidérons le ve teur d'observations étendu dé�nipar

x(n) = [x1(n + R), · · · , x1(n−R), · · · · · · , xP (n + R), · · · , xP (n−R)]t (2.7) ontenant P = (2R +1)P éléments9. Nous en déduisons le ve teur olonne, dedimension P , z = [z1(n), · · · , zP (n)]t dé�ni parz(n) = Bx(n) (2.8)où B est une matri e P × P hoisie de telle sorte que

E {zi(n)zj(n)} = δij, ∀i, j ∈{

1, · · · , P} (2.9)où δ est le symbole de Krone ker, e qui est équivalent à

Rz(n) = I. (2.10)où Rz(n) est la matri e d'auto orrélation du ve teur signal z(n). La �gure 2.2illustre et étage de blan himent dit onvolutif.Blanchimentconvolutif

x1(n)x2(n)

xP (n)

z1(n)z2(n)

zP (n)Fig. 2.2 � S héma-blo du pro essus de blan himent onvolutif.Par rapport à x(n), l'opération (2.8) peut être onsidérée omme un blan- himent et une normalisation onventionnels, e blan himent onsistant en uneAnalyse en Composantes Prin ipales (ACP). Mais par rapport aux observa-tions d'origine xi(n), ela peut être interprété di�éremment. En e�et, les éq.(2.7) et (2.8) montrent que les signaux zi(n) sont des mélanges onvolutifs des9Certaines méthodes à sous-espa es utilisent e prin ipe d'étalement des ve teurs signaux[3�5,83, 127℄ (nous utiliserons aussi dans la suite une version étalée du ve teur sour e).

Page 58: Algorithmes temporels rapides à point fixe pour la ...

2.4. Nouvelles méthodes pour extraire un pro essus d'innovation 41observations xi(n). L'éq. (2.9) signi�e alors que les signaux zi(n) sont réésde façon à être dé orrélés et à varian e unité, e qui peut être vu omme uneorthonormalisation spatio-temporelle des observations xi(n). Notons y(n) lesignal extraity(n) = wtz(n) =

P∑

m=1

wm.zm(n). (2.11)En ombinant les dé�nitions (2.7), (2.8) et (2.11) de y(n) ave la version tem-porelle de (2.4), on montre que y(n) est une ombinaison linéaire de versionsdé alées des pro essus uk(n) .-à-d.y(n) =

P∑

m=1

wm

P∑

j=1

bmj xj(n) (2.12)=

N∑

q=1

Dmax∑

d=Dmin

vqduq(n− d) (2.13)où vqd, Dmin et Dmax sont obtenus à partir des ordres des �ltres RIF impliquésdans (2.4) et (2.5).En utilisant les propriétés du kurtosis pour des variables aléatoires indé-pendantes, nous déduisons à partir de (2.12)kurty(n) =

N∑

q=1

Dmax∑

d=Dmin

v4qdkurtuq

(n− d)

=

N∑

q=1

Dmax∑

d=Dmin

v4qdαqd, (2.14)où

αqd = kurtuq(n− d) (2.15)Cal ulons maintenant la puissan e de y(n) en tenant ompte de la linéarité del'opérateur de puissan e pour des variables indépendantes

powy(n) =N∑

q=1

Dmax∑

d=Dmin

v2qdpowuq

(n− d). (2.16)Chaque pro essus uq(n) est supposé être identiquement distribué à tous lesinstants n−d où d varie de Dmin à Dmax. Les termes powuq(n−d) dans (2.16)ne dépendent don pas de d, .-à-d. que (2.16) implique seulement un termede puissan e powuq

(n) pour haque sour e, valable quel que soit le dé alaged appliqué au pro essus uq(n). Ces puissan es peuvent en outre être remisesà l'é helle ave un fa teur positif grâ e l'indétermination d'é helle propre à la

Page 59: Algorithmes temporels rapides à point fixe pour la ...

42 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianitéSAS. Ainsi, elles peuvent être supposées égales à 1 de telle sorte que (2.16)devientpowy(n) =

N∑

q=1

Dmax∑

d=Dmin

v2qd. (2.17)Cal ulons maintenant d'une autre manière la puissan e de y(n) :

powy(n) = E{y(n)2

}

= wtRz(n)w

= ‖w‖2 (2.18)d'après (2.10), e qui entraîne grâ e à (2.17)‖w‖2 =

N∑

q=1

Dmax∑

d=Dmin

v2qd. (2.19)Imposer à w d'être sur la sphère unité ‖w‖ = 1 permet don de ontraindre defaçon simple notre ve teur {vqd, 1 ≤ q ≤ N, d ∈ [Dmin, · · · , Dmax]} à être surla sphère unité

N∑

q=1

Dmax∑

d=Dmin

v2qd = 1 (2.20)de dimension N ×D où D = Dmax −Dmin + 1.L'optimisation de la valeur absolue du kurtosis kurty(n) dé�ni par (2.14),sous la ontrainte (2.6) (réalisable par la normalisation de w) appartient don au même type de problème que l'optimisation de

f (vq, q = 1..N) =N∑

q=1

v4qαq (2.21)sous la ontrainte

N∑

q=1

v2q = 1 (2.22)ave un jeu de variables i i notées vqd, au lieu du jeu de variables vq dans le as instantané (l'indi e des retards d est absent dans le as des mélanges ins-tantanés). Le type de fon tion dé�ni dans (2.21) a été largement étudié dansle ontexte des méthodes de SAS instantanée.En appliquant les résultats de [61, 97℄, on garantit que les maxima de

|kurty(n)| sur la sphère unité orrespondent aux points tels qu'une seulementdes variables onsidérées vqd est non nulle (égale à ±1)10. L'éq. (2.12) montre10Les mélanges onvolutifs entraînent une approximation on ernant les points que l'onpeut atteindre, omme on l'expliquera dans la se tion suivante.

Page 60: Algorithmes temporels rapides à point fixe pour la ...

2.4. Nouvelles méthodes pour extraire un pro essus d'innovation 43que le signal se ompose alors seulement d'une version pondérée et dé aléeel(n) du pro essus ul(n) orrespondant.Des algorithmes performants pour réaliser une optimisation sous ontraintede la valeur absolue du kurtosis de y(n) peuvent ensuite être dire tement dé-duits des appro hes pré édentes pour les mélanges linéaires instantanés. Ene�et, la se tion suivante montre que les mélanges onvolutifs x(n) étudiéspeuvent être reformulés omme des mélanges instantanés sous ertaines ondi-tions. Nous proposons don omme extension de FastICA [98℄ l'algorithme onvolutif à point �xe et kurtosis suivant, basé sur notre ve teur modi�é w :� Initialiser w à une valeur w0, par exemple en utilisant les appro hesprésentées i-dessous.� Répéter les étapes 1) et 2) jusqu'à la onvergen e

1) w = E{z(n)(wtz(n))3

}− 3w (2.23)

2) w = w/ ‖w‖ (2.24)La valeur initiale w0 de w mentionnée pré édemment peut être séle tionnéede façon aléatoire. Une appro he améliorée peut être obtenue en tirant partidu fait qu'il existe une relation entre notre ve teur w et les oe� ients des�ltres RIF de l'appro he de Tugnait dé�nie par (2.5). En e�et, onsidérons les olonnes de notre matri e B et indiçons les omme suitB = [b−R

1 , · · · ,b+R1 , · · · ,b−R

P , · · · ,b+RP ], (2.25)en nous basant sur (2.7) et (2.8). En utilisant (2.8), le signal (2.11) extraitpar notre méthode s'é rit y(n) = wtBx(n) = wt

∑Pp=1

∑Rr=−R br

pxp(n− r). Enidenti�ant ette expression ave le signal de sortie (2.5) dans l'appro he deTugnait, nous obtenonskp(r) = wtbr

p, ∀p ∈ {1, · · · , P} , ∀r ∈ {−R, · · · , R} (2.26)et don K = wtB (2.27)où le ve teur ligne K est omposé des oe� ients des réponses impulsionnellesdes �ltres k1(n), · · · , kP (n). Cette relation nous permet d'initialiser notre ve -teur w omme dans la méthode de Tugnait, .-à-d. ave des �ltres unités

kp(n) = δ(n), de sorte que y(n) soit la somme des observations xp(n). Celarevient à prendre K = K0 dé�ni parK0 = [0, · · · , 0, 1, 0, · · · , 0

︸ ︷︷ ︸

k1

, · · · · · · , 0, · · · , 0, 1, 0, · · · , 0︸ ︷︷ ︸

kP

]t. (2.28)L'éq. (2.27) entraîne alorswt

0 = K0B−1. (2.29)

Page 61: Algorithmes temporels rapides à point fixe pour la ...

44 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianitéCette initialisation de w nous donne de meilleurs résultats expérimentauxqu'une initialisation aléatoire et est utilisée dans le hapitre 3.Pour les mélanges linéaires instantanés, au lieu d'utiliser le kurtosis, uneautre fon tion de ontraste basée sur la néguentropie a été proposée par Hyvä-rinen pour estimer la non-gaussianité [96℄. Elle a démontré sa meilleure robus-tesse et sa plus faible varian e par rapport à l'appro he fondée sur le kurtosis.En parti ulier, elle est plus robuste aux valeurs extrêmes que elle basée sur lekurtosis qui fait appel à un moment d'ordre 4, dont l'estimation est très sen-sible aux valeurs extrêmes. De plus, un algorithme à point �xe rapide et �ablea aussi été développé par Hyvärinen pour e type de fon tion. Nous étendons et algorithme aux mélanges onvolutifs de la même manière que l'appro hefondée sur le kurtosis, en utilisant la formule d'adaptation suivante à la pla ede (2.23) à haque itération :1) w = E

{z(n)g(wtz(n))

}− E

{g′(wtz(n))

}w (2.30)où g et g′ sont les dérivées première et se onde d'une fon tion non-quadratique

G utilisée pour estimer la néguentropie.L'algorithme à kurtosis proposé peut être optimisé en termes de temps de al ul né essaire pour estimer l'espéran e dans (2.23). En e�et, (2.23) né essitede al uler un produit matri e-ve teur z = Bx(n) pour haque indi e d'é han-tillon n a�n d'en déduire la somme des termes z(wtz)3 utilisée pour l'estimationde l'espéran e. En al ulant le ve teur w1 = wtB une seule fois pour l'itérationdonnée de l'algorithme et en remplaçant z par Bx dans l'équation de mise àjour (2.23), nous obtenons1) w = BE

{

x(n)(wt

1x(n))3}

− 3w (2.31)Nous al ulons ainsi seulement deux produits matri e-ve teur pour estimerl'espéran e, .-à-d. un pour w1 = wtB et un dans (2.31). Le même prin ipes'applique à l'algorithme (2.30) basé sur la néguentropie.2.5 Reformulation du mélange sous forme linéaireinstantanéeLes P observations xi(n) onsidérées s'expriment en fon tion des N pro es-sus d'innovation uj(n) suivant (2.4). Elles sont don des mélanges RIF ausauxd'ordre Q de es pro essus. Considérons maintenant le ve teur x(n) dé�nipar (2.7) et omposé d'observations dé alées. L'analyse fournie par exempledans [78℄ implique que x(n) peut être interprété omme un jeu de mélangeslinéaires instantanés de sour es qui sont i i des versions dé alées et pondérées

Page 62: Algorithmes temporels rapides à point fixe pour la ...

2.5. Reformulation du mélange sous forme linéaire instantanée 45des pro essus d'innovation uj(n). Ce mélange linaire instantané s'é rit sousforme matri iellex(n) = H u(n) (2.32)où

• x(n) est dé�ni par (2.7),• u(n) = [u1(n+R), · · · , u1(n−R−Q), · · · · · · , uN(n+R), · · · , uN(n−R−Q)]t,• H =

H11 · · · H1N... . . . ...HP1 · · · HPN

,

• ave Hij =

hij(0) · · · hij(Q) 0. . . . . .0 hij(0) · · · hij(Q)

, matri e de Toeplitz dedimension (2R + 1)× (2R + 1 + Q).On montre alors fa ilement que si

PL ≥ N(Q + L) (2.33)où L = (2R + 1) est le nombre de retards utilisés pour onstituer le ve teurd'observations étendu x(n), alors le mélange x(n) = H u(n) a au moins au-tant d'observations que de sour es et le mélange reformulé de façon linéaireinstantanée est don (sur-)déterminé.Don , si (2.33) est véri�ée, l'analyse pour les mélanges linéaires instantanésfournie dans [61℄ prouve rigoureusement que, en maximisant la valeur absoluedu kurtosis non-normalisé du signal y(n) dé�ni par (2.11) sous la ontrainte(2.6), nous extrayons une version dé alée et pondérée du pro essus d'innova-tion, αlul(n− r), dont l'estimée est notée el(n) dans la suite.Si (2.33) n'est pas véri�ée, le problème de SAS reformulé en instantané estsous-déterminé, .-à-d. qu'il implique moins d'observations que de sour es (no-tons que 'est en parti ulier le as quand P = N). Cette sous-détermination estliée à l'ordre �ni des �ltres d'extra tion équivalents appliqués aux observationspar les étages de traitement (2.7), (2.8) et (2.11). Certaines approximationssont don né essaires. Néanmoins, quand le rapport PLN(Q+L)

asso ié à (2.33)tend vers 1 ( e qui est le as quand P = N et quand L est grand), un pro- essus d'innovation pondéré et dé alé peut en ore être estimé pré isément àl'aide d'une ombinaison linéaire des observations disponibles dont la valeurabsolue du kurtosis non-normalisé est maximale sous la ontrainte (2.6). L'im-pa t en termes de SIR11, du ara tère sous-déterminé du mélange reformulé11Le rapport signal à interféren es est dé�ni par :SIR = 10 log10

(E{y(n)2

}/E{(y(n)− y(n))2

} ), où y(n) est l'estimation de y(n).

Page 63: Algorithmes temporels rapides à point fixe pour la ...

46 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianitésous forme linéaire instantanée est étudié dans la se tion qui suit.2.6 Performan es atteignables par le modèle li-néaire instantané sous-déterminéNous avons vu dans la se tion pré édente qu'un mélange onvolutif RIF ausal peut être réinterprété omme un mélange linéaire instantané omportantP = PL observations et N = N(Q + L) sour es où L est le nombre de retardsde x(n) et Q est l'ordre du modèle dé�ni par la somme des ordres de mélangeet de oloration des pro essus d'innovation. Soit w un ve teur d'extra tionde pro essus d'innovation. Redé�nissons i i e ve teur pour y in lure l'étapede blan himent réalisée grâ e à la matri e B, .-à-d. la notation w utiliséei i orrespond au produit Btw ave la notation pré édente. Supposons que eve teur extrait approximativement la sour e de u(n) d'indi e i.Considérons maintenant ∆, norme de l'é art entre le ve teur de séparationglobal wtH et le ve teur ligne bi = [0, · · · , 0

︸ ︷︷ ︸

i−1

, 1, 0, · · · , 0︸ ︷︷ ︸

N−i

] omposé d'un 1 àl'indi e i et de 0 ailleurs :∆ = ‖wtH− bi‖

= ‖Htw − bti‖. (2.34)La formule des moindres arrés [123℄ dé�nit le ve teur w optimal minimisantla valeur de ∆ :

wopt =((Ht)tHt

)−1Hbt

i

=(HHt

)−1Hbt

i (2.35)et don wt

opt = biHt(HHt

)−1. (2.36)Le ve teur de séparation global optimal est don

wtoptH = biH

t(HHt

)−1H (2.37)et est égal à la ligne i de H1 où H1 = Ht

(HHt

)−1H, de dimension P × N estle proje teur orthogonal sur (KerH

)⊥ [123℄.En appliquant la matri e H1 au ve teur sour e u(n), on obtient don unve teur signal don le ieme élément orrespond à la meilleure estimation ausens des moindres arrés du ieme signal du ve teur sour e u(n).Déterminons maintenant les performan es moyennes qui peuvent être obte-nues par e ritère des moindres arrés. Soit u′(n) l'estimation du ve teur u(n)obtenue à l'aide du proje teur H1 par la formule u′(n) = H1u(n). Sa hant queH1 est le proje teur orthogonal sur (KerH

)⊥ de dimension P , la di�éren eu(n)− u′(n) est le projeté de u(n) sur KerH qui est de dimension N − P .

Page 64: Algorithmes temporels rapides à point fixe pour la ...

2.6. Performan es atteignables par le modèle linéaire instantané sous-déterminé47Cal ulons la puissan e moyenne de l'erreur ommise pour l'estimation desN sour es :

Perrmoy =1

NE{‖u(n)− u′(n)‖2

}. (2.38)Soit une B une base orthonormée adaptée à la dé omposition orthogonale

IRN =(KerH

)⊥⊕KerH (2.39)et U la matri e unitaire de passage de la base anonique à ette base B.Notons u(n) le ve teur u(n) exprimé dans ette nouvelle base. Comme

u(n)− u′(n) est le projeté de u(n) sur KerH,u(n)− u′(n) = U[0, · · · , 0, uP+1(n), · · · , uN(n)]t. (2.40)La puissan e moyenne de l'erreur ommise dans l'estimation des N sour esvaut don

Perrmoy =1

NE{‖u(n)− u(n)′‖2

}

=1

NE{‖[0, · · · , 0, uP+1(n), · · · , uN(n)]Ut‖2

} (2.41)et omme U est unitaire,Perrmoy =

1

NE{‖[0, · · · , 0, uP+1(n), · · · , uN(n)]‖2

}

=1

NE

N∑

i=P+1

u2i (n)

=1

N

N∑

i=P+1

E{u2

i (n)}

. (2.42)Les signaux ui(n) résultant des signaux ui(n) par hangement de base or-thonormale, en supposant que les ui(n) sont de puissan e unité, les ui(n) sontaussi de puissan e unité etPerrmoy =

1

N(N − P ) (2.43)Le Rapport Signal à Interféren e (SIR : Signal to Interferen e Ratio enanglais dé�ni par le rapport entre la puissan e du signal à estimer et la puis-san e de l'erreur d'estimation) asso ié à ette puissan e moyenne de l'erreurd'estimation des sour es est alors

SIR =1

1− P /N

=1

1−PL

N(Q + L)

(2.44)

Page 65: Algorithmes temporels rapides à point fixe pour la ...

48 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianitéNotons que ette performan e moyenne est la performan e maximale moyenneobtenue grâ e à la matri e pseudo-inverse de Ht réalisant l'optimisation du ritère des moindres arrés. On ne peut pas garantir en pratique que notrealgorithme basé sur l'optimisation de la non-gaussianité permettra d'obtenir ette performan e maximale théorique. Nous ne quanti�ons don i i que ladégradation de la séparation due au ara tère sous-déterminé du modèle demélange linéaire instantané.Notons toutefois que si L est grand, P /N devient pro he de 1, e quientraîne un SIR possible élevé.2.7 Méthode globale de SAS proposéeL'étape d'extra tion de pro essus d'innovation proposée en se tion 2.3 nousdonne une estimation el(n) d'un pro essus d'innovation de sour e à un fa teurd'é helle et à un retard près, qui peut ensuite être olorée pour obtenir haque ontribution de la l ième sour e dans la k ième observation xk(n). Ce i peutêtre fait en al ulant les �ltres de oloration non ausauxCkl(z) =

R′

r=−R′

ckl(r)z−r (2.45)qui rendent les signaux ckl(n) ∗ el(n) les plus pro hes des xk(n) au sens desmoindres arrés [6℄. Nous montrons en annexe A que ela peut être réalisépar des �ltres RIF non ausaux de Wiener, dont les oe� ients de réponsesimpulsionnelles forment des ve teurs ckl dé�nis par

ckl = Rel(n)−1relxk

(n) (2.46)où Rel(n) est la matri e d'auto orrélation du signal el(n) et relxk

(n) est leve teur d'inter orrélation des signaux el(n) et xk(n). Notons que la matri ed'auto orrélation a une stru ture de Toeplitz très régulière et qu'il existe denombreuses méthodes rapides [215℄ pour résoudre l'équation matri ielle linéaire(2.46).Après avoir soustrait les ontributions ckl(n) ∗ el(n) de toutes les observa-tions, nous obtenons une autre on�guration de mélange ave N − 1 sour essi(n). La première étape doit être réitérée omme expliqué dans la se tion 2.1pour extraire le pro essus d'innovation d'une autre sour e.2.8 Con lusionDans e hapitre, nous avons introduit une nouvelle appro he pour la sé-paration dans le domaine temporel de mélanges onvolutifs de sour es. Nos al-gorithmes sont basés sur un blan himent spatio-temporel (ou onvolutif) non- ausal des observations et sur une initialisation parti ulière des paramètres

Page 66: Algorithmes temporels rapides à point fixe pour la ...

2.8. Con lusion 49d'extra tion qui permettent l'utilisation d'itérations de type point �xe pourextraire les pro essus d'innovation des sour es par l'optimisation des ritèresdu kurtosis ou de la néguentropie. La pertinen e de notre méthode est notam-ment basée sur la réinterprétation du mélange sous forme linéaire instantanée.Pour obtenir les ontributions des sour es sur les apteurs, nous utilisons un ritère quadratique orrespondant à la puissan e de la di�éren e entre une ob-servation et une version �ltrée du pro essus d'innovation extrait et proposonsd'utiliser un pro essus de Wiener non- ausal pour l'optimiser. Nous baptisonsnotre algorithme C-FICA (extension onvolutive de FastICA).

Page 67: Algorithmes temporels rapides à point fixe pour la ...

50 Chapitre 2. Extension des méthodes de SAS basées sur la non-gaussianité

Page 68: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 3Résultats expérimentaux3.1 Introdu tionDans les deux premières se tions de e hapitre, nous illustrons le fon tion-nement de notre algorithme en e�e tuant quelques simulations de séparation desour es de télé ommuni ations et de sour es audio en utilisant soit des �ltresaléatoires, soit des �ltres réels mesurés au niveau des oreilles d'une tête demannequin. Ensuite, nous e�e tuons une étude statistique des performan esde notre algorithme en termes de SIR, de temps de al ul et de résistan e aubruit. Nous omparons aussi ses performan es et sa rapidité à elles de l'algo-rithme de J. K. Tugnait travaillant ave les mêmes hypothèses de stationnaritéet de non-gaussianité des sour es.123.2 Séparation de signaux de télé ommuni ationsNous avons testé notre algorithme C-FICA en utilisant le ritère du kurtosisdans une on�guration relative aux appli ations télé oms. Les deux premièressour es utilisées sont i i deux sour es binaires mélangées à l'aide d'un jeu de�ltres RIF ausaux à 10 oe� ients générés par une loi uniforme entre 0 et 1.Les deux sour es font 50000 é hantillons ha une. Nous avons hoisi i i R = 10et R′ = 30 où R et R′ sont dé�nis respe tivement par (2.7) et (2.45).12Une page internet [201℄ est onsa rée à notre algorithme C-FICA. Elle omprend unear hive télé hargeable ontenant une implémentation sous Matlab de l'algorithme ainsi quedeux programmes de démonstration illustrant la séparation de mélanges onvolutifs de si-gnaux arti� iels et audio. 51

Page 69: Algorithmes temporels rapides à point fixe pour la ...

52 Chapitre 3. Résultats expérimentauxLa �gure 3.1 représente les deux signaux sour es utilisés sur une longueur de300 é hantillons. La �gure 3.2 représente de haut en bas les deux observationsdu mélange, les deux ontributions des sour es 1 et 2 respe tivement sur les apteurs 1 et 2 (nous avons hoisi de représenter la ontribution de plus fortepuissan e pour ha une des sour es), et les estimations de es deux ontribu-tions. Les rapports signal à interféren es (SIR : Signal to Interferen e Ratioen anglais)13 de sortie des ontributions estimées sont respe tivement 18.7 dBet 18.6 dB, et les améliorations de SIR (SIRI) de 16.8 dB et 16.9 dB.

0 50 100 150 200 250 300−1.5

−1

−0.5

0

0.5

1

1.5s1(n)

n

0 50 100 150 200 250 300−1.5

−1

−0.5

0

0.5

1

1.5s2(n)

nFig. 3.1 � Sour es utilisées 1 et 2 orrespondant à des signaux binaires.13Nous dé�nissons les mesures de performan es SIRout, SIRin et SIRI dans l'annexe C.

Page 70: Algorithmes temporels rapides à point fixe pour la ...

3.2. Séparation de signaux de télé ommuni ations 530 50 100 150 200 250 300

−10

−5

0

5

10 x1(n)

n

0 50 100 150 200 250 300−15

−10

−5

0

5

10

15x2(n)

n

0 50 100 150 200 250 300

−6

−4

−2

0

2

4

6 x21(n)

n

0 50 100 150 200 250 300

−6

−4

−2

0

2

4

6 x12(n)

n

0 50 100 150 200 250 300−6

−4

−2

0

2

4

6 x21(n)

n

0 50 100 150 200 250 300−5

0

5x12(n)

nFig. 3.2 � De haut en bas : observations 1 et 2, ontributions réelles des sour es1 et 2 respe tivement sur les apteurs 2 et 1, ontributions estimées.

Page 71: Algorithmes temporels rapides à point fixe pour la ...

54 Chapitre 3. Résultats expérimentauxLes �gures 3.3 et 3.4 représentent les résultats obtenus dans une on�gurationsimilaire à l'ex eption des sour es qui sont ette fois des sour es AM à 4 états.Les SIR de sortie des ontributions estimées sont ette fois respe tivement25.6 dB et 22.2 dB, et les améliorations de SIR (SIRI) de 19.1 dB et 24.2dB.

0 50 100 150 200 250 300

−1.5

−1

−0.5

0

0.5

1

1.5 s1(n)

n

0 50 100 150 200 250 300

−1.5

−1

−0.5

0

0.5

1

1.5 s2(n)

nFig. 3.3 � Sour es utilisées 1 et 2 orrespondant à des signaux télé oms AM à4 états.

Page 72: Algorithmes temporels rapides à point fixe pour la ...

3.2. Séparation de signaux de télé ommuni ations 550 50 100 150 200 250 300

−10

−5

0

5

10x1(n)

n

0 50 100 150 200 250 300

−15

−10

−5

0

5

10

15 x2(n)

n

0 50 100 150 200 250 300−10

−5

0

5

10x11(n)

n

0 50 100 150 200 250 300−10

−5

0

5

10x22(n)

n

0 50 100 150 200 250 300−10

−5

0

5

10 x11(n)

n

0 50 100 150 200 250 300−10

−5

0

5

10x22(n)

nFig. 3.4 � De haut en bas : observations 1 et 2, ontributions réelles des sour es1 et 2 respe tivement sur les apteurs 1 et 2, ontributions estimées.

Page 73: Algorithmes temporels rapides à point fixe pour la ...

56 Chapitre 3. Résultats expérimentaux3.3 Séparation de signaux audioNous avons e�e tué deux tests de séparation dans le as de mélanges dedeux signaux de parole et de musique en utilisant des �ltres réels d'ordre 256(à une fréquen e d'é hantillonnage de 20 kHz) mesurés au niveau des oreillesd'une tête de mannequin [81℄ (pour le premier test nous avons séle tionné les�ltres asso iés aux angles 15�et -30�). La séparation a été réalisée i i en utili-sant la néguentropie ave G(x) = e−x2

2 et en hoisissant R = 40 et R′ = 100.Nous avons aussi hoisi une fenêtre d'extra tion de pro essus d'innovation oùles deux sour es sont stationnaires (les �ltres obtenus ont ensuite été appliquésà la totalité des signaux). Pour hoisir ette fenêtre d'extra tion, nous avonsdéveloppé une pro édure qui onsiste à e�e tuer la séparation su essivementsur plusieurs fenêtres et à hoisir l'une de elles donnant des sorties de ontri-butions les plus orrélées. La �gure 3.5 représente les 4 �ltres réels utilisés etla �gure 3.6 représente de haut en bas les deux observations du mélange, lesdeux ontributions des sour es 1 et 2 respe tivement sur les apteurs 1 et 2(nous avons hoisi de représenter la ontribution de plus forte puissan e pour ha une des sour es), et les estimations de es deux ontributions. Les SIRdes ontributions estimées sont de 12.8 dB et 14.3 dB et les améliorations deSIR (SIRI) de 5.7 dB et 11.7 dB.

0 100 200

−0.4

−0.2

0

0.2

0.4

0 100 200

−0.4

−0.2

0

0.2

0.4

0 100 200

−0.4

−0.2

0

0.2

0.4

0 100 200

−0.4

−0.2

0

0.2

0.4

a11(n) a12(n)

a21(n) a22(n)

n n

n n

Fig. 3.5 � Réponses impulsionnelles de la matri e de �ltres de mélange utilisée orrespondant aux azimuts 15�et -30�(ordre=256).

Page 74: Algorithmes temporels rapides à point fixe pour la ...

3.3. Séparation de signaux audio 570 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

5

−10

−5

0

5

10x1(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

x 105

−6

−4

−2

0

2

4

6x2(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−10

−5

0

5

10x11(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−4

−3

−2

−1

0

1

2

3

4x22(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−10

−5

0

5

10x11(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−4

−3

−2

−1

0

1

2

3

4x22(n)

nFig. 3.6 � De haut en bas : observations 1 et 2, ontributions réelles des sour es1 et 2 respe tivement sur les apteurs 1 et 2, ontributions estimées.

Page 75: Algorithmes temporels rapides à point fixe pour la ...

58 Chapitre 3. Résultats expérimentauxLes �gures 3.7 et 3.8 représentent les résultats obtenus dans une on�gurationde mélange similaire à e qui pré ède à l'ex eption des positions des sour esqui ont ette fois été asso iées aux angles 10� et 60�. Nous sommes don i idans une on�guration où les deux sour es se trouvent du même �té de latête de mannequin. Cette on�guration peut poser des problèmes pour er-tains algorithmes omme elui de L. Parra qui n'a pas donné de résultatsauditifs satisfaisants dans e as à la di�éren e du as pré édent. Pour notreappro he, les SIR des ontributions estimées sont i i de 13.2 dB et 13.0 dB etles améliorations de SIR (SIRI) de 6.2 dB et 13.2 dB.

0 100 200

−0.4

−0.2

0

0.2

0.4

0 100 200

−0.4

−0.2

0

0.2

0.4

0 100 200

−0.4

−0.2

0

0.2

0.4

0 100 200

−0.4

−0.2

0

0.2

0.4

a11(n) a12(n)

a21(n) a22(n)

n n

n n

Fig. 3.7 � Réponses impulsionnelles des �ltres de mélange utilisés orrespon-dant aux azimuts 10�et 60�(ordre=256).

Page 76: Algorithmes temporels rapides à point fixe pour la ...

3.3. Séparation de signaux audio 590 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

5

−10

−5

0

5

10x1(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−6

−4

−2

0

2

4

6x2(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−10

−5

0

5

10x11(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

x 105

−4

−3

−2

−1

0

1

2

3

4

x12(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−10

−5

0

5

10x11(n)

n

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 25

−4

−3

−2

−1

0

1

2

3

4x12(n)

nFig. 3.8 � De haut en bas : observations 1 et 2, ontributions réelles des sour es1 et 2 sur le apteur 1, ontributions estimées.

Page 77: Algorithmes temporels rapides à point fixe pour la ...

60 Chapitre 3. Résultats expérimentaux3.4 Tests statistiquesDans ette se tion, nous étudions les performan es de nos méthodes dansplusieurs on�gurations. Les algorithmes sont d'abord testés pour P = 2 mé-langes onvolutifs de N = 2 sour es normalisées olorées arti� iellement onte-nant 100000 é hantillons. Nous avons e�e tué des tests dans les deux as de�gure où les pro essus d'innovation uj(n) ont des distributions uniforme et la-pla ienne. Dans le as de pro essus à distribution uniforme, nous avons utiliséle ritère du kurtosis qui s'est avéré légèrement plus performant que la né-guentropie (les SIRout des ontributions estimées sont supérieurs de 2 à 3 dB).Dans le as de pro essus lapla iens, le ritère de la néguentropie en utilisantla non-linéarité gaussienne G(x) = e−x2/2 a donné de meilleures performan eset a don été préféré au kurtosis. Nous avons représenté les SIRout14, en fon -tion de l'ordre du modèle Q que nous dé�nissons omme la somme des ordresdes �ltres de mélange Aij(z) et de oloration d'innovation Fj(z). Pour haquevaleur de Q, 100 simulations de Monte-Carlo ont été réalisées en faisant varierles oe� ients des �ltres de mélange et de oloration d'innovation ave une loiuniforme. Les moyennes et é arts-types des SIRout résultants ont ensuite été al ulés. L'ordre R dans (2.7) a été �xé à R = Q ar nos tests ont montré que ela entraîne un bon ompromis entre le SIRout et le temps de al ul. De lamême manière, l'ordre des �ltres non ausaux Ckl(z) utilisés pour olorer lespro essus d'innovation estimés a été �xé à R′ = 2Q.La �gure 3.9 montre que dans dans le as de pro essus d'innovation uni-formes, pour des ordres de modèle Q inférieurs à 60, les moyennes des SIRoutsont omprises entre 17 et 9.5 dB pour la première sour e et un peu moinspour la se onde sour e, ex epté pour le as linéaire instantané, qui onduit àdes performan es nettement meilleures. Nous avons observé qu'en hoisissantun seuil de ritère d'arrêt plus petit (nous l'avons hoisi égal à 10−12 i i), il estpossible d'obtenir de meilleurs résultats pour des valeurs de Q élevées. Cepen-dant, le temps de al ul est alors plus long, e qui limite la possibilité d'uneanalyse statistique par des tests de Monte-Carlo. Notons que les oe� ientsde �ltres utilisés i i ne sont pas dé roissants dans l'ensemble omme eux des�ltres réels dont les derniers oe� ients sont en général faibles. Cela expliqueque nous ne puissions pas i i atteindre ave de bonnes performan es des va-leurs de Q égales à l'ordre des �ltres réels utilisés dans la se tion pré édente.La �gure 3.10 montre que pour des pro essus d'innovation à distributionlapla ienne, les SIRout moyens sont ompris entre 19 et 13 dB pour des valeursde Q inférieures à 80. Ces performan es sont meilleures que dans le as d'unedistribution uniforme, probablement en raison d'optimums du ritère plus pro-non és dans le as lapla ien, la distribution lapla ienne étant plus éloignée de14Dans ette se tion, nous avons utilisé des �ltres arti� iels de puissan es à peu prèségales ; le SIRin est don pro he de 0 ar les deux ontributions de sour es normalisées surun apteur donné sont alors de puissan es à peu près égales.

Page 78: Algorithmes temporels rapides à point fixe pour la ...

3.4. Tests statistiques 61la loi normale que la distribution uniforme (le kurtosis normalisé d'une variableuniforme est égal à -1.2 tandis que elui d'un variable lapla ienne est égal à3).

0 10 20 30 40 50 600

5

10

15

20

25

30

35

40

45

50

55

Moyenne pour la 1ere source extraite

Moyenne pour la 2nde source extraite

Ecart-type pour la 1ere source extraite

Ecart-type pour la 2nde source extraite

dB

SIRout

Q

Fig. 3.9 � SIRout des sour es extraites en fon tion de Q pour des sour es olo-rées arti� ielles dans le as de pro essus d'innovation uniformes et en utilisantle ritère du kurtosis.

0 20 40 60 80 100 1200

5

10

15

20

25

30

35

40

45

50

Moyenne pour la 1ere source extraite

Moyenne pour la 2nde source extraite

Ecart-type pour la 1ere source extraite

Ecart-type pour la 2nde source extraite

SIRout

dB

QFig. 3.10 � SIRout des sour es extraites en fon tion de Q pour des sour es olo-rées arti� ielles dans le as de pro essus d'innovation lapla iens et en utilisantle ritère de la néguentropie.

Page 79: Algorithmes temporels rapides à point fixe pour la ...

62 Chapitre 3. Résultats expérimentauxDans la se onde série d'expérien es, nous avons testé notre algorithme dansle as sous-déterminé N = 3 et P = 2, quand les deux signaux observés ontiennent une sour e de bruit blan gaussien15 stationnaire en plus des deuxsour es utiles mentionnées pré édemment (nous avons hoisi i i des pro essusd'innovation de densité uniforme). Nous avons �xé l'ordre du modèle à Q = 20.En faisant varier la puissan e de la sour e de bruit et don le rapport signal àbruit d'entrée (SNRin), nous avons étudié la robustesse de l'estimation de lamatri e de mélange en présen e de bruit. Dans e but, nous avons al ulé les

SIRout des deux sour es utiles estimées dans lesquelles nous avons enlevé les ontributions de la sour e de bruit. La �gure 3.11 montre que notre méthodeest assez robuste au bruit puisque les SIRout de la première sour e restentsupérieurs à 10 dB pour un SNRin dé roissant jusqu' à 8 dB.Pour N = P = 2, nous avons omparé le temps de al ul de notre méthodeave une version modi�ée de l'algorithme de Tugnait développée dans [6℄, quipermet déjà une plus grande rapidité que l'appro he de Tugnait en utilisantun algorithme de Newton modi�é. Nous avons fait varier l'ordre du modèle Qentre 0 et 30 pour des sour es ontenant T = 10000 é hantillons (T > 10000ou Q > 30 entraînent des temps de al ul trop grands pour 100 tests deMonte-Carlo de la méthode de Tugnait modi�ée). Les résultats de la �gure3.12 représentent la durée de l'extra tion du premier pro essus d'innovation,qui est de loin l'étape la plus lourde en temps de al ul. Cela montre que notreméthode est à peu près 100 fois plus rapide que la méthode Tugnait-Newton.De plus, elle donne des SIRout légèrement supérieurs, d'à peu près 0.5 dB.3.5 Con lusionDans e hapitre, nous avons validé notre algorithme C-FICA en l'appli-quant d'abord à des mélanges RIF de sour es de télé ommuni ations et desour es audio. Nous avons ensuite e�e tué des tests de Monte-Carlo pour ap-pré ier la robustesse de notre méthode en fon tion de l'ordre du mélange, del'ordre de oloration des sour es et du niveau de bruit présent dans les obser-vations. Les performan es en termes des Rapport Signal à Interféren e sontlégèrement meilleures qu'ave la méthode de Tugnait-Newton, tandis que letemps de al ul est de l'ordre de 100 fois plus faible.15Le kurtosis d'un signal gaussien est nul mais en raison du blan himent qui se fait àpartir de statistiques du se ond ordre, e bruit gaussien n'est pas transparent pour notre ritère d'optimisation.

Page 80: Algorithmes temporels rapides à point fixe pour la ...

3.5. Con lusion 63

0 10 20 30 40 500

5

10

15

20

25

Moyenne pour la 1ere source extraite

Moyenne pour la 2nde source extraite

Ecart-type pour la 1ere source extraite

Ecart-type pour la 2nde source extraite

SIRoutdB

SNRin(dB)

Fig. 3.11 � SIRout des sour es utiles extraites en fon tion du SNR d'entrée.

0 5 10 15 20 25 3010

−2

10−1

100

101

102

103

104

Tugnait-Newton

Point fixe

Sec. Type d’optimisation

Q

Fig. 3.12 � Temps d'extra tion moyen du premier pro essus d'innovation enfon tion de Q pour une optimisation de type Tugnait-Newton et pour notreoptimisation de type point �xe.

Page 81: Algorithmes temporels rapides à point fixe pour la ...

64 Chapitre 3. Résultats expérimentaux

Page 82: Algorithmes temporels rapides à point fixe pour la ...

Deuxième partieMélanges sous-déterminés

65

Page 83: Algorithmes temporels rapides à point fixe pour la ...
Page 84: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 4Mélanges sous-déterminés :état de l'artLa séparation aveugle de sour es sous-déterminée her he à estimer un jeude N signaux sour es in onnus sj(n) à partir d'un jeu de P signaux obser-vés xi(n) lorsque le nombre d'observations est inférieur au nombre de sour es(P < N). Les signaux observés sont dans la plupart des as des mélangeslinéaires instantanés ou onvolutifs des signaux sour es. Les mélanges onvo-lutifs s'expriment parx(n) = A(n) ∗ s(n) (4.1)où s(n) = [s1(n), · · · , sN(n)]t et x(n) = [x1(n), · · · , xP (n)]t sont les ve teursdes sour es et des observations, ∗ représente l'opérateur de onvolution, et lamatri e de mélange A(n) est omposée des réponses impulsionnelles de �ltresde mélange in onnus. Ce ontexte général in lut les mélanges linéaires instan-tanés. A(n) se réduit alors à une matri e omposée de termes proportionnels àdes dira s entrés à l'origine Aδ(n) et le ve teur d'observations s'exprime parun simple produit matri iel

x(n) = As(n). (4.2)Le nombre de sour es N étant supérieur au nombre d'observations P , lamatri e de mélange A(n) possède davantage de olonnes que de lignes et n'estdon pas inversible à gau he. Dans le as général, il est don impossible, mêmeen onnaissant parfaitement les paramètres du mélange, d'estimer orre te-ment les sour es par des méthodes de séparation linéaires.La séparation de sour es sous-déterminée a été abordée pour la premièrefois par Belou hrani et Cardoso [26℄ (1994). Elle se dé ompose en général endeux sous-problèmes : l'estimation de la matri e de mélange et l'estimationdes sour es. 67

Page 85: Algorithmes temporels rapides à point fixe pour la ...

68 Chapitre 4. Mélanges sous-déterminés : état de l'art4.1 Estimation de la matri e de mélangeLa grande majorité des algorithmes de séparation pour mélanges sous-déterminés supposent que les sour es sont par imonieuses, .-à-d. qu'il existedes zones du domaine d'analyse (domaines temps-fréquen e, en ondelettes oumulti-résolution par exemple) où une sour e seulement est non nulle. Dans e as, l'analyse d'une zone mono-sour e permet l'identi� ation d'une olonne dela matri e de mélange.L'identi� ation des oe� ients de mélange peut être réalisée soit par l'étudedu nuage de points des observations, grâ e à des te hniques de lustering[35, 36, 94, 119, 120℄, soit par le al ul de rapports d'observations, de oe�- ients d'inter orrélation ou de densités interspe trales des observations (resp.DUET [229℄ ou TIFROM [7℄, TIFCORR [71℄, TIFCOHERE [10℄). Dans le asde DUET, le al ul des rapports d'observations est ouplé à une analyse d'his-togramme à deux dimensions (amplitude, retard) pour déterminer le nombrede sour es ainsi que les oe� ients de mélange.Les algorithmes basés sur la par imonie peuvent être plus au moins ontrai-gnants sur les propriétés des sour es. L'algorithme DUET par exemple supposeque les sour es sont totalement disjointes dans le plan temps-fréquen e : dans haque ase du plan temps-fréquen e, une seule sour e doit être présente (ouprésente de façon prépondérante). Les algorithmes TIFROM, TIFCORR etTIFCOHERE supposent eux que haque sour e possède au moins une zonemono-sour e asso iée. Dans e as, l'existen e de zones multi-sour es est tolé-rée.Notons que dans le as de mélanges ontenant un grand nombre de sour es,l'existen e de zones mono-sour es est moins probable.D'autres hypothèses que la par imonie peuvent être utilisées pour la sé-paration de mélanges sous-déterminés. On peut par exemple supposer que lessour es sont dis rètes [26, 58, 197℄, de distributions onnues [34, 152, 209℄, ouqu'elles véri�ent un modèle donné [109, 230℄ (un arti le de E. Vin ent et X.Rodet suppose par exemple que les sour es de musique véri�ent un modèlemarkovien [218℄). D'autres méthodes formulent des hypothèses sur le pro es-sus de mélange [39℄.La séparation de sour es sous-déterminée a été très peu étudiée dans le as de mélanges onvolutifs. On peut iter toutefois [17, 32, 34, 144, 152℄. Lemodèle linéaire à atténuations et retards a été lui plus étudié, prin ipalementpar les appro hes temps-fréquen e DUET [229℄, TIFROM [7℄, TIFCORR [71℄et TIFCOHERE [10℄.4.2 Re onstru tion des sour esUne fois la matri e de mélange identi�ée, il reste à séparer les sour es entreelles, e qui ne peut être fait par simple inversion matri ielle puisque la matri ede mélange sous-déterminée n'est pas inversible à gau he. Une solution onsiste

Page 86: Algorithmes temporels rapides à point fixe pour la ...

4.2. Re onstru tion des sour es 69à al uler la matri e pseudo-inverse de Moore-Penrose dé�nie parA+ = At(AAt)−1. (4.3)Dans e as, on obtient une séparation approximative des sour es : haquesortie ontient une sour e prépondérante superposée à des résidus des autressour es.Une autre solution onsiste à annuler la présen e de ertaines sour es ene�e tuant une séparation partielle. Pour un mélange à N sour es et P obser-vations, il est ainsi possible d'annuler la présen e de P − 1 sour es dans lessignaux de sortie. Chaque signal de sortie ontiendra alors N −P + 1 sour es.Cette méthode peut être employée par exemple en as de présen e de sour esparasites se superposant aux sour es utiles que l'on veut séparer entre elles.Une autre solution très simple [121,216,217℄ onsiste, à haque instant n, àasso ier le ve teur d'observations à la sour e dont le ve teur olonne de A est leplus pro he. Pour ela, on al ule les produits s alaires du ve teur d'observationave les N olonnes normalisées de la matri e de mélange et on identi�e l'indi ede la sour e a tive omme elui ayant le plus grand produit s alaire en valeurabsolue. On retient alors e produit s alaire (signé) omme valeur pour lasour e a tive. La �gure 4.1 illustre ette méthode de re onstru tion de sour es.

x1

s1(n) = 0

ǫ

a3

a1

x(n) = a3s3(n) + ǫ

s2(n) = 0a2

x2

s3(n) 6= 0

Fig. 4.1 � S héma du prin ipe d'estimation des sour es à partir de la matri ede mélange en onsidérant qu'une seule sour e ( elle d'indi e 3) est a tive àl'instant n.Une extension logique de ette appro he onsiste à assigner plusieurs sour esà haque observation. En général, on her he alors à haque instant n un ve -teur sour e à P omposantes non nulles véri�ant l'équation de mélange et denorme ℓ1 minimale [35,36,118,119,199,222℄. Cela revient à résoudre à haqueinstant n le problème d'optimisation suivant :mins1(n)..sN (n)

( N∑

j=1

|sj(n)|

)

t.q.

N∑

j=1

ajsj(n) = x(n) (4.4)où aj est l'estimée de la j eme olonne de la matri e de mélange et où P om-posantes seulement du ve teur s(t) sont supposées non nulles. Cette te hnique

Page 87: Algorithmes temporels rapides à point fixe pour la ...

70 Chapitre 4. Mélanges sous-déterminés : état de l'artdite du trajet le plus ourt exige ependant une forte par imonie des sour es,et e d'autant plus que le rapport P/N est faible ar elle suppose qu'à haqueinstant, P sour es seulement parmi N soient non nulles. La �gure 4.2 illustre ette méthode du trajet le plus ourt.s3(n)

s1(n)

s2(n) = 0

x(n) = a1s1(n) + a3s3(n)

a1

a3

a2

x2

x1Fig. 4.2 � S héma du prin ipe d'estimation des sour es à partir de la matri ede mélange par la méthode du trajet le plus ourt.D'autres normes que la norme ℓ1 ont été employées pour déterminer e plus ourt trajet (norme ℓq ave q < 1 par exemple [179℄).Une appro he basée sur les statistiques du se ond ordre et appelée prin ipede dé omposition statistiquement par imonieuse (SSDP : statisti ally sparsede omposition prin iple) a aussi été proposée par M. Xiao, S. Xie et Y. Fu [227℄pour identi�er les sour es prépondérantes à séparer entre elles.Une autre te hnique ouramment employée onsiste à utiliser un di tion-naire de formes d'onde auquel les sour es sont supposées appartenir [27,28,232℄.L'appartenan e des sour es au di tionnaire engendre de nouvelles ontraintesqui rendent possible leur estimation. La dé omposition n'étant pas unique,plusieurs méthodes peuvent être employées pour re onstituer les sour es (Me-thod Of Frames MOF [60℄, Best Orthogonal Basis BOB [53℄, Mat hing PursuitMP [116,117, 126℄, Basis Pursuit [48℄ BP).Nous avons vu que les méthodes linéaires ne permettent pas une sépa-ration exa te des sour es. Dans le as général, une ombinaison linéaire desobservations ontiendra en e�et au minimum N − P + 1 sour es. Cependantla séparation exa te peut être réalisée au moyen d'un masquage binaire duplan temps-fréquen e sous réserve que les sour es soient totalement disjointesdans le plan temps-fréquen e. L'algorithme DUET utilise ette te hnique qui onsiste pour l'estimation d'une sour e donnée à masquer les ases temps-fréquen es asso iées aux autres sour es [229℄. Ré emment Aissa-El-Bey et al.ont proposé une méthode pour relâ her l'hypothèse d'orthogonalité des sour esen se basant sur une proje tion en sous-espa es. Cette méthode suppose qu'à haque point temps-fréquen e, le nombre de sour es a tives est stri tement in-férieur au nombre d'observations. Deux arti les ont été publiés respe tivementpour les mélanges linéaires instantanés [18℄ et onvolutifs [17℄.

Page 88: Algorithmes temporels rapides à point fixe pour la ...

4.3. La séparation di�érentielle de sour es 71Nous her hons dans ette partie à éviter toutes es hypothèses parfois trèsrestri tives sur le mélange et les sour es. Les méthodes de séparation partiellerapides présentées i i supposent uniquement que les sour es mélangées sontdivisées en deux atégories : ertaines sont non-stationnaires et orrespondentaux sour es utiles que l'on her he à séparer entre elles, d'autres sont station-naires et orrespondent à des sour es de bruit qui peuvent rester présentesdans les sorties de l'algorithme de séparation.Notons que la superposition d'un signal de bruit stationnaire sur un signalde parole est moins gênante que la superposition d'un autre signal de parole.En e�et, le erveau se fo alise davantage sur la parole et l'on est davantageperturbé par une personne parlant en même temps que notre interlo uteur quepar un bruit de fond neutre.4.3 La séparation di�érentielle de sour esDans [67℄, Deville, Benali et Abrard ont introduit un on ept général deSAS di�érentielle pour traiter les mélanges sous-déterminés. Dans sa versionstandard, la séparation di�érentielle de sour es onsidère la situation où (auplus) P des N sour es mélangées sont non-stationnaires alors que les N − Pautres sour es (au moins) sont stationnaires.Les P sour es non-stationnaires sont les signaux utiles dans ette appro he,alors que les N − P sour es stationnaires sont onsidérées omme des sour esde bruit. Notre on ept de SAS di�érentielle réalise la séparation partielle desP sour es utiles (le prin ipe de la séparation partielle a été dé�ni dans la se -tion pré édente) [67℄.Néanmoins, nous faisons remarquer que ette séparation partielle peut-être onsidérée omme une séparation pseudo- omplète dans les situations oùl'on ne her he pas à séparer les sour es de bruit qui ne ontiennent au uneinformation. Cette méthode peut être d'un intérêt pratique pour le s énariodu " o ktail party" bruité. On pourrait aussi envisager notre appro he dansles systèmes de ommuni ations MIMO, pour lesquels les signaux reçus sontsouvent perturbés par des sour es de bruit stationnaires dans les appli ationsréelles. Cette méthode pourrait aussi être appliquée aux signaux biomédi aux,qui ontiennent eux aussi diverses omposantes de bruit stationnaire.Bien que le on ept de séparation di�érentielle soit dé�ni de façon assezgénérale dans [67℄, il n'a été appliqué pour l'instant qu'à une méthode de SASsimple mais restri tive, limitée à P = 2 mélanges, impliquant seulement deux�ltres à réponses impulsionnelles �nies (RIF) stri tement ausaux ( .-à-d. pasde mélange instantané), et basée sur des algorithmes à onvergen e lente. Nousintroduisons i i des méthodes de SAS beau oup plus puissantes et leurs algo-

Page 89: Algorithmes temporels rapides à point fixe pour la ...

72 Chapitre 4. Mélanges sous-déterminés : état de l'artrithmes, basées sur la SAS di�érentielle, pour les mélanges linéaires instantanéset onvolutifs16.Notre méthode instantanée est obtenue en étendant aux mélanges sous-déterminés le ritère de séparation appelé kurtosis [61℄ et l'algorithme FastICAasso ié, de type point �xe et à onvergen e rapide [98℄. Dans le as onvolutif,nous étendons aux mélanges sous-déterminés l'algorithme temporel rapide àpoint �xe C-FICA restreint aux mélanges (sur-)déterminés (i.e. P ≥ N) quenous avons proposé dans la partie 1 du manus rit. Nous gardons ainsi les pro-priétés attra tives de e dernier algorithme.

16Un algorithme di�érentiel à point �xe légèrement di�érent a été proposé auparavant dansnotre équipe [69℄ pour les mélanges linéaires instantanés. La onvergen e de et algorithmen'a pas été prouvée rigoureusement et la version parallèle n'a pas été étudiée.

Page 90: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 5Méthode de SAS di�érentielleproposée pour les mélangesinstantanés5.1 Introdu tionCe hapitre on erne la séparation de mélanges linéaires instantanés sous-déterminés. Nous proposons une méthode de SAS partielle qui sépare P sour essupposées non-stationnaires en gardant des omposantes résiduelles des N−Pautres sour es supposées être des sour es de "bruit" stationnaire. Cette mé-thode est basées sur le on ept général de séparation di�érentielle ré emmentintroduit dans notre équipe. L'appro he proposée onsiste en une extensiondi�érentielle de l'algorithme FastICA et repose sur un blan himent di�érentieldes observations permettant d'appliquer un algorithme de type point �xe pourl'optimisation du ritère du kurtosis di�érentiel que nous dé�nissons.5.2 Un nouveau ritère de SAS basé sur le kur-tosis di�érentielLa méthode FastICA standard [98℄, qui est seulement appli able aux mé-langes linéaires instantanés ave P = N (ou P > N), extrait une sour e aumoyen d'une pro édure en deux étapes. La première onsiste à appliquer auve teur d'observations x(n) une matri e réelle P × P , e qui donne le ve teur

z(n) = Bx(n). (5.1)Dans la méthode FastICA standard, B est hoisie de manière à dé orréler spa-tialement et à normaliser les observations. La se onde étape de ette méthodestandard onsiste ensuite à obtenir un signal de sortie y(n) en faisant une ombinaison linéaire des signaux ontenus dans z(n), .-à-d.y(n) = wtz(n) (5.2)73

Page 91: Algorithmes temporels rapides à point fixe pour la ...

74Chapitre 5. Méthode de SAS di�érentielle proposée pour les mélanges instantanésoù w est un ve teur, qui est ontraint à être de norme unité. Ce ve teur w estséle tionné de manière à optimiser le kurtosis (non-normalisé) de y(n), dé�ni omme l'auto umulant sans dé alage d'ordre 4.kurty(n) = Cum

(y(n), y(n), y(n), y(n)

). (5.3)Etudions maintenant le as sous-déterminé, .-à-d. P < N . Nous obtenons ànouveau un signal de sortie y(n) en a ord ave (5.1) et (5.2). Nous her honsà dé�nir de nouveaux ritères pour séle tionner B et w, de façon à réaliser laSAS partielle, dé�nie dans le hapitre pré édent, des P sour es utiles. A ette�n, nous appliquons le on ept général de SAS di�érentielle dé rit dans [67℄ au ritère spé i�que du kurtosis utilisé dans la méthode FastICA standard. Nous onsidérons don deux instants n1 et n2, et introduisons ensuite le kurtosisdi�érentiel (non-normalisé) que nous asso ions à (5.3) pour es deux instants.Nous dé�nissons e paramètre par

Dkurty(n1, n2) = kurty(n2)− kurty(n1). (5.4)Montrons maintenant que, bien que le paramètre standard kurty(n) dépendede toutes les sour es, sa version di�érentielle Dkurty(n1, n2) dépend seulementdes sour es non-stationnaires. Les éq. (4.2), (5.1) et (5.2) donnenty(n) = vts(n) (5.5)où le ve teurv = (BA)tw (5.6)in lut les e�ets des étages de mélange et de séparation. En notant vq, ave

q = 1, · · · , N , les éléments de v, L'éq. (5.5) implique que le signal de sortiey(n) peut être exprimé en fon tion de toutes les sour es omme suit

y(n) =

N∑

q=1

vqsq(n). (5.7)En utilisant les propriétés des umulants et l'indépendan e supposée de toutesles sour es, on en déduit fa ilement quekurty(n) =

N∑

q=1

v4qkurtsq

(n) (5.8)où kurtsq(n) est le kurtosis de la sour e sq(n), à nouveau dé�ni par (5.3). Lekurtosis standard (5.8) de la sortie dépend don réellement des kurtosis detoutes les sour es. Le kurtosis di�érentiel asso ié de la sortie, dé�ni par (5.4),peut être exprimé par

Dkurty(n1, n2) =

N∑

q=1

v4qDkurtsq

(n1, n2) (5.9)

Page 92: Algorithmes temporels rapides à point fixe pour la ...

5.2. Un nouveau ritère de SAS basé sur le kurtosis di�érentiel 75où nous dé�nissons le kurtosis di�érentiel Dkurtsq(n1, n2) de la sour e sq(n)de la même façon que dans (5.4). Tenons ompte maintenant de l'hypothèsesuivant laquelle P sour es sont non-stationnaires17, alors que les autres sour essont stationnaires.Nous notons I l'ensemble ontenant les P indi es des sour es non-stationnairesin onnues. Le kurtosis standard kurtsq

(n) de toute sour e sq(n) ave q /∈ Iprend alors les mêmes valeurs pour les deux instants n1 et n2, si bien queDkurtsq

(n1, n2) = 0 18. L' éq. (5.9) se simpli�e alors enDkurty(n1, n2) =

q∈I

v4qDkurtsq

(n1, n2). (5.10)Cela montre expli itement que e paramètre di�érentiel dépend seulement dessour es non-stationnaires. De plus, pour des sour es données et deux instantsn1 et n2, elui- i peut être vu omme une fon tion f(.) du jeu de variables{vq, q ∈ I}, .-à-d. que Dkurty(n1, n2) est égal à

f (vq, q ∈ I) =∑

q∈I

v4qαq (5.11)où les paramètres αq sont égaux aux kurtosis di�érentiels Dkurtsq

(n1, n2) dessour es non-stationnaires. Le type de fon tion dé�ni dans (5.11) a été large-ment étudié dans le ontexte des méthodes de SAS à kurtosis standard, .-à-d.les méthodes pour le as P = N , par e que le kurtosis standard utilisé omme ritère de SAS dans e as peut être exprimé sous la forme (5.11)19.Le résultat suivant a été établi (voir [97℄ p. 173 pour la on�guration à 2sour es et [61℄ pour une preuve générale). Supposons que tous les paramètresαq ave q ∈ I sont non nuls, .-à-d. que toutes les sour es non-stationnaires ontdes kurtosis di�érentiels non nuls pour les deux instants n1 et n2. Considéronsles valeurs de la fon tion (5.11) sur la sphère unité de dimension P , .-à-d. surl'ensemble {vq, q ∈ I} tel que

q∈I

v2q = 1. (5.12)17Dans la suite, le nombre N de sour es non-stationnaires est supposé être égal au nombre

P d'observations.18Notons que la stationnarité omplète des sour es sq(n) ave q /∈ I est su�sante maispas né essaire pour notre méthode : nous avons seulement besoin que leurs kurtosis di�é-rentiels (et leurs puissan es di�érentielles introduites i-après) soient nuls pour les instants onsidérés. En dehors du as stationnaire, les kurtosis di�érentiels sont nuls par exemplequand l'aplatissement (mesuré par le kurtosis normalisé dé�ni par kurts(n)/E{s(n)2

}2) etla puissan e au arré des sour es varient de façon inversement proportionnelle.19Dans les appro hes standard, la somme pour q ∈ I dans (5.11) est réalisée pour toutesles P = N sour es et les paramètres αq sont égaux aux kurtosis standard kurtsq(n) de toutesles sour es. Néanmoins, ela n'a pas d'in�uen e sur l'argumentation qui suit, basée sur lespropriétés générales du type de fon tion dé�ni par (5.11).

Page 93: Algorithmes temporels rapides à point fixe pour la ...

76Chapitre 5. Méthode de SAS di�érentielle proposée pour les mélanges instantanésLes résultats obtenus dans [61℄, [97℄ impliquent dans notre as que les maximade la valeur absolue de f(vq, q ∈ I) sur la sphère unité sont tous les points telsqu'une seule variable vq, ave q ∈ I, est non nulle. L' éq. (5.7) montre que lesignal de sortie y(n) ontient alors une ontribution d'une seule sour e non-stationnaire (et des ontributions de toutes les sour es stationnaires). Nous réa-lisons don bien la SAS partielle voulue pour une des sour es non-stationnaires.Le dernier aspe t de notre méthode qui doit être pré isé est omment sé-le tionner la matri e B et omment ontraindre le ve teur w (qui est le pa-ramètre ontr�lé en pratique, et non pas v) pour que les variables {vq, q ∈ I}véri�ent la ondition (5.12). Nous dé�nissons d'abord la puissan e di�érentielleDpowy(n1, n2) d'un signal y entre deux instants n1 et n2 par

Dpowy(n1, n2) = E{y(n2)

2}− E

{y(n1)

2}

. (5.13)En utilisant l'indépendan e des signaux sour es, on peut montrer fa ilementque, omme pour le kurtosis di�érentiel (5.10), nous avonsDpowy(n1, n2) =

q∈I

v2qDpowsq

(n1, n2). (5.14)L'indétermination d'é helle propre à la SAS permet de remettre à l'é helleles puissan es di�érentielles des P sour es non-stationnaires ave des fa teurspositifs. Don , sous réserve que es P puissan es di�érentielles soient stri te-ment positives pour les instants n1 et n2 onsidérés (dans le as de puissan esdi�érentielles toutes négatives, on peut é hanger les instants n1 et n2), ellespeuvent être supposées égales à 1 sans perte de généralité. L'éq. (5.14) s'é ritalorsDpowy(n1, n2) =

q∈I

v2q (5.15)si bien que l'équation de ontrainte (5.12) peut être exprimée en termes depuissan e di�érentielle unité pour le signal de sortie y(n). Nous introduisonsensuite une extension di�érentielle de l'étage de dé orrélation et de normali-sation des méthodes à kurtosis standard, .-à-d. que nous her hons à obtenirune matri e B qui permette de normaliser la puissan e di�érentielle de y(n)en normalisant simplement le ve teur d'extra tion w. Dans e but, nous dé�-nissons la matri e d'auto orrélation di�érentielle de x(n) par

DRx(n1, n2) = Rx(n2)−Rx(n1) (5.16)où Rx(ni) = E {x(ni)x(ni)t} est la matri e de orrélation standard de x(n)à l'instant ni. Considérons maintenant la dé omposition en ve teurs propres( [82℄ p. 393) de la matri e symétrique réelle DRx(n1, n2) :DRx(n1, n2) = E∆Et (5.17)

Page 94: Algorithmes temporels rapides à point fixe pour la ...

5.2. Un nouveau ritère de SAS basé sur le kurtosis di�érentiel 77où E est une matri e P × P orthogonale réelle et ∆ est une matri e P × Pdiagonale. On peut montrer omme suit que les éléments de ∆ sont stri tementpositifs. Les éq. (4.2) et (5.16) donnentDRx(n1, n2) = Rx(n2)−Rx(n1)

= ARs(n2)At −ARs(n1)A

t

= A (Rs(n2)−Rs(n1))At

= ADRs(n1, n2)At (5.18)où DRs(n1, n2) est une matri e diagonale en raison de l'indépendan e dessour es et ses éléments d'indi es q /∈ I sont nuls en raison de la stationnaritédes sour es orrespondantes. On peut véri�er fa ilement que les olonnes de Ad'indi es q /∈ I ne donnent au un terme dans la partie droite de (5.18), si bienque nous avons aussi

DRx(n1, n2) = AΛAt (5.19)où A est omposée des P olonnes de A d'indi es q ∈ I et la matri e diagonaleΛ ontient les puissan es di�érentielles des P sour es non-stationnaires pourles deux instants n1 et n2. Alors que (5.18) met en jeu des matri es re tangu-laires, (5.19) ontient seulement des matri es P × P .Si nous supposons que A est inversible, le théorème 4.2.1 de [82℄ p. 141 im-plique que DRx(n1, n2) est dé�nie positive si et seulement si Λ est aussi dé�niepositive. Don , si nous supposons à nouveau que les puissan es di�érentiellesdes sour es non-stationnaires sont stri tement positives (pour les instants n1et n2), (5.17) et (5.19) montrent que toutes les valeurs de la diagonale de ∆sont stri tement positives. De plus, si es puissan es di�érentielles sont misesà l'é helle unité, alors Λ = I et (5.19) devient

DRx(n1, n2) = AAt. (5.20)Comme ∆ n'a que des valeurs positives, elle a une ra ine arrée réelle et nouspouvons dé�nir la matri e de blan himent di�érentiel B parB = ∆−1/2Et. (5.21)Don , ave z dé�ni par (5.1) nous avons

DRz(n1, n2) = BDRx(n1, n2)Bt

= ∆−1/2EtE∆EtE∆−1/2

= I. (5.22)Considérons maintenant le signal de sortie y(n) dé�ni par (5.2). Nous avonsDpowy(n1, n2) = E

{y(n2)

2}− E

{y(n1)

2}

= wtRz(n2)w−wtRz(n1)w

= wtDRz(n1, n2)w

= ‖w‖2. (5.23)

Page 95: Algorithmes temporels rapides à point fixe pour la ...

78Chapitre 5. Méthode de SAS di�érentielle proposée pour les mélanges instantanésEn tenant ompte des relations (5.15) et (5.23), nous obtenons‖w‖2 =

q∈I

v2q . (5.24)En forçant notre ve teur w à être de norme unité, nous ontraignons ainsi leve teur {vq, q ∈ I} à être sur la sphère unité. Don , omme expliqué i-dessus,les maxima de la valeur absolue de Dkurtwtz(n1, n2) sur la surfa e de ontrainte

‖w‖ = 1 orrespondent rigoureusement aux points de séparation partielle.5.3 Résumé des méthodes proposéesLa première méthode qui résulte de l'analyse i-dessus se dé ompose enplusieurs étapes :Etape 1 Séle tionner deux intervalles temporels non re ouvrants pourestimer les paramètres statistiques (kurtosis, auto orrélation et puissan e)aux deux instants n1 et n2. Dans la plupart des as, nous avons obtenu demeilleurs résultats ave des intervalles tels que les puissan es di�érentiellesdes sour es (qui peuvent être estimées grossièrement par les puissan es di�é-rentielles des observations) sont élevées. Ces intervalles doivent être tels quetoutes les sour es non-stationnaires20 aient des puissan es di�érentielles posi-tives (dé�nies par (5.13)) et des kurtosis di�érentiels non nuls21.Les signes des puissan es di�érentielles des sour es peuvent être obtenus enestimant la matri e de orrélation di�érentielle DRx et en al ulant sa dé om-position de en ve teurs propres E∆Et. En e�et, si toutes les valeurs propressont stri tement positives, nous avons prouvé i-dessus que les P sour es utilesont toutes des puissan es di�érentielles stri tement positives (si toutes les va-leurs propres sont stri tement négatives, nous pouvons permuter les deux in-20"non-stationnaire" signi�e i i "non-stationnaire à long terme". Plus pré isément, toutesles sour es doivent être stationnaires à l'intérieur de ha un des deux intervalles temporels" ourts" asso iés aux instants n1 et n2, de sorte que leurs statistiques puissent être estiméespour ha un de es intervalles, par moyennage temporel. Cela orrespond à la "stationna-rité à ourt terme". Les sour es "utiles" évoquées i-dessus (resp. sour es de "bruit") sontdon des signaux dont les statistiques doivent varier (resp. ne pas varier) d'un des inter-valles onsidérés à l'autre, .-à-d. des sour es qui sont non-stationnaires à long terme (resp.stationnaires à long terme).21Notons que l'hypothèse Dkurtsq(n1, n2) 6= 0, ∀q ∈ I ne né essite pas que les distribu-tions des sour es aient des aplatissements di�érents aux deux instants n1 et n2. En e�et,l'aplatissement se mesure par le kurtosis normalisé dé�ni par kurts(n)/E

{s(n)2

}2, si bienqu'une sour e peut avoir des kurtosis non-normalisés di�érents mais le même aplatissementaux deux instants tant que ette sour e a des puissan es di�érentes à es instants. Don ,ex epté le as très spé i�que où les kurtosis normalisés et les puissan es au arré des sour esvarient de façon inversement proportionnelle, nous sommes sûrs que les sour es ont deskurtosis di�érentiels non nuls.

Page 96: Algorithmes temporels rapides à point fixe pour la ...

5.3. Résumé des méthodes proposées 79tervalles temporels pour les rendre toutes positives).Etape 2 Cal uler la matri e B = ∆−1/2Et à partir des matri es E et ∆dé�nies i-dessus. Cette matri e réalise une dé orrélation et une normalisationdi�érentielles des observations, .-à-d. qu'elle donne un ve teur z(n) dé�ni par(5.1) qui véri�e (5.22).Etape 3 Créer un signal de sortie y(n) dé�ni par (5.2), où w est un ve teurqui satisfait ‖w‖ = 1 et qui est adapté pour maximiser la valeur absolue dukurtosis di�érentiel de y(n), dé�ni par (5.4). Divers algorithmes peuvent êtreutilisés pour réaliser ette optimisation, par exemple en développant des ver-sions di�érentielles d'algorithmes pré édemment proposés pour le as P = N .L'appro he la plus lassique est basée sur une optimisation de type gra-dient [97℄. Nous préférons i i utiliser une méthode améliorée déduite de l'al-gorithme standard à point �xe FastICA [98℄, qui a deux avantages sur l'algo-rithme du gradient, .-à-d. sa onvergen e rapide et son absen e de paramètreréglable. Brièvement, omme l'algorithme standard FastICA, notre algorithmelinéaire instantané di�érentiel à point �xe, noté DFICA par la suite, tire partidu fait que si un ve teur d'extra tion w optimise le ritère |Dkurty(n1, n2)|,alors le gradient de Dkurty(n1, n2) a la même dire tion que w (voir [97℄ p.178). Notre équation de mise à jour utilise don le gradient du kurtosis di�é-rentiel qui est al ulé à l'annexe D, .-à-d. qu'elle utilise l'assignationw ∝

∂Dkurty(n1, n2)

∂w. (5.25)Plus pré isément, en partant d'un ve teur à norme unité quel onque w, notrealgorithme DFICA onsiste à réitérer les deux opérations suivantes :1) Mise à jour di�érentielle de w

w← E{z(n2)(w

tz(n2))3}−E

{z(n1)(w

tz(n1))3}−3[Rz(n1) + (1 + wtRz(n1)w)I

]w

∝∂Dkurty(n1, n2)

∂w(5.26)où les paramètres statistiques sont estimés par moyennage temporel.2) Normalisation de w, pour obtenir l'égalité ‖w‖ = 1, .-à-d.

w←w

‖w‖. (5.27)Etape 4 Le signal sour e non-stationnaire y(n) extrait à l'étape 3 estensuite utilisé pour soustraire ses ontributions de tous les signaux d'observa-tion. Les signaux résultants sont ensuite réutilisés ave la pro édure omplète

Page 97: Algorithmes temporels rapides à point fixe pour la ...

80Chapitre 5. Méthode de SAS di�érentielle proposée pour les mélanges instantanésdé rite i-dessus, extrayant ainsi une autre sour e, et ainsi de suite jusqu'à eque toutes les sour es non-stationnaires soient extraites. Ce i orrespond à unepro édure à dé�ation [61℄, mais une version di�érentielle de ette pro éduredoit i i être dé�nie.Cette dé�ation di�érentielle opère en réalité omme la dé�ation standard,à l'ex eption du fait que les paramètres statistiques sont rempla és par leurversion di�érentielle pour estimer les valeurs akl de la matri e de mélange A.En e�et, nous prouvons en annexe E que le fa teur d'é helle de la ontribu-tion d'une sour e extraite sl(n) dans la keme observation peut être obtenu enestimant la orrélation di�érentielle Dcorryxk(n1, n2) dé�nie par

Dcorryxk(n1, n2) = E {y(n2)xk(n2)} − E {y(n1)xk(n1)} (5.28)dont on montre qu'elle est égale à la valeur akl de la matri e de mélange A.A la pla e de la version à dé�ation de notre méthode DFICA, une extensiondi�érentielle de l'appro he symétrique dé rite dans [98℄ peut être utilisée. Laméthode DFICA symétrique résultante est omposée des étapes 1 et 2, suiviespar la réitération des deux opérations :1) Mise à jour di�érentielle des P ve teurs wi, ave i = 1, · · · , P , en utili-sant (5.26).2) Orthogonalisation symétrique des ve teurs wi, .-à-d.

W←(WWt

)−1/2W (5.29)où W = [w1, · · · ,wP ]t.5.4 Preuves de onvergen eConsidérons les expressions de mise à jour (5.26)-(5.27) de notre algorithmedi�érentiel à dé�ation. Le signal de sortie y(n) peut être exprimé en fon -tion des sour es suivant (5.5) ave v = Mtw et M = BA. De plus, nousavons prouvé i-dessus que le kurtosis di�érentiel de y(n) dépend seulementdes sour es utiles (dont les indi es appartiennent à I) et de la sous-matri easso iée A. Don , en onsidérant la omposante globale y(n) de y(n) or-respondant aux sour es non-stationnaires, on peut réaliser le hangement devariable v = Mtw où la matri e M = BA ombine les étages de mélange et deblan himent di�érentiel pour les sour es non-stationnaires. Nous avons don

y(n) = vts(n) (5.30)où le ve teur olonne s(n) ontient seulement les valeurs des sour es non-stationnaires, .-à-d. sq(n) ave q ∈ I. Pour la lisibilité, nous omettrons i i les

Page 98: Algorithmes temporels rapides à point fixe pour la ...

5.4. Preuves de onvergen e 81instants n1 et n2 dans la notation du kurtosis di�érentiel.La loi de mise à jourw←

∂Dkurtwtz

∂w(5.31)s'é rit don

w ←∂v

∂w

∂Dkurtwtz

∂v. (5.32)Comme Dkurtwtz = Dkurtvts = Dkurtvts, nous pouvons réé rire (5.32) sui-vant

w← M∂Dkurtvts

∂v. (5.33)L'expression de mise à jour de v s'é rit don

v = Mtw← MtM∂Dkurtvts

∂v. (5.34)En ombinant (5.1) et (5.20), on obtient

DRz(n1, n2) = BDRx(n1, n2)Bt

= BAAtBt

= MMt (5.35)et en onsidérant (5.22)MMt = I. (5.36)

M est don orthogonale et nous avonsMtM = I. (5.37)Ainsi l'expression de mise à jour (5.34) devient

v←∂Dkurtvt s

∂v. (5.38)En onsidérant l'éq. (5.10) et en prenant en ompte le fait que le ve teur v ontient seulement les oe� ients des sour es non-stationnaires si, i ∈ I, nouspouvons exprimer l'équation de mise à jour de haque omposante de v dans(5.38) suivant

vi ← 4Dkurtsiv3

i ∝ Dkurtsiv3

i (5.39)En hoisissant j ∈ I de sorte que Dkurtsj6= 0 et vj 6= 0, nous obtenons

|vi|

|vj|←|Dkurtsi

|

|Dkurtsj|

(|vi|

|vj |

)3

, ∀i ∈ I. (5.40)Cette équation de ré urren e nous permet d'obtenir l'expression analytique de|vi||vj |

:|vi(k)|

|vj(k)|=

√∣∣∣∣

Dkurtsj

Dkurtsi

∣∣∣∣.

(√∣∣∣∣

Dkurtsi

Dkurtsj

∣∣∣∣

∣∣∣∣

vi(0)

vj(0)

∣∣∣∣

)3k

. (5.41)

Page 99: Algorithmes temporels rapides à point fixe pour la ...

82Chapitre 5. Méthode de SAS di�érentielle proposée pour les mélanges instantanésToutes les omposantes vi(k) sauf elle vj(k) qui véri�ej = argmaxp

(√|Dkurtsp

||vp(0)|) deviennent don rapidement petites ompa-rées à vj(k). Ave la normalisation ‖w‖ = 1 qui implique ‖v‖ = 1 en raisonde l'orthogonalité de la matri e M, nous on luons que vj(k) → ±1 et que

vi(k)→ 0, ∀i 6= j.Nous avons don prouvé que v onverge vers un ve teur ayant seulement unélément non nul (égal à ±1). Cela implique la séparation partielle des sour esutiles, ar y(n) = vts(n). Ainsi, nous avons prouvé la onvergen e globale ( .-à-d. quel que soit v(0)) de notre algorithme. De plus, ette onvergen e est ubique ( omme pour l'algorithme (sur-)déterminé FastICA [98℄), e qui veutdire une onvergen e très rapide.Pour notre algorithme symétrique, la même appro he que [142℄ peut êtreutilisée dans le as di�érentiel. En e�et, dans le as (sur-)déterminé, Oja aprouvé que quand les mises à jour obéissent aux loisvpq ← kurtsq

(n) v3pq (5.42)pour la qeme omposante de haque ve teur d'extra tion vp, es mises à jour ombinées ave l'orthogonalisation symétriqueW← (WWt)−1/2W entraînentune onvergen e ubique vers les points de séparation et la stabilité de l'al-gorithme dans le voisinage des points séparants, omme dans l'algorithme àdé�ation.En remarquant que notre algorithme di�érentiel donne (5.39), qui est équi-valent à (5.42) ave q = i, ex epté que les kurtosis standard kurtsq

(n) sontrempla és par leur version di�érentielle Dkurtsi(n1, n2), nous prouvons rigou-reusement la onvergen e ubique de notre algorithme di�érentiel symétrique.5.5 Con lusionDans e hapitre, nous avons proposé un algorithme de type point �xe pourla séparation partielle de mélanges linéaires instantanés sous-déterminés. Nousavons introduit le pro essus de blan himent di�érentiel qui permet d'obtenirun algorithme d'optimisation à point �xe dont nous démontrons la onvergen e ubique et la stabilité. Deux versions de notre algorithme, baptisé DFICA, sontproposées : une version à dé�ation qui estime les sour es itérativement et uneversion parallèle. Pour estimer les ontributions de sour es à soustraire desobservations durant le pro essus de dé�ation, nous proposons de al uler la orrélation di�érentielle entre deux instants.

Page 100: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 6Méthode de SAS di�érentielleproposée pour les mélanges onvolutifs6.1 Introdu tionDans le as onvolutif, nous étendons i i notre algorithme temporel à point�xe dénommé C-FICA aux mélanges sous-déterminés. Notre appro he est ba-sée sur le on ept de séparation di�érentielle de sour es et sur un pro essusde blan himent di�érentiel onvolutif non- ausal qui permet l'utilisation demises à jour de type point �xe pour l'optimisation du kurtosis di�érentiel in-troduit dans le hapitre pré édent. L'estimation des ontributions des sour esest réalisée au moyen d'un ritère quadratique di�érentiel que nous dé�nissons.6.2 Utilisation du kurtosis di�érentiel dans le as onvolutifNous supposons i i avoir le même modèle de mélange que elui dé rit dansle hapitre 1 (1.4) ex epté que ette fois le nombre de sour es est supérieurau nombre d'observations (N > P ). Nous her hons i i à étendre notre algo-rithme de séparation onvolutif C-FICA au as sous-déterminé, en utilisantle on ept de SAS di�érentielle introduit dans [67℄. L'algorithme résultant estdon appelé C-DFICA dans la suite. Dé�nissons à nouveau y(n) par (2.7),(2.8) et (2.11) où B et w seront séle tionnés omme expliqué i-dessous.Comme dans le hapitre 5, nous notons kurty(n1) et kurty(n2) resp. leskurtosis non-normalisés de y(n) pour deux instants n1 et n2, et nous dé�nissonsson kurtosis di�érentiel non-normalisé par (5.4). En ombinant les dé�nitions(2.7), (2.8) et (2.11) de y(n) ave (2.4), on montre que y(n) est une ombinaison83

Page 101: Algorithmes temporels rapides à point fixe pour la ...

84Chapitre 6. Méthode de SAS di�érentielle proposée pour les mélanges onvolutifslinéaire de versions dé alées des pro essus uk(n) .-à-d.y(n) =

N∑

q=1

Dmax∑

d=Dmin

vqduq(n− d) (6.1)où Dmin et Dmax sont obtenus à partir des ordres des �ltres RIF impliquésdans (2.4) et (2.7).Les pro essus uq(n) sont i i en ore supposés entrés, à valeurs réelles, mu-tuellement et temporellement indépendants. P d'entre eux sont en ore sup-posés non-stationnaires à long terme (don non identiquement distribués) et orrespondent aux sour es utiles, alors que les N −P autres sont stationnaireset orrespondent aux sour es de "bruit". En utilisant la multi-linéarité du kur-tosis pour des variables aléatoires indépendantes, nous en déduisons à partirde (5.4) et (6.1)Dkurty(n1, n2) =

N∑

q=1

Dmax∑

d=Dmin

v4qd

[kurtuq

(n2 − d)− kurtuq(n1 − d)

]

=N∑

q=1

Dmax∑

d=Dmin

v4qdαqd, (6.2)où

αqd = Dkurtuq(n1 − d, n2 − d) (6.3)est dé�ni omme dans (5.4). Comme dans le as linéaire instantané, notons

I l'ensemble ontenant les P indi es des sour es non-stationnaires in onnues.Les hypothèses i-dessus de notre on ept de SAS di�érentielle signi�ent queseuls les pro essus uq(n) ave q /∈ I sont supposés avoir le même kurtosis à desinstants di�érents, .-à-d.∀q /∈ I, ∀d ∈ [Dmin..Dmax] , kurtuq

(n1 − d) = kurtuq(n2 − d). (6.4)Ainsi nous avons

Dkurty(n1, n2) =∑

q∈I

Dmax∑

d=Dmin

v4qdαqd. (6.5)Nous voyons don que les sour es de bruit (dont les indi es n'appartiennent pasà l'ensemble I) sont invisibles pour notre ritère de séparation di�érentielle.En faisant une extension du as instantané, nous onsidérons i i les valeursde (6.5) sur la sphère unité de dimension22 P ×D où D = Dmax −Dmin + 1, .-à-d. l'ensemble {vqd, q ∈ I, d ∈ [Dmin, · · · , Dmax]} tel que

q∈I

Dmax∑

d=Dmin

v2qd = 1. (6.6)22Les mélanges onvolutifs entraînent une légère approximation on ernant les points de ette sphère que l'on peut atteindre, omme on l'expliquera dans la se tion 6.3.

Page 102: Algorithmes temporels rapides à point fixe pour la ...

6.2. Utilisation du kurtosis di�érentiel dans le as onvolutif 85On peut d'abord montrer fa ilement que la puissan e di�érentielle de y(n), ànouveau dé�nie par (5.13), s'é rit i iDpowy(n1, n2) =

q∈I

Dmax∑

d=Dmin

v2qdDpowuq

(n1 − d, n2 − d). (6.7)Chaque pro essus uq(n) ave q ∈ I est supposé i i être non-stationnaire entren1 et n2. Néanmoins, il est supposé être identiquement distribué à tous lesinstants ni − d où d varie de Dmin à Dmax. En pratique, ela signi�e que nousséle tionnons n1 et n2 tels que n2−n1 ≫ D, et que uq(n) est non-stationnaireà long terme entre les instants n1 et n2 mais stationnaire à ourt terme àl'intérieur de haque fenêtre [ni −Dmin, ni −Dmax] ave i = 1 ou 2. Les termesDpowuq

(n1 − d, n2 − d) dans (6.7) ne dépendent don pas de d, .-à-d. que(6.7) implique seulement une puissan e di�érentielle Dpowuq(n1, n2) uniquepour haque sour e non-stationnaire. Ces puissan es di�érentielles peuvent êtreremises à l'é helle ave un fa teur positif grâ e à l'indétermination d'é hellepropre à la SAS. Ainsi, si elles sont stri tement positives, elles peuvent êtresupposées égales à 1 si bien que (6.7) devient

Dpowy(n1, n2) =∑

q∈I

Dmax∑

d=Dmin

v2qd. (6.8)Don , si DRx(n1, n2) = E∆Et est la dé omposition en ve teurs propres de

DRx(n1, n2) dé�nie pour x omme dans (5.16), nous dé�nissons B par B =∆−1/2Et. Ainsi, en dé�nissant z par (2.8), nous pouvons prouver omme dans(5.22) que

DRz(n1, n2) = I (6.9) e qui implique, en utilisant la même appro he que dans (5.23) mais maintenantave (2.11),Dpowy(n1, n2) = ‖w‖2 (6.10)si bien que grâ e à (6.8)‖w‖2 =

q∈I

Dmax∑

d=Dmin

v2qd. (6.11)Faire varier w ave ‖w‖ = 1 permet don de ontraindre de façon simple notreve teur {vqd, q ∈ I, d ∈ [Dmin, · · · , Dmax]} à être sur la sphère unité (6.6) dansle as onvolutif sous-déterminé.L'optimisation de la valeur absolue du kurtosis di�érentiel Dkurty(n1, n2)dé�ni par (6.2), sous la ontrainte (6.6) appartient don au même type de pro-blème qu'ave (5.11)-(5.12), ave un jeu de variables notées i i vqd au lieu de

vq. En appliquant à nouveau les résultats de [61℄, [97℄ qui étaient déjà utilisés

Page 103: Algorithmes temporels rapides à point fixe pour la ...

86Chapitre 6. Méthode de SAS di�érentielle proposée pour les mélanges onvolutifsdans le hapitre 5, on garantit i i que les maxima de |Dkurty(n1, n2)| sur lasphère unité orrespondent aux points tels qu'une seule des variables onsidé-rées vqd, ave q ∈ I, est non nulle. L'éq. (6.1) montre que le signal de sortie se ompose alors seulement d'une version pondérée et dé alée el(n) du pro essusul(n) asso ié à une sour e non-stationnaire (ainsi que des ontributions dessour es stationnaires).Nous olorons ensuite el(n) pour estimer ses ontributions dans haqueobservation. Ce i est réalisé i i en adaptant la solution de Wiener que nousavons utilisée dans la partie I du manus rit, .-à-d. en introduisant un �ltragede Wiener di�érentiel, que nous dé�nissons omme suit.Considérons la di�éren e x′

k(n) entre l'observation xk(n) et une version�ltrée du signal extrait pré édent el(n) ave l ∈ I, .-à-d.x′

k(n) = xk(n)−R′

r=−R′

c(r)el(n− r) (6.12)où les c(r) sont les oe� ients d'un �ltre RIF non ausal. En raison des hypo-thèses de la se tion 2.1, xk(n) est un mélange RIF ausal de tous les pro essusd'innovation, .-à-d. que (2.4) nous donnexk(n) =

N∑

q=1

L∑

r=0

hkq(r)uq(n− r). (6.13)De plus,el(n) = βlul(n− rl) +

q /∈I

p

βqpuq(n− p) (6.14)où les bornes de p ne sont pas pré isés i i ar le termes orrespondants s'an-nulent plus bas dans (6.18). Don , si R′ est assez grand pour que rl − R′ ≤ 0et rl + R′ ≥ L, (6.12)-(6.14) nous donnentx′

k(n) =

rl+R′

r=rl−R′

[hkl(r)− βlc(r − rl)]ul(n− r)

+∑

q∈I,q 6=l

L∑

r=0

hkq(r)uq(n− r) +∑

q /∈I

p

γkq(p)uq(n− p) (6.15)où les poids γkq(p) dépendent de c(r), hkq(r) et βqp. Ces termes et les bornessur p n'ont pas besoin d'être dé�nis i i pour les mêmes raisons que plus haut.La puissan e di�érentielle de x′k(n) est dé�nie par

Dpowx′

k(n1, n2) = E

{x′

k(n2)2}− E

{x′

k(n1)2}

. (6.16)Sa hant que tous les pro essus d'innovation sont entrés, mutuellement et tem-porellement indépendants, et queDpowuq

(n1 − p, n2 − p) = 0, ∀p ∈ {1..N}, ∀q /∈ I, (6.17)

Page 104: Algorithmes temporels rapides à point fixe pour la ...

6.2. Utilisation du kurtosis di�érentiel dans le as onvolutif 87les éq. (6.15) et (6.16) donnentDpowx′

k(n1, n2) =

rl+R′

r=rl−R′

[hkl(r)− βlc(r − rl)]2Dpowul

(n1 − r, n2 − r)

+∑

q∈I,q 6=l

L∑

r=0

h2kq(r)Dpowuq

(n1 − r, n2 − r). (6.18)Comme nous avons supposé que toutes les puissan es di�érentiellesDpowul

(n1−r, n2−r) ave l ∈ I sont stri tement positives, l'éq. (6.18) montreque la minimisation de Dpowx′

k(n1, n2) en fon tion de c(r) orrespond exa te-ment à

hkl(r)− βlc(r − rl) = 0, ∀r ∈ [rl − R′, · · · , rl + R′]. (6.19)En omparant e résultat ave (6.15), nous en déduisons que pour obtenir uneobservation modi�ée x′k(n) où la ontribution de la leme sour e a été enlevée onsiste à minimiser Dpowx′

k(n1, n2). Nous utilisons la méthode de Newtonpour optimiser e ritère, qui est noté J dans la suite et peut être exprimé par

J = E

{(xk(n2)−

R′

r=−R′

c(r)el(n2−r))2}

−E

{(xk(n1)−

R′

r=−R′

c(r)el(n1−r))2}

.(6.20)L'équation de mise à jour du ve teur c = [c(−R′), · · · , c(R′)]t s'é ritc← c−

(∂2J

∂c2

)−1∂J

∂c(6.21)où ∂J

∂cet ∂2J

∂c2 sont respe tivement le gradient et le Hessien du ritère J . Cal u-lons la ieme omposante du gradient de J par rapport à c :∂J

∂ci= 2E

{

− el(n2 − i).(xk(n2)−

R′

r=−R′

c(r)el(n2 − r))}

−2E

{

− el(n1 − i).(xk(n1)−

R′

r=−R′

c(r)el(n1 − r))}

. (6.22)En parti ulier∂J

∂ci

∣∣∣∣c=0

= 2E {−el(n2 − i)xk(n2)} − 2E {−el(n1 − i)xk(n1)} . (6.23)Don nous avons∂J

∂c

∣∣∣∣c=0

= −2 (relxk(n2)− relxk

(n1)) (6.24)

Page 105: Algorithmes temporels rapides à point fixe pour la ...

88Chapitre 6. Méthode de SAS di�érentielle proposée pour les mélanges onvolutifsoù relxk(np) est le ve teur d'inter orrélation entre les signaux el(np − i), ave

i ∈ [−R′, R′] et xk(np), ave p = 1 ou 2. Cal ulons maintenant la (i, j)eme omposante du Hessien de J :∂2J

∂ci∂cj

= 2E {el(n2 − i)el(n2 − j)} − 2E {el(n1 − i)el(n1 − j)} . (6.25)Don , nous avons∂2J

∂c2= 2 (Rel

(n2)−Rel(n1)) (6.26)où Rel

(np) est la matri e d'auto orrélation asso iée aux valeurs de el(n) autourde n = np. En initialisant c ave c = 0, la valeur de c après une itération del'algorithme de Newton s'é ritc′ = −

(∂2J

∂c2

)−1∂J

∂c

∣∣∣∣c=0

= −1

2(Rel

(n2)−Rel(n1))

−1 (−2) (relxk(n2)− relxk

(n1))

= (Rel(n2)−Rel

(n1))−1 (relxk

(n2)− relxk(n1)) . (6.27)Sa hant que l'algorithme de Newton atteint un point stationnaire en une itéra-tion pour les ritères quadratiques et que notre ritère est quadratique positif,nous prouvons que le ve teur c′ orrespond au maximum global de J . Notonsque ette expression est une version di�érentielle du �ltre de Wiener standarddé�ni par (2.46).6.3 Résumé de la méthode proposéeNous proposons la pro édure suivante pour réaliser la séparation partiellerapide des mélanges onvolutifs sous-déterminés. Cette pro édure est basée surune version adaptée d'algorithme à point �xe et sur notre pro essus de �ltragedi�érentiel pour estimer les ontributions des sour es dans les observationsdans le ontexte d'une appro he à dé�ation.Etape 1 Séle tionner deux intervalles temporels non re ouvrants en uti-lisant le même type d'appro he que dans le hapitre 5.Etape 2 Estimer la matri e de orrélation di�érentielle DRx(n1, n2) duve teur d'observations étendu x. Cal uler ensuite la dé omposition en ve teurspropres de ette matri e. Cela nous donne une matri e E dont les olonnessont les ve teurs propres de norme unité de l'estimée de DRx(n1, n2), ainsiqu'une matri e diagonale ∆ qui ontient les valeurs propres de l'estimée de

DRx(n1, n2). Cal uler ensuite la matri e B = ∆−1/2Et. Nous obtenons ainsiun ve teur z(n) dé�ni par (2.8) qui véri�e (6.9).

Page 106: Algorithmes temporels rapides à point fixe pour la ...

6.3. Résumé de la méthode proposée 89Etape 3 Initialiser le ve teur d'extra tion w, en utilisant (2.29) ommepour l'algorithme C-FICA mais ave la nouvelle matri e B dé�nie à l'étape 2.Créer un signal de sortie y(n) dé�ni par (2.11), où w est un ve teur norma-lisé qui est adapté pour maximiser la valeur absolue du kurtosis di�érentiel dey(n). La même appro he que dans l'étape 3 de la se tion 5.2 peut être utilisée.Cela nous donne l'algorithme C-DFICA dé�ni omme suit :1) Mise à jour di�érentielle de w

w← E{z(n2)(w

tz(n2))3}−E

{z(n1)(w

tz(n1))3}−3[Rz(n1) + (1 + wtRz(n1)w)I

]w

∝∂Dkurty(n1, n2)

∂w(6.28)2) Normalisation de w, pour véri�er la ondition ‖w‖ = 1, .-à-d.

w←w

‖w‖. (6.29)

Etape 4 Le pro essus non-stationnaire ul(n) extrait par y(n) dans l'étape3 est ensuite oloré au moyen de notre �ltrage de Wiener di�érentiel introduitdans la se tion pré édente a�n d'estimer les ontributions de la sour e or-respondante dans haque observation. Ce �ltre minimise la puissan e di�éren-tielle de la di�éren e entre une observation et une version �ltrée non ausaleckl(n) ∗ y(n) du signal y(n). Nous avons démontré la onsistan e de ette mi-nimisation et avons établi l'expression des �ltres de oloration qui la réalisent, .-à-d.

ckl = (Rel(n2)−Rel

(n1))−1 (relxk

(n2)− relxk(n1)) . (6.30)Comme ave les fon tions statistiques kurtosis et puissan e, nous avons prouvéque e pro essus de oloration ne dépend pas des sour es de bruit. Les signauxrésultants ckl(n) ∗ y(n) sont ensuite soustraits des observations. Les étapes 2à 4 sont ensuite réitérées jusqu'à e que tous les pro essus d'innovation soientextraits.Nous n'introduisons pas i i de version symétrique pour et algorithme dif-férentiel destiné aux mélanges onvolutifs. En e�et, omme nous le développe-rons dans la pro haine se tion, les mélanges onvolutifs peuvent être expriméssous forme de mélanges instantanés de multiples versions dé alées des sour eset augmentent don onsidérablement la dimensionnalité de l'espa e d'opti-misation par rapport au hapitre 5. Nous é onomisons don énormément demémoire et de temps de al ul en extrayant les pro essus d'innovation les unsaprès les autres.

Page 107: Algorithmes temporels rapides à point fixe pour la ...

90Chapitre 6. Méthode de SAS di�érentielle proposée pour les mélanges onvolutifs6.4 Reformulation du mélange sous forme linéaireinstantanéeDans ha un des signaux de mélange de x(n) dé�nis par (2.7), nous onsidé-rons i i seulement la omposante engendrée par les sour es non-stationnaires, ar le ritère de SAS i-dessus dépend seulement de ette omposante. L'ana-lyse de la se tion 2.5 on ernant les mélanges onvolutifs (sur-)déterminésmontre que es mélanges peuvent être interprétés omme des mélanges li-néaires instantanés de multiples versions pondérées et dé alées des pro essusuq(n) ave q ∈ I. En parti ulier, l'analyse montre que si Q est l'ordre de H(n)dans (2.4), et si l'inégalité

PL ≥ N(Q + L) (6.31)est véri�ée, où L = (2R + 1) est le nombre de dé alages, P est le nombre demélanges et N est le nombre de sour es non-stationnaires, alors x(n) est unmélange linéaire instantané (sur-)déterminé de versions dé alées et pondéréesdes pro essus uq(n) ave q ∈ I. La preuve de onvergen e obtenue dans lase tion 5.3 dans le as instantané peut don être appliquée à notre algorithme onvolutif di�érentiel, e qui garantit i i à nouveau la onvergen e globale u-bique.Si (6.31) n'est pas véri�ée, e qui est en parti ulier le as quand P = N ,le mélange reformulé de manière instantanée est sous-déterminé. Cette sous-détermination est liée à l'ordre �ni des �ltres d'extra tion équivalents de (2.5).Néanmoins, quand le rapport PL/[N(Q + L)] asso ié à (6.31) tend vers 1 ( equi est le as quand P = N et L est grand), notre on�guration est presque dé-terminée .-à-d. que la matri e de mélange instantanée équivalente est presque arrée. On peut don en ore obtenir quasiment une estimation d'un pro essusuq(n) en maximisant la valeur absolue du kurtosis di�érentiel non-normalisésous la ontrainte d'une puissan e di�érentielle unitaire.Evoquons maintenant l'approximation que nous avons mentionnée dans lase tion 6.2 on ernant les points de la sphère unité a essibles en onvolu-tif. Dans le as linéaire instantané sous-déterminé, v = Mtw, où M est unematri e orthogonale. Don , faire varier w permet d'atteindre n'importe quellevaleur de v, et en parti ulier toute la sphère unité. Le même résultat s'appliqueaux mélanges onvolutifs si (6.31) est véri�ée par e que, omme expliqué dansla se tion 2.5, es mélanges peuvent être reformulés omme des mélanges li-néaires instantanés. Au ontraire, quand on onsidère des mélanges onvolu-tifs tels que (6.31) n'est pas véri�ée, on ne peut pas garantir que tout point{vqd, q ∈ I, d ∈ [Dmin, · · · , Dmax]} de la sphère unité peut être atteint en fai-sant varier w. Cependant, et e�et devient négligeable quand PL/[N(K + L)]se rappro he de 1, omme expliqué i-dessus. Ce phénomène est don ignorédans e do ument.

Page 108: Algorithmes temporels rapides à point fixe pour la ...

6.5. Con lusion 916.5 Con lusionNous avons proposé dans e hapitre un algorithme rapide de type point�xe opérant dans le domaine temporel et destiné à la séparation de mélanges onvolutifs sous-déterminés. Notre appro he, baptisée C-DFICA, est basée surun pro essus de blan himent di�érentiel spatio-temporel (ou onvolutif) non- ausal des observations qui permet d'appliquer des itérations d'optimisation àpoint �xe pour optimiser le ritère du kurtosis di�érentiel. Nous avons prouvésous ertaines onditions la onvergen e et la stabilité de notre méthode àdé�ation vers les valeurs optimales du kurtosis di�érentiel. Nous proposonsd'estimer les ontributions des sour es sur les apteurs grâ e au al ul d'un�ltre de Wiener di�érentiel non- ausal qui permet de minimiser un ritèrequadratique di�érentiel dé�ni omme la di�éren e entre deux instants de lapuissan e de l'é art entre une observation et une version �ltrée non- ausale dupro essus d'innovation extrait.

Page 109: Algorithmes temporels rapides à point fixe pour la ...

92Chapitre 6. Méthode de SAS di�érentielle proposée pour les mélanges onvolutifs

Page 110: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 7Résultats expérimentaux7.1 Introdu tionDans e hapitre destiné à valider expérimentalement nos algorithmes dif-férentiels rapides DFICA et C-DFICA, omme dans la partie pré édente, nous ommençons par illustrer le fon tionnement de nos méthodes en les testant surdes mélanges linéaires instantanés et onvolutifs de sour es de télé ommuni a-tions et de sour es audio. Pour haque expérien e réalisée, nous donnons aussiles performan es de séparation obtenues ave les méthodes non-di�érentiellesasso iées FastICA et C-FICA. Ensuite, nous e�e tuons une analyse statistiquepour évaluer la robustesse de nos méthodes en fon tion de la puissan e du bruitstationnaire présent dans les mélanges. Nous omparons aussi les performan eset la rapidité de notre algorithme C-DFICA ave une version di�érentielle del'algorithme de Tugnait développée auparavant dans l'équipe.7.2 Séparation de mélanges linéaires instantanésde signaux télé omsNous avons i i e�e tué une simulation de séparation d'un mélange linéaireinstantané sous-déterminé de deux sour es télé oms AM démodulées à 4 étatset d'une sour e de bruit stationnaire. Nous avons hoisi i i une sour e station-naire uniformément répartie entre -2 et 2 ( e qui orrespond à une sour e depuissan e 1.3) et une matri e de mélange égale à

A =

[1 0.9 1

0.9 1 1

] (7.1)et dont la dernière olonne est asso iée à la sour e de bruit. Sur les deuxdomaines ontenant ha un 100000 é hantillons, les deux sour es AM sontrespe tivement de puissan es 1 et 0.01. Le SNRin orrespondant à ette on�-guration est de -14 dB en moyenne sur les deux domaines.93

Page 111: Algorithmes temporels rapides à point fixe pour la ...

94 Chapitre 7. Résultats expérimentauxLa �gure 7.1 représente de haut en bas les deux sour es AM sur une partiedu domaine 1, les deux observations sur le même domaine et les deux sour esséparées auxquelles ont été enlevées les omposantes de bruit stationnaire.On onstate que les sour es séparées sont visuellement identiques aux sour esréelles malgré la forte présen e de bruit dans les observations.Pour mesurer la performan e de séparation, nous avons i i utilisé un ritèredé�ni à partir de la matri e P × N dite de performan e G = [gij] qui estle produit de la matri e de mélange et de la matri e de séparation partielleestimée. Le ritère de performan es pour le j eme signal sour e s'é rit :

∀j ∈ I, Perf(j) = maxi 10 log10

(

g2ij

∑k 6=jk∈I g2

ik

)

. (7.2)Le ritère Perf(j) résultant est ensuite moyenné sur l'indi e j pour obtenir un ritère unique Perf pour une matri e de performan es G donnée. Le ritèrede performan es obtenu par notre algorithme DFICA symétrique pour ettesimulation est de 43.8 dB ontre 0.1 dB pour l'algorithme FastICA symétriquestandard.Nous avons aussi testé les versions à dé�ation des algorithmes standard etdi�érentiel. Les SIRout obtenus pour les deux sour es ont été respe tivementde 33.2 dB et 32.5 dB pour notre algorithme DFICA (32.3 et 31.6 dB de SIRI)et de 3.0 dB et -21.5 dB pour l'algorithme FastICA standard (2.07 et -22.4 dBde SIRI)23.

23Les dé�nitions des paramètres SIRout et SIRI utilisés dans le as d'une séparationpartielle sont données en annexe F.

Page 112: Algorithmes temporels rapides à point fixe pour la ...

7.2. Séparation de mélanges linéaires instantanés de signaux télé oms 951000 1050 1100 1150 1200 1250 1300

−1.5

−1

−0.5

0

0.5

1

1.5 s1(n)

n

1000 1050 1100 1150 1200 1250 1300

−1.5

−1

−0.5

0

0.5

1

1.5 s2(n)

n

1000 1050 1100 1150 1200 1250 1300−5

0

5x1(n)

n

1000 1050 1100 1150 1200 1250 1300−5

0

5x2(n)

n

1000 1050 1100 1150 1200 1250 1300

−1.5

−1

−0.5

0

0.5

1

1.5 y1(n)

n

1000 1050 1100 1150 1200 1250 1300

−1.5

−1

−0.5

0

0.5

1

1.5 y2(n)

nFig. 7.1 � De haut en bas : sour es 1 et 2, observations 1 et 2, sour es estiméessans leur omposante de bruit.

Page 113: Algorithmes temporels rapides à point fixe pour la ...

96 Chapitre 7. Résultats expérimentaux7.3 Séparation de mélanges linéaires instantanésde signaux audio

Nous avons e�e tué la même simulation que dans la se tion pré édente enremplaçant les deux sour es télé oms par deux sour es audio orrespondant àl'enregistrement de deux instruments (piano et basse) pendant 15 se ondes àune fréquen e d'é hantillonnage de 44 kHz et dont nous avons séle tionné deuxdomaines de 100000 é hantillons pour appliquer notre méthode di�érentielle(les deux domaines orrespondent aux intervalles [2.105, 3.105] et [5.105, 6.105]).Les deux sour es sont de puissan es 1.0 et 0.26 sur le premier domaine et depuissan es 0.04 et 0.01 sur le se ond domaine. Nous avons hoisi la mêmesour e de bruit et la même matri e de mélange que dans la se tion pré édente.Le SNRin orrespondant à ette on�guration est de -19.6 dB en moyenne surles deux domaines de 100000 é hantillons.La �gure 7.2 représente de haut en bas le signal sour e de basse, le signalde piano, les deux observations et les deux sour es séparées sans leur ompo-sante de bruit. Comme dans le se tion pré édente, malgré la forte présen ede bruit, les sour es estimées sont visuellement identiques aux sour es réelles.L'indi e de performan es obtenu est de 37.3 dB pour notre algorithme di�éren-tiel DFICA symétrique ontre 4.2 dB pour l'algorithme FastICA symétriquestandard. Comme dans la se tion pré édente, nous avons testé les versions àdé�ation des algorithmes DFICA et FastICA. Les SIRI obtenus pour les deuxsour es ont été respe tivement de 19.3 dB et 25.6 dB pour notre algorithmeDFICA (24.2 et 18.9 dB de SIRI) et de 4.6 dB et -2.0 dB pour l'algorithmeFastICA standard (7.3 et -6.6 dB de SIRI).

Page 114: Algorithmes temporels rapides à point fixe pour la ...

7.3. Séparation de mélanges linéaires instantanés de signaux audio 970 1 2 3 4 5 6

5

−2

−1

0

1

2s1(n)

n(∗105)

0 1 2 3 4 5 65

−3

−2

−1

0

1

2

3

s2(n)

n(∗105)

0 1 2 3 4 5 65

−10

−5

0

5

10

x1(n)

n(∗105)

0 1 2 3 4 5 65

−10

−5

0

5

10

x2(n)

n(∗105)

0 1 2 3 4 5 65

−3

−2

−1

0

1

2

3

y1(n)

n(∗105)

0 1 2 3 4 5 65

−6

−4

−2

0

2

4

6

y2(n)

n(∗105)Fig. 7.2 � De haut en bas : sour es 1 et 2, observations 1 et 2, sour es estiméessans leur omposante de bruit.

Page 115: Algorithmes temporels rapides à point fixe pour la ...

98 Chapitre 7. Résultats expérimentaux7.4 Séparation de mélanges onvolutifs de signauxtélé omsDans ette se tion, nous avons réalisé une simulation de séparation d'un mé-lange onvolutif des deux sour es télé oms AM à 4 états utilisées pré édem-ment. Comme dans la se tion 7.1, les deux sour es omportant 100000 é han-tillons sur haque domaine sont de puissan e 1 sur le premier domaine et depuissan e 0.01 sur le deuxième. La sour e stationnaire est une sour e unifor-mément répartie entre -0.5 et +0.5 e qui orrespond à une puissan e24 de0.082. Nous obtenons dans ette on�guration un SNRin moyen sur les deuxdomaines de 1.0 dB. Le jeu de �ltres de 5 oe� ients a été généré par unefon tion uniformément répartie entre 0 et 1.La �gure 7.3 représente les deux sour es utilisées sur une plage de 300é hantillons. La �gure 7.4 représente de haut en bas les deux observations dumélange, les deux ontributions réelles des sour es 1 et 2 respe tivement surles apteurs 1 et 2 et les deux estimations de es ontributions. Les SIRout des ontributions estimées sont respe tivement de 21.4 dB et 19.4 dB (les SIRIsont respe tivement de 19.1 dB et 20.1 dB) alors que l'on obtient dans la même on�guration ave l'algorithme C-FICA non-di�érentiel des valeurs de SIRoutde 13.0 dB et 8.7 dB (pour des SIRI de 10.7 dB et 9.4 dB).1000 1050 1100 1150 1200 1250 1300

−1.5

−1

−0.5

0

0.5

1

1.5s1(n)

n

1000 1050 1100 1150 1200 1250 1300

−1.5

−1

−0.5

0

0.5

1

1.5 s2(n)

nFig. 7.3 � Sour es utilisées 1 et 2 orrespondant à des signaux télé oms AMdémodulés à 4 états.24En onvolutif, nous avons dû diminuer la puissan e de bruit pour obtenir une séparation orre te du mélange.

Page 116: Algorithmes temporels rapides à point fixe pour la ...

7.4. Séparation de mélanges onvolutifs de signaux télé oms 992000 2050 2100 2150 2200 2250 2300

−1.5

−1

−0.5

0

0.5

1

1.5x1(n)

n

2000 2050 2100 2150 2200 2250 2300−1.5

−1

−0.5

0

0.5

1

1.5x2(n)

n

1000 1050 1100 1150 1200 1250 1300−4

−3

−2

−1

0

1

2

3

4x21(n)

n

1000 1050 1100 1150 1200 1250 1300−6

−4

−2

0

2

4

6x22(n)

n

1000 1050 1100 1150 1200 1250 1300−5

0

5x21(n)

n

1000 1050 1100 1150 1200 1250 1300−6

−4

−2

0

2

4

6x22(n)

nFig. 7.4 � De haut en bas : observations 1 et 2, ontributions réelles des sour es1 et 2 sur le apteur 2, ontributions estimées sans leur omposante de bruit.

Page 117: Algorithmes temporels rapides à point fixe pour la ...

100 Chapitre 7. Résultats expérimentaux7.5 Tests statistiquesNous her hons à omparer les performan es de nos méthodes pour mé-langes sous-déterminés ave leur versions non di�érentielles .-à-d. les algo-rithmes FastICA et C-FICA. Nous avons d'abord testé notre méthode à dé�a-tion DFICA pour mélanges linéaires instantanés sous-déterminés dans le asN = 5, P = N = 2, où les deux sour es non-stationnaires orrespondent àdes signaux sonores de basse et de piano [63℄ ave 100000 é hantillons sur ha- un des deux domaines temporels. Les trois sour es de bruit sont des signauxstationnaires de même puissan e orrespondant à des distributions uniforme,gaussienne et lapla ienne. Leur fa teur d'é helle et leur puissan e résultanteont été variés dans nos tests pour mesurer l'évolution des performan es en fon -tion du SNRin des observations. Nous moyennons les deux valeurs de SNRinasso iées aux deux domaines temporels.Pour haque fa teur d'é helle appliqué aux sour es de bruit normalisées,nous avons réalisé 100 simulations de Monte-Carlo en faisant varier les oe�- ients de la matri e de mélange ave une distribution uniforme dans [−0.5, 0.5].Les performan es de notre méthode de SAS sont mesurées par son Rapport Si-gnal à Interféren e de sortie (SIRout), qui peut être omparé au SIR d'entrée(SIRin) asso ié aux observations.La �gure 7.5 montre que quel que soit le SNRin, le SIRout est supérieurpour notre algorithme di�érentiel omparé à l'algorithme standard. De plus,les performan es ommen ent à diminuer signi� ativement pour un SNRininférieur à 10 dB pour notre algorithme di�érentiel, au lieu de 35 dB pourl'algorithme standard. En outre, pour notre version di�érentielle, le SIRout estsupérieur à 30 dB pour la première sour e extraite jusqu'à un SNRin égal à 0dB, au lieu de 20 dB pour l'algorithme standard. Ces résultats ont été obtenuspour un SIRin moyen de 5 dB pour l'ensemble des 100 simulations.Nous avons aussi omparé la version symétrique de notre algorithme ins-tantané di�érentiel ave l'algorithme symétrique standard FastICA, ave lamême on�guration que i-dessus. La �gure 7.6 montre les même avantagesque i-dessus pour notre algorithme di�érentiel omparé à l'algorithme stan-dard. Cette fois, l'indi e de performan es Perf dé�ni en (7.2) ommen e àdiminuer signi� ativement pour SNRin plus petit que 15 dB (resp. 35 dB)pour l'algorithme di�érentiel (resp. l'algorithme standard) et e ritère restesupérieur à 33 dB jusqu'à un SNRin égal à 0 dB (resp. 16 dB). Sur ette�gure, les SIRout des ontributions des sour es, estimées au moyen de la orré-lation di�érentielle (5.28) omme post-traitement, sont aussi représentés. Celamontre pour l'algorithme symétrique que le ritère Perf est plus élevé que le ritère SIRout qui requiert lui pour être mesuré l'estimation des ontributionsdes sour es par un post-traitement (le ritère Perf se base seulement sur lamatri e de séparation estimée). Notons que es SIRout des ontributions desour es sont légèrement supérieurs à eux obtenus ave l'algorithme à dé�ation.

Page 118: Algorithmes temporels rapides à point fixe pour la ...

7.5. Tests statistiques 101

0 10 20 30 40 50 600

10

20

30

40

50

60

70

1ere source obtenue avec l’algorihme standard

1ere source obtenue avec l’algorithme differentiel

2nde source obtenue avec l’algorithme standard

2nde source obtenue avec l’algorithme differentiel

SIRout moyensSIRout (dB)

SNRin (dB)Fig. 7.5 � SIRout obtenus ave les versions à dé�ation de FastICA et DFICAen fon tion du SNR d'entrée.

0 10 20 30 40 50 600

10

20

30

40

50

60

70

80

Moyenne de Perf avec l’algorithme standard

Moyenne de Perf avec l’algorithme differentiel

Moyenne de SIRout avec l’algorithme standard

Moyenne de SIRout avec l’algorithme differentiel

Perf (dB) et SIRout (dB)

SNRin (dB)Fig. 7.6 � Perf et SIRout obtenus ave les versions symétriques de FastICAet DFICA en fon tion du SNR d'entrée.

Page 119: Algorithmes temporels rapides à point fixe pour la ...

102 Chapitre 7. Résultats expérimentauxDans le as onvolutif, nous avons testé nos algorithmes C-FICA et C-DFICApour deux sour es lapla iennes olorées par des �ltres RIF d'ordre 10 et non-stationnaires à long terme. Elles sont stationnaires à ourt terme sur deuxfenêtres temporelles de 100000 é hantillons. Nous avons utilisé des �ltres demélange réels dont les réponses impulsionnelles d'ordre 64 ont été mesurées auniveau des oreilles d'une tête de mannequin [80℄. Comme dans le as linéaireinstantané, les sour es de bruit sont des sour es pondérées à distributions uni-forme, gaussienne et lapla ienne dont les fa teurs d'é helle varient pour modi-�er le SNRin.Pour haque fa teur d'é helle appliqué aux sour es de bruit, nous avons onsidéré 153 jeux de �ltres di�érents asso iés à di�érentes positions de sour es.Nous avons seulement ontraint les 2 sour es utiles à n'être pas très pro hes lesunes des autres (la di�éren e angulaire a été prise supérieure ou égale à 20�) etnous avons pla é les sour es de bruit à des positions asso iées aux angles -90�,30�et 150�. Comme ave les versions à dé�ation des algorithmes instantanés,nous exprimons les performan es en termes de SIRout des ontributions dessour es (mesurés omme expliqué en annexe F), ette fois obtenues en utilisantle �ltrage de Wiener di�érentiel (6.30).La �gure 7.7 représente le SIRout des algorithmes d'ACI à point �xe stan-dard et di�érentiel en fon tion du SNRin. Comme dans le as linéaire ins-tantané, les performan es de notre algorithme di�érentiel restent supérieuresà elles de l'algorithme standard quel que soit le SNRin. Plus pré isément,elles ommen ent à diminuer signi� ativement pour un SNRin inférieur à 15dB (resp. 35 dB) pour notre version di�érentielle (resp. la version standard).Pour la première sour e extraite, le SIRout reste supérieur à 15 dB jusqu'à unSNRin égal à 8 dB (resp. 22 dB).Dans l'expérien e suivante, nous avons her hé à évaluer la robustessede notre algorithme di�érentiel pour les mélanges onvolutifs en fon tion dunombre d'é hantillons de haque domaine temporel. Pour ela, nous avons ré-glé le fa teur d'é helle appliqué aux bruits stationnaires de façon à obtenir unSNRin moyen de 11 dB pour toutes les positions de sour es et pour haquenombre d'é hantillons n, et nous avons testé notre algorithme di�érentiel surles 153 jeux de �ltres utilisés dans l'expérien e pré édente. La �gure 7.8 montreque le SIRout moyen reste supérieur à 15 dB jusqu'à un nombre d'é hantillonségal à 50000 é hantillons.

Page 120: Algorithmes temporels rapides à point fixe pour la ...

7.5. Tests statistiques 103

0 10 20 30 40 50 60

6

8

10

12

14

16

18

20

22

24

26

28

1ere source obtenue avec l’algorithme standard

1ere source obtenue avec l’algorithme differentiel

2nde source obtenue avec l’algorithme standard

2nde source obtenue avec l’algorithme differentiel

SIRout moyensSIRout (dB)

SNRin (dB)Fig. 7.7 � SIRout obtenus ave C-FICA et C-DFICA en fon tion du SNRd'entrée.

104

105

106

0

5

10

15

20

25

30

Moyenne

Ecart-type

SIRout (dB)

SIRout pour l’algorithme C-DFICA

nombre d’echantillons

Fig. 7.8 � SIRout obtenus ave C-DFICA en fon tion du nombre d'é hantillons.

Page 121: Algorithmes temporels rapides à point fixe pour la ...

104 Chapitre 7. Résultats expérimentauxPour N = P = 2 et N = 3, nous avons omparé le temps de al ul de notre mé-thode onvolutive di�érentielle rapide C-DFICA ave une version di�érentiellede l'algorithme de Tugnait développée dans [6℄, qui permet déjà une granderapidité en utilisant un algorithme de Newton modi�é. Nous avons hoisi despro essus d'innovation de sour es de densité uniforme ontenant T = 10000é hantillons sur haque domaine temporel et olorés par des �ltres générésaléatoirement par une loi uniforme. Les �ltres de mélange ont aussi été géné-rés par une loi uniforme. Nous avons fait varier l'ordre du modèle25 Q entre0 et 30 (T > 10000 ou Q > 30 entraînent des temps de al ul trop grandspour 100 tests de la méthode de Tugnait modi�ée) et nous avons e�e tué 100tests de Monte Carlo pour haque on�guration. Les résultats de la �gure 7.9représentent la durée de l'extra tion du pro essus d'innovation, qui est de loinl'étape la plus gourmande en temps de al ul. Cela montre que notre méthodeà point �xe est près de 500 fois plus rapide que la méthode de Tugnait di�é-rentielle. Nous avons aussi onstaté des performan es de séparation légèrementmeilleures pour notre méthode (les SIRout sont supérieurs de 1 dB environ).

0 5 10 15 20 25 3010

−1

100

101

102

103

104

Newton

Point fixe

Sec.

Q

Type d’optimisation

Fig. 7.9 � Temps d'extra tion moyen du premier pro essus d'innovation enfon tion de Q pour une optimisation de type Newton et pour notre optimisationde type point �xe (algorithme C-DFICA).25L'ordre du modèle est dé�ni par la somme de l'ordre de oloration des sour es et del'ordre du mélange.

Page 122: Algorithmes temporels rapides à point fixe pour la ...

7.6. Con lusion 1057.6 Con lusionDans e hapitre, nous avons testé expérimentalement nos algorithmes dif-férentiels DFICA et C-DFICA appli ables aux mélanges sous-déterminés res-pe tivement instantanés et onvolutifs. Après avoir illustré le fon tionnementde nos méthodes sur des mélanges de sour es de télé ommuni ations et audio,nous avons présenté les résultats d'une analyse statistique donnant les perfor-man es de séparation en fon tion de la puissan e totale des sour es de bruitstationnaires. Les méthodes di�érentielles se sont montrées plus résistantesque les appro hes standard en présen e de sour es de bruit stationnaires. Nousavons aussi omparé notre algorithme C-DFICA ave une version di�érentiellede l'algorithme de Tugnait développée auparavant dans l'équipe. Nous avons onstaté que notre algorithme est près de 500 fois plus rapide tout en permet-tant une séparation légèrement meilleure en termes de SIR.

Page 123: Algorithmes temporels rapides à point fixe pour la ...

106 Chapitre 7. Résultats expérimentaux

Page 124: Algorithmes temporels rapides à point fixe pour la ...

Troisième partieMélanges linéaires instantanés ontenant un grand nombred'é hantillons

107

Page 125: Algorithmes temporels rapides à point fixe pour la ...
Page 126: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 8Algorithmes rapides optimiséspour les mélanges linéairesinstantanés8.1 Introdu tionCe hapitre présente une nouvelle appro he pour optimiser les ritères deséparation basés sur le kurtosis dans le as de longs enregistrements de mé-langes. Notre méthode est basée sur une étape d'identi� ation polyn�mialemultivariable qui évite le al ul de statistiques à haque mise à jour de l'al-gorithme d'optimisation à point �xe. Comparées à l'algorithme FastICA età notre algorithme DFICA présenté dans la partie pré édente, nos nouvellesméthodes sont très performantes pour les longs enregistrements d'un nombremodéré de sour es mélangées. Elles sont don parti ulièrement adaptées à laséparation aveugle d'images, en raison de l'augmentation a tuelle du nombrede pixels des apteurs photo-sensibles. Nos algorithmes é onomisent aussi del'espa e mémoire en évitant le al ul et le sto kage du ve teur d'observationsblan hies.8.2 Position du problèmeNotons s(n) = [s1(n), · · · , sN(n)]t le ve teur des sour es réelles entrées etx(n) = [x1(n), · · · , xP (n)]t le ve teur des observations. Nous étudions i i le asdes mélanges linéaires instantanés. En notant A la matri e de mélange s alairede taille P × N ontenant des oe� ients s alaires réels, la relation entre lesve teurs sour e et observation s'é rit sous forme matri ielle

x(n) = As(n) (8.1)Dans le as (sur-)déterminé, nous faisons les hypothèses lassiques suivantes on ernant le modèle de mélange : 109

Page 127: Algorithmes temporels rapides à point fixe pour la ...

110Chapitre 8. Algorithmes rapides optimisés pour les mélanges linéaires instantanés� s(n) est spatialement indépendant, .-à-d. que ses omposantes sont sta-tistiquement indépendantes entre elles. Nous supposons aussi qu'au plusune de ses omposantes est gaussienne.� La matri e de mélange s alaire A est de rang de olonne plein. Si P > N ,nous pouvons utiliser l'Analyse en Composantes Prin ipales (ACP) pourréduire le nombre d'observations à N .Les hypothèses i-dessus sont par exemple requises par l'algorithme FastICAà kurtosis développé par Hyvärinen et Oja [98℄ que nous nous proposons d'op-timiser dans ette partie.Dans le as sous-déterminé (P < N), nous optimisons notre algorithmeDFICA présenté dans la partie 2 et destiné à la séparation partielle de sour esnon-stationnaires en présen e de sour es de bruit stationnaires. Les hypothèsesrequises par et algorithme sous-déterminé de type point �xe sont les suivantes :� s(n) est omposé de N sour es non-stationnaires à long terme (ave N ≤P ) dont les puissan es varient dans le même sens entre deux instantsparti uliers n1 et n2, et de N − N sour es stationnaires à long terme.Les N sour es sont statistiquement indépendantes, et au plus une des Nsour es non-stationnaires est gaussienne aux deux instants n1 et n2

26.� La matri e A, omposée des olonnes de A asso iées aux sour es non-stationnaires, est de rang de olonne plein. Si le nombre N de sour esnon-stationnaires est inférieur à P , nous pouvons e�e tuer une Analyseen Composantes Prin ipales di�érentielle pour réduire le nombre d'ob-servations à N .Dans la suite, nous supposons que le nombre N de sour es non-stationnairesest égal au nombre d'observations P , et nous notons T le nombre d'é hantillonsdans ha un des deux intervalles temporels.Nous onsidérons i i le as où les observations ontiennent un grand nombred'é hantillons (typiquement plus de 100000 é hantillons, e qui est souvent le as pour les sour es d'images) e qui implique que les algorithmes FastICAet DFICA demandent beau oup de temps de al ul pour l'estimation des sta-tistiques à haque mise à jour des algorithmes d'optimisation. En raison del'a tuelle augmentation de taille des apteurs photo-sensibles de type CCD etCMOS, qui engendre un grand nombre d'é hantillons, notre appro he est parexemple une bonne alternative aux algorithmes lassiques FastICA et DFICAdans le adre du traitement d'images. Nous supposons que les sour es à es-timer ne sont pas trop nombreuses (typiquement jusqu'à 7 sour es), e quiest souvent le as à l'ex eption des appli ations biomédi ales où le nombre de26Nous ex luons le as très spé i�que où le kurtosis normalisé et la puissan e au arré dessour es non-stationnaires varient de manière inversement proportionnelle.

Page 128: Algorithmes temporels rapides à point fixe pour la ...

8.3. Un algorithme optimisé rapide pour la SAS (sur-) déterminée 111mélanges enregistrés est souvent élevé.8.3 Un algorithme optimisé rapide pour la SAS(sur-) déterminée8.3.1 Prin ipes et limitations de l'appro he standardParmi les méthodes de SAS, nous onsidérons i i elles qui utilisent l'Ana-lyse en Composantes Indépendantes (ACI) et en parti ulier elles qui her hentà maximiser la non-gaussianité de signaux de sortie pour estimer les sour es.Dans [61℄, il fut proposé d'e�e tuer ette séparation en deux étapes.La première étape réalise un blan himent en appliquant au ve teur d'ob-servations une matri e dite de blan himent obtenue grâ e à la dé ompositionen ve teurs propres de la matri e d'auto orrélation des observations. Dans lase onde étape, un algorithme à gradient maximise la valeur absolue ou le arrédu kurtosis non-normalisé d'une ombinaison linéaire y(n) = wtz(n) des Nsignaux blan his sous la ontrainte ‖w‖ = 1. Cela nous donne une estimationd'une des sour es, les autres sour es pouvant être estimées itérativement parune pro édure à dé�ation [61℄.Dans l'algorithme FastICA, le même pro essus de blan himent des obser-vations est appliqué mais il est ette fois suivi par un algorithme de type point�xe plus rapide que l'algorithme à gradient. L'itération de l'algorithme à point�xe met à jour le ve teur d'extra tion ave le gradient du kurtosis et normaliseensuite e ve teur.Il existe deux versions de FastICA. La version parallèle, dont la onver-gen e a été rigoureusement prouvée par Oja et Yuan dans [143℄, extrait toutesles sour es en même temps en répétant alternativement les deux opérationssuivantes : la mise à jour d'un jeu de ve teurs d'extra tion par les gradients dukurtosis en es points et l'orthonormalisation de es ve teurs par l'opérationsymétrique W = W (WtW)− 1

2 , où la matri e W est omposée des N ve teursd'extra tion arrangés par olonnes. La mise à jour de type point �xe des Nve teurs d'extra tion est réalisée dans le logi iel FastICA [87℄ par l'opérationW = (Z*(( Z'*W ).∧3)) / T - 3 * W (8.2)où Z est une matri e de taille N × T ontenant les T é hantillons des obser-vations blan hies et W implémente la matri e W de taille N × N . Comme lamise à jour (8.2) né essite de sto ker Z et (Z'*W).∧3, nous avons besoin de2N × T ases mémoires. De plus, on peut montrer que l'opération (8.2) de-mande de réaliser (4N2 + N)T + 2N2 opérations élémentaires. Dans [96℄ estévoquée la possibilité d'e�e tuer les moyennages dans l'opération de mise àjour en utilisant un nombre réduit d'é hantillons, diminuant ainsi la harge de al ul. Néanmoins, e nombre réduit d'é hantillons a un e�et sur la pré isionde l'estimation �nale de W. Comme nous her hons à atteindre une bonnepré ision, nous utilisons i i toutes les données disponibles.

Page 129: Algorithmes temporels rapides à point fixe pour la ...

112Chapitre 8. Algorithmes rapides optimisés pour les mélanges linéaires instantanésLa version à dé�ation de FastICA extrait les sour es les unes après lesautres en appliquant une pro édure d'orthogonalisation à dé�ation à la pla ede l'orthogonalisation symétrique mentionnée i-dessus. Dans e as, à haqueétape de l'optimisation, un unique ve teur w est mis à jour ave le gradientdu kurtosis de wtz(n) (la matri e W est rempla ée par un unique ve teur wde taille N) et le ve teur résultant est projeté sur l'espa e orthogonal auxve teurs d'extra tion pré édemment estimés. Ce i est réalisé par l'opérationw = w−WWtw où W ontient les ve teurs pré édemment estimés arrangéspar olonnes. Le ve teur résultant est ensuite normalisé par l'opération w =w/‖w‖.8.3.2 Une nouvelle appro he pour optimiser le kurtosisDans ette se tion, nous proposons une méthode pour éviter l'importantbesoin en mémoire et le al ul des statistiques empiriques à haque opérationde mise à jour de l'optimisation de W ou w. Cette méthode est basée surune identi� ation polyn�miale multivariable qui nous permet d'e�e tuer les al uls des algorithmes à point �xe i-dessus dans un espa e de oe� ientspolyn�miaux. Elle évite aussi le al ul et le sto kage du ve teur d'observa-tions blan hies z(n). Cette nouvelle appro he est attrayante dans beau oup de on�gurations (ave N ≤ 7) en termes de temps de al ul et d'espa e mémoirerequis, parti ulièrement dans le as de longs enregistrements de mélange, alorsqu'elle onverge exa tement vers les mêmes points que les algorithmes FastICAstandard.Notons y(n) = wtz(n) une ombinaison linéaire des éléments du ve teurd'observations blan hies z(n) utilisé dans l'algorithme FastICA (le al ul dez(n) sera évité dans notre appro he omme expliqué plus bas). Comme tousles signaux sont supposés être entrés, le kurtosis de y(n) s'é rit :

kurty(n) = kurtwtz(n)

= E{(wtz(n))4

}− 3E

{(wtz(n))2

}2. (8.3)Comme nous avons

E{(wtz(n))2

}= E

{wtz(n)zt(n)w

}

= wtE{z(n)zt(n)

}w

= wtIw

= ‖w‖2, (8.4)

Page 130: Algorithmes temporels rapides à point fixe pour la ...

8.3. Un algorithme optimisé rapide pour la SAS (sur-) déterminée 113(8.3) devientkurty(n) = E

{ N∑

i1,i2,i3,i4=1

4∏

k=1

w(ik)zik(n)

}

− 3

( N∑

i=1

w(i)2

)2

=

N∑

i1,i2,i3,i4=1

( 4∏

k=1

w(ik)

)

E

{ 4∏

k=1

zik(n)

}

− 3

N∑

i1,i2=1

w(i1)2w(i2)

2.(8.5)Comme (8.5) est un polyn�me d'ordre 4 par rapport aux variablesw(1), · · · , w(N),nous pouvons dé�nir un jeu de oe� ients (αd)d∈D ave D =

{

d ∈ {0, · · · , 4}N \N∑

k=1

d(k) = 4

}

, (8.6)tel quekurty(n) =

d∈D

αd

N∏

k=1

w(k)d(k). (8.7)L'éq. (8.7) orrespond au développement anonique du kurtosis par rapportaux variables w(1), · · · , w(N). Notons R le ardinal27 de D, d1, · · · ,dR seséléments et α1, · · · , αR les valeurs de (αd)d∈D. Nous avons alorskurty(n) =

R∑

r=1

αr

N∏

k=1

w(k)dr(k). (8.8)Il serait possible de al uler dire tement les oe� ients αr qui dépendent demoments roisés d'ordre 4 des signaux z1(n), · · · , zN(n). Nous proposons i iune méthode plus e� a e en termes de temps de al ul. Soit (vi)i=1..R unefamille de R ve teurs di�érents de taille N . En remplaçant w par vi dans(8.8), nous avons∀i = 1 . . . R, kurtvt

iz(n) =

R∑

j=1

αj

N∏

k=1

vi(k)dj(k) (8.9) e qui peut être exprimé par la relation matri ielleMα = k (8.10)où α est le ve teur olonne des oe� ients (αr)r=1..R et où la matri e M =

[mij ]i,j=1..R et le ve teur olonne k = (ki)i=1..R sont dé�nis respe tivement par

∀i, j = 1..R, mij =

N∏

k=1

vi(k)dj(k)

∀i = 1..R, ki = kurtvtiz

(n)

(8.11)27On peut montrer que card(D) = R = N + 3N(N−1)2 + N(N−1)(N−2)

2 + N(N−1)(N−2)(N−3)24 .

Page 131: Algorithmes temporels rapides à point fixe pour la ...

114Chapitre 8. Algorithmes rapides optimisés pour les mélanges linéaires instantanésEn hoisissant R ve teurs d'extra tion vi de taille N qui fournissent une ma-tri eM non-singulière, nous pouvons don identi�er les R oe� ients (αr)r=1..Ren al ulant les kurtosis ki des R signaux vtiz(n) obtenus ave es ve teurs d'ex-tra tion et en utilisant la relation inverse de (8.10), .-à-d. α = M−1k. Dansl'annexe G, nous proposons un hoix parti ulier de ve teurs (vi) qui entraîneun bon onditionnement de la matri e M. Notons que grâ e au pro essus deblan himent,

∀i = 1, · · · , R, E{(vtiz(n))2} = ‖vi‖

2, (8.12) omme le montre (8.4) et don kurtvt

iz(n) = E{(vt

iz(n))4} − 3‖vi‖4, (8.13)si bien que nous n'avons à al uler qu'un moment simple d'ordre 4 pour ha undes R ve teurs d'extra tion. De plus la relation

∀i = 1 . . . R, vtiz(n) = vt

i∆−1/2Etx(n)

= utix(n) (8.14)ave ut

i = vti∆

−1/2Et nous permet d'éviter le al ul du ve teur d'observationsblan hies z(n). Dans la suite, V et U sont les matri es ontenant respe tive-ment les jeux de ve teurs (ui)i=1..R et (vi)i=1..R arrangés par olonnes.Notons que la matri e M est indépendante des sour es et du pro essus demélange. Il est don possible de al uler son inverse une fois pour toutes pourle jeu de ve teurs (vi)i=1..R hoisi pour un nombre de sour es donné. Aprèsavoir identi�é le jeu de oe� ients (αr)r=1..R en al ulant les kurtosis ki des Rsignaux asso iés aux ve teurs (vi)i=1..R et en al ulant α = M−1k, nous her- hons à maximiser la valeur absolue de kurtwtz(n) =∑R

r=1 αr

∏Nk=1 w(k)dr(k)par rapport à w sous la ontrainte ‖w‖ = 1. Cela peut être réalisé de lamême façon qu'ave l'algorithme FastICA standard mais i i dans l'espa e des oe� ients polyn�miaux αr de (8.8), au lieu de l'espa e des signaux asso ié à(8.3). Comme dans la version à dé�ation de FastICA, nous répétons alterna-tivement l'opération de mise à jour par le gradient du kurtosis et l'opérationde normalisation (pour la version parallèle, N ve teurs sont mis à jour puisorthonormalisés). Nous utilisons don le gradient de kurtwtz(n) par rapport à

w, qui s'é rit∂kurtwtz(n)

∂w=

R∑

r=1

αr∂∏N

k=1 w(k)dr(k)

∂w(8.15)ave

∂∏N

k=1 w(k)dr(k)

∂w(j)=

dr(j)w(j)dr(j)−1∏

k 6=j

w(k)dr(k) , si dr(j) ≥ 1

0 , si dr(j) = 0

(8.16)

Page 132: Algorithmes temporels rapides à point fixe pour la ...

8.4. Un algorithme optimisé rapide pour la SAS sous-déterminée 1158.3.3 Résumé de la méthode proposéeRésumons maintenant la version parallèle de notre algorithme FastICA op-timisé, que nous appelons O-FICA :� Estimer la matri e d'auto- orrélation Rx du ve teur d'observations x(n)et al uler sa dé omposition en ve teurs propres qui donne une matri eorthogonale E et une matri e diagonale ∆.� Cal uler U = E∆−1/2V où V est onstituée des ve teurs d'extra tionproposés dans l'annexe G.� Cal uler les kurtosis (ki)i=1..R des R signaux utix(n), i = 1..R et iden-ti�er le jeu de oe� ients α = (αr)r=1..R au moyen de l'inverse de Mdé�nie par (8.11) et al ulée préalablement, ave la relation α = M−1k.� InitialiserW ave N ve teurs de tailleN di�érents arrangés par olonnes, .-à-d. W = [w1, · · · ,wN ] = [wji] et répéter jusqu'à la onvergen e :1) ∀i, j = 1 . . . N, wji ←

∑Rr=1 αrdr(j)w

max(dr(j)−1,0)ji

k 6=j wdr(k)ki e qui est équivalent à faire ∀i = 1 . . . N, wi ←

∂kurtw

tiz(n)

∂wi.2) W←W(WtW)−

1

2Remarquons que e nouvel algorithme ne demande pas d'estimer de statis-tiques à haque étape de l'algorithme à point �xe, ontrairement à l'algo-rithme FastICA standard. Il n'utilise que des oe� ients polyn�miaux αr dontle nombre est indépendant de T , e qui est plus e� a e s'ils ne sont pas tropnombreux ( 'est le as typiquement pour N ≤ 7). De plus, nous évitons desto ker les matri es Z et (Z'*W).∧3 pendant l'algorithme à point �xe, e quireprésente 2NT ases mémoires. On peut montrer que nous ne sto kons i i queR2+R+RN +N2 mots mémoires pendant l'optimisation, valeur indépendantedu nombre d'é hantillons T .Le passage à la version à dé�ation de notre algorithme O-FICA peut êtredéduit fa ilement de la relation entre les versions parallèle et à dé�ation del'algorithme FastICA lassique.8.4 Un algorithme optimisé rapide pour la SASsous-déterminée8.4.1 Prin ipe et limitations de notre appro he DFICAComme l'algorithme FastICA standard, notre algorithme DFICA est om-posé de deux étapes : une étape de blan himent di�érentiel suivie d'un al-

Page 133: Algorithmes temporels rapides à point fixe pour la ...

116Chapitre 8. Algorithmes rapides optimisés pour les mélanges linéaires instantanésgorithme de type point �xe. Le blan himent di�érentiel estime la matri ed'auto orrélation di�érentielle des observations dé�nie par la di�éren e entreles matri es d'auto orrélation estimées respe tivement sur les deux intervallestemporels :DRx(n1, n2) = Rx(n2)−Rx(n1). (8.17)Ensuite, sous la ondition que DRx(n1, n2) est dé�nie positive28, sa dé ompo-sition en ve teurs propres est al ulée, e qui donne une matri e orthogonale

E et une matri e diagonale ∆. La matri e de blan himent di�érentielle estensuite obtenue par B = ∆−1/2Et. En�n, les observations sont blan hies dif-férentiellement. Ce blan himent di�érentiel implique une équivalen e entre lanormalisation d'un ve teur d'extra tion w et elle de la puissan e di�érentielledu signal y(n) = wtz(n) :E{y2(n2)} −E{y2(n1)} = 1⇔ ‖w‖2 = 1. (8.18)Nous avons prouvé dans la se onde partie de e do ument que la maximisationde la valeur absolue du kurtosis di�érentiel de wtz(n), dé�ni par

Dkurtwtz(n1, n2) = kurtwtz(n2)− kurtwtz(n1) (8.19)par rapport à w sous la ontrainte ‖w‖ = 1 réalise la séparation partielle dessour es non-stationnaires, .-à-d. que le signal de sortie y(n) = wtz(n) est alors omposé d'une unique sour e utile et de ontributions des sour es de bruit.Comme pour l'algorithme FastICA standard, nous avons proposé deux ver-sions de notre algorithme DFICA. La version parallèle extrait toutes les sour esutiles en même temps en mettant à jour N ve teurs d'extra tion ave les gra-dients du kurtosis di�érentiel en es points, puis en les orthonormalisant aumoyen de l'opération symétrique W = W(WtW)−1/2 déjà mentionnée dansle hapitre pré édent. La mise à jour de type point �xe des N ve teurs d'ex-tra tion peut être représentée en langage Matlab par les opérationsR1 = ( Z1*Z1' )/T ;D = diag( W'*R1*W )' ;W = ( Z2*( ( Z2'*W ).∧3 ) - Z1*( ( Z1'*W ).∧3 ) ) / T-3( ( I+R1 )*W+D(ones(1,length(W)), :).*W ) ; (8.20)où Z1 et Z2 sont deux matri es de taille N × T ontenant les T é hantillonsdes observations di�érentiellement blan hies sur les deux intervalles temporels,W est une matri e de taille N × N implémentant les N ve teurs d'extra tionarrangés par olonnes et R1 est la matri e d'auto orrélation de z(n) sur lepremier intervalle. La mise à jour (8.20) demande don de sto ker au moins Ziet ( Zi'*W ).∧3 ave i = 1 ou 2, e qui représente 2NT ases mémoires.28Les onditions de la nature dé�nie positive de DRx(n1, n2) seront données dans lapro haine se tion.

Page 134: Algorithmes temporels rapides à point fixe pour la ...

8.4. Un algorithme optimisé rapide pour la SAS sous-déterminée 117De plus, on peut montrer que l'opération (8.20) né essite de al uler (10N2 +2N)T + 6N3 + N2 + N opérations élémentaires.Comme pour les algorithmes FastICA et O-FICA, une version à dé�a-tion peut être obtenue en remplaçant la matri e W par un unique ve teurd'extra tion w et en appliquant une orthogonalisation à dé�ation au lieu del'orthogonalisation symétrique.Comme pour la version optimisée O-FICA de l'algorithme FastICA stan-dard, nous proposons dans la pro haine se tion une appro he pour éviter le al ul de statistiques à haque étape de l'optimisation à point �xe.8.4.2 Une nouvelle appro he pour optimiser le kurtosisdi�érentielNotons à nouveau y(n) = wtz(n) une ombinaison linéaire des élémentsdu ve teur d'observations di�érentiellement blan hies z(n) obtenu dans l'algo-rithme DFICA.Comme pour l'algorithme O-FICA, le al ul de z(n) sera évité dans notrenouvel algorithme omme expliqué plus bas. Dans la se tion pré édente, nousavons montré que le kurtosis standard de y(n) est un polyn�me multivariablepar rapport à w(1), · · · , w(N). Le kurtosis di�érentiel, dé�ni omme une dif-féren e de deux kurtosis à deux instants, est don aussi un polyn�me multiva-riable de es mêmes variables. On peut fa ilement l'exprimer en fon tion desmoments roisés d'ordre 4 des signaux z1(n), · · · , zP (n) :Dkurty(n1, n2) = kurty(n2)− kurty(n1)

= E{

(wtz(n2))4 }−3(E{

(wtz(n2))2 })2−E{

(wtz(n1))4 }

+3(E{

(wtz(n1))2 })2

= E{∑N

i1,i2,i3,i4=1

∏4k=1 w(ik)zik(n2)

}−3(E{∑N

i1,i2=1 w(i1)w(i2)zi1(n2)zi2(n2)})2

−E{∑N

i1,i2,i3,i4=1

∏4k=1 w(ik)zik(n1)

}+3(E{∑N

i1,i2=1 w(i1)w(i2)zi1(n1)zi2(n1)})2

=∑N

i1,i2,i3,i4=1

(

E{∏4

k=1 zik(n2)}−E

{∏4k=1 zik(n1)

})∏4

k=1 w(ik)

−3∑N

i1,i2,i3,i4=1

(

E{zi1(n2)zi2(n2)

}E{zi3(n2)zi4(n2)

}

−E{zi1(n1)zi2(n1)

}E{zi3(n1)zi4(n1)

}) 4∏

k=1

w(ik). (8.21)Comme le kurtosis standard, le kurtosis di�érentiel peut ainsi être exprimé defaçon similaire à (8.7) en fon tion d'un jeu de R oe� ients (αd)d∈D. Au lieude al uler les moments roisés identi�és dans (8.21), les oe� ients polyn�-miaux peuvent être identi�és en al ulant les kurtosis di�érentiels Dki de Rsignaux obtenus ave R ve teurs d'extra tion (vi)i=1..R qui peuvent être hoisis

Page 135: Algorithmes temporels rapides à point fixe pour la ...

118Chapitre 8. Algorithmes rapides optimisés pour les mélanges linéaires instantanés omme indiqué dans l'annexe G29. Comme dans le as (sur-)déterminé, il n'estpas né essaire de al uler le ve teur d'observations di�érentiellement blan hiesz(n). Une fois que l'on a identi�é le jeu de oe� ients (αr)r=1..R en al ulantles kurtosis di�érentiels de R signaux et en multipliant le ve teur résultant parl'inverse de M, on peut utiliser le même type d'algorithme que dans l'algo-rithme O-FICA (sur-)déterminé pour maximiser la valeur absolue du kurtosisdi�érentiel sous ontrainte de puissan e di�érentielle unitaire.8.4.3 Résumé de la méthode proposéeRésumons maintenant notre algorithme DFICA optimisé, que nous appe-lons O-DFICA :� Choisir deux intervalles temporels asso iés aux deux instants n1 et n2 desorte que l'estimée de la matri e d'auto orrélation di�érentielle

DRx(n1, n2) = Rx(n2)−Rx(n1) soit dé�nie positive30 et al uler sa dé- omposition en ve teurs propres qui donne une matri e orthogonale E etune matri e diagonale ∆.� Cal uler U = E∆−1/2V où V est onstituée des ve teurs d'extra tionproposés dans l'annexe G.� Cal uler les kurtosis di�érentiels (Dki)i=1..R des R signaux utix(n), i =

1..R et déterminer le jeu de oe� ients α = (αr)r=1..R au moyen dela matri e inverse de M (8.11) al ulée préalablement, ave la relationα = M−1Dk.� InitialiserW ave N ve teurs di�érents de taille N arrangés par olonnes, .-à-d. W = [w1, · · · ,wN ] = [wji] et répéter jusqu'à la onvergen e :1) ∀i, j = 1 . . . N , wji ←

∑Rr=1 αrdr(j)w

max(dr(j)−1,0)ji

k 6=j wdr(k)ki e qui est équivalent à faire ∀i = 1 . . . N , wi ←

∂Dkurtw

tiz(n1,n2)

∂wi.2) W←W(WtW)−

1

2Comme l'algorithme O-FICA, et algorithme O-DFICA n'utilise que des o-e� ients polyn�miaux dont le nombre est indépendant de T , pendant l'opti-misation de type point �xe. Cela est plus e� a e quand le nombre de sour esest modéré (typiquement N ≤ 7). Il évite aussi de sto ker Zi et ( Zi'*W29La valeur de R dépend ette fois de N au lieu de N , .-à-d. R = Card(D) = N +3N(N−1)

2 + N(N−1)(N−2)2 + N(N−1)(N−2)(N−3)

24 .30Nous avons prouvé dans la se onde partie que ette ondition est équivalente à l'augmen-tation de puissan e de toutes les sour es non-stationnaires entre n1 et n2. Si DRx(n1, n2)est dé�nie négative, on peut permuter les deux intervalles temporels asso iés à n1 et n2 pourla rendre dé�nie positive.

Page 136: Algorithmes temporels rapides à point fixe pour la ...

8.5. Con lusion 119).∧3 ave i = 1 ou 2, e qui représente 2NT mots mémoires. Comme ave l'algorithme (sur-)déterminé, nous ne sto kons i i que R2+R+RN +N2 mots,valeur indépendante du nombre T d'é hantillons.Comme pour l'algorithme O-FICA, la version à dé�ation de notre algo-rithme sous-déterminé O-DFICA peut être déduite de la relation entre lesalgorithmes parallèles et à dé�ation de l'algorithme FastICA lassique.8.5 Con lusionDans e hapitre, nous avons proposé des méthodes d'optimisation du kur-tosis et du kurtosis di�érentiel basées sur l'identi� ation du ritère sous formed'un polyn�me relativement aux variables d'extra tion. Nous avons montréque nos algorithmes pour mélanges (sur-) et sous-déterminés, baptisés respe -tivement O-FICA et O-DFICA, évitent l'estimation de statistiques à haqueitération de l'algorithme d'optimisation à point �xe. Ils évitent aussi de sto kerle ve teur d'observations blan hies qui est de grande taille lorsque le nombred'é hantillons est élevé. Notre appro he est parti ulièrement intéressante enséparation aveugle d'images en raison de l'augmentation du nombre de pixelsdes apteurs photo-sensibles de types CCD et CMOS.

Page 137: Algorithmes temporels rapides à point fixe pour la ...

120Chapitre 8. Algorithmes rapides optimisés pour les mélanges linéaires instantanés

Page 138: Algorithmes temporels rapides à point fixe pour la ...

Chapitre 9Résultats expérimentaux9.1 Introdu tionDans e hapitre, nous présentons des résultats expérimentaux qui om-parent les vitesses de nos algorithmes O-FICA et O-DFICA ave elles desalgorithmes standard FastICA et DFICA. Dans la première se tion, nous mon-trons l'intérêt de notre appro he pour la séparation d'images astrophysiquesre ueillies par le téles ope Hubble. Des tests de Monte-Carlo sont ensuite réa-lisés dans deux on�gurations : elle où le ritère d'arrêt est �xé et elle oùle temps de al ul est �xé. Dans le premier as, nous mesurons le temps mispar les algorithmes à atteindre un ritère d'arrêt permettant d'obtenir uneperforman e de séparation moyenne donnée. Dans le deuxième as, nous éva-luons les performan es moyennes qui peuvent être atteintes par les di�érentsalgorithmes en un temps �xé.9.2 Appli ation à l'astrophysiqueNous avons i i appliqué notre algorithme O-FICA à la séparation de deuxtypes de rayonnement émis par un nuage interstellaire en présen e du rayon-nement d'une étoile voisine. Les nuages interstellaires sont à l'origine de laformation des étoiles, e qui les rend parti ulièrement intéressants à étudierd'un point de vue physi o- himique.Les téles opes qui s rutent es nuages interstellaires, souvent en employantdes �ltres pour obtenir des images à di�érentes longueurs d'onde, permettentd'obtenir une distribution spatiale des rayonnements émis. Dans le as des né-buleuses par ré�exion, la répartition spatiale obtenue est en fait une répartitiondu mélange formé par deux types de rayonnements : l'émission rouge étendue(ERE : Extended Red Emission en anglais) dont le spe tre s'étend de 540 à 900nm ave un pi entre 600 et 800 nm, et la lumière di�usée (s attered light enanglais). En modi�ant la longueur d'onde d'étude, on obtient des répartitionsdi�érentes du fait de l'émission plus ou moins importante de es deux typesde rayonnements aux longueurs d'onde onsidérées.121

Page 139: Algorithmes temporels rapides à point fixe pour la ...

122 Chapitre 9. Résultats expérimentauxAdmettons que le nombre de photons reçus dans la ellule d'un apteurCCD pour un type de rayonnement donné soit proportionnel à l'intensité de e rayonnement dans la zone spatiale asso iée à e pixel ainsi qu'à la densitéspe trale du rayonnement à la longueur d'onde hoisie :νj(x, y, λ) = CteSj(λ)rj(x, y) (9.1)où νj(x, y, λ) est le nombre de photons du rayonnement j et de longueur d'onde

λ reçus par le pixel de oordonnées x et y, rj(x, y) est l'intensité du rayonne-ment j dans la zone spatiale asso iée au pixel de oordonnées x et y, et Sj(λ)est la densité spe trale d'émission du rayonnement j à la longueur d'onde λ.Dans le as de l'émission de N rayonnements di�érents, on obtient pour Plongueurs d'onde di�érentes λ1, · · · , λP les équations∀i = 1 . . . P, ν(x, y, λi) =

N∑

j=1

νj(x, y, λi) (9.2)où ν(x, y, λi) est le nombre total de photons de longueur d'onde λi reçus parle pixel (x, y). En tenant ompte de l'éq. (9.1), nous obtenons∀i = 1 . . . P, ν(x, y, λi) =

N∑

j=1

CteSj(λi)rj(x, y), (9.3) e qui s'é rit matri iellementν(x, y) = S r(x, y) (9.4)où les ve teurs r(x, y) et ν(x, y) sont les ve teurs sour e et observation dé�nisrespe tivement par r(x, y) =(rj(x, y)

)

j=1..Net ν(x, y) =

(ν(x, y, λi)

)

i=1..P, et

S est la matri e de mélange dé�nie par S =[CteSj(λi)

]

i=1..P,j=1..N.L'équation (9.4) orrespond à l'équation d'un mélange linéaire instantanéd'images31 de oordonnées spatiales x et y.Ce modèle simple e�e tue quelques approximations a eptables pour l'ap-pli ation que nous allons présenter. Il suppose en e�et que les spe tres desrayonnements ne varient pas spatialement, e qui peut être irréaliste en as deprésen e de forts transferts radiatifs, dans le as de galaxies par exemple [140℄.Néanmoins Witt et al. [223℄ ont montré que pour les nébuleuses par ré�exion, e phénomène n'intervient pas.Lorsque le nombre de pixels du apteur photo-sensible est important, une ontrainte al ulatoire apparaît : l'analyse statistique des é hantillons impose,si l'on veut tirer le meilleur parti des données, d'e�e tuer des moyennages spa-tiaux sur un grand nombre de valeurs. L'algorithme FastICA, omme nous31Ré emment des méthodes de séparation aveugle de sour es ont été utilisées pour étudierla répartition d'espè es himiques de nuages interstellaires ; le mélange y était interprété entermes de mélanges de spe tres et non de répartitions spatiales de rayonnement [29, 138℄.

Page 140: Algorithmes temporels rapides à point fixe pour la ...

9.2. Appli ation à l'astrophysique 123l'avons expliqué pré édemment, e�e tue des al uls statistiques à haque ité-ration de l'algorithme de type point �xe, e qui entraîne un temps de al ulimportant. Notre algorithme O-FICA e�e tue lui une analyse statistique dansun premier temps pour identi�er la fon tion polyn�miale à optimiser, puis réa-lise l'optimisation du polyn�me sans avoir à al uler de statistiques sur ungrand nombre d'é hantillons.Nous omparons i i les temps de al ul des algorithmes O-FICA et FastICApour l'analyse de la répartition spatiale de rayonnements à partir de deuximages de la nébuleuse NGC 2023 prises par le téles ope Hubble aux deuxlongueurs d'onde λ1=474 nm et λ2=631 nm. Le apteur CCD employé est detaille 4220× 4298, e qui entraîne un nombre d'é hantillons égal à 18137560.Cette valeur est très élevée et exige un temps de al ul important en utilisantl'algorithme FastICA.Les �gures 9.1 et 9.2 représentent les deux images obtenues par le téles opeHubble respe tivement aux longueurs d'onde λ1=474 nm et λ2=631 nm.Les �gures 9.3 et 9.4 représentent les deux images obtenues en sortie desalgorithme FastICA ou O-FICA. Alors que l'algorithme FastICA a e�e tué laséparation en 115 se ., .-à-d. près de deux minutes sur notre ma hine, l'algo-rithme O-FICA n'a mis que 4.5 se ondes pour réaliser la même tâ he.Les deux répartitions spatiales de rayonnement des �gures 9.3 et 9.4 sontintéressantes d'un point de vue astro himique ar elles nous renseignent surles répartitions des espè es himiques qui les émettent. Parmi les espè es hi-miques présentes dans les nuages interstellaires, on peut iter les molé ulespoly y liques aromatiques hydrogénées (PAH : Poly y li Aromati Hydro ar-bons) qui sont ionisées à divers degrés (PAH neutres, PAH+, PAH++ et PAH+2 )et les très petits grains (VSG : Very Small Grain en anglais) formés par agré-gation de es molé ules aromatiques. Des travaux menés en ollaboration ave l'équipe d'Olivier Berné et de Christine Joblin du CESR [30℄ ont montré qu'unbon andidat à l'émission du rayonnement ERE est la molé ule PAH+

2 , pré-sente en périphérie du nuage en raison d'un pro essus de destru tion des VSGexposés aux photons UV. Etant le produit �nal d'une as ade de réa tions dephotodisso iation, ette espè e est en e�et relativement stable et abondante arelle se reforme e� a ement à partir des molé ules de PAH neutres et ionisés.

Page 141: Algorithmes temporels rapides à point fixe pour la ...

124 Chapitre 9. Résultats expérimentaux

Fig. 9.1 � Image de la nébuleuse NGC 2023 prise par le téles ope Hubble à lalongueur d'onde λ1=474 nm.

Fig. 9.2 � Image de la nébuleuse NGC 2023 prise par le téles ope Hubble à lalongueur d'onde λ2=631 nm.

Page 142: Algorithmes temporels rapides à point fixe pour la ...

9.2. Appli ation à l'astrophysique 125

Fig. 9.3 � Image séparée 1 obtenue ave l'algorithme FastICA en 115 se . etave l'algorithme O-FICA en 4.5 se .

Fig. 9.4 � Image séparée 2 obtenue ave l'algorithme FastICA en 115 se . etave l'algorithme O-FICA en 4.5 se .

Page 143: Algorithmes temporels rapides à point fixe pour la ...

126 Chapitre 9. Résultats expérimentaux9.3 Tests statistiquesDans la première série de tests présentée i-dessous, nous avons omparéles temps de al ul des algorithmes optimisés O-FICA et O-DFICA aux algo-rithmes standard asso iés FastICA et DFICA. Pour ela, nous avons mesuréle temps qu'ils prennent à atteindre le ritère d'arrêt utilisé dans le logi ielMatlab FastICA. Brièvement, e ritère ompare les dire tions des ve teursd'extra tion après les deux dernières mises à jour et l'optimisation est stop-pée si es dire tions varient moins qu'un ertain seuil (nous avons réglé eparamètre de seuil à 10−4, qui est la valeur par défaut dans le logi iel). Nousavons testé les versions parallèles et à dé�ation des algorithmes pour séparerdes sour es uniformes et lapla iennes en nombres à peu près égaux.Pour les algorithmes di�érentiels O-DFICA et DFICA, nous avons prisdeux intervalles entre lesquels les puissan es des sour es varient dans le mêmesens. Sur es intervalles, nous avons mélangé es sour es ave 3 sour es debruit stationnaires orrespondant à des distributions uniforme, gaussienne etlapla ienne.La �gure 9.5 représente les valeurs de t′/t en fon tion du nombre d'é han-tillons T , où t et t′ sont respe tivement les temps de al ul des algorithmesstandard et optimisé. Pour haque on�guration, nous avons réalisé 100 testsde Monte-Carlo en faisant varier les sour es et les oe� ients de mélange, etavons moyenné les valeurs de t′/t. On peut onstater sur la �gure 9.5 quepour un nombre de sour es (un nombre de sour es non-stationnaires dans le as di�érentiel) inférieur ou égal à 7 pour les algorithmes (sur-)déterminés etinférieur ou égal à 6 pour les algorithmes di�érentiels, le rapport t′/t est nette-ment inférieur à 1 quand le nombre d'é hantillons T est assez grand et dé roîtgénéralement quand T augmente, e qui montre l'e� a ité de nos méthodesoptimisées.Dans la se onde série de tests, nous avons représenté l'indi e de perfor-man es en fon tion du temps de al ul des algorithmes symétriques standard etoptimisés dans la même on�guration que i-dessus. L'indi e de performan esmentionné i-dessus est dé�ni parPerf = meanj

{

maxi 10 log10

(

g2ij

j 6=i g2ij

)} (9.5)où les valeurs gij sont les oe� ients de la matri e de performan es G égaleau produit des matri es de mélange et de séparation. Dans le as di�érentiel,nous ne prenons en ompte que les olonnes de G asso iées aux sour es non-stationnaires et nous évaluons don la qualité de la séparation partielle dessour es utiles.Comme pré édemment, pour haque on�guration asso iée à un nombre desour es et à un temps de al ul donnés, nous avons réalisé 100 tests de Monte-Carlo et avons moyenné les valeurs de Perf . Nous avons hoisi un nombre total

Page 144: Algorithmes temporels rapides à point fixe pour la ...

9.3. Tests statistiques 12710

310

410

510

60

0.5

1

103

104

105

106

0

0.5

1

103

104

105

106

0

0.5

1

103

104

105

106

0

0.5

1

103

104

105

106

0

0.5

1

103

104

105

106

0

0.5

1

t′/t N = 2

N = 3

N = 4

N = 5

N = 6

N = 7

nombre T d’echantillons

103

104

105

0

0.5

1

103

104

105

0

0.5

1

103

104

105

0

0.5

1

103

104

105

0

0.5

1

103

104

105

0

0.5

1

103

104

105

0

0.5

1

t′/t N = 2

N = 3

N = 4

N = 5

N = 6

N = 7

nombre T d’echantillonsFig. 9.5 � Rapport t′/t des temps de al ul en fon tion du nombre T d'é hantillons.En traits pleins : algorithmes symétriques, en pointillés : algorithmes à dé�ation.A gau he : algorithmes non-di�érentiels (sur-)déterminés FastICA et O-FICA.A droite : algorithmes di�érentiels sous-déterminés DFICA et O-DFICA.

Page 145: Algorithmes temporels rapides à point fixe pour la ...

128 Chapitre 9. Résultats expérimentauxd'é hantillons égal à 100000 (T = 50000 dans le as di�érentiel). La �gure 9.6montre que les algorithmes optimisés atteignent la plus grande valeur de Perfen un temps de al ul plus ourt (ex epté pour N = 7 dans le as di�éren-tiel). Nous voyons aussi que pour les algorithmes FastICA et DFICA, l'indi ede performan es augmente progressivement ontrairement à nos versions op-timisées pour lesquelles l'indi e augmente très rapidement au moment où les oe� ients polyn�miaux ont été estimés (le temps de l'optimisation dans lenouvel espa e est négligeable omparé à l'identi� ation polyn�miale).9.4 Con lusionDans e hapitre, nous avons démontré l'intérêt de nos algorithmes op-timisés O-FICA et O-DFICA par rapport aux méthodes standard asso iées,FastICA et DFICA. Une appli ation en astrophysique a d'abord montré quedans le as d'une séparation de deux images sour es de dimension 4220×4298,notre méthode O-FICA permet d'e�e tuer la séparation en un temps 25 foisplus ourt. Des tests statistiques ont ensuite montré que nos algorithmes per-mettent, lorsque le nombre d'observations don de sour es n'est pas trop élevé,d'obtenir la même performan e de séparation en un temps plus ourt. Ces testsstatistiques, pour des raisons de temps de al ul, ont été limitées à un nombred'é hantillons égal à 1 million. Nos méthodes se sont alors révélées 2 à 10fois plus rapides que les méthodes standard. Pour des nombres d'é hantillonstrès grands omme dans le as des images astrophysiques de grande taille, legain s'avère supérieur. Nos méthodes permettent aussi, en un temps de al uldonné, d'obtenir une meilleure séparation.

Page 146: Algorithmes temporels rapides à point fixe pour la ...

9.4. Con lusion 1290 1 2 3 4

0

20

40

60

0 2 4 6 80

20

40

60

0 2 4 6 8 10 120

20

40

60

0 5 10 150

20

40

60

0 5 10 15 20 250

20

40

60

0 5 10 15 20 25 300

20

40

60

temps de calcul (sec.)

P erf (dB) N = 2

N = 3

N = 4

N = 5

N = 6

N = 7

0 1 2 3 40

20

40

60

0 2 4 6 8 10 120

20

40

60

0 2 4 6 8 10 120

20

40

60

0 5 10 15 200

20

40

60

0 5 10 15 20 250

20

40

60

0 10 20 300

20

40

60

P erf (dB)

temps de calcul (sec.)

N = 2

N = 3

N = 4

N = 5

N = 6

N = 7

Fig. 9.6 � Indi e de performan es Perf en fon tion du temps de al ul.En traits pleins : algorithmes symétriques optimisés.En pointillés : algorithmes symétriques standard.A gau he : algorithmes non-di�érentiels (sur-)déterminés FastICA et O-FICA.A droite : algorithmes di�érentiels sous-déterminés DFICA et O-DFICA.

Page 147: Algorithmes temporels rapides à point fixe pour la ...

130 Chapitre 9. Résultats expérimentaux

Page 148: Algorithmes temporels rapides à point fixe pour la ...

Con lusion générale

131

Page 149: Algorithmes temporels rapides à point fixe pour la ...
Page 150: Algorithmes temporels rapides à point fixe pour la ...

133Ce travail de thèse a eu pour obje tif de proposer des algorithmes temporelsde type point �xe pour une lasse de mélanges plus large que la lasse des mé-langes linéaires instantanés (sur-)déterminés, domaine d'appli ation de l'algo-rithme FastICA. Nous nous sommes d'abord intéressés aux mélanges onvolu-tifs (sur-)déterminés pour lesquels nous avons proposé un algorithme dénomméC-FICA, qui, grâ e à une pro édure de blan himent onvolutif non- ausal età une initialisation parti ulière des paramètres d'extra tion, utilise des itéra-tions d'optimisation de type point �xe pour estimer le pro essus d'innovationd'une sour e. Les ontributions des sour es sur les di�érents apteurs sontobtenues grâ e à un ritère quadratique orrespondant à la puissan e de ladi�éren e entre une observation et une version �ltrée non- ausale du pro es-sus d'innovation extrait. L'optimisation de e ritère onduit à l'adoption d'unpro essus de �ltrage de Wiener non- ausal. Des tests expérimentaux ont mon-tré que notre appro he permet de séparer des mélanges onvolutifs arti� ielsde signaux réels audio pour des réponses impulsionnelles de �ltres ontenant256 oe� ients mesurés au niveau des oreilles d'une tête de mannequin. Notreméthode a aussi permis de séparer des mélanges de signaux de télé ommuni- ations pour des �ltres arti� iels d'ordre 10. Suivant le type de sour es et lalongueur des �ltres, nous obtenons des SIR (rapport signal à interféren e) desortie ompris entre 13 à 25 dB. Nous avons onstaté que notre algorithmeC-FICA permet d'e�e tuer la séparation lorsque deux sour es se trouvent dumême �té de la tête de mannequin, ontrairement à d'autres algorithmes quin'y parviennent pas dans e as de �gure. Dans le as des signaux audio, unepro édure a été proposée, qui permet de re her her les zones stationnaires dessignaux de mélange. Des tests statistiques ont ensuite permis de valider notrealgorithme en termes de performan es de séparation et de rapidité. Nous avonsnotamment montré que notre algorithme est plus de 100 fois plus rapide et lé-gèrement plus performant en termes de séparation que l'algorithme de Tugnaitmodi�é (a éléré en utilisant une optimisation de type Newton), qui s'appliqueaux mêmes lasses de mélanges et de sour es. Cela permet d'utiliser des �ltresde séparation d'ordre plus grand et d'obtenir ainsi de meilleures performan esque et algorithme de Tugnait modi�é.Dans la se onde partie de e do ument, nous avons proposé des algorithmesde type point �xe pour les mélanges sous-déterminés instantanés ou onvo-lutifs. Contrairement à beau oup d'algorithmes destinés aux mélanges sous-déterminés, nous n'utilisons pas i i l'hypothèse de par imonie des sour es. Le on ept de séparation di�érentielle de sour es que nous employons nous permetd'e�e tuer la séparation partielle de sour es utiles non-stationnaires en pré-sen e de sour es de bruit stationnaires. L'algorithme que nous proposons pourles mélanges linéaires instantanés sous-déterminés, baptisé DFICA, utilise unblan himent di�érentiel des observations de façon à employer un algorithme detype point �xe pour extraire les sour es, soit itérativement par une appro heà dé�ation, soit de façon symétrique en utilisant un ritère de kurtosis ditdi�érentiel. La onvergen e globale de es algorithmes est prouvée rigoureu-

Page 151: Algorithmes temporels rapides à point fixe pour la ...

134sement et l'on montre que ette onvergen e est ubique. Pour la séparationdes mélanges onvolutifs sous-déterminés, nous avons étendu le pro essus deblan himent spatio-temporel non ausal à la séparation di�érentielle de sour eset avons proposé l'algorithme C-DFICA qui emploie un pro essus de blan hi-ment onvolutif di�érentiel non- ausal en préalable à l'optimisation du ritèredu kurtosis di�érentiel. Un ritère quadratique di�érentiel est proposé pourl'estimation des ontributions des sour es sur les apteurs, et son optimisationest réalisée au moyen d'un pro essus de �ltrage de Wiener non- ausal dit dif-férentiel. Nous avons ensuite réalisé des tests expérimentaux de séparation demélanges sous-déterminés linéaires instantanés ou onvolutifs de signaux réelsaudio ou de télé ommuni ations. Dans le as des mélanges onvolutifs, ommedans la première partie, nous avons utilisé des �ltres d'ordre 256 mesurés auniveau des oreilles d'une tête de mannequin. Ces tests ont on�rmé l'utilité denos méthodes, qui, ontrairement aux méthodes standard, permettent d'e�e -tuer la séparation partielle de sour es utiles en présen e de sour es de bruitrelativement puissantes. Des tests de Monte-Carlo ont permis ensuite de om-parer les performan es et la vitesse de notre algorithme C-DFICA ave uneversion di�érentielle de l'algorithme de Tugnait a éléré développée aupara-vant dans l'équipe. Ceux- i ont montré que notre algorithme C-DFICA est àpeu près 500 fois plus rapide, tout en donnant des performan es de séparationlégèrement meilleures.Dans la dernière partie de e do ument, nous avons présenté une nou-velle appro he pour séparer rapidement les mélanges linéaires instantanés (sur-)déterminés ou sous-déterminés de sour es ontenant un grand nombre d'é han-tillons. Nos méthodes se fondent sur l'observation du fait que les algorithmesFastICA et DFICA al ulent des moments empiriques à haque itération del'optimisation à point �xe du ritère, e qui implique le al ul de nombreusesopérations élémentaires. Pour y remédier, nous proposons d'identi�er les ri-tères du kurtosis et du kurtosis di�érentiel sous forme de polyn�mes multi-variables relativement aux oe� ients d'extra tion appliqués au ve teur d'ob-servation blan hi. Cette étape d'identi� ation permet ensuite d'e�e tuer lesitérations d'optimisation en un temps très ourt. Un test expérimental sur desdonnées astrophysiques du téles ope Hubble a montré que notre appro he O-FICA pour mélanges (sur-)déterminés permet de diviser le temps de al ul par25 par rapport à FastICA lorsque la taille de l'image avoisine les 16 millions depixels. Des tests de Monte-Carlo ont ensuite montré que pour un nombre desour es inférieur ou égal à 7, nos algorithmes O-FICA et O-DFICA permettentd'atteindre un seuil de ritère d'arrêt donné en un temps plus ourt, .-à-d.jusqu'à 10 fois plus ourt pour un mélange de 2 sour es ontenant 1 milliond'é hantillons. Les itérations d'optimisation étant e�e tuées très rapidementgrâ e à notre appro he, elle- i permet en fait de réduire onsidérablementle seuil du ritère d'arrêt sans a�e ter sensiblement le temps de al ul. Ellepermet don d'obtenir de meilleures performan es de séparation en un tempsdonné.

Page 152: Algorithmes temporels rapides à point fixe pour la ...

135Au sujet des méthodes proposées dans les deux premières parties de ettethèse, nous pouvons envisager à l'avenir de développer des pro édures pour hoisir au mieux les fenêtres d'extra tion où les pro essus d'innovation sontestimés. Nos méthodes né essitant que les sour es à séparer soient station-naires sur es fenêtres, les performan es de séparation pourraient se trouveraméliorées. Dans le as des mélanges (sur-)déterminés par exemple, la méthodeproposée qui al ule les oe� ients de orrélation de sorties obtenues sur plu-sieurs intervalles est relativement simple et pourrait être perfe tionnée en yin luant des mesures de stationnarité. Dans le as des méthodes di�érentiellesqui demandent à la fois la stationnarité des sour es sur haque fenêtre d'ana-lyse et des variations de puissan es de sour es de même signe d'une fenêtre àune autre, une pro édure de hoix automatique des deux fenêtres d'extra tiontenant ompte de es deux ontraintes pourrait être envisagée.Nous pensons aussi étendre nos algorithmes C-FICA et C-DFICA aux mé-langes onvolutifs à �ltres et à sour es omplexes. Cela serait intéressant pourpouvoir utiliser nos méthodes dans le as d'appli ations en télé ommuni ations.Nous souhaitons aussi proposer des versions symétriques de es algorithmes defaçon à éviter l'a umulation d'erreurs d'estimation durant le pro essus de dé-�ation. En�n, une version optimale de C-FICA, en se basant sur l'algorithmeinstantané EFICA qui atteint la borne de Cramer-Rao, pourrait aussi être en-visagée.Con ernant la dernière partie de ette thèse, nous pensons à l'avenir étendrenotre méthode O-FICA au ritère de la néguentropie. En e�et, il existe des ap-proximations de la néguentropie qui utilisent des fon tions non-quadratiquesG(x) polyn�miales. La néguentropie est alors en ore un polyn�memulti-variablerelativement aux oe� ients d'extra tion. Une première étape d'identi� ationde e polyn�me permettrait don d'e�e tuer les itérations d'optimisation defaçon plus rapide, e qui diminuerait le temps de al ul par rapport à l'algo-rithme FastICA basé sur la néguentropie.Dans les trois parties de ette thèse, nous avons proposé des méthodes ap-partenant à la lasse de l'ACI. Ces méthodes supposent que les sour es sontstationnaires et ergodiques. En e�et, es méthodes demandent l'estimation destatistiques par des moyennages empiriques, e qui est réalisable seulement siles sour es sont stationnaires et ergodiques. Ré emment, nous avons mis enéviden e qu'en hoisissant des fenêtres d'extra tion de taille réduite, du fait dela stationnarité à ourt terme des sour es qui est mieux véri�ée en pratique,nous pouvons obtenir de meilleures performan es de séparation pour des si-gnaux non-stationnaires à long terme mais stationnaires à ourt terme. Nousdéveloppons a tuellement, pour les mélanges linéaires instantanés(sur-)déterminés dans un premier temps, une méthode qui e�e tue des ACIsu essivement sur une série de zones temporelles ou spatiales de taille ré-

Page 153: Algorithmes temporels rapides à point fixe pour la ...

136duite et éventuellement re ouvrantes, puis lassi�e les ve teurs de séparationobtenus pour obtenir une série de ve teurs orrespondant aux entroïdes des lusters déte tés. Nous avons démontré que ette appro he permet d'e�e tuerla séparation de sour es empiriquement orrélées à long terme mais empirique-ment dé orrélés à ourt terme. Cela n'est pas le as de la plupart des méthodesd'ACI ar elles- i ommen ent par blan hir empiriquement les observationset estiment ensuite une matri e unitaire réalisant la séparation à partir du ve -teur d'observations blan hies : les sour es estimées sont don par onstru tionempiriquement dé orrélées à long terme. Nos premiers résultats expérimen-taux montrent que notre appro he, en utilisant l'algorithme de lassi� ationK-medians, donne une nette amélioration des performan es de séparation dansle as de sour es audio et d'images non-stationnaires, et permet une séparationde sour es orrélées à long terme, ontrairement aux méthodes d'ACI standardqui é houent lorsqu'on e�e tue l'ACI sur l'intégralité des é hantillons. Un ar-ti le de onféren e est en ours de soumission on ernant e travail. Cette ap-pro he pourra ensuite être étendue aux mélanges onvolutifs (sur-)déterminéset sous-déterminés, e qui donnera lieu pro hainement à des travaux théoriqueset expérimentaux.

Page 154: Algorithmes temporels rapides à point fixe pour la ...

Annexes

137

Page 155: Algorithmes temporels rapides à point fixe pour la ...
Page 156: Algorithmes temporels rapides à point fixe pour la ...

Annexe A : Blan himentL'étage de blan himent d'un jeu d'observations entrées x1(n), · · · , xP (n) onsiste à dé orréler mutuellement es observations entre elles. Le plus sou-vent, ette étape de dé orrélation est suivie d'une étape de normalisation desorte que les signaux obtenus sont de puissan e unité. Soit Rx la matri e d'au-to orrélation des observations, dont haque oe� ient (i, j) est dé�ni par le oe� ient de orrélation entre la ième observation et la jème observation :E {xi(n)xj(n)} (1)La matri e Rx est alors dé�nie matri iellement par

Rx = E{x(n)x(n)t

}. (2)E�e tuons maintenant la diagonalisation de la matri e Rx, qui donne unematri e orthogonale E de ve teurs propres regroupés par olonnes, et unematri e diagonale ∆ onstituée des valeurs propres de Rx.Soit y(n) le ve teur signal dé�ni par

y(n) = Etx(n) (3)et al ulons sa matri e d'auto orrélation Ry :Ry = E

{y(n)y(n)t

}

= E{

Etx(n)(Etx(n)

)t}

= EtE{x(n)x(n)t

}E

= EtRxE

= EtE∆EtE

= ∆ (4)La matri e d'auto orrélation du ve teur signal y(n) est don diagonale, equi signi�e que les signaux y1(n), · · · , yP (n) sont mutuellement dé orrélés (leve teur d'observations y(n) est dit blan hi), et véri�ent∀i, j = 1 . . . P, E {zi(n)zj(n)} = δij∆i (5)où δij est le symbole de Krone ker dé�ni par

δij =

{

1 si i = j

0 sinon, (6)139

Page 157: Algorithmes temporels rapides à point fixe pour la ...

140 Annexe A : Blan himentet ∆i est la ième valeur propre de Rx. La matri e Rx étant une matri e d'au-to orrélation, on peut montrer qu'elle est dé�nie positive, .-à-d. que toutesses valeurs propres (regroupées dans la matri e diagonale ∆) sont stri tementpositives.Soit le ve teur signal z(n) dé�ni parz(n) = ∆−1/2y(n) = ∆−1/2Etx(n), (7)où ∆−1/2 est la matri e diagonale onstituée des ra ines arrées inverses desvaleurs propres de Rx. Cal ulons la matri e d'auto orrélation de z(n) :

Rz = E{z(n)z(n)t

}

= E{

∆−1/2y(n)(∆−1/2y(n)

)t}

= ∆−1/2E{y(n)y(n)t

}∆−1/2

= ∆−1/2∆∆−1/2

= I (8)La matri e d'auto orrélation de z(n) est don égale à la matri e identité, equi implique que ses signaux sont mutuellement dé orrélés et de puissan eunité (le ve teur d'observations z(n) est dit blan hi et normalisé). La �gure 1illustre sous forme de s héma-blo les deux étages su essifs de dé orrélationet de normalisation.PP P

x(n) Et z(n)∆−1/2y(n)

Fig. 1 � S héma-blo des étages de blan himent et de normalisation.On dé�nit aussi parfois z(n) parz(n) = E∆−1/2Etx(n), (9)dé�nition qui fait intervenir la matri eE∆−1/2Et, dite matri e ra ine arrée in-verse de la matri e d'auto orrélation Rx. On montre fa ilement que la matri ed'auto orrélation de e nouveau ve teur signal z(n) est aussi égale à la matri eidentité. La �gure 2 i-dessous illustre les deux possibilités de blan himent.

∆−1/2Et

E∆−1/2Et

ouP P

z(n)x(n)Fig. 2 � S héma-blo du pro essus de blan himent et de normalisation.

Page 158: Algorithmes temporels rapides à point fixe pour la ...

141Le pro essus de blan himent (ou de dé orrélation) et de normalisation dé- rit i-dessus est appelé 'sphering' en anglais. Cette dénomination vient dufait que si l'on applique un ve teur d'extra tion w au ve teur d'observationblan hi normalisé z(n), le signal wtz(n) est de puissan e unité si et seulementsi le ve teur w appartient à la sphère unité :E{(

wtz(n))2}

= 1⇔ ‖w‖ = 1 (10)

Page 159: Algorithmes temporels rapides à point fixe pour la ...

142 Annexe A : Blan himent

Page 160: Algorithmes temporels rapides à point fixe pour la ...

Annexe B : Estimation des ontributions des sour esConsidérons la di�éren e x′k(n) entre l'observation xk(n) et une version�ltrée du signal extrait pré édent el(n), .-à-d.

x′k(n) = xk(n)−

R′

r=−R′

c(r)el(n− r) (1)où les c(r) sont les oe� ients d'un �ltre RIF non ausal. En raison des hypo-thèses de la se tion 2.1, xk(n) est un mélange RIF ausal de tous les pro essusd'innovation, .-à-d. que (2.4) nous donnexk(n) =

N∑

q=1

L∑

r=0

hkq(r)uq(n− r). (2)De plus,el(n) = βlul(n− rl) (3)Don , si R′ est assez grand pour que rl − R′ ≤ 0 et rl + R′ ≥ L, (1)-(3) nousdonnent

x′k(n) =

rl+R′

r=rl−R′

[hkl(r)− βlc(r − rl)]ul(n− r) +∑

q 6=l

L∑

r=0

hkq(r)uq(n− r) (4)La puissan e de x′k(n) vaut

E{x′2

k (n)}

=

rl+R′

r=rl−R′

[hkl(r)− βlc(r − rl)]2E{u2

l (n− r)}

+∑

q 6=l

L∑

r=0

h2kq(r)E

{u2

q(n− r)}

. (5)Comme nous avons supposé que toutes les puissan es E {u2l (n− r)} sont stri -tement positives, l'éq. (5) montre que la minimisation de E {x′2

k (n)} en fon tionde c(r) orrespond exa tement àhkl(r)− βlc(r − rl) = 0, ∀r ∈ [rl − R′, · · · , rl + R′]. (6)143

Page 161: Algorithmes temporels rapides à point fixe pour la ...

144 Annexe B : Estimation des ontributions des sour esEn omparant e résultat ave (4), nous en déduisons que pour obtenir uneobservation modi�ée x′k(n) où la ontribution de la leme sour e a été enlevée onsiste à minimiser E {x′2

k (n)}. Nous utilisons la méthode de Newton pouroptimiser e ritère, qui est noté J dans la suite et peut être exprimé parJ = E

{(xk(n−

R′

r=−R′

c(r)el(n− r))2}

. (7)L'équation de mise à jour du ve teur c = [c(−R′), · · · , c(R′)]t s'é ritc← c−

(∂2J

∂c2

)−1∂J

∂c(8)où ∂J

∂cet ∂2J

∂c2 sont respe tivement le gradient et le Hessien du ritère J . Cal u-lons la ieme omposante du gradient de J par rapport à c :∂J

∂ci= 2E

{

− el(n− i).(xk(n)−

R′

r=−R′

c(r)el(n− r))} (9)En parti ulier

∂J

∂ci

∣∣∣∣c=0

= 2E {−el(n− i)xk(n)} . (10)Don nous avons∂J

∂c

∣∣∣∣c=0

= −2relxk(n) (11)où relxk

(np) est le ve teur d'inter orrélation entre les signaux el(n−i), ave i ∈[−R′, R′] et xk(np). Cal ulons maintenant la (i, j)eme omposante du Hessiende J :

∂2J

∂ci∂cj= 2E {el(n− i)el(n− j)} . (12)Don , nous avons

∂2J

∂c2= 2Rel

(n) (13)où Rel(np) est la matri e d'auto orrélation asso iée aux valeurs de el(n). Eninitialisant c ave c = 0, la valeur de c après une itération de l'algorithme deNewton s'é rit

c′ = −

(∂2J

∂c2

)−1∂J

∂c

∣∣∣∣c=0

= −1

2Rel

(n)−1(−2)relxk(n)

= Rel(n)−1relxk

(n). (14)Sa hant que l'algorithme de Newton atteint un point stationnaire en une itéra-tion pour les ritères quadratiques et que notre ritère est quadratique positif,nous prouvons que le ve teur c′ orrespond au maximum global de J . Notonsque ette expression est elle d'un �ltre de Wiener.

Page 162: Algorithmes temporels rapides à point fixe pour la ...

Annexe C : Dé�nitions des ritèresSIRout, SIRin, SIRI et SNRinPour haque sour e sj(n) et haque ontribution estimée de la sour e k dansl'obsevation i notée xik(n), nous dé�nissons le SIRout(i, j, k) asso ié omme lerapport entre la puissan e du "signal" et la puissan e de l'"interféren e" où� le "Signal" est la valeur idéale xij(n) de xik(n) qui est la ontribution desj(n) dans xi(n).� l'"Interféren e" est la déviation de xik(n) par rapport à sa valeur idéale, .-à-d. xik(n)− xij(n).Cela donne ∀i ∈ {1, · · · , P} , ∀j ∈ {1, · · · , N} , ∀k ∈ {1, · · · , P} ,

SIRout(i, j, k) = 10 log10

(

E{x2

ij(n)}

E {(xik(n)− xij(n))2}

)

. (1)Pour haque sour e j et haque sortie k, on onsidère seulement le seulSIRout(i, j, k) orrespondant à l'observation i donnant le signal xik qui a lapuissan e la plus élevée. Ensuite, pour haque indi e de sour e j, on onsi-dère seulement le maximum par rapport à l'indi e de sortie k des valeursSIRout(i, j, k). Cela nous donne un unique SIR pour haque sour e utile.Le SIR d'entrée (SIRin) de la sour e j dans les observations est lui dé�nipar∀j ∈ {1, · · · , N} , SIRin(j) = maxi 10 log10

(

E{x2

ij(n)}

∑k 6=jk=1..N E {x2

ik(n)}

)

. (2)Pour une sour e donnée, on dé�nit ensuite l'amélioration du SIR, SIRI parSIRI(j) = SIRout(j)− SIRin(j) (3)D'une façon similaire, nous pouvons dé�nir le rapport signal à bruit desobservations par

∀i ∈ {1, · · · , N} , SNRin(i) = 10 log10

(∑

k∈U E {x2ik(n)}

k∈B E {x2ik(n)}

) (4)145

Page 163: Algorithmes temporels rapides à point fixe pour la ...

146 Annexe C : Dé�nitions des ritères SIRout, SIRin, SIRI et SNRinoù U et B sont respe tivement les ensembles d'indi es asso iées aux sour esutiles et aux sour es de bruit. Les SNRin(i) peuvent ensuite être moyennéspour obtenir un unique ritère pour l'ensemble des observations.

Page 164: Algorithmes temporels rapides à point fixe pour la ...

Annexe D : Gradient du kurtosisdi�érentielLe kurtosis non-normalisé d'un signal entré y(n) = wtz(n) est dé�ni parkurty(n) = E

{y4(n)

}− 3

(E{y2(n)

})2. (1)En al ulant sa dérivée première par rapport à w, nous obtenons

∂ kurty(n)

∂w=

∂w

(

E{(wtz(n))4

}− 3

(E{(wtz(n))2

})2)

= E{4z(n)(wtz(n))3

}− 6E

{(wtz(n))2

}E{2z(n)wtz(n)

}

= 4E{z(n)y3(n)

}− 12E

{y2(n)

}E{z(n)z(n)t

}w

∝ E{z(n)y3(n)

}− 3E

{y2(n)

}Rz(n)w. (2)Notons que dans l'appro he FastICA non di�érentielle, l'expression du gradient(2) peut être simpli�ée en raison de l'étape de dé orrélation et de normalisationqui entraîne E {y2(n)} = 1 et Rz(n) = I. L'expression du gradient est alors

∂ kurty(n)

∂w∝ E

{z(n)y3(n)

}− 3w. (3)Dans notre as, le gradient di�érentiel s'é rit

∂Dkurty(n1, n2)

∂w=

∂ kurty(n2)

∂w−

∂ kurty(n1)

∂w∝ E

{z(n2)y

3(n2)}− 3E

{y2(n2)

}Rz(n2)w

−E{z(n1)y

3(n1)}

+ 3E{y2(n1)

}Rz(n1)w. (4)En utilisant les relations Rz(n2)−Rz(n1) = I, E {y2(ni)} = wtRz(ni)w ∀i ∈

{1, 2} et E {y2(n2)} −E {y2(n1)} = 1, on peut simpli�er l'expression (4) pourobtenir∂Dkurty(n1, n2)

∂w∝ E

{z(n2)y

3(n2)}− E

{z(n1)y

3(n1)}

−3[Rz(n1) + (1 + wtRz(n1)w)I

]w. (5)147

Page 165: Algorithmes temporels rapides à point fixe pour la ...

148 Annexe D : Gradient du kurtosis di�érentiel

Page 166: Algorithmes temporels rapides à point fixe pour la ...

Annexe E : La orrélationdi�érentielleNous supposons i i que le signal extrait ontient seulement une seule sour eutile ainsi que des sour es de bruits de sorte quey(n) = εsl(n) +

q /∈I

αqsq(n) (1)ave l ∈ I. Le fa teur d'é helle ε asso ié à sl(n) dans (1) peut être obtenu grâ eà la puissan e di�érentielle de y(n) supposée égale à 1 et grâ e à la puissan edi�érentielle unitaire des sour es non-stationnaires, .-à-d.Dpowsl

(n1, n2) = 1, ∀l ∈ I (2)qui implique que ε = ±1. Dans la suite, nous supposons sans perte de généra-lité que ε = 1 (autrement, nous pouvons redé�nir sl(n) par son opposée).En outre, la keme observation s'é ritxk(n) =

N∑

q=1

akqsq(n). (3)Cal ulons maintenant la orrélation di�érentielle entre y(n) et xk(n), dé�nieparDcorryxk

(n1, n2) = E {y(n2)xk(n2)} − E {y(n1)xk(n1)} . (4)Don Dcorryxk

(n1, n2) = aklDcorrslsl(n1, n2) +

q 6=l

akqDcorrslsq(n1, n2)

+∑

q1/∈I,q2

αq1akq2

Dcorrsq1sq2

(n1, n2)

= aklDpowsl(n1, n2)

= akl (5) omme Dcorrsq1sq2

(n1, n2) = 0, ∀q1 6= q2 en raison de l'indépendan e dessour es entrées, Dcorrsqsq(n1, n2) = 0, ∀q /∈ I en raison de la stationnarité149

Page 167: Algorithmes temporels rapides à point fixe pour la ...

150 Annexe E : La orrélation di�érentielledes sour es de bruit et en prenant en ompte (2).Dcorryxk

(n1, n2) donne don le fa teur d'é helle asso ié à la ontributionde la leme sour e dans la keme observation.

Page 168: Algorithmes temporels rapides à point fixe pour la ...

Annexe F : Dé�nitions des ritèresSIRout, SIRin et SIRI pour lesméthodes de séparation partielleNous dé�nissons i i les ritères utilisés dans le hapitre 3 pour évaluer lesperforman es des algorithmes à dé�ation. Pour haque test, nous appliquonsd'abord les mélanges de toutes les sour es au système de SAS et estimons lesparamètres séparation. Comme nous her hons à évaluer la qualité de la sépa-ration partielle seulement entre les sour es non-stationnaires, nous transféronsensuite seulement es sour es à travers les étages de mélange de séparation.Nous obtenons ainsi un jeu de ontributions estimées xik(n) asso iées à unsignal extrait yk(n) et à une observation xi(n). Pour haque sour e sj(n) et haque signal xik(n), nous dé�nissons ensuite un SIRout(i, j, k) asso ié ommele rapport entre la puissan e du "signal" et la puissan e de l'"interféren e" où� le "Signal" est la valeur idéale xij(n) de xik(n) qui est la ontribution de

sj(n) dans xi(n).� l'"Interféren e" est la déviation de xik(n) par rapport à sa valeur idéale, .-à-d. xik(n)− xij(n).Cela donne ∀i ∈ {1, · · · , P} , ∀j ∈ I, ∀k ∈ {1, · · · , P} ,

SIRout(i, j, k) = 10 log10

(

E{x2

ij(n)}

E {(xik(n)− xij(n))2}

)

. (1)Pour haque sour e j et haque sortie k, on onsidère seulement le seulSIRout(i, j, k) orrespondant à l'observation i donnant le signal xik qui a lapuissan e la plus élevée. Ensuite, pour haque indi e de sour e j, on onsi-dère seulement le maximum par rapport à l'indi e de sortie k des valeursSIRout(i, j, k). Nous al ulons ensuite la moyenne de es valeurs sur les deuxintervalles temporels. Cela nous donne un unique SIR pour haque sour eutile, qui dé�nit la performan e de sortie de notre système, noté SIRout(j) i-après. La moyenne de es SIRout(j) sur les sour es peut ensuite être al u-lée. Nous faisons ette moyenne pour al uler le SIRout global des méthodessymétriques. 151

Page 169: Algorithmes temporels rapides à point fixe pour la ...

152Annexe F : Dé�nitions des ritères SIRout, SIRin et SIRI pour les méthodes de séparation partielleLe SIR d'entrée des observations est dé�nie de manière similaire. Nousdé�nissons d'abord le SIR d'entrée asso ié à haque sour e par∀j ∈ I, SIRin(j) = maxi 10 log10

(

E{x2

ij(n)}

∑k 6=jk∈I E {x2

ik(n)}

)

. (2)Nous al ulons ensuite le SIRin global omme la moyenne sur les sour es etsur les domaines temporels.

Page 170: Algorithmes temporels rapides à point fixe pour la ...

Annexe G : Choix de la famille deve teurs d'extra tionDé�nissons les 5 ensembles32 :E1 =

{

w ∈ {0, 1}N \ ∃i1 , w(i1) = 1, ∀i 6= i1 w(i) = 0}

E2 ={

w ∈ {0, 1}N \ ∃i1, i2 , w(i1) = w(i2) = 1, ∀i 6= i1, i2 w(i) = 0}

E3 ={

w ∈ {0, 1, 2}N \ ∃i1, i2 , w(i1) = 2w(i2) = 2, ∀i 6= i1, i2 w(i) = 0}

E4 ={

w ∈ {0, 1, 2}N \ ∃i1, i2, i3 , w(i1) = 2w(i2) = 2w(i3) = 2, ∀i 6= i1, i2, i3 w(i) = 0}

E5 ={

w ∈ {0, 1}N \ ∃i1, · · · , i4 , w(i1) = . . . = w(i4) = 1, ∀i 6= i1, · · · , i4 w(i) = 0}Les ardinaux de E1, .., E5 valent respe tivement N, N(N−1)

2, N(N − 1),

N(N−1)(N−2)2

, N(N−1)(N−2)(N−3)24

. En notant E = ∪iEi, card(E) =∑

i card(Ei) =

N + 3N(N−1)2

+ N(N−1)(N−2)2

+ N(N−1)(N−2)(N−3)24

= card(D) = R.De plus, nous avons véri�é numériquement que ette famille donne unematri e M dé�nie par (8.11) non singulière pour un nombre de sour es N ≤ 7.Les onditionnements respe tifs de M (dé�nis par le rapport de la plus grandeet de la plus petite valeurs propres de M) pour N = 2, · · · , 7 valent en e�et182, 414, 844, 1605, 2758, 4344, e qui assez faible pour les valeurs de R asso iées(respe tivement 5, 15, 35, 70, 126, 210). Par exemple, le onditionnement moyende matri es de dimension 210 ave des oe� ients uniformément distribuésentre 0 et 1 est supérieur à 50000. Nous avons don une famille de ve teursqui peut être utilisée pour identi�er le jeu de oe� ients (αr)r=1..R dé�ni par(8.8).

32Dans le as sous-déterminé, N doit être rempla é par N dans e qui suit.153

Page 171: Algorithmes temporels rapides à point fixe pour la ...

154 Annexe G : Choix de la famille de ve teurs d'extra tion

Page 172: Algorithmes temporels rapides à point fixe pour la ...

Bibliographie[1℄ Musi al audio stream separation by non-negative matrix fa torization. DsA tes DMRN Summer Conferen e, Glasgow, Royaume-Uni, juil. 2005. B.Wang and M. D. Plumbley.[2℄ Investigating single- hannel audio sour e separation methods based onnon-negative matrix fa torization. Ds A tes ICArn'06, p. 18�19, Liver-pool, Royaume-Uni, sept. 2006. B. Wang and M. D. Plumbley.[3℄ K. Abed-Meraim, J. F. Cardoso, A. Y. Gorokhov, P. Loubaton etE. Moulines: On Subspa e Methods for Blind Identi� ation of Single-Input Multiple-Output FIR Systems. IEEE Trans. on Signal Pro essing,45(1) :42�55, janv. 1997.[4℄ K. Abed-Meraim, Y. Hua, P. Loubaton et E. Moulines: Subspa e Methodfor Blind Identi� ation of Multi hannel FIR Systems in Noise Field withUnknown Spatial Covarian e. IEEE Signal Pro essing Letters, 4(5) :135�137, mai 1997.[5℄ K. Abed-Meraim, P. Loubaton et E. Moulines: A Subspa e Algorithmfor Certain Blind Identi� ation Problems. IEEE Trans. on InformationTheory, 43(2) :499�511, mars 1997.[6℄ F. Abrard: Méthodes de séparation aveugle de sour es et appli ations.Thèse de do torat, Université Paul Sabatier - Toulouse 3, Fran e, pages29-41, mars 2003.[7℄ F. Abrard et Y. Deville: A time-frequen y blind signal separation methodappli able to underdetermined mixtures of dependent sour es. Signal Pro- essing, 85(7) :1389�1403, juil. 2005.[8℄ F. Abrard, Y. Deville et J. Thomas: Blind partial separation of under-determined onvolutive mixtures of omplex sour es based on di�erentialnormalized kurtosis. Neuro omputing. A paraître.[9℄ F. Abrard, Y. Deville et P. White: From blind sour e separation to blindsour e an ellation in the underdetermined ase : a new approa h basedon time-frequen y analysis. Ds A tes Intl. Conf. on Independent Com-ponent Analysis and Signal Separation (ICA'01), San Diego, Californie,dé . 2001.[10℄ B. Albouy: Méthodes de séparation aveugle de sour es appli ables à dessignaux de parole. Thèse de do torat, Université Paul Sabatier - Toulouse3, Fran e, dé . 2004. 155

Page 173: Algorithmes temporels rapides à point fixe pour la ...

156 Bibliographie[11℄ B. Albouy et Y. Deville: A time-frequen y blind sour e separation methodbased on segmented oheren e fun tion. Ds A tes Intl. Work. on Arti� ialNeural Networks (IWANN'03), vol. 2, p. 289�296, Minorque, Espagne,juin 2003.[12℄ B. Albouy et Y. Deville: Alternative stru tures and power spe trum rite-ria for blind segmentation and separation of onvolutive spee h mixtures.Ds A tes Intl. Conf. on Independent Component Analysis and SignalSeparation (ICA'03), p. 361�366, Nara, Japon, avr. 2003.[13℄ S. Amari, A. Ci ho ki et H. H. Yang: A New Learning Algorithm forBlind Signal Separation. Ds A tes Conf. on Advan es in Neural Informa-tion Pro essing Systems (NIPS'95), vol. 8, p. 757�763, Denver, Colorado,nov. 1995.[14℄ J. Anemüller et B. Kollmeier: Adaptive separation of a ousti sour es forane hoi onditions : A onstrained frequen y domain approa h. Spee hCommuni ations, 39(1-2) :79�95, janv. 2003.[15℄ P. Anttila, P. Paatero, U. Tapper et O. Järvinen: Sour e identi� ationof bulk wet deposition in Finlande by positive matrix fa torization. At-mospheri Environment, 29(14) :1705�1718, juil. 1995.[16℄ S. Araki, R. Mukai et S. Makino: The fundamental limitation of frequen ydomain blind sour e separation for onvolutive mixtures of spee h. IEEETrans. on Spee h and Audio Pro essing, 11(2) :109�116, mars 2003.[17℄ A. Aïssa-El-Bey, K. Abed-Meraim et Y. Grenier: Blind Separation ofUnderdetermined Convolutive Mixtures Using Their Time-Frequen y Re-presentation. IEEE Trans. on Audio, Spee h, and Language Pro essing,15(5) :1540�1550, juil. 2007.[18℄ A. Aïssa-El-Bey, N. Linh-Trung, K. Abed-Meraim, A. Belou hrani et Y.Grenier: Underdetermined Blind Separation of Nondisjoint Sour es in theTime-Frequen y Domain. IEEE Trans. on Signal Pro essing, 55(3) :897�907, mars 2007.[19℄ M. Babaie-Zadeh et C. Jutten: A general approa h for mutual informa-tion minimization and its appli ation to blind sour e separation. SignalPro essing, 85(5) :975�995, mai 2005.[20℄ A. D. Ba k et A. C. Tsoi: Blind de onvolution of signals using a omplexre urrent network. Ds A tes Intl. Work. on Neural Networks for SignalPro essing (NNSP'94), p. 565�574, Ermioni, Grè e, sept. 1994.[21℄ R. Balan, J. Ros a et S. Ri kard: Non-square blind sour e separation un-der oherent noise by beamforming and time-frequen y masking. Ds A tesIntl. Conf. on Independent Component Analysis and Signal Separation(ICA'03), p. 313�318, Nara, Japon, avr. 2003.[22℄ R. Balan, J. Ros a et S. Ri kard: S alable non-square blind sour e se-paration in the presen e of noise. Ds A tes Intl. Conf. on A ousti s,Spee h, and Signal Pro essing (ICASSP'03), vol. 5, p. 293�296, HongKong, Chine, avr. 2003.

Page 174: Algorithmes temporels rapides à point fixe pour la ...

157[23℄ A. J. Bell et T. J. Sejnowski: An information-maximisation approa hto blind separation and blind de onvolution. Neural Computation,7(6) :1129�1159, juil. 1995.[24℄ A. Belou hrani, K. Abed-Meraim, J. F. Cardoso et E. Moulines: A BlindSour e Separation Te hnique Using Se ond-Order Statisti s. IEEE Trans.on Signal Pro essing, 45(2) :434�444, fév. 1997.[25℄ A. Belou hrani et M. G. Amin: Blind Sour e Separation Based on Time-Frequen y Signal Representations. IEEE Trans. on Signal Pro essing,46(11) :2888�2897, nov. 1998.[26℄ A. Belou hrani et J. F. Cardoso: Maximum likelihood sour e separationfor dis rete sour es. Ds A tes European Signal Pro essing Conferen e(EUSIPCO'94), vol. 2, p. 768�771, Edimbourg, Royaume-Uni, sept.1994.[27℄ L. Benaroya, F. Bimbot et R. Gribonval:Audio Sour e Separation With aSingle Sensor. IEEE Trans. on Audio, Spee h, and Language Pro essing,14(1), janv. 2006.[28℄ L. Benaroya, L. M. Donagh, F. Bimbot et R. Gribonval: Non negativesparse representation for Wiener based sour e separation with a singlesensor. Ds A tes Intl. Conf. on A ousti s, Spee h, and Signal Pro essing(ICASSP'03), vol. 6, p. 613�616, Hong Kong, Chine, avr. 2003.[29℄ O. Berné, C. Joblin, Y. Deville, J. D. Smith, M. Rapa ioli, J. P. Bernard,J. Thomas, W. Rea h et A. Abergel: Analysis of the emission of verysmall dust parti les from Spitzer spe tro-imagery data using Blind SignalSeparation methods. Astronomy & Astrophysi s, 469(2) :575�586, juil.2007.[30℄ O. Berné, C. Joblin, M. Rapa ioli, J. Thomas, J. C. Cuillandre et Y.Deville: Extended Red Emission and the evolution of arbona eous nano-grains in NGC 7023. Astronomy & Astrophysi s, 479(3) :L41�44, mars2008.[31℄ F. Berthommier et S. Choi: Several improvements of the Herault-Juttenmodel for spee h segregation. Ds A tes Intl. Conf. on Independent Com-ponent Analysis and Blind Signal Separation (ICA'03), p. 1089�1094,Nara, Japon, avr. 2003.[32℄ A. Blin, S. Araki et S. Makino: A sparseness-mixing matrix estima-tion (SMME) solving the underdetermined BSS for onvolutive mix-tures. Ds A tes Intl. Conf. on A ousti s, Spee h, and Signal Pro essing(ICASSP'04), vol. 4, p. 85�88, Montréal, Canada, mai 2004.[33℄ P. Bo�ll: Underdetermined blind separation of delayed sound sour es inthe frequen y domain. Neuro omputing, 55(3-4) :627�641, o t. 2003.[34℄ P. Bo�ll et E. Monte: Underdetermined Convoluted Sour e Re onstru -tion Using LP and SOCP, and a Neural Approximator of the Optimizer.Ds A tes Intl. Conf. on Independent Component Analysis and Signal Se-paration (ICA'06), p. 569�576, Charleston, Caroline du Sud, mars 2006.

Page 175: Algorithmes temporels rapides à point fixe pour la ...

158 Bibliographie[35℄ P. Bo�ll et M. Zibulevsky: Blind separation of more sour es than mixturesusing sparsity of their short-time Fourier transform. Ds A tes Intl. Conf.on Independent Component Analysis and Signal Separation (ICA'00), p.87�92, Helsinki, Finlande, juin 2000.[36℄ P. Bo�ll et M. Zibulevsky: Underdetermined blind sour e separation usingsparse representations. Signal Pro essing, 81(11) :2353�2362, nov. 2001.[37℄ H. Bousbia-Salah, A. Belou hrani et K. Abed-Meraim: Ja obi-like al-gorithm for blind signal separation of onvolutive mixtures. Ele troni Letters, 37 :1049�1050, août 2001.[38℄ H. Bu hner, R. Ai hner et W. Kellermann: A Generalization of BlindSour e Separation Algorithms for Convolutive Mixtures Based on Se ond-Order Statisti s. IEEE Trans. on Spee h and Audio Pro essing, 13(1),janv. 2005.[39℄ X. R. Cao et R. W. Liu: General approa h to blind sour e separation.IEEE Trans. on Signal Pro essing, 44(3) :562�571, mars 1996.[40℄ V. Capdevielle, C. Servière et J. L. La oume: Blind separation of wide-band sour es in the frequen y domain. Ds A tes Intl. Conf. on A ous-ti s, Spee h, and Signal Pro essing (ICASSP'95), vol. 3, p. 2080�2083,Détroit, Mi higan, mai 1995.[41℄ J. F. Cardoso: Sour e separation using higher order moments. Ds A tesIntl. Conf. on A ousti s, Spee h, and Signal Pro essing (ICASSP'89),vol. 4, p. 2109�2112, Glasgow, Royaume-Uni, mai 1989.[42℄ J. F. Cardoso: Infomax and Maximum Likelihood for Blind Sour e Sepa-ration. IEEE Signal Pro essing Letters, 4(4) :112�114, avr. 1997.[43℄ J. F. Cardoso: Blind signal separation : statisti al prin iples. Pro eedingsof the IEEE, 9(10) :2009�2025, o t. 1998.[44℄ J. F. Cardoso et A. Souloumia : Blind beamforming for non-Gaussiansignals. IEE Pro eedings F Radar and Signal Pro essing, 140(6) :362�370, dé . 1993.[45℄ N. Charkani: Séparation auto-adaptative de sour es pour des mélanges onvolutifs. Appli ation à la téléphonie mains libres dans les voitures.Thèse de do torat, Institut National Polyte hnique de Grenoble, Fran e,nov. 1996.[46℄ N. Charkani et Y. Deville: Self-adaptive separation of onvolutively mixedsignals with a re ursive stru ture. Part I : Stability analysis and optimi-zation of asymptoti behaviour. Signal Pro essing, 73(3) :225�254, janv.1999.[47℄ N. Charkani et Y. Deville: Self-adaptive separation of onvolutively mixedsignals with a re ursive stru ture. Part II : Theori al extensions andappli ation to syntheti and real signals. Signal Pro essing, 75(2) :117�140, juin 1999.

Page 176: Algorithmes temporels rapides à point fixe pour la ...

159[48℄ S. S. Chen, D. L. Donoho et M. A. Saunders: Atomi de omposition bybasis pursuit. SIAM J S i Comput, 20(1) :33�61, 1998.[49℄ C. Choi: Real-time binaural blind sour e separation. Ds A tes Intl. Conf.on Independent Component Analysis and Signal Separation (ICA'03), p.567�572, Nara, Japon, avr. 2003.[50℄ S. Choi et A. Ci ho ki: Adaptive Blind Separation of Spee h Signals :Co ktail Party Problem. Ds A tes Intl. Conf. on Spee h Pro essing(ICSP'97), p. 617�622, Séoul, Corée du Sud, août 1997.[51℄ S. Choi et A. Ci ho ki: A Hybrid Learning Approa h to Blind De onvo-lution of Linear MIMO Systems. Ele troni letters, 35(7) :1429�1430,août 1999.[52℄ A. Ci ho ki et S. Amari: Adaptive Blind Signal and Image Pro essing.John Wiley & Sons, 2002.[53℄ R. R. Coifman et M. V. Wi kerhauser: Entropy-Based Algorithms forBest Basis Sele tion. IEEE Trans. on Information Theory, 38(2) :713�718, mars 1992.[54℄ P. Comon: Separation of sour es using higher-order umulants. Ds A tesAdvan ed Algorithms and Ar hite tures for Signal Pro essing IV, vol.1152, p. 170�181, San Diego, Californie, août 1989.[55℄ P. Comon: Independent omponent analysis. Ds Pro . Int. Sig. Pro .Workshop on Higher-Order Statisti s (HOS'91), p. 111�120, Cham-rousse, Fran e, juil. 1991.[56℄ P. Comon: Blind Identi� ation in Presen e of Noise. Ds A tes EuropeanSignal Pro essing Conferen e (EUSIPCO'92), p. 835�838, Bruxelles, Bel-gique, août 1992.[57℄ P. Comon: Independent omponent analysis, A new on ept ? SignalPro essing, 36(3) :287�314, avr. 1994.[58℄ P. Comon: Blind Identi� ation and Sour e Separation in 2×3 Under-determined Mixtures. IEEE Trans. on Signal Pro essing, 52(1) :11�22,janv. 2004.[59℄ P. Comon et E. Moreau: Improved ontrast dedi ated to blind separationin ommuni ations. Ds A tes Intl. Conf. on A ousti s, Spee h, and SignalPro essing (ICASSP'97), p. 3453�3456, Muni h, Allemagne, avr. 1997.[60℄ I. Daube hies: Time-Frequen y Lo alization Operators : A Geometri Phase Spa e Approa h. IEEE Trans. on Information Theory, 34(4) :605�612, juil. 1988.[61℄ N. Delfosse et P. Loubaton: Adaptive blind separation of independentsour es : A de�ation approa h. Signal Pro essing, 45(1) :59�83, juil.1995.[62℄ S. Deligne et R. Gopinath: An EM algorithm for onvolutive independent omponent analysis. Neuro omputing, 49(1) :187�211, dé . 2002.

Page 177: Algorithmes temporels rapides à point fixe pour la ...

160 Bibliographie[63℄ Y. Deville: Sons de basse et de piano. http ://www.ast.obs-mip.fr/deville.[64℄ Y. Deville: Towards industrial appli ations of blind sour e separation andindependent omponent analysis. Ds A tes Intl. Conf. on IndependentComponent Analysis and Signal Separation (ICA'99), p. 19�24, Aussois,Fran e, janv. 1999.[65℄ Y. Deville: Panorama des appli ations biomédi ales des méthodes de sé-paration aveugle de sour es. Ds A tes Groupe de Re her he et d'Etudedu Traitement du Signal et des Images (GRETSI'03), vol. 1, p. 31�34,Paris, Fran e, sept. 2003.[66℄ Y. Deville: Temporal and time-frequen y orrelation-based blind sour eseparation methods. Ds A tes Intl. Conf. on Independent ComponentAnalysis and Signal Separation (ICA'03), p. 1059�1064, Nara, Japon,avr. 2003.[67℄ Y. Deville, M. Benali et F. Abrard: Di�erential sour e separation forunderdetermined instantaneous or onvolutive mixtures : on ept and al-gorithms. Signal Pro essing, 84(10) :1759�1776, o t. 2004.[68℄ Y. Deville, D. Bissessur, M. Puigt, S. Hosseini et H. Carfantan: Atime-s ale orrelation-based blind separation method appli able to or-related sour es. Ds A tes European Symp. on Arti� ial Neural Networks(ESANN'06), p. 337�344, Bruges, Belgique, avr. 2006.[69℄ Y. Deville, J. Chappuis, S. Hosseini et J. Thomas: Di�erential fast �xed-point BSS for underdetermined linear instantaneous mixtures. Ds A tesIntl. Conf. on Independent Component Analysis and Signal Separation(ICA'06), p. 48�56, Charleston, Caroline du Sud, mars 2006.[70℄ Y. Deville et S. Hosseini: Blind identi� ation and separation methodsfor linear-quadrati mixtures and/or linearly independent non-stationarysignals. Ds A tes Intl. Symp. on Signal Pro essing and its Appli ations(ISSPA'07), Sharjah, Émirats arabes unis, fév. 2007.[71℄ Y. Deville et M. Puigt: Temporal and time-frequen y orrelation-basedblind sour e separation methods. Part I : Determined and underdeter-mined linear instantaneous mixtures. Signal Pro essing, 87(3) :374�407,mars 2007.[72℄ D. Donoho: On Minimum Entropy De onvolution. Ds A tes AppliedTime series Analysis II, p. 556�608, Tulsa, Oklahoma, mars 1980.[73℄ S. Douglas, H. Sawada et S. Makino: A spatio-temporal FastICA algo-rithm for separating onvolutive mixtures. Ds A tes Intl. Conf. on A ous-ti s, Spee h, and Signal Pro essing (ICASSP'05), vol. 5, p. 165�168, Phi-ladelphie, Pennsylvanie, mars 2005.[74℄ S. C. Douglas, M. Guptaand, H. Sawada et S. Makino: Spatio-TemporalFastICA Algorithms for the Blind Separation of Convolutive Mixtures.IEEE Trans. on Audio, Spee h, and Language Pro essing, 15(5) :1511 �1520, juil. 2007.

Page 178: Algorithmes temporels rapides à point fixe pour la ...

161[75℄ D. Erdogmus, K. E. Hild, Y. N. Rao et J. C. Prin ipe: Minimax Mu-tual Information Approa h for Independent Component Analysis. NeuralComputation, 16(6) :1235�1252, juin 2004.[76℄ J. Eriksson et V. Koivunen: Blind Separation of a Class of NonlinearICA Models. Ds A tes Intl. Symp. on Cir uits and Systems (ISCAS'05),p. 5890�5893, Kobe, Japon, mai 2005.[77℄ A. Ferréol, L. Albera et P. Chevalier: Fourth-order blind identi� ation ofunderdetermined mixtures of sour es (FOBIUM). IEEE Trans. on SignalPro essing, 53(5) :1640�1653, mai 2005.[78℄ C. Févotte: Appro he temps-fréquen e pour la séparation aveugle desour es non-stationnaires. Thèse de do torat, E ole Centrale deNantes et Université de Nantes, Fran e, pages 80-82, o t. 2003.http ://www.tsi.enst.fr/∼ fevotte/.[79℄ M. Gaeta et J. L. La oume: Sour e separation without prior knowledge :The maximum likelihood solution. Ds A tes European Signal Pro essingConferen e (EUSIPCO'90), p. 621�624, Bar elone, Espagne, sept. 1990.[80℄ B. Gardner et K. Martin: Head related transfer fun tions of a dummyhead, 1999. http ://sound.media.mit.edu/i a-ben h.[81℄ B. Gardner et K. Martin: HRTF Measurements of a KEMAR Dummy-Head Mi rophone, 2000. http ://sound.media.mit.edu/KEMAR.html.[82℄ G. H. Golub et C. F. Van Loan:Matrix Computations. The John HopkinsUniversity Press, 1996.[83℄ A. Gorokhov et P. Loubaton: Subspa e-Based Te hniques for Blind Se-paration of Convolutive Mixtures with Temporally Correlated Sour es.IEEE Trans. on Cir uits and Systems I : Fundamental Theory and Ap-pli ations, 44(9) :813�820, sept. 1997.[84℄ R. Gribonval et S. Lesage: A survey of Sparse Component Analysis forBlind Sour e Separation : prin iples, perspe tives, and new hallenges.Ds A tes Europ. Symp. on Arti� ial Neural Networks (ESANN'06), p.323�330, Bruges, Belgique, avr. 2006.[85℄ R. Guidara, S. Hosseini et Y. Deville: Blind separation of non-stationaryimages using Markov models. Ds A tes Intl. Conf. on Independent Com-ponent Analysis and Signal Separation (ICA'07), Londres, Royaume-Uni,sept. 2007.[86℄ R. Guidara, S. Hosseini et Y. Deville: Markovian blind separation ofnon-stationary temporally orrelated sour es. Ds A tes Europ. Symp. onArti� ial Neural Networks (ESANN'07), Bruges, Belgique, avr. 2007.[87℄ Hugo Gävert, Jarmo Hurri, Jaakko Särelä et Aapo Hyväri-nen: FastICA for Matlab 7.x and 6.x, Version 2.5, o t. 2005.http ://www. is.hut.Fi/proje ts/i a/fasti a/ ode/dl ode.shtml.

Page 179: Algorithmes temporels rapides à point fixe pour la ...

162 Bibliographie[88℄ J. Herault et B. Ans: Réseaux de neurones à synapses modi�ables : dé- odage de messages sensoriels omposites par un apprentissage non su-pervisé et permanent. C. R. A adémie des S ien es, Paris, série III, p.525�528, 1984.[89℄ J. Herault et C. Jutten: Spa e or time adaptive signal pro essing by neuralnetwork models. Ds A tes Intl. Conf. on Neural Networks for Computing,p. 206�211, Snowbird, Utah, avr. 1986.[90℄ J. Herault, C. Jutten et B. Ans: Déte tion de grandeurs primitives dansun message omposite pour une ar hite ture de al ul neuromimétique enapprentissage non supervisé. Ds A tes Groupe de Re her he et d'Etudedu Traitement du Signal et des Images (GRETSI'85), p. 1017�1022, Ni e,Fran e, mai 1985.[91℄ K. E. Hild, D. Erdogmus et J. C. Prin ipe: Blind Sour e Separation UsingRenyi's Mutual Information. IEEE Signal Pro essing Letters, 8(6) :174�176, juin 2001.[92℄ K. E. Hild, D. Erdogmus et J. C. Prin ipe: On-line minimum mutualinformation method for time-varying blind sour e separation. Ds A tesIntl. Conf. on Independent Component Analysis and Signal Separation(ICA'01), p. 126�131, San Diego, Californie, dé . 2001.[93℄ K. E. Hild, D. Pinto, D. Erdogmus et J. C. Prin ipe: Convolutive BlindSour e Separation by Minimizing Mutual Information Between Segmentsof Signals. IEEE Trans. on Cir uits and Systems - I, 52(10) :2188�2196,o t. 2005.[94℄ M. V. Hulle: Clustering approa h to square and non-square blind sour eseparation. Ds A tes Intl. Work. on Neural Networks for Signal Pro es-sing (NNSP'99), p. 315�323, Madison, Wis onsin, août 1999.[95℄ A. Hyvärinen: New Approximations of Di�erential Entropy for Inde-pendent Component Analysis and Proje tion Pursuit. Ds A tes Conf. onAdvan es in Neural Information Pro essing Systems (NIPS'97), vol. 10,p. 273�279, Denver, Colorado, dé . 1997.[96℄ A. Hyvärinen: Fast and Robust Fixed-Point Algorithms for IndependentComponent Analysis. IEEE Trans. on Neural Networks, 10(3) :626�634,mai 1999.[97℄ A. Hyvärinen, J. Karhunen et E. Oja: Independent Component Analysis.John Wiley & Sons, 2001.[98℄ A. Hyvärinen et E. Oja: A Fast Fixed-Point Algorithm for IndependentComponent Analysis. Neural Computation, 9(7) :1483�1492, o t. 1997.[99℄ S. Ikeda et N. Murata: A method of blind separation based on temporalstru ture of signals. Ds A tes Intl. Conf. on Neural Information Pro es-sing (ICONIP'98), p. 737�742, Kitakyushu, Japon, o t. 1998.[100℄ Y. Inouye et K. Tanebe: Super-Exponential Algorithms for Multi hannelBlind De onvolution. IEEE Trans. on Signal Pro essing, 48(3) :881�888,mars 2000.

Page 180: Algorithmes temporels rapides à point fixe pour la ...

163[101℄ A. Jourjine, S. Ri kard et O. Yilmaz: Blind separation of disjoint or-thogonal signals : Demixing N sour es from 2 mixtures. Ds A tes Intl.Conf. on A ousti s, Spee h, and Signal Pro essing (ICASSP'00), vol. 5,p. 2985�2988, Istanbul, Turquie, juin 2000.[102℄ C. Jutten et M. Babaie-Zadeh: Sour e separation : prin iples, urrentadvan es and appli ations. Ds A tes Work. on Advan ed Control andDiagnosis (ACD'06), Nan y, Fran e, nov. 2006.[103℄ C. Jutten, P. Comon et al.: Séparation de Sour es, vol. 2, hapitre 13 (Appli ations des méthodes de séparation aveuglede sour es par Y. Deville). Colle tion Traité IC2, Informa-tion � Commande � Communi ation, Hermès - Lavoisier, 2007.www.lavoisier.fr/fr/livres/index.asp ?texte=2746215180&sele t=isbn&from=Hermes.[104℄ C. Jutten et J. Herault: Blind separation of sour es, part I : An adaptivealgorithm based on neuromimeti ar hite ture. Signal Pro essing, 24(1) :1�10,juil. 1991.[105℄ C. Jutten, H. L. Nguyen-Thi, E. Dijkstra, E. Vittoz et J. Caelen: Blind se-paration of sour es : An algorithm for separation of onvolutive mixtures. DsA tes Intl. Signal Pro essing Work. on Higher Order Statisti s (HOS'91), p.273�276, Chamrousse, Fran e, juil. 1991.[106℄ A. Ka henoura, L. Albera et L. Senhadji: Séparation aveugle de sour es eningénierie biomédi ale. ITBM�RBM, 28 :20�34, 2007.[107℄ M. Kawamoto, A. K. Barros, A. Mansour, K. Matsuoka et N. Ohnishi: BlindSeparation for Convolutive Mixtures of Non-stationary Signals. Ds A tes Intl.Conf. on Neural Information Pro essing (ICONIP'98), p. 743�746, Kitakyu-shu, Japon, o t. 1998.[108℄ M. Kawamoto, K. Matsuoka et N. Ohnishi: A method of blind separationfor onvolved non-stationary signals. Neuro omputing, 22(1-3) :157�171, nov.1998.[109℄ L. C. Khor, W. L. Woo et S. S. Dlay: Non-sparse approa h to underdeterminedblind signal estimation. Ds A tes Intl. Conf. on A ousti s, Spee h, and SignalPro essing (ICASSP'05), vol. 5, p. 309�312, Philadelphie, Pennsylvanie, mars2005.[110℄ M. Knaak, S. Araki et S. Makino: Geometri ally onstraint ICA for onvolutivemixtures of sound. Ds A tes Intl. Conf. on A ousti s, Spee h, and SignalPro essing (ICASSP'03), vol. 2, p. 725�728, Hong Kong, Chine, avr. 2003.[111℄ I. Kopriva, Z. Vev i et H. Szu: An adaptive short-time frequen y domainalgorithm for blind separation of nonstationary onvolved mixtures. Ds A tesIntl. Joint Conf. on Neural Networks (IJCNN'01), p. 424�429, WashingtonDC, juil. 2001.[112℄ J. L. La oume et P. Ruiz: Sour es identi� ation : A Solution Based on theCumulants. Ds A tes Work. on Spe trum, Estimation and Modelling, p. 199�203, août 1988.[113℄ D. D. Lee et H. S. Seung: Learning the parts of obje ts by non-negative matrixfa torization. Nature, 401 :788�791, o t. 1999.

Page 181: Algorithmes temporels rapides à point fixe pour la ...

164 Bibliographie[114℄ D. D. Lee et H. S. Seung: Algorithms for Non-negative Matrix Fa toriza-tion. Ds A tes Conf. on Advan es in Neural Information Pro essing Systems(NIPS'00), vol. 13, p. 556�562, Denver, Colorado, 2000.[115℄ T. W. Lee, A. J. Bell et R. H. Lambert: Blind separation of delayed and onvol-ved sour es. Ds A tes Conf. on Advan es in Neural Information Pro essingSystems (NIPS'96), vol. 9, p. 758�764, Denver, Colorado, dé . 1996.[116℄ S. Lesage, S. Krstulovi et R. Gribonval: Séparation de sour es dans le assous-déterminé : omparaison de deux appro hes basées sur des dé ompositionspar imonieuses. Ds A tes Groupe de Re her he et d'Etude du Traitement duSignal et des Images (GRETSI'05), Louvain-la-Neuve, Belgique, sept. 2005.[117℄ S. Lesage, S. Krstulovi et R. Gribonval: Under-Determined Sour e Separa-tion : Comparison of Two Approa hes Based on Sparse De ompositions. DsA tes Intl. Conf. on Independent Component Analysis and Signal Separation(ICA'06), p. 633�640, Charleston, Caroline du Sud, mars 2006.[118℄ Y. Li, S. I. Amari, A. Ci ho ki, D. W. C. Ho et S. Xie: Underdetermined BlindSour e Separation Based on Sparse Representation. IEEE Trans. on SignalPro essing, 54(2), fév. 2006.[119℄ Y. Li, A. Ci ho ki et S. Amari: Sparse omponent analysis for blind sour eseparation with less sensors than sour es. Ds A tes Intl. Conf. on IndependentComponent Analysis and Blind Signal Separation (ICA'03), p. 89�94, Nara,Japon, avr. 2003.[120℄ Y. Li, A. Ci ho ki et S. Amari: Analysis of sparse representation and blindsour e separation. Neural Computation, 16(6) :1193�1234, 2004.[121℄ J. K. Lin, D. G. Grier et J. D. Cowan: Feature Extra tion Approa h to BlindSour e Separation. Ds A tes Intl. Work. on Neural Networks for Signal Pro- essing (NNSP'97), p. 398�405, Amelia Island, Floride, sept. 1997.[122℄ P. Loubaton et P. Regalia: Blind de onvolution of multivariate signals : a de-�ation approa h. Ds A tes Intl. Conf. on Communi ations (ICC'93), vol. 2,p. 1160�1164, Genève, Suisse, mai 1993.[123℄ D. G. Luenberger: Optimization by Ve tor Spa e Methods. John Wiley & Sons,New York, 1969.[124℄ Z. Q. Luo et J. Lu: On blind sour e separation using mutual information ri-terion. Mathemati al programming, 97(3) :587�603, août 2003.[125℄ S. Makino, H. Sawada, R. Mukai et S. Araki: Blind sour e separation of onvolutive mixtures of spee h in frequen y domain. IEICE Transa tions onFundamentals of Ele troni s, Communi ations and Computer S ien es, E88-A(7) :1640�1655, juil. 2005.[126℄ S. Mallat et Z. Zhang: Mat hing Pursuits With Time-Frequen y Di tionaries.IEEE Trans. on Signal Pro essing, 41(12) :3397�3415, 1993.[127℄ A. Mansour, C. Jutten et P. Loubaton: Adaptive Subspa e Algorithm for BlindSeparation of Independent Sour es in Convolutive Mixture. IEEE Trans. onSignal Pro essing, 48(2) :583�586, Febr. 2000.[128℄ A. S. Master: Sound sour e separation of N sour es from stereo signals via�tting to N models ea h la king one sour e. rapport te hnique, Center

Page 182: Algorithmes temporels rapides à point fixe pour la ...

165for Computer Resear h in Musi and A ousti s, Stanford University, 2003.http ://www- rma.stanford.edu/asmaster/.[129℄ A. S. Master: Bayesian two sour e modeling for separation of N sour es fromstereo signals. Ds A tes Intl. Conf. on A ousti s, Spee h and Signal Pro essing(ICASSP'04), vol. 4, p. 281�284, Montréal, Canada, mai 2004.[130℄ K. Matsuoka et M. Kawamoto: Blind signal separation based on mutual infor-mation riterion. Ds A tes Intl. Symp. on Nonlinear Theory and its Appli a-tions (NOLTA'95), p. 85�90, Las Vegas, Nevada, dé . 1995.[131℄ K. Matsuoka, M. Ohya et M. Kawamoto: A Neural Net for Blind Separationof Nonstationary Signals. Neural Networks, 8 :411�419, 1995.[132℄ J. M Queen: Some methods for lassi� ation and analysis of multivariate ob-servations. Ds A tes Berkeley Symp. on Mathemati al Statisti s and Probabi-lity, vol. 1, p. 281�297, 1967.[133℄ T. Melia et S. Ri kard: Extending the DUET Blind Sour e Separation te h-nique. Ds A tes Stru ture et Par imonie pour la Représentation Adaptative deSignaux (SPARS'05), Rennes, Fran e, nov. 2005.[134℄ T. Melia et S. Ri kard: Underdetermined blind sour e separation in e hoi environments using DESPRIT. EURASIP Journal on Advan es in Signal Pro- essing, 2007 :Arti le ID 86484, 19 pages, 2007.[135℄ N. Mitianoudis et M. E. Davies: Audio Sour e Separation of Convolutive Mix-tures. IEEE Trans. on Spee h and Audio Pro essing, 11(5) :489�497, sept.2003.[136℄ E. Moreau et E. Ma hi: New self-adaptive algorithms for sour e separa-tion based on ontrast fun tions. Ds A tes Work. on Higher-Order Stati ti s(HOS'93), p. 215�219, Lake Tahoe, USA, juin 1993.[137℄ E. Moulines, J. F. Cardoso et E. Gassiat: Maximum likelihood for blind se-paration and de onvolution of noisy signals using mixture models. Ds A tesIntl. Conf. on A ousti s, Spee h, and Signal Pro essing (ICASSP'97), vol. 5,p. 3617�3620, Muni h, Allemagne, avr. 1997.[138℄ M.Rapa ioli, C. Joblin et P. Boissel: Spe tros opy of poly y li aromati hy-dro arbons and very small grains in photodisso iation regions. Astronomy &Astrophysi s, 429 :193�204, 2005.[139℄ H. L. Nguyen-Thi et C. Jutten: Blind sour e separation for onvolutive mix-tures. Signal Pro essing, 45(2) :209�229, août 1995.[140℄ D. Nuzillard et A. Bijaoui: Blind sour e separation and analysis of multispe tralastronomi al images. Astronomy & Astrophysi s, 147 :129�138, nov. 2006.[141℄ M. Ohata, K. Matsuoka et T. Mukai: An adaptive blind separation methodusing para-Hermitian whitening �lter for onvolutively mixed signals. SignalPro essing, 87(1) :33�50, janv. 2007.[142℄ E. Oja: Convergen e of the symmetri al FastICA algorithm. Ds A tes Intl.Conf. on Neural Information Pro essing (ICONIP'02), vol. 3, p. 1368�1372,Singapour, nov. 2002.[143℄ E. Oja et Z. Yuan: The FastICA Algorithm Revisited : Convergen e Analysis.IEEE Trans. on Neural Networks, 17(6) :1370�1381, nov. 2006.

Page 183: Algorithmes temporels rapides à point fixe pour la ...

166 Bibliographie[144℄ R. K. Olsson et L. K. Hansen: Blind separation of more sour es than sensorsin onvolutive mixtures. Ds A tes Intl. Conf. on A ousti s, Spee h, and SignalPro essing (ICASSP'06), vol. 5, p. 657�660, Toulouse, Fran e, mai 2006.[145℄ P. Paatero et U. Tapper: Positive matrix fa torization : A non-negative fa tormodel with optimal utilization of error estimates of data values. Environme-tri s, 5 :111�126, 1994.[146℄ L. Parra et C. Alvino: Geometri Sour e Separation : Merging ConvolutiveSour e Separation With Geometri Beamforming. IEEE Trans. on Spee hAudio Pro essing, 10(6) :352�362, sept. 2002.[147℄ L. Parra et C. Spen e: Convolutive Blind Separation of Non-StationarySour es. IEEE Trans. on Spee h Audio Pro essing, 8(3) :320�327, mai 2000.[148℄ L. C. Parra, C. Spen e et B. Vries: Convolutive Sour e Separation and SignalModeling with ML. Ds A tes Intl. Symp. on Intelligent Systems (ISIS'97),Reggio de Calabre, Italie, sept. 1997.[149℄ B. A. Pearlmutter et L. C. Parra: Maximum Likelihood Blind Sour e Separa-tion : A Context-Sensitive Generalization of ICA. Ds A tes Conf. on Advan esin Neural Information Pro essing Systems (NIPS'96), p. 613�619, Denver, Co-lorado, dé . 1996.[150℄ M. S. Pedersen, J. Larsen, U. Kjems et L. C. Parra: A survey of Convolu-tive Blind Sour e Separation Methods. Eds. Ja ob Benesty and Arden Huang,Springer, 2007. to appear as hapter in Multi hannel Spee h Pro essing Hand-book.[151℄ M. S. Pedersen et C. M. Nielsen: Gradient �ow onvolutive blind sour e se-paration. Ds A tes Intl. Work. on Ma hine Learning for Signal Pro essing(MLSP'04), p. 335�344, Saint Louis, Brésil, sept. 2004.[152℄ J. M. Peterson et S. Kadambe: A probabilisti approa h for blind sour e separa-tion of underdetermined onvolutive mixtures. Ds A tes Intl. Conf. on A ous-ti s, Spee h, and Signal Pro essing (ICASSP'03), vol. 6, p. 581�584, HongKong, Chine, avr. 2003.[153℄ D. T. Pham: Mutual information approa h to blind separation of stationarysour es. Ds A tes Intl. Conf. on Independent Component Analysis and SignalSeparation (ICA'99), p. 215�220, Aussois, Fran e, janv. 1999.[154℄ D. T. Pham: Blind separation of instantaneous mixture of sour es via the Gaus-sian mutual information riterion. Signal Pro essing, 81(4) :855�870, avr.2001.[155℄ D. T. Pham: Blind separation of non stationary non Gaussian sour es.Ds A tes European Signal Pro essing Conferen e (EUSIPCO'02), Toulouse,Fran e, sept. 2002.[156℄ D. T. Pham: Exploiting sour e non stationarity and oloration in Blind Sour eSeparation. Ds A tes Intl. Conf. on Digital Signal Pro essing (DSP'02), vol. 1,p. 151�154, Santorin, Grè e, juil. 2002.[157℄ D. T. Pham: Mutual Information Approa h to Blind Separation of StationarySour es. IEEE Trans. on Information Theory, 48(7) :1935�1946, juil. 2002.

Page 184: Algorithmes temporels rapides à point fixe pour la ...

167[158℄ D. T. Pham: Mutual information approa h to blind separation-de onvolution.Ds A tes European Signal Pro essing Conferen e (EUSIPCO'05), Antalya,Turquie, sept. 2005.[159℄ D. T. Pham et J. F. Cardoso: Blind Separation of Instantaneous Mixture ofNon Stationary Sour es. Ds A tes Intl. Conf. on Independent ComponentAnalysis and Signal Separation (ICA'00), p. 187�192, Helsinki , Finlande, juin2000.[160℄ D. T. Pham et J. F. Cardoso: Blind Separation of Instantaneous Mixtures ofNonstationary Sour es. IEEE Trans. on Signal Pro essing, 49(9) :1837 � 1848,sept. 2001.[161℄ D. T. Pham et P. Garat: Blind Separation of Mixtures of Independent Sour esThrough a Quasi-Maximum Likelihood Approa h. IEEE Trans. on Signal Pro- essing, 45(7) :1712�1725, juil. 1997.[162℄ D. T. Pham, P. Garat et C. Jutten: Separation of mixture of independentsour es through a maximum likelihood approa h. Ds Signal Pro essing VI,Pro . of the 6th European Signal Pro essing Conferen e (EUSIPCO'92), p.771�774, Bruxelles, Belgique, août 1992.[163℄ D. T. Pham, C. Servière et H. Boumaraf: Blind separation of onvolutiveaudio mixtures using nonstationarity. Ds A tes Intl. Conf. on IndependentComponent Analysis and Blind Signal Separation (ICA'03), p. 975�980, Nara,Japon, avr. 2003.[164℄ D. T. Pham, C. Servière et H. Boumaraf: Blind separation of spee h mixturesbased on nonstationarity. Ds A tes Intl. Symp. on Signal Pro essing and itsAppli ations (ISSPA'03), vol. 2, p. 73�76, Paris, Fran e, juil. 2003.[165℄ R. Prasad, H. Saruwatari, A. Lee et K. Shikano: A �xed-point ICA algorithmfor onvoluted spee h signal separation. Ds A tes Intl. Conf. on IndependentComponent Analysis and Signal Separation (ICA'03), p. 579�584, Nara, Japon,avr. 2003.[166℄ M. Puigt et Y. Deville: Time-frequen y ratio-based blind separation methodsfor attenuated and time-delayed sour es. Me hani al Systems and Signal Pro- essing, 19(6) :1348�1379, nov. 2005.[167℄ M. Puigt et Y. Deville: A time-frequen y orrelation-based blind sour e se-paration method for time-delayed mixtures. Ds A tes Intl. Conf. on A ous-ti s, Spee h, and Signal Pro essing (ICASSP'06), vol. 5, p. 853�856, Toulouse,Fran e, mai 2006.[168℄ M. Puigt et Y. Deville: Two Time-Frequen y Ratio-Based Blind Sour e Separa-tion Methods for Time-Delayed Mixtures. Ds A tes Intl. Conf. on IndependentComponent Analysis and Signal Separation (ICA'06), p. 682�690, Charleston,Caroline du Sud, mars 2006.[169℄ M. Puigt et Y. Deville: A new time-frequen y orrelation-based sour e separa-tion method for attenuated and time shifted mixtures. Ds A tes Intl. Work. onEle troni s, Control, Modelling, Measurement and Signals (ECMS'07), Libe-re , République t hèque, mai 2007.

Page 185: Algorithmes temporels rapides à point fixe pour la ...

168 Bibliographie[170℄ K. Rahbar et J. Reilly: Blind sour e separation algorithm for MIMO onvolu-tive mixtures. Ds A tes Intl. Conf. on Independent Component Analysis andSignal Separation (ICA'01), p. 242�247, San Diego, Californie, dé . 2001.[171℄ K. Rahbar et J. P. Reilly: A Frequen y Domain Method for Blind Sour e Se-paration of Convolutive Audio Mixtures. IEEE Trans. on Spee h and AudioPro essing, 13(5), sept. 2005.[172℄ K. Rahbar, J. P. Reilly et J. H. Manton: Blind Identi� ation of MIMO FIRSystems Driven by Quasistationary Sour es Using Se ond-Order Statisti s : AFrequen y Domain Approa h. IEEE Trans. on Signal Pro essing, 52(2), fév.2004.[173℄ J. P. Reilly et L. C. Mendoza: Blind signal separation for onvolutive mixingenvironments using spatial-temporal pro essing. Ds A tes Intl. Conf. on A ous-ti s, Spee h, and Signal Pro essing (ICASSP'99), vol. 3, p. 1437�1440, Phoe-nix, Arizona, mai 1999.[174℄ M. E. Rhabi, G. Gelle, H. Fenniri et G. Delaunay: A penalized mutual informa-tion riterion for blind separation of onvolutive mixtures. Signal Pro essing,84(10) :1979�1984, o t. 2004.[175℄ S. Ri kard, R. Balan et J. Ros a: Real-time time-frequen y based blind sour eseparation. Ds A tes Intl. Conf. on Independent Component Analysis andSignal Separation (ICA'01), p. 651�656, San Diego, Californie, dé . 2001.[176℄ S. Ri kard et M. Fallon: The Gini index of spee h. Ds A tes Annual Conf. onInformation S ien es and Systems (CISS'04), Prin eton, New Jersey, Mar h2004.[177℄ S. Ri kard et O. Yilmaz: On the approximate W-disjoint orthogonality ofspee h. Ds A tes Intl. Conf. on A ousti s, Spee h, and Signal Pro essing(ICASSP'02), vol. 1, p. 529�532, Orlando, Floride, mai 2002.[178℄ J. Ros a, C. Borss et R. Balan: Generalized sparse signal mixing model andappli ation to noisy blind sour e separation. Ds A tes Intl. Conf. on A ous-ti s, Spee h, and Signal Pro essing (ICASSP'04), vol. 3, p. 877�880, Montréal,Canada, mai 2004.[179℄ R. Saab, O. Yilmaz, M. J. M Keown et R. Abugharbieh: Underdeterminedsparse blind sour e separation with delays. Ds A tes Stru ture et Par imoniepour la Représentation Adaptative de Signaux (SPARS'05), Rennes, Fran e,nov. 2005.[180℄ R. Saab, O. Yilmaz, M. J. M Keown et R. Abugharbieh: Underdeterminedane hoi blind sour e separation via ℓq-basis-pursuit with q < 1. IEEE Trans.on Signal Pro essing, to appear.[181℄ S. Samadi, M. Babaie-Zadeh, C. Jutten et K. Nayebi: Blind Sour e Separationby Adaptive Estimation of S ore Fun tion Di�eren e. Ds A tes Intl. Conf.on Independent Component Analysis and Blind Signal Separation (ICA'04),Grenade, Espagne, sept. 2004.[182℄ H. Saruwatari, T. Kawamura, T. Nishikawa, A. Lee et K. Shikano: BlindSour e Separation Based on a Fast-Convergen e Algorithm Combining ICAand Beamforming. IEEE Trans. on Audio, Spee h, and Language Pro essing,14(2) :666�678, mars 2006.

Page 186: Algorithmes temporels rapides à point fixe pour la ...

169[183℄ H. Sawada, R. Mukai, S. Araki et S. Makino: A Robust and Pre ise Methodfor Solving the Permutation Problem of Frequen y-Domain Blind Sour e Se-paration. IEEE Trans. on Spee h and Audio Pro essing, 12(5) :530�538, sept.2004.[184℄ H. Saylani, Y. Deville, S. Hosseini et M. Habibi: A multi-tag radio-frequen yidenti� ation system using a new blind sour e separation method based on spe -tral de orrelation. Ds A tes Intl. Symp. on Communi ations, Control and Si-gnal Pro essing (ISCCSP'06), Marrake h, Maro , mars 2006.[185℄ C. Servière: Blind sour e separation of onvolutive mixtures. Ds A tes Work.on Statisti al Signal and Array Pro essing (SSAP'96), p. 316�319, Corfou,Grè e, juin 1996.[186℄ C. Servière: Separation of spee h signals under reverberant onditions. Ds A tesEuropean Signal Pro essing Conferen e (EUSIPCO'04), p. 1693�1696, Vienne,Autri he, sept. 2004.[187℄ O. Shalvi et E. Weinstein: New Criteria for Blind De onvolution of Non-minimum Phase Systems (Channels). IEEE Trans. on Information Theory,36(2) :312�321, mars 1990.[188℄ O. Shalvi et E. Weinstein: Super-Exponential Methods for Blind De onvolution.IEEE Trans. on Information Theory, 39(2) :504�519, mars 1993.[189℄ C. Simon: Séparation aveugle de sour es en mélanges onvolutifs. Thèse dedo torat, Université de Marne-la-Vallée, Fran e, nov. 1999.[190℄ C. Simon, P. Loubaton, C. Vignat, C. Jutten et G. d'Urso: Blind Sour e Sepa-ration of onvolutive mixtures by maximization of fourth-order umulants : thenon-i.i.d. ase. Ds A tes Asilomar Conf. on Signals, Systems, and Computers(ASILOMAR'98), p. 1584�1588, Monterey, Californie, nov. 1998.[191℄ C. Simon, P. Loubaton, C. Vignat, C. Jutten et G. d'Urso: Separation of a lassof onvolutive mixtures : a ontrast fun tion approa h. Ds A tes Intl. Conf. onA ousti s, Spee h, and Signal Pro essing (ICASSP'99), vol. 3, p. 1429�1432,Phoenix, Arizona, mars 1999.[192℄ P. Smaragdis: Blind separation of onvolved mixtures in the frequen y domain.Neuro omputing, 22(1-3) :21�34, nov. 1998.[193℄ P. Smaragdis: Non-negative matrix fa tor de onvolution ; extra tion of multiplesound sour es from monophoni inputs. Ds A tes Intl. Conf. on IndependentComponent Analysis and Signal Separation (ICA'04), p. 494�499, Grenade,Espagne, 2004.[194℄ P. Smaragdis: Convolutive Spee h Bases and Their Appli ation to SupervisedSpee h Separation. IEEE Trans. on Audio, Spee h, and Language Pro essing,15(1) :1�12, janv. 2007.[195℄ D. Smith, J. Lukasiak et I. Burnett: A two hannel, blo k-adaptive audio se-paration te hnique based upon time-frequen y information. Ds A tes EuropeanSignal Pro essing Conferen e (EUSIPCO'04), p. 393�396, Vienne, Autri he,sept. 2004.[196℄ D. Smith, J. Lukasiak et I. Burnett: Two Channel, Blo k Adaptative AudioSeparation Using the Cross Correlation of Time Frequen y Information. Ds

Page 187: Algorithmes temporels rapides à point fixe pour la ...

170 BibliographieA tes Intl. Conf. on Independent Component Analysis and Signal Separation(ICA'04), p. 889�897, Grenade, Espagne, sept. 2004.[197℄ A. Taleb et C. Jutten: On underdetermined sour e separation. Ds A tes Intl.Conf. on A ousti s, Spee h, and Signal Pro essing (ICASSP'99), vol. 3, p.1445�1448, Phoenix, Arizona, mars 1999.[198℄ A. R. Teixeira, A. M. Tomé, E. W. Lang et K. Stadlthanner: Delayed AMUSE� A Tool for Blind Sour e Separation and Denoising. Ds A tes Intl. Conf.on Independent Component Analysis and Blind Signal Separation (ICA'04),Grenade, Espagne, sept. 2004.[199℄ F. J. Theis, E. W. Lang et C. G. Puntonet: A geometri algorithm for over- omplete linear ICA. Neuro omputing, 56 :381�398, janv. 2004.[200℄ F. J. Theis, C. G. Puntonet et E. W. Lang: Median-based lustering for under-determined blind signal pro essing. IEEE Signal Pro essing Letters, 13(2) :96�99, fév. 2006.[201℄ J. Thomas: L'algorithme C-FICA, 2007. http ://www.ast.obs-mip.fr/arti le569.html.[202℄ J. Thomas, Y. Deville et S. Hosseini: Fixed-point algorithms for onvolutiveblind sour e separation based on non-gaussianity maximization. Ds A tesIntl. Work. on Ele troni s, Control, Modelling, Measurement and Signals(ECMS'05), Toulouse, Fran e, mai 2005.[203℄ J. Thomas, Y. Deville et S. Hosseini: Time-domain fast �xed point algorithmsfor onvolutive ICA. IEEE Signal Pro essing Letters, 13(4) :228�231, avr.2006.[204℄ J. Thomas, Y. Deville et S. Hosseini: Di�erential Fast Fixed-point Algorithmsfor Underdetermined Instantaneous and Convolutive Partial Blind Sour e Se-paration. IEEE Trans. on Signal Pro essing, 55(7) :3717�3729, juil. 2007.[205℄ J. Thomas, Y. Deville et S. Hosseini: Multivariate polynomial identi� ationfor blind image separation. Ds A tes Intl. Work. on Ele troni s, Control, Mo-delling, Measurement and Signals (ECMS'07), p. 97�102, Libere , Républiquet hèque, mai 2007.[206℄ J. Thomas, Y. Deville et S. Hosseini: Un algorithme rapide à identi� ation po-lyn�miale multi-variable pour la séparation aveugle d'images. Ds A tes Groupede Re her he et d'Etude du Traitement du Signal et des Images (GRETSI'07),Troyes, Fran e, sept. 2007.[207℄ L. Tong, R. W. Liu, V. C. Soon et Y. F. Huang: Indetermina y and Identi�abi-lity of Blind Identi� ation. IEEE Trans. on Cir uits and Systems, 38(5) :499�509, mai 1991.[208℄ L. Tong, V. C. Soon, R. Liu et Y. Huang: AMUSE : A New Blind Identi� ationAlgorithm. Ds A tes Intl. Symp. on Cir uits and Systems (ISCAS'90), vol. 3,p. 1784�1787, Nouvelle-Orléans, Louisiane, mai 1990.[209℄ C. C. Took, S. Sanei, J. Chambers et S. Dunne: Underdetermined Blind Sour eSeparation of Temporomandibular Joint Sounds. IEEE Trans. on Biomedi alEngineering, 53(10) :2123�2126, o t. 2006.

Page 188: Algorithmes temporels rapides à point fixe pour la ...

171[210℄ K. Torkkola: Blind separation of onvolved sour es based on information maxi-mization. Ds A tes Intl. Work. on Neural Networks for Signal Pro essing(NNSP'96), p. 423�432, Kyoto, Japon, sept. 1996.[211℄ K. Torkkola: Blind separation of delayed sour es based on information maxi-mization. Ds A tes Intl. Conf. on A ousti s, Spee h, and Signal Pro essing(ICASSP'96), vol. 6, p. 3509�3512, Atlanta, Géorgie, mai 1996.[212℄ J. K. Tugnait: Identi� ation and De onvolution of Multi hannel Linear Non-Gaussian Pro esses Using Higher Order Statisti s and Inverse Filter Criteria.IEEE Trans. on Signal Pro essing, 45(3) :658�672, mars 1997.[213℄ J. K. Tugnait: On Blind Separation of Convolutive Mixtures of IndependentLinear Signals in Unknown Additive Noise. IEEE Trans. on Signal Pro essing,46(11) :3117�3123, nov. 1998.[214℄ J. K. Tugnait: Adaptive blind separation of onvolutive mixtures of independentlinear signals. Signal Pro essing, 73(11) :139�152, janv. 1999.[215℄ S. V. Vaseghi: Advan ed Digital Signal Pro essing and Noise Redu tion. JohnWiley & Sons, 2000.[216℄ L. Vielva, D. Erdogmus, C. Pantaleon, I. Santamaria, J. Pereda et J. C. Prin- ipe: Underdetermined blind sour e separation in a time-varying environment.Ds A tes Intl. Conf. on A ousti s, Spee h, and Signal Pro essing (ICASSP'02),vol. 3, p. 3049�3052, Orlando, Floride, mai 2002.[217℄ L. Vielva, D. Erdogmus et J. C. Prin ipe: Underdetermined blind sour e se-paration using a probabilisti sour e sparsity model. Ds A tes Intl. Conf. onIndependent Component Analysis and Signal Separation (ICA'00), p. 675�679,Helsinki, Finlande, 2000.[218℄ E. Vin ent et X. Rodet: Underdetermined Sour e Separation with Stru turedSour e Priors. Ds A tes Intl. Conf. on Independent Component Analysis andBlind Signal Separation (ICA'04), p. 327�332, Grenade, Espagne, sept. 2004.[219℄ T. Virtanen: Sound sour e separation using sparse oding with temporal onti-nuity obje tive. Ds A tes Intl. Computer Musi Conf. (ICMC'03), p. 231�234,Singapour, o t. 2003.[220℄ E. Weinstein, M. Feder et A. Oppenheim: Multi-Channel Signal Separation byDe orrelation. IEEE Trans. on Spee h Audio Pro essing, 1(4) :405�413, o t.1993.[221℄ R. A. Wiggins: On minimum entropy de onvolution. Geoexploration, 16 :21�35, janv. 1978.[222℄ S. Winter, W. Kellermann, H. Sawada et S. Makino: MAP-Based Underdeter-mined Blind Sour e Separation of Convolutive Mixtures by Hierar hi al Clus-tering and ℓ1-Norm Minimization. EURASIP Journal on Advan es in SignalPro essing, 2007 :Arti le ID 24717, 12 pages, 2007.[223℄ A. N. Witt, K. D. Gordon, U. P. Vijh, P. H. Sell, T. L. Smith et R. H. Xie:The Ex itation of Extended Red Emission : New Constraints on Its Carrierfrom Hubble Spa e Teles ope Observations of NGC 7023. The Astrophysi alJournal, 636 :303�315.

Page 189: Algorithmes temporels rapides à point fixe pour la ...

172 Bibliographie[224℄ H. C. Wu et J. C. Prin ipe: Simultaneous Diagonalization in the Frequen yDomain (SDIF) for Sour e Separation. Ds A tes Intl. Conf. on IndependentComponent Analysis and Signal Separation (ICA'99), p. 245�250, Aussois,Fran e, janv. 1999.[225℄ J. Xi et J. P. Reilly: Blind separation and restoration of signals mixed in onvo-lutive environment. Ds A tes Intl. Conf. on A ousti s, Spee h, and SignalPro essing (ICASSP'97), vol. 2, p. 1327�1330, Muni h, Allemagne, avr. 1997.[226℄ M. Xiao, S. Xie et Y. Fu: A Novel Approa h for Underdetermined Blind Sour esSeparation in Frequen y Domain. Ds A tes Intl. Symp. on Neural Networks(ISNN'05), p. 484�489, Chongqing, Chine, mai 2005.[227℄ M. Xiao, S. Xie et Y. Fu: A statisti ally sparse de omposition prin iple for un-derdetermined blind sour e separation. Ds A tes Intl. Symp. on Intelligent Si-gnal Pro essing and Communi ation Systems (ISPACS'05), p. 165�168, HongKong, Chine, dé . 2005.[228℄ R. Xu et D. Wuns h II: Survey of Clustering Algorithms. IEEE Transa tionson Neural Networks, 16(3) :645�678, mai 2005.[229℄ O. Yilmaz et S. Ri kard: Blind Separation of Spee h Mixtures via Time-Frequen y Masking. IEEE Trans. on Signal Pro essing, 52(7) :1830�1847, juil.2004.[230℄ Y. Zhang, X. Shi et C. H. Chen: A Gaussian mixture model for underdeter-mined independent omponent analysis. Signal Pro essing, 86(7) :1538�1549,juil. 2006.[231℄ M. Zibulevsky, P. Kisilev, Y. Y. Zeevi et B. A. Pearlmutter: Blind sour eseparation via multinode sparse representation. Ds A tes Conf. on Advan esin Neural Information Pro essing Systems (NIPS'01), vol. 14, p. 1049�1056,Van ouver, Canada, dé . 2001.[232℄ M. Zibulevsky et Y. Y. Zeevi: Extra tion of a sour e from multi hannel datausing sparse de omposition. Neuro omputing, 49(1-4) :163�173, dé . 2002.

Page 190: Algorithmes temporels rapides à point fixe pour la ...

Publi ations de l'auteur

173

Page 191: Algorithmes temporels rapides à point fixe pour la ...
Page 192: Algorithmes temporels rapides à point fixe pour la ...

175Arti les de revues- J. Thomas, Y. Deville et S. Hosseini, Time-domain fast �xed point algo-rithms for onvolutive ICA, IEEE Signal Pro essing Letters, vol. 13, no. 4, p.228-231, avr. 2006.- J. Thomas, Y. Deville et S. Hosseini, Di�erential Fast Fixed-point Al-gorithms for Underdetermined Instantaneous and Convolutive Partial BlindSour e Separation, IEEE Transa tions on Signal Pro essing, vol. 55, no. 7, p.3717-3729, juil. 2007.- O. Berné, C. Joblin, Y. Deville, J. D. Smith, M. Rapa ioli, J. P. Bernard,J. Thomas, W. Rea h et A. Abergel, Analysis of the emission of very smalldust parti les from Spitzer spe tro-imagery data using Blind Signal Separationmethods, Astronomy & Astrophysi s, vol. 469, no. 2, p. 575-586, juil. 2007.- F. Abrard, Y. Deville et J. Thomas, Blind partial separation of underdeter-mined onvolutive mixtures of omplex sour es based on di�erential normalizedkurtosis, Neuro omputing, à paraître.- O. Berné, C. Joblin, M. Rapa ioli, J. Thomas, J.-C. Cuillandre, and Y.Deville, Extended Red Emission and the evolution of arbona eous nanograinsin NGC 7023, Astron. & Astrophysi s, vol. 479, no. 3, pp. L41-44, Mar. 2008.A tes de onféren es- J. Thomas, Y. Deville et S. Hosseini, Fixed-point algorithms for onvolutiveblind sour e separation based on non-gaussianity maximization, Ds A tes Intl.Work. on Ele troni s, Control, Modelling, Measurement and Signals(ECMS'05),Toulouse, Fran e, mai 2005.- Y. Deville, J. Chappuis, S. Hosseini et J. Thomas, Di�erential fast �xed-point BSS for underdetermined linear instantaneous mixtures, Ds A tes Intl.Conf. on Independent Component Analysis and Signal Separation (ICA'06),p. 48-56, Charleston, Caroline du Sud, mars 2006.- J. Thomas, Y. Deville et S. Hosseini, Multivariate polynomial identi� a-tion for blind image separation, Ds A tes Intl. Work. on Ele troni s, Control,Modelling, Measurement and Signals (ECMS'07), p. 97-102, Libere , Répu-blique t hèque, mai 2007.- J. Thomas, Y. Deville et S. Hosseini, Un algorithme rapide à identi� a-tion polyn�miale multi-variable pour la séparation aveugle d'images, Ds A tesGroupe de Re her he et d'Etude du Traitement du Signal et des Images(GRETSI'07), Troyes, Fran e, sept. 2007.

Page 193: Algorithmes temporels rapides à point fixe pour la ...

176Author : Johan Thomas������������������������������Title : Time-domain fast �xed-point algorithms for the blind separation of onvolutive and/or underdetermined mixtures������������������������������Thesis supervisors : Yanni k Deville and Shahram Hosseini������������������������������Defense : the 12th of De embre 2007 at the Observatoire Midi-Pyrénées ofToulouse, Fran e.������������������������������Abstra t : The �rst part of this thesis deals with (over-)determined onvo-lutive mixtures. We extend the FastICA algorithm to onvolutive mixturesby developing a �xed-point algorithm operating in the time domain. We in-trodu e a non- ausal spatio-temporal whitening pro ess, whi h, by initializingthe extra tion parameters in a parti ular way, allows us to use �xed-point op-timization iterations. The estimation of the ontributions in the observationsis realized by means of a quadrati riterion optimized by a non- ausal Wienerpro ess.In the se ond part on erning instantaneous and onvolutive under-determined mixtures, we extend the FastICA algorithm by using the di�eren-tial separation on ept. We propose di�erential observation whitening pro e-dures whi h allow us to use �xed-point iterations to separate between themsome sour es of interest. In the onvolutive ase, the ontributions are estima-ted thanks to a non- ausal di�erential Wiener pro ess.The third part deals with instantaneous mixtures of sour es ontaining ahigh number of samples. We �rst point out a limitation of the FastICA al-gorithm whi h, at ea h optimization iteration, omputes some statisti s onall available samples. As the kurtosis riterion is polynomial relatively to theextra tion oe� ients, we propose a pro edure to identify this polynomial inorder to perform the optimization in a more e� ient omputation spa e. Thisprin iple is then extended to underdetermined instantaneous mixtures.������������������������������Keywords : Blind Sour e Separation (BSS), Independent Component Ana-lysis (ICA), onvolutive mixtures, underdetermined mixtures, long mixturere ordings, FastICA.������������������������������

Page 194: Algorithmes temporels rapides à point fixe pour la ...

177Auteur : Johan Thomas������������������������������Titre : Algorithmes temporels rapides à point �xe pour la séparation aveuglede mélanges onvolutifs et/ou sous-déterminés������������������������������Dire teurs de thèse : Yanni k Deville et Shahram Hosseini������������������������������Soutenan e : le 12 dé embre 2007 à l'Observatoire Midi - Pyrénées deToulouse, Fran e.������������������������������Résumé : La première partie de ette thèse est onsa rée aux mélanges onvo-lutifs (sur-)déterminés. Nous her hons à étendre l'algorithme FastICA auxmélanges onvolutifs en proposant un algorithme à point �xe opérant dansle domaine temporel. Nous introduisons un pro essus de blan himent spatio-temporel non- ausal, qui, en initialisant les paramètres d'extra tion d'une fa-çon parti ulière, permet d'utiliser des itérations d'optimisation de type point�xe. L'estimation des ontributions dans les observations est réalisée grâ e àun ritère quadratique optimisé par un �ltre de Wiener non- ausal.Dans la deuxième partie, onsa rée aux mélanges sous-déterminés instan-tanés et onvolutifs, nous her hons aussi à étendre l'algorithme FastICA ennous basant sur le on ept de séparation di�érentielle. Nous proposons despro édures de blan himent di�érentiel des observations qui permettent l'em-ploi d'itérations à point �xe pour séparer entre elles des sour es dites utiles.En onvolutif, les ontributions sont estimées au moyen d'un �ltre de Wienerdi�érentiel non- ausal.La troisième partie, onsa rée aux mélanges instantanés de sour es onte-nant un grand nombre d'é hantillons, met d'abord en éviden e une limitationde l'algorithme FastICA, qui, à haque itération d'optimisation, al ule desstatistiques sur l'ensemble des é hantillons disponibles. Le ritère du kurtosisétant polyn�mial relativement aux oe� ients d'extra tion, nous proposonsune pro édure d'identi� ation de e polyn�me qui permet d'e�e tuer l'opti-misation dans un espa e de al ul moins gourmand. Ce prin ipe est ensuiteappliqué aux mélanges instantanés sous-déterminés.������������������������������Mots- lés : Séparation Aveugle de Sour es (SAS), Analyse en ComposantesIndépendantes (ACI), mélanges onvolutifs, mélanges sous-déterminés, longsenregistrements de mélanges, FastICA.������������������������������Dis ipline : Traitement du signal������������������������������Laboratoire d'Astrophysique de Toulouse - TarbesUniversité de Toulouse � CNRS14, avenue Edouard Belin31400 Toulouse

Page 195: Algorithmes temporels rapides à point fixe pour la ...

Johan Thomas – Algorithmes temporels rapides a point fixe pour la separation aveugle de melanges convolutifs et/ou sous-determines – 2007