Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle...

32
Remarques stir l'hypercontractivit~ et l'6volution de l'entropie pour des chaines de Markov finies Laurent Miclo Universit~ Paul Sabatier de Toulouse Summary : We will show how, in the discrete times setting of finite (irreducible and aperiodic) Markov chains, one can still use some logarithmic-Sobolev inequalities to study hypercontractivity and the evolution of entropy. As an application, we will give a new simple proof of a criterion of Hwang and Sheu for the strong ergodicity in law of the generalised simulated annealing algorithms in discrete times. R~sum6: Nous allons montrer comment, dans le cadre du temps discret des chaines de Markov finies irr~ductibles et apdriodiques, on peut encore utiliser certaines in6galit6s de Sobolev-logarithmiques pour obtenir des rdsultats sur l'hypercontractivit~ et l'6volution de l'entropie. On illustrera ces techniques de semi-groupes en retrouvant simplement un crit~re de Hwang et Sheu pour l'ergodicit6 en loi forte des algorithmes de recuit g6n6ralls6s ~ temps discret. Abbreviated title : Hypercontractivit~ des chaines de Markov finies. American Mathematical Society 1991 subject classifications : Primary 60310 ; secondary 47A50 and 47N30. Key words and phrases: Irreducible and aperiodique finite Markov chains, logarithmic- Sobolev inequalities, hypercontractivity, entropy evolution, strong ergodicity in law for generalised simulated annealing.

Transcript of Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle...

Page 1: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

Remarques stir l'hypercontractivit~ et l'6volution de l'entropie

pour des chaines de Markov finies

Laurent Miclo Universit~ Paul Sabatier de Toulouse

S u m m a r y : We will show how, in the discrete times setting of finite (irreducible and aperiodic) Markov chains, one can still use some logarithmic-Sobolev inequalities to study hypercontractivity and the evolution of entropy. As an application, we will give a new simple proof of a criterion of Hwang and Sheu for the strong ergodicity in law of the generalised simulated annealing algorithms in discrete times.

R ~ s u m 6 : Nous allons montrer comment, dans le cadre du temps discret des chaines de Markov finies irr~ductibles et apdriodiques, on peut encore utiliser certaines in6galit6s de Sobolev-logarithmiques pour obtenir des rdsultats sur l 'hypercontractivit~ et l'6volution de l'entropie. On illustrera ces techniques de semi-groupes en retrouvant simplement un crit~re de Hwang et Sheu pour l'ergodicit6 en loi forte des algorithmes de recuit g6n6ralls6s ~ temps discret.

Abbreviated title : Hypercontractivit~ des chaines de Markov finies. American Mathematical Society 1991 subject classifications : Primary 60310 ; secondary

47A50 and 47N30.

Key words and phrases: Irreducible and aperiodique finite Markov chains, logarithmic- Sobolev inequalities, hypercontractivity, entropy evolution, strong ergodicity in law for generalised simulated annealing.

Page 2: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

137

1 I n t r o d u c t i o n

Les in4galit~s de Sobolev-logarithmiques furent introduites par Gross dans [8] pour trai ter notamment de l 'hypercontractivit~ des processus d'Ornstein-Uhlenbeck en dimension infinie. Mais elles se sont vite r4v~16es int4ressantes pour d 'autres types de processus (cf. par exemple Rothaus [18] et Holley et Stroock [91) et jusque dans un cadre g4n4ral de th4orie des semi-groupes (voir Bakry [1] et les r4f~rences qui y sont donn6es). M~me dans le contexte relativement plus simple (en apparence!) des processus de Markov finis homog~nes, elles permirent de faire des progr~s dans la compr4hension des vitesses de convergence vers l '4quilibre (cf. Diaconis et Saloff- Coste [4], nous reprendrons d'ailleurs ici les notations de cet article). Cependant leur domaine d 'application sembla.it restreint aux cas de processus indic4s par un temps continu, car l'int~r6t de ces in4galit4s 4tait souvent de permettre une majorat ion des d4riv4es temporelles de certaines quantit4s naturellement associ4es aux semi-groupes. Notre but ici est de montrer comment on peut dgalement les utiliser pour 4tudier des chaines de Markov finies s temps discret. Pr~cisons tout de suite que de supposer l 'espace des 4tats finis est un peu frustrant, mais nous a 4t6 impos~ par les in6galit~s de Sobolev-logarithmiques pr4sent4es dans la section suivante, qui ne sont pertinentes que dans ce cadre fini (les autres calculs 4tant sinon souvent walables dans une plus grande g6n6ralit4).

Soit donc S u n ensemble fini (non r4duit ~ un singleton), muni d 'un noyau p = (p(x, Y))~,.ues de probabilit6s de transitions que I'on supposera irr~ductibte : pour tous z ,y C S, il existe n �9 /TV et une suite finie x = ~c0, x l , . . . , x , ~ = y d'41~ments de S telle que pour tout 1 < i < n, p(~ci_l,x,) > 0 (une teUe suite sera appel~e un chemin de longueur n, de points de d4part z et d'arriv4e y), i.e. il n 'y a qu'une classe de r4currence et pas de points transients. I1 existe donc une unique probabilit4 invariante # pour p, qui est caract4ris~e par

V z �9 S, ~ ~ (y)p(y ,z ) = Z ~(~)p(x ,y) = ~ ( ~ ) yES yES

et eUe charge tous les points. Comme d'habitude, on associe s p u n op4rateur P qui agit d 'une part sur les

fonctions r6elles d4finies sur S (leur ensemble sera d~sormais not4 .T'(S)) par

v f �9 :r(s), v ~ �9 s, P f ( z ) = ~ p(x, ~)f(~,) y6S

et d 'autre part sur les probabilit~s sur S (dont l 'ensemble sera d~signe par 7~(S)) par

v m �9 ~ ( s ) , v x �9 s, m p ( ~ ) = ~ m(~)p(~, ~) y6S

l ' invariance de # s'dcrivant alors # P = #. Ces operations ont clairement les interpretations probabilistes stfivantes : si X =

(X~),e~v est une cha~ne de Markov sur S dont les probabilit6s de transitions sont donn6es par p e t qui est issue de z �9 S, alors pour tout f �9 .T(S), P f ( z ) = ~:=[f(X~)]. Si par contre on suppose X de loi initiale m �9 T(S) , alors mP est la loi de X~.

Pour n �9 PC, on d4signera aussi par P'~ les it6r4s n fois de P (auxquelles correspon- dent les matrices p"), en convenant que p0 = I , off I e s t l 'application identit4, agissant suivant les cas sur ~ ' (S) ou sur P ( S ) .

Page 3: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

138

La premiere question que l'on se pose est de savoir si le semi-groupe (P~)=e~v est hypercontractif: si 2 < q0 < +cr est donn6, existe-t-il des q > q0 tels que pour tout f E ~-(S),

(1) IIPfllq _< Ilfllq0

off pour tout 1 < r < 0r I1" II, d6signera la norme usuelle de L ' ( S , ~) .

La seconde question concerne l'6volution de l'entropie le long des itdr6es de P agissant sur ~~ et plus particuhSrement de d6crire quantitativement sa d6croissance, pour pouvoir dans les situations ap6riodiques donner sa vitesse de convergence vers 0 en temps grand. Rappelons que l'entropie par rapport s # d'une mesure m E P(S) est d6finie par

Ent(m) = E In (m(x)~ m(x)

(par la suite, dans le cas de processus inhomog&nes, phsieurs mesures invariantes instantan6es apparaJtront et cette expression sera alors p h t f t notge Eat(m[#) pour 6viter les confusions)~ et que c'est une quantit6 qui mesure d'une certaine mani&re un 6cart s la probabilit6 g, car on a par exemple

(2) II m -#11,,, -< ~ ~

o~ I1 It,,, repr6sente la variation totale (cf. Stroock [19] formule (1.12)).

Dans la section suivante, on introduira certaines in6galit6s de Sobolev-logari- thmiques dont les constantes associ6es permettront d'apporter des r6ponses aux pro- blSmes pr6c6dents, respectivement dans les sections 3 et 4. Enfin dans une derniSre section, on illustrera ces techniques en retrouvant, relativement facilement, un critSre d'ergodicit6 en loi des algorithmes de recuit g6n6ralis6s finis s temps discret.

2 In~galit~s de Sobolev-logarithmiques

Les in6galit6s de Sobolev-logarithmiques consistent s comparer une certaine fonctionnelle L:, qui ressemble s l'entropie mais qui est d6finie sur :F'(S) par

v S e .r(s), / f-'(f)= f21n Ilfll~ d~

(cette quantit6 sera aussi not6e / : , ( f ) quand la probabilit6 /z ne sera plus sous- entendue), s une forme de Dirichlet. Quand les processus 6tudi6s sont s temps continu, la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6 additif de cet op6rateur dans L2(/z)), mais quand le temps est discret, c'est suivant les cas ceUe associ6e s I - P * P ou s I - P P * qui apparaJt natureUement (voir aussi Fill [5] et Diaconis et Saloff-Coste [3], off P * P est appeM le symdtris6 multiplicatif pour le distinguer du sym6tris6 additif (P + P*)/2).

On a not~ ci-dessus P* l'adjoint de P dans L2(#), et pour tout f E ~ (S ) , soit

E(f,f) = / ( x - P*P)(S)S d~ = / S ~ -(PS)= d~ = IlSll=~ -IIPSlI~

Page 4: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

139

(quand on voudra pr$ciser les opSrateurs intervenant, cette expression sera aussi notre Ez_p.p(f , f ) ) . Du fait que P e s t une contraction dans L2(#), il est clair que E(f, f ) > 0. On calcule imm6diatement que P* agit sur Y(5') par

V f �9 .7-'(5'), V x � 9 P * f ( z ) = ~ ~ p * ( x , y ) f ( y ) yES

avec pour tous x , y �9 S, p ' ( z , y ) = # (y )p (y , x ) /# (x ) . Le falt que # est invariante pour P imphque que P* est un noyau markovien

V z �9 S, Z p , ( z , y ) _ 1 ~ ~(~) ~ Z ~(y)p(y, ~) = 1

qui de plus admet aussi # pour probabilit6 invariante

V z �9 5', Z #(z)P*(Z, Y) = Z ff(Y)P(Y, x) = ~(x) yES yES

Notons qu'en posant pour z , y �9 5',

q(~,y) = (p*p)(z,y) = , ( z ) - ~ ~ , ( z ) p ( z , ~ ) p ( z , y ) zES

on peut expllciter un peu plus la forme de Dirichlet,

1 (3) V f �9 J:'(5'), $ ( f , f ) = ~ ~ # (x )q (x , y ) ( f ( y ) - f(:c)) 2

z ,y E S

D6finition :

On dit que I - P*P satisfait une in6galit6 de Sobolev-logarithmique s'il existe une constante ~ > 0 teUe que pour tout f C .~(S),

s < ~ -1 s f )

et c t ( I - P ' P ) ddsignera alors la plus grande constante (appelSe constante de Sobolev- logarithmique) teUe que toutes ces in6galit6s soient satisfaites.

Remarque :

Une telle inSgalit$ impiique que pour tout f C ~-(5'), s < a -111f1122, ce qui b~ son tour impose que 5' est fini (du moins que # est une combinalson convexe d 'un hombre fini de masses de Dirac, ce qui nous ramSne ~ ce cas), comme on en s'en rend compte en considSrant sinon des indicatrices d'ensembles de mesure de plus en plus petites pour # (voir aussi les contre-exemples de la fin de cette section).

En fait dans le contexte des processus de Markov finis, il est bien connu qu'une inSgalit$ de Sobolev-logarithmique du type pr~cgdent est Squiwlente s l ' irr6ductiblit6 de p ' p : en effet pour la condition n$cessaire, il suffit de remarquer que si on pose f~ = I + 6h, avec I la fonction prenant toujours la valeur 1 et h �9 .7:(5') fixg, on a E ( L , f , ) = 2E(h,h) et pour tendant vers 0, g ( f , ) ~ - z ( L ) ) b , d'o l 'existence d 'un trou spectral (d 'au moins 2a(I - P ' P ) ) pour l 'o l~rateur sym~trique I - P*P (pour plus de dgtalls, on renvoit ~ Rothaus [18] ou s Diaconis et Saloff-Coste

Page 5: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

140

[4]), ce qui est aussi ~quivalent s l ' irr6ductibilit6 de p*p (ce dernier point se montrant part i r de l 'expression (3), voir par exemple la preuve de l'in6galit6 de Poincar6 faite

par Holley et Stroock [10]). Quant s la condition suffisante, puisque s et g sont tous deux homog~nes d 'ordre 2, il suffit de voir que

inf g(f'f--) > 0 fey(S)/llfll~=a.f~Vect(I) •(f)

et m~me que, puisque pour tout f E .T(S), g(I,I) > e(Efl , I l l) ,

inf g(f'f--) > 0 fez(s) /H file=l, f~t. f_>0 s

mals ceci d6coule, outre du trou spectral et d 'un d6veloppement du type pr6c6dent au voisinage de I , du fait que l 'application f ~ g( f , I ) / f - ( f ) est continue (on aura not6 que par l'in6galit6 de Jensen et la stricte convexit6 de /R+ ~ t ~ t ln( t ) , s est nul si et seulement si f2 est constante) sur le compact form6 de l 'ensemble { f E y ( s ) / [ [ f H ~ = 1, f r I, f _> 0} priv6 de son intersection avec une pet i te boule (pour I1" 112) autour de I , elle y atteint donc son minimum qui ne peut fitre nul car e ( f , I) = 0 6quivaut de par la formule (3) et l ' irr6ductibilit6 de p*p s f constan*.

Pour ceci et pour des estimations de a ( I - P ' P ) (qui constituent le point crucial dans les applications, voir par exemple la derni~re section) on renvoit aussi s Diaconis et Saloff-Coste [4].

Notons que le trou spectral de I - P*P est toujours major6 par 1, ce qui montre que d 'une mani~re g6n6rale, on a c~(I - P ' P ) <_ 1/2.

Le r6sultat tr~s simple suivant vanous permettre de voir quelles sont les situations pour lesquelles des in6galit6s de Sobolev-logarithmiques peuvent ~tre utiles. On y suppose seulement que le noyau p admet # pour mesure invariante. L'adjoint P* est alors toujours bien d6fini dans L2(#), m~me si la matrice p* n'est plus unique, il suffit de poser p*(x,y) = #(y)p(y ,x ) /#(x) si #(x) > 0 et de prendre pour p*(x, .) une probabilit6 quelconque sur S si #(x) = 0 (pour permettre au noyau p* de rester markovien et d ' admet t re 6galement # pour mesure invariante). Le r~sultat ci-dessous ne d6pend pas du choix 6ventuel de p*.

Proposition 1

On a 6quivalence entre (i) I1 existe un k > 1 tel que pk,pk est irr6ductible. (ii) pes t irr6ductible et ap6riodique.

D g m o n s t r a t i o n :

Supposons (ii), il est bien connu qu'alors il existe un k > 1 tel que pour tous x ,y E S, pk(x,y) > 0~ or il est clair s part ir des 6galit6s

p~. = (p~)* = (p')~

que ceci implique aussi que pour tous x ,y C S, pk,(y~ x) > O, puis que

v ~,v ~ s, (pk'p~)(~,v) > 0

Page 6: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

141

et donc notamment l ' irr6ductibilit6 de pk,pk.

P~ciproquement, supposons d 'abord que p admette une classe de r6currence C # S. I1 existe une telle classe satisfaisant pour tout x E C, #(x) > 0. Or pour z E C et y E S, l'in6galit6 p*(z,y) > 0 implique, puisque #(x) > 0, d 'une part que #(y) > 0, et done notamment que y ne peut pas ~tre un point transient, et d 'autre part que p(y,z) > 0. Ces deux informations montrent que y E C et on aboutit s la m~me conclusion si p (z ,y ) > 0. Ainsi pour tous k >_ 1, z E C et y C S, l'in6gafit6 (pk*pk)(x,y) > 0 impose que y appartient aussi h la elasse C et il en d~coule que pk,pk a une elasse de r6currence dans C, ce qui est incompatible avec l ' irr6ductibilit6 de pk,pk. Supposons maintenant que p irr6ductible admette plusieurs classes de p6riodieit6, disons Co," " ,Cd-1 (d > 1 est alors la p6riode, et on suppose que C o , ' " , Cd-1 sont rang6s eons6eutivement). En consid6rant leurs indices comme des dl6ments de ~ , / d N , pour tous k >_ 1, i E ~/d2~, x E C~ et y E S, on a l ' implieation p~(x,y) > 0 ~ y E Ci+k (respectivement p~*(x,y) > 0 ~ y E Ci-k), ce qui prouve que pk,pk(x, y) > 0 assure que z et y sont dans une m~me classe de p6riodicit6 et done que pk,pk ne pent fitre irr6ductible.

[3

Si p e s t irr6duetible et ap6riodique, notons

(4) k(p) = min{k C Pr / pk,pk est irr6ductible}

Pour appliquer les r~sultats des deux sections suivantes, qui seront satisfaits sous l 'hypoth~se d'existenee d'in6gafit6s de Sobolev-logarithmiques, il faudra au moins remplacer la matrice p par pk(p), et m~me souvent il sera int6ressant de eonsid6rer plut6t pk avec un certain k > k(p) pour accroitre fortement la constante de Sobolev- logarithmique (voir l 'exemple de la remarque (b) de la fin de la section 5). L'argument pr6c6dent montre que

k(p) < min{k _> 1 / V x, y ~ S, p~(x,y) > 0}

mais on peut avoir une in6galit6 stricte comme le montre l 'exemple donn6 par la matrice

1 0 1 1 ) 1 0 1

P=2 o ~ o

pour laquelle k(p) = 1. Par ailleurs pour tout n ~ / N , n > 2, la matrice p ddfinie sur 2~ /(n2g) par

1 , s i i # O e t j = i + l 1/2 , s i i = 0 e t j = l

V i , j ~ 2~/(n2g,), p( i , j ) = 1/2 , s i i = 0 = j

0 , sinon

fournit un exemple tr~s simple pour lequel k(p) = n - 1. Revenons au eas g~n6ral, s part ir des in~galit6s de Cauchy-Schwarz,

V k > 1, V f ~ Jr(S), V x ~ S, (P~+~f(x)) ~ <_ P((P~f)2)(z)

Page 7: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

142

et de l ' invariance de # par rapport s P , on reinarque que

ce qui montre que SV * ~ k ~ a( I - pk . pk )

est une application croissante (en convenant que a ( I -- p k . p k ) = 0 si pk.pk n'es t pas irr6ductible). Celle-ci admet d'ailleurs a ( I - E;E~,) = a ( I - E , ) comme limite en l 'infini, off Eu est la matrice correspondant s l 'esp6rance par rapport s # et qui est donn6e par

V z , y �9 S, E~(z ,y ) = ~(y)

Indiquons que la valeur de a ( I - E , ) a 6t6 astucieuselnent calcttl6e par Diaconis et Saloff-Coste (cf. le tli4or6me 5.1 de l 'appendice de [4]) et qu'elle vaut ( 1 - 2 # ) / l n ( 1 / # - 1), off # = m i n , e s #(z) .

I1 apparait 6galeinent que pour tout k > k(p), pk.pk sera irr6ductible, puisque ceci revient s dire que a ( I - pk .p~ ) > 0, in6galit6 elle-ingme 6quivalente s

V f �9 .T(S), C i _ p k . m ( f , f ) = 0 ~ f est constant

Reinarques :

a) Dans le In , me ordre d'id6es, notons pour tout n �9 ~TV,

V,~ = { f �9 ~ ( S ) / I IP~f] le = Ilfl le}

Puisque pour tout x �9 S, on a (P '~f (x) ) 2 < P'~(f2)(z) avec 6galit4 si et seulement si f est constante sur l 'enseinble {y �9 S / pn(z, y) > 0}, il appara~t que Vn est un sous- espace vectoriel de 2-(S). De plus, en utifisant les in4gafit~s [IP'~+lfll2 _ IIP'~fil2 < �9 " < IIPfll2 < Iifll2 valables pour tout f �9 9t-(S), on montre que pour tout n �9 ~W,

f E V.+I r P f E V,~ et f �9 171

De ceci il d4coule facilement que si pour un n C LW on a V~+I = Vn, alors pour tout r C ~W, V,~+, = Vn. Or eli supposant p irrdductible ap6riodique, on a Vk(p) = Vect(I) , ainsi (Vn) est une suite de sous-espaces vectoriels qui commence par 6tre str ictelnent d6croissante (V0 = 9r(S)) puis qui finit par valoir Vect(I) . On en d6duit que l 'on a toujours k(p) <_ card(S) - 1 (l'6galit4 6tant possible coinine on l 'a d6js vu dans l 'exemple ci-dessus sur 2~/(n2~)). Ceci nous donne un rdsultat sur les chemins qui n 'es t pas facile g obtenir directeinent : en effet, k(p) est ie plus pet i t k E /N tel que pour tous x , y �9 S, on puisse trouver deux suites finies (q(0)0_<~<~ et (q(1))0<i<= de

cheinins (pour p) de longueur k satisfaisant q~O) = z, (1~ n) = y, q~i) = (1~i) pour tout

0 < i < n e t q~i+l) = (1~i) pour tout 0 _< i < n. Les r&ul ta ts pr6cfdents montrent donc que l 'on peut trouver de telles suites avec k = card(S) - 1.

b) D 'au t re part , reinarquons que P * P est diagonalisable et n ' adme t que des valeurs propres positives, la plus grande 6tant 1. Puisque cette diagonalisation est orthogonale dans L2(#), I[Pf[[2 = llfl[2 6quivaut s l ' appar tenance de f s l 'espace propre associ6

la valeur propre 1 et l ' i rr6ductibil i t6 de p*p est donc 6quivalente au fait que celle-ci est de Inultiplicit6 1. Or il est bien connu que P*P et PP* ont In6ine spectre, ainsi

Page 8: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

143

l ' i rr6ductibil i t$ de p*p est dquivalente s celle de pp*, on a no t am m en t k(p*) = k(p) et I - P * P satisfait une in~galit~ de Sobolev-logarithmique si et seulement si il en est de m6me pour 1 - PP* . Cependant il n 'es t pas clair en g~nSral, mis ~ part dans les cas oh p e s t normal (no tamment si p e s t rSversible, car on a alors P* = P) , que les constantes c~(I - P ' P ) et c~(I - PP*) soient 6gales. Or dans la section suivante c'est la premiere qui interviendra, alors que dans les sections 4 et 5 ce sera la seconde.

c) S i p est irr~duetible apdriodique et rdversible, notons que k(p) = 1, car s'il existait f E 9r(S) non constante telle que ~ _ p . p ( f , f ) = 0, ceci impliquerait que l 'espace propre associ$ ~ la valeur propre 1 pour P~ = P * P serait au moins de dimension 2, i.e. soit l 'espace propre associ6 s 1 pour P e s t au moins de dimension 2, ce qui est exclus par l ' irrdductibili t6, soit - 1 est valeur propre de P, ce qui est en contradict ion avec l 'ap~riodicit6.

On peut en d~duire un rSsultat un peu plus gSn6ral : supposons que p soit tel que

(5) v=,y~ s, p(~,y) > 0 ,===> p(y,~) > 0

alors on a aussi k(p) = 1. En effet , k(p) n e d6pend que de la matrice d ' incidence i(p) associ6e s p, qui est

donn6e par

V x, y C S, i(p)(x, y) = I~(~,~)>0

ainsi k(p) = k(iY), o~ i~ est la matr ice markovienne d6finie par

{1/card{z~S/p(x,z)> } , s i p ( z , y ) > O V x , y ~ S, ~ ( x , y ) = 0 , sinon

or eette derni~re est r~versible si et seulement s i p satisfait (5).

3 Hypercontractivit~ h temps discret

Tradi t ionnel lement dans le cas des processus de Markov finis, une in~galit~ d 'hyper- contractivi t~ du type (1) se prouve pour P = exp(t0L) o~ to > 0 et L e s t un g~n6rateur irrSductible sur S. Plus pr~cisSment, on montre que route une famiUe d'indgalit6s est satisfaite :

V t > 0, V f E ~ ' (S) , Ilexp(tL)fHq(t) < Ilfl[qo

off q : ~ + ~ [ 2 , + ~ [ est une certaine application telle que q(0) = q0 > 2. On les prouve en les ddrivant par rapport ~ t > 0 et en imposant aux d~rivSes d'$tre ndgatives grhce s des inSgalitSs de Sobolev-logarithmiques (cf. par exemple Gross [8] ou Diaconis et Saloff-Coste [4]). Ainsi, si on veut montrer (1), on peut commencer par chercher s'il n 'exis terai t pas un gSnSrateur irrSductible L sur S tel que P = exp(L). Cependant ceci est rarement satisfait, ne serait-ce que parce que cela implique ddjh que pour tous x , y E S, p ( x , y ) > 0. Nous allons plutSt essayer d 'est imer directement la diffSrence I I P f l l q - Llflla0 et voir comment lea indgalit6s de Sobolev-logarithmiques de la section pr$cSdente peuvent permet t re de la rendre n6gative.

On supposera donc que I - P * P satisfait une in6galit~ de Sobolev-logarithmique avec constante a ( I - P ' P ) > 0, c'est-s que P * P est irr$ductible, ce qui entralne no t ammen t l ' irr6ductibili t~ et l 'apSriodicit$ de P . Notons Sgalement

u ( P ) = m a x ( 1 / p ( x , y ) / x , y e S, p ( x , y ) > O} - 1

Page 9: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

144

(on a donc v(P) _> 1 par ap6riodicit6 de P) , et si q > 2 et v > 0 sont donn6s, on pose

(1 + v) q - 1 - qv

g(q,u) = ( ( l + v ) q /2 -1 ) 2

Si q = 2, on a 9 ( 2 , . ) _= 1, mais si q > 2 est fix6, on v6rifie ais6ment que l 'appl icat ion Kl+ ~ v ~ g(q,u) est s t r ic tement d6croissante et satisfait

g(q,0+) = 2 q - 1, g ( q , + ~ ) = 1 q

D ' au t r e part , on peut aussi montrer qu 's u > 0 fixd, [ 2 , + c c [ ~ q ~ g(q,u) commence par 6tre croissante puis d6croit, les limites 6tant g(2, v) = 1 = g ( + c c , v).

Avec ces notations, le principal r6sultat de ce t te section s'6nonce alors,

Proposition 2

Pour tous qc _> 2 et f E .~(S) , on a

[IPfl[q _< Ilfllqo

d&s que q satisfait q _< [1 + g(q, v (P) )a ( I - P*P)]qo, et donc no t ammen t si q = [1 + a(I - P*P)]qo

La preuve de cet te proposit ion est bas6e sur deux lemmes tr~s simples :

L e m m e 3

Fixons f E 9v(S), l 'applicat ion

[0,1] ~ t ~ [[/[]l/t

est convexe. N o t a m m e n t pour tous q ~ qo > 1,

l l f l lq - l l f l l~o <- q - qo. ttfll~_q s qqo

D 6 m o n s t r a t i o n :

Soit 0 < 0 < 1 et 0 < s < t < 1, on veut es t imer IlfU~/fe,+o-o)t). 0 < r < 1 t e l q u e

i r l - r

0s + (1 - 0)t s t

o n c~acule que ~ : e , / ( O ~ + ( 1 - - O ) t ) .

Par l 'in~galit6 de H61der on a

<_ Jf ,(0s+(1-o)t)/,zl, f :It(1-'J(~176

f 1-o = Ilfll~ ll Hi# < 0 I]flla/, + (I - 0)Ilflll#

Pour ceci soit

Page 10: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

145

par convexit6 de l 'appl icat ion exponentielle. Pour la seconde affirmation, il reste s v4rifier que

I[flll/t = --Ilfll~j~,/ ' f ln ~ } f l / , d# d~

= _ iif11~i7, ~/' s

[]

Le second lemme concerne une pet i te in4galit~ qui pr4cise la stricte convexit4 de l 'appl icat ion ~ + 9 t ~-+ t q, pour q > 2. C'est elle qui a d4termin4 la fonction g ( . , �9 ) pr&~dente.

L e m m e 4

Soit u > O e t q > _ 2 f i x & . Pour t o u s t > _ _ O e t - t < s < u t , o n a

(t + s) q > t q + qtq-ls + g ( q , u ) ( ( t + a) q/2 - tq/2) 2

Ddmonstration :

En effet, t > 0 4tant fix~, notons pour u = s/ t , h(u) le mcmbre de gauche moins

le mernbre de droite le tout divis4 par t q. En d4rivant deux lois, il apparaJt que h a l e compor tement suivant :

u -1 0 u(q,v) v

h h ( - l ~

pour une cer taine valeur 0 < u (q ,u ) < u, ce qui pe rmet de conclure au r&ul ta t o, nnonce.

[]

D4monstratlon de [a propositlon 2 :

Soit q > q0 - 2 a priori quelconques, et comme d 'habi tude , on commence par se

ramener ~ ne consid6rer que des fonctions f positives. On 6crit ensuite

IIPfl[q - ] l f l l q0 = I lPfl la - Ilfllq + IIf[Iq - Ilflla0

et on majore l 'expression I l f l l a - Ilfllq0 comme dans l emme 3.

Pour l ' au t re te rme, on utilise l 'in4galit~ de concavitd a 1/q - b 1/q < kbl/q-l(a - b), - - q

valable pour tous r4els a, b > O, pour obtenir

1 I lPfl tq - I l f l l ~ -< q [[fllX~-q(NPfll~ -Ilfll~)

ce qui nous rarn~ne s est imer f (P f )q d# - f fq d#. Pour ceci on se sert du l emme 4 appliqu4 avec u = u (P) , t = P f ( x ) et t + a = f ( y ) , oh z , y E S sont tels que

p(x,y) > O.

Page 11: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

146

Mais z E S 6tant fix6, on int6gre ces in6galit6s en y par rapport s p(x,y) pour obtenir

P(fq)(z) >_ (P(f)(x)) q + g(q,u(P)) ~ p(z,y)(fq/2(y) - (Pf)q/2(z))2 yES

Cependant , toujours s x E S fix~, on a

y~ p ( x , y ) ( f q / 2 ( y ) -(Pf)q/2(x))2 yEG

d'ofl

(6)

> min E p(x,y) (fq/2(y) - c) 2 -- cE1R yEG

= Z p(~,y) (f~/~(y) - P( /~)(~))~ yEG

= P ( s ~ ) ( ~ ) _ (p(/q/b(~)) 2

I1 reste alors s int6grer ces in6galit6s en x par rapport s # et s utiliser l ' invariance de tt par P pour faire apparai t re que

[]pf[[~ _ [[fl[qq _< _g(q, v(p))g(fq/2, fq/2)

Finalement on a done montr6 que

(7) ]IPf[]~ -II/ll~0 -< q [l/Ill( ~ q -qoq~163 _ g(q,.(p))e(f~/2,/ . /2)

qui est un analogue pour des difffirenees finies de l ' es t imat ion elassique de la d6riv6e dans la preuve de l 'hypercontraet ivi t&

Si main tenan t q _< [1 + g(q, v(P))a(I - P*P)]qo, on peut eonelure par l'infigalit6 de Sobolev-logarit hmique

a(I - P*P)C(f q/2) < g( f q/2, fq/2)

Remarques :

Dans les applications, on a souvent u(P) trbs grand, et on peut alors se contenter de prendre q = (1 + a(I - P*P))qo. Notons d'ailleurs que pour la preuve du r6sultat d 'hypercontract ivi t6 avec ce q, le lemme 4 est inutile, car on a besoin de l ' in6galit6 (6) qu'avec g(q, u(P)) remplacd par 1, et dans ee cas elle se r6duit s

(P(fq/2)(x))2 > (P(f)(x))q

qui est t r ivialement satisfait pour q ~ 2. N6anmoins nous avons tenu ~ presenter le lemme 4, car c'est une in6galit6 du

m~me genre qui in terv iendra dans la section suivante, et curieusement la difference entre g(q,O+) et g(q,+o~) est la "m~me" que celle qui intervient dans le lemme

Page 12: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

147

2.6 de Diaconis et Saloff-Coste [4[ entre les situations r4versibles et non r6versibles. Malheureusement, nous ne sommes pas arriv6 s exploiter ceci pour montrer par exemple que si P e s t r6versible, alors on peut obtenir un meiUeur r6sultat que la proposition 2.

Dans le m4me ordre de consid6rations, notons que (7), off on remplace g(q, u(P)) par 1, permet de retrouver le lemme 2.6 de Diaconis et Saloff-Coste I41 dans les cas non r6versibles : soit L un g4n6rateur markovien sur S, matriciellement L = (L(x,y))~.ues avec pour tous x r y C S, L(z,y) > O, et pour tout x E S, ~uesL(x,y) = O. Supposons L irr6ductible et soit P = exp(tL) pour un t > 0. Si q : ~ + --* /R+ est une application d4rivable telle que q(0) = q0 _> 2, 6crivons que

[lexp(tL)f]/q(,)- Ilfll~o t

1 ~ l_q(t)[q(t)~qo~(f q(t)/2)_ _ Ei_exp(tL*)exp(tL)t(fq(t)/2, fq(t)/2)] <- ~ J q(*) qo

Or on salt (voir la preuve du th~or6me 3.5 de Diaconis et Saloff-Coste [4]) que

d [ ] e x p ( t L ) f [ [ q ( t ) t o = ]lflll~~176 [dq(t) ff~(fqo/2) C-L(f'fq~ ] ~ i = L dt t=o q~-

et d 'autre part il est clair que

lira EX-r fq(t)/~) = E-L*-L( f q~ fqo/2) = 2E_L(fqo/2, fqo/2) t~O+ t

Ainsi en passant s la limite en t petit, on retrouve bien que pour tout q0 _> 2 et tout f E ~-(S),

q~ E /~ ~q0-1~ r176 q~ <_ ~ -L~.J,J ]

4 Evolution de l'entropie h temps discret

Un des moyens de montrer la convergence en lot vers l'6quilibre des processus de Markov finis irr6ductibles et homog6nes (s temps continu), est d'6tudier ]'6volution de l'entropie, par rapport s la mesure invariante # du syst6me, de la lot s un instant donn6. En effet, il n'est pas tr6s difficile de majorer la d6riv6e par rapport au temps de cette quantit6 par l'oppos6 de deux lois la forme de Dirichlet associ4e au sym6tris6 additif de l'oppos6 du g4n6rateur (st le processus est r6versible, on peut m6me faire intervenir quatre lois cette forme de Dirichlet, voir Diaconis et Saloff-Coste [4]). Par le biais d 'une in6galit6 de Sobolev-logarithmique, ceci permet d'obtenir une in6gaht6 diffSrentielle simple satisfaite par l'entropie, qui s'int6gre pour prouver que cette quantit6 converge exponentieUement vite vers 0, la vitesse 6tant donnSe par la cons- tante de Sobolev-logarithmique consid6r6e.

Nous allons voir comment ceci peut 6galement s'adapter pour traiter de l'ergodicit6 des chaines de Markov finies homog6nes irr6ductibles et ap6riodiques.

Comme dans la section pr6c6dente, on a besoin d'une in6galit6 qui quantifie d 'une certaine mani6re la stricte convexit6 de l'application j~t~+ 9 u ~ u ln(u).

Page 13: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

148

L e m m e 5

Pour t o u s t > 0 e t s > - t , o n a

(t + s) ln( t + s) _> t ln(t) + (1 + ln ( t ) ) , + ( t g g T ~ - x/t) =

D 6 m o n s t r a t i o n :

A t > 0 fix~, soit pour u -- s / t , h(u) le nlembre de gauche moins celui de droite, le tout divis6 par t. En d6rivant deux fois on montre que h a le tableau de variations suivant :

h

- 1 u0 0 +oo

0 / ~ ~176 pour une cer taine valeur --1 < u0 < 0, caract6ris6e par l n ( l + u 0 ) - l + ( l + u 0 ) -1/2 = 0.

[]

En supposant que I - PP* satisfait une in6galit6 de Sobolev- logar i thmique avec constante a ( I - PP*) > 0, on en d6duit le r6sultat suivant :

P r o p o s i t i o n 6

Pour tout m E 7~(S), on a

E n t ( m P ) < (1 - a ( I - P P * ) ) E n t ( m )

D d m o n s t r a t i o n :

D6signons par f la densit6 de m par rappor t s #. On v6rifie imm~dia tement que la densit6 de rap par rappor t ~ p est alors donn6e par P * f .

En appl iquant le l emme 5 avec t = P * f ( x ) et t + s = f ( 9 ) , pour x , 9 C S, puis en mult ipl iant cet te in6galit6 par p*(x, 9) et en sommant sur 9 E S, on obtient que pour tout x E S,

yES

Cependant , toujours ~ x E S fixd, on a comme dans la section pr6c6dente

yES

ainsi en int6grant par rappor t s # en x et en utilisant l ' invariance de # par rappor t s P*, on fMt apparal t re que

(8) E n t ( m P ) = ~ P * f ( x ) l n ( P * f ( x ) ) # ( x ) <_ Ent (m) - Sx_pp , (~ / f , ~ / f ) ~ES

Page 14: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

149

I1 reste s uti l iser l ' in~galit~ de Sobolev- logar i thmique

1 En t (m) = f_.(~ff) < a(I Z PP*) e~-P~'(~f~' ~f~)

pour conclure au r(~sultat escompt~.

Remarques :

a) Pour 0 < v < 1, soit g(u) = ((1 - ~,)ln(1 - . ) + v)/(lxflf-:-~-~ - 1) 2, on v6rifie sans difficult6 que pour tous t _> 0 et s ~ -g t , on a

(9) ( t + 8 ) l n ( t + s ) > t l n ( t ) + ( l + l n ( t ) ) s + g ( v ) ( ~ - v / t ) 2

Remarquons que g est s t r ic tement d~croissante et que g(0+) = 2 et g(1) = 1. Une nouvelle coi'ncidence veut que la difference entre ces valeurs est la m~me que celle qui intervient dans le lemme 2.7 de Diaconis et Saloff-Coste [4] entre les s i tuat ions r~versibles et non rdversibles. Notons aussi que l 'on peu t se servir d 'une in~galit~ du type (9) avec un v > 0 d~pendant de m e t p, si l 'on suit a priori que m charge tous les points. Puis quand on finit par suvoir plus pr~cis~ment que f est assez proche de I , on peut util iser plut6t une var iante de l ' in~galit~ de t rou spectra l s la place d 'une v~ritable in~gatit~ de Sobolev- logar i thmique (cf. les in~galit~s ~nergie-entropie de Bakry [1], que l 'on ~crit ici sous la forme

V f �9 J : (S ) , IIfll2 = 1, s ~_ az(f)(I - PP*)g( f , f )

avec pour tout h > 0, ah(I-- PP*) = h -1 inf]ey(s)\vr162 iiflh=l. L(S)=h $ ( f , f ) >_ a(I -- P P * ) , et on se sert du fait que fimh~0+ a(h) est ~gal s la moiti~ du t rou spectra l ) .

b) Par des arguments ident iques s ceux de la fin de la section pr~c~dente, en prenant P = exp( tL) avec t pe t i t et L g~n~rateur i rr~ductible , on mont re que (8) pe rmet de re t rouver le lemme 2.7 de Diaconis et Saloff-Coste [4]: pour tout f E .T'(S),

f_>O,

(car il suffit de l 'avoir pour routes ces fonctions qui satisfont f f d# = 1).

c) Le choix pr6c~dent de t = P ' f (x) est commode et est sugg~r~ par la preuve de l ' in~galit~ de Jensen pour la fonction convexe ~ + ~ t ~-* t ln( t ) et la probabi l i t~ donn~e par p*(x, �9 ) s x E S fix6 (qui pe rme t de voir que l ' en t ropie est toujours d6croissante le long des it~r~s du semi-groupe agissant sur 7v(S)), mais n 'es t pas op t imal en g6n~ral : en effectuant les m~mes cMculs, on obt ient pour tout t ~ 0,

P*(fln(f))(x) - (P*(f)(~) - (P'( z])(~))~)

et s x E S fix~, on est donc amen~ s opt imiser le membre de droi te en t. On v~rifie facilement que le m a x i m u m est a t te in t pour

= [ P (x /Y) (x ) ]

Page 15: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

150

si P*(,fT)(z) # 0 (sinon de route fa~on, l ' inSgaht$ pr$c6dente s'$crit 0 > 0 pour tout t > 0). En rempla~ant t par cette valeur, on obtient

> -P*(S)(m) + (P* ( ,~) (x ) ) 2 + 21n ( P * ( S ) ( x ) X

_ i p , ( v i - f ) ( x ) ] P * ( f ) ( x )

c'est-s

P*(fln(d))(z) - ln(P*(f)(x))P*(f)(~:) > in ( P ' ( f ) ( * ) _ i t ( p , ( x / 7 ) ( x ) ) 2 ) P * ( f ) ( x )

En int~grant par rapport, s # en x, il apparait donc que

E n t ( m P ) _> f [ln(P*(f)) - ln((P*(~/-]))2)]P*(f) d# Ent (m)

ainsi en uti l isant l ' indgalit4 de concavitd

V a , b > 0 , ln(a) ln(b) > 1 - ( a - b ) a

on retrouve la majora t ion (8). De maniSre similaire le choix de t = Pf(z ) dans la section pr~cSdente n 'est pas

a priori le meilleur, cependant le problSme d 'opt imisa t ion en t n 'est plus alors aussi trivial (et d@end de l 'exposant q consid6r6).

Comme apphcation immddiate de la proposition 6, on obtient une vitesse de convergence vers l '~quilibre des chaines de Markov irrSductibles et ap$riodiques :

C o r o l l a i r e 7

Soit p une matr ice markovienne i rrfduct ible et ap6riodique. Alors pour route probabili t~ initiale m E P(S), tout k > k(p) et tout n C xW, on a

E n t ( m P '~) < (1 - a(I - PkPk*))l'#kJEnt(m)

o/1 L-J repr~sente la part ie entiSre.

En fait on aurait pu se servir de ce r6sultat pour montrer que (i) ~ (ii) dans la proposit ion 1, du moins si l 'on y suppose p sans point t ransient , car il permet de voir que si pour un k > 1, a(I - pkpk,) > O, alors on a unicitd de la mesure invariante.

Notons &galement que contrairement aux processus de Markov & temps continu, ici l 'entropie ne d&cro]t pas n&cessairement s tr ictement en dehors de l 'dquilibre #. Plus pr&cis&ment, par le cas d'6galit6 dans l'in&gafit~ de Jensen pour l 'appl icat ion str ictement convexe ~i~+ ~ x H x ln(x), il apparai t que E n t ( m P ) = En t (m) si et seulement si pour tout z E S fixd, la densit~ f = dm/d# est constante sur l 'ensemble {y E S/p*(z ,y) > 0} (ce qui dquivaut aussi & Ss_pp.(v/-f,v/-f) = 0), ainsi dans l 'exemple sur 2g,/n2g de la section 2, si on part d ' une masse de Dirac en 1, il faut a t tendre le temps n - 1 pour que l 'entropie commence & d$croltre s tr ictement s la prochaine t ransi t ion (car E n t ( m P ) = En t (m) ~quivaut ici & m(0) = 2m(n - 1)).

Page 16: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

151

S i p est une matrice ap~riodique irr~ductible telle que k(p) = 1, on pourrait conjecturer que

Ent (mp'~+ 1) _ Ent (mR ~) 2N ~ n ~--~

Ent ( m P ~ )

est une application d~croissante~ ce qui permet t ra i t de sortir du cadre d~ensembles d~ta t s S finis et obtenir en g~n~ral une d~croissance exponentielle de l 'entropie, mais avec une vitesse qui d~pend de la loi initiale m par l ' interm~diaire de la constante ( E n t ( m P ) - Ent (m) ) /En t (m) < 0. Cependant ceci est faux: consid~rons s nouveau

1 4 l 'exemple ci-dessus sur 2Z/n2~ avec n > 3 et prenons m = ~5,~_e + ~50, on v~rifie imm~diatement que En t (mP :) = En t (mP) < Ent(m). Quit te s consid~rer pour un

> 0 assez petit la matrice donn~e par

p(~, ~) +~ V x~y E S, p~(x,y) - 1 + ne

on obtient alors un contre-exemple ~ la conjecture prdc~dente.

5 A p p l i c a t i o n a u x a l g o r i t h m e s d e r e c u i t g 6 n 6 r a l i s 6 s

L'ergodicit~ forte en loi des algorithmes de recuit gSnSralis~s s temps discret, si la tempdrature d$crolt suffisamment lentement, est bien connue (cf. les articles de Hwang et Sheu [11] et [12]). Dans [14], nous avons pr~sent~ une preuve tr&s courte de ce r6sultat pour les ~quivalents de ces processus s temps continu (voir aussi la simplification donn~e utt~rieurement dans la section 2 de [t6]), tout en retrouvant la constante critique qui y apparMt, en ~tudiant l'~volntion de l 'entropie s l'Mde du comportement s basse temperature, donn~ par Holley et Stroock dans [10], de certaines constantes de Sobolev-logarithmiques. Nous allons voir ici comment les techniques d6crites dans la section pr6c~dente ~tendent cette d~monstration aux cas d'algorithmes s temps discret. Le r~sultat n'~tant pas original, la justification de cette section se trouve plutSt dans l 'espoir que la relative simplicit~ de la preuve lui permet t ra de s 'adapter s des situations plus complexes que l 'on rencontre dans la pratique.

On consid&re toujours un ensemble fini S muni d 'un noyau de probabilit6s de transitions p irr6ductible (pas n6cessairement ap~riodique), mais on suppose que l 'on dispose en plus d 'une fonction de cofit V, d~finie sur S • S priv~ de sa diagonale et s valeurs dans ~ + , compatible avec (S,p) (qui dans ce contexte est appel~ noyau de communication a priori) :

v �9 # y ~ s, p(~,y) = 0 ~:~ y(~,y) = +co

Pour /3 > 0 donn$ (repr~sentant l 'inverse de la tempSrature), soit p~ le noyau irrSductible d~fini par

f exp( -~U(~ ,y) )p (~ ,y ) , si �9 # y v~,v~s, P~(~'Y) = ~ 1 - E ~ p~(~,z) , sinon.

Pour ne pas consid~rer des situations homog&nes, on suppose que V n'est pas seulement s valeurs dans {0,+co}. Ceci assure que pour tout /3 > 0, il existe un x0 E S tel que p~(xo,xo) > 0 et donc que p~ est de plus ap~riodique.

Page 17: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

152

Si m0 E P ( S ) et une 6volution de l ' inverse de la temp6rature fl : zW ~ Z~+ sont donn6s, on notera X = (Xn) ,e lv une chaine de Markov inhomog~ne de loi initiale m0 et dont le noyau de probabilit6s de transi t ions s tout ins tant n E / N e s t p~.. Quand l '4volution fl est telle que lim,~__.oo fin = +oo, le processus pr6c4dent est appel6 un algorithme de recuit g6n6ralis6.

Pour donner des conditions d'ergodicit6 forte en loi de ces chMnes, il apparai t une constante c > 0 que nous al]ons main tenan t d6crire, mais il faut pour cela faire quelques rappels sur les probabilit6s invariantes #8 associ4es aux PZ pour /3 _ 0: il existe (volt le lemme 3.1 p. 177 de Freidlin et Wentzell [6]) deux applications p : S --* ~ + et U : S ---+ ~ + (appel6e parfois 6nergie virtuelle ou quasi-potentiel associ6 s ( S , p , Y ) ) , telles que pour tout x E S fix6, on ait pour fl grand,

~ ( ~ ) ~ p(~) e~p(-Zu(~))

Ceci montre no t ammen t que quand fl devient grand, les probabilit6s #8 convergent vers une certaine mesure #o~ dont le support est l 'ensemble des min ima globaux de U.

Pour x , y E S, soit C~.u l 'ensemble des chemins (dont les t ransi t ions sont permises par p) allant de x s y. Si q = (ql)o<_,<_n est un tel chemin, son 416vation est le nombre

{ max0<i<n(U(x~)+ V(z~,z~+l)) , s i n > 1 e(q) = U(z ) , s i n = 0 (et donc x = y )

(o~ on a convenu que pour tout z E S, Y ( z , z ) = 0 si p ( z , z ) > 0), et on pose

H ( ~ , y ) = rain e(q) q6Cz,~

cette quanti t6 4tant appel6e la hau teur de communica t ion de �9 s y (pour le triplet (S ,p , V)) . Enfin on note

c = m a x H ( x , y ) - U(x) - U(y) >_ 0 x,yES

Le r4sultat classique que nous voulons retrouver s '6nonce alors,

P r o p o s i t i o n 8

Supposons que l '4volut ion/3 satisfasse

l im ft , = +oo n ~ Jco~

l i m s u p f i n / l n ( n ) < 1/c n - - - * + o o

l imsupn] f l~+ l - /3 ,~ [ < +oo n---* q- oo

alors la loi de X , converge pour n grand vers #oo.

Bien que la proposit ion reste v4rifi4e dans le cas off e = 0, cette s i tuat ion n 'es t pas tr~s int4ressante en th4orie du recuit simul4 et on se restreindra d~sormais ~ c > 0.

Page 18: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

153

Exemple :

Une 6volution typique de l'inverse de la temp6rature qui satisfait ces conditions est celle donn6e par

V n E/N, /3~ = b -1 ln(1 + n)

avec b > c. Profitons-en pour pr~ciser qae ces conditions ne sont pas optimales, on pourrait d'ailleurs les ~tendre un peu en reprenant plus soigneusement la preuve qui suit, cependant il semblerait qu'aucune de ces g6n6ralisations ne puissent permettre de traiter le cas o~ pour tout n C ~V',/3, = c -1 ln(1 + n), or il est connu que cette 6volution assure 6galement la convergence en loi vers/too (cf. par exemple [17], mais il est s noter que la d6monstration est alors beaucoup plus complexe et passe par une 6valuation pr$cise des temps et positions de sortie de certains ensembles, car nous ne sommes pas arriv6 s la d6duire de l'6tude de l'6volution de fonctionnelles (comme l'entropie) d6finies sur 7~(S), et bien que la preuve soit donn6e pour des processus s temps continu, elle peut s'adapter au cas du temps discret). N6anmoins, notons que si l 'on prend pour tout n E ~W, fin = b -1 ln(1 + n), avec 0 < b < c, alors la conclusion de la proposition 8 est fausse, car on salt (cf. Hwang et Sheu [12] on [15] dont les rdsultats sont donn6s pour des algorithmes de recuit simul6 classiques s temps continu, mais qui peuvent 6galement s'6tendre s la situation d'algorithmes g6n6ralis6s s temps discret) que dans ce cas la loi limite d6pend effectivement de la loi initiale, et en ce sens, les conditions de cette proposition ne sont pas si mauvaises.

La preuve de cette proposition va se faire en plusieurs 6tapes. Tout d'abord, en reprenant les notations de la section 2, remarquons que k(pz) ne d6pend pas de/~ > 0, on notera d6sormais cette quantit6 k. Pour l > _k, soit A(I-P~P~*) la plus petite valeur propre non nulle de l'op6rateur I-P~P~*, qui est auto-adjoint darts L2(#~), c'est-s la plus grande constante A > 0 telle que

0o) vS m(s), ' ' * - - PjPj ) f d#n

Commen~ons par rappeler le comportement pour J grand de ce trou spectral, et pour ceci introduisons les quantit6s suivantes :

V x # y �9 S, W,(x,y) = - lim /3-11n((p~p$)(x,y)) f3~+or

puis

c(U, W,) = max min max (V(q,) + W,(q,,q,+l)) A (U(q,+l) + Wl(qi+l,q,)) x,yES q:(qi)0<i_<nESz,y O<_i<n

o6 S~,~ repr6sente l'ensemble des suites finies de S dont le premier 616ment est x et le dernier y.

L e m m e 9

I1 existe une certaine constante K > 0 assez grande, telle que pour tout / 3 > 0 ,

K -~ exp(-c(U, Wl)fl)< ) ~ ( I - PJPJ*)< Kexp(-c(U, Wl)~)

La majoration est donn6e s titre indicatif, car elle n'est pas n6cessaire s la preuve de la proposition 8.

Page 19: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

154

D ~ m o n s t r a t i o n :

I1 s 'agit 1s d 'une estimation classique, d~s que l 'on a remarqu~ que U est la fonctionnelle des grandes dSviations satisfaites pour/3 grand par la mesure invariante de ~l l. t-~Po, car celle-ci n'est autre que #~.

Pour la minoration, on renvoit s la preuve pr6sent& dans [14], qui adapte celle de Holley et Stroock [10] donn& dans te cas d'algorithmes de recuit elassiques r&ersibles et bas& sur des in6galit& de type Poincar6 (plus pr&is6ment, on utifise ici que pour tous x r y E S tels que Wl(x,y) < +o% il existe ~t(x,y) > 0 tel que pour /3 grand,

y) ~ y) y))). Pour la majoration, on peut figalement reprendre la d~monstration de ttoUey et

Stroock [10] qui est has& sur le choix d'une bonne fonction f dans (10): soit C un cycle relatif s la fonction de cofit Wt (voir Hwang et Sheu [12] pour une d$finition r&ursive des cycles, ou la section 3 de [17] qui les fait apparal tre comme les traces sur S des cycles usuels relatifs s la structure de Hajek virtuelle associ& s (S, ill, Wt), qui est une notion d6finie un peu plus loin)~ dont te compl$mentaire contient au moins un des minima globaux de U et qui est de hauteur de sortie maximale parmi ceux- ci. Cette hauteur de sortie de C vaut alors c(U, Wl) et il suffit de prendre pour f l ' indicatrice de C dans (10) pour obtenir la majoration escompt&.

[]

Pour tous x ~ y E S, notons

Hv, w,(x,y) = rain max V(qi) + Wz(qi,qi+l) q=(ql)o<i<nE S.,~ O<i<_n-1

et remarquons que

(11) min + Wl(ql,qi+l) ) /~ : q=(q,)o<,<.~5..,on~_~<,(U(q~) (U(q,+l) + Wt(q~+a,qi)) Hv, wz(x,y)

car puisque /~0 est r~versible pour le noyau t t, p~po, on a pour tous z,z' E S, U(z) + Wl(z,z') = U(z')+ Wt(z', z) (n~anmoins il est connu que l'~galit~ (11) ci-dessus est toujours satisfaite, m~me si #~ n'avait ~t~ qu'invariante).

L '&ape suivante est cruciale et consiste s trouver un k _> 1 tel que

c(Wk, U) =

Pour d&rire cet entier, on va faire quelques rappels sur la structure du paysage d'~nergie associ~ s la fenction de cofit V.

On dit que x E S est un minimum local, si et seulement si pour tout y E S tel que U(y) < V(x), on a H(x,y) > U(x), ainsi notamment les minima globaux de U, qui sont ceux qui annulent cette application, en sont. I1 ne s'agit pas 1s d 'une notion de minima locaux pour U (bien que ceux-ci en soient tous) , mais par rapport s une fonction U qui prolonge natureUement V sur un graphe (S,~) qui lui m~me &end canoniquement le graphe (S,p) , comme on l 'a d~js pr~sent~ dans [17]: Pour tous x 7~ y E S tels que p(~,y) > 0, soit x .y un nouveau point n 'appar tenant pas S. On prend alors

- - - - S ~ l { x - y / x ~ y E S t e l s q u e p ( x , y ) >0}

Page 20: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

155

et

Z, Z t �9 S~

p(z, z') , si z = z' E S , s i z � 9 z ' = z . y , p o u r u n y � 9 , s i z = x . z ' e t z ' � 9 p o u r u n x � 9 S , s i n o n

puis v z e ~, ~ ( z ) = { v ( ~ ) , si z E s

u(z ) + v ( z , y ) , si z = z . y , avec x , y E g

Cependant, si V d6rivait ddjs d 'un potentiel U satisfaisant la condition de r6versibilit6 faible de Hajek, c'est-s si pour tous z ~ y �9 S tels que p(z , y ) > 0, on a V ( z , y ) = (U(y) - U(z))+, et si en posant pour tous z ,y �9 S,

H~(x , y ) = rain max ~'(qi) q=(q,)0<,<~e r 0_<i_<n

on a que H~ est sym6trique en ses deux arguments, alors cette construction est en fair inutile, car son but est de ramener d 'une certaine maniSre toutes les situations s celle-ci.

Revenons au cas g6n6ral, il apparMt que H correspond s la hauteur de communica- tion classique relative au potentiel U (i.e. la restriction s S • S de H~, qui elle est

d6finie sur S • S), et on a vu dans [17] que cette application b- satisfaisait une condition de r6versibilit6 faible de Hajek (sur (S,:~)), ce qui permit de retrouver que H est sym6trique en ses deux arguments (ce r6sultat est dfi initialement s Trouv6, cf. le lemme 1.33 p. 34 de [20], qui l 'a prouv6 par une m6thode diff6rente). En consdquence, (S,/5, U) sera appel~ la structure de Hajek virtuelle associ6e s (S,p, V).

Notons L 1'ensemble des minima locaux (qui est donc la trace sur S de l 'ensemble des vSritables minima locaux de U sur S), sur lequel on introduit une relation d'6quiva- lence M par

V x , y E L, x N y r H ( x , y ) = U(x) = U(y)

Appelons C 1 , ' " ,C, les classes d'6quivalence correspondantes. Du fait de l 'hypo- th~se faite sur V, pour tout 1 < i < 8, il existe au moins un x �9 Ci tel que pour tout fl > 0, p~(x, x) > 0. On notera Ci leur ensemble.

Soit q = (q~)0<~<n un chemin (on d6signera d6sormais par chemin, une suite finie d'~16ments de S dont routes les transitions sont permises par les p~, pour/3 > 0, et non pas seulement par p, c'est-s que Fon admet 6ventuellement certaines transitions suppl6mentaires qui restent en un mSme point, et pour tout x E S, on conviendra d'ailleurs que V(x, x) = 0 ou Y(x , x) = +0% suivant que pl(x, x) > 0 ou pl(x, x) = 0), on dira que q est descendant (respectivement montant) si

V 0 < i < n, V(qi,qi+l) = 0

(resp. si pour tout 0 < i < n - 1, U(q~) + V(ql,q~+a) = U(qs Notons, en utilisant que pour tous x # y E S tels que p(x ,y ) > 0, on a U~x . y ) > U(x) V U(y), que les chemins qui leur sont canoniquement associ6s dans (S,~Z) sont effectivement descendants (resp. montants) pour U, sauf 6ventuellement la premiSre (resp. derniSre) transition. Si V d6rivait dSj~ d 'un potentiel de Hajek, descendant (resp. montant) signifiera v6ritablement d6croissant (resp. croissant) pour le potentiel.

Page 21: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

156

I1 est clair (en t ravai l lant par exemple sur ( S , : ~ ) ) , que pour tout x C S, il existe au moins un chemin descendant (resp. montan t ) issu de x et about issant s un 61~ment de C1 [ 2 . . . [2 C, (resp. pa r t an t de C~ L2.. . U C, et about i ssan t en z). Notons D(x) (resp. m ( x ) ) l ' ensemble des ~16ments de C~ tA . . . tA C, pour lesquels il existe un tel chemin descendant (resp. montant ) . Sur l ' exemple simple suivant on volt qu' i l se peut que D(x) et M ( x ) soient diff~rents :

On a S = {Xo, x l , x2, xa, x4} et les fl~ches d~signent les t ransi t ions s t r ic tement posit ives pour p (routes ici de valeur 1), les autres t ransi t ions 6tant nul]es. De plus, la fonction de cofit V d4rive du potent ie l de Ha jek dont les valeurs sont indiqu~es en ordonn6e. Avec ces d6finitions il appara i t que D(x4) = {xo} et que M(x4) = {x2}. On pour ra i t d 'ai l leurs remplacer xa et x4 par un seul point , mais on les a distingu6s pour que cet exemple puisse aussi servir dans la remarque (b) de la fin de cet te section.

Revenons au cas g6n~ral, pour tous x C S et y E D(x) (resp. y C M(x ) ) fix6s, consid4rons C(,d 2 (resp. C ~ ) ) l ' e n s e m b l e des chemins descendants (resp. montan t s ) aUant de :c s y (resp. de y s x) qui sont d'616vation minimale parmi de tels chemins. Rappelons par aJ_lleurs que la longueur d 'un chemin q = (ql)0_<i_<,~ est d6finie par l(q) = n e t notons

d(x ,y) = min l(q) ~g(d)

m ( y , x ) = min l(q) q~e(,5 )

On pose ensuite provisoirement

k = max d(x,y) zES, y~D(x)

P r o p o s i t i o n 10

On a c(Wk, U) = c, ce qui impl ique que k _> _k, et ainsi il existe une constante K > 1 teUe que

V/3 > 0, g -1 exp ( -c /3 ) < ~ ( I - Dk k., _ _ ,~P~ ) <_ Kexp( -c /3 )

D ~ m o n s t r a t i o n :

Pour tous x E S e t y C D(x ) , il existe au moins un chemin de ~!a) de longueur x j y

k , qui t te s obliger le chemin s res ter plusieurs pas en y. Choisissons un tel chemin que l 'on notera dSsormais q(a)( ,y)x = (q,!d)(x, y))0<~<k_ �9 I1 sera commode aussi de faire

Page 22: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

157

intervenir son retourn$ ~(d)(y, x) = (q(ka)(x, Y))0<i_<~, qui n 'es t plus n$cessaJrement un chemin au sens pr~cSdent.

Rappelons Sgalement que si q = (ql)0<i<k est une suite de k 41$ments de S, sa valuation par rapport & p/3 (resp. p~) est la quanti t$

k-1

v/3(q) = 1-I P/3(ql,qi+l) < P~(qo,qk) i=0

(resp. v*~(q) k-1 , = 1]i=0 P/3(qi,q~+l) <- P*~k(qo,qk)). Ainsi pour les valuations vz(q(a)(z,y)) et v~(~(a)(y,x)), on a l e compor tement

suivant pour ~ grand :

~/3(q(~)(~, y))

~;(~(~)(y, ~))

~ e~p(-gV(~, q~)(~, y)))~(~)(~, y) = exp(-9[~(q(~)(~, y)) - u(~)])~(~)(~, y) = #/3(~)~(q(~)(~,y))/~/3(y)

exp(-~[e( q(a)( x, y ) ) - U(y )])§ x)

off r(d)(x,y) et § x) sont des quantitSs s tr ictement positives.

Ceci nous amSne s considSrer une nouvelle fonction de cofit 12d (non n4cessairement compatible avec (S,p)) dont l'intSr&t appara l t ra par la suite et qui est d4finie par

V z # y c S , e(q(d)(x,y)) -- U(x)

r162 = ~(q(~)(y,~)) - u(~) +cr

, s i y E D(x) , si x E D(y) sinon

que l 'on prolonge sur la diagonale de S x S par W(x , x ) = 0 ou W ( x , x ) = +c~ suivant que �9 E C'~u . . . u O , ou x ~ C1 u . . . u C , .

Par ailleurs, pour tous x # y, soit

W ( ~ , ~ ) = - hm ~ - l l n ( p ~ ( x , y ) ) /3--*+00

= ra in V ( ~ , Xl) -[- V(Xl , x2) ~ - . . . - [ - V ( x k _ l , y ) Xl ,...,xk_t Es

Du fait que pour tous z,z ' E S, U(z) + V(z, z') > U(z'), on s'aper~oit sur cette derni~re expression que

A V x ~ y E S, W(x , y ) > H(x ,y ) - U(x)

Remarquons dgalement que pour tous x r y,

W(x , y ) = min W ( x , z ) + U(y) + W(y , z ) - V(z) z E S

off d4sormais W d4signe Wk. En uti l isant que pour tout z C S fix~, on a

A A w ( x , z) + u (y ) + w ( y , z) - u(~) > H ( x , z ) - U(x) + H ( y , z ) - U(z)

= H ( x , z ) + H ( z , y ) - U(z) - U(x)

> H ( ~ , u ) - U ( x )

Page 23: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

158

il apparai t que l 'on a aussi

(12) V z , y E S, W ( z , y ) > H ( z , y ) - U(z)

D'apr6s les inggalit6s H ( x , y ) < g ( z , z) V H ( z , y ) , valables pour tous x , y , z E S, et (12), il est clair que Hu, w k H (en convenant comme d 'habi tude que pour tout z E S, Hu.w(ze, z) = U(a)). Mais v6rifions qu'en fait on a une 6galit6

Hv, w = H

En utilisant que l im~+~r -1 ln[v,(q(d)(y, y))] = 0 = lim~--+oo/~-1 ln[v;(~(a)(y,y))]

pour tout y E C1 U . . . U C,, il apparait facilement que W _< l~, d'ofl Hu, w < Hu.W (cette derni~re application ~tant d6finie de mani~re similaire, avec 12d remplaw W), et on peut donc se contenter de montrer que Hu.V v < H.

Par construction des quanti%s p%c6dentes et en se ramenant sur (S,/~), il suffit de voir que si une fonction de cofit V d~rive d 'un potentiel U satisfaisant la condition de Hajek sur un graphe ir%ductible (S,p) , alors pour tous z # y E S, il existe une suite finie q = (ql)l<~_<~ E S=,y qui soit une succession de chemins %ritablement descendants s des minima locaux (pour U) et de retourn~s de tels chemins s part ir de ces minima locaux et telle que

max U(q,) = Y ( x , y ) o ! i ! ~

Pour ceci, notons pour tout 1 < i < s, A~ ]e domaine d 'a t t ract ion de Ci, c'est-s dire l 'ensemble des x E S tels que D(x)MC~ # 0. Soit ~ = (qj)0<j<,~ E C~,~ un v6ritable chemin tel que e(~) = H(x , y). On construit q s part ir de (~ de la mani~re suivante: soit 1 < i o < s t e l q u e x E A 4 et soit m0 = max{0 < j < m / V 0 < l < j , ql E Ai~}. On peut alors remplacer le tronqon (~)0<~<,~0 par une descente/t part ir de z en C~ 0 suivi du retourn~ d'une descente de q-~o en Ci 0. Ensuite si m o = m c~est gagn6, et sinon il existe 1 ~ il < s tel que q-~0 E A~ et tel qu'en posant ml = max{too < j _< m / V mo _< I _< j , ~ ~ A4o}, on air m x > mo (ceci provenant du fait que I'on a n6cessairement U(~,,~o) > U(~,~0+l) ). On remplace alors le t ra je t (~j),~~ par une descente en Ci~ suivi du retourn6 d'une autre telle descente. En procfdant ainsi, on finit par arriver en y, d'ofi l 'existence de q qui est la concat6natlon de ces suites finies de descentes et de retourn6es de descentes.

L'identit6 Hu, w = H implique alors par le biais de (11) que c(U, W ) = c.

[]

Si l 'on avait pos6 k = max re(y, x)

reES, yEM(~)

en travaillant plut6t s part ir des chemins montants et de leur retourn6s (ce qui amine introduire pour x E S e t y ~ M(x ) , des q(m)(y,x) et des ~l(~)(x,y)) et des domaines

de r~pulsion des Ci, R, = {~ E S, / M ( x ) M Ci r 0} (en fait plutSt ceux associfs s la structure de Hajek virtuelle), on montre d 'une mani~re similaire que pour une certaine constante K > 1,

V f / > O, g -~ exp( -c f l ) < ~(I - P~*P~) < K exp(-c/~)

Page 24: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

159

I1 reste s utiliser que A(I - P~P~*) = A(I - P~*P~) pour conclure que

(13) V/3 > 0, K -1 exp(-c/3) < A(I - P~P~*) <_ g exp( -c f l )

est toujours v6rifi6 avec k d6fini par

(14) k : ( max d ( x , y ) ) A ( max m ( y , z ) l \a:eS, yeD(a:) \a~eS, yeM(a~) ]

ce qui admet aussi pour cons6quence que k > k.

Soit ct(I P~P~') la constante de Sobolev-logarithmique associ6e g l 'op6rateur I - P~P~*, c'est-s la plus grande constante a > 0 telle que

V f < .T'(S), e~/f21n(f=)dg,<_ff(I-F~P~*)fdg, Un calcul de Holley et Stroock (cf. le th~or6me 3.21 p. 568 de [10]) permet de

d6duire de la minoration de A(I - P~P~*) dans (13) et du comportement pour /3 grand de #z, qu'il existe une constante K > 0 assez grande, teUe que

v / 3 >_ 1, ~(I - P~p~') > K-1/3 -~ e x p ( - c g )

(plus simplement encore et d~une mani~re peut-6tre plus explicite, ceci d4coule aussi du coroUaire 5.4 de l 'appendice de Diaconis et $aloff-Coste [4]).

D'autre par G la constante de Sobolev-logarithmique 6tant toujours major6e par la moiti4 du trou spectral de I 'op6rateur sym&rique consid6r6 (voir par exemple Diaconis et Saloff-Coste [4]), on a en fin de compte un encadrement de la forme

(15) v Z > 1, K < / 3 - 1 exp( -e /3 ) _< ~(~ - P~P~') < g e x p ( - ~ Z )

(notons que l 'appendice de Diaconis et Saloff-Coste [4], qui donne une expression exacte pour la constante de Sobolev-logarithmique dans le cas off S n'est constitu6 que de deux points, permet de voir que l 'on ne peut pas esp&er avoir en g4n6ral une estimation du type (13) pour a(I - P~P~*), mais que la minoration (15) est du bon ordre).

On a donc prouv6 l 'est imation suivante :

P r o p o s i t i o n 11

Si k est l 'entier donn6 par (14), on a

hm f l - l l n ( a ( i ~ t,, - e ; e ; )) = - c B~+~

Remarquons que de la m6me mani~re, on montre que l im~+o~/3 -1 ln(a(I-P~*P~)) = - c , ce qui aurait pu 6tre int6ressant si on avait cherch6 s utifiser plut6t l 'hypercon- tractivit6, dans l 'esprit de Concordet {2], ce qui permet plus pr6cis6ment de montrer que la densit6 converge vers I et de donner des estimdes de la vitesse de convergence.

Des arguments standards de comparaisons permettent d'6tendre ce r4sultat, mais introduisons d 'abord l 'ensemble suivant :

Page 25: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

160

(on a aussi, puisque pour tout x E S l 'apphcation ~ + S ~ ~ p~(x ,x ) est soit constante soit strictement croissante, R = {x E S / B 13 _> 0 avec ps ( x , x ) > 0} = {~ ~ s / v / 3 > 0,p~(~,=) > 0})

Supposons maintenant que Fon dispose de k (qui dSsormais ddsignera la constante d$finie ci-dessus) matrices markoviennes p(1, t ) , . . . , p(k, t) dSpendant d'un param&tre t _~ 0 telles que pour une certaine fonction/3 : ~ + --* ~ + v~rifiant limt~+o~/3t = +or on ait les limites suivantes pour tout 1 < i < k,

Y x ~ y E S, l i m t ~ + ~ / 3 t l l n ( p ( i , t ) ( x , y ) ) = - V ( x , y )

(16) v = ~ s , nm~+~/3;1 ]n(p(i, t)(~, =)) = { 0 , si �9 c ~ - c ~ , si x C_ R

Posons

a [ I - P ( 1 , t ) . .. P ( k , t ) ( P ( 1 , t ) . . . P(k, t ))*] = inf $z-P(1,t)...P(k,t)(P(1,t).. P(k,t))*(f, f ) fes\v~ct(~) s

avec fit la probabilit4 invariante de p(1, t ) . . . p(k, t) (qui intervient aussi dans la forme de Dirichlet au num4rateur comme mesure d'int4gration et dans la d4finition de l'adjoint qui est compris ici dans L~(fit)), qui est bien d4finie du moins pour t assez grand.

Le r4sultat suivant se base sur la proposition 11 pour la g4n4raliser.

P r o p o s i t i o n 12

Les constantes de Sobolev-logarithmique pr4c4dentes satisfont

lira /3 l l n ( a [ I - P ( 1 , t ) . . . P ( k , t ) ( P ( 1 , t ) - . - P ( k , t ) ) * ] ) = - c t ~ § t

D 6 m o n s t r a t i o n :

I1 suffit de vSrifier que

t ~ n ~/3~_11 n ( a [ I - P(1, t)..._al ~-P(k't)(P(I*'t)'''P~,P~,~ P(k , t ) )* ] ) = 0

Cependant la condition (16) permet de voir que

v =,y c s, ,~§ = t ~ /3;~ ln((p~,)(~,y))

Par la formule de Freidlin et Wentzell pour la mesure invariante, il apparait alors que

(17) v ~ c s, ,~§ ]n(~) = t ~ ~-~ ln(~,,) = -Y(~)

En consdquence, on a donc 6galement pour tous x ,y E S,

lim /3-1 ln((p(1, t ) . . . p(k, t))*(x, y)) = t~m/3 t -1 ln(p~:(x, y)) t ~ - F o o t

et

(18) lim fit -~ ln( [p(1 , t ) . . .p (k , t ) (p(1 , t ) . . .p (k , t ) )*] (x ,y) ) t ~ + o o

lira /3~ k k, = ln([p~,p~ ](x, y)) t ~ + o o

Page 26: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

161

Grs s (17) et (18), via une application de l 'argument de comparaison du lemme 3.3 de Diaconis et Saloff-Coste [41, on obtient le r4sultat annonc4.

[]

Nous pouvons maintenant appliquer les calculs de la section pr4c6dente. On consi- dTre donc une chaine de Markov inhomog6ne X v4rifiant les hypoth6ses de la proposi- tion 8 et soit 0 < r < h fix4.

Pour simplifier les notations, convenons de poser pour tout n C IW, ~ . la loi de Xk.+. , ~ . la matrice produit p~ .+ . �9 ..pn,.+a+~_~ et ~ . la probabilit6 invariante qui lui est associ4e. Notons que pour n grand, on a aussi

V * ~ S, Z. (*) ~ p ( x ) e x p ( - ~ . + ~ U ( * ) )

En effet, il est facile de voir, d'apr~s la troisi6me condition de la proposition 8, que les entr4es des matrices ~,~ et pk ~.+~ ne difI~rent que de facteurs de la forme (1 + O ( 1 / n ) ) (du moins d~s que /3k,~+, > O, car sinon, si de plus &,~+k+,-1 > O, il se p e u t que pour u n x ~ S , o n ait (p0k)(x,z) = 0 et i~n(x,x) > 0), ainsi par la formule explicite de la mesure invariante donn4e par Freidlin et Wentzell, il apparalt , en consid4rant #n~+, comme la mesure invariante de P~k~+~, que pour n grand, on a

(19) V x �9 S, ~. (x) = #/3,~+.(x)(1 + O(1 /n) )

d'ofl l'4quivalence annonc4e, et d'apr&s la premi&re condition de la proposition 8, le fait que

~p(x) , s i U ( z ) = 0 (20) V ~ �9 S, lim ~,,(x) = #o~ = 1.0 sinon. n - - - e o o

Mais on peut d4duire de (19) un autre r4sultat qui nous sera fort ut i le: en effet, de la re&me mani&re, on prouve que pour n grand,

v ~ �9 s, ~,~.+,~+.(~) : ~,.+~(~)(1 + o(11~))

et puisque pour tout x �9 S, ff~+l(z) = / ~ l . + , / + . ( z ) ( 1 + O ( 1 / n ) ) , on obtient que

v �9 �9 s, ~ " + ' ( ~ ) - a + o (un) ~(~)

puis que

in O(1/n)

o,~ I1" I1~ repr~sente la n o r m e u n i f o r m e sur re(m). D'autre part , pour n E /N, appelons ~ . la constante de Sobolev-logarithmique

associ4e s l 'opTrateur I - P.~P* :

E1 ~ ~* ( f , f ) ~ = inf - ~ ~

f~s=\v,~t(i) s

Une application de (12) montre que

(21) l i m -1 ~ 3 ~ n + , i n ( a N ) -- - c

Page 27: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

162

ce qui combin6 avec la seconde hypoth~se de la proposition 8, donne

l iminf ln(a~) l iminf ln(kn + r) /3kn+. l n ( a . ) - > - 1

.~o~ In(n) n - = in(n) ln(kn + r) 9k.+.

En notant 7 = - ( f i m i n f . _ ~ l n ( & ~ ) / l n ( n ) - 1)/2 < 1, il existe done deux cons- tantes no > 0 et K > 0 telles qua pour tout n > no, &,~ >_ K / ( n + 1) ' . On peut d'ailleurs prendre no = max{n E PC-//3k.+. = 0} + 1 (ou no = 0 s i c e t ensemble est vide) et trouver un K > 0 correspondant, et comme on peut supposer /3 s valeurs dans _~+ pour ce qui nous int6resse, on prendra ci-dessous no = 0.

Nous disposons d6sormais de routes les estimations n6cessaires s l '~tude de l'6volu- tion de l 'entropie E n t ( ~ . I ~ ) . On aura remarqu6 que pour prouver la proposition 8, il suffit, par le biais de la majorat ion (2) et de (20), de voir que lim,~oo Ent(~,~l~,~ ) = 0 (pou. tout 1 < r < k fix6), Pour ceci, on 6crit

Ent(~ .+~ J~.+~) - Ent(~. l~.~ ) = E n t ( ~ . + ~ l p = + j - Ent(~,~+~l~.~)

Pour 6valuer la premi&re diff6rence du membre de droite, notons que

d~f a~ = [Ent(~,~+~l~=+~) - Ent(~,~+~l~,~) I

< In (fi'~+----~l ] o ~

K' < - n + 2

pour tout n E/TV, pour un bon choix de K ' > 0. Quant s la seconde diff6rence, d'apr$s la section 4, on a

E n t ( ~ + ~ l ~ . ) - E n t ( ~ . [ ~ . ) < - & . E n t ( ~ . I ~ . )

d'o~ en fin de compte, en posant pour tout n E ~W, b. = 1 - ~ > 0,

__< b, E n t ( ~ , l ~ , ) + a ,

< a,~ + b,~a,~_a § bnb,~_~a,_2 + . . . + bnb,~-a'" .b~ao § b,~bn_~.. "boEnt(~o]fi0)

I1 reste done & voir que cette derni6re expression tend vers 0 pour n grand. On utilise pour ceci les in6galit6s

b, = 1 - a. <_ e x p ( - ~ , ) _< e x p ( - / ; / ( n + 1) ' )

qui permettent de voir pour tout 0 _< j <_ n,

b, . . . b~ < e x p ( - K ( ( n + l ) - ' + . . . § 2 4 7 < e x p ( - K ( 1 - 7 ) - l ( ( n §

On est done ramen6 s voir que

lim exp(-K(1-7)-t(n+2)'-')[L 1 exp(K(l_7)_l(j+2)~_,) ] = 0 n~oo [~=0 J + 2 l

Page 28: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

163

et pour cela on majore la somme entre crochet par l ' int6grale suivante (car l 'appl icat ion ~ + ~ t ~ e x p ( g ( 1 - 7)- l t l -~) / t est d6croissante puis croissante), que l 'on int~gre par parties

/ ,+3 1 exp(K(1 - 7)- l t l -~)d t 7

= / .+3 1 1 exp(K(1 - 7)-1t 1-~)dt J1 t 1-~ t ~

*-n+3

= K - l ( [ t " - ' exp(K(1 - 7 ) -1 t1 - ' ) ] ?+~+ (1 - V)/1 t ' - 2 exp(K(1 - 7 ) -1 t 1 - ' ) dt)

Choisissons A > 1 tel que K(1 - 7 ) - l A 1-v > 2 et 6crivons que

f ~+~ i K-I(I -v) -- exp(K(1 - ~)-it'-~) dt

J1 t 2-~

J~l 1 fn+3 ~ exp(K(Z- ~y)-1t1-5') dt 1 e~p(K(1 - ~ ) - ' t ~-~) dt + ~ ~1 < K-~ (1 _ ?) t2_--W

ce qui fait apparai t re que pour une certaine constante K " > 0,

fl '~+3 1 exp(K(1 - ?)- l t l -~)d t < g " + 2K- ' 1

(n + 3) 1-~ exp(K(1 - ~)-'(n + 3) 1-~)

puis que pour n grand,

[ ] ( ') 1 exp(K(1 - 7 ) - 1 ( j + 2) 1-~) = (9 e x p ( - K ( 1 - 7)-I(n + 2) 1-~) s j - - ~ j=o

(et en 6tant un peu plus soigneux, il est possible de voir que le membre de gauche multipli6 par n 1-~ tend pour n grand vers K - l ) , d'ofi le r6sultat annonc6, et une majora t ion de la vitesse de convergence.

Remarques :

a) Rappelons que les algorithmes de recuit simul6 classiques sont ceux pour lesquels il existe une mesure # telle que le noyau a priori p soit r6versible par rapport s # et pour lesquels V d6rive d ' un potentiel U.

Dans cette s i tuat ion un encadrement de la forme (15) est en fait valable pour a(I - P#P~). En effet, comme d 'hab i tude par les techniques de Holley et Stroock, on se ram~ne ~ une est imation du trou spectral A~ de I - P~P~.

Or ici, il appara~t que la mesure i n v a r i a n t e / ~ est la mesure de Gibbs donn6e par

v �9 ~ s, #~(=) = e~p(-fiu(~))t*(~)

et que p~ est r6versible par rapport s cette mesure, mont ran t ainsi que P~ = P~. On en d6duit que 1 - A~ est la plus grande valeur propre de PJ diff6rente de 1. Or

d'apr&s les calculs qui pr6c&dent, il existe k E ~W* tel que la plus pet i te valeur propre non nulle A~ de I - OkOk* = I - p~k satisfasse pour une certaine constante K > 1, u n encadrement de la forme

Y/3 _> 1, K -1 exp ( - c f l ) <_ A~ _< K exp(-c /3)

Page 29: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

164

Mais en uti l isant que routes les valeurs propres de PJ sont positives, il appara l t que pour /3 grand,

et il en dfieoule qu' i l existe une aut re constante K > 1 telle que

(22) V fl _> 1, ~ - - I e x p ( - e ~ ) < AS _< g e x p ( - c f l )

Frigerio et Grino (voir les ~quations (2.12) et (2.13) de [7]) amrment qu' i l est aussi possible d 'ob ten i r d i rec tement (22) A par t i r des calculs classiques de Holley et Stroock. Cependant remarquons que si l 'on note pou r /~ >_ 0, - 1 _< Al(f~) _< . . . _< )'c~ra(s)-~(fl) < Ar = 1 les valeurs propres de ps (Vec t ( l ) fitant l ' espace propre associ~ s 1 = Ar les es t imat ions de [10] por tent sur 1 - A~,a(s)-~(f~), or on

A2 a A s = 1 - ( r V A~(r et il faudrai t encore connai t re le compor tement de 1 + ~ ( 9 ) .

Mais montrons que celui-ci n 'es t en fait pas g~nant, car

lim 1 + AI(/~) > 0 B~+~

En effet, soit p:r la mat r ice markovienne l imite pour /3 grand des PC, par un rgsultat usuel de pe r tu rba t ion (cf. Ka to [13], th~or~me 5.1 p. 107), A~(fl) converge vers la plus pe t i t e valeur propre de p ~ pour /3 grand (m~me si p~ n 'es t plus n~cessairement diagonal isable , cont ra i rement ici aux ps, on aura not6 que les valeurs propres de p ~ restent %elles). I1 suffit done de voir que - 1 n 'es t pas valeur propre de p ~ . Pour ceci consid6rons par l ' absurde un vecteur propre f E ~ ' (S ) \ {0} associfi. On a donc pour tout n E P( ,

(23) P s = ( - 1 ) ' /

Or remarquons que les classes de r6currences de p ~ sont exac tement les classes d 'dquivalence pour la relat ion N dans L, i.e. les C1,. . . ,C, . Posons pour tout 1 _< i _< s, p(~) la res t r ic t ion de p ~ ~ C~, il s 'agi t de matr ices markoviennes i r r6duct ibles et apdriodiques (car pour tout x E C~, p~(x, x) > 0). On note ra # ~ les probabi l i t6s invariantes associ6es (sur Ci). Alors, pour tout x E S fix6, on a

lira e ~ f ( x ) = ~ 3q(x)#~)(f) n ~ o o

i = 1

off pour tout 1 < i < s, les l imites suivantes existent bien

3',(x) = lim T FL(Ic,)(x)

Ainsi en vertu de (23), ( - 1 ) ~ f doit converger pour n grand, c 'est-s que f = 0, ce qui est la contradic t ion recherchSe.

b) Souvent on peu t aussi prendre un k plus pe t i t que celui donn~ par (14) tout en 6tant assu% d 'avoir encore (15). Par exemple , pour x E S, 9 E D(x) et q E C~(au), soit j(q) la plus grande longueur d 'un sous-chemin de q qui, en dehors de ses points de d@ar t et d ' a r r i%e , ne rencontre pas R = {z E S/p~(z , z) > 0}, posons ensui te

d(x,y) = m!~) j (q) qEC~,y

Page 30: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

165

et d~finissons de mani~re similaire re(y, x) pour x E S e t y ~ M(x) . On peut alors prendre dans les preuves pr~c~dentes le k construit comme dans (14) mais s part ir de ces nouvelles quantit~s. N~anmoins re&me celui-ci n'est pas minimal en g~n~ral, comme on peut le voir sur les algorithmes de recuit classiques.

On pourrait conjecturer que l 'on a toujours pour une certaine constante K > 1,

V ,8 > O, K -1 exp(-c/3) <_ , ~ ( I - P~P~*) < K exp(-c,8)

mais c'est faux: En effet, considSrons un triplet (S,p, V) tel que _k > 1, par exemple celui donn6

par une figure pr6cSdente. On rajoute s S u n point y qui n 'y appartenai t pas, et on pose S = S U {y}. Soit x0 E S tel que U(xo) = 0 et tel qu'il existe x~ E S avec 0 < V(xo ,x l ) < +er On d~finit un noyau de probabilit6s de transitions ~ par

V x ,y E S,

p(~,y) p(~ ,y ) /2

~(x ,y) = 1/2 1 /card(S) 0

, si z , y E S, avec z ~ s0 , s i x = x 0 et y E S , s i x =Xo et y = , s i x = ~ - e t s i y E S

sinon.

Pour K _ O, on munit (S, fi) de la fonction de cofit VK d~finie par

V ( x , y ) , si x , y ~ S - - K , s i x = x c e t y =

V z # y e S , VK(X,y) = 0 , si x = ~ et si y E S

+oo , sinon.

Par la formule de Freidlin et Wentzell, il apparai t que si K est assez grand, alors la restriction s S du quasi-potentiel U de (S,~, VK) n'est autre que U et que U(~) = K. Par ailleurs, sur l 'expression de c, il est clair que cette constante sera aussi celle associ6e s (S,~, VK), quitte s prendre K encore plus grand. Or on se convainc facilement, puisque k_ > 1, que pour tout C > c assez grand, on peut choisir K toujours plus grand (et plus pr6eis6ment, pour C grand, K et C seront 6quivalents) de mani~re s ce que A(I - PzP--~) soit de l 'ordre de e x p ( - C f l ) (au sens d 'une minoration et d 'une majoration du type (22)) et non pas de l 'ordre de exp(-c~3), ce qui fournit le contre- exemple cherch&

Pour d 'autres remarques sur les preuves de cette section et tout particuli&rement sur les mani~res d'affaiblir la seconde condition de (16) tout en gardant le b~n~fice de la proposition 12, on renvoit s la pr~publication 07-96 du Laboratoire de Statistique et Probabilit~s de l 'Universit~ Toulouse III qui correspond s cet article.

R ~ f ~ r e n c e s

[1] D. Bakry. L'hypercontractivit~ et son utilisation en thdorie des semigroupes. In P. Bernard, editor, Lectures on Probability Theory. Ecole d'Etd de Probabilitgs de Saint-Flour XXII-1992, Lecture Notes in Mathematics 1581. Springer-Verlag, 1994.

[2] D. Concordet. Estimation de la densit~ du recuit simul& Annales de l'Institut Henri Poincar(, 30(2):265-302, 1994.

Page 31: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

166

[3] P. Diaconis and L. Saloff-Coste. Nash inequalities for finite Markov chains. A paraitre dans Journal of Theoretical Probability, 1992.

[4] P. Diaconis and L. Saioff-Coste. Logarithmic Sobolev inequalities for finite Markov chains. Pr6print, Octobre 1995.

[5] J.A. Fill. Eigenvalue bounds on convergence to stationarity for nonreversible Markov chains, with an apphcation to the exclusion process. The Annals of Applied Probability, 1(1):62-87, 1991.

[6] M.I. Freidlin and A.D. Wentzell. Random Perturbations of Dynamical Systems. A Series of Comprehensive Studies in Mathematics 260. Springer-Verlag, 1984.

[7] A. Frigerio and G. Grillo. Simulated annealing with tlme-dependent energy function. Mathematische Zeitschrift, 213:97-116, 1993.

[8] L. Gross. Logarithmic Sobolev inequalities. American Journal of Mathematics, 97(4):1061-1083, 1976.

[9] R. HoUey and D. Stroock. Logarithmic Sobolev inequalities and stochastic Ising models. Journal of Statistical Physics, 46:1159-1194, 1987.

[10] R. HoUey and D. Stroock. Simulated annealing via Sobolev inequalities. Communications in Mathematical Physics, 115:553-569, 1988.

[11] C.R. Hwang and S.J. Sheu. Large-time behavior of perturbed diffusion Markov processes with apphcations to the second eigenvalue problem for Fokker-Planck operators and simulated annealing. Acta Applicandae Mathematicae, 19:253-295, 1990.

[12] C.R. Hwang and S.J. Sheu. Singular perturbed Markov chains and exact behaviors of simulated annealing processes. Journal of Theoretical Probability, 5(2):223-249, 1992.

[13] T. Kato. Perturbation Theory for Linear Operators. Classics in Mathematics. Springer, 1980.

[14] L. Miclo. Recuit simul$ sans potentiel sur un ensemble fini. In J. Azdma, P.A. Meyer, and M. Yor, editors, Sdminaire de Probabilitds XXVI, Lecture Notes in Mathematics 1526, pages 47-60. Springer-Verlag, 1992.

[15] L. Miclo. Une Stude des aigorithmes de recuit simul$ sous-admissibles. Annales de la Facultd des sciences de Toulouse, 4:819-877, 1995.

[16] L. Miclo. Sur les probl~mes de sortie discrets inhomog~nes. Pr~print ~ paraitre dans The Annals of Applied Probability, 1995.

[17] L. Miclo. Sur les temps d'occupations des processus de Markov finis inhomogSnes basse temperature. Pr@rint, 1995.

[18] O.S. Rothaus. Diffusion on compact Riemannian manifolds and logarithmic Sobolev inequalities. Journal of Functional Analysis, 42:102-109, 1981.

Page 32: Remarques sur l’hypercontractivité et l’évolution de …...la forme intervenant est celle associ6e s l'oppos6 du g6n6rateur (ou de mani~re 6quiva- lente, s l'oppos6 du sym6tris6

167

[19] D.W. Stroock. Logarithmic Sobolev inequalities for Gibbs states. In G. Dell'Antonio and U. Mosco, editors, Dirichlet Forms, Lecture Notes in Mathematics 1563, pages 194-228. Springer-Verlag, 1993.

[20] A. Trouv~. Paralldlisation massive du recuit simuld. PhD thesis, Universit$ Paris 11, Janvier 1993. ThSse de doctorat.

Laboratoire de Statistique et Probabilit6s Universit~ Paul Sabatier et CNRS 118, route de Narbonne 31062 Toulouse cedex, France