[IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina...

6
Estabilizaci´ on Mediante Realimentaci´ on de Salidas – Un M´ etodo Alternativo Santiago M. Hernandez 1 Departamento de Matem´ atica, Instituto Tecnol´ ogico de Buenos Aires Av. Eduardo Madero 399 (C1106ACD), Buenos Aires, Argentina 1 [email protected] Abstract—The problem of the stabilization of locally Lipschitz continuous systems for which a suitable state feedback law exists by using state estimates, is addressed. The state estimates are evaluated using an alternative type of observer that, given the output measurements, yields at each time instant a set containing feasible states of the system. Resumen— Consideramos el problema de estabilizaci´ on para sistemas localmente Lipschitz continuos, para los cuales existe una ley de realimentaci´ on de estados apropiada, mediante la utilizaci´ on de estimaciones de estados. Las estimaciones son obtenidas con un etodo alternativo de observaci´ on de estados que, dadas las mediciones de las salidas, arroja una sucesi´ on de conjuntos, cada uno de los cuales contiene estados posibles para cada instante de tiempo. I. I NTRODUCCI ´ ON Un problema de relevancia en teor´ ıa de control es el de estabilizaci´ on mediante realimentaci´ on de salidas. Si consideramos sistemas din´ amicos con controles y salidas de la forma: ˙ x = f (x, u) y = h(x) (1) donde x R n es el estado, u U R m el control e y R p la salida, y contamos con una ley de control u = α(x) tal que ˙ x = f (x, α(x)) es un sistema cuyo origen (i.e., x =0) es asint´ oticamente estable, nos interesa estabilizar asint´ oticamente el sistema cuando, en lugar de u = α(x), se usa ˆ u = αx), utilizando una estimaci´ on ˆ x de x obtenida a partir de las salidas y. Se han propuesto resultados para algunas clases de sis- temas no lineales de fase m´ ınima ( [1]–[4]) como as´ ı tambi´ en para algunas clases de sistemas no lineales de fase no m´ ınima ( [5]–[7]), sin embargo, nuestro enfoque se aparta significativamente de aquellos. En nuestro caso, adaptamos un m´ etodo alternativo de observaci´ on de estados, que fuera aplicado a sistemas Lipchitz continuos aut´ onomos ( [8]), con controles ( [9]) y conmutados ( [10]), al problema de estabilizaci´ on por realimentaci´ on de estados. A. Sistemas Considerados y Notaci´ on Consideramos sistemas din´ amicos como (1) adonde f : R n × R m R n y h : R n R p son funciones localmente Lipschitz continuas respecto de sus argumentos. Adem´ as consideramos f (0, 0) = 0. Definici´ on 1: Decimos que una funci´ on g : V W es Lipschitz continua con constante de Lipschitz L g > 0 si |f (x 1 ) - f (x 2 )|≤ L g |x 1 - x 2 | para todo x 1 ,x 2 V , y que es localmente Lipschitz continua si para cada x V existe un entorno U de x tal que la funci´ on restringida a U es Lipschitz continua. Si la funci´ on g es (localmente) Lipschitz continua para un cierto E V , quedar´ a impl´ ıcito al nombrar L E g a su constante de Lipschitz. Los controles o “entradas” son mapas medibles local- mente esencialmente acotados u(·):[t 0 , +) U adonde U R m es el espacio de valores de control. Para un estado inicial x(t 0 )= x 0 y una funci´ on de control u dada, se tiene una soluci ´ on x(t, x 0 ,u(t)) (x(t) para simplificar) que verifica ˙ x(t)= f (x(t),u(t)) en casi todo punto de un intervalo maximal I u,x0,t0 =[t 0 ,t max ). En particular, para sistemas sin entradas ˙ x = ¯ f (x) denotamos su soluci´ on como x(t, x 0 ). Llamamos cmp(A) a la clase de subconjuntos compactos con elementos de A. Para un cierto sistema, decimos que un conjunto E es su espacio ambiente si todas las trayectorias correspondientes a todas las condiciones iniciales de inter´ es est´ an contenidas en dicho conjunto. N 0 es el conjunto de enteros no negativos, |·| la norma eucl´ ıdea, |·| la norma del supremo, · 2 la norma 2 matricial, y #(A) el cardinal de A. Dado A R n , su di´ ametro diam(A) = sup{|x-y| : x, y A},y B(ξ,ε)= {x R n : |x - ξ | }. Dado ξ R n , ξ (i) hace referencia a su coordenada iesima. Decimos que una funci ´ on α : R 0 R 0 es de clase K (α ∈K) si es continua, estrictamente creciente y α(0) = 0. Una funci´ on β : R 0 × R 0 R 0 se dice de clase KL si para cada umero real s 0, la funci´ on r β(r, s) es de clase K y, para cada n´ umero real r> 0, la funci´ on s β(r, s) es estrictamente decreciente y satisface lim s+β(r, s)=0. B. Controlabilidad Asint´ otica y Estabilizaci´ on por reali- mentaci´ on Un sistema ˙ x = ¯ f (x) se dice globalmente asint´ oticamente estable cuando β ∈ KL tal que |x(t, x 0 )|≤ β(|x 0 |,t - t 0 ) x 0 , t t 0 . Cuando el sistema tiene controles, debemos definir la noci´ on m´ as general de controlabilidad asint´ otica: decimos que existen una funci´ on β ∈ KL y otra funci´ on no decreciente σ : R 0 R 0 tales que x 0 R n u :[t 0 , ) U, u σ(|x 0 |), |x(t, x 0 ,u(t))|≤ β(|x 0 |,t - t 0 ) t t 0 . (2) Nuestro prop´ osito de estabilizar al sistema (1) exige al menos la existencia de un control “a lazo abierto” como en (2), por lo que al menos supondremos que el sistema (1) es asint´ oticamente controlable. Por otro lado, como 2014 IEEE Biennial Congress of Argentina (ARGENCON) 978 -1 -4799 -4269 -5/14/$31.00 c 2014 IEEE 207

Transcript of [IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina...

Page 1: [IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina (2014.6.11-2014.6.13)] 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Estabilización mediante

Estabilizacion Mediante Realimentacion deSalidas – Un Metodo Alternativo

Santiago M. Hernandez†1†Departamento de Matematica, Instituto Tecnologico de Buenos Aires

Av. Eduardo Madero 399 (C1106ACD), Buenos Aires, [email protected]

Abstract—The problem of the stabilization of locallyLipschitz continuous systems for which a suitable statefeedback law exists by using state estimates, is addressed.The state estimates are evaluated using an alternative type ofobserver that, given the output measurements, yields at eachtime instant a set containing feasible states of the system.

Resumen— Consideramos el problema de estabilizacionpara sistemas localmente Lipschitz continuos, para los cualesexiste una ley de realimentacion de estados apropiada,mediante la utilizacion de estimaciones de estados. Lasestimaciones son obtenidas con un metodo alternativo deobservacion de estados que, dadas las mediciones de lassalidas, arroja una sucesion de conjuntos, cada uno de loscuales contiene estados posibles para cada instante de tiempo.

I. INTRODUCCION

Un problema de relevancia en teorıa de control es elde estabilizacion mediante realimentacion de salidas. Siconsideramos sistemas dinamicos con controles y salidas dela forma:

{x = f(x, u)y = h(x)

(1)

donde x ∈ Rn es el estado, u ∈ U ⊆ Rm el control e y ∈ Rpla salida, y contamos con una ley de control u = α(x)tal que x = f(x, α(x)) es un sistema cuyo origen (i.e.,x = 0) es asintoticamente estable, nos interesa estabilizarasintoticamente el sistema cuando, en lugar de u = α(x),se usa u = α(x), utilizando una estimacion x de x obtenidaa partir de las salidas y.

Se han propuesto resultados para algunas clases de sis-temas no lineales de fase mınima ( [1]–[4]) como asıtambien para algunas clases de sistemas no lineales de faseno mınima ( [5]–[7]), sin embargo, nuestro enfoque se apartasignificativamente de aquellos. En nuestro caso, adaptamosun metodo alternativo de observacion de estados, que fueraaplicado a sistemas Lipchitz continuos autonomos ( [8]),con controles ( [9]) y conmutados ( [10]), al problema deestabilizacion por realimentacion de estados.

A. Sistemas Considerados y Notacion

Consideramos sistemas dinamicos como (1) adonde f :Rn × Rm → Rn y h : Rn → Rp son funciones localmenteLipschitz continuas respecto de sus argumentos. Ademasconsideramos f(0, 0) = 0.

Definicion 1: Decimos que una funcion g : V → W esLipschitz continua con constante de Lipschitz Lg > 0 si

|f(x1)− f(x2)| ≤ Lg|x1 − x2|

para todo x1, x2 ∈ V , y que es localmente Lipschitzcontinua si para cada x ∈ V existe un entorno U de x talque la funcion restringida a U es Lipschitz continua. Si lafuncion g es (localmente) Lipschitz continua para un ciertoE ⊂ V , quedara implıcito al nombrar LEg a su constante deLipschitz.

Los controles o “entradas” son mapas medibles local-mente esencialmente acotados u(·) : [t0,+∞)→ U adondeU ⊆ Rm es el espacio de valores de control.

Para un estado inicial x(t0) = x0 y una funcion decontrol u dada, se tiene una solucion x(t, x0, u(t)) (x(t) parasimplificar) que verifica x(t) = f(x(t), u(t)) en casi todopunto de un intervalo maximal Iu,x0,t0 = [t0, tmax). Enparticular, para sistemas sin entradas x = f(x) denotamossu solucion como x(t, x0).

Llamamos cmp(A) a la clase de subconjuntos compactoscon elementos de A. Para un cierto sistema, decimos que unconjunto E es su espacio ambiente si todas las trayectoriascorrespondientes a todas las condiciones iniciales de interesestan contenidas en dicho conjunto. N0 es el conjunto deenteros no negativos, | · | la norma euclıdea, | · |∞ la normadel supremo, ‖ · ‖2 la norma 2 matricial, y #(A) el cardinalde A. Dado A ⊂ Rn, su diametro diam(A) = sup{|x−y|∞ :x, y ∈ A}, y B(ξ, ε) = {x ∈ Rn : |x− ξ|∞ < ε}. Dado ξ ∈Rn, ξ(i) hace referencia a su coordenada i-esima. Decimosque una funcion α : R≥0 → R≥0 es de clase K (α ∈ K) si escontinua, estrictamente creciente y α(0) = 0. Una funcionβ : R≥0 × R≥0 → R≥0 se dice de clase KL si para cadanumero real s ≥ 0, la funcion r 7→ β(r, s) es de clase Ky, para cada numero real r > 0, la funcion s 7→ β(r, s) esestrictamente decreciente y satisface lims→+∞ β(r, s) = 0.

B. Controlabilidad Asintotica y Estabilizacion por reali-mentacion

Un sistema x = f(x) se dice globalmente asintoticamenteestable cuando ∃β ∈ KL tal que |x(t, x0)| ≤ β(|x0|, t −t0) ∀x0,∀t ≥ t0. Cuando el sistema tiene controles,debemos definir la nocion mas general de controlabilidadasintotica: decimos que existen una funcion β ∈ KL y otrafuncion no decreciente σ : R≥0 → R≥0 tales que

∀x0 ∈ Rn ∃u : [t0,∞)→ U, ‖u‖∞ ≤ σ(|x0|),|x(t, x0, u(t))| ≤ β(|x0|, t− t0) ∀t ≥ t0. (2)

Nuestro proposito de estabilizar al sistema (1) exige almenos la existencia de un control “a lazo abierto” comoen (2), por lo que al menos supondremos que el sistema(1) es asintoticamente controlable. Por otro lado, como

2014 IEEE Biennial Congress of Argentina (ARGENCON)

978−1−4799−4269−5/14/$31.00 c©2014 IEEE 207

Page 2: [IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina (2014.6.11-2014.6.13)] 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Estabilización mediante

nuestra intencion es estabilizar el sistema (1) utilizando lassalidas del mismo o, mas especıficamente, utilizando algunaestimacion lo suficientemente buena de los estados delsistema a partir de las salidas, precisaremos un estabilizadorpor realimentacion, esto es, una funcion localmente acotadaα : Rn → U, que verifica α(0) = 0, y que hace queel sistema a lazo cerrado x = f(x, α(x)) =: f(x) sea(globalmente) asintoticamente estable.Nota: Se ve facilmente que la existencia de un estabilizadorpor realimentacion implica la controlabilidad asintotica; encambio, lo recıproco no es trivial. Aun para sistemas nolineales de estructura simple puede no existir una funcion derealimentacion estabilizante continua ( [11]). Para sistemasasintoticamente controlables se demuestra en ( [12]), queefectivamente existe un estabilizador asintotico de la formaα(x) aunque α no pueda ser, en general, una funcioncontinua.

C. Funciones de control de Lyapunov (fcL)

Para obtener resultados que nos permitan establecermargenes que aseguren la convergencia del sistema reali-mentado con estimaciones, usaremos la nocion de fcL.

Definicion 2: Un par de fcL para (1) viene dado por dosfunciones continuas V,W : Rn → R≥0 que verifican:

1) V (x) > 0 y W (x) > 0 para todo x 6= 0, y V (0) = 0,2) el conjunto {x|V (x) ≤ β} es acotado para cada β,3) para cada subconjunto acotado G ⊂ Rn, existe un

subconjunto compacto U ∈ cmp(Rm) tal que

minu∈U∇V (x) · f(x, u) ≤ −W (x) (3)

para cada x ∈ G.La caracterıstica principal de las fcL es que para cada

x 6= 0 se puede elegir un valor de control que haceque V (x, u) < 01. Ahora bien, si para cualquier conjuntocompacto D ⊂ Rn podemos escoger para (1) un conjuntocompacto U ⊂ Rm tal que ∀x ∈ D,x 6= 0,∃u ∈U tal que V (x, u) < 0, luego se podrıa estabilizar al sistemapara los estados en D usando una ley de realimentacion dedescenso de maxima pendiente, i.e.: α(x) := argmin

u∈U∇V (x)·

f(x, u)2 donde se restringe U a un conjunto compacto paraasegurar que alcance un mınimo.

En [12] se prueba que sistemas como (1) sonasintoticamente controlables si y solo si admiten un parV,W de fcL. Sin embargo, para sistemas generales como (1)podrıa no existir una V suave. Como buscamos estabilizar(1) con estimaciones sujetas a errores de observacion esimprescindible la existencia de una ley de realimentacionα robusta, por lo que precisamos que las fcL sean suaves(i.e., continuamente diferenciables) ( [12]).

II. EL PROBLEMA DE ESTABILIZACION PORREALIMENTACION DE SALIDAS

Dados f, h, α, deseamos obtener una estimacion x(t) delestado real del sistema x(t) que estabilice asintoticamente

x = f(x, α(x(t))) (4)

1V (x, u) = ∇V (x) · f(x, u) se refiere a la variacion infinitesimal deV sobre una trayectoria del sistema para un dado control.

2“argmin” debe interpretarse como “escoja cualquier u adonde el mınimosea alcanzado”

para todo x(t0) ∈ E ⊆ Rn.Separaremos al problema en dos:1) Evaluaremos que tan pequeno puede ser el error de

estimacion ex := x − x para lograr un error deestabilizacion final ee acotado.

2) Se elaboraran las condiciones para que el observadorpropuesto asegure que a un dado tiempo finito se tieneun error de estimacion menor o igual al valor halladoen el punto anterior.

Consideremos en primer lugar los efectos de tener unerror de estimacion en la senal de realimentacion.

A. Error en la senal de control

Para nuestra ley de realimentacion se cumple que ∇V (x)·f(x, α(x)) ≤ −W (x) para cada x ∈ E, de esta manera, elproblema esta resuelto si se conoce el estado real x(t) delsistema para cada t ≥ t0. Sin embargo, el control que se usaviene dado por α(x) = α(x+ ex), lo que se traduce en unerror de control. El error de control eu ∈ Rm (en general, noconstante) se puede expresar como eu = α(x+ ex)−α(x).Manipulando, de ∇V (x) · [f(x, α(x)) + f(x, α(x) + eu)−f(x, α(x)+eu)] ≤ −W (x) obtenemos ∇V (x) ·f(x, α(x)+eu) ≤ −W (x) + ∇V (x)[f(x, α(x) + eu) − f(x, α(x))],adonde el ultimo termino se debe al error en el control y,si fuese suficientemente grande, se perderıa la estabilidadasintotica del sistema realimentado.

Supongamos entonces que deseamos que el error deestabilizacion para todo tiempo t > Te sea menor a ee paraalgun Te > t0. Es decir que para todo t > Te, |x(t)| < ee.Por lo tanto, para que se cumpla que dicho error es alcanz-able asintoticamente debemos poder “disminuir” el valor deV siempre que nos encontremos en Eee := E \ B(0, ee).Esto ocurrira siempre que:

W (x) > ∇V (x)[f(x, α(x) + eu)− f(x, α(x))]. (5)

Luego, si vale la siguienteSuposicion 3: La ley de realimentacion α es localmente

Lipschitz continua con constante de Lipschitz Lα.y si x ∈ Eee , es suficiente que se verifique

minx∈Eee

W (x) > maxx∈Eee

{∇V (x)[f(x, α(x)+eu)−f(x, α(x))]}.(6)

para que se cumpla (5).Si volvemos a expresar a α(x) + eu como α(x) es facil

ver que (6) vale si

minx∈Eee

W (x) > ( maxx∈Eee

|∇V (x)|) · LfLα|x− x|. (7)

Luego se tiene que si queremos lograr un error de estabi-lizacion menor o igual a ee, la estimacion que realimentamosa (1) (para algun instante previo a Te) debe estar acotadade la siguiente manera:

|x− x| < minx∈EeeW (x)

LfLα maxx∈Eee|∇V (x)| (8)

Observacion 4: Vale decir que precisamos de un obser-vador que arroje una estimacion x(t) tal que |x(t) − x(t)|

208

Page 3: [IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina (2014.6.11-2014.6.13)] 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Estabilización mediante

cumpla con la condicion (8) para todo t > To dondet0 < To < Te. Como Te es arbitrario, bastara con que elobservador arribe a dicho error de estimacion en un tiempofinito y permanezca por debajo de ese valor.

B. Obtencion de las Estimaciones x(t)

Para obtener las estimaciones utilizaremos el metodo deobservacion de estados que fuera utilizado en [8], [9] y[10] (utilizando resultados y notacion de [10]).

Resena del funcionamiento del ObservadorPara una sucesion temporal T = {ti}i∈N0 con ti+1 − ti =∆T , una subsucesion Υ = {tki : i ∈ N0, k0 = 0}con tki+1

− tki = ∆τ , y sucesiones decrecientes{εi}i∈N0

, {γi}i∈N0(εi, γi > 0), el observador produce

una sucesion de conjuntos {Dti : i ∈ N0} con lassiguientes caracterısticas:

1) Cada Dti contiene una cantidad finita de elementosy “representa” a un conjunto compacto adonde seencuentra el estado real x(t) del sistema para cadat = ti ∈ T , i.e.:

2) para cada t ∈ Υ existe al menos un elemento ξ ∈ Dt

tal que |ξ − x(t)| < εi (para t ∈ T \Υ este “error deestimacion” puede aumentar de manera acotada segunsea la dinamica del sistema).

3) Los εi decrecen hasta arribar a un “error de esti-macion” final ε?, cada γi es una proporcion apropiadade εi.

4) En cada t ∈ Υ se agregan elementos en Dt paraasegurar que se cumpla lo expresado en 2).

5) Para cada t ∈ T , se comparan los elementos deξ ∈ Dt con el estado real del sistema x(t), haciendouso de las mediciones y, de la siguiente manera: seevalua |h(ξ)− h(x(t)|, si este valor es menor a γi elelemento se conserva en el conjunto, en caso contrario,se elimina o descarta del mismo. El γi que se utilizadepende de t, los elementos de Υ estan asociados enorden con los εi y los γi, y el γi utilizado es el que secorresponde con tki ∈ Υ tal que t− tki es el mınimoposible y tki < t.

6) Los elementos de Dti que no se descartan evolucionana Dti+1

con la misma dinamica del sistema a observar.7) El Teorema 3.13 de [10], junto con una hipotesis de

observabilidad, aseguran la consistencia (Lema 3.12de [10]), i.e. que siempre quede al menos un elementoen Dti , y el descarte (Lema 3.11 de [10]), i.e. que seeliminen elementos de los Dti , para que el observadorconverja en un tiempo finito a un error acotado pordiseno.

La hipotesis de observabilidad, a la que denominamosγ − ε-observabilidad , establece esencialmente que parados estados x1, x2 cuya distancia a un tiempo t cumple|x1 − x2| ≥ ε, existira un tiempo finito t∗ tal que, luego deque ambos estados evolucionen con la dinamica del sistemaa un tiempo futuro t + t∗, la distancia entre las salidascorrespondientes a dichos estados, sera mayor a 2γ.3

***

3Para una exposicion mas detallada de las definiciones referirse a [10].

Dado un operador de evolucion T ta,tbf que hace que loselementos de un conjunto A sobre el que actue, siguiendo ladinamica f , evolucionen desde un tiempo ta a un tiempo tbpara el que B = T ta,tbf (A), podemos expresar la evoluciona la que hace mencion 6) para el problema que nos ocupa,como:

Dti+1 = Tti,ti+1

f(·,u(τ))(Dti), (9)

adonde, para τ ∈ [ti, ti+1],

u(τ) := α(T ti,τf

(S(Dti))) (10)

Como al sistema (1) no se le puede aplicar un controlu = α(x) distinto por cada una de todas las posibilidadesque generan los elementos (estimaciones) que contiene Dti ,se utiliza en (10) la funcion S que lo que hace es escogerarbitrariamente un elemento de Dti y lo arroja comoresultado.

Luego tenemos un sistema como (4) adonde x(ti) =S(Dti), para ti ∈ T . Para expresar formalmente dichasituacion y adaptarlo al resultado de [10], definimos elsiguiente sistema auxiliar

x = gη(t, x) (11)

donde gη : R≥t0 × Rn → Rn y η ∈ E que es un conjuntode indexacion definido por

E := T × E (12)

donde E es el espacio ambiente. De esta manera se tieneuna familia de subsistemas {gη : η ∈ E} con

gη(t, x) := f(x, u(t)) (13)

y

u(t) = α(Tπ1(η),t

f(π2(η))) (14)

adonde para η = (t∗, x∗) ∈ E π1(η) = t∗ y π2(η) = x∗.Por otro lado, sea

{si = S(Dti) : ti ∈ T } (15)

la sucesion de selecciones realizadas sobre los espacios debusqueda para cada instante de tiempo de T . Definamos lafuncion σ : [t0,+∞)→ E de la siguiente manera

σ(t) = (ti, si) cuando t ∈ [ti, ti+1). (16)

Es decir que σ es una funcion constante a tramos quepara cada instante t ∈ R≥t0 toma valores en E y que puedecambiar de valor solamente en los instantes t ∈ T .

Luego la solucion que buscamos para (4) sera la de“integrar”

x(t) = gσ(t)(t, x(t)) (17)

con una cierta condicion inicial x0 en t = t0 arbitraria ydesconocida.

209

Page 4: [IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina (2014.6.11-2014.6.13)] 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Estabilización mediante

III. RESULTADO PRINCIPAL

La representacion del sistema dada por (17), equivalente ala de los sistemas conmutados de [10], nos permite adaptaren forma directa los resultados correspondientes a los Lemas3.11 y 3.12 allı expuestos, y enunciar el siguiente

Teorema 5: Consideremos al sistema (1) y que secumplen las siguientes condiciones:• El estado inicial del sistema (1) x(t0) = x0 ∈ D

adonde D es algun conjunto compacto conocido.• Se tiene una funcion α : Rn → Rm localmente Lips-

chitz continua tal que x = f(x, α(x)) es globalmenteasintoticamente estable.

• El espacio de valores de control es un conjunto U ∈cmp(Rm).

Consideremos tambien que E ∈ cmp(Rn) es el espacioambiente. Para κ ∈ (LEh , 2L

Eh ) sean

γ0 =2LEhME

LE×Uf

ln

LEh

), (18)

y ee > 0 tal que

γ0 ≤16κ

6LE×Uf LEα

minx∈EeeW (x)

maxx∈Eee|∇V (x)| . (19)

con ME = maxx∈Eu∈U{|f(x, u)|}.

Si el sistema (1) es γ0 − ε0-observable y existe unnumero positivo γ? < γ0/4 tal que t?(ν, γ?,

3γ?8κ , E

?) <t?(ν, γ?,

γ?4κ , E

?) para todo ν ∈ [t0, t?(t0, γ?,

γ?4κ , E

?)],donde E? = {(x1, x2) ∈ E×E : |h(x1)−h(x2)| ≤ γ?/2}4,luego existen dos sucesiones estrictamente crecientes

T = {t0, t1, · · · , tk, · · · } y

Υ = {τi = tki , i ∈ N0, k0 = 0} ⊂ Ty dos sucesiones decrecientes de numeros positivos

Σ = {εi, i ∈ N0} y

Γ = {γi, i ∈ N0}con limi→∞ εi = ε? y limi→∞ γi = γ? tales que, dada lasucesion de muestras de salida del sistema (1) correspondi-entes al estado inicial x(t0) = x0,

Y = {y(t0), y(t1), . . . , y(tk), . . . } ⊂ Rp

un observador como el de [10], definido con los parametrosT ,Υ,Σ y Γ, al recibir como entrada la sucesion Y , produceuna sucesion de conjuntos {Dti : ti ∈ T , i ∈ N0} que, juntocon la funcion de seleccion S, genera la sucesion {si =S(Dti) : ti ∈ T , i ∈ N0}, entonces la f -interpolacion5

4La condicion sobre los tiempos t? es de caracter tecnico y refiere a unacondicion de regularidad sobre los tiempos de descarte para los elementosque forman parte de los conjuntos Dti . Referimos a [10] para mayoresdetalles.

5Dada una sucesion

{(ti, si) : i ∈ N0, ti < ti+1, si ∈ E ⊆ Rn}definimos la f -interpolacion como a la funcion continua a tramos x :[t0,+∞)→ Rn definida por

x(t) = Tti,t

f(si) cuando t ∈ [ti, ti+1)

x(t), al ser realimentada al sistema (1) como α(x(t)) haceque la solucion x(t) del mismo verifique

limt→+∞

|x(t)| ≤ ee.

Demostracion: Dadas las hipotesis del Teorema, se verifi-can las condiciones de los Lemas 3.11 y 3.12 de [10] por loque (analogamente a la construccion en la demostracion delTeorema 3.13 de [10]), al elegir γ0 como en (18) podemosasegurar que existira un tiempo To tal que t0 ≤ To < +∞para el cual el observador arrojara estimaciones tales que

maxti≥To

|S(Dti)− x(ti)| < 6ε?

con lo cual |x(t)− x(t)| < 6ε? para t ≥ To, de manera talque6, como γ0 > 16κε?, entonces para algun Te ≥ To

|x(t)− x(t)| < ee para todo t ≥ Tedonde ee > 0 verifica (19).

Observacion 6: Dados un espacio ambiente E fijo y dosconstantes 0 < e1 < e2, Ee2 ⊂ Ee1 por lo que el “mınimo”de la expresion (19) es mas grande cuanto mas grandesea ee. Lo contrario ocurre con el “maximo” que figuraen el denominador de dicha expresion. Por lo tanto, sepuede ver que la expresion (19) no contradice la intuicionpues, cuanto mas pequeno se desee que sea el error finalde estabilizacion, mas resolucion debera tener el conjuntoinicial Dt0 de manera tal que los errores de estimacion delobservador se mantengan acotados por valores mas pequenosen todo instante. El costo que se paga es una mayor cargacomputacional.

IV. EJEMPLO NUMERICO

A modo de ejemplo buscaremos estabilizar el sistema dedimension n = 3 descripto por las ecuaciones

x(1) = x(2)

x(2) = −x(1) + x(3)

x(3) = |x(1)|+ |x(2)|+ (1 + |x(1)|+ |x(2)|) · u(20)

con salida y = h(x) no suave definida por

h(x) =

{x(1) si x(1) > 00.5 · x(1) si x(1) ≤ 0.

(21)

La ley de realimentacion

α(x) =−(|x(1)|+ |x(2)|) + [0.5 0.5 − 0.6] · x

1 + |x(1)|+ |x(2)| (22)

estabiliza asintoticamente a (20). De hecho,

f(x, α(x)) =

0 1 0−1 0 10.5 0.5 −0.6

· x (23)

donde la matriz tiene espectro {−0.1790 +0.6175i,−0.1790 − 0.6175i,−0.2419}, i.e. es Hurwitz ypor lo tanto exponencialmente estable.

Consideramos que x0 ∈ D es un conjunto compacto losuficientemente grande centrado en cero, y que el espacio

6Vease la demostracion del Teorema 3.13 de [10]

210

Page 5: [IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina (2014.6.11-2014.6.13)] 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Estabilización mediante

ambiente es otro compacto (tambien centrado en cero y quecontiene a D) cuyo diametro es 1.5 veces el de D. Estaeleccion se debe a que, dada la dinamica del sistema estabi-lizado, en cualquier caso la convergencia del observador a“valores estabilizantes” se dara en no mas de 5 instantesde descarte por lo que los Dti quedaran holgadamenteconfinados dentro de esos lımites.

De esta manera, tenemos una cota superior para γ0 quesurge de evaluar (18) para κ = 2LEh . Luego, partiendode esta cota superior que asegura la convergencia delobservador debemos achicar γ0 hasta alcanzar un valorque satisfaga la cota (19) para algun valor de ee sufi-cientemente pequeno para la aplicacion que se considerepero no demasiado pequeno como para no comprometerexcesivamente el costo computacional del algoritmo (i.e.,achicar excesivamente γ0 solamente tiene consecuencias enterminos de costo computacional pues fuerza a utilizar una“resolucion” mayor en los Dti , lo que se traduce en queestos conjuntos estaran mas poblados).

Para poder evaluar la expresion (19) se debe contar confcL para el sistema en cuestion. En este caso podemos hallarfacilmente una funcion de Lyapunov de la forma V (x) =xTPx para (23) resolviendo la ecuacion de Lyapunov (veasee.g. [13]):

ATP + PA = −wI (24)

adonde A es la matriz de (23), I es una matriz identidadde 3 × 3 y w una constante positiva. Las funciones de laforma V (x) = xTPx, W (x) = w|x|2 pueden cumplir el rolde funciones de control de Lyapunov para el sistema (20).Ahora bien, para distintos valores de w se obtienen distintospares V,W . Sin embargo, como el error en la estimacion quepuede tolerar nuestro sistema estabilizado f(·, α(·)) es unapropiedad estructural que (una vez fija α) no puede dependerde la eleccion de w, es esperable que la cota que obtenemospara γ0 en (19) no dependa de dicho parametro.

Para ver lo que sucede conminx∈Eee

W (x)

maxx∈Eee|∇V (x)| , notemos

que

minx∈Eee

W (x) = w · e2e

y que como |∇V (x)| ≤ 2‖P‖2 · |x| tenemos que

maxx∈Eee

|∇V (x)| ≤ ‖P‖2 · diam(E)

por lo que finalmente

minx∈EeeW (x)

maxx∈Eee|∇V (x)| ≥

w · e2e

‖P‖2 · diam(E)

Fijos E y ee nos interesa ver que sucede con

w

‖P‖2. (25)

Como tanto V (x) como W (x) son ambas funcioneshomogeneas de grado 2 que verifican la ecuacion (24),es facil ver que la cantidad (25) que define la cota deestabilidad sobre γ0 es una constante. En nuestro caso delorden de 0.02.

0 10 20 30 40 50 60 70 80 90 1001.5

1

0.5

0

0.5

1

1.5

2

t

x1

x2

x3

Fig. 1. Evolucion de la variable de estados x.

0 10 20 30 40 50 60 70 80 90 100−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

t

(Dt)(1)

x1

Fig. 2. x1 versus D(1)t .

Las condiciones dadas por el Teorema 5 pueden resultarrestrictivas, por lo que vale considerar lo siguiente: dado unespacio ambiente E se puede disenar para un ee “holgado”,luego si se tiene en cuenta que pasado un tiempo Dti estararestringido a un espacio mas chico (por lo que tendremos unnuevo espacio ambiente mas chico) se puede proponer unee mas pequeno y seguir iterando hasta obtener un valor deerror de estabilizacion muy pequeno. En la practica (comose vera en la simulacion) una vez que se alcanza un errorpequeno en la estimacion de los estados, el sistema seestabiliza a un error arbitrariamente pequeno.

El resultado de la simulacion, con una resolucion losuficientemente elevada (que surge de las cotas del Teorema5), ∆T = 0.5 y ∆τ = 40 · ∆T y condicion inicialx0 = [1, 1, 1]T puede verse en las Figuras 1–6. En laFigura 1 se puede ver la evolucion de la variable de estados,mientras que en las Figuras 2–4 se puede observar laevolucion de cada una de las coordenadas de la variablede estados respecto de la coordenada correspondiente delos elementos de los conjuntos Dti . En cuanto a la Figura5, esta exhibe la salida del sistema. Finalmente, la Figura6 nos muestra la cantidad de puntos que tiene Dti paracada instante: como se puede ver, disminuye rapidamente amedida que se van descartando elementos al evolucionar; porotro lado, aumenta en los momentos en los que se agreganelementos para aumentar la resolucion (para los instantesdados por la sucesion Υ).

V. CONCLUSIONES

Hemos encontrado condiciones bajo las cuales un metodode observacion de estados alternativo garantiza que un sis-

211

Page 6: [IEEE 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Bariloche, Argentina (2014.6.11-2014.6.13)] 2014 IEEE Biennial Congress of Argentina (ARGENCON) - Estabilización mediante

0 10 20 30 40 50 60 70 80 90 100−3

−2

−1

0

1

2

3

t

(Dt)(2)

x2

Fig. 3. x2 versus D(2)t .

0 10 20 30 40 50 60 70 80 90 100−4

−3

−2

−1

0

1

2

3

t

(Dt)(3)

x3

Fig. 4. x3 versus D(3)t .

0 10 20 30 40 50 60 70 80 90 100−1

−0.5

0

0.5

1

1.5

2

t

y

Fig. 5. Salida y = h(x).

0 10 20 30 40 50 60 70 80 90 1000

100

200

300

400

500

600

700

800

900

1000

t

#(Dt)

Fig. 6. Evolucion del tamano (#(Dt)) del espacio de busqueda.

tema para el cual existe una ley de realimentacion de estadosestabilizante tambien se estabiliza cuando se reemplaza larealimentacion por una estimacion de los estados. Por lascaracterısticas mismas del observador, la clase de sistemasa los que se puede aplicar el metodo (localmente Lipschitzcontinuos, no necesariamente suaves) es amplia, siempre quese asegure que el espacio ambiente permanece acotado, ya expensas de un paradigma de observacion de naturaleza“paralela”. Asimismo, se presenta un ejemplo numericoque exhibe el comportamiento del sistema realimentado conestimaciones.

REFERENCIAS

[1] L. Praly and Z. P. Jiang, “Stabilization by output feedback for systemswith ISS inverse dynamics,” Systems & Control Letters., vol. 21(1),pp. 19–33, 1993.

[2] L. Praly, “Asymptotic stabilization via output feedback for lowertriangular systems with output dependent incremental rate,” IEEETransactions on Automatic Control, vol. 48(6), pp. 1103–1108, 2003.

[3] M. Krstic, I. Kanellakopoulos, and P. V. Kokotovic, Nonlinear andadaptative control design. New York: Wiley., 1995.

[4] R. Marino and P. Tomei, “Dynamic output feedback linearization andglobal stabilization,” Systems & Control Letters, vol. 17(2), pp. 115–121, 1991.

[5] A. Isidori, “A tool for semi-global stabilization of uncertain non-minimum-phase nonlinear systems via output feedback,” IEEE Trans-actions on Automatic Control, vol. 45(10), pp. 1817–1827, 2000.

[6] D. Karagiannis, Z. P. Jiang, R. Ortega, and A. Astolfi, “Output-feedback stabilization of a class of uncertain non-minimum-phasenonlinear systems,” Automatica, vol. 41(9), pp. 1609–1615, 2005.

[7] R. Marino and P. Tomei, “A class of globally output feedback sta-bilizable nonlinear nonminimum phase systems,” IEEE Transactionson Automatic Control, vol. 50(12), pp. 2097–2101, 2005.

[8] S. M. Hernandez and R. A. Garcıa, “An observer for Lipschitzcontinous systems: an alternative approach,” in Proceedings de la XIIIReunion de Trabajo en Procesamiento de la Informacion y Control(RPIC), 2009.

[9] S. M. Hernandez and R. A. Garcıa, “An alternative approach tothe state observation problem for Lipschitz continuous systems withcontrols,” in American Control Conference (ACC), 2010, pp. 5272–5277.

[10] ——, “An observer for switched Lipschitz continuous systems,”International Journal of Control, vol. 87, no. 1, pp. 207–222, 2014.

[11] E. Sontag and H. Sussmann, “Remarks on continuous feedback,” inProc. IEEE Conf. Decision and Control, Albuquerque. Piscataway:IEEE Publications, Dic. 1980, pp. 916–921.

[12] F. Clarke, Y. Ledyaev, E. Sontag, and A. Subbotin, “Asymptoticcontrollability implies feedback stabilization,” IEEE Transactions onAutomatic Control, vol. 42, pp. 1394–1407, 1997.

[13] H. Khalil, Nonlinear Systems. Prentice Hall, 2002.

212