Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie...
Transcript of Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie...
Operations Research
Rainer Schrader
Zentrum für Angewandte Informatik Köln
20. April 2007
1 / 112
Organisatorisches
• Dozent: Prof. Dr. Rainer Schrader
• Weyertal 80• Tel.: 470-6030• email: [email protected]
• Übungen: Dipl.-Inf. Anna Schulze
• Weyertal 80• el.: 470-6050• email: [email protected]
• url: www.zaik.uni-koeln.de/AFS
2 / 112
Organisatorisches
• Ort: Hörsaal Mathematisches Institut
• Zeit: Mo, Do 8–10
• Teilnehmerkreis:
• Wirtschaftsmathematik• Mathematik
Voraussetzungen:
• Grundkenntnisse in linearer Algebra und Analysis
• Grundkenntnisse in Informatik hilfreich, aber nicht notwendig
• Vorlesung weitgehend aus sich selbst heraus verständlich
• Folien hängen im Netz (jeweils am Ende der Woche)
3 / 112
Organisatorisches
• Übungsorganisation: −→ Anna Schulze
• Anmeldung zu den Übungen über Homepage ab Mo, 2. April 2007
• Scheinerwerb über Übungsteilnahme und Klausur
• Voraussetzungen für die Teilnahme an der Abschlussprüfung:
• aktive Teilnahme an den Übungen
• 50% der Punkte aus den Übungen
4 / 112
Organisatorisches
Literatur:
• U. Faigle, W. Kern und G. Still: Algorithmic Principles of MathematicalProgramming. Kluwer Academic Publishers 2002.
• David G. Luenberger: Linear and Nonlinear Programming,Addison-Wesley 1984
• A. Schrijver: Theory of Linear and Integer Programming, Wiley
5 / 112 6 / 112
7 / 112 8 / 112
9 / 112 10 / 112
Operations Research
Gliederung der Inhalte
1. Theorie linearer Ungleichungen
2. Polyeder und Polytope
3. Konvexe Funktionen
4. die Simplexmethode
5. ganzzahlige lineare Programme
6. Flüsse in Netzwerken
11 / 112
Theorie linearer Ungleichungssysteme
12 / 112
Theorie linearer Ungleichungen
Gliederung
• Grundbegriffe
• der Algortihmus von Fourier-Motzkin
• Alternativsätze
• Seitenflächen
• konvexe Kegel
• zwei Anwendungen
13 / 112
Grundbegriffe
• wir betrachten Ungleichungssysteme der Form
aTi x ≤ bi (i ∈ I)
• dabei ist I eine (endliche oder unendliche) Indexmenge
• die Parameter
aTi = [ai1,, . . . , ain] ∈ Rn und bi ∈ R
sind als gegeben vorausgesetzte Vektoren und reelle Zahlen
14 / 112
Grundbegriffe
• für die Anwendungen ist es oft notwendig, sich auf den rationalenZahlkörper Q zu beschränken.
15 / 112
Grundbegriffe
Wir betrachten das Problem:
• bestimme ein x ∈ Rn , das alle Ungleichungen
nXj=1
aij xj ≤ bi (i ∈ I)
erfüllt,
• oder stelle fest, dass kein solches x existiert.
16 / 112
Grundbegriffe
• mit A = [aij ] bezeichnen wir die (möglicherweise unendliche) Matrixmit den n-dimensionalen Zeilenvektoren aT
i
• d.h. A ist die Abbildung
A : I × {1, . . . , n} → R mit A(i , j) = aij
• entsprechend ist b = [bi ] ∈ RI der Koeffizientenvektor der rechtenSeite des Ungleichungssystems
• wir schreiben das Ungleichungssystem dann kurz als
Ax ≤ b ←→nX
j=1
aij xj ≤ bi (i ∈ I).
17 / 112
Grundbegriffe
• die Lösungsmenge des Ungleichungssystem ist
P(A, b) = {x ∈ Rn | Ax ≤ b}.
Beispiel
• ein lineares Gleichungssystem Ax = b mit A ∈ Rm×n und b ∈ Rm istäquivalent zu dem Ungleichungssystem
Ax ≤ b−Ax ≤ −b
• die Lösungsmenge A = {x ∈ Rn | Ax = b} ist ein affinerTeilraum von Rn
18 / 112
Grundbegriffe
Beispiel
• wir fassen eine Matrix X = [xij ] ∈ Rn×n als n2-dimensionalenKoordinatenvektor auf
• sei X = [xij ] eine Lösung des unendlichen Ungleichungssystems
nXi=1
nXj=1
ai aj xij ≥ 0 für alle [a1, . . . , an] ∈ Rn
xij − xji = 0 i , j = 1, . . . , n
• dann ist X = [xij ] eine positiv semidefinite Matrix
19 / 112
Grundbegriffe
• wir betrachten zunächst einen Spezialfall:
• A besteht nur aus einem einzigen Zeilenvektor aT
• Ist a 6= 0, so ist die Punktmenge
P(a, b) = {x ∈ Rn | aT x ≤ b}
ein (n-dimensionaler) Halbraum
• im Fall a = 0 erhalten wir Rn = P(0, 0) als „trivialen“ Halbraum
• ebenso ist die leere Menge ∅ = P(0,−1) ein trivialer Halbraum
• damit ist die Lösungsmenge eines linearen Ungleichungssystemsimmer Durchschnitt von Halbräumen
20 / 112
Grundbegriffe
Beispiel (Hyperebenen)
• sei H(a, b) = {x ∈ Rn | aT x = b} eine Hyperebene
• H ist Durchschnitt ihrer zugeordneten Halbräume
H(a, b) = P(a, b) ∩ P(−a,−b)
• bzw. Lösungsmenge des linearen Ungleichungssystemsa1x1 + . . . + anxn ≤ b−a1x1 − . . .− anxn ≤ −b
ff←→ a1x1 + . . . + anxn = b.
21 / 112
Grundbegriffe
• sei S ⊆ Rn
• S heißt konvex, falls
• für alle x, y ∈ S und alle reellen 0 ≤ λ ≤ 1 gilt:
λx + (1− λ)y ∈ S
xx
yy
konvex nicht konvex
22 / 112
Grundbegriffe
• ist P(a, b) ein Halbraum, so ist P(a, b) konvex
• außerdem ist P(a, b) (im Sinn der Analysis) abgeschlossen
• offensichtlich bleibt Abgeschlossenheit und Konvexität unterDurchschnittsbildung erhalten
• somit ist die Lösungsmenge eines linearen Ungleichungssystemskonvex und abgeschlossen
• wir wollen zeigen:
• die konvexen abgeschlossenen Mengen im Rn sind genau dieLösungsmengen von linearen Ungleichungssystemen
• dazu folgendes grundlegendes Lemma:
23 / 112
Grundbegriffe
Lemma 1 (Trennungslemma)
• sei S ⊆ Rn nichtleer, konvex und abgeschlossen
• dann existiert für jedes y ∈ Rn r S ein Vektor c ∈ Rn und einx0 ∈ S derart, dass
cT y > cT x0 ≥ cT x für alle x ∈ S.
y
S
y
Sc
y
S
x
c
0
24 / 112
Grundbegriffe
y
S
x
c
0
• mit z = cT x0 hat man S ⊆ P(c, z) und y /∈ P(c, z)
• d.h. die Hyperebene H = {x ∈ Rn | cT x = z} trennt den Punkty ∈ Rn von der Menge S ⊆ Rn
• H heißt Stützhyperebene von S im Punkt x0.
25 / 112
Grundbegriffe
Beweis des Trennungslemmas:
(i) das Minimierungsproblemminx∈S‖y − x‖
besitzt eine optimale Lösung x0 ∈ S:
• wir können dazu oBdA annehmen, dass S kompakt ist
• andernfalls beschränken wir uns auf die kompakte Menge
SR = {x ∈ S | ‖y − x‖ ≤ R},
(wobei R > 0 so groß gewählt ist, dass SR 6= ∅ gilt)
• die Funktion x 7→ ‖x − y‖ ist stetig auf Rn
• eine stetige Funktion nimmt auf einem Kompaktum ihre Extremwerte an
• damit existiert eine Minimallösung x0 ∈ S
26 / 112
Grundbegriffe
• für x0 ∈ S gilt‖y − x0‖ = min
x∈S‖y − x‖
• da y /∈ S, folgt x0 6= y
• sei c = y − x0
• wir zeigen, dass c die gewünschten Eigenschaften hat:
(ii) cT x0 < cT y:
• es gilt
cT y − cT x0 = cT (y − x0)
= ‖y − x0‖2
> 0
27 / 112
Grundbegriffe
(iii) cT x0 ≥ cT x für alle x ∈ S:
• sei x ∈ S ein beliebiger Punkt in S
• für 0 < λ < 1 setze z(λ) = x0 + λ(x − x0)
• da S konvex, gilt z(λ) ∈ S
• nach Wahl von x0 folgt
‖c‖2 = ‖y − x0‖2 ≤ ‖y − z(λ)‖2 = ‖c− λ(x − x0)‖2.
• ausmultiplizieren ergibt
−2λcT (x−x0)+λ2‖x−x0‖2 ≥ 0 bzw. −2cT (x−x0)+λ‖x−x0‖2 ≥ 0
• und liefert
cT x − cT x0 = cT (x − x0) ≤12
limλ→0
λ‖x − x0‖2 = 0.
28 / 112
Grundbegriffe
Bemerkung 1
• die Voraussetzung der Abgeschlossenheit von S im Trennungslemmaist wichtig:
• betrachte die konvexe Menge
S = {(x1, x2) | x 21 + x 2
2 < 1} ⊆ R2
• das Trennungslemma gilt aber nicht.
Bemerkung 2
• Für den Vektor c im Trennungslemma können wir oBdA eine normierteLänge ‖c‖ = 1 fordern.
29 / 112
Grundbegriffe
Satz 2Eine Teilmenge S ⊆ Rn ist genau dann konvex und abgeschlossen, wennS Lösungsmenge eines linearen Ungleichungssystems ist.
Beweis:
• die Lösungsmenge eines linearen Ungleichungssystems ist konvex undabgeschlossen
• zum Beweis der anderen Richtung:
• der Fall S = Rn oder S = ∅ ist trivial
• in allen anderen Fällen erhalten wir nach dem Trennungslemma
S =\y/∈S
Py,
• wobei die Py Halbräume mit S ⊆ Py und y /∈ Py sind.
30 / 112
Grundbegriffe
• sei S ⊆ Rn
• wir können S auf zweierlei Arten eine konvexe Menge zuordnen:
• einmal betrachten wir die Menge aller Konvexkombinationen:
conv S = {kX
i=1
λi si | si ∈ S, λi ≥ 0,
kXi=1
λi = 1}.
• d.h. Linearkombinationen mit nichtnegativen Koeffizienten, die sich zu1 aufsummieren
• conv S ist die konvexe Hülle von S
31 / 112
Grundbegriffe
Beispiel
S Sconv
Bemerkung
conv S ist die kleinste konvexe Menge, die S enthält.
32 / 112
GrundbegriffeOffensichtlich gilt:
• S ⊆ conv S
• S ⊆ T =⇒ conv S ⊆ conv T
• conv S = conv(conv S)
Lemma 3Sei S ⊆ Rn eine beliebige nichtleere Menge. Dann gilt:
S ist konvex ⇐⇒ S = conv S.
Beweis: Übungsaufgabe
33 / 112
Grundbegriffe
• dual dazu definiert man:
Spol = {x ∈ Rn | sT x ≤ 1 für alle s ∈ S}. (1)
• Spol ist die Polare zu S
• Spol ist Lösungsmenge eines linearen Ungleichungssystems unddeshalb abgeschlossen (und konvex)
• stellen wir uns S als eine Matrix mit den Zeilenvektoren sT vor, so ist
Spol = P(S, 1),
• wobei b = 1 der Vektor mit allen Komponenten bi = 1 bedeutet
34 / 112
Grundbegriffe
Beispiel
(-1,2)
(-1,-1)
(1,0)
Spol
35 / 112
GrundbegriffeMotivation
• sei S ⊆ Rn mit 0 ∈ S
• sei cT x ≤ z eine lineare Ungleichung, die von allen s ∈ S erfüllt wird
• dann gilt z ≥ 0 (wegen 0 ∈ S)
• im Fall z > 0 kann man die Koeffizienten per Division durchz skalieren
• und enthält die äquivalente Ungleichung
cT x ≤ 1 (c = z−1c).
• Spol ist gerade die Menge aller solcher Koordinatenvektoren c.
36 / 112
GrundbegriffeMan macht sich leicht klar:
• S ⊆ (Spol )pol
• S ⊆ T =⇒ T pol ⊆ Spol
• Spol = (conv S)pol
Satz 4Sei S ⊆ Rn eine beliebige nichtleere Menge mit 0 ∈ S. Dann gilt:
S ist eine abgeschlossene konvexe Menge ⇐⇒ S = (Spol )pol .
37 / 112
Grundbegriffe
S ist eine abgeschlossene konvexe Menge ⇐⇒ S = (Spol )pol .
Beweis:
• sei S = (Spol )pol ,
• dann ist ist S Durchschnitt von Halbräumen und somit konvex undabgeschlossen
• sei umgekehrt S konvex und abgeschlossen
• nach Satz 2 existiert ein Ungleichungssystem Ax ≤ b mit S = P(A, b)
• da 0 ∈ S, folgt bi ≥ 0 für jede Komponente bi von b
• nach Skalierung können wir annehmen, dass bi ∈ {0, 1}
38 / 112
Grundbegriffe
• d.h. S = P(A, b) mit bi ∈ {0, 1}
• wir ersetzen jede Ungleichung vom Typ aTi x ≤ 0 durch unendlich viele
Ungleichungen(kai )
T ≤ 1 (k ∈ N)
• dann können wir annehmen, dass S von der Form ist:
S = {x ∈ Rn | aTi x ≤ 1 (i ∈ I)}
• das bedeutet aber ai ∈ Spol für alle i ∈ I
• also A ⊆ Spol und somit
S ⊆ (Spol )pol ⊆ Apol ⊆ S
• d.h.S = (Spol )pol .
39 / 112
Grundbegriffe
• sei Ax ≤ b ein Ungleichungssystem
• als Dimension von Ax ≤ b bezeichnet man gewöhnlich die Anzahln der Variablen xj
• uns interessiert aber auch die Dimension der Lösungsmenge P(A, b)
• für einen Spezialfall ist dies bekannt:
40 / 112
Grundbegriffe
• die linearen Teilräume L von Rn sind genau die Lösungsmengen vonlinearen Gleichungssystemen:
L = {x ∈ Rn | Ax = 0}.
• die Dimension dimL von L ist:
dimL = max{k | es gibt k linear unabhängige Punkte x1, . . . , xk ∈ L}.
• bzw. dimL = −1 falls L = ∅
• es gilt die Dimensionsformel
dimL = n − rg A (2)
• mit rg A = (Zeilen/Spalten-)Rang von A
• bei Gleichungssystemen darf man (im Gegensatz zuUngleichungssystemen) immer A als endliche Matrix annehmen
41 / 112
Grundbegriffe
• etwas allgemeiner:
• die affinen Teilräume A von Rn sind genau die Lösungsmengen vonlinearen Gleichungssystemen:
A = {x ∈ Rn | Ax = b}.
• jeder nichtleere affine Teilraum A lässt sich schreiben als
A = p + L = {x | x = p + y, y ∈ L}
• hierbei ist p ∈ Rn und L ein linearer Teilraum
• die (affine) Dimension dimA von A ist:
dimA =
dimL, falls A 6= ∅−1, falls A = ∅
42 / 112
Grundbegriffe
• der allgemeine Fall:
• Idee: einer Teilmenge S ∈ Rn ordnen wir die Dimension des kleinstenaffinen Teilraums zu, der S enthält
• seiPk
i=1 λi si eine Linearkombination von Punkten aus S
• die Linearkombination heißt affine Linearkombinationen, wennzuätzlich gilt
kXi=1
λi = 1
• die affine Hülle aff S ist die Menge aller Punkte, die sich als affineLinearkombinationen aus S ausdrücken lassen
43 / 112
Grundbegriffe
• d.h.
aff S = {kX
i=1
λi si | si ∈ S,
kXi=1
λi = 1}.
• aff S ist der kleinste affine Teilraum von Rn , der S enthält
• die affine Dimension von S ist jetzt
dim S := dim aff S.
S
aff S
44 / 112
Grundbegriffe
• sei S ⊆ Rn eine abgeschlossene konvexe Menge
• sei F ⊆ S eine Teilmenge von S
• F heißt Berührfläche von S, wenn gilt:
(SF0) es gibt einen Vektor a 6= 0 und eine reelle Zahl b ∈ R mit:
(SF1) S ⊆ {x ∈ Rn | aT x ≤ b} = P(a, b)
(SF2) F = {x ∈ S | aT x = b} = S ∩ H(a, b)
• F heißt Seitenfläche von S, wenn F Berührfläche von S ist oderF = S oder F = ∅.
45 / 112
Grundbegriffe
• die Seitenflächen S und ∅ sind die trivialen Seitenflächen
• die anderen sind die nicht-trivialen Seitenflächen
• eine einelementige Seitenfläche F = {v} von S heißtExtrempunkt (oder Ecke) von S
• aus der Definition ergibt sich sofort, dass eine Seitenfläche F vonS selber eine abgeschlossene konvexe Menge ist
• es giltdim F ≤ dim S − 1 ⇐⇒ F 6= S.
• die Extrempunkte von S entsprechen den Seitenflächen F mitdim F = 0
46 / 112
Grundbegriffe
Beispiel
• sei S = {(x1, x2, x3) ∈ R3 | x 21 + x 2
2 + x 23 ≤ 1}.
• die nichttrivialen Seitenflächen von S sind genau die Punkte auf derKugeloberfläche
• dieses sind gleichzeitig auch die Extrempunkte von S
47 / 112
Grundbegriffe
Beispiel
A
B
C
D
E
48 / 112
Grundbegriffe
Beispiel (Stützhyperebenen)
• jede Stützhyperebene H = H(c, b) induziert eine nichtleereSeitenfläche von S, denn:
• sei x0 der Stützpunkt von H
• dann gilt (SF1) wegen
cT x ≤ b = cT x0 für alle x ∈ S
• die Seitenfläche F = S ∩ H enthält x0 und ist folglich nichtleer.
Seitenflächen sind unter Durchschnitten abgeschlossen:
49 / 112
Grundbegriffe
Proposition 5
Sind F1, F2 Seitenflächen der abgeschlossenen konvexen Menge S ⊆ Rn ,dann ist auch F = F1 ∩ F2 eine Seitenfläche von F .
Beweis:
• sei F1 = S ∩ H(a1, b1) und F2 = S ∩ H(a2, b2)
• wir setzen a = a1 + a2 und b = b1 + b2.
• dann gilt nach Voraussetzung für alle x ∈ S:
aT1 x ≤ b1, aT
2 x ≤ b2 und deshalb aT x ≤ b.
• außerdem gilt für x ∈ S:
aT x = b ⇐⇒ aT1 x = b1 und aT
2 x = b2
• und somit F = S ∩ H(a, b).
50 / 112
Grundbegriffe
Bemerkung
Wie schon das Beispiel der Kreisscheibe zeigt, ist die VereinigungF1 ∪ F2 von zwei Seitenflächen im allgemeinen keine Seitenfläche.
51 / 112
Theorie linearer Ungleichungen
Gliederung
• Grundbegriffe
• der Algortihmus von Fourier-Motzkin
• Alternativsätze
• Seitenflächen
• konvexe Kegel
• zwei Anwendungen
52 / 112
Fourier-Motzkin
• wir diskutieren nun einen Algorithmus zum Lösen linearerUngleichungssysteme
• er ist natürlich nur bei endlichen Systemen praktisch durchführbar,
• aber doch auch bei unendlichen Systemen „im Prinzip“ anwendbar
• wir gehen aus von einem Ungleichungssystem
aTi x =
nXj=1
aij xj ≤ bi (i ∈ I).
• wir wollen nun (ähnlich wie beim Gauss-Verfahren) die Variablen xj derReihe nach eliminieren
• wegen der Ungleichungen können wir aber nur mit positiven Zahlenskalieren
• wir beginnen mit z.B. x1.
53 / 112
Fourier-Motzkin• seien
I+ = {i ∈ I | ai1 > 0},I− = {i ∈ I | ai1 < 0},I0 = {i ∈ I | ai1 = 0}.
• dividieren wir die Ungleichungen in I1 und I2 jeweils durch |ai1|, soerhalten wir das äquivalente System
x1 +Xj=2
a′rj xj ≤ b′r (r ∈ I+)
−x1 +Xj=2
a′sj xj ≤ b′s (s ∈ I−)Xj=2
atj xj ≤ bt (t ∈ I0)
(3)
54 / 112
Fourier-Motzkin
x1+Xj=2
a′rj xj ≤ b′r (r ∈ I+)
−x1+Xj=2
a′sj xj ≤ b′s (s ∈ I−) (3)
Xj=2
atj xj ≤ bt (t ∈ I0)
• x = (x1, x2, . . . , xn) ist also genau dann zulässige Lösung, wenn gilt:
(i) (x2, . . . , xn) erfülltnX
j=2
atj xj ≤ bt für alle t ∈ I0
(ii) −b′s +nX
j=2
a′sj xj ≤ x1 ≤ b′r −nX
j=2
a′rj xj für alle r ∈ I+, s ∈ I−
55 / 112
Fourier-MotzkinBeobachtung: Das System
(ii) −b′s +nX
j=2
a′sj xj ≤ x1 ≤ b′r −nX
j=2
a′rj xj für alle r ∈ I+, s ∈ I−
ist genau dann erfüllbar, wenn das folgende System erfüllbar ist:
(iii)nX
j=2
(a′rj + a′sj )xj ≤ b′r + b′s für alle r ∈ I+ und s ∈ I−.
denn:
• (ii)⇒ (iii): addiere je eine Ungleichung r ∈ I+, s ∈ I−• (iii)⇒ (ii): für alle r ∈ I+, s ∈ I− gilt
−b′s +nX
j=2
a′sj xj ≤ b′r −nX
j=2
a′rj xj
• und somit (mit inf ∅ = +∞, sup ∅ = −∞)
sups∈I−
`− b′s +
nXj=2
a′sj xj´≤ inf
r∈I+
`b′r −
nXj=2
a′rj xj´
56 / 112
Fourier-Motzkin• in diesem Fall können wir jedes x1 wählen mit
sups∈I−
`− b′s +
nXj=2
a′sj xj´≤ x1 ≤ inf
r∈I+
`b′r −
nXj=2
a′rj xj´
(4)
• somit:
• erfüllt (x2, . . . , xn) die Ungleichungen (i) und (iii),
• so lässt sich x1 per Rücksubstitution aus (4) bestimmen
• danach erfüllt (x1, . . . , xn) die Ungleichungen (i) und (ii)
57 / 112
Fourier-Motzkin
• zusammengefasst:
Lemma 6Das System (3) ist genau dann lösbar, wenn das System
(i)nX
j=2
atj xj ≤ bt (t ∈ I0)
(iii)nX
j=2
(a′rj + a′sj )xj ≤ br + bs (r ∈ I+, s ∈ I−)
lösbar ist.
58 / 112
Fourier-Motzkin
Lemma 6 führt auf eine rekursive Beschreibung des Eliminationsverfahrensbzgl. (3):
Fourier-Motzkin-Elimination
(1) berechne rekursiv eine Lösung (x2, . . . , xn) für das System (i) & (iii);
(2) wenn keine Lösung existiert: stop
(3) berechne x1 mit Rückwärtssubstitution nach (4)
59 / 112
Fourier-MotzkinBeispiel:
3x + y − 2z ≤ 1− 2y − 4z ≤ −14
−x + 3y − 2z ≤ −2y + 4z ≤ 13
2x − 5y + z ≤ 0
es ist:
I+ = {1, 5} I− = {3} I0 = {2, 4}Normierung ergibt:
x + 13 y − 2
3 z ≤ 13
x − 52 y + 1
2 z ≤ 0− x + 3y − 2z ≤ −2
− 2y − 4z ≤ −14y + 4z ≤ 13
60 / 112
Fourier-Motzkinx + 1
3 y − 23 z ≤ 1
3
x − 52 y + 1
2 z ≤ 0− x + 3y − 2z ≤ −2
− 2y − 4z ≤ −14y + 4z ≤ 13
Elimination von x ergibt:
103 y − 8
3 z ≤ − 53
12 y − 3
2 z ≤ −2− 2y − 4z ≤ −14
y + 4z ≤ 13
Normierung ergibt:
y − 810 z ≤ − 1
2
y − 3z ≤ −4y + 4z ≤ 13
− y − 2z ≤ −7
61 / 112
Fourier-Motzkiny − 8
10 z ≤ − 12
y − 3z ≤ −4y + 4z ≤ 13
− y − 2z ≤ −7
Elimination von y ergibt:
− 2810 z ≤ − 15
2
− 5z ≤ −112z ≤ 6
Normierung ergibt:
z ≤ 3
− z ≤ − 15056
− z ≤ − 115
62 / 112
Fourier-Motzkinz ≤ 3
− z ≤ − 15056
− z ≤ − 115
Somit äquivalent dazu:
• 15056 ≤ z ≤ 3
• eine möglich Lösung wäre z.B. z = 3
• ein weiterer Eliminationsschritt liefert:
0 ≤ 3 + 15656
0 ≤ 3− 115
63 / 112
Fourier-MotzkinBerechnung der anderen Komponenten:
• Einsetzen von z = 3 in
y − 810 z ≤ − 1
2
y − 3z ≤ −4y + 4z ≤ 13
− y − 2z ≤ −7
• lieferty ≤ 19
10
y ≤ 5y ≤ 1
− y ≤ −1
• und somit y = 1
64 / 112
Fourier-Motzkin• Einsetzen von y = 1 und z = 3 in
x + 13 y − 2
3 z ≤ 13
x − 52 y + 1
2 z ≤ 0− x + 3y − 2z ≤ −2
• liefert:
x ≤ 2x ≤ 2
− x ≤ 1
• und somit z.B. x = 2.
65 / 112
Fourier-MotzkinZusammenfassung:
• das FM-Verfahren führt nur zwei Operationen aus:
(i) Multiplikation einer Ungleichung mit einer positiven Zahl
(ii) Addition von zwei Ungleichungen
• damit gilt nach jeder Elimination einer Variablen:
• jede der neuen Ungleichungen ist eine Linearkombination vonhöchstens zwei Ungleichungen des vorigen Systems mit positivenKoeffizienten
• gilt für eine Variable I+ = ∅ (I− = ∅), so ist das System lösbar
• wenn alle Variablen eliminiert sind, sind die Koeffizienten auf der linkenSeite des Systems Null
• dann ist das System genau dann lösbar, wenn die Koeffizienten auf derrechten Seite alle nichtnegativ sind.
66 / 112
Fourier-MotzkinBemerkung:
• sei Ax ≤ b ein System mit m Ungleichungen
• nach der Elimination einer Variablen kann das resultierende Systemm2
4 Ungleichungen haben
• d.h. die Anzahl der Ungleichungen kann explodieren
• daher ist das Fourier-Motzkin-Verfahren nicht sehr effizient.
67 / 112
Fourier-MotzkinAnwendung: Projektionen
• wir betrachten die Projektionsabbildung π : Rn → Rn−1
• π ist gegeben durch
π(x1, x2, x3 . . . , xn) = (x2, x3, . . . , xn).
• Projektionen von konvexen Mengen sind konvex
• weiter ist π stetig
• daher ist die Projektion einer abgeschlossenen konvexen Menge wiederabgeschlossen und konvex
• d.h. die Projektion der Lösungsmenge eines linearenUngleichungssystems ist selber Lösungsmenge eines linearenUngleichungssystems
• die interessante Aussage des folgenden Lemmas ist der Erhalt derEndlichkeit
68 / 112
Fourier-Motzkin
Lemma 7 (Projektionslemma)
Sei A ∈ Rm×n und b ∈ Rm gegeben. Dann existiert eine endliche MatrixB ∈ Rk×(n−1) und ein Vektor d ∈ Rk derart, dass gilt
π[P(A, b)] = P(B, d).
Beweis:
• sei Bx ≤ d das lineare Ungleichungssystem, das sich ausAx ≤ b nach FM-Elimination von x1 ergibt
• aus der Rücksubstitutionsregel (4) ergibt sich
(x∗2 , . . . , x∗n ) ∈ P(B, d) ⇐⇒ es gibt ein x∗1 ∈ R mit (x∗1 , x∗2 , . . . , x∗n ) ∈ P(A, b)
• das ist aber genau die Behauptung P(B, d) = π[P(A, b)] .
69 / 112
Fourier-Motzkin
Bemerkung
• Der Beweis des Projektionslemmas ist konstruktiv
• mit dem FM-Verfahren kann man eine geeignete Matrix B und einen
geeigneten Vektor d berechnen.
70 / 112
Theorie linearer Ungleichungen
Gliederung
• Grundbegriffe
• der Algortihmus von Fourier-Motzkin
• Alternativsätze
• Seitenflächen
• konvexe Kegel
• zwei Anwendungen
71 / 112
Alternativsätze
• wir betrachten ein Ungleichungssystem Ax ≤ b
• Fourier-Motzkin liefert ein Verfahren, um die Lösbarkeit zu testen
• wir werden im folgenden die Lösbarkeit charakterisieren
72 / 112
Alternativsätze
Satz 8 (Alternativsatz)
Genau eine der Aussagen ist richtig:
(i) das System Ax ≤ b besitzt eine Lösung
(ii) es gibt einen nichtnegativen Vektor y ∈ RI mit nur endlich vielenpositiven Komponenten derart, dass
yT A = 0T und yT b < 0 .
Bemerkung
• da nur endlich viele Komponenten von y von 0 verschieden sind,
• gibt es eine endliche Teilmenge I ′ ⊆ I derart, dass
yT A =Xi∈I′
yi aTi und yT b =
Xi∈I′
yi bi
• damit sind die Ausdrücke yT A und yT b im Satz wohldefiniert.73 / 112
AlternativsätzeSatz 8 (Alternativsatz)Genau eine der Aussagen ist richtig:
(i) Das System Ax ≤ b besitzt eine Lösung.
(ii) Es gibt nichtnegativen einen Vektor y ∈ RI mit nur endlich vielenpositiven Komponenten derart, dass yT A = 0T und yT b < 0 .
Beweis:
• die Aussagen können nicht gleichzeitig gelten
• andernfalls würde folgen: 0 = 0T x = yT Ax ≤ yT b < 0
• angenommen (i) ist falsch
• nach der FM-Elimination aller Variablen existiert eine Ungleichung derForm 0 ≤ t mit t < 0
• diese Ungleichung ist nichtnegative Linearkombination von höchstenszwei Ungleichungen des Systems davor
74 / 112
Alternativsätze
• diese sind wiederum nichtnegative Linearkombinationen von höchstenszwei Ungleichungen des Systems davor
•...
• damit existiert ein nichtnegativer Vektor y mit höchstens 2n positivenEinträgen, so dass yT A = 0T und yT b < 0.
• ist das Systems Ax ≤ b endlich, so ist der obige Alternativsatz auchals Lemma von Farkas bekannt
• wir werden später noch eine andere Form des Lemmas von Farkasbehandeln
75 / 112
Alternativsätze
Korollar 9Das System Ax ≤ b ist nicht lösbar genau dann, wenn ein endlichesTeilsystem A′x ≤ b′ nicht lösbar ist.
Beweis:
• eine Lösung x∗ von Ax ≤ b ist natürlich auch eine Lösung desTeilsystems A′x ≤ b′
• ist Ax ≤ b nicht lösbar, so gilt Alternative (ii) im Satz 8
• die Alternative (ii) bezieht sich auf ein endliches Teilsystem
• also ist auch dieses nicht lösbar.
76 / 112
Alternativsätze
Korollar 10 (Gordan)
Sei A ∈ Rm×n eine Matrix. Dann gilt genau eine der Aussagen:
(i) Ax = 0, x ≥ 0 hat eine Lösung x∗ 6= 0.
(ii) yT A < 0T hat eine Lösung.
Beweis: Übung.
Bemerkung
x < y bedeutet, dass die Relation xj < yj für alle Komponenten gilt.
77 / 112
Theorie linearer Ungleichungen
Gliederung
• Grundbegriffe
• der Algortihmus von Fourier-Motzkin
• Alternativsätze
• Seitenflächen
• konvexe Kegel
• zwei Anwendungen
78 / 112
Seitenflächen
• sei S ⊆ Rn eine beliebige nicht-leere Teilmenge
• sei cT x ≤ z eine lineare Ungleichung
• S impliziert die Ungleichung cT x ≤ z , wenn gilt:
cT x ≤ z für alle x ∈ S
• ebenso sagt man, dass cT x ≤ z eine für S gültige Ungleichung ist
• diese Implikation erlaubt zwei Interpretationen:
79 / 112
SeitenflächenOptimierung:
(i) supx∈S cT x ≤ z .
(ii) F = {x ∈ S | cT x = z} ist die Menge aller Optimallösungen desentsprechenden Maximierungsproblems.
Geometrie:
(i) Der Halbraum P(c, z) = {x ∈ Rn | cT x ≤ z} enthält S.
(ii) F = {x ∈| cT x = z} ist eine Seitenfläche von S.
80 / 112
Seitenflächen
• analog:
• seien Ax ≤ b ein Ungleichungssystem und cT x ≤ z eine Ungleichung
• cT x ≤ z wird von Ax ≤ b impliziert, wenn gilt:
Ax∗ ≤ b =⇒ cT x∗ ≤ z für alle x∗ ∈ Rn .
• die zweite Form des Farkas-Lemmas ist nun:
Lemma 11 (Farkas)
Sei Ax ≤ b ein endliches lösbares lineares Ungleichungssystem. Dann wirdcT x ≤ z genau dann von Ax ≤ b impliziert, wenn es einen Vektory ≥ 0 gibt mit
cT = yT A und yT b ≤ z .
81 / 112
SeitenflächenBeweis:
(i) sei y ≥ 0 so, dass cT = yT A und yT b ≤ z
• für jede Lösung x von Ax ≤ b gilt dann yT (b− Ax) ≥ 0
• und somitcT x = yT Ax ≤ yT b ≤ z
• die Bedingung ist also hinreichend
• zum Beweis der Rückrichtung betrachten wir das System
Ax ≤ b−cT x ≤ −(z + ε)
• nach Annahme hat dieses System für kein ε > 0 eine Lösung
• führe FM-Elimination durch (unabhängig von ε)
• aus der Endlichkeit des Systems folgt:
82 / 112
Seitenflächen• es existiert ein Vektor y ≥ 0 und ein Skalar y0 ≥ 0 mit
yT A − y0c = 0 und yT b − y0(z + ε) < 0
• wäre y0 = 0, so hätten wir
yT A = 0 und yT b < 0
• nach dem Alternativsatz 8 hätte dann das System Ax ≤ b keineLösung, im Widerspruch zur Voraussetzung
• somit ist y0 > 0 und wir können nach Division durch y0 annehmen:
yT A = c und yT b < (z + ε)
• da dies für alle ε > 0 gilt, folgt yT b ≤ z .
83 / 112
Seitenflächen
Bemerkung
• das Farkas-Lemma kann auf unendliche Ungleichungssysteme mitkompakter Lösungsmenge S = P(A, b) verallgemeinert werden
• ohne diese Zusatzannahme ist das Farkas-Lemma bei unendlichenSystemen falsch:
Beispiel
• sei S = {(x , y ) ∈ R2 | x > 0, y ≥ 1/x}• S ist Lösungsmenge des unendlichen Ungleichungssystems
1r 2 x + y ≥ 2
r(r ∈ R, r > 0)
• die Ungleichung x ≥ 0 gilt offenbar für S
• sie lässt sich aber nicht als positive (endliche) Linearkombination ausdem System ableiten.
84 / 112
Seitenflächen
Die zweite Form des Farkas-Lemmas liefert eine Methode, wie man im Prinzipalle Seitenflächen von S = P(A, b) konstruieren kann:
• wir nehmen oBdA S 6= ∅ an
• sei AF x ≤ bF ein Teilsystem von Ax ≤ b
• sei cT = 1T AF der Summenvektor aller Zeilenvektoren von AF
• entsprechend sei z = 1T bF die Summe der rechten Seiten
• dann ist ist die Ungleichung cT x ≤ z für S gültig
• denn für alle x ∈ P(A, b) gilt:
cT x = 1T AF x ≤ 1T bF = z
85 / 112
Seitenflächen
• wegen AF x ≤ bF gilt:
1T AF x = 1T bF ⇐⇒ AF x = bF
• somit bestimmt die Teilmatrix AF eine Seitenfläche
F = {x ∈ S | cT x = z} = {x ∈ Rn | Ax ≤ b, AF x = bF }
• es bleibt zu zeigen, dass man auf diese Weise alle nichttrivialenSeitenflächen von P(A, b) erhält
• sei dazu F eine beliebige nichtleere Seitenfläche, d.h.
F = {x ∈ Rn | Ax ≤ b, cT x = z}
86 / 112
Seitenflächen
• nach dem Farkas-Lemma existiert ein Vektor y ≥ 0 derart, dass
cT = yT A und yT b ≤ z .
• wenn wir y auf seine positiven Komponenten einschränken, erhaltenwir eine endliche Teilmatix AF und ein y ≥ 0 derart, dass
cT = yT AF und yT bF ≤ z .
• da F 6= ∅, gilt z = yT bF , denn:
x ∈ F =⇒ z = cT x = yT AF x ≤ yT bF ≤ z .
• daraus folgt:
• F besteht genau aus den Punkten x ∈ P(A, b), die die GleichungAF x = bF erfüllen, d.h.
F = {x ∈ Rn | Ax ≤ b, AF x = bF }.
87 / 112
Seitenflächen
Beispiel
• das Standardsimplex in Rn ist die Menge
∆n = {(x1, . . . , xn) | x1 + . . . + xn = 1, x1 ≥ 0, . . . , xn ≥ 0}.
• ein Eckpunkt von ∆n entspricht einer einelementigen Seitenfläche
• und damit einer Auswahl von Ungleichungen derart, dass daszugeordnete Gleichungssystem nur eine einzige Lösung in∆n gestattet.
• also ergeben sich genau die n Einheitsvektoren als die Ecken von ∆n .
x
x
x
1
2
3
1
1
1
88 / 112
Seitenflächen
Satz 12Ist Ax ≤ b ein endliches Ungleichungssystem, so hat die abgeschlossenekonvexe Menge P(A, b) nur endlich viele verschiedene Seitenflächen.
Beweis: Ax ≤ b hat nur endlich viele verschiedene Teilsysteme AF x ≤bF .
Beispiel
Die KugelS = {(x , y , z) ∈ Rn | x 2 + y 2 + z2 ≤ R}
lässt sich nicht als Lösungsmenge eines endlichen linearenUngleichungssystem darstellen, denn S hat unendlich viele Extrempunkte.
89 / 112
Theorie linearer Ungleichungen
Gliederung
• Grundbegriffe
• der Algortihmus von Fourier-Motzkin
• Alternativsätze
• Seitenflächen
• konvexe Kegel
• zwei Anwendungen
90 / 112
konvexe Kegel
wir betrachten jetzt eine spezielle Klasse von Ungleichungssystemen
eine nichtleere Menge K ⊆ Rn ist ein (konvexer) Kegel, wenn gilt:
(K1) λx ∈ K für alle x ∈ K und Skalare λ ≥ 0
(K2) x + y ∈ K für alle x, y ∈ K
• ein konvexer Kegel ist also eine unter nichtnegativenLinearkombinationen abgeschlossene Menge
• ein nichtleerer Kegel enthält immer zumindest den Punkt 0 ∈ Rn
91 / 112
konvexe Kegel
Beispiel
x
x
x
1
2
3
x
x
x
1
2
3
• jeder nichtleeren Menge S ⊆ Rn kann man auf zwei (zueinander„duale“) Weisen einen Kegel zuordnen.
• zum einen betrachtet man die Menge aller nichtnegativenLinearkombinationen:
92 / 112
konvexe Kegel
• cone S ist die konische Hülle von S oder der von S erzeugteKegel:
cone S = {kX
i=1
λi si |, si ∈ S, λi ≥ 0} (5)
Beispiel
• sei A ∈ Rm×n eine Matrix mit Spalten A1, . . . , An
• dann bezeichnet cone A den von den Spalten von A erzeugten Kegel
cone A = {nX
i=1
λi Ai |, λi ≥ 0}
93 / 112
konvexe Kegel
• dual dazu definieren wir
S◦ = {x ∈ Rn | sT x ≤ 0 für alle s ∈ S}. (6)
• ist S ein Kegel, so ist S◦ ist der zu S duale Kegel
• S◦ ist Lösungsmenge eines linearen Ungleichungssystems und daherabgeschlossen (und konvex)
• fassen wir S als Matrix mit den Zeilenvektoren sT auf, so gilt
S◦ = P(S, 0).
• für konvexe Kegel sind die Polare und der duale Kegel identisch:
94 / 112
konvexe Kegel
Lemma 13Sei K ⊆ Rn ein konvexer Kegel. Dann gilt
K ◦ = K pol .
Beweis:
• es gilt K ◦ ⊆ K pol , denn
cT x ≤ 0 =⇒ cT x ≤ 1 für alle x ∈ K .
• sei umgekehrt c ∈ K pol , d.h. cT x ≤ 1 für alle x ∈ K
• mit x ∈ K ist auch λx ∈ K für alle λ ≥ 0
• d.h. λ(cT x) ≤ 1 für alle λ ≥ 0
• somit cT x ≤ 0 und K pol ⊆ K ◦.
95 / 112
konvexe Kegel
Analog der Argumentation bei der Polaren macht sich leicht klar:
• S ⊆ (S◦)◦.
• S ⊆ T =⇒ T ◦ ⊆ S◦.
• S◦ = (cone S)◦.
Satz 14Sei S ⊆ Rn eine beliebige nichtleere Menge. Dann gilt
(i) S ist ein konvexer Kegel ⇐⇒ S = cone S.
(ii) S ist ein abgeschlossener konvexer Kegel ⇐⇒ S = (S◦)◦.
Beweis:
• der Beweis von Behauptung (i) ist Routine
• Aussage (ii) ist der Spezialfall der analogen Aussage über die Polarekonvexer Kegel.
96 / 112
konvexe Kegel
Korollar 15Sei A ∈ Rm×n eine Matrix. Dann gilt:
cone A = P(AT , 0)◦.
Beweis:
• für eine beliebige Menge S haben wir gesehen:
• fassen wir S als Matrix mit den Zeilenvektoren sT auf, so gilt
S◦ = P(S, 0).
• speziell für S = cone A gilt dann:
(cone A)◦ = P(AT , 0).
• wegen K = (K ◦)◦ für konvexe Kegel, folgt:
cone A = ((cone A)◦)◦ = P(AT , 0)◦.
97 / 112
Theorie linearer Ungleichungen
Gliederung
• Grundbegriffe
• der Algortihmus von Fourier-Motzkin
• Alternativsätze
• Seitenflächen
• konvexe Kegel
• zwei Anwendungen
• das Erfüllbarkeitsproblem
• stochastische Matrizen
98 / 112
Zwei Anwendungen
Wir rechnen über dem Zahlenbereich {0, 1} mit den Operationen:
• „oder“
∨ 0 10 0 11 1 1
• „und“
∧ 0 10 0 01 0 1
• und der Negation:− 0 1
1 0
99 / 112
Zwei Anwendungen
• eine Boolesche Funktion ist eine Funktion ϕ : {0, 1}n → {0, 1}
• jede Boolesche Funktion ϕ(x1, . . . , xn) kann in konjuktiverNormalform (KNF) dargestellt werden
• d.h.ϕ(x1, . . . , xn) =
^Ci ,
• hierbei haben die Klauseln Ci die Form
Ci = ai1y1 ∨ . . . ∨ ainyn mit aij ∈ {0, 1} und yi ∈ {xi , xi}.
Beispiel
ϕ(x1, x2, x3) = (x1 ∨ x2) ∧ (x1 ∨ x2 ∨ x3) ∧ x3.
100 / 112
Zwei Anwendungen
Erfüllbarkeitsproblem
• gegeben eine Boolesche Funktion ϕ in KNF,
• entscheide, ob ϕ den Wert 1 annehmen kann.
• d.h.: kann eine Belegung der Variablen gefunden werden derart, dassjede Klausel Ci den Wert 1 annimmt?
• das Problem kann man mit Ungleichungssystemen modellieren:
• in der Klausel Ci = ai1y1 + . . . ainyn ersetzen wir xj durch 1− xj
• wir haben dann das Problem: gibt es eine Lösung mit ganzzahligenxj ∈ {0, 1} derart, dass
ai1y1 + . . . ainyn ≥ 1 ?
101 / 112
Zwei Anwendungen
Beispiel
• sei C = x2 ∨ x5 ∨ x7
• dann ist C erfüllbar, wenn es eine ganzzahlige {0, 1}-Lösung derUngleichung
x2 + (1− x5) + x7 ≥ 1 ←→ −x2 + x5 − x7 ≤ 0
gibt.
• Das Erfüllbarkeitsproblem fragt also nach einer ganzzahligen{0, 1}-Lösung des aus allen Klauseln gebildeten Ungleichungssystems.
102 / 112
Zwei AnwendungenWir betrachten folgenden Spezialfall:
2-Sat
• gegeben eine Boolesche Funktionen f in KNF mit höchstens2 Variablen pro Klausel
• ist f erfüllbar ?
2-SAT kann mit dem FM-Verfahren effizient gelöst werden:
• eine 2-SAT-KNF hat höchstens n2 Klauseln
• wir können annehmen, dass keine zwei Klauseln(xi ∨ xj ), (xi ∨ xj ) existieren
• die sind genau dann erfüllbar, wenn xj = 1
103 / 112
Zwei Anwendungen
Beispiel
• wann sind zwei Klauseln C1 = (xk ∨ xs) und C2 = (xk ∨ xl ) simultanerfüllbar?
• offensichtlich genau dann, wenn C = (xs ∨ xl ) erfüllbar ist
• die entspricht aber einem Schritt der FM-Elimination:
C1 = xk ∨ xs
C2 = xk ∨ xl
C = xs ∨ xl
←→−xk − xs ≤ −1xk − xl ≤ 0
− xs − xl ≤ −1
• C ist die sog. Resolvente der Klauseln C1 und C2
• offensichtlich sind C1 und C2 genau dann gleichzeitig erfüllt, wennihre Resolvente C erfüllt ist
• im Ungleichungssystem entspricht C der Summe der aus C1 undC2 gewonnenen Ungleichungen
104 / 112
Zwei Anwendungen
Dann gilt:
• bei jeder Addition von Ungleichungen bleiben die Koeffizienten imBereich {−1, 0, +1}
• die Elimination einer Variablen führt wieder auf ein 2-SAT-Problem
Für das allgemeine Erfüllbarkeitsproblem ist gegenwärtig kein effizienter Lö-sungsalgorithmus bekannt.
105 / 112
Theorie linearer Ungleichungen
Gliederung
• Grundbegriffe
• der Algortihmus von Fourier-Motzkin
• Alternativsätze
• Seitenflächen
• konvexe Kegel
• zwei Anwendungen
• das Erfüllbarkeitsproblem
• stochastische Matrizen
106 / 112
Zwei Anwendungen
• in Anwendungssimulationen betrachtet man Systeme, die sich zu jedem(diskreten) Zeitpunkt in einem von n Zuständen {Z1, . . . , Zn} befinden
Beispiel1 2
3 4
• ein Spieler hält sich in einem der vier Punkte auf
• in jedem Schritt
• bleibt er mit Wahrscheinlichkeit 12 da, wo er ist
• oder geht mit Wahrscheinlichkeit 14 entlang einer Kante
107 / 112
Zwei Anwendungen
• wir nehmen allgemein an, dass das System mit Wahrscheinlichkeit
mij = Pr (Zi |Zj )
in den Zustand Zi übergeht, wenn es vorher im Zustand Zj war.
• die entsprechende Übergangsmatrix
M = [mij ] ∈ Rn×n
hat nur nichtnegative Koeffizienten mij ≥ 0 und SpaltensummenPni=1 mij = 1.
• M ist eine stochastische Matrix: alle Spalten sindWahrscheinlichkeitsverteilungen
• in unserem Beispiel hätte M die Form
M =
0BBB@12
14
14 0
14
12 0 1
414 0 1
214
0 14
14
12
1CCCA108 / 112
Zwei Anwendungen• nehmen wir an, dass sich das System zum Zeitpunkt t mit der
Wahrscheinlichkeit πi im Zustand Zi befindet (i = 1, . . . , n).
• die Wahrscheinlichkeit, sich zum Zeitpunkt t + 1 im ZustandZk (k = 1, . . . , n) zu befinden ist:
π′k =nX
i=1
mki πi
• in Matrixnotation haben wir also:
π′ = Mπ (π = [π1, . . . , πn], π′ = [π′1, . . . , π
′n]).
109 / 112
Zwei Anwendungen• sei in unserem Beispiel π = [1, 0, 0, 0]
• dann ist π′ = [ 12 , 1
4 , 14 , 0]
• nach zwei Schritten π′′ = [ 38 , 2
8 , 28 , 1
8 ]
• d.h. die Wahrscheinlichkeiten verändern sich von Schritt zu Schritt
• dieser Prozess wirft zumindest zwei Fragen auf:
• existiert eine Grenzverteilung?
• existiert eine Startverteilung, die sich nicht ändert?
• wir beantworten die zweite Frage
• π heiße stationär, wenn π′ = Mπ = π
• eine stationäre Wahrscheinlichkeitsverteilung ist somit ein (rechter)Eigenvektor von M zum Eigenwert λ = 1
110 / 112
Zwei Anwendungen
Proposition 16
Die stochastische Matrix M = [mij ] besitzt eine stationäreWahrscheinlichkeitsverteilung.
Beweis:
• wir setzen A = M − I .
• es genügt zu zeigen, dass
Ax = 0, x ≥ 0, x 6= 0
eine Lösung hat
• diese können wir dann auf Koeffizientensumme 1 normieren underhalten das gewünschte π.
111 / 112
Zwei Anwendungen• wir nehmen an, dass keine solche Lösung existiert
• dann gäbe es nach dem Alternativsatz von Gordan (Korollar 10) einenVektor y mit der Eigenschaft
0T > yT A = yT M − yT d.h. yj >
nXi=1
mij yi für alle j = 1, . . . , n.
• für yk = min{y1, . . . , yn} gilt aber
nXi=1
mik yi ≥nX
i=1
mik yk = yk .
• somit muss eine stationäre Verteilung existieren.
• in unserem Beispiel ist π = [ 14 , 1
4 , 14 , 1
4 ] eine stationäre Verteilung.
112 / 112