Extensive Form Game. “Burn the Boats” לעיתים אנחנו שומעים את הביטוי...

Post on 11-Jan-2016

227 views 0 download

Tags:

Transcript of Extensive Form Game. “Burn the Boats” לעיתים אנחנו שומעים את הביטוי...

Extensive Form Game

“Burn the Boats”

הביטוי • את שומעים אנחנו let’s burn“לעיתיםthe boats? הכוונה”. מה

אלטרנטיבה – על Bלוותרלהשיג – ולנסות ברירה להותיר לא Aובכך

• Paradox of commitment• It is by limiting my own options that I can manage to

influence the rival’s course of actions in my interest.

Hernan Cortes and the Aztecs

• From a good Spanish family.– Failed at being a

European soldier.– Failed at becoming a

lawyer.Cortes was hungry for wealth and recognition.

Cortes

• 1519 – landed on the coast of Mexico with :– 600 men, 16 horses, and

a few cannon.

• WHY WOULD CORTES BURN HIS SHIPS WHEN HE GOT TO THE NEW WORLD?

5

C

Burn ships

Keep Ships

S

S Be careful

Fight Hard

C = 100, S = 0

C = -100, S = -100

C = 100, S = 0

C = 0, S = 10

Think of Cortes trying to motivate his own soldiers

Fight Hard

Be careful

6

C

Burn ships

Keep Ships

S

S Be careful

Fight Hard

C = 100, S = 0

C = -100, S = -100

C = 100, S = 0

C = 0, S = 10

If no retreat possible, will fight hard or die. But if retreat is possible, may fight less hard and ‘run away’

Fight Hard

Be careful

7

C

Burn ships

Keep Ships

S

S Be careful

Fight Hard

C = 100, S = 0

C = -100, S = -100

C = 100, S = 0

C = 0, S = 10

So Cortes wants to burn his ships. It is a credible commitment not to retreat – and this alters how his own troops behave.

Fight Hard

Be careful

על Burn the boatsעוד

•? כה עד בזה נתקלנו היכן–Golden Balls - ל – ביטול stealהתחייבות ובכך

- ל splitהאופציה– - ב ההגה chicken gameעקירת

• Busi ness guru, Tom Peters swears by Cortés’ destruc tive strat egy by going so far as to sug gest that every com pany hire a CDO – a Chief Destruc tive Officer.

הזמן Extensive Form Game - מימדמשמעותי - • מרכיב הפעולות וסדר הזמן מימד

משחק בניתוח• - ה שום normal form gameתצוגת משלבת לא

הפעולות ) סדר של זמן( sequenceמרכיב אוזמנית – בו פועלים השחקנים

• - ה הינה extensive form gameתצוגתהמרכיב את גם שמייצגת אלטרנטיבה

שבמשחק הטמפורלי– perfect information extensive-form games– imperfect-information extensive-form games

Perfect Information Extensive Form Game

• A (finite) perfect-information game (in extensive form) is defined by the tuple (N ; A ; H ; Z ; χ ; ρ ; σ ; u), where:– Players: N– Actions: A– Choice nodes and labels for these nodes:

• Choice nodes: H• Action function: χ : H → 2A assigns to each choice node a set

of possible actions• Player function: ρ : H → N assigns to each non-terminal node

h a player iϵN who chooses an action at h– .

Perfect Information Extensive Form Game

• A (finite) perfect-information game (in extensive form) is defined by the tuple (N ; A ; H ; Z ; χ ; ρ ; σ ; u), where:– Terminal nodes: Z is a set of terminal nodes, disjoint

from H– Successor function: σ : HxA → H U Z maps a choice

node and an action to a new choice node or terminal node such that for all h1,h2 ϵ H and a1,a2 ϵA, if σ(h1,a1) = σ(h2,a2) then h1 = h2 and a1 = a2

• Choice nodes form a tree: nodes encode history

– Utility function: u = (u1,…,un); ui : Z → is a utility function for player i on the terminal nodes Z.

The Sharing Gameדוגמה – ביניהם • לחלק צריכים ואחות דולר 2אחמתחיל • האחמקבלים • שניהם אז מסכימה לא האחות 0אם

אסטרטגיות

שחקן • לכל יש טהורות אסטרטגיות כמהבמשחק?

(2-0,1-1,0-2)אסטרטגיות 3יש 1לשחקן –אסטרטגיות( 2^3 )8יש 2לשחקן –

הגדרה - טהורה אסטרטגיה

• - ב שחקן של טהורה perfectאסטרטגיהinformation game של מלאה הגדרה היא

צומת ) כל עבור ינקוט בה ( nodeהפעולהזה לשחקן השייכת

דוגמה

שחקן • של הטהורות האסטרטגיות ?2מהן– S2 = {(C,E),(C,F),(D,E),(D,F)}

שחקן • של הטהורות האסטרטגיות ?1מהן– S1 = }(B,G),(B,H),(A,G),(A,H)}

- ל לעולם נגיע לא זה Hבמצבהטהורה האסטרטגיה עדיין אבל

(A,H( - מ( (A,Gשונה

נאש" מ ש

• , ניתן- הטהורה האסטרטגיה הגדרת בסיס על: גם מחדש להגדיר

מעורבות – אסטרטגיות–Best responseנאש" – מ ש

- ל המשחק Normal Formהמרת

• - ה את להמיר - extensive form gameניתן ל normal form game קלה יחסית בצורה

:חשיבות / ב שהתקיימו הוכחות התוצאות -כלnormal form game ב גם -יתקיימו

extensive form

- ה extensive form gameיתרונות

זמן • של אלמנט בהם שיש משחקים לייצג מאפשר•: קומפקטית בצורה משחקים לייצג מאפשר

פעולות – הרבה עם משחקיםהיינו ) – הקודמת בדוגמה למשל מצבים של חזרה מונע

- payoff pairs 16צריכים ה שבאמצעות extensiveבעודform לנו 5מספיק

אבל... •– - כ לייצג ניתן משחק כל , extensive formלא כלומר )

- מ - normal formהמעבר תמיד extensive formל לאמתקיים(

matching penniesדוגמה – –

- ב" מ Extensive Formש

סדרתית • בצורה עובדים שאנחנו מכך נובע(sequential)

• - !!! ל/ ורק אך נכון המשפט לב י perfectשימinformation extensive form game - שב ) ראינו כבר

normal form אין שבהם מצבים - PSNEיש ב, למשלmatching pennies)

• - ב מעורבת באסטרטגיה להשתמש טעם יש האםperfect information extensive form game ?

לא! ) – אני עשינו מה רואה השני השחקן ממילא כי לא - מה כלום (randomizationמרוויח

- ל המשחק Normal Formהמרת

אסטרטגיות • בסיס על המשקל שיוויי מהם? במשחק טהורות

Subgame Perfection

מ" • ששחקן( – BH,CE)ש למה מוזר לו Hישחק 1קצת יש אםהאלטרנטיבה את ?Gגם

– - ב הבחירה " – Hלמעשה שחקן מ בש עלינו ששומר האיום 2היא - ב יבחר שאם שחקן Fיודע - 1אז ב - Hיבחר ב לבחור לו עדיף Eולכן

– ? שחקן באמת האם אמין איום זה האמנם ברגע 1אבל כך יפעלהאמת?

פורמלית הגדרה

•s הואsubgame perfect equilibrium שלG אםלכל אם של, Gשל’ subgame Gורק sהנגזרת

’Gשל Nash equilibriumהיא’ Gל-

דוגמה

הפעולה subgameב- " )Hהזה הפיתרון ולכן נאש מ ש לא לא( BH,CEהיא הואsubgame perfect equilibrium

Subgame G’

נוספות נקודות

• - ש גם Gמכיוון כל subgameהוא אז עצמו שלSPE גם .NEהוא

אמינים • לא איומים פוסלת הנוכחית ההגדרהnon-credible threats

לנו יש subgame perfect equilibriumהאםבמשחק?

- )Hהאסטרטגיה • off pathנקראת( AH,CFב

Backward Induction

• - ה לחישוב subgame perfect equilibriumדרךמשחק של

all leaf nodes

vector denoting the utility for each player

set of all actions available to player at that node

Centipede gameדוגמה –

• - ה ?subgame perfect equilibriumמהוהראשון Dבוחר 1שחקן – בתור כבר

היא • זו - Pareto-dominatedתוצאה האחרות התוצאות כל ידי על) השניה) מלבד

•? " זה מ ש לפי ישחקו אנשים האםשחקן • צריך שחקן 2מה אם - Aבחר 1לעשות ה? עליו SPEלפי

Dלבחור שחקן – גם לבחור 1אבל צריך . Dהיה שחקן אולי אז זה היגיון 1לפי

? רציונלית לא בצורה משחקבספרות – רבות נחקר הנושא

Example: Mini Ultimatum Game• Proposer (Player 1) can suggest one of two splits of £10: (5,5)

and (9,1).• Responder (Player 2) can decide whether to accept or reject

(9,1), but has to accept (5,5). Reject leads to 0 for both

Player 1

(9,1)

a r

9 1 0 0

(5,5)

5 5

Player 2

Mini Ultimatum Game in Strategic Form

Player 2accept (9,1) reject (9,1)

Player 1 propose (5,5) 5,5 5,5propose (9,1) 9,1 0,0

• There are two equilibria: 1. (propose (9,1), accept (9,1))2. (propose (5,5), reject (9,1)).

• Equilibrium 2 is in weakly dominated strategies (reject (9,1) is weakly dominated)

Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)

Player 1

(9,1)

a r

9 1 0 0

(5,5)

5 5

Player 2

Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)• The optimal action is accept

Player 1

(9,1)

a r

9 1 0 0

(5,5)

5 5

Player 2

Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)• The optimal action is accept• There is one subgame of length 2, the whole game

Player 1

(9,1)

a r

9 1 0 0

(5,5)

5 5

Player 2

Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)• The optimal action is accept• There is one subgame of length 2, the whole game• Taking “accept” in the subgame of length 1 as given, we see

that (9,1) is optimalPlayer 1

(9,1)

a r

9 1 0 0

(5,5)

5 5

Player 2

Extensive Form Games with Perfect Information

Example (172.1)1

2

2

CE

F

D

G

H

2,11,32,2

3,0

2

KJI

1,11,0

Extensive Form Games with Perfect Information

Example (172.1)1

22

CE

F

D

G

H

2,11,32,2

3,0

2

KJI

1,11,0

Player 2 Optimal Strategies:(FHK),(FIK),(GHK),(GIK)

Extensive Form Games with Perfect Information

Example (172.1)1

22

CE

F

D

G

H

2,11,32,2

3,0

2

KJI

1,11,0

Player 2 Optimal Strategies:(FHK),(FIK),(GHK),(GIK)

Player 1 Best Responses:(C),(C),(C or D, or E),(D)

Extensive Form Games with Perfect Information

1

22

CE

F

D

G

H

2,11,32,2

3,0

2

KJI

1,11,0

Strategy Pairs: (C,FHK), (C,FIK), (C,GHK), (D,GHK), (E,GHK), (D,GIK)

Player 2 Optimal Strategies:(FHK),(FIK),(GHK),(GIK)

Player 1 Best Responses:(C),(C),(C or D, or E),(D)

All SPE

Example: Voting for a PayraiseThree legislators are voting on whether to give themselves a pay raise. All three want the pay raise; however, Each face a small cost in voter resentment c>0.The benefit for the raise is greater than cost: b>cThey vote in the order 1-2-3. Simple majority ruleWhat is the outcome obtained by backward induction? (N; NY; nyyn)

Diagram courtesy: Dr. Tayfun Sönmez