Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Spieltheorie_WS1213

.pdf
Скачиваний:
13
Добавлен:
21.03.2016
Размер:
2.44 Mб
Скачать

3.7. WEITERE ANWENDUNGEN

79

Spiel, Unsicherheit, . . . ) mit einzubeziehen.

Die Darstellung geht dabei davon aus, dass die Zentralbank auf Weisung der jeweiligen Regierung agiert, d.h. keine eigenst¨andigen Ziele verfolgt.

Die Regierung (Zentralbank) setzt ihr geldpolitisches Instrumentarium so ein, dass ihre Nutzenfunktion

uG = −απ2 − (y − y˜)2

(3.37)

maximiert wird.π bezeichnet dabei die Inflationsrate, y den Output und y˜ den Zieloutput der Regierung, der beispielsweise konsistent ist mit Vollbesch¨aftigung.

Abweichungen der Inflationsrate von einem Zielwert von Null und Abweichungen von dem Outputziel gehen jeweils negativ und mit steigendem Grenzleid in die Nutzenfunktion ein. Der Parameter α reflektiert die Bedeutung des Inflationsziels relativ zum Outputziel. Eine Zentralbank, die sich ausschließlich der Inflationsbek¨ampfung widmet (”inflation nutter”) kann durch α → ∞ charakterisiert werden.

Es ist etwas bequemer – und in der Literatur ublich¨ – anstelle der Nutzenfunktion (3.37) die folgende Verlustfunktion zu postulieren:

LG = −uG = απ2 + (y − y˜)2

(3.38)

Nat¨urlich sind die Maximierung von (3.37) und die Minimierung (3.38) v¨ollig ¨aquivalent.

Das Umfeld der Geldpolitik kann in der denkbar k¨urzesten Weise durch die Phillipskurve beschrieben werden:

y = yN + β (π − πe)

(3.39)

πe ist die vom privaten Sektor erwartete Inflationsrate. yN bezeichnet das ”nat¨urliche” Outputniveau. Aufgrund von Unvollkommenheiten auf Arbeitsund G¨uterm¨arkten kann das yN geringer sein als der mit Vollbesch¨aftigung kompatible Zieloutput der Regierung y˜. Dieser Gedanke kann formalisiert werden durch die Beziehung

y˜ = γ · yN ,

(3.40)

wobei der Parameter γ > 1 als Maß f¨ur die genannten Marktunvollkommenheiten dienen kann.

Der zweite Spieler in diesem Modell ist der private Sektor. Hier k¨onnte nun eine ausf¨uhrliche Modellierung erfolgen, die z.B. Strukturaspekte von Lohnverhandlungen beinhaltet, hier soll es jedoch gen¨ugen, dem privaten Sektor einfach zu unterstellen, dass er nicht systematischen Erwartungsirrt¨mern unterliegen will, sondern seine Erwartungen – in Kenntnis der Zielfunktion (3.38) und dem

¨

”Modell der Okonomie” (3.39) – so bildet, dass sie auch erf¨ullt werden. Dieses Verhalten l¨asst sich also einfach zusammenfassen als

π = πe,

(3.41)

80

KAPITEL 3. NICHTKOOPERATIVE SPIELE I

was der Hypothese Rationaler Erwartungsbildung entspricht. Der zweite Spieler will also letztlich das reale Ziel y = yN erf¨ullt sehen.

Damit sind die Zielfunktionen der Akteure und das Modell beschrieben. Die beiden Spieler sind die Regierung und der private Sektor, die Zielfunktion der Regierung ist (3.38), die Zielfunktion der privaten Sektors ist in diesem Modell zwar nicht explizit gemacht, dessen Verhalten aber in (3.41) zusammengefasst. Die Strategievariable der Regierung ist die Inflationsrate, diejenige des privaten Sektors ist die Inflationserwartung. Damit liegt ein ”Spiel” vor, dessen NashGleichgewicht nun bestimmt werden kann.

Der erste Schritt dazu besteht in der Ermittlung der Reaktionsfunktion π (πe, . . .) der Geldpolitik.

Dazu muss die Zielfunktion (3.38) in eine Form gebracht werden, in der außer exogenen Konstanten nur noch die beiden Strategievariablen π und πe enthalten sind. Dazu wird mit Hilfe von (3.39) y aus (3.38) eliminiert. Weiterhin wird mit (3.40) y˜ eliminiert. Dies f¨uhrt zu

 

LG = απ2 +

(1 − γ) yN + β (π − πe) 2

(3.42)

Minimierung dieser Funktion uber¨ π ergibt

 

 

∂L

(1 − γ) yN + β (π − πe) = 0,

 

 

G

= 2απ + 2β

(3.43)

 

∂π

woraus sich sofort die Reaktionsfunktion der Regierung als

π =

β

βπe + (γ − 1) yN

(3.44)

α + β2

errechnet.

Zu beachten ist, dass f¨ur γ > 1 die optimale Reaktion der Regierung auf Inflationserwartungen in H¨ohe von Null die Setzung einer positiven Inflationsrate ist. Diese Reaktionsfunktion ist in Abbildung 3.13 auf der n¨achsten Seite als durchgezogene Linie zu sehen.

Die Reaktionsfunktion des privaten Sektors ist aufgrund der extrem sparsamen Modellierung einfach durch Gleichung (3.41) gegeben und in Abbildung 3.13 auf der n¨achsten Seite als Winkelhalbierende zu sehen.

Das Nash-Gleichgewicht f¨ur die Inflationsrate errechnet sich durch Einsetzen von (3.41) in (3.44) und lautet

π =

(γ − 1) β

yN .

(3.45)

 

 

α

 

Das dazugeh¨orige Outputniveau ergibt sich durch Einsetzen von (3.41) in die Phillipskurve (3.39) als

y = yN .

(3.46)

Damit liegt wieder ein Beispiel vor, in dem ein Nash-Gleichgewicht eine o enkundig ine ziente L¨osung darstellt, da f¨ur π = πe = 0 das gleiche Outputniveau d.h. yN erreicht werden k¨onnte und die gesellschaftliche Wohlfahrt gem¨aß

3.7. WEITERE ANWENDUNGEN

81

(3.37) h¨oher w¨are. Der L¨osung (3.46) ist zu entnehmen, dass f¨ur das in (3.40) zum Ausdruck kommende uberambitionierte¨ Outputziel aufgrund von Marktunvollkommenheiten nur eine Zentralbank dieses e ziente Ergebnis erzielt, die sich ausschließlich dem Inflationsziel verpflichtet f¨uhlt, die also so handelt, als ob α → ∞. Dies erkl¨art die weltweite Tendenz zu Zentralbankverfassungen, in denen genau diese Zielvorgabe gemacht wird und ein Eingreifen der gew¨ahlten Regierung nicht oder nur sehr schwer m¨oglich ist.

Abbildung 3.13 zeigt die Reaktionsfunktionen und das Nash-Gleichgewicht dieses Spiels.

Abbildung 3.13: Das Barro-Gordon-Modell

82

KAPITEL 3. NICHTKOOPERATIVE SPIELE I

Kapitel 4

Nichtkooperative Spiele II: Dynamische Spiele mit vollkommener Information und wiederholte Spiele

4.1Lernziele

In diesem Kapitel werden Spielsituationen analysiert, in denen die Spieler zeitlich bzw. logisch nacheinander ihre Entscheidungen tre en (dynamisches Spiel) und dabei genau die Geschichte des Spiels kennen, d.h. bei jeder Entscheidung wissen, an welchem Knoten eines Spielbaums sie sich befinden (vollkommene Information). Die Struktur solcher Spiele kann nur durch die extensive Form ad¨aquat zum Ausdruck gebracht werden; in der Normalform ist diese Information nicht mehr enthalten. Deshalb werden dynamische Spiele auch als extensive form games bezeichnet. Das erste zentrale Anliegen dieses Kapitels besteht in der Analyse und Anwendung dieser Klasse von Spielen.

Dazu wird in Abschnitt 4.2 auf der n¨achsten Seite das L¨osungskonzept der sog. R¨uckw¨artsinduktion eingef¨uhrt. Dabei handelt es sich um ein L¨osungskonzept, bei dem die rationalen Spielz¨uge (zeitlich und/oder logisch) von hinten nach vorne identifiziert werden. Durch diese sequentielle Vorgehensweise wird ein Spiel letztlich in verschiedene Teilspiele zerlegt. Dieses Konzept und die Anforderung an eine L¨osung f¨ur ein aus mehreren Teilspielen bestehendes Spiel – die Eigenschaft der Teilspielperfektheit – sind Gegenstand des Abschnitts 4.3 auf Seite 88.

Eine ganz andere Dimension der zeitlichen Gliederung von Spielen ist die M¨oglichkeit, dass ein und dasselbe Spiel – egal ob es dynamischer oder statischer Natur ist – wiederholt gespielt wird. Bei sehr vielen Interaktionen auf wirtschaftlichem Gebiet, aber auch außerhalb dieses Bereichs, sind Wiederholungen von gleichen Situationen ein ganz wesentliches Merkmal. Daher widmet sich Abschnitt 4.4 auf Seite 93 der Theorie wiederholter Spiele. Es wird

83

84

KAPITEL 4. NICHTKOOPERATIVE SPIELE II

sich dabei zeigen, dass es von großer Bedeutung f¨ur die L¨osung des wiederholten Spiels ist, ob die Situation von vorneherein nur eine wohldefinierte und endliche Zahl von Wiederholungen vorsieht, oder ob dies nicht der Fall ist und eine jedenfalls potentiell unendliche Zahl von Wiederholungen stattfinden kann.

Abschnitt 4.5 auf Seite 107 befasst sich dann mit einigen Anwendungen dynamischer und wiederholter Spiele. Dabei geht es zun¨achst um die Dynamisierung des Cournot-Duopolmodells aus Abschnitt 3.7.1 auf Seite 71; hier wird unterstellt, dass die beiden Spieler ihre Mengen in einer bestimmten Reihenfolge, also zeitlich bzw. logisch nacheinander setzen. Die zweite Anwendung betri t zwei Modifikationen des Barro-Gordon-Modells, dessen einfachste, d.h. statische Version auch bereits im zweiten Abschnitt behandelt wurde. Zum einen wird die Struktur des privaten Sektors etwas reicher modelliert und

¨

ebenfalls eine zeitliche Struktur postuliert, was zu ”dramatischen” Anderungen des Ergebnisses relativ zur Modellierung des Abschnitts 3.7.4 auf Seite 77 f¨uhrt. Schließlich wird die Theorie wiederholter Spiele auf die Barro-Gordon- Struktur angewandt.

4.2R¨uckw¨artsinduktion

”Life can only be understood backwards, but it must be lived forwards.” (Soren Kierkegaard, zitiert nach Rasmusen, 2001, p. 110)

Im einfachsten Fall eines dynamischen Spiels mit vollst¨andiger Information tre en zwei Spieler nacheinander ihre Entscheidungen. Nennen wir diese Spieler 1 und 2. Da keinerlei Informationsdefizite in diesem Spiel vorliegen, kann Spieler 1 das Verhalten von Spieler 2 perfekt antizipieren; da der payo f¨ur Spieler 1 von dem Verhalten des Spielers 2 abh¨angt, wird er dies selbst-

¨

verst¨andlich in Rechnung stellen. Diese Uberlegung etabliert das Prinzip bzw. das L¨osungskonzept der R¨uckw¨artsinduktion.1 Dieses L¨osungskonzept identifiziert die Wahl einer gleichgewichtigen Strategienkombination dadurch, dass eine dynamische Situation von hinten nach vorne durchdacht wird.

Zumindest in einer sehr ubersichtlichen¨ Situation ist dieses Prinzip so einleuchtend, dass auch ohne n¨ahere Begr¨undung dessen Anwendung fast zwingend erscheint. So wurde im Paradiesspiel bereits das Prinzip der R¨uckw¨artsinduktion angewandt, indem zuerst die (logisch zweite) Entscheidung von Adam und Eva uber¨ ”essen” bzw. ”nicht essen” analysiert wurde und erst danach die (logisch erste) Entscheidung von Gott uber¨ ”verbieten” bzw. ”nicht verbieten”. Selbstverst¨andlich hat die Idee der R¨uckw¨artsinduktion in einem statischen Spiel keinerlei Bedeutung, da hier die Struktur des Spiels keine Reihenfolge etabliert.

1In der dynamischen Optimierungsrechnung beschreibt das sog. Bellman-Prinzip ein analoges Vorgehen ”von hinten nach vorne”.

¨

¨

85

4.2. RUCKWARTSINDUKTION

Die Darstellung der vollst¨andigen Struktur eines dynamischen Spiels erfolgt mit Hilfe der bereits bekannten extensiven Form. Eine oft benutzte Alternative dazu ist die Zeitlinie (oder Zeitpfad) eines Spiels. Diese veranschaulicht die logische Reihenfolge sowohl von Spielz¨ugen als auch ggf. exogener Ereignisse, die in Spielen mit Unsicherheit v.a. die Realisation ex ante unbekannter Schocks darstellen. Abbildung 4.1 zeigt die Zeitlinien f¨ur das Paradiesspiel aus Kapitel 2 sowie f¨ur eine Modifikation des Oligopolspiels aus Abschnitt 3.7.1 auf Seite 71, in dem die beiden Anbieter nicht simultan, sondern nacheinander ihre Mengen setzen. Diese Situation wird in den Anwendungen zu diesem Kapitel n¨aher erl¨autert werden. In Teil (b) der Abbildung 4.1 wird außerdem noch ein stochastischer Nachfrageschock in das Spiel eingef¨uhrt (es handelt sich also um ein in diesem Kapitel nicht untersuchtes Spiel unter Unsicherheit). Ein solcher Schock ver¨andert die Entscheidung der beiden Anbieter insoweit, als diese bei ihrer Entscheidung nicht genau uber¨ die Lage der Nachfragekurve Bescheid wissen.

(a)

Gott entscheidet

A+E entscheiden

Zeit

 

„v“ oder „nv“

„e“ oder „ne“

 

(b)

Duopolist 1

Duopolist 2

Nachfrage-

Preise, Zeit

setzt Menge

setzt Menge

schock

Gewinne

Abbildung 4.1: R¨uckw¨artsinduktion

Zeitlinien sind gerade bei dynamischen Spielen mit stetig variierbaren Strategien eine n¨utzliche Alternative zur extensiven Form. (a) zeigt die Zeitlinie des Paradiesspiels, (b) ein Stackelberg-Duopol-Spiel mit stochastischer Nachfrage.

Die Idee der R¨uckw¨artsinduktion l¨asst sich in dem oben eingef¨uhrten Rahmen mit zwei Spielern, die nacheinander Entscheidungen tre en und je eine stetig variierbare Strategievariable haben, wie folgt beschreiben. Der zuletzt ziehende Spieler 2 l¨ost das Problem

max u2 (s2|s1) .

(4.1)

s2

 

Die Schreibweise in (4.1) bringt zum Ausdruck, dass dies bereits f¨ur eine gegebene und beobachtbare Auspr¨agung der Strategievariable des Spielers 1 erfolgt. Generell, d.h. f¨ur eine beliebige Auspr¨agung von s1 kann die L¨osung von (4.1) als Reaktionsfunktion geschrieben werden:

∂u2 (s2

|s1)

= 0 s2 = r2 (s1) .

(4.2)

∂s2

 

 

 

 

86

KAPITEL 4. NICHTKOOPERATIVE SPIELE II

Spieler 1 kennt sowohl das Problem seines Gegenspielers (4.1) als auch dessen L¨osung (4.2); daher kann das Problem von Spieler 1 geschrieben werden als

max u1

(s1

, s2) = max u1 (s1, r2 (s1))

(4.3)

s1

 

s1

 

Die L¨osung dieses Problems ist gegeben durch

∂u1

= 0

(4.4)

 

∂s1

 

und wird mit s1 bezeichnet. Das Strategienpaar (s1, s2) ist das Ergebnis der R¨uckw¨artsinduktion.

Folgende Bemerkungen zu dieser L¨osungsprozedur sind hilfreich:

Viele ¨okonomische Situationen lassen sich in die – zugegebenermaßen abstrakt klingende – Schablone hintereinander folgender Entscheidungen von zwei oder mehr Akteuren pressen. Darunter fallen die Stackelberg- L¨osung eines oligopolistisch strukturierten Marktes, die Entscheidungen von Gewerkschaften und Firmen uber¨ L¨ohne und Besch¨aftigung und viele andere mehr.

(4.2) und (4.4) unterscheiden sich von der Nash-L¨osung des statischen Spiels (3.9) und (3.10) dadurch, dass Spieler 1 bei seiner L¨osung die Reaktionsfunktion des Spielers 2 bereits in Rechnung stellt. Diese Modifikation kann die Natur der L¨osung dramatisch ¨andern, d.h. das Nash-

Gleichgewicht des dynamischen Spiels kann (muss aber nicht) ein v¨ollig anderes sein als bei simultanen Entscheidungen.

Wenn ein statisches Spiel mehrere Nash-Gleichgewichte aufweist, kann eine dynamische Struktur bei der Selektion zwischen diesen Gleichgewichten helfen. R¨uckw¨artsinduktion kann also als eine feinere Methode zur Vorhersage der L¨osung des Spiels verstanden werden. Durch die

Einf¨uhrung der dynamischen Struktur k¨onnen bestimmte Nash-Gleichgewichte des statischen Spiels ”¨uberleben”, andere hingegen nicht.

Eine wichtige Eigenschaft der L¨osung durch R¨uckw¨artsinduktion ist die Tatsache, dass diese keine unglaubw¨urdigen Drohungen erlaubt. Anders gesagt: Die einzige glaubw¨urdige Reaktion des Spielers 2 ist gegeben durch seine Reaktionsfunktion (4.2); nur diese ist konsistent damit, dass Spieler 2 Rationalverhalten an den Tag legt. Glaubw¨urdigkeit ist in der Tat ein ganz zentrales Element in dynamischen Spielen. Es ist wohl eine der wichtigsten Errungenschaften der Spieltheorie, f¨ur Fragen der Glaubw¨urdigkeit einen stringenten Analyserahmen anbieten zu k¨onnen.

F¨ur eine denkbar einfache Illustration der beiden letzten Punkt k¨onnen wir wieder ”Battle of the Sexes” heranziehen. Die extensive Form dieses Spiels

¨

¨

87

4.2. RUCKWARTSINDUKTION

wurde bereits in Abbildung 2.16 auf Seite 41 eingef¨uhrt, wobei dort zwei aqui¨ - valente Darstellungen f¨ur das statische Spiel gegeben werden konnten. Die beiden Teile von Abbildung 4.2 geben nun eine zeitliche Struktur vor und lassen Peter bzw. Petra zuerst entscheiden, wobei der jeweils andere die zuerst getro ene Entscheidung kennt. Es leuchtet sofort ein, dass hier die jeweils fett gedruckten Strategiekombinationen ein Gleichgewicht darstellen.

Peter Petra

 

.

 

OXK

 

B

.

Ballett

OXK

B

 

Ballett

.

Boxk

 

 

Ballett

 

(a)

(2,1)

(0,0)

(0,0)

(1,2)

Petra Peter

 

.

 

Boxk

.

Ballett

Boxk

B

.

 

ALLETT

Boxk

 

 

B

 

ALLETT

(b)

(2,1)

(0,0)

(0,0)

(1,2)

Abbildung 4.2: R¨uckw¨artsinduktion bei battle of sexes

Durch die Annahme einer zeitlichen Struktur kann in Battle of the Sexes (jeweils) ein eindeutiges Ergebnis durch R¨uckw¨artsinduktion ermittelt werden.

Abbildung 4.2 eignet sich auch, um die Idee der Glaubw¨urdigkeit einer Ank¨undigung zu verdeutlichen. Angenommen, die zeitliche Struktur sein durch Abbildung 4.2 (a) gegeben. Petra k¨onnte bei dieser Sequenz versucht sein, damit zu drohen, unabh¨angig von Peter’s Entscheidung ins Ballett zu gehen – nat¨urlich in der Ho nung, dass deshalb auch Peter sich in der ersten Stufe daf¨ur entscheidet. Sollte Peter die Drohung glauben? Die Antwort lautet eindeutig nein, da sich Petra nach Peters Entscheidung f¨ur ”Boxkampf” selbst schaden w¨urde, wenn sie die Ank¨undigung in die Tat umsetzt. Petra’ Drohung w¨are also unglaubw¨urdig und ist somit irrelevant.

Zum Schluss dieses Abschnitts wird noch eine weitere Illustration f¨ur das L¨osungskonzept der R¨uckw¨artsinduktion eingef¨uhrt. Nennen wir dieses Spiel

Der Letzte wird der Erste sein

Zwei Personen sitzen vor einem Stapel mit 10 Karten und d¨urfen nacheinander abheben. Die Regel ist, dass jeder Spieler entweder eine oder zwei Karten aufnehmen muss. Gewonnen hat derjenige Spieler, der die letzte Karte nimmt. Spieler 1 hat das Recht, zuerst zu ziehen. Auch hier kann die L¨osung vom Ende des Spiels her gedacht werden: Spieler 1 hat den sicheren Sieg in der Tasche, wenn er es scha t, dass Spieler 2 vor einem Stapel mit 3 Karten sitzt – dann kann dieser eine oder zwei Karten nehmen, was Spieler 1 dann den Sieg sichert. Abbildung 4.3(a) zeigt die Logik des Arguments. Um diese Situation

88

KAPITEL 4. NICHTKOOPERATIVE SPIELE II

herzustellen, muss Spieler 1 sicherstellen, dass Spieler 2 einmal vor einem Stapel mit 6 Karten sitzt – die Logik sollte nunmehr klar sein und ist in Teil (b) von Abbildung 4.3 zu sehen. Treibt man dieses Spiel noch eine Stufe weiter, so ist klar, dass Spieler 1 versuchen sollte, Spieler 2 vor einen Stapel mit 9 Karten zu setzen – was er problemlos tun kann, indem er zuerst eine Karte nimmt. Dies ist f¨ur Spieler 1 Teil einer dominanten Strategie. Danach besteht die dominante Strategie darin, immer 2 (1) Karte(n) zu nehmen, wenn Spieler 2 zuvor 1 (2) Karte(n) genommen hat. Mit dieser Strategie kann Spieler 1 den Sieg sicherstellen.

Sp 2

Karten3

2

 

1

Sp 1

2 1

(a)

Erg. für Sp 1

Sieg

Niederlage

Sieg

Sp 2

Karten6

2

 

1

Sp 1

 

1

5

2

4

1

 

2

 

(b)

Restkarten

4

3

3

2

Abbildung 4.3: R¨uckw¨artsinduktion bei einem Kartenspiel

(a) Sitzt Spieler 2 vor drei Karten, kann Spieler 1 eine Sieg sicherstellen; (b) Sitzt Spieler 2 vor 6 Karten, kann Spieler 1 eine Situation mit 3 Karten erzwingen.

4.3Teilspiele und teilspielperfekte Gleichgewichte

Der Schl¨ussel zur Identifikation einer dominanten Strategie in dem gerade analysierten Spiel ist die Abbildung 4.3(a). Hier werden verschiedene Konstellationen f¨ur die beiden letzten Z¨uge des gesamten Spiels angeschaut, d.h. es handelt sich um ein Teilspiel (subgame). Diese M¨oglichkeit der Zerlegung eines Spiels in mehrere Teilspiele steht im Zentrum einer wichtigen Verfeinerung der Idee von Nash-Gleichgewichten, wie sie in Abschnitt 2.7.3 auf Seite 48 eingef¨uhrt wurde, n¨amlich des Konzepts eines teilspielperfekten Gleichgewichts.1 Um diese zu verstehen, muss zun¨achst ein Teilspiel definiert werden.

Definition: Ein Teilspiel ist ein Teil eines dynamischen Spiels mit den folgenden Eigenschaften: (a) das Teilspiel muss an einem Knoten beginnen,

1Vor allem f¨ur die Entwicklung dieser Idee erhielt Reinhard Selten im Jahr 1994 den

¨

Nobelpreis f¨ur Okonomie. Formuliert wurde die Idee in Selten (1965) in einem deutschsprachigen Aufsatz. Durch das Papier von Selten (1975) in englischer Sprache wurde die Idee allerdings erst international wirklich zur Kenntnis genommen.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]