Ein spieltheoretischer Blick auf die Ukraine-Krise

von NZZ-Gastautor / 31.05.2015

In der Ukraine befinden sich die Konfliktparteien in einer verfahrenen Situation. Die Spieltheorie gibt nicht nur Hinweise darauf, weshalb dies so ist. Mit ihrer Hilfe können auch die Erfolgsaussichten von Vermittlungsversuchen abgeschätzt werden, schreiben Volker BietaLehrbeauftragter an der Technischen Universität Dresden und Hellmuth MildeÖkonomieprofessor im Ruhestand an der Universität Trier.

Vergangenes Wochenende ist John Nash bei einem Autounfall gestorben. Das nach ihm benannte Nash-Gleichgewicht kennt heute jeder Ökonomiestudent. Für seine bahnbrechenden Arbeiten erhielt Nash zusammen mit John Harsanyi und Reinhard Selten 1994 den Nobelpreis für Wirtschaftswissenschaften. Auch wenn Nash die Grundlagen für seine Theorien vor mehr als fünfzig Jahren gelegt hat, eignen sie sich auch zur Analyse aktueller Probleme, wie dieser Beitrag zu zeigen beabsichtigt.

Die Bausteine des Modells

Weshalb wurde die Kubakrise 1962 gelöst, der Konflikt in der Ukraine aber noch immer nicht beigelegt? Um dieser Frage auf den Grund zu gehen, wird im Folgenden auf spieltheoretische Konzepte zurückgegriffen. Als Instrument zur Erklärung strategischer Entscheidungen hat sich die Spieltheorie in der Politikwissenschaft bestens bewährt. Für unsere Überlegungen greifen wir auf den Artikel „Krieg oder Frieden? – Eine spieltheoretische Analyse der Appeasement-Politik“ (NZZ 30.3.2002) von Jack Hirshleifer, bis 2001 Ökonomieprofessor an der Universität Los Angeles, zurück.

Hirshleifer untersucht die Entscheidungssituation der Westmächte und Deutschlands beim Münchener Abkommen von 1938. Er identifiziert die Details, die von Beginn an für das Scheitern des Abkommens verantwortlich waren. Unsere Analyse der Ukraine-Krise folgt den Überlegungen Hirshleifers. In einer Zusatzüberlegung zeigen wir zudem, warum gewisse Änderungen der Spielregeln nicht dazu geführt haben, die erwünschte Krisenlösung zu erreichen.

Bei jeder Spielanalyse müssen konkrete Annahmen zu den folgenden fünf Punkten gemacht werden: Spieler, Strategien, Informationen, Spielregeln und Auszahlungen. Es gibt Querverbindungen zwischen einigen der Punkte; deshalb müssen sie teilweise gemeinsam behandelt werden. Im Ukraine-Konflikt agieren zwei Spieler. Sie werden im Folgenden als „Kiew“ und „Separatisten“ bezeichnet.

Jeder Spieler kann zwischen zwei Strategien wählen. Kiew kann sich entweder anpassen (diese Strategie ist im Folgenden mit dem Buchstaben A bezeichnet) oder die Konfrontation suchen (B). Die Separatisten ihrerseits haben die Wahl zwischen einer kriegerischen (C) oder friedlichen (D) Strategie.

Als Nächstes muss definiert werden, wie die Informationen verteilt sind und welche Spielregeln gelten. Es wird hier angenommen, dass die Informationen unvollständig sind – in diesem Fall spricht man auch von nichtkooperativen Spielen. Ohne Informationstransfer ist die Zug-Reihenfolge simultan. Das heißt, beide Spieler müssen gleichzeitig die Wahl ihrer Strategie bekanntgeben.

Wie findet man nun den Ausgang des Konflikts heraus? Das universelle Lösungskonzept der Spieltheorie ist das eingangs erwähnte Nash-Gleichgewicht. Darunter versteht man eine Spielsituation, in der kein Spieler durch eine einseitige Änderung seiner Strategie einen Vorteil erzielen kann; da kein Spieler einen Anreiz zum Strategiewechsel hat, ist diese Lösung stabil. Die jeweiligen Vorteile einer Strategie werden durch die Auszahlungen definiert.

Auszahlungen sind in der Realität meist Nettoauszahlungen. Bei jeder Strategie hängt die Nettoauszahlung entscheidend davon ab, wie der Gegenspieler reagiert. Wechselwirkungen dürfen also nicht ignoriert werden. Daraus folgt, dass in der Spielanalyse immer Strategie-Kombinationen berücksichtigt werden müssen. In der Ukraine-Krise gibt es keine definierten Nettoauszahlungen. Deshalb wird hier auf den Vorschlag Hirshleifers zurückgegriffen, und die Nettoauszahlungen werden durch eine Rangfolge von Präferenzen ersetzt. Der Präferenzrang wird durch eine Zahl ausgedrückt. Es gilt die folgende Klassifikation: Die höchste Präferenz wird mit der Zahl 1 bezeichnet; die geringste Präferenz ist durch die Zahl 4 charakterisiert.

Aufbau der Konflikt-Matrix

In der Grafik ist die sogenannte Konflikt-Matrix abgebildet. Bevor die Lösung des Spiels mithilfe dieser Matrix gefunden werden kann, müssen zuerst die möglichen Strategiekombinationen identifiziert werden. Aus zwei Spielern mit je zwei Strategien folgen vier Kombinationen; diese lauten: AC, AD, BC und BD. Die Frage lautet nun: Wie werden diese vier Kombinationen bewertet? Es ist klar, dass Kiew und die Separatisten unterschiedliche Bewertungen haben. Die Präferenzen eines jeden Spielers kommen in einer Rangfolge zum Ausdruck. Wichtig ist, dass jede Präferenzordnung von der konkreten Entscheidungssituation abhängig ist; es gibt keine natürliche Ordnung.

Für die Präferenzordnung der Separatisten gilt: Das beste Ergebnis ist, wenn Kiew nachgeben, also die Strategie A wählen würde. Damit ist Strategie A besser als Strategie B. Hinsichtlich der Auswahl der eigenen Strategie gilt für die Separatisten in der gegenwärtigen Situation: Krieg ist besser als Frieden. Strategie C ist also besser als Strategie D. Damit ist CA besser als DA und CB ist besser als DB. Da A besser als B ist, folgt für die Separatisten die Rangordnung: (1) CA, (2) DA, (3) CB, (4) DB.

Analog dazu kann auch für Kiew die Rangordnung abgeleitet werden. Das beste Ergebnis für diese Konfliktpartei ist, wenn die Separatisten nicht die kriegerische Auseinandersetzung suchen würden. Damit ist Strategie D besser als Strategie C. Für die Auswahl der eigenen Strategie gilt: Besser auf Konfrontation gehen als nachgeben. Strategie B ist besser als Strategie A. Daraus folgt für Kiew die Rangordnung: (1) BD, (2) AD, (3) BC, (4) AC.

In der in der Grafik abgebildeten Konflikt-Matrix steht jede Zelle für eine der vier Kombinationen. Den Kombinationen wurden Ordnungszahlen zugewiesen, welche die Präferenz wiedergeben. Diese Zahlen sind in den Zellen der Matrix ebenfalls eingetragen.

Die wichtigste Frage lautet nun: Welche Kombination von Strategien bildet ein Nash-Gleichgewicht? Nach der oben gegebenen Definition des Nash-Gleichgewichtes suchen wir jene Zelle in der Konflikt-Matrix, wo kein Spieler einen Anreiz hat, seine Strategie zu verändern. Nur die Zelle CB erfüllt diese Bedingung; hier gibt es kein einseitiges oder zweiseitiges Abweichen. Die Lösung CB impliziert die folgenden Entscheidungen: Die Separatisten wählen eine kriegerische Strategie, und Kiew passt sich nicht an. Das ist exakt die Situation, die wir in der Ukraine seit langem beobachten. Dass dies die denkbar schlechteste Lösung ist, lässt sich einfach zeigen.

Das Nash-Gleichgewicht, also die Strategiekombination CB, ist durch die Ordnungszahlen (3/3) charakterisiert. In der Konflikt-Matrix sehen wir, dass es auch die Strategiekombination DA mit den Ordnungszahlen (2/2) gibt. Der Vergleich von (2/2) und (3/3) zeigt eine außergewöhnliche Situation: Beide Spieler wären lieber in der Situation DA als im Nash-Gleichgewicht. Die Verbesserung eines Spielers würde dabei nicht auf Kosten des anderen Spielers geschehen. Leider ist DA aber kein Nash-Gleichgewicht. Dies gilt deshalb, weil die Separatisten statt der Strategie D die Strategie C wählen werden; sie können damit ihre Position von 2 auf 1 verbessern. Auch Kiew würde anders handeln: Es kommt zum Wechsel von Strategie A hin zu Strategie B. Dies führt zu einer Verbesserung für Kiew von 2 auf 1. DA ist deshalb kein Gleichgewicht.

Im gegebenen Spiel ist die einzige stabile Lösung somit die schlechteste Strategiekombination CB; man spricht in diesem Fall auch von einem Gefangenen-Dilemma. Dahinter steht die Geschichte zweier Gefangener, die sich aus einem subjektiven Optimierungszwang in ein kollektives Desaster stürzen. Individuelle Rationalität erzeugt kollektive Irrationalität. Besser kann man die aktuelle Situation in der Ukraine wohl nicht beschreiben.

Wege aus dem Dilemma

Welche Möglichkeiten gibt es, der Desaster-Kombination CB zu entkommen? In der derzeitigen Diskussion dominiert ein einziger Vorschlag. Er lautet: Die Spielregeln müssen verändert werden. Im Hintergrund steht die Idee, das nichtkooperative Spiel durch ein kooperatives Spiel zu ersetzen. Sobald nämlich die Spieler miteinander sprechen und kooperieren, kommt ein Informationsaustausch zustande. Stimmen zusätzlich die institutionellen Rahmenbedingungen, kann der Informationsaustauch in reguläre Vertragsverhandlungen übergeführt werden.

Eine Vertragsverhandlung ist dadurch gekennzeichnet, dass einer der Spieler einen Vorschlag macht; der zweite Spieler wird dann mit einem Gegenvorschlag antworten. Auf den Zug des zweiten Spielers wird der erste Spieler wieder reagieren. Das ist nicht mehr die Welt simultaner Entscheidungen; es ist die Welt sequenzieller Entscheidungen. Der erste Spieler wird als „Leader“, der zweite Spieler als „Follower“ bezeichnet. In der Spieltheorie ist in diesem Fall von einem Stackelberg-Spiel die Rede.

Man kann jetzt untersuchen, welche Auswirkung ein Stackelberg-Spiel auf die Lösung des Konflikts hat. Sowohl Kiew als auch die Separatisten können die Rolle des Leaders im Spiel übernehmen. Die Rolle des Schlichters besteht darin, die sequenzielle Reihenfolge der Spielzüge geeignet zu beeinflussen. Eine Rolle, die im Ukraine-Konflikt Präsident Hollande und Kanzlerin Merkel übernommen haben.

Aus Platzgründen wird hier auf eine ausführliche Diskussion der Spielanalyse verzichtet. Doch das Ergebnis soll dem Leser nicht vorenthalten werden. Leider zeigt sich, dass für jede denkbare Stackelberg-Version des Spiels die Desaster-Kombination CB die einzige stabile Lösung ist. Mit einfachen Verfahrenstricks, also Änderungen der Spielregeln, ist man offensichtlich nicht in der Lage, die Spieler aus dem Gefangenen-Dilemma zu befreien.

Die bekannten Verhandlungsergebnisse zeigen klar: Minsk I und Minsk II unterscheiden sich nicht. Kein Spieler hat sich bewegt. Warum ist das so? Schlichter-Einsatz und Verhandlungen haben bei den Spielern zu keinen Änderungen der Präferenzen geführt. Die oben abgeleitete Konflikt-Matrix ist weiter gültig. Ohne eine Veränderung der Präferenzen, also der Ordnungszahlen in der Konflikt-Matrix, kann dem Dilemma nicht entkommen werden.

Machtspiele um Kuba

Das bekannteste Beispiel für eine Präferenz-Änderung ist die Kubakrise. Im Oktober 1962 standen sich die damalige Sowjetunion und die USA als Spieler gegenüber. Die Sowjetunion hatte als Strategien die Stationierung von Raketen oder den Raketenabzug zur Auswahl. Die USA konnten zwischen den Strategien einer Invasion oder einer Blockade Kubas wählen. Analog zur Ukraine-Krise kann für Kuba gezeigt werden, dass das einzige Nash-Gleichgewicht die Desaster-Kombination „Raketenstationierung/Invasion“ war. Die Entscheidungsträger Chruschtschow und Kennedy sahen klar, dass diese Konstellation in den Dritten Weltkrieg führen würde. Dieser schlimmstmögliche Fall trat dennoch nicht ein.

Der Grund dafür war die Tatsache, dass die wechselseitige existenzielle Bedrohung glaubwürdig war; im Kalten Krieg war der Kernwaffeneinsatz als letzte Option nicht tabu. Beide Spieler bemühten sich ernsthaft, aus der Desaster-Situation herauszufinden. In seinem Buch „13 Tage“ berichtet Robert Kennedy, der Bruder US-Präsidenten, über die sehr kontroversen Diskussionen im Krisenstab bei der Festlegung der US-Strategie. Der Wechsel der Priorität von einer Invasion zu einer Blockade wurde durch die Glaubwürdigkeit der Sowjet-Drohung erzwungen.

Auf der anderen Seite führte die Glaubwürdigkeit der US-Drohung zum Strategie-Wechsel der Sowjets: Der Abzug der Raketen trat als erste Priorität an die Stelle der Stationierung von Raketen. Das neue Nash-Gleichgewicht „Raketenabzug/Blockade“ ist mit der wünschenswerten Kombination (2/2) aus der obigen Matrix vergleichbar. Damit konnte die Desaster-Kombination (3/3) beseitigt und die Kubakrise beigelegt werden. Die Einsicht in die Notwendigkeit einer Änderung der Präferenzen war die Leistung von Chruschtschow und Kennedy.

In der Ukraine-Krise ist die Spielsituation anders; Drohungen sind erkennbar unglaubwürdig. Deshalb können Russland und die USA ihre jeweiligen Stellvertreter, die Separatisten und Kiew, ungebremst wirken lassen. Leider verfügen die wirklichen Entscheidungsträger, Putin und Obama, nicht über jene Charakteristika, die Chruschtschow und Kennedy zur Konflikt-Lösung befähigt hatten. Der russische Präsident Putin erscheint als frustrierter Pokerspieler und der amerikanische Präsident Obama als „lame duck“ – der eine Politiker ist durch Torheit, der andere durch Schwäche charakterisiert.

Eine Präferenzänderung ist von diesen beiden Spielern nicht zu erwarten. Damit bleibt in der Ukraine-Krise die Desaster-Kombination die einzige Lösung. Was die Folge davon sein kann, zeigt ein historisches Beispiel: Am Ende des Ersten Weltkrieges führte die Torheit der Alliierten und die Schwäche der Deutschen zur Unterzeichnung des Desaster-Vertrages von Versailles. Das Ergebnis war der Zweite Weltkrieg, die Katastrophe des 20. Jahrhunderts.