Kann die evolutionäre Spieltheorie die Entstehung von Kooperation erklären?
Studie über die Schwächen eines formalen Ansatzes

Eckhart Arnold

1 Einleitung
2 Die Theorie der „Evolution der Kooperation“
3 Die Erklärungsdefizite der Theorie der „Evolution der Kooperation“
    3.1 „Leben und leben lassen“ im ersten Weltkrieg
    3.2 Stichlinge und Buntbarsche
    3.3 Wenn weiche Wissenschaft harte Wissenschaft schlägt: Spieltheorie und klassische Gesellschaftsvertragstheorie
4 Fazit
5 Anhang: Quellcodes und Beispielsimulationen
6 Revisionsgeschichte
Literaturverzeichnis

3.1 „Leben und leben lassen“ im ersten Weltkrieg

Eines der wohl eindrucksvollsten Beispiele für die „Evolution der Kooperation“ hat Axelrod mit seiner Analyse des „Leben und leben lassen“-Systems im Grabenkrieg des ersten Weltkrieges geliefert (Axelrod 1984, S. 67-79). Axelrod stützt sich dabei auf die eingehende Studie des Soziologen Tony Ashworth (Ashworth 1980), der eine ausführliche historische Darstellung dieses Systems geliefert hat. Ashworth ist kein Spieltheoretiker und er versucht auch nicht die Entstehung des „Leben und leben lassen“-Systems evolutionär zu erklären. Dennoch beansprucht Ashworth durchaus, neben der bloßen historischen Beschreibung, eine Erklärung dafür zu liefern, wie das „Leben und leben lassen“-System in bestimmten Frontabschnitten entstehen konnte, warum es sich über eine gewisse Zeit hinweg erhalten konnte, und weshalb es schließlich zusammenbrach. Ashworth beschreibt dazu überaus differenziert die verschiedenen Faktoren, von denen das „Leben und leben lassen“ System abhing.

Die Frage, die sich unserem Zusammenhang nun stellt, ist die, ob Axelrod, gestützt auf die evolutionäre Spieltheorie, eine bessere Erklärung dieses erstaunlichen Phänomens liefern kann, oder ob er zumindest bestimmte Aspekte der historischen Vorgänge erklären kann, die bei Ashworth im Dunkel geblieben sind. Dazu muss zunächst die Erklärung rekonstruiert werden, die Ashworth im Rahmen seiner historischen Darstellung für das „Leben und leben lassen“-System liefert.

Aber zuvor ist die Frage zu klären, die bei historischen Untersuchungen immer am Anfang steht: Was ist geschehen? Der Erste Weltkrieg ist im kollektiven Gedächnis als ein überaus brutaler und verlustreicher Krieg verankert. Es verbinden sich damit Erinnerungen an blutige Schlachten, wie die Schlacht bei Verdun oder die Schlacht an der Somme, in deren Verlauf innerhalb weniger Wochen zehntausende Menschen starben (James 2003, S. 52). Weit weniger bekannt ist, dass abseits der großen Schlachten an weiten Frontabschnitten oft längere Zeit eine erstaunliche Ruhe herrschte, und das obwohl sich die Gegner im Stellungskrieg beinahe Auge in Auge gegenüber standen. Mehr noch, wie Ashworth in seiner Studie heraus arbeitet, waren diese Ruhe-Phasen oftmals nicht bloß der Ausdruck von vergleichsweise weniger intensiven Kampfhandlungen, sondern sie beruhten häufig auf mehr oder weniger stillschweigenden Übereinkommen nach dem „Leben und leben lassen“-Prinzip (Ashworth 1980, S. 24ff.). Natürlich wurde dieses Prinzip zu keiner Zeit und auf keiner Seite von der offiziellen Militärdoktrin unterstützt, und gegen offene Fraternisierungen wurde disziplinarisch hart durchgegriffen. Dennoch gelang es den Soldaten an den festgefahrenen Fronten des Stellungskrieges sich durch dieses System zumindest phasenweise das Leben halbwegs erträglich zu gestalten.

Worin bestand dann aber das „Leben und leben lassen“-System, wenn offene Absprachen unmöglich waren? Ashworth identifiziert verschiedene Ausdrucksformen des „Leben- und Leben lassen“-Systems: So konnten die Kampfhandlungen etwa auf bestimmte Tageszeiten beschränkt werden, ebenso konnte der Beschuss auf bestimmte und immer wieder dieselben Ziele gelenkt werden, denen die gegnerischen Soldaten nur auszuweichen brauchten, um am Leben zu bleiben, schließlich war es auch möglich, absichtlich daneben zu schießen. Auf diese Weise konnte man dem eigenen Oberkommando sowohl den Verbrauch von Munition melden als auch den Gegern signalisieren, dass man sie nicht schädigen wollte. All dies beruhte natürlich auf Gegenseitigkeit, und das Verhalten konnte sofort geändert werden, wenn sich die Gegenseite nicht entsprechend verhielt. Ashworth hat diese verschiedenen Aspekte des „Leben- und leben lassen“-Systems zusammenfassend als eine „Ritualisierung der Aggression“ beschrieben (Ashworth 1980, S. 99ff.). Diese Ritualisierung der Agression zwischen den Gegenern wurde ergänzt durch die Herausbildung einer regelrechten Ethik unter den Kameraden einer Seite, nach der „Ruhestörer“ und „Scharfmacher“, die sich nicht an die Abmachungen hielten, gehasst und verpönt waren (Ashworth 1980, S. 135ff.). Damit sind nur kurz und sehr grob die wichtigsten Aspekte des „Leben und leben lassen“-Systems umrissen. Ashworth geht noch auf zahlreiche weitere Faktoren ein, wie etwa die Rolle der unterschiedlichen Waffengattungen und die Kommandostruktur. Aber die Erörterung dieser Einzelheiten würde an dieser Stelle zu weit führen, auch wenn diese Einzelheiten keineswegs unwesentlich sind, und es weiterhin keineswegs unwesentlich ist, dass in der gröberen spieltheoretischen Analyse alle diese Feinheiten beinahe zwangsläufig unter den Tisch fallen.

Wie erklärt Ashworth nun das „Leben und leben lassen“-System. Da das System weit verbreitet war, muss man davon ausgehen, dass das System generische Ursachen (im Gegensatz zu historisch singulären) hat. Nach Ashworths Schätzung trat es bei einer durchschnittlichen Division immerhin während ca. eines Drittels aller Frontaufenthalte auf. Das bedeutet freilich auch, dass es nur während eines Drittels aller Frontaufenthalte auftrat. Wenn man also erklären will, wie es dazu kam, muss man ebenso erklären können, warum es häufig nicht dazu kam. In Ashworth Darstellung lassen sich folgende Ursachen für das „Leben- und leben lassen“-System ausmachen:

  1. Die strategische Situation: Festgefahrene Fronten
     
  2. Der nur natürliche Wunsch der meisten Soldaten, den Krieg zu überleben
     
  3. Die unpersönliche und bürokratisierte Struktur der Aggression (Ashworth 1980, S. 76ff.)
     
  4. Empathie mit den Soldaten auf der gegnerischen Seite
     
  5. Korpsgeist, der sich förderlich oder (bei Elite-Einheiten) hinderlich auf die Entwicklung des „Leben und leben lassen Systems“ auswirken konnte
     
  6. Initialursachen wie Weihnachtswaffenstillstände, Schlechtwetterperioden, Gleichzeitiges Schweigen der Waffen aufgrund der Ähnlichkeit der Lebensabläufe in den feindlichen Gräben (z.B. infolge gleicher Essenszeiten)

Warum trat das System aber nicht überall und nicht ständig auf? Verschiedene Erklärungen wären denkbar. Da das „Leben und leben lassen“-System natürlich nicht den Zielen eines Krieges entspricht, liegt die Annahme nahe, dass es in den meisten Fällen erfolgreich unterbunden werden konnte. Tatsächlich erwies es sich für die Militärführung aber als überaus schwierig das, was in ihren Augen ein Unwesen war, zu unterbinden. Es dauerte eine ganze Weile bis sich Mittel und Wege fanden, das „Leben und leben lassen“-System (dann aber mit nachhaltigem Erfolg) zu durchbrechen. Auch könnte man vermuten, dass das System einigermaßen störanfällig war, da die Soldaten ja keine Abmachungen mit der feindlichen Seite treffen konnten. Der entscheidende Faktor war nach Ashworth' empirischer Untersuchung jedoch, ob es sich um Elite-Einheiten oder gewöhnliche Truppen handelte. Nur wo gewöhnliche Truppen in den Gräben einander gegenüber lagen, bildete sich das „Leben und leben lassen“-System heraus.

Das Mittel, mit dem sich das „Leben und leben lassen“-System schließlich unterbinden ließ, waren angeordnete Überfälle auf die feindlichen Gräben. Die Durchführung solcher Überfälle ließ sich nicht vortäuschen oder ritualisieren, wie das gezielte danebenschießen, denn entweder der Feind erlitt Verluste (die durch heimgeführte Gefangene unvortäuschbar bewiesen werden konnten) oder die eigenen Soldaten kehrten nicht zurück. Zudem schürten die Überfälle Haß und Rachegefühle und entzogen so gleichzeitig dem „Leben und leben lassen“-System eine wichtige psychologische Grundlage (Ashworth 1980, S. 176ff.).

Soweit in kürzester Form die Darstellung des „Leben und leben lassen“-Systems im Grabenkrieg des Ersten Weltkrieges durch Ashworth und seine Erklärung für dieses erstaunliche Phänomen. Was fügt nun Axelrods Deutung vor dem Hintergrund seiner Theorie der „Evolution der Kooperation“ dieser Erklärung hinzu?

Zunächst einmal argumentiert Axelrod dahingehend, dass sich die Situation der Front-Soldaten auch als wiederholtes Gefangenendilemma auffassen lässt. Dazu muss Axelrod zeigen, dass die zugänglichen Handlungsoptionen in der historischen Situation den Wahlmöglichkeiten in einem Zwei-Personen-Spiel entsprechen und von den Soldaten so bewertet werden, dass sich daraus ein Gefangenendilemmaspiel ergibt. Dafür lässt sich durchaus plausibel argumentieren: So wäre einseitige Defektion, d.h. kämpfen und dabei siegen, sicherlich die bevorzugte Alternative jeder Seite gewesen (T > R,P,S in Axelrods Nomenklatura). Aber wenn es nicht möglich war, durch kämpfen einen durchschlagenden Erfolg zu erringen, dann war es besser „Ruhe zu halten“ sofern die Gegenseite darauf einging, da ein solches Arrangement die Überlenschancen drastisch erhöhte (R > P,S). Gegenseitige Zurückhaltung war auch besser als abwechselnde einseitige Kampfhandlungen (R > (T+S)/2). Ging die Gegenseite aber nicht darauf ein, dann blieb den Soldaten nur noch zu kämpfen, was immer noch besser war, als sich einfach überrennen zu lassen (P > S).

Um seine Theorie anwenden zu können, muss Axelrod natürlich noch weitere Punkte klären, wie z.B. dass es sich um ein wiederholtes Gefangenendilemma handelt, was die Identität der Spieler über längere Zeit voraussetzt. Obwohl die Soldaten an der Front jeweils nach wenigen Wochen ausgewechselt wurden, wurden sie bei der Ablösung von ihren Vorgängern mit den Verhältnissen an der Front vertraut gemacht, so dass sie das „Spiel`“ an dem Punkt aufnehmen konnten, an dem die abgelösten Soldaten aufgehört hatten. Weniger deutlich erklärt Axelrod, worin der evolutionäre Transmissionsmechanismus bestand, der zur Ausbreitung des „Leben und leben lassen“-Systems führte. Er begnügt sich mit dem Hinweis, dass sich das System unter anderem über benachbarte Frontabschnitte verbreitete. Aber, wie schon erwähnt, kann man ebenso davon ausgehen, dass es auch immer wieder unabhängig entstand.

Im Großen und Ganzen ist Axelrods Analyse zweifellos nachvollziehbar. Aber inwiefern ist Axelrods Deutung geeignet, die Erklärungsqualität von Ashworths Studie zu steigern? Es fällt unmittelbar auf, dass in dem Ursachenbündel, das Ashworth für das „Leben und leben lassen“-System herausarbeitet, nur eine Bedingung, wenn überhaupt, durch Axelrods Theorie beschrieben wird, nämlich die (strategische) Situation, in der sich die Soldaten an der Front befanden. Gelingt es Axelrod nun, diesen Aspekt mit Hilfe der evolutionären Spieltheorie präziser zu fassen? Dazu ist zunächst zu untersuchen, ob die Situation der Frontsoldaten tatsächlich angemessen als ein wiederholtes Gefangenendilemma beschrieben werden kann. Gegen diese Beschreibung ist eingewandt worden, dass die Frontsoldaten womöglich vor allem an ihrem Überleben interessiert waren und im Vergleich zu diesem gut nachvollziehbaren Ziel bestenfalls ein marginales Interesse am Sieg hatten, der im näheren Zeithorizont ohnehin nicht mehr absehbar schien. Dann hätten die Soldaten aber auch keinen Vorteil davon, wenn sie einseitig nicht kooperieren würden (Der Auszahlungsparameter T wäre gleich dem Auszahlungsparameter P in Axelrods formaler Darstellung). So gesehen hätten die Soldaten kein Gefangenendilemma zu lösen, sondern bestenfalls ein Koordinationsproblem. Es sei dahingestellt, wie entscheidend dieser Einwand tatsächlich ist. Zumindest zeigt er, dass die Festellung welche Spielsituation in einem gegebenen Fall vorliegt, keineswegs eine triviale Aufgabe ist. Erst recht gilt dies für die Abschätzung der Auszahlungsparameter, die Axelrod gänzlich unterlässt (er beschränkt sich auf die Größenverhältnisse, T > R > P > S und 2R > (T+S)), obwohl sein Modell durchaus sensitiv bereits auf die Änderung der Auszahlungsparameter innerhalb dieser Größenverhältnisse reagiert.

Ein anderer Einwand ist aber noch viel gravierender: Die beschriebene strategische Patt-Situation war an allen Frontabschnitten die gleiche (von den großen Schlachten einmal abgesehen, die aber auch Ashworth von seiner Analyse bewusst ausnimmt). Trotzdem zeigt die Längsschnittanalyse, dass das „Leben- und Leben lassen“-System nur während ca. eines Drittels aller Frontaufenthalte auftrat (Ashworth 1980, S. 171-175). Diese Tatsache stellt nun ein echtes Problem für Axelrods Theorie dar, denn seine Theorie postuliert ja, dass im unbestimmt oft wiederholten Gefangenendilemma mit großer Wahrscheinlichkeit eine bedingt kooperative Strategie sich durchsetzen wird. Eine der entscheidendsten Determinanten dafür, ob es an einem Frontabschnitt ruhig oder nicht ruhig zuging, bestand nach Ashworth, wie bereits erwähnt wurde, darin, ob sich Elite-Einheiten oder gewöhnliche Truppen begegneten. Gerade gegenüber diesem entscheidenden Unterschied jedoch verhält sich Axelrods Theorie vollkommen insensitiv, denn Axelrod leitet das zu erwartende Verhalten (bedingt kooperative Strategie) allein aus der strategischen Situation (wiederholtes Gefangenendilemma) ab. Die strategische Situation war aber an allen Frontabschnitten die gleiche.

So sollte man zumindest meinen, denn die übliche Art, wie Spieltheoretiker mit Problemen dieser Art umgehen, besteht nicht darin, dass sie die Grundannahmen der Spiel- und Entscheidungstheorie (also insbesondere Rationalität bzw. bedingte Rationalität) der Akteure in Zweifel ziehen (indem man beispielsweise zugestehen würde, dass Menschen im (einfachen) Gefangenendilemma gelegentlich kooperieren und gelegentlich nicht koopererien, anstatt - entsprechend der Gleichgewichtsstrategie - niemals zu kooperieren), sondern sie fordern statt dessen vielmehr, scheinbare Abweichungen von der Theorie bei der Konstruktion des Modells zu berücksichtigen (Binmore 1994, S. 161/162). Dieses Vorgehen erscheint durchaus plausibel, denn man könnte ja naheliegenderweise annehmen, dass sich Elite-Truppen von gewöhnlichen Truppen durch andere Auszahlungsparameter unterscheiden, dergestallt, dass Elite-Soldaten wechselseitige Kooperation ehrlos erscheint und desshalb sehr viel geringer bewertet werden würde. Aber was wäre damit gewonnen? Statt relativ einfacher genereller Annahmen über die Auszahlungsparameter in einer gegebenen strategischen Situation müssten nun komplizierte Untersuchungen darüber angestellt werden, wie verschiedene Soldaten dieselbe Situation unterschiedlich bewerten. Mit anderen Worten, um ein halbwegs akkurates spieltheoretisches Modell aufstellen zu können, ist eine historische Studie erforderlich, wie Ashworth sie verfasst hat. Aber dann stellt sich umgekehrt die Frage, wozu wir noch das spieltheoretische Modell benötigen, wenn doch - wie wir gesehen haben - bereits Ashworth' historische Studie eine vollkommen befriedigende Erklärung für das Verhalten der Soldaten liefert.

Ein Irrtum wäre es, zu glauben, dass das spieltheoretische Modell, deshalb weil es mathematisch formuliert ist, eine genauere Erklärung liefert als eine historische Studie sie liefern kann. Das wäre nur dann der Fall, wenn sich 1) hinreichend genau bestimmen lässt, welche Einflussgrößen relevant sind (da man alle relevanten Einflussgrößen im Modell berücksichtigen müsste, oder mit anderen Worten:das Modell muss wirklichkeitsadäquat sein) und wenn sich 2) diese Größen hinreicheind genau messen lassen, so dass das Modell im Rahen der Messgenauigkeit einigermaßen stabile Vorhersagen liefert, m.a.W. das Modell muss robust sein. Es erscheint ziemlich aussichtslos, für das Verhalten der Soldaten im Grabenkrieg ein mathematisches Modell zu finden, dass zugleich wirklichkeitsadäquat und robust ist.

Nun ist es natürlich zweifellos möglich, solange mit einem bestimmten Modell zu experimentieren, bis man Auszahlungsparameter gefunden hat, für welche die Ergebnisse des Modells mit dem strategischen Verhalten der Soldaten in der historischen Darstellung (die man im vorhinein kennen muss) übereinstimmen. Die Auszahlungsparameter würden dann im Sinne der „revealed preferences“-Hypothese mutmaßlich diejenigen Präferenzen der Soldaten wiederspiegeln, die sich in ihrem tatsächlichen Verhalten offenbaren. Die erkenntnistheoretische Problematik der „revealed preferences“-Hypthese besteht aber bekanntlich darin, dass empirisch gehaltvolle Erklärungen unter dieser Voraussetzung nur zu Stande kommen, wenn es möglich ist, die „offenbarten Präferenzen“ unabhängig von dem Phänomen zu bestimmen, das man erklären möchte. Andernfalls führt die „revealed preferences“-Annahme nur zur Tautologisierung der Theorie.

Im Ergebnis bedeutet dies: Ohne eine genaue historische Untersuchung des Verhaltens der Soldaten im Ersten Weltkrieg ist das spieltheoretische Modell Axelrods wertlos. Verfügen wir aber über eine solche Untersuchung, dann ist das spieltheoretische Modell überflüssig. Folglich ist das spieltheoretische Modell überhaupt überflüssig.

t g+ f @