30 juli 2015

Spelteori - folkteorem


Spelteori – folkteorem och organisationer av anhängare

Spelteori handlar om att analysera valmöjligheter matematiskt, i fall där flera aktörer är inblandade. Spelteorin är därmed en viktig utgångspunkt för försök att konstruera teorier om vilka val som är rationella i olika situationer. Institutionella ekonomer hänvisar till exempel till spelteori för sin grundläggande beskrivning av hur organisationer uppkommer. Jag använder mig här av  en introduktion till ämnet av Ken Binmore, ”Kort om spelteori”, Fri tanke 2012, (Game theory, a very short introduction, Oxford UP, 2007) samt en artikel av John Joseph Wallis från 2010 som lyfter fram de spel som kallas folkteorem i en analys av hur organisationer uppkommer.
Kenneth "Ken" Binmore (född 1940) är professor emeritus vid University London College i matematik, ekonomi och spelteori.  
Olika fallstudier inom spelteorin får roliga namn som ska beskriva vilket spel som avses. Ett enkelt spel är ”bilkörningsspelet”, där bägge spelarna vinner om bägge antingen väljer strategin att köra på vänster sida eller höger sida, men förlorar om de väljer att göra olika (då de krockar eller måste väja om de möts). En så kallad ”blandad strategi” är inte heller så smart i detta spel, dvs att ibland köra på vänster och ibland köra på höger sida. Ken Binmore noterar att de inte finns något rationellt skäl för att välja vänster eller höger, det rationella här är bara att alla måste göra lika. Lösningen för att välja vänster eller höger är att upprätta en konvention, i detta fall en trafikregel som godtyckligt avgör vilken sida som ska gälla. Just denna trafikregel är rätt lätt att få efterföljd på eftersom kostnaden för att göra rätt är så låg. Andra trafikregler kan vara svårare att få spelarna att följa.

Ett annat spel uppkommer när vägen smalnar av så att man måste mötas, en trafikteknisk lösning som blir allt vanligare i Uppsala. Detta spel kallas ”chicken race”, även om det i vanlig trafik inte förväntas vara en så prestigefull seger att komma först (Att komma först motsvarar att komma närmast stupet när spelet spelas i filmen Ung rebell.) Valet står mellan att köra sakta eller fort. För ett enstaka spel är det rationellt om den ene kör fort och den andre sakta. Det finns en lösning där båda kör sakta men då är utfallet sämre för den deltagare som istället kunnat köra fort. Om båda väljer att köra fort förlorar bägge.

Upprepar man mötet flera gånger får man ett bättre underlag för vem som ska välja vilken strategi. Detta kallas evolutionär spelteori. Enligt den matematiska modellen kommer den spelare som oftast kör fort att allt oftare väja att köra fort tills han eller hon alltid gör det och omvänt, den som kör långsammare bör då alltid göra det. Möjligheten att man kör varannan gång fort och varannan gång sakta är liten. Detta illustreras av ett diagram på sidan 38 i ”Kort om spelteori” som visar olika startpunkter för strategier och hur de utvecklas mot ett jämviktsläge. Alla de startpunkter som leder till samma slutliga jämvikt kallas ett attraktionsområde. Mellan dessa områden finns en diagonal linje. Att det är osannolikt att man kör varannan gång formulerar Ken Binmore som att ”attraktionsområdet för den blandade jämvikten består enbart av diagonalen självt”. Tunt som ett streck, alltså.

De jämvikter som talas om här är så kallade Nash-jämvikter. Spelteorins pionjärer var John Von Neumann (1903-1957, född i Ungern som János Neumann), Oskar Morenstern (1902-1977, född i Tyskland, uppväxt i Wien) och John Nash (1928-2015), alla tre verksamma vid Princeton University i USA.

Det mest kända spelet är ”fångarnas dilemma”. Ken Binmore redogör för en lättbegriplig variant av spelet. Där är reglerna att två spelare får välja på att antingen ge den andre spelaren två pengar eller själv få en peng. De kan inte tala med varandra, de är fångar, dvs spelledaren håller dem skilda åt. Bägge skulle tjäna på att de båda två gav bort två pengar men eftersom de inte vet om den andre kommer att göra det så är den rationella strategin att ta den enda pengen som man är säker på att få. En variant av fångarnas dilemma med flera spelare är ”allmänningens tragedi”. Varje enskild spelare tjänar på att överutnyttja allmänningen men den sammanlagda effekten är att alla förlorar på att agera på det vis som för den enskilde är rationellt.

Ken Binmore insisterar på att man måste förstå att den enskilde spelaren är rationell i dessa spel. Eftersom spelarna enligt reglerna är fångar kan de inte se att det finns en gemensam lösning som är bättre än den som var och en väljer. Detta har kallats ”rationalitetsparadoxen”.

Binmore menar att fångarnas dilemma beskriver ett fall som inte är betydelsefullt för att förstå mänsklig samverkan. Han skriver att det är ett spel som är maximalt vinklat för att undvika att samverkan uppstår.

Flera olika förslag att lösa rationalitetsparadoxen bygger enligt Ken Binmore på önsketänkande. Han påpekar särskilt att han tycker att Immanuel Kant aldrig lyckades motivera sitt kategoriska imperativ, dvs ange skälet för att det skulle vara rationellt att göra mot andra det du vill att alla andra ska göra mot dig. Som jag minns det så upphörde aldrig Kant själv att förundra sig över sitt samvetes röst.

Altruism är dock inte uteslutet enligt spelteori. Men den behandlas lite oromantiskt. I ett räkneexempel i "Kort om spelteori" sätts den  altrustiske helige Franciskus av Assisi till värdet 3 och hans motsats Attila till värde 9 i en skala som går mellan 3 till 9. (Detta sätt att analysera problem genom att tilldela spelarna olika typer utvecklades av ungraren John Harsanyi.)

För att gå vidare med dessa frågor är det de så kallade folkteoremen som är mest relevanta. Ett enkelt sådant spel är ”lilla tillitsspelet”. Fallet är att en spelare betalar för något som den andra spelaren sedan levererar. Ekonomer kallar detta ”hold up”-problemet. Spelarna får i detta spel förhandla innan spelet genomförs men det finns ingen tredje part som straffar en spelare ifall man inte följer det avtal man kommit överens om, spelarna måste kontrollera sig själva. För ett enda spel är det rationellt för den som tagit emot betalningen att inte leverera. I ett upprepat spel finns det fler rationella lösningar, det som spelteoretikerna kallar fler jämviktslägen. Dessa jämviktslägen uppnås genom att spelaren som betalar hotar med en bestraffning i senare spel ifall inte spelaren som ska leverera följer sin del av avtalet.
 
Det finns flera strategier för hur bestraffningen ska utformas, även dessa har fått roliga namn av spelteoretikerna. Den tydligaste är den så kallade GRIM-strategin, där en spelare erbjuder möjligheten att nå jämviktsläge enda tills den andra spelaren avviker från avtalet, om så sker tillgriper den betalande spelaren största möjliga bestraffning.
Vad är då det värsta som kan användas som bestraffning i detta spel? På den frågan svarar Ken Binmore att ”det värsta är att avkräva den andra spelaren dennes minimax-utfall."

Detta är vad som i vardagsspråk är ett utbyte av tjänster. Jag gör dig en tjänst mot att du gör mig en tjänst, men om du inte gör det så slutar jag göra dig tjänster eller erbjuder en otjänst. Jag behöver inte använda GRIM-strategin. Även subtila sociala bestraffningar kan räcka för att åter nå jämviktsläget, ifall hotet om värre bestraffningar finns i bakgrunden. En tydlig strategi kallas LIKA FÖR LIKA, då bestraffningen inte är maximal utan så fort den andra spelaren återgår till jämvikt så gör den bestraffande spelaren det också.

Folkteoremen utgår från att en spelare kan observera att den andra spelaren avviker. I en grupp där samma spelare möts upprepat fungerar detta. På sidan 111 i ”Kort om spelteori” förklarar Binmore att en version av folkteoremen gäller för det som kallas delspelsperfekta jämvikter. Delspel är de spel som man går igenom när man reder ut vilken strategi som är bäst genom baklängesräkning. Genom delspel kan man visa att den bestraffning som ska utkrävas inte behöver genomföras av den förfördelade, utan det kan ske av någon annan i gruppen. Binmore skriver att ”om man har ett ändligt antal aktörer är den här sortens ansvarskedjor med nödvändighet slutna”.

Men i sammanhang där det är nya spelare som möts krävs antingen att det går att få information om hur en viss spelare agerat i tidigare spel eller någon form av tredje-parts kontroll. Folkteoremen säger bara att det kan gå att uppnå samarbete i en upprepad situation, inte att det måste ske. Spel med tredje parts-kontroll är en annan sorts spel, mera likt spel med trafikregler och en polis (en typ av våldsspecialist) som kan stoppa dig om du bryter mot reglerna.

Folkteoremen heter så för att spelteoretikerna hade klart för sig följderna av upprepade spel även innan detta formellt publicerades av Robert Aumann. Han tyckte därför att det skulle betraktas som en ”folklig insikt”. Enligt Binmore hade redan David Hume år 1739 (A treatise on human nature)förklarat hur ömsesidighet fungerar. I den mån det handlar om ”tjänster och gentjänster” kan det nog anses vara en folklig insikt sedan urminnes tider. Binmore skriver att det var först 1984, med utgivningen av Bob Axelrods ”Evolution of Cooperation” ”som idén slutligen upphörde att upptäckas på nytt – ungefär på samma sätt som Amerika slutgiltigt upphörde att upptäckas efter Columbus resa 1492”.

I en artikel av Roger B. Myerson (Game Theory: Analysis of Conflict, 1991, Harvard University Press.) föreslås att folkteoremen ska kallas ”general feasability theorems”. Folkteorem låter ju trevligare.

John Joseph Wallis artikel ”Institutions, Organizations, Impersonality, and Interests” får vara ett exempel på hur referenser görs till folkteoremen. Wallis skriver (i min översättning) att en startpunkt för en teori om organisationer är folkteoremens intuition att två individer kan upprätthålla en relation över tid om båda individerna erhåller en avkastning från relationen. (Avkastning är min översättning av ordet ”rent”). Wallis kallar sådana organisationer för “adherent organizations”, de hålls ihop av det intresse som finns att vara med I organisationen utan att det finns kontrakt som binder medlemmarna samman. Små grupper av jägare och samlare, där alla känner alla och främlingar betraktas med stor misstänksamhet, är exempel på sådana ”adherent organizations”. Tyvärr är översättning av "adherent" inte så enkelt, ordet betyder "anhängare".  En synonym till anhängare är "vapendragare", vilket kanske ger lite mer av känsla av De strategier som används i sådana små grupper för att reglera relationerna varierar oerhört, ofta är de strikt ritualiserade. Det går att i Lasse Bergs anda beskriva dessa grupper som i huvudsak internt fridsamma, men med en aktiv social kontroll genom att alla skvallrade om alla. Men folkteoremet förutsätter att det fanns en bestraffnings-strategi. Ytterst tillgreps en GRIM-strategi, som att någon blev utfrusen ur gruppen.
Så snart gruppen växer och möten med andra grupper ökar i antal så måste man hantera relationer med människor man inte säkert har ett upprepat spel med. Varje lokal grupp kommer att en begynnande hierarki för att hantera sådana spel. Wallis beskriver då hur de ledande representanterna inom varje grupp (Wallis kallar dem i artikeln våldsspecialister, men jag antar att det även kan vara andra med auktoritet) kan finna former för regelbunden interaktion enligt folkteoremen. En dominant koalition av våldsspecialister från olika grupper kan på så vis skapa en ”adherent organization”. Detta ger dem ökade resurser att skapa tydligare fördelar i sin egen grupp, och en ännu mer hierarkisk ordning uppkommer. Dessa större grupper bygger på en kontraktbaserad organisation, som inte ska beskrivas med hjälp av folkteorem. Kontraktbaserade organisationer har en tredje part som kan se till att reglerna efterföljs. Den dominerande koalitionen kan utnyttja sina kontakter för att skapa sådan tredje-parts kontroll.

Vad har detta med 600-talet och 1200-talet att göra? Jo, det Wallis beskriver är uppkomsten av det han kallar en naturlig stat (begreppet har tagits fram tillsammans med North och Weingast, se t.ex. Violence and Social Orders). Den naturliga staten är den typ av organisation av organisationer som funnits och fortfarande finns i de flesta samhällen sen historiens början.
 

Ken Binmore, ”Kort om spelteori”, Fri tanke 2012, (Game theory, a very short introduction, Oxford University Press, 2007)

John Joseph Wallis, ”Institutions, Organizations, Impersonality, and Interests: The dynamics of Institutions, February 2010, University of Maryland, and  National Bureau of Economic Research.

Inga kommentarer:

Skicka en kommentar