Gevangenendilemma (speltheorie)

Samenvatting economie VWO: Het gevangenendilemma in de speltheorie

Stel je voor dat je in een situatie zit waarin jouw keuze afhangt van wat een ander doet, en vice versa. Dat is precies waar speltheorie om draait. Het is een slimme manier om strategische beslissingen tussen partijen te analyseren en te voorspellen wat er zal gebeuren. Je bekijkt de mogelijke opties voor elke partij en hoe de uitkomst verandert afhankelijk van wat de ander kiest. Vooral in simultane spellen, waarbij beide partijen tegelijkertijd hun keuze maken zonder te weten wat de ander doet, komt dit goed tot zijn recht. Een klassiek voorbeeld daarvan is het gevangenendilemma, waar dominante strategieën een grote rol spelen. Laten we dat stap voor stap uitpluizen, zodat je het perfect snapt voor je toets of examen.

Wat maakt het gevangenendilemma zo bijzonder?

Het gevangenendilemma is een typisch simultaan spel, oftewel een spel waarin beide spelers gelijktijdig en onafhankelijk van elkaar beslissen. Ze hebben volledige informatie over de situatie en de mogelijke gevolgen, maar weten niet wat de ander precies kiest. Cruciaal is dat elke speler een dominante strategie heeft: een keuze die altijd het beste uitpakt voor henzelf, ongeacht wat de ander doet. Toch leidt dat vaak tot een uitkomst die voor niemand echt ideaal is. Neem nou het verhaal van twee verdachten, Jasper en Willem, die verdacht worden van moord maar alleen hard bewijs hebben voor illegaal wapenbezit. Ze zitten apart van elkaar en krijgen hetzelfde aanbod van de politie: beken of ontken.

Als beiden bekennen, krijgen ze elk zes jaar cel. Bekent Jasper wel en Willem niet, dan zit Jasper maar één jaar vast en Willem twaalf jaar. Ontkennen ze allebei, dan is het drie jaar per persoon. En Willem hoort exact hetzelfde. Klinkt als een dilemma, hè? Want wat doe je dan?

De opbrengstenmatrix: alles in een handig overzicht

Om dit soort situaties overzichtelijk te maken, gebruiken we een opbrengstenmatrix. Dat is gewoon een tabel die alle keuzes en mogelijke uitkomsten samenvat. Er zijn twee spelers: de rijspeler, die bepaalt welke rij in de tabel geldt, en de kolomspeler, die de kolom kiest. De eerste uitkomst in elke cel hoort altijd bij de rijspeler. Zo zie je in één oogopslag de vier mogelijke combinaties.

Stel dat Willem bekent: dan is het voor Jasper beter om ook te bekennen (zes jaar) dan te ontkennen (twaalf jaar). En als Willem ontkent? Dan krijgt Jasper bij ontkennen drie jaar, maar bij bekennen slechts één jaar. Dus bekennen is óók dan de slimste zet. Dat geldt net zo voor Willem. Bekennen is dus de dominante strategie voor beiden, omdat het altijd beter uitpakt, wat de ander ook doet. Helaas eindigen ze daardoor allebei met zes jaar cel – terwijl drie jaar elk veel beter zou zijn als ze allebei zwegen.

Pareto-efficiëntie en waarom samenwerking lastig is

Die uitkomst met drie jaar elk is Pareto-efficiënt, oftewel Pareto-optimaal. Dat betekent dat niemand erop vooruit kan gaan zonder dat de ander erop achteruitgaat. Het is het beste voor de groep als geheel. Maar in het gevangenendilemma kiezen spelers uit eigenbelang voor hun dominante strategie, waardoor ze niet bij die optimale situatie uitkomen. Zelfs als ze dikke vrienden zijn, blijft het riskant: één die zwicht en bekent, dumpt de ander met twaalf jaar. Dus ondanks dat samen ontkennen perfect zou zijn, is de verleiding van 'eigenbelang eerst' te groot.

Nash-evenwicht: het stabiele maar suboptimale punt

Wat er uiteindelijk gebeurt, is dat beiden bekennen en vastzitten in het Nash-evenwicht. Dat is een situatie waarin de keuze van de één de beste reactie is op de keuze van de ander, en niemand een reden heeft om unilateral te veranderen. Vanuit zes jaar elk overstappen naar ontkennen zou voor Jasper betekenen dat hij twaalf jaar krijgt als Willem bekent – een ramp. Dus blijven ze zitten waar ze zitten, ook al zou een gezamenlijke switch naar ontkennen hen beiden helpen. Precies daarom is het een evenwicht: stabiel, maar niet optimaal.

Kort samengevat: een gevangenendilemma ontstaat alleen als er dominante strategieën zijn die leiden tot een Nash-evenwicht dat niet Pareto-optimaal is. Zonder die mismatch geen dilemma. Oefen dit met de matrix in je hoofd, en je kraakt zulke vraagstukken op het examen moeiteloos. Snap je nu waarom bedrijven soms prijzen dumpen of adverteren, ook al zou minder beter zijn voor iedereen? Dat is speltheorie in de praktijk!