Hallo allemaal,
InleidingDempster-Shafer theorie is een methode uit de statistiek om met behulp van een aantal bewijsstukken de meest waarschijnlijke hypothese te kiezen uit een set van hypothesen. Meer informatie is te vinden op
http://en.wikipedia.org/wiki/Dempster%E2%80%93Shafer_theory en
http://fitelson.org/topics/shafer.pdfHet leek me een leuk idee om deze theorie toe te passen op het WIDM probleem. Voor Dempster-Shafer theorie zijn er drie essentiële componenten: de hypothesen, de bewijsstukken en het bewijs wat uit de bewijsstukken voortvloeit.
Methode In ons geval zijn de hypothesen de kandidaten. Slecht één hypothese kan waar zijn, en dat is logisch: maar één van de mensen die dit jaar mee doet is daadwerkelijk de mol. In de programmatuur wordt de set weergegeven met enkele letters, waar “a” correspondeert met Aafke, etc.
Bewijsstukken geven bewijs, door punten toe te kennen aan (combinaties) van hypothesen. De bewijsstukken die ik heb gekozen zijn
a) het 'follow the money' bewijs, zoals te zien op
http://www.wieisdemol.com/index.php?p=widm14-overzicht-molgeldzak en
b) de 'mol acties' zoals te zien op
http://www.wieisdemol.com/index.php?p=widm14-overzichten-molacties.
Bij het 'follow the money' bewijs worden punten toegekend aan de set van kandidaten die lijken te mollen. Bijvoorbeeld, bij de verlaten TV studio opdracht, is er geld verdiend, maar niet door Aafke, Daphne, Jan-Willem en Suzan. Dit kan wijzen naar het mol-zijn van één van deze kandidaten. Het 'mol-actie' bewijs werkt op ongeveer dezelfde manier. Als voorbeeld: bij de schijnwerper opdracht is de persoon die de widm website bijhoudt dit opgevallen: “Freek en Tygo denken in het begin dat de groene lasers de andere kandidaten zijn terwijl dit eigenlijk een lichtshow is. Dit kost tijd. “ Dit is bewijs voor het mol-zijn van Freek of Tycho.
Op zichzelf zijn bovenstaande bewijzen natuurlijk niet genoeg om de mol aan te wijzen. Het voordeel van Dempster-Shafer theorie is dat het te gebruiken is om een grote hoeveelheid bewijs samen te voegen, en te zoeken naar overlap tussen bewijsstukken. Een tweede voordeel is dat er een betrouwbaarheid aan elk bewijsstuk toegekend kan worden.
ResultatenIn mijn model heb ik op bovenstaande wijze bewijsstukken verzameld. Ik heb het 'follow the money' bewijs een betrouwbaarheid van 75% gegeven, en de losse molacties (omdat de regiseur m.i. veel meer invloed heeft op wat we daar wel/niet zien) een betrouwbaarheid van 25%.
Met deze gegevens kom ik op deze gemiddelde scores:
Aafke: 0.57
Daphne: 0.05
Freek: 0.06
Jan-Willem: 0.18
Jennifer: 0.01
Maurice: 0
Owen: 0
Sofie: 0.12
Suzan: 0.02
Tycho: 0.04
Grafiekje met onder- en bovengrenzen van deze schattingen:
https://www.dropbox.com/s/boeyvy2m6p8hded/widmbasecase.pngDoor te spelen met de betrouwbaarheid die we aan de bewijsstukken toekennen, zien we dat de conclusie “Aafke of Jan-Willem is de mol” op basis van wat we nu gezien hebben, wellicht best te trekken is. Zelfs als we elk bewijs maar 10% betrouwbaar vinden, blijft dit nog de beste conclusie:
https://www.dropbox.com/s/duicmbctqql5tyh/DSwidm.pngConclusieNu zijn er natuurlijk een hoop haken en ogen aan deze methode. Allereerst zijn we natuurlijk afhankelijk van een gegevensbron die probeert ons te misleiden, en ons niet te laten weten wie de mol is. Hoe dan ook geeft dit ons een overzicht van wat men ons wíl laten zien. Verder kunnen we gedeeltelijk voor misleiding compenseren door een lagere betrouwbaarheid te geven aan makkelijk te manipuleren fragmenten. Verder zullen de echte kandidaten af en toe ook domme dingen doen, bedoeld danwel onbedoeld.
Ik ben benieuwd hoe zich dit verder ontwikkeld, en of het toepassen van dit soort modellen überhaupt werkt op een spel als WIDM. Naderhand zal het leuk zijn om de voorspellende waarde te berekenen.
Voor mensen die hier ook wel eens mee willen spelen (bijv zelf bewijsstukken toevoegen of aan de betrouwbaarheid van bewijzen sleutelen), heb ik het scriptje bijgevoegd. Het is geschreven voor het programma Rstudio (
www.rstudio.com). Ik kan ook nog wel wat doorrekenen als mensen concrete getallen hebben.
groetjes!
Henk