Een team wetenschappers van Google DeepMind en de universiteit van Oxford is erin geslaagd een ingewikkeld raadsel op te lossen met behulp van artificiële intelligentie.
De onderzoekers gingen aan de slag met een ingewikkeld vraagstuk dat sollicitanten bij Google naar verluidt ook wel eens voorgeschoteld krijgen. Ze lieten daar verschillende entiteiten met kunstmatige intelligentie op los die, om dat vraagstuk op te lossen, eerst met elkaar moesten leren communiceren en zelfstandig informatie moesten uitwisselen. Dat ze die opdracht tot een goed einde wisten te brengen, zou een belangrijke doorbraak zijn in het onderzoek naar kunstmatige intelligentie.
Het vraagstuk
Het vraagstuk is nochtans niet eenvoudig. Het begint met honderd gevangenen die door een beul op een rij gezet worden. Ze krijgen allemaal een rode of een blauwe hoed opgezet.
Elke gevangene kan de hoeden van de anderen voor hem in de rij zien, maar ziet niet welke kleur de hoeden van de gevangenen achter hem hebben. Ook de kleur van de hoed die ze zelf ophebben, kennen de gevangenen niet.
De beul start achteraan de rij en vraagt de laatste gevangene welke kleur zijn hoed heeft. Als de gevangene correct antwoordt, mag hij blijven leven. Zoniet, wordt hij ter plekke - en in alle stilte - geëxecuteerd.
De andere gevangenen horen dus wel het antwoord van nummer 100, maar weten niet of dat antwoord correct was. Ze mogen elkaar geen signalen geven, bijvoorbeeld door harder of stiller te praten: als de beul dat merkt, worden ze allemaal omgebracht.
De avond voor de executies gepland staan, krijgen ze wel nog de kans om samen een strategie te bepalen. Hoe moeten ze dat aanpakken om met zo veel mogelijk te overleven? En hoe groot is de kans dat ze het overleven?
De oplossing
(scroll verder naar beneden voor de oplossing)
Er bestaat een mogelijkheid om alle gevangenen, op de laatste in de rij na, te redden. Er is een kans op de twee dat ook die laatste het haalt.
De laatste gevangene telt alle blauwe hoeden voor hem. Als dat een even getal is, roept hij ‘blauw’, als het oneven is, roept hij ‘rood’.
Als gevangene nummer 99 ‘blauw’ hoort, weet hij dus dat er, met zijn eigen hoed inbegrepen, een even aantal blauwe hoeden zijn. Als hij een oneven aantal blauwe hoeden telt voor zich telt, dan kan hij zeker zijn dat zijn eigen hoed blauw is, aangezien hij aan een even aantal blauwe hoeden moet komen. Als hij een even aantal blauwe hoeden telt, dan weet hij zeker dat zijn eigen hoed rood is.
Omgekeerd, als de laatste gevangene ‘rood’ geroepen heeft, dan weet nummer 99 dat er een oneven aantal blauwe hoeden moeten zijn. Telt hij een oneven aantal blauwe hoeden voor zich, dan weet hij dat hij zelf een rode hoed draagt. Telt hij een even aantal blauwe hoeden, dan draagt hij ook een blauwe hoed.
Nummer 99 kent dus met zekerheid de kleur van zijn hoed en kan die uitroepen en zijn eigen leven redden.
De volgende in de rij, nummer 98, weet ook of het aantal blauwe hoeden - met inbegrip van zijn eigen hoed - even of oneven is. Hij weet immers wat nummer 100 geroepen heeft en kent ook met zekerheid de kleur van nummer 99, want die heeft die zonet ook gezegd. Door het aantal blauwe hoeden voor hem te tellen - en de kleur van nummer 99 in rekening te brengen - kan hij de kleur van zijn eigen hoed te weten komen.
Zo gaat het verder en kan iedereen in de rij met zekerheid de kleur van zijn eigen hoed uitroepen en gespaard blijven. Alleen de laatste in de rij was niet zeker, maar aangezien die gokte op blauw of rood, heeft die ook een kans van een op de twee.