Met schaken hebben we al langer geen kans meer, maar nu heeft een computer van Google de mens ook verslagen met Go. En dat is opmerkelijk, want bij het Chinese bordspel zijn er veel meer verschillende scenario's mogelijk dan bij schaken. 'Dit is een enorme doorbraak voor artificiële intelligentie', zeggen experts.

Het Chinese bordspel Go bestaat al duizenden jaren en wordt gespeeld op een bord met 19 x 19 lijnen die samen 361 'kruispunten' vormen. De ene speler krijgt witte stenen, de andere zwarte. De bedoeling is om 'gebieden te veroveren' door ze te omsingelen met jouw stenen. 

Hoewel de regels vrij eenvoudig zijn, wordt Go nog meer dan schaken beschouwd als het meest complexe bordspel. Dat komt omdat er veel meer mogelijkheden zijn. Bij elke zet heeft een speler de keuze uit meer dan 200 opties, bij schaken zijn dat er maar zo'n twintig. Daardoor kan het spel bijna oneindig veel meer verschillende kanten uitgaan.

'Het aantal mogelijkheden is groter dan het aantal atomen in het heelal', wordt wel eens gezegd. Het is dan ook heel moeilijk om in te schatten wie er op een bepaald moment aan de winnende hand is. Topspelers vertrouwen vooral op instinct.

AlphaGo

Om die reden is Go veel moeilijker 'aan te leren' aan een computerprogramma. Volgens experts zou het dan ook nog jaren duren voordat een computer de mens zou verslaan, maar daar heeft Google verandering in gebracht.

AlphaGo, artificiële intelligentie-software ontwikkeld door de DeepMind-divisie van de internetgigant, versloeg de Europese Go-kampioen. Met forfaitcijfers. De match werd al in oktober vorig jaar gespeeld, maar het nieuws werd nu pas bekendgemaakt om het te laten samenvallen met de publicatie rond de software in het wetenschappelijk vakblad Nature.

Analyse van 30 miljoen zetten

'We hebben het programma eerst een analyse laten maken van 30 miljoen zetten van Go-partijen tussen professionele spelers', zegt Demis Hassabis, hoofd van Deepmind. 'Het leerde welke patronen vaker terugkeerden en welke goed uitpakten en welke slecht. Het leerde intuïtief te zijn. Vervolgens speelde het miljoenen en miljoenen varianten van het spel tegen zichzelf en leerde het uit zijn fouten. Daardoor kon het programma, en dat was de derde stap in het leerproces, ook op lange termijn leren plannen.'

Google testte AlphaGo ook al met andere Go-spelende AI-systemen van concurrenten. AlphaGo won 499 van de 500 partijen. En vorige oktober ging Europees kampioen Fan Hui in Londen voor de bijl. 'De reden dat we hier nu al toe in staat zijn, komt doordat de onderliggende algoritmes veel sneller dan verwacht vorderingen maakte en door heel wat verschillende algoritmes met elkaar te combineren', aldus Hassabis.

'Enorme doorbraak'

Volgens experts gaat deze overwinning veel verder dan een gewoon partijtje Go. 'Dit is een enorme doorbraak voor artificiële intelligentie, met wijdverspreide gevolgen', zegt Cambridge-professor Zoubin Ghahramani. 'Het technische idee dat hieraan ten grondslag ligt is het idee van versterkt leren,  waarbij computers zelf leren om hun gedrag te verbeteren om bepaalde doelen te bereiken. Dat kan gebruikt worden bij problemen rond besluitvorming, maar het zal bijvoorbeeld ook artsen kunnen helpen om een behandeling te plannen.'

Maart

In maart neemt AlphaGo het op tegen Lee Sedol, de beste speler van de wereld.