Pages

Deel 1: Details van de Match van de 21e eeuw (De historische match van deep learning AlphaGo vs Lee Sedol)


Achtergrond details van de match van de 21e eeuw


Wereldwijd gezien als de belangrijkste nog openstaande uitdaging voor kunstmatige intelligentie, wordt go al meer dan een halve eeuw beschouwd als één van de moeilijkst te kraken en onder de knie te krijgen denksporten, vooral vanwege de weinige hendels die computer programma's hebben om de complexiteit van een go-stelling stevig proberen in te dammen. Op brute kracht gebaseerde en eindeloos doorrekenende zoekopdrachten naar 'goeie' zetten zijn voor computers nagenoeg onhandelbaar (nog afgezien van het feit dat het aantal mogelijke posities bij go groter is dan het aantal zichtbare atomen in het heelal). 

Op 27 Januari dit jaar, ging baanbrekend nieuws de hele wereld over: programma AlphaGo van DeepMind wint vijf partijen match tegen regerend Europees kampioen Fan Hui (2p). Niet eerder versloeg een computer programma een go-prof met 5-0 in formele gelijk-op partijen. De tot nu toe meest uitdagende en complexe klus, voor computers en kunstmatige intelligentie wereldwijd, lijkt daarmee dus te zijn geklaard. Ondanks het winnen van de match tegen Fan Hui, liet AlphaGo echter wel wat steken vallen en kwamen sommige zwaktes van het AI programma aan het licht. Het DeepMind team wilde daarom onderzoeken of ze in staat zouden zijn AlphaGo's spel sterk te verbeteren en op te krikken tot het niveau van de allersterkste go-profs ter wereld. Daarom ook nodigde het DeepMind team Fan Hui zelf uit om hun verder te helpen het spel van AlphaGo te verbeteren.

Op 4 februari maakte Demis Hassabis, directeur en oprichter van Google DeepMind, in een tweet bekend dat AlphaGo van 9 – 15 Maart een match over vijf partijen zal spelen tegen de beste menselijke go speler van de laatste 10 jaar: Lee Sedol (9p). Dit zal de grootste en meest spectaculaire en baanbrekende match zijn in de geschiedenis van het oudste spel ter wereld en zal zonder twijfel nog heel lang worden aangeduid als de match van de 21e eeuw.



Voor het DeepMind team is het belangrijkste doel van deze match om te testen of een verbeterde versie van AlphaGo een gelijkwaardige tegenstander kan zijn voor Lee Sedol. En misschien zelfs wel al in staat zal zijn om hem te verslaan. Daarnaast is het team ook geïnteresseerd in het vinden en repareren van eventuele, nieuwe zwaktes of onvolkomendheden in het programma.

Het overkoepelende en belangrijkste lange termijn doel van het DeepMind team, echter, is het maken van generieke, voor alle doeleinden geschikte, deep learning software die in staat is wetenschappers te helpen effectieve oplossingen te vinden voor ultra complexe problemen in uiteenlopende onderzoeksgebieden als gezondheidszorg, energie, transport, voedsel, genetica, natuurkunde, etc.

Tot nu toe hebben computer programma's nog nooit een top go-prof gelijk-op weten te verslaan. Deze match zal daarom ook een toets zijn voor de plotselinge, schoksgewijze snelle groei van AI –hoe ver zijn deze technologiën op dit moment gevorderd (en misschien ook wel hoe ver ze kunnen komen)-- en wat wetenschappers en ontwikkelaars tot nu toe hebben bereikt op het gebied van AI. 

Een van de meest opvallende en intrigerende beslissingen van het DeepMind team bij het trainen van AlphaGo is het gebruik van een giga verzameling partijen louter gespeeld door sterke amateurs (≥ 6d tot 8-9d, dit komt ongeveer overeen met 1-2d prof) afkomstig van de KGS Go server. Dit terwijl ze in plaats daarvan ook hadden kiezen om partijen van sterke go-profs te gebruiken (inclusief de sterkste 9p profs van de wereld). Hassabis heeft herhaaldelijk verklaard, bevestigd en benadrukt dat er –geen enkele-- sterke prof partij zit in de database waarmee AlphaGo heeft geleerd en getraind. En specifieker: deze database bevat geen enkele partij van Lee Sedol. Toch zijn er minimaal 85.000 pro games publiekelijk toegankelijk, dat is meer dan de helft van de hoeveelheid van 130.000 KGS games die gebruikt zijn om AlphaGo's basis systeem te trainen. 

Stel je eens voor dat je bijna oneindig dik in je slappe was zit, één van de meest geavanceerde reken platforms ter wereld bezit en werkelijk de meest mega getalenteerde en gemotiveerde werknemers (en dochter ondernemingen) ter wereld in dienst hebt. Die zonder twijfel behoren tot de allerbesten wereldwijd op het gebied van AI onderzoek. Wat zou dan in hemelsnaam een reden kunnen zijn om uitdrukkelijk –niet-- te kiezen voor de meest uitgebreide verzamelingen go-prof partijen die vandaag de dag beschikbaar zijn? Gebruikers of copy rechten? Kosten of misschien grote inspanningen om deze prof partijen te kunnen gebruiken? Uiterst onwaarschijnlijk. Misschien dan dat de 85.000 prof partijen (in vergelijking met de 130.000 amateur partijen van KGS) ontoereikend (of te inhomogeen) zouden zijn voor AlphaGo om op basis daarvan effectief te kunnen leren? Heel onlogisch aangezien de convolutionele (lees voor het gemak: codering  door middel van transformatie) neurale netwerken waarop AlphaGo gebaseerd is, gemakkelijk in staat zijn om zelfstandig miljoenen karakteristieke eigenschappen uit bordposities en patronen af te leiden, zelfs al gebruikmakend van een relatief kleine aantal van zeg 50.000 partijen.

Zou het daarom dan niet veel meer voor de hand liggen, voor het intelligente en zeer gemotiveerde team achter AlphaGo, om –exclusief-- te gaan voor een verzameling sterke go-prof partijen als hun ultieme doel is het sterkste go-spelende programma ter wereld te ontwerpen, trainen, testen, gebruiken en verbeteren om daarmee uiteindelijk ook de allerbeste go-profs van de wereld proberen te verslaan? 

Zeer waarschijnlijk is er dus een hele simpele, logische, onderliggende, vanzelfsprekende en boven alles heel fundamentele reden voor deze opmerkelijke keuze: het DeepMind team wil onderzoeken en analyseren of  de manier waarop AlphaGo is ontworpen en getraind, dat wil zeggen uitsluitend op basis van amateur partijen,  kan resulteren in een 'intelligent' systeem dat in staat is om (van tijd tot tijd) zetten te spelen die ver boven amateur niveau uitstijgen, dus ver boven het niveau van de partijen aan de hand waarvan AlphaGo go heeft leren spelen.   

Met andere woorden: àls AlphaGo in staat zal zijn om Lee Sedol te verslaan op basis van louter amateur-niveau partijen (spelers die normalerwijze niet in staat zouden zijn om van Lee Sedol te winnen, zelfs niet met drie stenen voorgift), zou dat dan niet bewijzen dat AlphaGo qua ontwerp en training --zelfstandig-- nieuwe, top-niveau prof-zetten en patronen heeft leren te spelen die absoluut onbekend waren in de oorspronkelijke data op basis waarvan het programma go heeft leren spelen? Dat AlphaGo consequent een speelsterkte zou hebben ontwikkeld die aantoonbaar veel sterker is dan welke amateur ook van wie deze partijen afkomstig zijn?  Dat zou werkelijk een onvoorstelbaar grote doorbraak in AI wereldwijd zijn en bewijzen dat deep learning modellen –beter-- kunnen worden dan de data die je ze voedt (in tegenstelling tot het algemeen geaccepteerde en wijd verbreide idee dat deep learning models --hooguit-- zo goed zijn als de data die je ze voedt).




De match over vijf formele partijen zal worden gespeeld in het Four Seasons Hotel in Seoul, Zuid-Korea (partijen zullen beginnen om 13h lokale tijd:  04h GMT, met rust dagen op 11 en 14 Maart). Er zal worden gespeeld volgens chineze regels (19x19, 7.5 komi) en de bedenktijd zal 2 uur per persoon zijn (plus drie byoyomi perioden van 60 sec). Iedere partij zal naar verwachting tussen de 4 – 5 uur duren. De winnaar van de match ontvangt  $1M prijzengeld. Als AlphaGo de winnaar wordt, zal het prijzengeld gedoneerd worden aan goede doelen als Unicef. Lee Sedol ontvangt hoe dan ook $150.000 bij deelname aan alle vijf partijen plus $ 20.000 extra voor iedere partij die hij weet te winnen.

Hassabis lichtte de match toe: “Go is het meest diepgaande spel ooit dat de mensheid heeft bedacht. De elegante simple regels leiden tot wonderschone complexiteit. Go is een spel dat in de eerste plaats gaat om intuïtie en gevoel meer dan brute doorrekening wat het ook zo moeilijk maakt voor computers om het spel degelijk te spelen. Daarom ook is het bij go zeer lastig om te bepalen wie er voor staat. De waarde van een steen komt pas tot bloei door de relatieve positie ten opzichte van andere stenen op het bord, en die waarde verandert met elke zet. 

Tegelijkertijd kunnen kleine tactische beslissingen, zoals iedere go speler weet, enorme gevolgen hebben later in de partij. Er is een overvloed aan structuur –go spelers praten over kenmerken als ladders, muren en valse ogen – maar deze onstaan vanzelf op natuurlijke wijze door de regels, in plaats van dat ze door de regels voorgeschreven. We zijn vereerd en opgewonden om deze uitdagingsmatch te gaan spelen tegen Lee Sedol, een ware go-legende, en ongeacht wie er wint of verliest, we hopen dat deze match wereldwijd veel nieuwe belangstelling voor en inspiratie door go teweeg zal brengen”. 

Park Chimoon, Vice President van de Koreaanse Baduk Associatie (KBA) zei: “De hele wereld is geïnteresseerd in deze belangrijke gebeurtenis aangezien dit de eerste fase is waarin mensen en computers elkaar beconcurreren in intelligentie. Ik ben trots dat het in deze historische fase om go gaat. Ik hoop dat Lee Sedol deze keer zal winnen zodat mensen hun opmerkelijke intelligentie kunnen bewijzen en de mysteries van go behouden kunnen blijven”. 

De match zal live worden uitgezonden op DeepMind's YouTube kanaal als ook ook live op tv in heel Azië door Korea's Baduk TV, als ook door televisie stations in China, Japan, als elders. Match commentatoren zijn onder meer Michael Redmond, de enige westerse go speler die het gelukt is om de 9e dan prof status (9p) te bereiken met meer dan 500 winst partijen tegen professionals, die in het engels commentaar zal geven, en Yoo Changhyuk (9p), Kim Sungryong (9p), Song Taegon (9p), and Lee Hyunwook (8p) die om en om in het Koreaans commentaar op de match zullen geven. 




Hassabis verklaarde: “als AlphaGo deze match zal winnen tegen de legendarische Lee Sedol, dan geloof ik dat dat zou betekenen dat AlphaGo beter is in het spelen van go dan wie dan ook ter wereld”. In een eerste verklaring dat zei Lee Sedol dat hij zeer verheugd en opgewonden is om deze uitdaging aan te gaan: “Ik voel me bevoorrecht om diegene te zijn die speelt, maar ik vertrouw erop dat ik kan winnen”. 

Afhankelijk van eventuele verbeteringen aan en de verdere ontwikkeling van AlphaGo gedurende de laatste paar maanden (afgezien van mogelijke aanpassingen in AlphaGo die specifiek gericht zijn op Lee Sedol's manier van spelen) en de enorme rekenkracht die zal worden gebruikt tijdens de match, zal AlphaGo waarschijnlijk de speelsterkte van top spelers als Lee Sedol kunnen benaderen. Zodoende is de kans heel groot dat dit een buitengewoon spannende, boeiende, enerverende en inspirerende match zal worden. Mocht AlphaGo deze match tegen Lee Sedol winnen dan zal dat ongetwijfeld een heel wat grotere sensatie zijn dan na de matchwinst van AlphaGo tegen Fan Hui (of toen Deep Blue Kasparov versloeg).

1 comment:

  1. Overzichtsartikel over de historische match van deep learining AlphaGo tegen Lee Sedol. Deel 1: introductie en achtergrond details van de match.

    ReplyDelete