Deep Learning: Sky's the Limit?: Laatste Voorspellingen Match AlphaGo vs. Lee Sedol (9p)

Het is zover: de historische match van AlphaGo tegen Lee Sedol (9p) gaat zo van start. Met de talrijke mogelijke verbeteringen aan AlphaGo en de langere bedenktijd / rekentijd van 2 uur per persoon beloofd het al met al een enorm spannende match te gaan worden.

Vrijwel alle polls wereldwijd tonen hetzelfde beeld: ~75 - 85 % van alle stemmers is ervan overtuigd dat Lee Sedol de komende match tegen AlphaGo gaat winnen. Dit is ook de voorspelling van 't leeuwendeel van de deelnemers aan de prijsvraag (totaal ~105 deelnemers, georganiseerd in samenwerking met schaak en go winkel het Paard en ICT bedrijf).

Er zijn echter veel redenen om aan te nemen dat AlphaGo , sinds de match een half jaar geleden, waarin Europees Go Kampioen Fan Hui (2p) verpletterend werd verslagen met 5 – 0, nu minimaal een paar dan graden sterker zal spelen tegen Lee Sedol. De geschatte actuele speelsterkte van AlphaGo is: ≥ 8e dan prof.

AlphaGo heeft geleerd van (kleinere) fouten in de match tegen Fan Hui
verbeteringen aan AlphaGo's speel algorithmes (bijv. voor zetkeuze en performance evaluatie)
AlphaGo kan nu wellicht bouwen op uitgebreide openings- en vorm bibliotheken
fijnafstemming en uitbreiding van AlphaGo's neurale netwerk training sessies
het voorkomen en omzeilen van specifieke probleem situaties (bijv. complexe ko's om veel punten)
selectie van bepaalde groepen van prof games, niet alleen partijen van de KGS Go Server maar ook (selectief) van andere Go servers wereldwijd
verbetering van de balans tussen enerzijds AlphaGo's neurale netwerken voor zetbepaling en bordevaluatie en anderzijds de precieze doorrekening middels Monte Carlo Tree Simulatie
uitbreiding van het aantal conventionele (> 1202 CPUs) en grafische processors (> 176 GPUs) waarvan de gedistrubeerde versie van AlphaGo tegelijkertijd gebruik kan maken in zijn partijen tegen Lee Sedol
verhoging van de bedenktijd / rekentijd, deze is nu 2 uur per persoon (en was 1 uur tijdens de match tegen Fan Hui) en zal sterk in het voordeel van de zeer nauwkeurig rekenende AlphaGo werken
implementeren van nieuwe ideeën en concepten om de performance van AlphaGo sterk te verbeteren en/of gebruik te maken van specifiek zwakkere elementen in het spel van Lee Sedol – voor zover deze zijn aan te wijzen aangezien Lee Sedol > 68% van zijn partijen heeft gewonnen de laatste 20 jaar --
sterk uitbreiden van het bestudeerde aantal Go-posities (> 60 miljoen) en/of gespeelde partijen van AlphaGo (tegen zichzelf, ≥ 1.3 miljoen) om de nauwkeurigheid bij het reproduceren van zetten van Go-profs door AlphaGo te verhogen. Aangetoond is dat met kleine verbeteringen in deze nauwkeurigheid onmiddelijk grote sprongen voorwaarts in speelsterkte bereikt kunnen worden
verbetering en uitbreiding van positie filters welke bepalen of een (deel-) positie uit een partij tegen Lee Sedol voldoende nauwkeurig wordt herkend door AlphaGo
verbeteringen in het leren van de waarde van Go-zetten door meer gedetailleerde en nauwkeurigere terugkoppeling van de uiteindelijke partij uitslag tijdens de trainingsessies van AlphaGo

Ondanks de bovenstaande mogelijke verbeteringen aan AlphaGo tijdens de match tegen Lee Sedol is mijn verwachting dat:

Lee Sedol minimaal één partij van AlphaGo gaat winnen
de winnaar van de eerste partij ook de uiteindelijke winnaar van de match wordt
Lee Sedol de match gaat winnen met 3-2
AlphaGo ook minimaal één partij gaat winnen
Lee Sedol aantoonbaar (*) minimaal één zet achterwege laat die hij wel degelijk onmiddelijk had moeten spelen, en dit wel in IEDERE partij van de match
Lee Sedol aantoonbaar (*) minder is in het eindspel dan AlphaGo en daar consequent punten verliest, in iedere partij van de match
Lee Sedol minimaal één partij op totale opgave komt te staan (*). Of hij dan ook opgeeft of uiteindelijk alsnog wint / verliest is daarbij niet van belang
Lee Sedol alle zeilen zal moeten bijzetten om zijn eventueel opgebouwde winst in een partij (*) tot het einde van de partij te behouden
AlphaGo binnen een jaar na de match met Lee Sedol een soortgelijke match tegen een sterke 9p prof (wellicht weer Lee Sedol) zal houden en deze zal winnen (van de vijf formele partijen wint AlphaGo er dan minimaal 3).

(*) dit bijvoorbeeld beoordeelt door een meerderheid van 10 onafhankelijke top profs (9p) uit Zuid-Korea, China en Japan.

En als je om het bovenstaande wilt wedden: Deep Learning modellen zijn zo goed als de data die je ze voedt.

Deep Learning: Sky's the Limit?

Pages

Laatste Voorspellingen Match AlphaGo vs. Lee Sedol (9p)

No comments:

Post a Comment