Intelligence artificielle : le go a un nouveau maître

Le but du jeu de go est simple : il s'agit de faire "prisonnier" les pions adverses et ainsi de contrôler le plus de territoire possible. © Jonathan Reichel

En 2017, un logiciel appelé AlphaGo Zero est devenu le champion suprême du jeu de go. Cette intelligence artificielle, ayant surpassé toutes ses versions précédentes, a appris un des jeux de société les plus vieux du monde sans aucune donnée extérieure.

En 2016, la foudre s’est abattue sur le monde du go, ce jeu de plateau chinois réputé comme le plus ancien à encore être pratiqué. Se-dol Lee, considéré comme le plus grand joueur de go de la planète, a été écrasé par… un ordinateur. Une première dans l’histoire du go. AlphaGo, développé par Google DeepMind, une entreprise spécialisée dans l’intelligence artificielle, devint alors le meilleur joueur de go du monde. « Battre un joueur professionnel de go a toujours été un défi de longue date pour la recherche sur l’intelligence artificielle » a déclaré plus tard Dennis Hassabis, fondateur de DeepMind.

AlphaGo est un programme d’intelligence artificielle basé sur le principe de “réseau neuronal profond”. En d’autres termes, lorsque AlphaGo joue au go, il étudie à chaque coup les différentes possibilités qui s’offrent à lui. Il les classe alors selon les meilleurs pourcentages de victoire possibles, avant de placer sa pierre. Tout ceci est basé sur “l’auto-apprentissage” du logiciel. En effet, au début de sa programmation AlphaGo s’est vu intégré plus de 100 000 parties de go “humaines”. Il a appris le jeu, puis a joué des millions de parties contre lui-même, afin d’apprendre de ses erreurs autant que de ses victoires. 

Un an plus tard, second tremblement de terre. Fin 2017, AlphaGo est détrôné par sa dernière version : AlphaGo Zero. Ce nouveau programme est basé uniquement sur l’auto-apprentissage : contrairement à son prédécesseur, AlphaGo Zero n’a jamais été exposé à des parties pré-enregistrées. C’est une véritable prouesse de l’intelligence artificielle. Avec seulement un plateau de go et les règles du jeu, AlphaGo Zero a été capable de venir à bout de n’importe quelle autre version du programme. La preuve ultime de supériorité de l’intelligence artificielle sur l’humain au go. 

Les résultats obtenus par DeepMind sont une avancée considérable dans la recherche sur l’intelligence artificielle. Mais nous sommes encore bien loin des robots intelligents assoiffés de sang de Terminator. Dennis Hassabis se voit même rassurant quant aux travaux réalisés par son équipe : « le coeur de notre mission est de comprendre l’intelligence et de la recréer. Ensuite, nous espérons utiliser cette technologie pour aider la société ». On peut d’ailleurs voir comme une certaine poésie dans la manière d‘utiliser le plus vieux jeu du monde pour forger l’avenir. 

Antoine Duval