AlphaZero de DeepMind devient champion d'échecs en quelques heures ! (et champion de Shogi et de Go aussi !)

Par:

fredericmazue

jeu, 07/12/2017 - 16:02

intelligence artificielle, Apprentissage de renforcement général, AlphaZero, AlphaGo

Depuis quelques heures, une très étonnante nouvelle met les forum échiquéens en ébullition. L'intelligence artificielle de DeepMind, filiale de Google, a appris à jouer aux échecs au plus haut niveau en seulement quelques heures.

DeepMind explique cela dans un article au format PDF accessible depuis cette page. Moyennant un peu de patience car actuellement, il semble que le serveur du site croule sous les requêtes.

Le programme d'échecs de DeepMind s'appelle AlphaZero. Le Zero signifiant qu'au départ le niveau de jeu du programme est nul. Le programme ne connaît que les règles du jeu d'échecs. Il n'est doté d'aucun stratégie de jeu, mais d'une fonctionnalité d'apprentissage par renforcement. En clair, plus il joue, plus il tire des conclusions, plus il apprend et meilleur devient son niveau.

« Partant d’un jeu aléatoire et n’ayant aucune connaissance à part les règles du jeu, AlphaZero a atteint en 24 heures un niveau de jeu surhumain dans les parties d’échecs et a battu de manière convaincante un programme de classe mondiale explique DeepMind qui précise qu'il a fallu 9 heures d’entraînement et 44 millions de parties pour maîtriser les échecs avec cet algorithme d’apprentissage de renforcement général.

Ensuite il a fallu 4 heures seulement à AlphaZero pour surclasser Stockfish. Stockfish est un moteur d'échecs open source, considéré comme le meilleur au monde. En fait pour être précis, le débat reste ouvert à ce niveau, certains considérant que c'est le moteur Komodo qui est le meilleur. Quoi qu'il en soit, Stockfish, Komodo, ou encore Fritz, Houdini, etc. sont des programmes d'échecs extrêmement forts, capables de battre des champions du monde humains.

AlphaZero et Stockfish ont disputé un match de 100 parties, à la cadence de 1 minute par coup pour chaque programme. Le match s'est soldé par 75 parties nulles et 25 victoires de AlphaZero. Ce qui, pour ceux qui connaissent le jeu d'échecs, est un résultat ébouriffant, pour ne pas dire plus...

AlphaZero recherche seulement 80 000 positions par seconde aux échecs contre 70 millions pour Stockfish. AlphaZero compense ce faible nombre en utilisant son réseau de neurones profonds pour se concentrer beaucoup plus sélectivement sur les variantes les plus prometteuses – sans doute une approche de recherche plus ‘humaine' écrit DeepMind... Plus humaine si l'on peut dire... Mais désormais, la force brute n'est clairement plus l'arme principale de ce genre de programme informatique.

Peter Heine Nielsen, qui compte parmi les meilleurs joueurs du monde et qui est le secondant de l'actuel champion du monde Magnus Carlsen, a commenté ainsi cette nouvelle à la BBC: "Je me suis toujours demandé comment cela se passerait si une espèce supérieure débarquait sur terre et nous montrait comment elle jouait aux échecs. Maintenant je sais."

AlphaZero a réalisé un exploit similaire au Shogi, un jeu qui peut être considéré comme le jeu d'échecs japonais. Pour AlphaZero, le jeu d'échecs et le Shogi sont probablement des jeux très similaires. AlphaZero a gagné un match en 90 parties contre le moteur Elmo, avec 80 victoires, 2 parties nulles et 8 pertes.

Enfin, AlphaZero a battu AlphaGo au Go après seulement 8 heures d'auto-formation. AlphaGo est le programme d'intelligence artificielle de DeepMind qui s'était illustré en battant les meilleurs joueurs humain du monde, au cours de plusieurs matches qui ont eu lieu entre le printemps 2016 et le printemps 2017. Le match en 100 parties Alpha Zero - AlphaGo a eu pour résultat 40 pertes et 60 victoires pour Alpha Zero.

Ajouter un commentaire

Commentaires

guineret

—

09:29 , 01/12/2018

—

Permalien

impressionnant!

répondre