En octobre 2015, un programme informatique de Google dénommé AlphaGo a battu Fan Hui, le double champion d’Europe de jeu de Go, par 5 victoires à 0. Ce fut la première fois de l’histoire qu’un ordinateur batte un professionnel sur un plateau complet de Go de 19×19. Cet événement n’a été rendu public qu’en janvier 2016. AlphaGo a encore enfoncé le clou en battant Lee Sedol, champion du monde et meilleur joueur de Go au monde depuis une décennie, par 4 victoires à 1, du 8 au 15 mars 2016.
Cet événement a ouvert une nouvelle ère à l’intelligence artificielle, offrant des possibilités qui n’étaient même pas imaginables il y a quelques mois.
On se souvient encore de l’ordinateur Deep Blue d’IBM battant le champion du monde de jeu d’échec Garry Kasparov en mai 1997. Alors, en quoi l’événement de cette année est-il extraordinaire ?
Des échecs au Go, un changement d’échelle
C’est que le Go, jeu chinois vieux de plus de 2500 ans, est basé sur l’intuition, la créativité et la stratégie. Il est théoriquement impossible à analyser avec un ordinateur. Et pour cause : le nombre de combinaisons possibles dépasse rapidement le Gogol (soit 10100).
Sur un plateau d’échecs, il y a 20 coups possibles pour le premier déplacement. Si on considère les 2 premiers tours (chaque joueur joue 2 coups), il existe 20 000 combinaisons possibles.
Sur un plateau de Go, il y a 361 positions possibles pour un pion. Une fois le pion joué, l’adversaire a 360 possibilités de jeu. Vous aurez ensuite 359 possibilités pour le pion suivant. Sur une partie de 2 tours, il existe près de 2 x 1010 possibilités.
On comprend bien que le Go est déjà 106 fois plus complexe que le jeu d’échec au bout de 2 tours. 10 tours de Go présentent 1051 possibilités, sachant que notre galaxie est composée de 1068 atomes !!!!! En faisant des hypothèses sur le bon sens de l’adversaire, on peut réduire ces possibilités (ce que l’on nomme l’élagage alpha-bêta). Il est néanmoins absolument inenvisageable d’explorer toutes les possibilités, même par le plus puissant des ordinateurs.
A ça, il faudra rajouter l’extrême difficulté avec le Go de construire une fonction d’évaluation, qui permette de comparer 2 situations pour choisir la meilleure. Ceci fait qu’aucune machine n’a jamais battu un joueur professionnel de Go.
Derrière AlphaGo, DeepMind
AlphaGo est issu de la recherche d’une start-up britannique : DeepMind Technologies. Créée en 2010, DeepMind Technologies a été fondée par 3 personnes, dont 2 chercheurs en intelligence artificielle : Demis Hassabis, Shane Legg et Mustafa Suleyman.
DeepMind Technologies a été acquise par Google en janvier 2014 pour $400 millions. Il s’agit de la plus grosse acquisition européenne de la firme de Mountain View.
Derrière DeepMind, le deep learning
DeepMind Technologies exploite une science en plein boom appelée le deep learning ou apprentissage profond.
En 1957, est apparu le perceptron, modèle mathématique simplifié du neurone biologique. Vers la fin des années 1980 sont apparus les réseaux neuronaux artificiels à couches.
Yann LeCun, l’un des inventeurs de l’apprentissage profond et aujourd’hui directeur du laboratoire d’Intelligence Artificielle de Facebook, avait soutenu sa thèse en 1987. Il avait développé un programme qui a servi à lire près de 20 % des chèques émis aux USA.
Mais comme la puissance des ordinateurs de l’époque n’était pas suffisante pour permettre une utilisation confortable de la méthode, celle-ci a été progressivement abandonnée au détriment d’autres approches. Elle a été reprise vers 2000 avec une avancée fulgurante.
Derrière le deep learning, les réseaux neuronaux
L’étude des réseaux de neurones artificiels (ANN) a pour but de développer des machines capables d’apprendre. L’apprentissage peut être de deux types : supervisé ou non-supervisé. Dans le premier cas, la machine n’a aucune connaissance préalable des règles liées au domaine appris. Elle visualise des millions de parties déjà enregistrées. Dans la deuxième approche, la machine joue des millions de parties contre elle-même pour trouver ses propres stratégies.
AlphaGo utilise une combinaison de ces deux approches, supportées par deux réseaux neuronaux multi-couches qu’il programme successivement. Exactement comme un enfant observant son grand-père jouant au poker, il apprend alors à la volée la valeur des cartes, les règles du jeu et la stratégie, au fil des parties. Il se retire ensuite pour jouer tout seul dans son coin, pour trouver ses propres techniques et affiner sa stratégie.
Dans les 5 dernières années, le deep learning a considérablement avancé, sur le plan théorique. Le développement de nouveaux algorithmes pour réseaux neuronaux multicouches a conduit à des avancées fulgurantes dans différents domaines d’application comme la vision, la reconnaissance vocale, la biologie, l’analyse de l’ADN ou les jeux.
Dans ce dernier domaine, le deep learning a permis de créer des machines capables d’analyser des millions de parties et de créer leur propres stratégies.
Lee Sedol dit que la raison de sa défaite est que la machine utilise des stratégies complètement inhabituelles, qu’aucun humain n’aurait jamais utilisées. Il affirme qu’avec le temps, il pourra s’adapter à ce genre de comportement et finir par battre la machine. Mais gageons que, telle la rivière qui se regardait dans les yeux de Narcisse pendant que celui-ci admirait son propre reflet à la surface de l’eau, la machine sera capable d’adapter sa propre stratégie à mesure que le champion du monde s’habitue à ses comportements : la course à l’intelligence entre l’homme et la machine pour la suprématie et la domination sur la planète terre a donc déjà commencé.
Deep learning et l’invasion des robots
Le domaine des machines autonomes et auto-apprenantes engendre déjà une peur alimentée par les films de science fiction : pour la première fois de l’histoire de l’humanité, une machine possède plus d’intelligence que le plus performant humain vivant.
Même s’il s’agit -pour le moment- de domaines très spécifiques, certaines personnes comme l’entrepreneur milliardaire Elon Musk ou le physicien Stephen Hawking alertent sur le fait qu’un jour prochain, ces machines pourront prendre le contrôle de leur destinée et devenir incontrôlables pour l’Homme.