Dans la première partie de cet article, votre agence web spécialisée dans la création de sites e-commerces s’est penchée sur le « deep learning ».
Il s’agit de comprendre comment AlphaGo a appris à jouer. Mieux, il s’agit de comprendre comment il est devenu un expert en jeu de go. Rappelons que l’algorithme de Google est désormais capable de vaincre les plus grands spécialistes en la matière. Pour cela, en plus de la technique de l’apprentissage profond, il a dû intégrer celle de la « recherche Monte-Carlo » et du « big data ».
Technique Monte-Carlo
La « recherche Monte-Carlo » permet d’établir des statistiques sur les coups possibles dans différents contextes de jeu. Les coups remportant le plus de succès dans un contexte donné sont mémorisés, tout comme les contextes eux-mêmes. De cette manière, lorsqu’AlphaGo rencontre une situation similaire par la suite, il choisit habilement les coups y répondant le mieux.
Big data
AlphaGo est doté de méthodes récentes et fines de gestion et d’analyse massive de données. Ces données, il les récolte au fil des très nombreuses parties d’excellents joueurs qu’il a observées. Elles sont utilisées pour amorcer son processus d’apprentissage. Ainsi, dans un premier temps, son travail consiste à imiter le comportement humain.
Une autre salve de données est ensuite générée par les parties de jeu de go que l’algorithme joue contre lui-même pour parfaire ses méthodes. C’est de cette manière qu’il passe au niveau superhumain.
L’homme, inégalable
Même si l’intelligence artificielle est à des années lumières de rattraper les capacités humaines, elle s’en approche doucement. Et cela est encore une réussite de l’humain – ingénieurs et chercheurs -, cette fabuleuse machine.
06 25 21 86 99