Google développe une intelligence artificielle qui se passe de l'homme pour apprendre

Publication: Mis à jour:
ALPHAGO ZERO
GOOGLE DEEPMIND
Imprimer

INTELLIGENCE ARTIFICIELLE - Vous vous souvenez d’AlphaGo, le célèbre programme d’intelligence artificielle de Google DeepMind qui a fait sensation en 2016 en battant le meilleur joueur au monde de Go? Ce programme vient à son tour d’être battu à plate couture par... une version améliorée de lui-même!

Si la victoire en tant que telle n’a rien de surprenant - une nouvelle version d’un logiciel est toujours censée être meilleure que la précédente - le plus sensationnel réside dans le fait que le nouveau programme, baptisé AlphaGo Zero, a pu battre son adversaire sans qu’aucun humain ne lui ait appris à jouer.

En effet, et contrairement à AlphaGo qui avait besoin d’étudier pendant plusieurs mois des dizaines de millions de parties jouées entre des êtres humains, AlphaGo Zero a pu apprendre "tout seul" en jouant contre lui-même avec comme seul élément de départ les règles du jeu de Go.

Et le résultat est sans appel: après seulement trois jours d’entraînement en autodidacte, le programme terrasse son adversaire par 100 matchs à 0! Après 40 jours d’entraînement, AlphaGo Zero est devenu encore plus fort, surpassant même AlphaGo Master, une version plus puissante d’AlphaGo qui avait battu en 2017 le numéro 1 mondial, Ke Jie.



La prouesse a été réalisée par l’équipe britannique de Google DeepMind qui vient de publier un article dans la prestigieuse revue scientifique Nature. "Alors que les précédentes versions du programme ont été formées par 'apprentissage supervisé' à partir de mouvements d’experts humains, nous avons introduit dans AlphaGo Zero un algorithme basé uniquement sur 'l'apprentissage par renforcement', sans données, conseils ou connaissances du domaine au-delà des règles du jeu", expliquent les experts.

Et la méthode marche. Non seulement le système a progressivement appris le jeu de Go à partir de zéro, accumulant des milliers d’années de connaissances humaines pendant quelques jours, mais il a également découvert de nouvelles connaissances, développant des stratégies non conventionnelles et de nouveaux mouvements.

Ce sont ces "moments de créativité" de l’intelligence artificielle qui intéressent justement les scientifiques, car ils permettront de multiplier l’ingéniosité humaine pour résoudre certains des défis les plus importants auxquels l’humanité est confrontée. Déjà, les chercheurs de DeepMind évoquent des secteurs de recherches tels que le repliement des protéines, la réduction de la consommation d’énergie ou la recherche de nouveaux matériaux révolutionnaires comme domaine d’application à leur technique d’apprentissage.

Pour rappel, en 1997, le champion du monde d’échecs Garry Kasparov avait déjà été vaincu par l’ordinateur Deep Blue d’IBM. Mais le défi pour la machine semblait bien plus important au jeu de Go, qui présente un nombre de combinaisons de jeu beaucoup plus impressionnant, encore plus grand que le nombre d’atomes dans l’univers.

LIRE AUSSI: