DeepMind, propriété de Google, a annoncé avoir atteint un nouveau jalon en intelligence artificielle (IA). Son logiciel d’IA le plus sophistiqué, AlphaStar, a atteint le grade suprême de « grand maître » à StarCraft II, un jeu populaire de stratégie en temps réel sorti en 2010. Il a surclassé 99,8% des meilleurs joueurs et joueuses à travers la planète. Les résultats ont été publiés hier dans la prestigieuse revue scientifique Nature.

Ceux qui y ont déjà joué le savent : le jeu StarCraft II, édité par Blizzard Entertainment, peut devenir diaboliquement difficile, surtout lorsqu’on monte en grade dans les parties compétitives.

En 2016, DeepMind avait déjà réussi à accomplir l’exploit de battre un humain au jeu de go, un jeu de stratégie inventé il y a 3000 ans en Chine et considéré comme étant l'un des jeux les plus complexes au monde. StarCraft II était le prochain grand défi de l’équipe de recherche derrière l’IA.

« Le jeu est bien plus complexe que les échecs, parce que les joueurs contrôlent des centaines d’unités ; plus complexe que le jeu de go, parce qu’il y a 1026 choix possibles pour chaque mouvement ; et les joueurs ont moins d’information à propos de leur adversaire que dans une partie de poker », a expliqué dans une déclaration David Silver, chercheur chez DeepMind.

AlphaStar a joué anonymement contre de vrais adversaires sur la plateforme Battle.net, où les joueurs du monde entier s’affrontent en ligne, divisés en quatre grandes régions (Europe, Amériques, Asie et Chine). Seuls les meilleurs accèdent à la ligue « grand maître » (Nouvelle fenêtre) (Grandmaster en anglais), qui ne compte qu’une centaine de joueurs et de joueuses pour chaque région.

De nombreuses données à gérer

StarCraft II est un jeu de stratégie qui oppose des armées de races terrienne ou extraterrestre. Le participant débute la partie avec une poignée de soldats et d’ouvriers, ainsi qu’un nombre limité de ressources naturelles à exploiter, comme du minerai ou du gaz. Le but est d’extraire ces ressources afin de bâtir des édifices militaires et attaquer l’équipe adverse. Le jeu amène les participants à diriger des dizaines, voire des centaines d’unités simultanément, le tout en temps réel.

Des « ouvriers » ramènent du minerai à la base, dans StarCraft II. Photo : Blizzard Entertainment

AlphaStar devait donc gérer de nombreuses données à partir desquelles établir une stratégie. Dans StarCraft II, contrairement aux jeux traditionnels comme les échecs ou le jeu de go, le joueur ne voit pas toute la zone de jeu, l’écran n’affichant qu’une partie de la carte, les parties inexplorées restant dans le noir. Il est impossible de connaître à l’avance toutes les positions des ennemis sans envoyer une équipe de reconnaissance, ce qui représente une difficulté supplémentaire pour l’IA.

Les professionnels de StarCraft II y jouent à une vitesse ahurissante, exécutant plus de 300 actions par minute.

Grâce à un réseau de neurones artificiels, le logiciel a appris à maîtriser le jeu après 44 jours d’entraînement, en observant des parties jouées par des humains, et en jouant contre différentes versions de lui-même, afin de s’améliorer continuellement.

Ainsi, AlphaStar a réussi à devenir « grand maître » dans les trois races avec lesquelles il est possible de jouer, soit les Protoss, les Zergs et les Terrans, qui ont toutes leurs propres caractéristiques. Il a respectivement atteint des cotes de 6 275, 6 048 et 5 835. À titre comparatif, pour les mêmes races utilisées, les meilleurs joueurs d’Europe à l’heure actuelle ont des cotes de 6983, 6904 et 6702.

Un terrain de jeu égal pour tous

En janvier dernier, AlphaStar avait déjà réussi à balayer un professionnel de StarCraft II, mais avec quelques privilèges.

« Cette fois, AlphaStar a les mêmes contraintes que celles des humains », insiste DeepMind sur son blogue (Nouvelle fenêtre) .

Premièrement, DeepMind a entraîné le logiciel à utiliser chacune des trois races. La vision du jeu d’AlphaStar était également limitée à la portion de carte normalement visible pour un humain. Finalement, DeepMind a limité la fréquence de l’IA à un maximum de 22 actions par tranche de 5 secondes, s’alignant avec les mouvements humains habituels.

Les trois races de StarCraft II, les Zergs, les Protoss et les Terran (de gauche à droite) Photo : Blizzard Entertainment

Ces contraintes ont été approuvées par le joueur professionnel Dario « TLO » Wünsch, qui avait affronté Alpha Star en janvier et a conseillé l’équipe de Deep Mind pour modifier le programme afin qu’il ne dispose pas d’avantages injustes.

Des applications concrètes intéressantes

L’exploit de l’IA AlphaStar peut sembler inutile à première vue, si ce n’est que pour frustrer les meilleurs adversaires de leur titre en or, mais Deep Mind a des applications beaucoup plus concrètes en tête pour son logiciel.

Oriol Vinyals, le chercheur principal du projet, a affirmé que des logiciels comme AlphaStar pourraient potentiellement être utilisés pour améliorer les assistants personnels, les voitures autonomes, les prédictions météorologiques et les modèles climatiques.

Les technologies développées par DeepMind pourraient même aider à la planification militaire, mais l’entreprise a affirmé que ce n’était pas dans ses intentions.

« Comme DeepMind l’a expliqué récemment à un événement des Nations Unies, de telles méthodes seraient hautement dangereuses pour contrôler des armes puisque l’IA pourrait agir de façon imprévisible. Cela va à l’encontre des lois qui régissent les conflits armés » a déclaré à The Guardian Noel Sharkey, professeur émérite en IA et robotique à l’Université de Sheffield.