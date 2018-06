Dota 2 est l’un des jeux vidéo compétitifs les plus populaires au monde. Au cours d’une partie, deux équipes de cinq joueurs s’affrontent en temps réel avec l'objectif de détruire la base adverse.

Pour ce faire, chaque joueur contrôle l’un des 115 personnages uniques du jeu et utilise ses habiletés pour forcer ses ennemis à se retrancher de plus en plus loin dans l’arène.

Les meilleurs joueurs au monde parviennent à élaborer des stratégies complexes qui peuvent s’échelonner sur plusieurs dizaines de minutes pour tendre des pièges à leurs adversaires ou parvenir à s’emparer d’une zone clé de la carte.

De nouveaux défis

Ce type d’environnement présente des défis très difficiles à surmonter pour une intelligence artificielle. Premièrement, le jeu se déroule en temps réel, contrairement aux échecs ou au jeu de go, qui progressent tour par tour. Pour l’emporter, le robot OpenAI Five doit constamment s’adapter aux actions de ses adversaires.

Deuxièmement, Dota 2 est un jeu d’équipe qui demande beaucoup de coordination entre ses joueurs. Or, l’algorithme d’OpenAI est constitué de cinq réseaux de neurones artificiels indépendants qui ne communiquent pas entre eux.

Des joueurs de l'équipe paiN Gaming durant les quarts de finales du tournoi Birmingham Major de Dota 2. Photo : Reuters/Ed Sykes

Enfin, le jeu est conçu de telle façon qu’il est impossible de voir les adversaires lorsqu’ils ne se trouvent pas à proximité de ses propres personnages. L’algorithme conçu par OpenAI doit par conséquent démontrer beaucoup d’intuition pour arriver à prévoir la position et les actions de ses ennemis, et ainsi éviter de tomber dans un piège.

180 années d’entraînement… par jour

Pour obtenir une intelligence artificielle d’un niveau comparable à celui des champions du monde, les chercheurs ont utilisé l’apprentissage par renforcement. Ce type d’apprentissage automatique récompense l’algorithme lorsqu’il adopte les comportements recherchés.

Grâce à un système informatique extrêmement puissant, OpenAI Five est capable de simuler l’équivalent de 180 années de parties de Dota 2 chaque jour et d’apprendre de ses erreurs. Les chercheurs ont observé une progression constante de la qualité de ses stratégies, si bien qu’il a fini par adopter des tactiques observées sur le circuit professionnel.

Le championnat du monde de Dota 2 est l'un des plus importants événements de sports électroniques au monde. Photo : Reuters/Jason Redmond

Après s’être entraîné contre lui-même des millions de fois, le robot a affronté des équipes humaines de différents niveaux. Si ses premiers matchs se sont soldés par des défaites, il a rapidement progressé jusqu’à être capable de battre des équipes semi-professionnelles parmi les meilleures au monde.

Direction : le championnat du monde

Le 28 juillet prochain, OpenAI organisera un match amical contre une équipe professionnelle pour mesurer la progression de son algorithme. Il s’agira du dernier test d’OpenAI Five avant le championnat du monde de Dota 2, The International 2018, qui aura lieu à Vancouver du 20 au 25 août.

Ce tournoi est parmi les plus importants du genre dans toute l’industrie du jeu vidéo. Il offre des bourses en argent totalisant près de 40 millions de dollars américains aux meilleurs joueurs du championnat.

Une compétition de sport électronique de « Dota 2 » a rassemblé des milliers de personnes le 27 mai 2018 à Birmingham, en Angleterre. Photo : Reuters/Ed Sykes

L’an dernier, un autre robot d’OpenAI avait battu un joueur professionnel dans un match de Dota 2 à un contre un. Depuis cette partie historique, de nombreux joueurs professionnels ont commencé à se servir de l’algorithme d’OpenAI pour s’entraîner.

Selon William Lee, alias Blitz, un ex-joueur professionnel de Dota 2, le comportement du robot a grandement contribué à modifier les stratégies sur le circuit professionnel. Celles-ci sont désormais plus axées sur la rapidité et l’agressivité.

Les recherches d’OpenAI s’inscrivent dans la même lignée que celles menées par Google avec AlphaGo, une intelligence artificielle qui a battu le champion du monde du jeu de go en 2016.

Les chercheurs estiment que ce type d’algorithme pourrait un jour être utilisé pour gérer les ressources du système de santé ou les problèmes du réseau de transport des grandes villes, rapporte le Washington Post.