•  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Les « robots journalistes » de l’AP écrivent sur le baseball mineur

Baseball

Baseball

Photo : ici.radio-canada.ca

Maxime Johnson
Prenez note que cet article publié en 2016 pourrait contenir des informations qui ne sont plus à jour.

Après les résultats financiers et le basketball universitaire, les « robots journalistes » de l'Associated Press (AP) s'intéressent maintenant au baseball mineur. Si les articles écrits par des logiciels sont encore loin d'être du calibre d'un texte rédigé par un véritable journaliste, l'utilisation de cette technologie par l'agence de presse devrait lui permettre de couvrir beaucoup plus de parties qu'à l'heure actuelle.

L'Associated Press utilise depuis juillet 2014 le service Wordsmith de la compagnie Automated Insights pour rédiger automatiquement des articles dans certains domaines précis, comme la publication de résultats financiers.

Le service n'utilise pas d'apprentissage automatique ou d'apprentissage profond, mais doit plutôt être programmé par des spécialistes de l'automatisation et des journalistes. Ceux-ci doivent notamment considérer quelles informations seront les plus pertinentes dans toutes les situations possibles, afin de permettre au logiciel de rédiger un article en intégrant les éléments d'informations les plus importants en premier, le tout à partir de données ou de statistiques.

Une équipe de journalistes doit ensuite corriger les articles produits par Wordsmith afin de peaufiner le système, un processus qui a pris une année complète dans le cas du baseball mineur. Selon le directeur des produits du sport de l'AP Barry Bedlan, le manque de temps des journalistes sportifs de l'AP est toutefois responsable de ce délai, qui aurait pu être raccourci.

Maintenant que le service est en place, celui-ci permet à AP de proposer à ses clients une couverture qui n'existait pas auparavant.

Depuis la semaine dernière, l'AP publie des articles décrivant les résultats de 142 équipes de baseball dans 13 ligues différentes. Les articles sont généralement prêts dans les minutes suivant la fin de la partie. Les journalistes de l'AP avaient couvert des parties de baseball mineur en 2006, mais une fraction seulement des équipes étaient suivies.

Notons que l'AP n'est pas la seule à utiliser un service du genre. ProPublica, Forbes, The New York Times, l'Oregon Public Broadcasting et Yahoo utilisent également des algorithmes similaires. Ceux-ci ne servent pas forcément à publier des articles directement, mais peuvent aider les journalistes dans leur rédaction.

Est-ce réussi?

Les textes publiés par AP sont courts et simples à comprendre, mais manquent cruellement de style. Chaque paragraphe est souvent composé d'une seule phrase et ils ne se suivent pas vraiment. La qualité de l'information diffusée est toutefois étonnante pour de l'information obtenue à partir de statistiques, et certains jeux semblent être décrits par des journalistes qui étaient sur place.

Un lecteur qui ne connaîtrait pas l'existence de Wordsmith pourrait croire que l'article a été écrit par un véritable journaliste, dépourvu de style et clairement blasé (du moins jusqu'à la fin du texte, où il est mentionné que l'histoire a été générée par Automated Insights, en utilisant des données en coopération avec MLB Advanced Media et Minor League Baseball).

Pour lire un exemple d'article de l'AP écrit automatiquement, suivez le lien au bas de ce billet.

Quels seront les prochains domaines?

Pour pouvoir être utilisé par AP, Wordsmith nécessite notamment un domaine où le type d'écriture se prête bien à l'automatisation. Des formules doivent revenir souvent, des données ou statistiques très précises doivent pouvoir être utilisées, et la quantité d'événements à couvrir doit être suffisante pour justifier l'investissement.

Selon ce qu'a affirmé Barry Bedlan en entrevue avec le blogue Techcrunch, plusieurs autres sports pourraient être à considérer pour l'agence, à condition que les données accessibles soient bonnes et qu'elles soient publiées rapidement.

« Il y a tellement de possibilités, mais si une organisation sportive ne peut approuver ses données à 100 % avant des heures ou des jours, ça ne peut fonctionner avec nous, puisque l'intérêt journalistique pour les journaux, les diffuseurs ou les sites web est perdu. »

Vos commentaires

Veuillez noter que Radio-Canada ne cautionne pas les opinions exprimées. Vos commentaires seront modérés, et publiés s’ils respectent la nétiquette. Bonne discussion !