L'envers de l'info : ce que le journalisme de données révèle sur les billets des Blue Jays

Des piétons devant le Centre Rogers de Toronto
Photo : Radio-Canada / Francis Ferland
Python : pour le commun des mortels, c'est un serpent, mais pour les journalistes de données, c'est un langage de programmation informatique qui permet de faire toute sorte de constats intéressants, comme sur l'ampleur du marché de la revente de billets pour le match d'ouverture à domicile des Blue Jays.
Une chronique d’Eve Caron
C’est notamment avec des « scripts » de type Python qu’une équipe de journalistes de CBC a réussi à établir que près de la moitié des billets pour le match des Blue Jays du 29 mars dernier s'étaient retrouvés sur un site de revente en ligne.
À quoi ça ressemble?
Pour les nuls de l’informatique (et non de l’information!) comme moi, ça peut avoir l’air d’un script sur un écran d’ordinateur qui ne fonctionne pas. Le fond de l’écran est noir, des lettres, des chiffres et d'autres caractères comme des parenthèses se suivent.
En voici un exemple :
Grâce à des scripts de ce type, les journalistes ont communiqué avec les serveurs des plateformes de vente et de revente de billets pendant 52 jours pour obtenir de l’information sur les 45 811 sièges disponibles pour le match.
Les scripts demandaient des informations précises au serveur. « Pour tel siège, quelle est la valeur réelle du billet? Est-ce que tu es capable de regarder la section et l’allée [et] le numéro de siège puis de le joindre avec le prix », explique Valérie Ouellet, une journaliste spécialisée en données, qui a participé à l’enquête.
« On était quatre humains pour ce projet-là, mais on avait une armée de… disons de petits assistants qui étaient capables d’aller sur les sites puis de vérifier les prix. »
L’information était ensuite colligée dans un autre programme informatique, puis analysée par les journalistes.
Résultat : 45 % des billets pour le match des Blue Jays se sont retrouvés sur un site de revente, à un prix, en moyenne, deux fois plus élevé.
Ces données précises sur l’ampleur du marché de la revente de billets ont même surpris les experts, dont certains croyaient que ce marché touchait à peine 10 % des billets.
« C’est une chose de découvrir ça, puis de penser que c’est 10 %. C’en est une autre de se rendre compte que c’est la moitié du marché pour un match. »
Journalisme 101
Cela dit, ce n’est pas parce qu’un ordinateur est impliqué que les pratiques journalistiques de base sont mises de côté.
Par exemple, dans le dossier des Blue Jays, Valérie Ouellet et les membres de son équipe ont eux-mêmes confirmé les conclusions des données produites par leur démarche informatique en s'intéressant à un plus petit échantillon sans l'aide des scripts. C’est essentiellement comme aller chercher une deuxième source.
« L'expression, c'est deux mots : « journalisme » et « de données » donc il ne faut jamais oublier son chapeau de journaliste et vérifier ce que les données nous disent. »
Par ailleurs, plusieurs organisations gouvernementales, dont la Ville de Toronto, ont publié au cours des dernières années des données « ouvertes » sur différents sujets d’intérêt public. Cependant, M. Roy souligne que ce type de données n'est pas toujours de bonne qualité.
L’automne dernier, La Presse a tenté de faire un reportage sur l’octroi des contrats de la Ville de Montréal. Les journalistes ont constaté que les données étaient truffées d’erreurs, notamment avec des compagnies à numéro « 123456789 » ou « 1111111111 », et en ont fait un reportage (Nouvelle fenêtre).
« On se rend bien compte de la valeur des données aussi. Donc, les organisations gouvernementales ne diffusent pas tout ce qu'elles pourraient diffuser comme données. »
Ce que les chiffres racontent
Enfin, les journalistes de données sont de plus en plus conscients de l’importance de donner un visage humain aux chiffres. Un article qui commence par : « Une analyse des données révèle que... » n’est pas un moyen de susciter l'intérêt du lecteur, explique Roberto Rocha, journaliste de données pour CBC à Montréal.
Ainsi, plus tôt ce mois-ci, il a dévoilé son exclusivité sur le remorquage à Montréal de façon non traditionnelle. Au lieu de garder le secret jusqu’à ce que l’article soit publié, il a mis en ligne une vidéo (Nouvelle fenêtre) dans laquelle il disait clairement qu’au moins 2000 personnes auraient vu leur véhicule se faire remorquer alors que celui-ci était stationné légalement à Montréal.
Or, le but de la vidéo était de trouver quelqu’un qui avait vécu cette situation. Ainsi, l’article final (Nouvelle fenêtre) qui commence par le cas particulier d’un Montréalais a été publié trois jours plus tard.
« J’aurais pu écrire un article qui commence par : “Une analyse des données montre que 3000 voitures ont été remorquées…”. C’est plate, ça. Je ne veux pas lire ça moi-même. »
Roberto Rocha et Valérie Ouellet sont ainsi aux premières loges d’une pratique en constante évolution et sur laquelle plusieurs organisations, dont CBC/Radio-Canada, misent pour raconter des histoires d’intérêt public.
À lire aussi :
Vous avez des questions liées à notre travail? Des idées de chroniques? Écrivez-moi à l’adresse suivante : eve.caron@radio-canada.ca