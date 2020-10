Depuis la mi-mars, vous avez consulté notre tableau de bord en continu des cas de COVID-19 au Canada et dans le monde des dizaines de millions de fois. Pour maintenir ce service public, un travail minutieux de collecte de données provenant de multiples sources est réalisé. Et pour tenir le fort, trois personnes : Melanie Julien, chef de pupitre, Mathieu Saint-Laurent, développeur, et moi-même, journaliste de données.

Vous nous avez envoyé des milliers de courriels. Parfois pour nous avertir de problèmes (merci!), mais surtout pour nous poser des questions sur nos chiffres. Dans ce texte, je vais soulever le capot de notre tableau de bord et vous expliquer ses nombreux défis.

En somme, il n’y a pas de normes entre les provinces pour rendre publiques les données liées à la COVID-19. Et à l’intérieur même de ces provinces, il n’y a pas de normes non plus entre les régions. Pour avoir une vue d’ensemble des cas, des rétablis, des décès, des hospitalisations, des soins intensifs et des tests, il faut passer au tamis la cacophonie pancanadienne.

Nous utilisons ce diagramme pour structurer notre collecte de données. Pour alimenter notre tableau de bord, nous avons codé des programmes informatiques qui surveillent les sites web des provinces et des territoires 24 h sur 24, 7 jours sur 7. Photo : Radio-Canada / Naël Shiab

À titre d’exemple, prenons une question a priori de base : combien de personnes ont été testées pour la COVID-19 au Canada hier? Et à quoi ressemble la tendance historique?

Pour trouver la réponse à cette question (et offrir les chiffres dans notre tableau), commençons par jeter un coup d’oeil aux statistiques fédérales. L’Agence de santé publique du Canada compile les données provinciales jour après jour, dont le nombre de personnes testées  (Nouvelle fenêtre) .

Mais n’oublions pas de lire les petits caractères : l’Agence récupère le nombre de personnes testées dans certaines provinces et le nombre de tests effectués dans d’autres. Autrement dit, la collecte n’est pas uniforme. Et quand c’est le nombre de tests qui est récupéré, l’Agence utilise une formule mathématique pour estimer le nombre de personnes testées, car une personne peut avoir été testée plusieurs fois. Quelle est cette formule? Je leur ai écrit. Ils ont refusé de me la donner.

Ça commence mal!

De plus, les données fédérales mélangent le nombre de personnes uniques testées au Québec avec des estimations du nombre de personnes testées dans le reste du Canada. Les chiffres compilés pour le Québec correspondent à ceux du graphique 4.1  (Nouvelle fenêtre) sur le site web de l’INSPQ. Comme me l’a confirmé l’Institut, une personne testée à plusieurs reprises au fil des semaines ou des mois ne sera comptabilisée qu’une seule fois dans ces chiffres. Pour le 28 octobre, par exemple, 9968 nouvelles personnes ont été testées selon l’INSPQ, mais 26 620 tests ont été réalisés. Sacrée différence!

C’est d’ailleurs pour ça que nous avons arrêté d’utiliser les données fédérales dans notre tableau de bord. (Merci aux lecteurs qui nous ont fait remarquer le problème.)

Alors où trouver le nombre de tests au pays? Nous devons passer au plan B : collecter les données publiées sur les sites web des provinces et des territoires. Puis faire la somme des chiffres provinciaux pour avoir le total canadien. L’opération devient plus compliquée, car au lieu de nous appuyer sur une seule source, nous devons maintenant en consulter 13.

Un petit tour d’horizon nous montre l'hétérogénéité de ce qui est rendu public. Certaines provinces donnent le nombre de personnes testées. D’autres, le nombre de tests réalisés depuis le début de la pandémie. Certaines n'affichent que les données du jour ou seulement le nombre de tests négatifs.

Finalement, la statistique qui revient le plus souvent (ou que nous pouvons déduire) est le nombre total de tests. Malheureusement pour la Nouvelle-Écosse, le Nouveau-Brunswick, l’Île-du-Prince-Édouard, le Yukon et le Nunavut, c’est l’impasse. J’ai écrit à chacun d’entre eux pour obtenir les précieux chiffres. C’est sans appel : ils rendent public ce qui est sur leur site web, et c’est tout.

Ces provinces et territoires manquants représentent environ 5 % de la population. Avec une note pour prévenir les lecteurs, le compromis est acceptable. Au moins, c’est exact!

Nouvel obstacle sur notre route : le Québec est la seule province à rendre public le nombre total de tests avec deux jours de délai. Pour les autres, nous avons les données de la veille. Cela signifie que le total canadien ne pourra être calculé qu’avec… 48 heures de délai également.

Ici s’arrêtent les enjeux si vous souhaitez récolter ces données à la main, par exemple vers 20 h, une fois que toutes les provinces ont publié leur bilan quotidien. Mais nous avons un tableau de bord! Chaque fois que vous vous connectez à notre page web, peu importe l’heure, vous vous attendez à obtenir les toutes dernières informations disponibles. Et vous avez bien raison.

C’est pourquoi nous avons codé des programmes informatiques (ou algorithmes) pour récupérer ces informations automatiquement. Ainsi, 24 h sur 24, 7 jours sur 7, ces derniers collectent les informations disponibles sur les sites de toutes les provinces et territoires pour publier le tout sur notre page web. Au 21e siècle, le journalisme, c’est aussi parfois de l’automatisation.

Voyez-vous à quel point la quête d’une simple réponse se transforme rapidement en épopée? Si tout le monde s’entendait pour publier les données de façon uniforme, les gouvernements, les journalistes et les citoyens passeraient beaucoup moins de temps à essayer d’obtenir l’information.

Par ailleurs, il existe déjà des portails de données ouvertes pour rendre facilement accessibles des informations au plus grand nombre. Le fédéral  (Nouvelle fenêtre) et l’Ontario  (Nouvelle fenêtre) y déposent quotidiennement leurs statistiques. Le Québec? Malheureusement non  (Nouvelle fenêtre) . Nos voisins ontariens publient même un document avec le détail de chaque cas (Nouvelle fenêtre) confirmé dans leur province. Un bel exemple.

Pour conclure, prenons une dernière question que vous êtes nombreux à nous poser au Québec : quelle est la situation dans ma région? Dans ma ville?

Pour les tests, c’est simple : l’information n’est malheureusement pas rendue publique. Tant et aussi longtemps que les gouvernements ne fourniront pas les chiffres par régions, nous ne pouvons rien y faire.

En ce qui concerne les cas confirmés, les cas actifs et les décès? L’INSPQ donne de l’information au niveau de votre région sociosanitaire (légèrement différente de votre région administrative, mais sensiblement identique). Nous récupérons automatiquement le tout et le publions sur notre tableau de bord, dès que c’est disponible.

Dans votre municipalité ou quartier? C’est différent. J’ai demandé au ministère de la Santé et à l’INSPQ de me donner l’information. Réponse négative. Encore une fois, il faut passer au plan B : consulter les sites web des 18 régions sociosanitaires du Québec. Une seule source aurait été si simple!

Alors on recommence. Tour d’horizon des 18 sites web : on retrouve sur certains d’entre eux les données par municipalités régionales de comté (MRC) et sur d’autres les statistiques par municipalités. À Montréal, les chiffres sont ventilés par arrondissements, alors que dans la Capitale-Nationale, c’est plutôt par territoires de CLSC. Certaines directions de santé publique donnent le nombre de cas depuis le début, d’autres depuis un certain nombre de semaines. La majorité ne donne pas le détail du nombre de morts. Parfois il y a les cas actifs, parfois non. Idem pour les dernières éclosions. Encore une fois, pas d’uniformité.

Bref, on retrouve des statistiques sur la COVID-19 éparpillées sur des pages web, sur des cartes, dans des documents PDF et parfois même dans des images partagées sur… Facebook.

C’est pourquoi nous trions cet amas hétérogène de chiffres provenant de tous les côtés afin de vous les présenter de façon claire. Car si vous ne savez pas ce qui se passe chez vous, comment tiendrez-vous vos gouvernements pour responsables de leurs bons coups comme de leurs mauvais?

Aussi, n’oubliez pas que les provinces et les pays ne comptabilisent pas nécessairement les cas, les rétablis et les morts dus à la COVID-19 de la même façon. Mais c’est un tout autre sujet, que ma collègue Mélanie Méloche-Holubowski explore dans cet autre texte.

PS : Pour ceux qui se demandent à quand le taux de positivité dans le tableau de bord, nous attendons toujours des nouvelles de l’INSPQ à ce sujet pour recevoir une formule de calcul la plus rigoureuse possible.