Chiffres du Coronavirus : cherchez l'erreur

Courbe de l'occupation des soins intensifs sur laquelle il manque le pic du 9 novembre dernier (1474 lits occupés en ICU).
5 images
Courbe de l'occupation des soins intensifs sur laquelle il manque le pic du 9 novembre dernier (1474 lits occupés en ICU). - © RTBF

Ils font partie de notre quotidien depuis le début de la pandémie. Chaque jour, les chiffres du Covid-19 s’invitent dans notre info sous forme de graphes, de tableaux et d’analyses. Nombre de cas positifs détectés, de personnes hospitalisées, en soins intensifs, nombre de décès… Des données dans lesquelles, parfois, un public attentif détecte une erreur.

Ce fut le cas ce mois-ci. "Pour le deuxième soir consécutif votre graphique montrant le nombre de personnes aux soins intensifs n’est pas correct", nous indique ainsi Karine D., une téléspectatrice. "Il ne fait pas apparaître correctement le récent pic d’occupation du 9 novembre (1474 personnes en unités de soins intensifs ce jour-là), mais montre un pic beaucoup trop bas. Le pic de la seconde vague est supérieur au pic de la première, contrairement à ce que suggère votre schéma".


►►► Cet article n’est pas un article d’info comme les autres : tout sur la démarche Inside de la rédaction ici.


Et c’est vrai, les graphes qui apparaissent dans les journaux télévisés du 4 et 5 décembre derniers comportent une erreur. Le pic concernant l’occupation des soins intensifs de la deuxième vague n’apparaît pas correctement.

Un autre message nous accuse même de manipulation.

"Quand la RTBF arrêtera-t-elle de mentir sur le graphique des hospitalisations en soins intensifs. Vous transformez le graphique officiel pour faire paniquer les gens. Vous cachez le pic de 1500 pour cacher que les hospitalisations sont en forte baisse. C’est de la désinformation"

La RTBF a-t-elle délibérément menti en modifiant volontairement son graphe pour tromper le public ? Non. "Il s’agit simplement d’une erreur d’actualisation de la courbe sur le graphe", explique Axel Bonnert, réalisateur au Journal télévisé. Il aurait en fait fallu que le dessin de la courbe monte plus haut en indiquant la bonne hauteur du pic (à 1474 précisément, comme signalé par Karine D.), suivi plus bas du chiffre (correct) du jour, 789.

Les données, nous ne les inventons pas. Les chiffres viennent directement de Sciensano, l’Institut de Santé publique. La RTBF se charge ensuite de les mettre en graphique ou en tableau pour les diffuser avec son propre canevas dans nos médias. "Nous disposons d’une boîte de modèles graphiques dans laquelle on pioche pour mettre en exergue les chiffres quotidiens", poursuit Axel. "D’un jour à l’autre, les demandes graphiques sont différentes selon le chiffre que l’on désire mettre en avant". Certains jours, ce sont des graphes avec le nombre de cas détectés, d’autres jours ce sont des tableaux avec des chiffres qui reprennent les décès par exemple.

Concernant l’erreur d’actualisation du 4 et du 5 décembre derniers, elle s’explique par le fait que "les dernières fois où les chiffres des soins intensifs ont été mis en avant sur un graphique dataient d’avant le second pic de novembre", poursuit Axel. Début décembre, une demande a été faite pour ressortir ce graphique, avec le chiffre du jour. "Malheureusement, si le chiffre a été actualisé, le graphique non. La base est restée celle de début novembre. Ce qui explique l’absence d’un deuxième pic sur la courbe. Il s’agit d’une erreur d’inattention à travers laquelle tout le monde est passé. Il existe une vérification avant de mettre sur antenne mais celle-ci s’est portée sur le chiffre en lui-même et non sur la courbe du graphe". Le problème d’actualisation a bien évidemment été rectifié depuis.

Peut-on faire confiance aveuglément aux graphes et aux chiffres ?

"Il ne faut jamais perdre de vue que ces chiffres et ces graphes doivent toujours s’accompagner d’une mise en contexte", explique Simon Dellicour, épidémiologiste à l’ULB. "Chaque métrique [nombre de cas, décès, hospitalisations. Ndlr] peut être représentée de plusieurs manières et elles ne sont pas toutes comparables dans l’espace et dans le temps. Si on prend le nombre de cas détectés au jour J et qu’on le compare avec les chiffres de la première vague, il ne faut pas oublier que l’effort ainsi que la stratégie de dépistage ont bien évolué depuis le début de la pandémie".

Il en va de même lorsque l’on compare le nombre de décès en Belgique avec les autres pays. "Notre manière de comptabiliser les décès attribués à la COVID-19 n’est pas nécessairement la même que celle appliquée dans les autres pays. Il faut donc rester très prudent avec ce type de comparaison".

Le travail d’interprétation des chiffres est délicat.

La mise en contexte, une notion sur laquelle insiste aussi Adeline Louvigny. Elle est journaliste pour le site Web de la RTBF et elle s’est spécialisée dans l’analyse des données depuis le début de la pandémie. Chaque jour, le site Web propose d’ailleurs une mise à jour des graphes et des données. "Ces graphes sont repris dans un article qui explique le contexte", commente Adeline. "On ne met pas uniquement les chiffres bruts. On peut expliquer si on voit émerger une tendance,… Ces données sont mises à jour régulièrement pour que les gens puissent avoir une vue claire sur l’évolution de l’épidémie."

Est-ce pour autant qu’il n’y a jamais d’erreurs ? "Non", explique Xavier Lambert, journaliste lui aussi pour le site info de la RTBF. "Le travail d’interprétation des chiffres est délicat. Il peut y avoir des fautes d’analyse. C’est facile de se tromper."

Xavier se souvient notamment d’un cas où toute la presse a mal interprété les chiffres relatifs aux décès à un moment où ceux-ci étaient particulièrement bas. Alors que l’augmentation des décès était généralement exprimée en pourcentage, elle a soudainement été exprimée en valeur absolue dans la base de données. "La presse a donc par exemple annoncé un jour une augmentation de 7% alors qu’il y avait 7 décès supplémentaires". L’erreur n’a pas duré et a été rectifiée mais cela illustre la difficulté de travailler avec des chiffres et des méthodologies qui évoluent constamment.

Eviter les pièges

"Il faut aussi veiller à faire attention aux délais potentiels au niveau du rapport de certains chiffres. On sait par exemple qu’il y a un effet "week-end", c’est-à-dire que les chiffres collectés durant le week-end ne sont pas rapportés aussi efficacement et/ou rapidement que durant un jour de semaine", explique encore Xavier.

Simon Dellicour insiste lui aussi sur ces fameux "effets week-end" qui peuvent parfois donner la fausse impression d’une baisse éphémère de certaines courbes par exemple. "Il faut lisser les valeurs. Une tendance doit se confirmer sur une certaine période avant de dire qu’elle a vraiment lieu", précise-t-il.

Dans un article Inside précédent -"Pourquoi la rédaction vous donne tel chiffre et pas (toujours) tel autre ?"- Brecht Devleesschauwer, épidémiologiste à Sciensano expliquait que chaque chiffre avait ses limites : "C’est normal que les gens s’attendent à des données parfaites, sans incertitudes, surestimation ou sous-estimation, etc. Mais la réalité c’est que les données ne seront en fait jamais parfaites". Toujours dans cet article, le biostatisticien Niel Hens expliquait : "Toutes les données sont sujettes à des biais. Il faut les mettre toutes ensemble pour avoir le tableau complet de ce qui se passe. Il faut tout combiner".

En télé, des graphes épurés pour plus de clarté

En télévision, il faut faire des choix. Les graphes sont diffusés quelques secondes à l’écran et sont commentés dans le sujet ou en plateau par le/la journaliste. Il faut donc éviter d’y mettre trop d’informations sans quoi le public s’y perd. "Dès le début de l’épidémie, on s’est posé beaucoup de questions à la rédaction quant à la manière de montrer l’évolution des chiffres sans que cela soit trop compliqué", explique Axel Bonnert.

Il faut que ce soit lisible en un coup d’œil.

"Si vous regardez les graphes, on y retrouve peu d’informations. Il y a la thématique (infections, hospitalisations ou décès par exemple)", poursuit Axel. "Ainsi que la date clé avec le pic de la première vague et puis le chiffre du jour que l’on veut mettre en avant. On a voulu être le plus clair possible. Il faut que ce soit lisible et compréhensible en coup d’œil". Cela ne veut pas dire que la RTBF omet volontairement ou décide de cacher certains éléments au public. C’est un choix éditorial de mettre tel ou tel chiffre en avant. Le reste peut alors être abordé dans un sujet du journal ou avec un expert en plateau.

"La méthode a d’ailleurs évolué depuis le début de l’épidémie", explique Axel. "Au début, on montrait les quelques chiffres-clés quotidiens l’un en dessous de l’autre avec parfois la différence par rapport à la veille. A partir du mois de juin, on a voulu montrer l’évolution. Aller au-delà des chiffres. C’est là que sont apparus les graphiques et les courbes. C’est plus visuel. Il a fallu adapter les données de Sciensano à nos impératifs graphiques, à notre canevas"Par après, nous avons été un pas plus loin, et on a montré l’évolution par rapport aux sept derniers jours comme Sciensano avait pris l’habitude de le faire.

Un véritable apprentissage.

Adeline Louvigny insiste aussi sur la difficulté pour les journalistes, au début de l’épidémie, de devoir jongler avec ces données. "Il ne faut pas oublier qu’on a découvert cela en même temps que tout le monde. Il y a eu un véritable travail d’apprentissage pour les journalistes. On a dû appréhender cette information que l’on n’avait pas l’habitude de traiter. Dès le début, nous avons dû faire appel à une spécialiste du traitement des données, une data scientist, pour intégrer tous ces chiffres à nos graphes, pour que ces données soient mises sous un certain format. C’est un véritable boulot de codage et de traitement de données", explique Adeline. "On parle bien du traitement des données et non de leur modification. A aucun moment les chiffres ne subissent une modification de notre part. On les met juste en page sous un certain format graphique ou dans des tableaux pour faciliter leur lisibilité".

Cela permet aussi au site Web de proposer des données triées selon certains critères. "Au début de la pandémie par exemple, le site de Sciensano ne proposait pas l’évolution du Coronavirus par province", se souvient Adeline. "La data scientist nous a permis de le faire. Et puis, cela nous a aussi permis d’automatiser le système et que les graphes se mettent à jour d’eux-mêmes à partir des données officielles".

Même si des erreurs se sont parfois glissées dans un graphique ou un visuel, la rédaction se base toujours sur les chiffres officiels pour expliquer l’évolution de l’épidémie en Belgique. Il est évident que les chiffres à eux seuls ne se suffisent pas. Même si les journalistes ont dû apprendre à maîtriser ces données, leur interprétation et leur explication par un.e expert.e restent primordiales. Voilà pourquoi des noms tels que Marius Gilbert, Yves Van Lathem, Emmanuel André, … nous sont devenus familiers. Depuis le début de l’épidémie vous les voyez/entendez/lisez régulièrement. Elles et ils apportent leur éclairage sur une matière difficile à traiter et à appréhender.


►►► Cet article n’est pas un article d’info comme les autres… Sur la page INSIDE de la rédaction, les journalistes de l’info quotidienne prennent la plume – et un peu de recul – pour dévoiler les coulisses du métier, répondre à vos questions et réfléchir, avec vous, à leurs pratiques. Plus d’information : là. Et pour vos questions sur notre traitement de l’info : c’est ici.


 

Newsletter info

Recevez chaque matin l’essentiel de l'actualité.

OK