Interview

Comment analyser les statistiques quotidiennes? Un expert nous explique

Ingénieur dans le traitement des données de masse, notamment dans le domaine biomédical, Guillaume Rozier a ouvert il y a quelques jours le portail Covidtracker, sur lequel il publie des graphiques sur l’évolution de la pandémie en France et dans le monde. Il décrypte pour nous les dynamiques derrière les chiffres bruts.

Comment jugez-vous la nature des chiffres communiqués sur l’évolution de la pandémie en France?

Il y a évidemment une dimension politique de la gestion de la crise, une volonté de ne pas déclencher de panique dans la population, mais cela ne signifie pas qu’on nous ment, puisqu’il faudrait que tous les échelons de la santé publique soient complices pour que les chiffres soient tronqués ou manipulés. Depuis qu’on a intégré les décès dans les Ehpad, les chiffres en France me semble crédibles. Quand Jérôme Salomon, le directeur général de la Santé, communique des chiffres, il met l’accent sur ceux qui sont encourageants, mais les données plutôt négatives sont livrées sans commentaire particulier. J’aimerais en savoir plus sur le contexte, si l’évolution est durable ou pas.

On sait aussi que les profils des gens qui arrivent en réanimation et de ceux qui sont hospitalisés sont différents. Les personnes âgées se présentent à l’hôpital dès les premiers symptômes, alors que les jeunes vont faire traîner en pensant que cela va passer, et sont souvent admis directement en réanimation. Ce sont des données importantes pour comprendre l’évolution de la pandémie. Il n’empêche que les autorités sanitaires françaises communiquent de façon plutôt transparente par rapport à d’autres pays. Ce sont des données hospitalières qui remontent d’abord aux agences régionales de santé, qui publient d’ailleurs leurs chiffres sur leur site, et ensuite à l’agence nationale qui les agrège.

Tous les lundis, les chiffres sont globalement mauvais en France, le nombre de décès est très supérieur à celui des week-ends, comment l’expliquez-vous?

On ne sait pas. L’hypothèse la plus plausible est liée au plus petit nombre de personnes travaillant le week-end dans les hôpitaux. Certains actes de décès administratifs ne seraient donc pas réalisés à temps pour être pris en compte le dimanche. Ils sont donc répercutés seulement le lundi. Dans le même temps, ça expliquerait aussi pourquoi les chiffres sont plutôt ‘bons’ le samedi.

Que disent les données brutes de la manière dont chaque État gère la lutte contre la pandémie?

Prenons, par exemple, les chiffres comparés de la France et de l’Italie. On pourrait penser que la France s’en sort moins bien quand on regarde le nombre de morts par habitant. Cela dit, je pense que le nombre de décès en Italie est peut-être sous-évalué, parce qu’ils effectuent beaucoup moins de tests post-mortem qu’en France. Ces décès sortent donc des statistiques de la mortalité du Covid-19.

Ailleurs, il y a clairement un souci avec la Chine, où les données sont très douteuses. Pareil avec la Russie, dont les chiffres sont étrangement très bas. Les États-Unis se prennent une grosse claque en ce moment, mais je pense qu’on peut l’expliquer par l’aveuglement ou le déni des autorités en mars. Elles n’ont pas mené de campagne massive de tests alors que l’épidémie était déjà présente, sûrement au même moment qu’en Europe.

Quels sont les autres facteurs qui agissent sur les statistiques?

Il y a clairement une dimension culturelle. Dans les pays latins, les gens sont plus tactiles dans leurs relations sociales. En Italie et en Espagne, on a pour tradition de se retrouver en famille le dimanche, ce qui peut expliquer la gravité de la situation. Il y a une solidarité transgénérationnelle, des rituels –les petits-enfants, les enfants et les parents se voient régulièrement– qui peuvent expliquer la propagation du virus par l’importance de la ‘valeur famille’.

À l’opposé, en Allemagne, c’est moins le cas. La pandémie est arrivée par des jeunes qui étaient partis aux sports d’hiver. Ils ont donc plutôt transmis le virus à des personnes de leur âge, plus résistants ou qui n’ont pas développé de symptômes, ce qui pourrait expliquer la mortalité plus faible. C’est un peu contre-intuitif, puisque sa population est en moyenne plus âgée que l’Italie. Et puis, il y a aussi une question de densité de la population, qui explique par exemple les situations contradictoires entre New York et le reste des États-Unis. Elle peut paraître critique à la lecture des chiffres bruts nationaux mais, en affinant, on se rend compte que la pandémie aux États-Unis est localisée pour l’instant à quelques grandes villes.

La majorité du territoire est faiblement peuplé, et donc le contexte est moins favorable à la propagation rapide du virus. C’est peut-être ce qui va les sauver. Sinon, il y a des petits pays dont l’évolution est inquiétante. Par exemple, la Belgique est désormais troisième, derrière l’Italie et l’Espagne, pour le taux de décès par habitants. Ça explose sans que je n’arrive à comprendre pourquoi.

Retrouvez les graphiques et les analyses de Guillaume Rozier sur son site.

Par Joachim Barbier