m Rapport : Estimation du nombre de reproduction de l’épidémie de COVID-19 en France

Préambule

Le contenu de ce rapport n’est en aucun cas officiel et est avant tout à destination pédagogique. De plus, les calculs réalisés ici sont faits avec des hypothèses volontairement simplifiées.

En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus

L’Organisation Mondiale de la Santé (OMS) dispose aussi d’un site très complet https://www.who.int/fr/emergencies/diseases/novel-coronavirus-2019

Contexte

Depuis décembre 2019 l’épidémie de COVID-19 causée par un coronavirus jusqu’alors inconnu (SRAS-Cov-19) se propage. Initialement présente dans la région de Wuhan en Chine, elle a officiellement été déclarée comme pandémique le 11 mars 2020 par l’Organisation Mondiale de la Santé (OMS).

En France, des premiers cas isolés ont été détectés en janvier 2020 auprès de voyageurs revenant de Chine. Depuis le 25 février 2020, l’incidence (nombre de nouveaux cas par jour) est strictement positive et croissante, suggérant une transmission locale du virus. Le 11 mars, 2281 cas avaient été recensés. Le 12 mars, l’État français a annoncé la fermeture des structures scolaires à partir du lundi 16 mars.

Les données d’incidence dans la figure ci-dessus ne sont pas estimées mais proviennent des rapports de l’OMS.

Nombre de reproduction de base

À l’aide de méthodes statistiques, nous avons estimé le nombre de reproduction de base (noté \(R_0\)) de l’épidémie en France, c’est-à-dire le nombre d’infections secondaires engendrées par une personne infectée au cours de toute sa période infectieuse.

Ce nombre est clé en santé publique car il détermine l’ampleur de l’épidémie. Si le \(R_0\) passe sous le seuil de 1, soit du fait des mesures de contrôle, soit parce qu’une proportion suffisante de la population est immunisée, l’épidémie décroît.

Ce nombre d’infections secondaires a tendance à diminuer en cours d’épidémie. D’une part car de moins en moins de personnes sont sensibles (une fois guéries, une mémoire immunitaire se met en place qui protège contre les ré-infections). D’autre part, car des mesures sanitaires (notamment la limitation des contacts) sont implémentées. À une date \(t\) on peut alors mesurer un nombre instantané (ou efficace) que l’on notera ici \(R(t)\).

Méthode

Cette section est plus technique et vise à expliciter les hypothèses de travail réalisées.

Pour estimer ces valeurs, nous avons utilisé le nombre de nouveaux cas rapportés chaque semaine en France par l’OMS (données récupérées sur le site https://ourworldindata.org/coronavirus-source-data), ainsi que les données brutes de 28 paires infecteur/infecté compilées dans un article de Nishiura et alii (2020, Int J Infect Dis). Enfin, nous avons estimé le \(R_0\) à partir de plusieurs dates de début d’épidémie, afin de déterminer dans quelle mesure celui-ci était impacté par les cas importés (majoritaires en début d’épidémie).

Les estimations ont été faites à l’aide du logiciel R et des fonctions est.R0.TD() et est.R0.ML() du package R0.

Les hypothèses sous-jacentes pour le calcul du \(R_0\) sont les suivantes :

  • le temps de signalement des cas est négligé,

  • la stratégie de dépistage en France est supposée constante,

  • la structure spatiale est négligée,

  • les cas importés ne sont pas distingués des cas non-importés,

  • les incidences utilisées sont celles disponibles depuis le 21 janvier 2020 et jusqu’au 16 mars 2020 (date de la mise en place des mesures de confinement) pour \(R_0(t)\) et au 01 avril 2020 pour \(R(t)\).

Résulats

\(R_0\)

Nous avons estimé un \(R_0\) classique en fixant arbitrairement une date de début d’installation de l’épidémie en France (donc le moment à partir duquel les cas importés ont peu d’influence).

Dans ce modèle simpliste, le \(R_0\) est supposé constant au cours du temps (on néglige donc la baisse du nombre de personnes sensibles à mesure que l’épidémie avance ainsi que les politiques de prévention).

Le résultat de la fonction est.R0.ML est le suivant pour des données intégrées entre le 27 février (date du début de la courbe d’incidenc) et le 16 mars (date de début du confinement) :

## [1] "R0 = 2.49  [2.39 ; 2.58]"

Il semblerait donc que l’épidémie se soit propagée très rapidement en France puisqu’une personne infectée en infectait en moyenne plus de 2,5.

Cette estimation de \(R_0\) dépend de la date à laquelle l’épidémie s’est installée en France (c’est-à-dire ne dépendait plus des cas importés) ainsi que des données disponibles à ce jour. Le graphique ci-dessous indique la valeur du \(R_0\) selon cette date d’origine.

En revanche, la date de fin d’intervalle, elle, joue plus. En effet, si au lieu d’arrêter notre jeu de données 16 mars nous l’arrêtons au 9 mars, tout en commençant au 27 février, alors le résultat de la fonction est.R0.ML est le suivant :

## [1] "R0 = 3.81  [3.5 ; 4.13]"

On voit que les valeurs de \(R_0\) dépendent peu de la date d’origine choisie pour le calcul (entre le 29 janvier et le 27 février) mais qu’en revanche elles dépendent de la date de fin d’intervalle. En effet, plus l’intervalle est grand, plus le \(R_0\) est faible. Ceci fait sens car plus l’épidémie avance, plus des mesures sont mises en place pour lutter contre l’épidémie et plus l’immunité se construit. Il semble donc intéressant de calculer les variations du nombre de reproduction.

Nombre de reproduction temporel (ou efficace)

Comme indiqué ci-dessus, le nombre de reproduction de base varie du fait de l’immunité qui se construit dans la population et des mesures de santé publique. Nous avons donc estimé le nombre de reproduction efficace (\(R(t)\)) afin de détecter ces variations temporelles.

Sur le graphique suivant, la zone grisée correspond à l’intervalle de confiance et la courbe noire à la médiane. Attention, ce n’est pas le nombre de cas qui est représenté mais plutôt la rapidité de propagation de l’épidémie. Si l’on passe sous la barre de 1 (matérialisée avec des tirets), l’épidémie est en phase de décroissance.

On peut observer des pics initiaux de \(R(t)\) correspondant à des clusters de transmission initiés par des cas importés et qui ont été contrôlés. Ces pics sont avant tout dus au nombre limité de dates et peuvent être ignorés : avec des incidences hebdomadaires au lieu d’incidences journalières, ces courbes seraient bien plus lisses.

À partir du 28 février, l’épidémie semble s’installer en France (le pic de valeur de \(R(t)\) est non biologique et lié à ce début). Depuis cette date, la valeur du nombre de reproduction de base semble s’être stabilisée sur une valeur supérieure à 2, en cohérence avec notre estimation de \(R_0\).

Situation avec confinement

Depuis le 16 mars 2020, le gouvernement français a mis en place un confinement à l’échelle nationale. Si on se concentre sur une période de temps plus récente, voici à quoi ressemble le graphique (la ligne rouge est le début du confinement et la zone grisée l’intervalle de confiance à 95 %).