Cette notes, comme l’ensemble de nos travaux, est à visée académique, fruit d’un travail de recherche fondamentale indépendant des autorités compétentes en matière de santé. En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus.
Une des propriétés des épidémies de maladies infectieuses est la croissance exponentielle. En effet, si une personne en infecte deux par semaine, la semaine suivante ces deux personnes en auront infecté 4, qui en infecteront 8 la semaine suivant. Un fait qui illustre le coté contre-intuitif de cette croissance est que si on part d’une seule personne infectée et que l’épidémie double en taille toutes les semaines, alors au cours d’une semaine ont lieu autant d’infections que depuis le début de l’épidémie, même si celle-ci a commencé des mois avant.
Le nombre moyen de personnes infectées par quelqu’un au cours de sa période infectieuse est appelé nombre de reproduction. Au tout début de l’épidémie, on parle de nombre de reproduction de base (noté \(\mathcal{R}_0\)). Ce nombre tend à diminuer en cours d’épidémie, du fait des interventions de contrôle et de l’immunisation progressive de la population (on note le nombre de reproduction temporel à une date \(t\) par \(\mathcal{R}_t\)).
Le nombre de reproduction est pratique en santé publique car il illustre directement l’ampleur de l’épidémie. De plus, le fait qu’il porte sur une personne infectée (en moyenne) aide à diffuser les politiques de prévention au niveau individuel. Cependant, ce nombre a deux limites :
Il nécessite pour être calculé de connaître le temps de génération, c’est-à-dire la distribution du nombre de jours entre le début d’une infection et le début de la suivante ; nombre à ce jour inconnu en France.
Le nombre de reproduction est sans dimension. Et si une personne infectée en infecte deux en moyenne au cours de son infection, selon que ces deux infections se produisent en 3 jours ou en 3 semaines modifie complètement la réponse à l’épidémie.
Une des manière de se représenter la vitesse à laquelle l’épidémie se propage est de calculer le temps de doublement de l’épidémie. Ce temps, comme on l’explique dans les Méthodes, provient directement du taux de croissance exponentielle, est d’ailleurs utilisé pour le calcul du nombre de reproduction de base (pour plus de détails, voir la description de notre application Rt2).
Le temps de doublement se calcule sur des données d’incidence (nombre de nouveaux cas par unité de temps). En termes de visualisation, si on représente le logarithme du nombre de cas au cours du temps, une croissance exponentielle correspondra à une droite. Comme décrit dans nos rapport précédents, chaque type de données d’incidence a ses avantages et ses inconvénients, que l’on peut résumer ainsi :
dépistage (tests PCR) : suivi au plus près de l’épidémie mais variation potentiellement forte du type de population échantillonnée et de l’intensité de dépistage,
hospitalisations : délai de plus d’une semaine avec l’état actuel de l’épidémie mais population échantillonnée stable avec une bonne exhaustivité,
admissions en réanimation : très proche des hospitalisations avec toutefois moins de cas (donc moins de signal) mais des symptômes plus sévères (meilleur échantillonnage de l’épidémie),
décès : suivi plus différé de l’épidémie avec, de plus, un temps entre l’infection et le décès compliqué à inférer.
Dans cette note, nous avons choisi d’utiliser les données d’hospitalisation. À noter que des travaux d’une équipe anglaise suivent ces chiffres au niveau international sur les données de dépistage.
Le temps de doublement de l’épidémie en France calculé sur les 7 derniers jours avec une moyenne glissante de 7 jours au 08 nov. 2020
est de 31.3
jours (avec 95 % des valeurs comprises entre 23.2
et 47.7
jours).
Comme indiqué ci-dessus, en représentant le nombre de nouvelles hospitalisations selon une échelle logarithmique on peut visualiser les phases de croissance ou de décroissance exponentielles. Sur la Figure ci-dessous, les lignes de couleur indiquent ces phases et les chiffres les intervalles de confiance à 95 % pour les temps de doublement correspondants.
Le tableau suivant répertorie l’ensemble des valeurs jusqu’au 25 mar. 2020
(date depuis laquelle les hospitalisations pour COVID-19 sont recensées).
Le temps de doublement peut être aussi calculé au niveau régional. Les valeurs calculées sur les 7 derniers jours à partir du 08 nov. 2020
avec une moyenne glissante de 7 jours sont dans le tableau ci-dessous.
Région | Hospitalisations en 7 jours | Temps de doublement médian | q025 | q975 |
---|---|---|---|---|
Bourgogne-Franche-Comté | 1034 | 13.6 | 11.8 | 16.1 |
Grand Est | 1253 | 21 | 14.7 | 36.9 |
Auvergne-Rhône-Alpes | 4228 | 21.3 | 16.6 | 30 |
Pays de la Loire | 600 | 23.2 | 18.6 | 31 |
Hauts-de-France | 1863 | 29.2 | 22 | 43.7 |
Le même calcul peut se faire au niveau départemental pour les données disponibles au 08 nov. 2020
. Un certain nombre de départements sont absents car le faible nombre de cas ou leur trop forte variation empêche le calcul du temps de doublement.
De plus, une croissance rapide (donc un temps de doublement court) ne signifie pas une saturation des capacité de réanimation et il faut aussi prendre en compte le nombre de cas. Ces variations peuvent être visualisées sur notre application Rt2.
Comme notre équipe l’a diffusé le 10 septembre avec un modèle plus fin, on peut détecter depuis le début septembre une croissance exponentielle de l’épidémie. On voit que les temps de doublement associés étaient de l’ordre de 2 à 3 semaines début septembre.
Ces analyses montrent aussi un net ralentissement de l’épidémie fin septembre. Les origines de celui-ci sont à rechercher vers le début ou la mi-septembre. En effet, pour les infections sévères, la durée entre le début de l’infection et l’hospitalisation est de 10 à 18 jours. De plus, on peut envisager que certains événements aient un effet décalé.
Parmi les hypothèses expliquant le ralentissement observé dans les données fin septembre on peut lister :
la rentrée, qui aurait brassé les chaînes de transmission de l’été,
la température, avec des pics de chaleur en septembre qui auraient minimisé les transmissions dans des lieux clos,
les premières mesures plus strictes prises à la mi-septembre, notamment en Gironde et dans les Bouches-du-Rhône.
Depuis la semaine du 5 oct. 2020
, l’épidémie est de nouveau en croissance très rapide et double en taille en moins de deux semaines. Les semaines du 12 et du 19 octobre ont vu une accélération avec un temps de doublement de l’ordre de 10 jours. S’il existe une hétérogénéité au niveau régional, l’épidémie se propageant plus vite dans le Grand Est qu’en Occitanie par exemple, l’immense majorité des régions est touchée.
Les dernières mesures les plus strictes (couvre-feu dans plusieurs département) ont été mises en place à compter du samedi 17 oct
. Par définition, leur effet ne peut pas être visible dans les données d’hospitalisation avant plus d’une dizaine de jours. Sachant que la semaine du 12 oct
a compté plus de 1000
hospitalisations et que le temps de doublement de l’épidémie était inférieur à 10 jours, on peut craindre plus de 2000
hospitalisations la semaine du 26 oct
. Pour la suite et le mois de novembre, tout dépendra de l’effet des mesures de couvre-feu sur le temps de doublement.
Comme nous l’avons expliqué en détail dans notre Rapport 9 et rappelé plus récemment sur Twitter, plus des mesures sont mises en place rapidement, plus elles sont efficaces. À l’inverse, plus le contrôle est tardif et plus il doit être intense. Au final, la durée des périodes de contrôle intense de type confinement (ou même leur besoin) ne dépend que du contrôle en période de relâchement.
Si le taux de croissance exponentiel \(r\) est connu, le temps de doublement \(t_D\) est obtenu simplement par la formule \[ t_D = \frac{\ln(2)}{r}. \]
Le calcul du taux de croissance a été obtenu à partir des données d’incidence d’hospitalisations, le nombre d’hospitalisations à la date \(t\) étant noté \(H(t)\). Ces dernières ont d’abord été modifiées en \(H^*(t)\) de telle sorte que la valeur du nombre d’hospitalisations à la date \(t\) correspond à la moyenne des hospitalisations entre la date \(t-7\) et \(t\) (aussi appelé « fenêtre glissante » d’une semaine). Mathématiquement, on a donc \[ H^*(t) = \frac{\sum_{i=0}^6 H(t-i)}{7} \] Cette transformation permet de lisser les variations quotidiennes, notamment les « effets week-ends ».
Nous avons ensuite effectué un régression linéaire par tranches de 7 jours entre le logarithme du nombre de cas, \(\ln\left(H^*(t)\right)\), et le temps, \(t\). Les figures représentant la distribution des résidus peuvent être visualisées ci-dessous.
L’équipe de modélisation de l’équipe ETE est composée de Samuel Alizon, Thomas Bénéteau, Marc Choisy, Gonché Danesh, Ramsès Djidjou-Demasse, Baptiste Elie, Yannis Michalakis, Bastien Reyné, Quentin Richard, Christian Selinger, Mircea T. Sofonea.
Merci aux personnels des ARS et de Santé Publique France pour la collection et le partage en quotidien des données sur data.gouv.fr.
Contribution à ce travail :
rédaction du rapport : SA
contacts : covid-ete@ouvaton.org
relecture : BE et Florence Débarre
Ce travail est soutenu la région Occitanie dans le cadre de son appel « Urgence Recherche Covid-19 » et par l’Agence Nationale de la Recherche (projet PHYEPI).
Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.