Préambule

Ces notes, comme l’ensemble de nos travaux, sont à visée académique, fruit d’un travail de recherche fondamentale indépendant des autorités compétentes en matière de santé. En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus.

Résumé

Le nombre de reproduction de base de l’épidémie de COVID-19 a été estimé à environ 3,5 en France. Cela signifie qu’en début d’épidémie, 10 personnes infectées en infectaient 35. Le temps de doublement de l’épidémie était au début d’environ 3 jours (tous les trois jours, le nombre de personnes infectées doublait).

Avec la mise en place du confinement, le nombre de reproduction a été divisé par 6 ou 7. Il est possible de visualiser sa valeur la plus récente à partir des données via notre application.

Ces résultats sont dépendants des méthodes utilisées et des données disponibles.

\(\mathcal{R}_0\) et \(\mathcal{R}_t\)

Le nombre de reproduction de base, noté \(\mathcal{R}_0\), est défini comme le nombre moyen d’infections qu’engendre une personne infectée dans une population entièrement sensible au cours de son infection. Si le \(\mathcal{R}_0\) est de 3, chaque infection engendre 3 nouvelles infections, qui elles-mêmes en engendrent 3, et ainsi de suite.

La valeur de 1 est une valeur seuil. Si le \(\mathcal{R}_0\) est supérieur à 1, il y a un risque épidémique. Plus le \(\mathcal{R}_0\) est grand, plus le risque épidémique est élevé. Si le \(\mathcal{R}_0\) est inférieur à 1, le risque épidémique est faible ou nul.

Au cours d’une épidémie, le nombre de reproduction va changer et on parle alors d’un nombre de reproduction temporel, noté \(\mathcal{R}_t\)\(t\) est une date donnée. Le nombre de reproduction a tendance à diminuer au cours d’une épidémie du fait des mesures de contrôle et de l’immunisation progressive de la population.

Le but des mesures de santé publique du type distanciation sociale, gestes barrières, confinement, port du masque, est de diminuer le nombre de reproduction pour l’amener sous la barre de 1. L’immunisation de la population, que ce soit par des infections naturelles ou par la vaccination, fait aussi diminuer le nombre de reproduction suivant un phénomène appelé immunité de groupe.

Au cours d’une épidémie, lorsque le nombre de reproduction passe sous la barre de 1, on dit que le pic épidémique est atteint.

Comment les calculer ?

On peut estimer les nombres de reproduction à partir de plusieurs types de données. Soit en dépistant la population (avec tests qui cherchent les infections actives), soit avec des sérologies pour détecter les personnes immunisées (et donc qui ont été infectées), soit à partir des données de génomique des virus (leur séquence ARN).

Incidence

L’incidence correspond aux nombre de nouveaux cas détectés chaque jour. En France, on la calcule sur les dépistages, les hospitalisations, les admissions en réanimation et les décès. Si on suit les valeurs d’incidence sur une période donnée, on obtient une courbe d’incidence, aussi appelée série temporelle.

Pour obtenir le nombre de reproduction, la première étape consiste à calculer le taux de croissance exponentielle de la courbe d’incidence, noté \(r\). Au passage, ce taux nous permet de calculer le temps de doublement de l’épidémie, noté \(T_d\), par la formule :

\[\begin{align} T_d &= \frac{\ln(2)}{r} \end{align}\]

Si le temps de doublement est de 3 jours, alors en 3 jours 1 infecté en donnera 2, qui 3 jours après en donneront chacun 2, et ainsi de suite. Après 30 jours, donc 10 doublements, on aura eu \(2^{10}\) (soit 1024) infections et après 60 jours ce sera 1048576 infections.

Afin d’obtenir le nombre de reproduction, il faut une autre donnée appelée temps de génération, noté \(D\). Cela correspond au nombre de jours entre le moment où une personne est infectée et le moment où elle infecte une autre personne. Ce temps de génération a une composante biologique (pour infecter une personne il faut être soi-même infectieux⋅se) et une composante sociale (pour infecter une personne il faut être en contact avec elle).

Mesurer le temps de génération est difficile. Pour ce faire, il faut suivre des couples de transmission, avec une personne infectrice et une personne infectée. On calcule ensuite généralement un intervalle sériel, qui correspond au nombre de jours entre l’apparition des symptômes chez la personne infectrice et l’apparition des symptômes chez la personne infectée. À ce jour, il n’existe pas d’estimation du temps de génération (ou de l’intervalle sériel en France). La plupart des données utilisées proviennent d’Asie.

En simplifiant, le nombre de reproduction est lié au produit entre le taux de croissance exponentiel (\(r\)) et le temps de génération (\(D\)) avec la formule

\[\begin{align} \mathcal{R}_0 & \approx r \times D + 1 \end{align}\]

Le calcul lui-même n’est pas trivial car il nécessite de tenir compte de beaucoup de facteurs, notamment les délais temporels. Pour en savoir plus, on pourra se référer aux explications détaillées sur le site de notre application de calcul du nombre de reproduction.

Attention, les résultats sont très sensibles aux variations d’intensité de dépistage. Si pendant un mois donné on dépiste deux fois plus, on détectera beaucoup plus d’infections et on aura donc l’impression que l’épidémie est en croissance.

Sérologies

Les personnes infectées par le COVID-19 développent une réponse immunitaire, qui leur permet de guérir de l’infection et d’être protégés, au moins sur le court terme. En analysant le statut sérologique des personnes à partir d’échantillons de sang, c’est-à-dire en dosant les anticorps présents, on peut donc savoir si une personne a été infectée ou pas.

Comme détaillé dans notre Rapport 2, les modèles mathématiques permettent de lier le nombre de reproduction d’une épidémie et le nombre total de personnes infectées après d’une vague épidémique, aussi appelé taille de l’épidémie.

Dans le cas du COVID-19, on peut estimer le nombre de reproduction de la vague épidémique, qui n’est donc pas un \(\mathcal{R}_0\) mais plutôt un nombre de reproduction moyen entre les périodes avec et sans contrôle.

Séquences

Comme tous les êtres vivants, les virus accumulent des mutations dans leur génome ARN à chaque fois qu’ils se reproduisent. Les virus évoluant rapidement, on peut retracer leur propagation en analysant leurs génomes. C’est l’objectif d’une discipline scientifique appelée phylodynamique.

Plus précisément, des modèles de naissance et de mort ainsi que des modèles de coalescent permettent d’estimer le nombre de reproduction temporel. Pour plus de détails, on peut se référer Alizon & Saulnier (2017, Virologie).

Attention, les résultats de phylodynamique sont très dépendants des séquences disponibles.

En Chine

Le nombre de reproduction a été estimé très rapidement à partir des données d’incidence et de suivi de contact dans Wuhan par Li et alii (2020, New Engl J Med). À partir de 425 cas, ils ont estimé que le temps de doublement initial était de 7,4 jours, que la moyenne de l’intervalle sériel était de 7,5 jours (avec un intervalle de confiance à 95 % entre 5,3 et 19 jours) et que le \(\mathcal{R}_0\) était de 2,2 (avec un intervalle de confiance à 95 % entre 1,4 et 3,9).

Des résultats de Wu et alii (2020, Nat Med) obtenus sur plus d’infections ont confirmé et précisé ces résultats avec un \(\mathcal{R}_0\) 1,9 (avec un intervalle de confiance à 95 % entre 1,8 et 2,1).

En France

\(\mathcal{R}_0\)

À ce jour, le temps de génération est inconnu en France. Les estimations de \(\mathcal{R}_0\) comportent donc une marge d’incertitude.

Dans notre Rapport 1, nous avons calculé le \(\mathcal{R}_0\) à partir des courbes d’incidence. Ce dernier était compris entre 2,4 et 2,6 s’il était calculé sur les données du 27 février au 16 mars, mais entre 3,5 et 4,1 s’il était calculé sur les données du 27 février au 9 mars. Ceci suggérerait donc soit un ralentissement de l’épidémie après le 9 mars, soit une diminution des dépistages.

D’autres équipes de recherche ont estimé le \(\mathcal{R}_0\) en France :

  • Di Domenico et alii l’estiment entre 2,8 et 3,2,

  • Magal & Webb le trouvent égal à 4,5 (pas d’intervalle de confiance),

  • Bacaer indique 2,33 (pas d’intervalle de confiance),

  • Roux et alii estiment des nombres de reproduction dans plusieurs régions de France avec des valeurs qui vont de 1,7 à 4,2 avec une médiane à 2,8,

  • Salje et alii l’estiment entre 3,2 et 3,4 mais finalement entre 2,8 et 2,99 dans la version publiée.

  • Roques et alii l’estiment entre 3,1 et 3,3,

  • Sofonea et alii, c’est-à-dire nous, l’estimons entre 2,59 et 3,39.

\(\mathcal{R}_t\)

Incidence

Nous avons conçu une application en ligne qui permet de visualiser les valeurs du nombre de reproduction temporel dans différents pays ou départements français en fonction de différents types de données d’incidence (dépistages, hospitalisations, décès).

À l’aide d’un modèle mécanistique, Salje et alii ont estimé un nombre de reproduction pré- et post-confinement. Ils trouvent qu’avec le confinement le \(\mathcal{R}_t\) est de 0,52 (avec un intervalle de confiance à 95 % entre 0,5 et 0,55). Dans la version publiée, cette estimation est de 0,65 à 0,68.

Avec un modèle plus simple, Roques et alii trouvent un \(\mathcal{R}_t\) pendant le confinement de 0,47 (avec un intervalle de confiance à 95 % entre 0,45 et 0,50).

PLus récemment, * Sofonea et alii, c’est-à-dire nous, avons déterminé que la valeur pendant le confinement était entre 0,69 et 0,74, soit une division e,tre 3,7 et 4,7.

Phylodynamique

Dans notre Rapport 6, nous avons analysé 196 génomes provenant de patient⋅e⋅s de plusieurs régions de France. Ceci nous a permis d’estimer le nombre de reproduction sur trois périodes temporelles. En particulier, on détecte qu’entre le 18 février et le 6 mars, le \(\mathcal{R}_t\) semblait compris entre 1,5 et 3,9 alors qu’entre le 7 et le 22 mars il était compris entre 0,8 et 1,4, ce qui suggère un ralentissement prononcé de l’épidémie.

Ces résultats peuvent dépendre des séquences échantillonnées. Plus de séquences permettraient des estimations plus précises, notamment en estimant un nombre de reproduction post-confinement.

\(\mathcal{R}_0\) individuels

Le nombre de reproduction qui est médiatisé est celui au niveau populationnel. En pratique, personne ne peut infecter 3,5 personnes. Concrètement, une personne infectée en infectera 3, 4, 10, ou… 0. On a donc toute une distribution des valeurs individuelles du nombre de reproduction.

Sur la figure suivante, nous représentons cette distribution pour le SRAS-Cov-1 de 2003 (donc pour 1.000 personnes infectées, combien causent 0, 1, 2, 3, etc. infections). Les chiffres au dessus des colonnes indiquent les pourcentages des infections qui causent ce nombre d’infections secondaires.

Sur la figure précédente, qui est basée sur le \(\mathcal{R}_0\) de la France et la dispersion des valeurs estimée pour l’épidémie de SRAS de 2003 à Hong-Kong par Lloyd-Smith et alii (2005, Nature), on voit que près de 60 % des personnes ne causent aucune infection secondaire. En revanche, une petite proportion va au contraire générer plus de 10 infections secondaires. La valeur moyenne du \(\mathcal{R}_0\) était donc fortement associée à des événements de surdispersion (super-spreaders en anglais).

Ceci a une énorme influence sur la propagation de l’épidémie, en particulier au début : plus la variabilité dans les nombres de reproduction individuels est grande, plus la probabilité que l’épidémie s’éteigne toute seule par hasard est grande.

Ceci explique aussi pourquoi des chaînes de transmission auraient pu exister en France et s’éteindre avant le début de la vague épidémique comme nous l’expliquons dans notre note sur l’origine de l’épidémie. Sachant que pour le COVID-19, cette hétérogénéité des valeurs est encore peu connue.

Sources et remerciements

  • Le groupe de modélisation de l’équipe ETE (Laboratoire MIVEGEC, CNRS, IRD, Université de Montpellier) est composée de Samuel Alizon, Thomas Bénéteau, Marc Choisy, Gonché Danesh, Ramsès Djidjou-Demasse, Baptiste Elie, Yannis Michalakis, Bastien Reyné, Quentin Richard, Christian Selinger, Mircea T. Sofonea.

  • Ce travail n’a reçu aucun financement spécifique à ce jour.

  • Contribution à ce travail :

    • conception du travail : ensemble de l’équipe

    • rédaction : SA, MTS, YM

    • validation : ensemble de l’équipe

  • contacts :

  • site : covid-ete.ouvaton.org

  • Licence Creative Commons
    Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.