Ces notes, comme l’ensemble de nos travaux, sont à visée académique, fruit d’un travail de recherche fondamentale indépendant des autorités compétentes en matière de santé. En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus.
Ce travail de modélisation mathématique et statistique vise à mieux décrire, comprendre et aider à prévoir le comportement de l’épidémie de COVID-19 en France. Il s’appuie sur un modèle en temps discret, conçu et analysé par Mircea T. Sofonea, avec l’aide de l’ensemble de l’équipe. Le modèle et les méthodes sont décrites plus en détails dans une pré-publication scientifique (en anglais).
Après un aperçu de la structure du modèle, nous présentons ici les résultats selon trois axes principaux :
l’analyse de la vague passée : l’estimation de valeurs de paramètres clés difficilement mesurables, et l’effet de la date de début du confinement sur la vague épidémique,
l’exploration de différents scénarios épidémiques suite aux mesures de déconfinement du 11 mai et du 2 juin,
l’effet de la rapidité de la mise en place des mesures de contrôle sur l’ampleur et la date du pic épidémique correspondant,
l’analyse de stratégies non pharmaceutiques (SNP), notamment du contrôle adaptatif (ou stop & go), implémentable en cas de redémarrage de l’épidémie.
Les deux derniers points sont particulièrement importants dans le futur proche car tant que des options pharmaceutiques (traitements ou vaccins) ne sont pas disponibles, tout redémarrage de l’épidémie ne pourra être jugulé que par des SNP.
La structure du modèle est schématisée par le diagramme de la Figure 1 ci-dessous (par souci de clarté, la stratification n’est pas représentée). Il est à noter que le modèle n’a pas pour objectif de détailler la diversité des histoires naturelles de la COVID-19 mais de rendre compte de façon parcimonieuse des données communiquées quotidiennement par les autorités sanitaires. Ceci explique pourquoi une attention particulière est portée aux cas critiques, qui développent des complications respiratoires, potentiellement fatales, et dont certaines nécessitent des soins intensifs. En outre, les EHPAD sont ignorés du présent travail (leurs effectifs sont d’ailleurs retirés de la paramétrisation), du fait de leur faible contribution à la circulation du virus dans la population générale.
Le modèle se décompose en deux environnements : la population générale (avec des personnes sensibles à l’infection en jaune et des personnes infectées, sur fond rose) et la population hospitalisée (sur fond bleu). Les personnes peuvent être dans plusieurs états : sensibles, infectées non critiques (c’est-à-dire développant une maladie n’étant ni fatale ni ne justifiant une admission en réanimation, A), infectées critiques (B), hospitalisée en réanimation (C), hospitalisée mais non en réanimation (D), guérie et décédée. La transmission du virus ne se fait qu’en population générale dans ce modèle (la transmission intra-hospitalière n’est pas abordée par le modèle, sa contribution à la circulation du virus en population générale étant considérée marginale).
Ce modèle est en temps discret et à effets mémoire (pour les puristes, le terme exact est non-markovien). En pratique, on part d’une condition initiale et on étudie chaque jour les variations dans la population. En effet, chaque jour les individus ont des probabilités de changer d’état et ces probabilités dépendent de ce qui s’est passé les jours précédents.
Au 1er janvier, tous les individus appartiennent au compartiment sensibles. Une fois le virus introduit dans la population (date qui sera estimée après ajustement aux données), chaque individu présente une certaine probabilité de progresser, le jour suivant, dans le diagramme selon les flèches indiquées. Parmi ces probabilités, citons celle d’être contaminé un jour donné. Cette valeur est actualisée jour après jour selon l’avancement de l’épidémie. Les autres probabilités, à l’image de celle d’être hospitalisé, sont constantes mais peuvent varier selon l’âge de l’individu et le temps écoulé depuis la contamination. Le potentiel de transmission est lui-même dépendant de ce dernier (en lien avec l’intervalle sériel, cf infra), ce qui qualifie ce modèle de dynamique à mémoire. Pour plus de détails à ce sujet, voir notre précédente note (onglet Modèle).
Nous avons pu utiliser des données de la littérature afin d’obtenir un ordre de grandeur pour des différents paramètres. De plus, nous avons ensuite ré-estimé ces valeurs à l’aide de notre modèle, à part pour deux grandeurs : la létalité effective (qui est basée sur l’étude de Verity et alii 2020, Lancet Infectious Diseases) et le temps de génération, c’est-à-dire le nombre de jours qui séparent en moyenne une infection et la suivante, qui provient de l’étude de Nishiura et alii (2020, Int J Inf Dis).
Trois paramètres du modèle ont été estimés plus en détails. Il s’agit du nombre de reproduction de base (\(\mathcal{R}_0\)) de l’épidémie, de la date d’origine de la vague épidémique (\(t_0\)) et de l’effet des mesures de contrôle sur le nombre de reproduction (\(\kappa\)).
Afin d’estimer ces paramètres, nous avons du développer une méthodologie statistique originale, liée à notre utilisation d’un modèle en temps discret (pour plus de détails, voir Sofonea et alii (2020). Concernant les données, nous nous sommes basés sur les séries temporelles d’incidence de nombre de décès, d’hospitalisation et d’admissions en réanimation publiées par Santé Publique France sur le site data.gouv.fr. Depuis notre rapport du 23 avril 2020, Santé Publique France a rendu public des chiffres essentiels de l’épidémie, notamment les statistiques du temps écoulé entre l’apparition des symptômes et l’entrée en réanimation, et la durée du séjour en réanimation (point du 23 avril). D’autres informations toutes aussi essentielles à la calibration du modèle ont été publiées par exemple dans le point du 7 mai avec la stratification par âge des décès en réanimation.
Au cours de notre première estimation publiée le 22 avril dans notre Rapport résumant nos travaux, nous avions trouvé que la valeur du \(\mathcal{R}_0\) de l’épidémie était de 3,0 et avait été divisée par 4 suite aux mesures de contrôle (donc le confinement) pour atteindre un nombre de reproduction temporel \(\mathcal{R}_t\) de 0,73.
Depuis, nous avons mis en place un moyen robuste de générer des intervalles de confiance pour le modèle qui aient un sens statistique. Les estimations sont résumées dans le tableau suivant.
Paramètre | Notation | Estimation | Intervalle de confiance à 95 % |
---|---|---|---|
nombre de reproduction de base | \(\mathcal{R}_{0}\) | 3,0 | [2,6 à 3,4] |
début vague épidémique (en 2020) | \(t_{0}\) | 20 janvier | [12 au 28 janvier] |
effet du confinement (%) | \(\kappa\) | 76 | [73 à 79] |
En fonction des données disponibles au 12 mai 2020, notre modèle estime qu’initialement une personne infectée infectait en moyenne 3 nouvelles personnes au cours de son infection. Les interventions de contrôle, aussi appelées stratégies non-pharmaceutiques (SNP), ont permis de diviser ce nombre environ par 4. Le \(\mathcal{R}_t\) correspondant en période de confinement est de 0,7 et donc très proche des valeurs estimées à l’aide d’un modèle plus simple directement à partir des données de réanimation via notre application Rt.
Enfin, la vague épidémique aurait vraisemblablement commencé entre le 13 et le 28 janvier, ce qui est cohérent avec les résultats que nous avons obtenus à partir des données de séquences génétiques le 9 avril 2020.
Notre modèle nous permet aussi d’estimer les valeurs de plusieurs autres paramètres. En particulier, nous estimons que le temps entre la date où une personne est infectée et celle où elle est éventuellement hospitalisée pour des symptômes critiques est en moyenne de 14 jours (avec un écart-type de 4 jours).
Les dynamiques épidémiologiques associées à notre modèle s’ajustent bien aux données communiquées par Santé Publique France, comme l’illustrent les graphiques des Figures 2 et 3. Ils représentent des dynamiques que l’on pourrait qualifier respectivement d’incidente (admissions et nouveaux décès journaliers, nombre de reproduction temporel) et d’inertielle (lits occupés en services de réanimations / soins intensifs, mortalité cumulée et immunisation).
Les six courbes présentées ont des implications notables en terme de santé publique mais à des niveaux décisionnels et des temporalités différentes. Ainsi, le nombre de reproduction est d’intérêt majeur à court terme, afin de réajuster les mesures selon la dynamique épidémique, tandis que la mortalité cumulée permettra de dresser un bilan a posteriori du poids de la COVID-19 dans la mortalité de la population française en 2020. Le nombre de lits occupés en réanimation a quant à lui un intérêt hospitalier direct, en particulier pour l’optimisation et la restructuration exceptionnelle des services pour faire face au flux inédit de complications respiratoires.
Le 11 mai puis le 2 juin, de nombreuses restrictions ont été levées, parmi lesquelles les emblématiques autorisations de sorties individuelles, la fermeture des écoles et la fermeture des bars et restaurants. Dans le même temps, des mesures inédites sont entrées en vigueur afin de faire obstacle à la circulation virale : le port généralisé du masque, le dépistage massif, les brigades sanitaires, l’application StopCovid. La multiplicité de ces changements simultanés rend la prédiction de la suite de l’épidémie à partir d’un modèle extrêmement difficile de par l’intrication et des effets conjoints inconnus. Une prédiction semble même relever plus de la croyance que de la science. En effet, pour formuler une prédiction solide, il faudrait être en mesure de connaître l’effet actuel des mesures individuelles (distanciation sociale, port du masque, confinement, dépistage…) et de leurs potentielles synergies. Ceci nous apparaît impossible à ce jour en France car il n’existe pas de données précises par exemple quant aux matrices de contacts entre les âges. Mais surtout, il faudrait pouvoir avoir une idée des comportements individuels et du suivi des mesures mises en place après le 2 juin.
À la date où nous écrivons ce rapport, l’analyse des données postérieures au 11 mai est rassurante dans la mesure où elles permettent d’éliminer un rebond épidémique précoce et brutal (qui serait quantifié par un nombre de reproduction temporel largement supérieur à 1). Par exemple, un calcul basé sur les admissions en réanimation disponibles au 1er juin 2020 et effectué par le logiciel EpiEstim visualisable sur notre application Rt l’estimait à 0,89 avec un intervalle de confiance à 95 % entre 0,76 et 1,01.
À défaut d’identifier le scénario le plus probable, nous décrivons ici quatre scénarios possibles pour les semaines à venir :
une épidémie sous contrôle (donc \(\mathcal{R}_t \approx 0,9\)),
une reprise épidémique lente (avec \(\mathcal{R}_t \approx 1,1\)),
le même cas que précédemment avec une réponse sanitaire début juillet,
le même cas que précédemment avec une réponse très rapide (mi-juin).
Comme on le voit sur la Figure 4A, il s’agit du scénario collectivement espéré, où \(\mathcal{R}_t\) se maintiendrait sous le seuil de 1 malgré la levée des restrictions les plus importantes (confinement, fermeture des écoles, des restaurants…). Dans ce cas, on s’attend à une diminution du nombre de personnes en réanimation pour des cas de COVID-19 sévères (courbe bleue) jusqu’à atteindre une valeur nulle vers la fin de l’été.
Cet état perdurerait tant que les mesures de contrôle seraient en place et/ou que les arrivées sur le territoire national soient assorties de mesures de contrôle de type quatorzaine.
On pourrait alors envisager de lever progressivement les différentes mesures de contrôle. Il faut toutefois faire attention car la raréfaction du nombre de cas de COVID-19 couplée à un relâchement important du contrôle entraînerait une dynamique stochastique de l’épidémie, avec des explosions épidémiques localisées tant que l’immunité de groupe n’aura pas atteint un niveau suffisant. Plus généralement, comme nous l’expliquons dans notre rapport sur l’origine et la fin de l’épidémie, le hasard peut entraîner une attente relativement longue avant de voir la fin complète de l’épidémie.
Une des possibilités est que le nombre de reproduction soit du mauvais coté du seuil de 1, par exemple avec \(\mathcal{R}_t=1,1\). Dans ce cas, l’épidémie arrêterait sa décrue.
Comme on le voit sur la figure 4B, ce redémarrage ne se matérialiserait pas au niveau de l’occupation des services de réanimation avant la mi-juin, lesquels ont une inertie importante pour se désemplir. Une observation importante est qu’au voisinage de la valeur seuil \(\mathcal{R}_t=1\), les dynamiques décroissantes et croissantes peuvent difficlement être distinguées avant quelques semaines, du fait des oscillations dans les données : aléas des petits nombres, reports des week-ends…
Notons qu’en l’absence de changement des mesures de contrôle de l’épidémie, selon ce scénario le nombre de personne en service de réanimation (courbe de prévalence bleue) demeurerait sous le seuil de saturation des services (courbe horizontale tiretée). Mais là encore, la prudence est de mise pour deux raisons :
avoir des personnes en réanimation pour COVID-19 impose une contrainte sur le service dans son ensemble, en particulier sur la possibilité de traiter d’autres pathologies,
le nombre cumulé de décès à la fin du mois de septembre (courbe rose d’incidence cumulée) serait élevé.
Dans ce cas, il semblerait légitime de réévaluer les moyens de contrôle de l’épidémie.
Dans le cas où l’épidémie redémarrerait lentement, il est à envisager que les autorités reviennent sur certaines levées de restrictions ou, dans une moindre mesure, promeuvent davantage certaines pratiques (par exemple l’application StopCovid, disponible le 2 juin).
La Figure 4C illustre le fait que si des réponses, capables de ramener \(\mathcal{R}_t\) sous 1, sont implémentées vers la mi-juillet, cela suffirait à empêcher la saturation des services de réanimation et on aurait alors un pic de prévalence dans les services au cours de la première quinzaine du mois d’août. Le nombre de décès cumulés liés à l’épidémie de COVID-19 pourrait toutefois être élevé, même si les incertitudes sont grandes sur ce scénario.
Si une réponse efficace est implémentée dès la détection d’un redémarrage de l’épidémie (donc au cours de la première quinzaine de juin), le second pic épidémique début juillet serait à peine distingable (Figure 4D). En termes de mortalité cumulée, les valeurs ne seraient que peu différentes d’une épidémie ayant été constamment sous contrôle.
Comme nous l’avons vu dans les cas C et D, un éventuel redémarrage de l’épidémie pourrait nécessiter de nouvelles stratégies de contrôle. Ici, nous explorons l’effet de la rapidité de mise en place de ces mesures sur la date et l’amplitude d’un second pic.
Afin de créer la Figure 5 ci-dessous, nous avons supposé un nombre de reproduction égal ou supérieur à 1 après le 11 mai. L’axe des abscisses correspond à la date de mise en place des nouvelles mesures. Chaque couleur de point correspond à un scénario de reprise plus ou moins rapide de l’épidémie (estimé par le nombre de reproduction temporel \(\mathcal{R}_t\)). Sur le panneau du haut est représentée l’ampleur du second pic épidémique (avec une échelle logarithmique) en fonction de la date de mise en place des mesures. Celui du bas représente la date de ce pic.
Comme attendu, si la reprise est très limitée (\(\mathcal{R}_t<1,1\)), même en l’absence de mesures mises en place, on peut échapper à un second pic. En revanche, même avec une reprise limitée (\(\mathcal{R}_t\approx 1,2\)), une mise en place tardive de nouvelles mesures (après le 22 juillet) pourraient conduire à un pic d’ampleur importante, qui aurait lieu au mois d’août. Si la reprise est plus violente, il faut des mesures de contrôle bien plus rapides afin de limiter l’ampleur d’un éventuel second pic. Une observation générale est que, dans la gamme de nombre de reproduction du COVID-19, une réponse sanitaire adaptée doit idéalement être apportée dans les 5 semaines qui suivent la levée d’un confinement afin de prévenir une surmortalité consécutive à une saturation du système de soins.
Popularisée sous sa version anglaise du stop & go (“arrêt et redémarrage”), cette stratégie consiste à alterner les phases de contrôle strict et de relâchement. Son originalité est que le déclenchement des phases de contrôle strict repose sur la valeur d’un indicateur de terrain. Ici, nous avons basé ce déclenchement sur le nombre de nouvelles admissions en réanimation. Dans notre article, nous explorons différentes valeurs et montrons que 15 admissions par jour constitue un seuil équilibré car il permet de ne pas rebasculer trop souvent, tout en évitant des pics épidémiques trop prononcés.
La Figure 6 illustre trois déclinaisons possibles du contrôle adaptatif :
un relâchement total (avec une épidémie se propageant à la vitesse initiale donc \(\mathcal{R}_t\approx \mathcal{R}_0\approx 3\)) avec un retour à un confinement (\(\mathcal{R}_t \approx 0,7\)) dès que le seuil des 15 admissions par jour en réanimation est atteint,
un scénario identique mais avec un relâchement moins important et un \(\mathcal{R}_t\approx 2\) (soit 80 % du scénario précédent),
un scénario identique au précédent mais avec contrôle différentiel en fonction des âges avec un seuil à 5 admissions en réanimation pour les plus de 65 ans, à 15 pour les jeunes (moins de 25 ans), et à 30 pour la classe intermédiaire. Il est à noter que l’indicateur surveillé est le nombre d’admissions, tous âges confondus : en cas de redémarrage, les restrictions s’appliquent donc successivement aux personnes les plus âgées, aux plus jeunes et à la classe la plus active dans un troisième temps seulement.
En comparant les scénarios A et B, on voit que le fait d’abandonner complètement le contrôle pendant les phases de relâchement conduit à des pics plus élevés, à la fois en termes de nombre de patients en réanimation (en bleu) et de décès (en rose). On constate aussi que les périodes de relâchement (où le \(\mathcal{R}_t\) est élevé, en noir) sont plus courtes. Autrement dit, si l’épidémie repart et qu’une solution adaptative est envisagé, maintenir un certain contrôle de l’épidémie pendant les phases de relâchement peut à la fois permettre de minimiser les périodes de contrôle strict et les décès.
Dans le scénario C, qui est plus “académique” que les autres et clairement moins déployable, nous avons exploré une stratégie de contrôle différentiel en fonction des âges (NB : dans le manuscrit original, nous montrons par ailleurs qu’une stratégie de contrôle différentiel par âge mais non adaptatif est quant à elle peu efficace). Selon cette stratégie, le contrôle strict dépend du nombre de personnes admises en réanimation avec des différences selon les âges. Pour les personnes les plus à risque, ce seuil est plus bas afin de minimiser au maximum les décès. Pour les plus jeunes, ce seuil est aussi plus élevé que pour la majorité des actifs. Au final, un tel scénario a l’avantage de permettre un relâchement pour 53 % des 25-65 ans (sachant qu’en période de relâchement on maintient un contrôle de 80 % de la propagation de l’épidémie), mais cela se fait au détriment des autres classes qui elles subissent le plus souvent un contrôle strict.
Les données cliniques et épidémiologique collectées en Asie et aussi pour une partie en France permettent de développer des modèles plus mécanistiques de l’épidémie de COVID-19 et donc d’aller plus loin qu’une simple description du nombre de reproduction (\(\mathcal{R}_t\)) ou du temps de doublement par exemple à partir des données d’incidence.
D’un point de vue descriptif, ce modèle nous permet d’obtenir une mesure des variables de l’épidémie plus robuste car elle intègre plus de données. Ainsi, nous avons pu estimer que le nombre de reproduction de l’épidémie avait été divisé par 4 suite à la mise en place des mesures de contrôle. Mais nous avons aussi pu affiner des estimations telles que le nombre de jours entre une infection et une éventuelle hospitalisation (entre 10 et 18 jours environ).
À partir de ce modèle et des valeurs estimées des paramètres, nous avons pu explorer différents scénarios. Sur le court terme, la question est encore ouverte de savoir si la levée de mesures au-delà du 2 juin peut se traduire par un redémarrage ou non de l’épidémie.
Si l’épidémie demeure sous contrôle, de nouvelles levées de restrictions seront envisagées.
Si l’épidémie redémarre, que ce soit suite au déconfinement partiel du 11 mai ou ultérieurement, se posera la question de nouvelles mesures de contrôle. Dans le cas d’un tel redémarrage, nous montrons qu’en fonction de son intensité (quantifiée par le nombre de reproduction), la rapidité de la réponse peut avoir un effet déterminant.
Sur le moyen terme, tant qu’aucune option pharmaceutique (traitement ou vaccin) ne sera disponible, les seules interventions possibles demeurent les solutions non-pharmaceutiques (SNP). Nous présentons ici plusieurs implémentations de la stratégie adaptative (stop & go), qui montrent que même en phase de relâchement, conserver un certain niveau de contrôle de l’épidémie permet à la fois de minimiser les décès mais aussi le nombre de jours passés en périodes de contrôle strict.
La majorité des données auxquelles nous avons réussi à avoir accès proviennent du site public data.Gouv.fr et des points hebdomadaires publiés par Santé Publique France. Malheureusement nous n’avons pas pu avoir accès à d’autres données pour calibrer nos modèles.
Le groupe de modélisation de l’équipe ETE (Laboratoire MIVEGEC, CNRS, IRD, Université de Montpellier) est composée de Samuel Alizon, Thomas Bénéteau, Marc Choisy, Gonché Danesh, Ramsès Djidjou-Demasse, Baptiste Elie, Yannis Michalakis, Bastien Reyné, Quentin Richard, Christian Selinger, Mircea T. Sofonea.
Contribution à ce travail :
conception, modélisation et analyse : MTS
rédaction : SA, MTS
validation : ensemble de l’équipe
contacts : covid-ete@ouvaton.org
site : covid-ete.ouvaton.org
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.