Préambule

Ces notes, comme l’ensemble de nos travaux, sont à visée académique, fruit d’un travail de recherche fondamentale indépendant des autorités compétentes en matière de santé. En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus.

Résumé

Nos travaux et ceux de nos collègues permettent, en fonction des données disponibles de dater le début de l’épidémie de COVID-19 en Chine aux alentours de la mi-novembre en moyenne et le début de la vague épidémique actuelle en France vers fin janvier en moyenne. Plusieurs introductions pourraient avoir contribué à cette vague.

D’autres introductions sporadiques du virus ont pu avoir lieu en France avant et après le début de la vague épidémique, mais soit les chaînes de transmission se sont éteintes rapidement par hasard, soit elles sont restées limitées jusqu’en février et n’ont à ce jour pas été échantillonnées (par conséquent les génomes issus de ces chaînes de transmission précoces sont inconnus).

Tous ces résultats sont fonction des données disponibles à ce jour et pourraient être revus à la lumière de nouvelles découvertes.

Origine du COVID-19

Les analyses de la séquence ARN du SRAS-Cov-2, qui cause le COVID-19, ont montré que le virus le plus ressemblant est un coronavirus échantillonné chez une chauve-souris et nommé SARSr-CoV-RaTG13. Les deux génomes partagent plus de 96 % de leurs 29.000 nucléotides (il y a donc environ un millier de mutations nucléotidiques de différences entre les deux).

À noter qu’une région du génome contient 6 mutations qui semblent conférer une adaptation à l’homme et ont déjà été détectées dans un coronavirus échantillonné chez un pangolin. Pour plus de détails quant à l’origine génomique du virus, voir le travail de Andersen et alii (2020, Nature Medicine).

Pour en savoir plus, il faudrait davantage d’études sur les coronavirus dans la faune sauvage.

Date de l’épidémie

Comme le rapportent Li et alii (2020, New Engl J Med), les premiers cas de pneumonies atypiques dans la région de Wuhan ont été signalés le 29 décembre 2019. Le 3 janvier, l’agence de santé chinoise prenait le relais des autorités locales et informait l’OMS. Les études rétrospectives ont montré que des personnes étaient déjà infectées le 1er décembre 2019 (Huang et alii 2020 Lancet).

Les analyses d’Andrew Rambaut basées sur 86 séquences génétiques ARN de virus issues de patients suggèrent que la première personne infectée l’a été aux alentours du 17 Novembre 2019 (avec un intervalle de confiance à 95 % entre le 27 août et le 19 décembre). Cette estimation est toutefois à prendre avec précautions du fait du peu de génomes et de la diversité génétique limitée.

Pour en savoir plus, il faudrait séquencer les virus dans des échantillons provenant de patients infectés début décembre.

Arrivée en France

Cas sporadiques

Les trois premiers cas recensés de COVID-19 en France datent du 24 janvier 2020, avec deux cas à Paris et un à Bordeaux, comme le détaillent, en anglais, Bernard Stoecklin et alii (2020, Eurosurveillance). Tous trois avaient séjourné en Chine. Ceci correspond aussi au premier cas détecté en Europe.

Entre le 24 et le 28 janvier, 5 personnes ont été infectées dans la station de ski de Contamines-Montjoie par une personne qui avait séjourné à Singapour (comme le détaille une note de Santé Publique France). Pour plus de détails, on peut voir l’article en anglais de Danis et alii (2020, Clin Infect Dis)

D’autres cas ont été détectés début février dans l’Oise et une enquête de terrain a permis de remonter à une infection ayant eu lieu « la deuxième semaine de janvier ».

Étant donné le début de début de l’épidémie en Chine, il est possible qu’il y ait eu des introductions sporadiques en France fin 2019 et début 2020 mais pour le moment il n’y a pas de confirmation.

Attention, la présence d’infections sporadiques en France ne correspond pas nécessairement au début de la vague épidémique en France.

En effet, le hasard joue un grand rôle en début d’épidémie. On estime que pour chaque introduction de l’épidémie en France, il y a plus de 30 % de chances qu’elle s’éteigne par hasard. Autrement dit, il a pu y avoir des premiers cas importés qui n’ont infecté personne, oui qui ont conduit à des chaînes de transmission qui se sont éteintes d’elles mêmes.

Pour dater l’origine de la vague épidémique, on peut avoir recours aux approches de modélisation et utiliser des données d’incidence et des données de génomes viraux.

Vague épidémique

Données génétiques

Comme détaillé dans nos Rapport 4 et Rapport 6, à l’aide des données de séquences ARN des génomes viraux échantillonnés chez des patients, on peut dater l’infection à l’origine des infections de la vague épidémique. C’est le champ de la phylodynamie.

En fonction des données disponibles, nous voyons une vague épidémique qui commencerait au plus tôt entre mi-janvier et mi-février. En effet, il semble y avoir eu plusieurs introductions donc l’origine commune à toutes ces introductions, et donc à l’ensemble de la vague épidémique, pourrait se situer hors de France.

Attention, ces données sont dépendantes des séquences disponibles. À ce jour, nous ne disposons que d’une vision tronquée de l’épidémie (par exemple, nous ne disposons pas de séquences provenant d’Occitanie).

Données d’incidence

En France, les données d’incidence de dépistage (nombre de nouvelles personnes détectées positives pour le COVID-19 chaque jour) ont commencé à croître exponentiellement à partir du 27 février 2020. La valeur la plus élevée d’incidence de la vague épidémique a été atteinte le 1er avril 2020.

Grâce aux données d’incidence, on sait qu’entre le 27 février et début mars, le temps de doublement de l’épidémie était de 3 jours environ. Donc tous les trois jours, l’épidémie doublait en taille. Pour atteindre le nombre total de personnes qui seront immunisées au 11 mars, il faut environ 23 doublements soit 69 jours si le temps de doublement est constant.

On peut affiner cette estimation à l’aide de simulations stochastiques. Dans notre Rapport 8, nous montrons que les dates d’introduction les plus compatibles avec les données observées sont aux alentours de la mi-janvier 2020, avec un intervalle de confiance compris entre le 2 et le 19 janvier pour le modèle le plus simpliste.

Avoir un début de l’épidémie avant cette date est soit très improbable, soit moins parcimonieux en l’état des connaissances car cela nécessite d’invoquer une hypothèse de plus expliquant pourquoi en début d’épidémie le temps de doublement aurait été bien supérieur à celui mesuré pendant la vague épidémique.

Sources et remerciements