Préambule

Ce rapport a été produit à des fins académiques et ne constitue pas un support de prise de décision. De plus, les données analysées ne sont pas représentatives de la situation nationale.

L’ensemble de nos rapports sur la pandémie de COVID-19 est disponible sur cette page.

En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus

L’Organisation Mondiale de la Santé (OMS) dispose aussi d’un site très complet https://www.who.int/fr/emergencies/diseases/novel-coronavirus-2019

Nous remercions les patients, personnels de santé, le laboratoire de virologie du CHU de Montpellier et l’équipe de virologie du laboratoire CERBA qui ont permis de générer les données de criblage analysées dans de ce travail. Cette étude a été approuvée par l’IRB du CHU de Montpellier et est enregistrée sur le site ClinicalTrials.gov avec l’identifiant NCT04738331.

Variants et tests de ciblage

Ce rapport consiste à analyser les tests dits de criblage réalisés sur l’ensemble des tests de dépistage positifs pour le SARS-CoV-2. Du fait de leur impact massifs sur les épidémies nationales, les variants de SARS-CoV-2 sont surveillés de près. En France, cette surveillance s’effectue de deux manières :

  1. des tests dits de criblages qui sont réalisés sur l’ensemble des tests de dépistage positifs pour le SARS-Cov-2,

  2. du séquençage de génome entier réalisé sur une partie des tests positifs dans le cadre des enquêtes Flash nationales ou de manière plus ciblée (par exemple suite au résultat du test de dépistage).

Actuellement, les tests de criblage ciblent 3 mutations dans la protéine de spicule du virus : la S:L452R (mutation C), la S:E484Q (mutation B) et la S:E484K (mutation A). Selon la présence ou l’absence de ces mutations, on peut avoir une idée de la lignée causant l’infection. Plus précisément, si on note par 0 l’absence et 1 la présence de mutation, on a les équivalences suivantes :

  • A0B0C1 : plutôt le variant Delta (il n’a pas de mutation en position 484 mais a la mutation S:L452R),

  • A0B1C1 : plutôt le variant Kappa,

  • A1B0C0 : plutôt les variants Beta, ou Gamma, ou Eta,

  • A0B0C0 : une lignée ancestrale, ou le variant Alpha, ou Omicron, ou la lignée B.1.640.

Ces tests ont une sensibilité limitée et les profils de mutations sont souvent ininterprétables. Le séquençage des génomes permet de donner une vision plus détaillée mais il prend plus de temps et coûte plus cher donc il concerne moins d’échantillons.

Nous analysons ici les données de 93882 tests de criblage effectués chez autant de personnes de 5 à 80 ans par le laboratoire CERBA entre le 01 sept. 2021 et le 07 déc. 2021. Ces données sont volontairement tronquées de 8 jours afin de tenir compte des délais de remontée des tests. Malheureusement les statuts vaccinaux ne sont pas connus.

Situation épidémique et variants

Une visualisation de l’ensemble des tests analysés dans ce jeu de données montre bien la décroissance de l’épidémie au mois de septembre-octobre et la repris épidémique depuis la fin octobre. Quasiment tous les criblages effectués correspondent à du variant Delta.

Si l’on se concentre uniquement sur les criblages AB0C0, leur nombre suit clairement la tendance générale de l’épidémie.

Enfin, si on ne considère que les tests qui ne sont pas A0B0C1 (donc a priori tout ce qui n’est pas du Delta) en France, on voit des variations temporelles avec d’abord des A0B0C0 (probablement du variant Alpha), puis des A0B1C1 (cohérents avec le variant Kappa), puis de nouveau des A0B0C0.

Modèle multinomial

Pour explorer dans quel contexte les tests de criblage autres que ceux associés à Delta (AB0C1) sont observés, nous avons effectué un modèle multinomial (la fonction multinom du package nnet). Plus de détails sont disponibles dans les annexes d’un des articles de notre consortium (Roquebert et alii 2021).

Dans ce modèle, la référence est le criblage AB0C1 et nous calculons, pour différents facteurs, dans quelle mesure ils augmentent les ratios de risque relatifs d’observer un autre résultat de criblage.

Cette analyse est conduite sur les 35 derniers jours donc entre le 02 nov. 2021 et le 07 déc. 2021. Les facteurs inclus dans le modèle sont l’âge de la personne testés, le contexte du test (la référence étant le milieu non(hospitalier), le kit utilisé (la référence étant le test ID™ SARS-CoV-2 / VOC evolution Pentaplex) et l’interaction entre la date et la région de prélèvement. La raison pour la prise en compte d’une telle interaction est pour détecter une éventuelle croissance (ou décroissance temporelle).

A0B0C0 A0B1C1 A1B0C0 autres
(Intercept) 0.00 0.00 0.00 0.16
Age 0.76 0.00 0.00 0.84
Contextehospital 0.00 0.25 NA 0.78
Kitcovti2 2.75 11.85 0.00 1.98
Date:RegionNormandie 13.14 6.09 0.00 0.00
Date:RegionBourgogne-Franche-Comté 3.29 24.96 0.00 0.80
Date:RegionBretagne 6.43 0.00 0.00 1.85
Date:RegionCentre-Val de Loire 22.71 0.00 0.00 1.34
Date:RegionCorse 30.08 0.00 0.00 0.48
Date:RegionGrand Est 4.13 4.96 477.81 0.64
Date:RegionHauts-de-France 18.08 0.00 0.00 0.00
Date:RegionIle-de-France 10.81 7.11 0.00 1.87
Date:RegionNouvelle-Aquitaine 4.08 2.47 0.00 0.40
Date:RegionOccitanie 0.00 4.88 0.00 0.78
Date:Regionother 8.25 0.00 0.00 0.47
Date:RegionProvence-Alpes-Côte d’Azur 0.00 0.00 0.00 0.14

Le modèle montre que les tests A0B0C0 sont retrouvés chez des personnes plus jeunes que les tests A0B0C1 (Delta, la référence). Les tests A0B1C1 (cohérents avec le variant Kappa) sont eux très peu retrouvés dans le milieu hospitalier par rapport aux tests A0B0C1. Enfin, le test covti2 (qui correspond au test Tib Mol biol virsnip 452R+484K+484Q) semble détecter plus souvent les A0B0C0 et A0B1C1 que des tests A0B0C1 par rapport au test de référence (ID(TM) SARS-CoV-2 / VOC evolution Pentaplex). Enfin, les derniers effets signalent une augmentation au cours du temps de la proportion de tests A0B0C0 et A0B1C1 par rapport aux tests A0B0C1 dans la plupart des régions. À noter que les tests A1B0C0, cohérents avec des infections par les variants Beta ou Gamma, sont associés dans ces données à la région Grand-Est.

Avantages de transmission

L’augmentation du nombre de tests de criblage de type A0B0C0 peut être liée à une reprise de l’épidémie et il faut donc estimer s’il y a une hausse en proportion. Pour ce faire, on peut utiliser des techniques issues de la génétique des populations qui sont utilisées pour analyser la propagation d’un allèle mutant avantagé dans une population résidente. Sans rentrer dans les détails, si la proportion de mutant à une date \(t\) est \(p(t)\), alors, en supposant que l’aavantage sélectif \(s\) de ce mutant est constant au cours du temps est donné par la formule

\[\begin{equation} s = \frac{\text{d}}{\text{d} t} \text{log} \left( \frac{p(t)}{1-p(t)} \right) \end{equation}\]

En supposant donc une croissance logistique de \(p(t)\) dans nos données, on peut donc calculer la valeur de \(s\) à l’aide d’un modèle statistique. Pour plus de détails techniques, on peut se référer à l’article de Luis-Miguel Chevin de 2011 dans Biology Letters. À noter qu’il convient de calibrer cet avantage sélectif par le temps de génération (noté \(T\)) et, dans notre cas, supposé égal à l’intervalle sériel calculé par Nishiura et alii (2020, Int J Infect Dis).

En résumé, selon ce modèle d’évolution, en fittant nos données (la proportion journalière de tests A0B0C0), on peut donc estimer l’avantage de sélection du mutant, qui correspond dans notre cas à l’avantage de transmission. Avant de faire cela, il faut noter que ces proportions peuvent varier énormément. Nous réalisons donc un premier modèle linéaire généralisé avec une distribution binomiale qui nous permet de prévoir le type de test (A0B0C0 ou A0B0C1) en fonction de variables réponses clé, notamment le jour de l’année, l’âge de la personne testée, son département administratif de résidence et le kit utilisé pour le criblage.

Ile-de-France

Nous avons d’abord calculé cet avantage de transmission des tests A0B0C0 par rapport à A0B0C1 pour les 21 derniers jours, donc du 16 nov. 2021 et le 07 déc. 2021, en Ile-de-France uniquement car c’est une des région les plus échantillonnées dans les données analysées.

Les résultats indiquent un avantage de transmission significatif de l’ordre de 50 %. On aurait déjà actuellement un ratio de tests dépassant les 10 % dans cette région (attention, ceci ne prend en compte que les tests A0B0C0 et A0B0C1).

Afin de déterminer dans quelle mesure cet avantage de transmission est robuste dans le temps, nous avons répété la même analyse depuis début septembre, toujours avec des intervalles de 21 jours (effectuant ce qu’on appelle une “fenêtre glissante”).

On voit que l’avantage de transmission des tests A0B0C0 est assez récent puisqu’on ne le détecte que sur les 6 dernière fenêtres de 21 jours. On remarque aussi qu’au début septembre ces tests étaient contre-sélectionnés par rapport aux A0B0C1 ce qui suggère que les tests A0B0C0 reflétaient alors des lignées différentes (a priori en septembre on avait encore un peu de variant Alpha, qui a un R0 plus faible que le variant Delta).

On peut se demander ce qu’il en est des autres variants. Si on estime le même avantage de transmission en fenêtre glissante de 21 jours pour les tests A0B1C1, le résultat est très différent.

Ces tests A0B1C1, cohérents avec le variant kappa (on y reviendra) on eu un avantage de transmission au cours du mois de septembre, qui a d’ailleurs alerté nos équipes. Toutefois, depuis octobre leur augmentation en fréquence est non significative, et clairement différente des tests A0B0C0.

France

Nos précédentes analyses se sont limitées à une seule région. Analyser les différentes régions de concert est délicat car la correction effectuée avec le modèle linéaire généralisé doit alors se faire au niveau régional. Pour pallier à cela, nous avons utilisé une mise à jour du package EpiEstim qui permet de calculer de concert le nombre de reproduction temporel de l’épidémie et l’avantage de transmission d’un variant. Les détails sur la méthode sont disponible dans cette prébulication de l’équipe d’Anne Cori.

Comme dans le cas précédent, on considère les 21 derniers jours et on réalise d’abord un modèle linéaire généralisé pour chaque région afin de corriger des biais potentiels liés à l’âge des personnes, de leur département de résidence ou du kit de dépistage utilisé.

Ces estimations suggèrent que l’avantage de transmission des tests A0B0C0 au niveau national pourrait être plus élevé qu’en Ile-de-France.

Attention, ce jeu de données n’est pas idéal pour calculer des nombres de reproduction puisqu’il s’agit de tests de criblages, qui sont dont encore moins exhaustifs que des tests de dépistage, eux-mêmes bien moins robustes que les données hospitalières. En particulier, un délai de remontée des tests peut créer un ralentissement artificiel aux dates les plus récentes.

Pour estimer le nombre de reproduction, nous conseillons vivement l’utilisation de notre outil Rt2.

Nature des lignées

Afin d’en savoir plus quand à la nature des lignées dépistées par les différents résultats de criblage, le laboratoire CERBA a séquencé une partie des tests A0B1C1 (cohérents avec le variant Kappa) et les tests A0B0C0 du moins de novembre (cohérents en théorie avec les lignées ancestrales, le variant Alpha, le variant Omicron et la lignée B.1.640).

A0B1C1

De manière assez frappante, le séquençage a révélé que, dans ce jeu de données, les tests de criblage cohérents avec du variant Kappa correspondaient en fait majoritairement à des variants Delta ayant acquis une mutation en position 484 de la protéine de spicule (la mutation S:E484Q). Cette mutation est qualifiée d’intérêt puisque la position S:484 est mutée chez plusieurs variants (Beta, Gamma, Kappa et, maintenant, Omicron) et associée dans des expériences in vitro à de l’échappement immunitaire. De plus, une analyse plus fine a aussi révélé que ces séquences avaient aussi pour la plupart acquis une seconde mutation d’importante, la S:T95I, elle aussi associé à de l’échappement immunitaire.

Ceci peut être visualisé sur la phylogénie, où les feuilles en rouge correspondent aux personnes infections avec la mutations S:E484Q, les feuilles en bleu aux infections avec uniquement la mutation S:T95I et les feuilles en violet aux deux mutations.

Phylogénie d’infections causées par le variant Delta (échelle en années)

Les tests A0B1C1 correspondent aux feuilles rouges et violettes et on observe bien la présence de cluster violets traduisant l’association des deux mutations. Une version plus précoce de ces travaux a fait l’objet d’une prépublication avec plus de détails. Heureusement, comme indiqué ci-dessus, l’avantage de transmission de cette lignée détecté en août-septembre semble s’être éteint.

A0B0C0

Comme indiqué ci-dessus, ces tests de criblage peuvent correspondre à de nombreuses lignées. Afin de mieux cerner la diversité génétique, nous avons pu utiliser les résultats du séquençage de 150 tests A0B0C0 détectés depuis septembre.

Lignée virale associée à un test de criblage A0B0C0

Les résultats montrent d’abord que les résultats A0B0C0 peuvent parfois être associés à une infection causée par le variant Delta. On constate aussi que les variants Alpha sont rares, surtout depuis octobre. De plus, durant la première moitié du mois de novembre, les tests A0B0C0 semblaient majoritairement correspondre à des virus de la lignée B.1.640. Enfin, depuis les tests effectués fin-novembre, on distingue l’apparition d’infections causées par le variant Omicron.

  • On observe la propagation de lignées de variant Delta ayant acquis des mutations connues pour conférer de l’échappement immunitaire mais leur propagation ne semble pas supérieure à celle de Delta,

  • La mise à jour des tests de criblage pour détecter par exemple la délétion en position 69-70 de la protéine de spicule (présente dans une des deux lignées du variant Omicron et chez Alpha) ou la mutation K417N (présente dans les deux lignées d’Omicron) aidera à donner une image plus détaillée de l’épidémie en France.

Addendum

(En ajoutant les données jusqu’au 14 décembre )

Comme indiqué plus haut, il existe un délai entre la réalisation du test et sa saisie dans le système ce qui peut biaiser certaines analyses, notamment les calculs de nombre de reproduction (R). Pour les avantages de transmission, ce biais existe aussi mais est plus limité (si on suppose que tous les tests sont affectés de la même manière).

En utilisant une extraction un peu plus récente de la base de données, on peut effectuer une troncation plus réduite et regarder les tests jusqu’au 14 déc. 2021.

On voit que la présence des tests A0B0C0 est maintenant visible dans de nombreuses régions. (Attention, ce sont des chiffres bruts et donc potentiellement très biaisés en termes d’âge ou de contexte d’échantillonnage.)

Depuis le 21 novembre, l’avantage de transmission augmente en Ile-de-France quand on le calcule sur une fenêtre glissante de 21 jours (en corrigeant pour l’âge et le département, et en ignorant les tests réalisés en milieu hospitalier). Sur les deux dernières estimations, qui sont aussi les plus sensibles au délai de signalement, on dépasse les 100 % (ce qui serait cohérent avec une propagation deux fois plus rapide d’Omicron que de Delta).

Au niveau national, là encore avec toutes les précautions à prendre, cet avantage sélectif se retrouve avec les analyses EpiEstim avec une propagation environ 2 fois plus rapide des tests A0B0C0 (entre +87 et +107 %).

Si on représente la tendance sur les 21 derniers jours en France, donc du 23 nov. 2021 au 14 déc. 2021, on trouve que les tests A0B0C0 devraient dépasser les A0B0C1 (cohérents avec Delta) dans le courant de la semaine du 20 décembre, sachant que cela reflète l’état de l’épidémie de la semaine dernière.

Attention, ces dernières données sont potentiellement biaisées si, par exemple, les tests A0B0C0 remontent plus rapidement. Elles sont uniquement à prendre comme une indication que la situation décrite s’accélère.

De plus, on fait l’hypothèse que les temps de génération (estimés via les intervalles sériels) sont identiques entre Delta et Omicron mais si ce dernier se transmet plus tôt dans l’infection cela pourrait expliquer en partie cette tendance (et donc se traduire par une différence de \(R_t\) moins prononcée). Pour plus de détails techniques sur ce problème, voir cette récente prépublication de François Blanquart et alii.

Enfin, la mise en place des nouveaux tests de criblage permet de déterminer dans quelle mesure les résultats A0B0C0 correspondent à du variant Omicron. Les résultats sur les 491 premiers tests sont disponibles ci-dessous.

Résultat du second test de criblage sur les échantillons A0B0C0 Depuis la fin de novembre, on voit qu’une proportion croissante des tests A0B0C0 correspondent à des tests B0C0D1 donc cohérents avec une infection par le variant Omicron. Ces résultats correspondent aussi à ceux de séquençage. Dans des régions telles que l’Ile-de-France, les Hauts-de-France ou le Centre Val-de-Loire, les tests A0B0C0 sont donc maintenant une bonne indication de la proportion d’infections causées par le variant Omicron.

Conclusion (mises à jour)

Les données de criblage sont délicates à interpréter du fait de l’incertitude autour de la signification des tests sans aucune des mutations recherchées (A0B0C0). On peut toutefois conclure les éléments suivants :

  • On observe depuis la mi-novembre une augmentation en fréquence des tests A0B0C0 par rapport aux tests cohérents avec le variant Delta,

  • Au vu des analyses de séquençage, cette hausse des tests A0B0C0 semble avoir été causée au début par la lignée B.1.640 et, plus récemment, par le variant Omicron,

  • Dans certaines régions, les tests A0B0C0 semblaient quasiment uniquement causés par du variant Omicron au 13 décembre,

  • Dans des données moins robustes (avec un biais potentiel de signalement), l’avantage de transmission des tests A0B0C0 augmente nettement à partir de la semaine du 22 novembre pour atteindre des valeurs préliminaire de l’ordre de +100 %. Cette propagation deux fois plus rapide est cohérente avec les résultat des autres pays. Dans ce cas, ces tests, et donc a priori le variant Omicron, dépasseraient le variant Delta en fréquence dans les tests au cours de la semaine du 20 décembre.

Sources et remerciements

  • Nous remercions les patients, personnels de santé, les membres du laboratoire de virologie du CHU de Montpellier (Vincent Foulongne, Brigitte Montès, Edouard Tuaillon) et du laboratoire CERBA (Stéphanie Haim-Boukobza, Laura Verdurme, Bénédicte Roquebert) qui ont collecté et partagé les tests de SARS-COV-2 à la base de ce travail.

  • Les données de séquençage réalisées par le laboratoire CERBA et le laboratoire de virologie du CHU de Montpellier ont pu s’appuyer sur la coordination du réseau EMERGEN.

  • L’analyse phylogénétique a été réalisée grâce à la pipeline CovFlow, en cours de difussion et qui repose entre autres sur les outils de NextClade, IQTree et TreeTime.

  • L’équipe de modélisation de l’équipe ETE (dont plusieurs membres ne sont plus sur Montpellier) a compté parmi ses membres Samuel Alizon, Thomas Beneteau, Corentin Boennec, Marc Choisy, Gonché Danesh, Ramsès Djidjou-Demasse, Baptiste Elie, Alexander Massey, Yannis Michalakis, Claudia Ximena Restrepo Ortiz, Bastien Reyné, Quentin Richard, Christian Selinger et Mircea T. Sofonea.

  • Contribution à ce travail :

    • conception du travail : toute l’équipe

    • réalisation des analyses statistiques : SA et MTS

    • réalisation des analyses phylogénétiques : SA et GD

    • rédaction du rapport : SA, MTS, SHB, BR

    • contact :

  • Ce travail a été en partie soutenu par le financement PHYEPI de la Région Occitanie en juin 2020 (géré par l’ANR). L’équipe ETE n’a pas reçu d’autre financement à ce jour pour travailler sur l’épidémie les demandes aux différentes agences ayant été déclinées.

  • Licence Creative Commons
    Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.