Résumé

En résumé, pour 2013 patients testés avec la RT-PCR SARS-CoV-2 ThermoFisher entre le 04 janvier 2021 et le 22 janvier 2021 majoritairement dans la région Ile-de-France, on trouve 1631 infections (soit 81 %). Parmi celles-ci, on détecte une nette augmentation de la proportion de tests ayant ont un signal cohérent avec une présence potentielle du variant of concern (VOC), c’est-à-dire une absence de signal uniquement pour la cible dans le gène S : on passe d’environ 5.2 % la première semaine de janvier à 15.4 % vers le 3e semaine. On détecte aussi un Ct plus faible pour les tests RT-PCR potentiellement associés avec le VOC ce qui pourrait suggérer une charge virale plus élevée. En revanche, on ne détecte pas d’effet de l’âge des patients sur le Ct ou le signal VOC.

Ces résultats sont à prendre avec beaucoup de précaution du fait de biais potentiels d’échantillonnage (seul l’âge des patients est ici connu et la plupart des patients sont positifs).

De plus, même si l’augmentation de la fréquence des tests positifs avec une cible S négative est frappante, seul un séquençage permettrait de s’assurer qu’il s’agit bien du VOC.

Échantillons

La collecte des échantillons n’est pas uniforme au cours du temps. La couleur indique la positivité du test (co19sn ou co19sp), donc une infection par le SARS-CoV-2. On voit que la majorité des tests sont positifs pour le SARS-CoV-2. Les valeurs manquantes (NA dans le graphique) correspondent aux labels (co19si et et négatif).

Effet sur les Ct

Plus il y a de matériel viral ciblé dans un échantillon, plus la RT-PCR détecte du signal en faisant peu de “cycles” (on parle de Ct). Comparons les Ct des tests RT-PCR pour les différents gènes pour les RT-PCR négatives pour celles potentiellement associées au VOC (le gène S ciblé par la PCR sort négatif, en bleu) ou celles positives pour toutes les cibles de la RT-PCR (en rouge). Les NA correspondent aux labels (co19si, inhib et négatif).

Si on fait un test statistique, on constate que, parmi les positifs, le VOC est plutôt associé à des Ct plus faibles (pour les gènes autres que S évidemment). Donc cela pourrait suggérer une charge virale plus élevée.

## 
## Call:
## lm(formula = as.numeric(value) ~ as.factor(variable) + as.factor(VOC) + 
##     as.numeric(DTNAI), data = subset(data, (replicat == 1) & 
##     (resultat == 1) & (value > 0) & (!is.na(semaine)) & (!(variable == 
##     "gene_S"))))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -24.9852  -3.1185  -0.4506   3.1612  16.3493 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                    6.407690   6.309230   1.016 0.309877    
## as.factor(variable)gene_N     -5.186780   0.196823 -26.353  < 2e-16 ***
## as.factor(variable)gene_ORF1A -5.512597   0.199029 -27.697  < 2e-16 ***
## as.factor(VOC)1               -0.545403   0.260122  -2.097 0.036079 *  
## as.numeric(DTNAI)              0.011599   0.003198   3.626 0.000291 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.035 on 4131 degrees of freedom
##   (14 observations deleted due to missingness)
## Multiple R-squared:  0.1873, Adjusted R-squared:  0.1866 
## F-statistic: 238.1 on 4 and 4131 DF,  p-value: < 2.2e-16

Variations du VOC

Parmi les tests RT-PCR positifs, on peut maintenant regarder, par semaine, la proportion qui ont une des trois cibles, le gène S, négative (en rouge, co19sn) ou celles qui ont toutes les trois cibles positives (en bleu, co19sp).

La proportion de tests RT-PCR ThermoFisher positifs avec un gène S négatif (indicateur potentiel du VOC) semble donc avoir augmenté au cours du mois de janvier dans l’échantillon considéré. Attention, seul un séquençage du génome ou une PCR spécifique permettrait d’être sûr.

Un rapide test de comparaison de proportions (avec correction de Bonferroni) trouve que les différences entre les semaines sont statistiquement significatives.

## 
##  Pairwise comparisons using Pairwise comparison of proportions 
## 
## data:  tableau_semaines[, 2] out of tableau_semaines[, 2] + tableau_semaines[, 3] 
## 
##   1      2     
## 2 0.0008 -     
## 3 <2e-16 0.0012
## 
## P value adjustment method: bonferroni

Pas d’effet âge

On peut aussi regarder la proportion des des tests potentiellement associés au variant en fonction de l’âge.

Un test statistique hâtif confirme l’absence de tendance d’augmentation de la proportion de signal potentiel pour le VOC avec l’âge des patients. Cela tranche avec les données du Royaume-Uni mais peut aussi facilement s’expliquer par la faible taille de l’échantillon.

## 
## Call:
## glm(formula = as.numeric(VOC) ~ as.numeric(DTNAI) + as.numeric(semaine), 
##     family = "binomial", data = subset(data, (replicat == 1) & 
##         (resultat == 1) & (!is.na(semaine))))
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -0.6019  -0.5786  -0.3371  -0.3260   2.4449  
## 
## Coefficients:
##                      Estimate Std. Error z value Pr(>|z|)    
## (Intercept)         -0.888465   3.444191  -0.258    0.796    
## as.numeric(DTNAI)   -0.001320   0.001747  -0.756    0.450    
## as.numeric(semaine)  0.602062   0.048889  12.315   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 4135.5  on 6199  degrees of freedom
## Residual deviance: 3964.7  on 6197  degrees of freedom
##   (20 observations deleted due to missingness)
## AIC: 3970.7
## 
## Number of Fisher Scoring iterations: 5

Sources et remerciements

  • Les données utilisées ont été générées et partagées par le laboratoire CERBA.

  • L’équipe de modélisation de l’équipe ETE est composée de Samuel Alizon, Thomas Bénéteau, Corentin Boennec, Marc Choisy, Gonché Danesh, Ramsès Djidjou-Demasse, Baptiste Elie, Yannis Michalakis, Bastien Reyné, Quentin Richard, Christian Selinger, Mircea T. Sofonea.

  • Contribution à ce travail :

    • réalisation des analyses et rédaction du rapport : SA

    • merci à BR pour le test de proportions et à toute l’équipe du laboratoire CERBA et Stéphanie Haim-Boukobza pour le partage des données et les discussions.

    • contact :

  • Ce travail a été aidé par la région Occitanie et l’ANR au travers du projet PHYEPI et par le soutien du CNRS, de l’IRD et de l’UM.

  • Licence Creative Commons
    Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.