Statut vaccinal des personnes hospitalisées

Paru le 10/02/2022

Questions/réponses sur les appariements SI-VIC, SI-DEP et VAC-SI

 

Depuis août 2021, la DREES met régulièrement en ligne sur son site :

  • Les statistiques sur le statut vaccinal (vaccinés/non vaccinés) des personnes testées, entrées en hospitalisation conventionnelle, entrées en soins critiques et décédées (fichiers Open Data) ;
  • Une note détaillée qui présente les principales conclusions tirées de ces exploitations ;
  • Un communiqué de presse (synthèse) avec les liens vers les jeux de données nationales, régionales, et par âge.

Le calendrier des autres publications de la DREES est accessible en ligne.

PRODUCTION DES DONNEES

Dans le cadre de sa mission d’appui à la gestion de la crise sanitaire, la DREES exploite les données pseudonymisées issues des 3 principales bases de données sur la crise Covid-19 :

-    SI-VIC, base de données sur les hospitalisations conventionnelles ou en soins critiques (réanimation, soins intensifs et soins continus) de patients hospitalisés pour ou positifs au test Covid-19,
-    SI-DEP, base de données sur les résultats des tests Covid-19 (les auto-tests ne sont pas pris en compte dans SI-DEP),
-    VAC-SI, base de données sur les vaccinations Covid-19.

L’appariement (croisement) de ces bases permet notamment d’identifier la part de patients hospitalisés qui sont vaccinés et/ou porteurs d’un variant.

Dans chacune des 3 bases de données utilisées, lors de leur constitution et avant transmission à la DREES, le nom patronymique, premier prénom, sexe et date de naissance des personnes hospitalisées, testées ou vaccinées sont utilisés afin de constituer un pseudonyme, c’est-à-dire une chaîne de caractères non signifiante identifiant de façon unique chaque personne.
Ces informations nominatives sont ensuite supprimées des bases avant transmission à la DREES pour exploitation statistique. Seul le pseudonyme est transmis.
Pour que l’appariement sur ce pseudonyme entre tests, hospitalisations et vaccinations soit possible, il faut que les données identifiantes renseignées dans chacune des bases et utilisées en entrée de l’algorithme soient identiques.

Au-delà des statistiques descriptives des tests positifs et des taux d’entrées hospitalières à taille de population comparable, l’élaboration d’une régression sur les données agrégées depuis la fin du mois de mai 2021 permet d’estimer les effets spécifiques de la vaccination sur le risque de forme symptomatique ou d’entrée à l’hôpital selon les différents statuts. Cette modélisation conduit à estimer la réduction de risque d’infection ou d’hospitalisation qu’apporte chaque statut vaccinal (une dose récente ou efficace, vaccination complète depuis moins de 3 mois, 3 à 6 mois, plus de 6 mois sans rappel ou rappel après plus de 6 mois) par rapport à l’absence de vaccin.
Les coefficients estimés ne montrent pas directement un risque d’infection ou d’hospitalisation, mais un risque relatif ou ratio de risque entre les modalités, en général en référence au risque des non-vaccinés.
La description mathématique du modèle est consultable dans la note détaillée publiée à intervalles réguliers (annexe en fin de note).

Pour pouvoir attribuer à chaque observation de test (SI-DEP) ou d’événement hospitalier (SI-VIC) le statut vaccinal du patient correspondant, il est nécessaire de retrouver dans la base VAC-SI le pseudonyme correspondant à celui du patient concerné dans la base SI-DEP ou SI-VIC. Dans une fraction des cas, ce pseudonyme n’est pas retrouvé (pour diverses raisons comme par exemple des différences de nom ou de prénom employés dans les informations identifiantes servant à la génération du pseudonyme). Malgré ces défauts d’appariement avec la base VAC-SI (qui ne concernent qu’une minorité des observations), il est utile que le volume total des tests ou des événements hospitaliers selon le statut vaccinal corresponde à celui qui est établi et diffusé par ailleurs à partir des seules bases SI-DEP ou SI-VIC. Pour assurer cette cohérence, les nombres d’observations appariées sont pondérés (par des poids non entiers supérieurs à 1) par strate (d’âge, de date, de région), ce qui conduit à ce que les effectifs publiés en open data de nombre de tests, d’entrées hospitalières ou de décès soient aussi décimaux.

Exemple : Sur 100 personnes hospitalisées, on ne connait le statut vaccinal de de 90 d’entre-elles : 85 sont vaccinées, 5 ne le sont pas et pour les 10 restantes l’information n’a pu être retrouvée. Dans ce cas, on fait l’hypothèse que pour ces 10 personnes la répartition entre vaccinées et non-vaccinées est identique à celle que l’on observe parmi les personnes pour lesquelles l’information a été retrouvée, soit 10*85/90 = 9,44 vaccinés et 10*5/90=0,56 vaccinés. Au total, parmi ces 100 personnes il y aurait 85+9,44=94,44 vaccinés et 5+0,56=5,56 vaccinés.

Ce décalage dans le temps correspond au temps nécessaire :

  1. pour que les données soient saisies par les différents opérateurs concernés dans les bases de données permettant le suivi de la crise (établissements de santé pour SI-VIC en particulier). Compte-tenu de la charge d’activité de ces opérateurs, très sollicités dans le contexte de crise sanitaire, cette saisie peut être faite avec quelques jours de décalage ;
  2. pour qu’elles soient ensuite transmises à notre équipe de statisticiens et que ceux-ci procèdent à l'appariement des 3 bases de données (c’est-à-dire au croisement des bases SI-VIC, qui comporte les données sur les hospitalisations, SI-DEP sur le dépistage et VAC-SI sur la vaccination) ;
  3. La DREES procède ensuite au traitement des données (statistiques descriptives et modélisation permettant d’estimer l’effet des différents statuts vaccinaux sur la réduction du risque de formes symptomatiques ou graves de Covid), à la rédaction d’une synthèse avec les principales conclusions et à la préparation des données pour la diffusion en open data.

La progression rapide de l’épidémie a fait apparaître de nouveaux besoins en termes de production et analyse de données, afin de documenter la situation sanitaire et d’éclairer la décision publique.
Les choix méthodologiques effectués pour produire ces données dépendent en grande partie de l’information disponible, qui est aujourd’hui bien plus large que lors des premières publications. Ces nouvelles ressources, conjuguées au processus naturel d’affinement des statistiques (permis par un temps d’investigation et de déploiement d’améliorations méthodologiques), ont conduit à procéder à certains ajustements de la méthode d’élaboration des statistiques issues des bases appariées, dans le but de rendre les résultats les plus robustes possibles au regard de l’information disponible à un moment donné.
Les ajustements opérés sont systématiquement expliqués dans les annexes méthodologiques publiés à la fin des notes et la DREES communique les résultats AVANT et APRES changement méthodologique, pour permettre aux lecteurs de mesurer l’impact des évolutions. Cette double publication s’inscrit dans le cadre de son engagement déontologique et du code de bonnes pratiques de la statistique européenne.

date

Jour du prélèvement (tests), de l'admission (hospitalisations) ou du décès

vac_statut

Statut vaccinal le jour du test, de l'admission ou du décès (afin de tenir compte des délais d'incubation)

age

Catégorie d'âge vingtennales

region

Région de résidence

nb_PCR

Nombre de tests PCR prélevés

nb_PCR_sympt

Nombre de tests PCR prélevés où le patient est déclaré symptomatique

nb_PCR+ 

Nombre de tests PCR positifs prélevés

nb_PCR+_sympt 

Nombre de tests PCR positifs prélevés où le patient est déclaré symptomatique

HC

Nombre d’entrées de patients en hospitalisation complète

HC_PCR+ 

Nombre d’entrées de patients en hospitalisation complète pour lesquelles un  test PCR positif a été identifié

SC 

Nombre d’entrées de patients en soins critiques (qui regroupent les services de réanimation, soins intensifs et soins continus).          

SC_PCR+

Nombre d’entrées de patients en soins critiques pour lesquelles un  test PCR positif a été identifié

DC 

Nombre de décès de patients hospitalisés

DC_PCR+ 

Nombre de décès de patients hospitalisés pour lesquelles un  test PCR positif a été identifié

pourcent_parmi_vaccines

Proportion (en %) parmi les vaccinés avec au moins une dose par date.

PCR+_pourcent_omicron

Pourcentage de tests positifs criblés dont une mutation liée à Omicron a été détectée

PCR+_sympt_pourcent_omicron

Pourcentage de tests positif criblés avec symptôme dont une mutation liée à Omicron a été détectée

HC_pourcent_omicron

Pourcentage du nombre d'entrées de patients en hospitalisation conventionnelle pour lesquels un test PCR positif a été identifié avec une mutation liée à Omicron

SC_pourcent_omicron

Pourcentage du nombre d'entrées de patients en soins critiques pour lesquelles un test PCR positif a été identifié avec une mutation liée à Omicron

DC_pourcent_omicron

Pourcentage du nombre de décès pour lesquels un test PCR positif a été identifié avec une mutation liée à Omicron

PERIMETRE DES DONNEES

Les données que nous publions portent sur les personnes admises à l’hôpital et testées positives au Covid, quel que soit leur statut vaccinal. Les personnes hospitalisées pour d’autres raisons que le Covid mais qui ont été testées positives sont donc également comptabilisées.

Actuellement, la DREES modélise la protection apportée par la vaccination pour les adultes de 20 ans ou plus. C’est sur cette partie de la population que ces estimations sont les plus pertinentes.

La population des moins de 20 ans étant très spécifique au regard du statut vaccinal (les plus jeunes enfants étant majoritairement non vaccinés tandis que les adolescents et jeunes majeurs le sont largement), les raisonnements selon le statut vaccinal pour cette tranche d’âge peuvent conduire à des erreurs d’interprétation (attribution au statut vaccinal de phénomènes qui en réalité proviennent de différences d’âge). Toutefois, afin de répondre à tous les besoins et utilisations possibles, les données concernant les moins de 20 ans sont disponibles en open data sur le site de la Drees comme celles des autres tranches d’âge vingtennales.

Les données de la DREES concernent les admissions en hospitalisation conventionnelle et les entrées en soins critiques (services de réanimation + soins intensifs + surveillance continue), et proviennent de la base de données SI-VIC. Ces estimations portent sur un flux d’entrants (admissions) sur une période donnée, non sur le nombre de places occupées à un moment T.

Chaque personne n’est comptée qu’une seule fois par type d’hospitalisation : par exemple une personne entrant en hospitalisation conventionnelle, puis en soins critiques et de nouveau en hospitalisation conventionnelle comptera une fois dans les entrées en hospitalisation conventionnelle et une fois dans les entrées en soins critiques.

Les décès dénombrés de patient positifs Covid-19 sont ceux survenus à l’hôpital, enregistrés dans la base de données SI-VIC (y compris dans d’autres services que ceux d’hospitalisation conventionnelle et de soins critiques, que le Covid-19 soit le motif d’hospitalisation ou non).

Concernant les tests, les données communiquées chaque semaine par la DREES sont en date de prélèvement, comme le fait Santé publique France, mais les exploitations de SI-DEP ne portent que sur les tests RT-PCR (et donc excluent notamment les tests antigéniques qui représentent actuellement la majorité des tests utilisés), afin de pouvoir disposer d’une information sur le type de variant (seuls les tests RT-PCR sont criblés). De plus, les tests successifs pour un même patient ne sont pas dédoublonnés (sauf lorsque 2 tests ont lieu une même journée), contrairement à ce que produit Santé publique France.

Les événements hospitaliers sont eux comptabilisés en date de survenue, tandis que la plupart des publications de statistiques issues des données de SI-VIC publiées par Santé publique France sont en date d’enregistrement.

Enfin, d’autres différences existent dans les choix méthodologiques pour l’élaboration des données sur les effectifs, les événements enregistrés et la couverture vaccinale de la population entre Santé publique France et la Drees. En particulier, la date de prise en compte de la population de référence, le traitement des décès survenant depuis le 1er janvier 2021  ou certains filtres sur les tests et les hospitalisations (par exemple lorsque l’âge n’est pas disponible dans les observations, voir annexe Définitions et méthodes en fin de chaque publication hebdomadaire).

 

VENTILATION PAR VARIANT

La présomption de variant Omicron ou Delta est établie à partir des résultats de criblage des tests RT-PCR positifs. Le criblage conduit à fournir une information codée sur 4 positions : A, B, C, D, renseignant sur le type de mutations identifiées :

  • A correspond à la mutation indicatrice notamment des variants Beta et Gamma,
  • B à la mutation indicatrice notamment du variant Kappa,
  • C à la mutation indicatrice notamment du variant Delta,
  • D aux mutations indicatrices notamment du variant Omicron.

Pour chaque position, les codages possibles sont :

  • 0 : absence
  • 1 : présence
  • 8 : ininterprétable
  • 9 : non recherché

La détection du variant Omicron peut être indiquée par le codage D1. Mais cette quatrième position n’a été introduite dans le dispositif de remontée des résultats de criblage que début décembre 2021 et moins de 40 % des tests criblés début 2022 contiennent une information exploitable pour ces mutations D. Par ailleurs, depuis juillet et jusqu’à début décembre 2021, le variant Delta étant largement majoritaire, l’essentiel des criblages durant cette période portent la mutation C. En revanche, le variant Omicron ne comporte aucune des trois mutations A, B, C. Si bien qu’en l’absence d’information exhaustive issue du criblage sur la mutation D et après une quatrième vague essentiellement portée par le variant Delta codé en C1, un indicateur raisonnable pour déceler les tests relevant possiblement d’un variant Omicron provient des codages indiquant l’absence de mutations A, B et C. Au final, on définit le « proxy Omicron » comme les tests criblés dont le résultat est du type A0BxC0 (pour une nomenclature en 3 lettres) ou A0BxC0D[189] (pour une nomenclature en 4 lettres) ou AxBxCxD1 . Par ailleurs tous les autres tests sont considérés comme relevant du « proxy Delta » car les autres variants circulant en France en décembre 2021 sont très minoritaires. Ces choix sont par ailleurs confirmés par les résultats de séquençage exploités par Santé publique France, qui permettent d’établir de façon certaine le lignage du virus identifié dans les prélèvements. Une part importante des tests RT-PCR positifs étant criblés, les proportions de tests criblés relevant du proxy Omicron ou du proxy Delta sont supposées être similaires pour l’ensemble des tests RT-PCR positifs (qu’ils soient criblés ou non)

 

Pour toute question complémentaire : DREES-INFOS@sante.gouv.fr
Contact presse (pour les journalistes uniquement) : DREES-PRESSE@sante.gouv.fr