Une rumeur coure sur le net : La somme des données régionales de la DREES seraient différentes des données nationales : Je prpose ici un Notebook qui débunke cette rumeur.
Les données proviennent de :
import pandas as pd
import numpy as np
# Choix entre nb_PCR ,nb_PCR_sympt ,nb_PCR+ ,nb_PCR+_sympt ,HC ,HC_PCR+ ,SC ,SC_PCR+
STAT_COL='HC_PCR+' # Soin critique PCR+
region_df = pd.read_csv("region.csv", sep=";", parse_dates=["date"])
# Pivot sur le statut vaccinal
region_pivot = region_df.pivot(index=["date", "region"], columns='vac_statut', values=STAT_COL)
# Somme de toutes les regions
region_sum=region_pivot.groupby(level=0).sum()
# Affichage des données
region_sum.plot(figsize=(10, 5), title="Données régionales sommées")
<AxesSubplot:title={'center':'Données régionales sommées'}, xlabel='date'>
# Changement des données nationales
nation_df = pd.read_csv("national.csv", sep=";", parse_dates=["date"])
nation_pivot = nation_df.pivot(index=["date"], columns='vac_statut', values=STAT_COL).fillna(0)
# Affichage des données
nation_pivot.plot(figsize=(10, 5), title="Donnée nationales brutes")
<AxesSubplot:title={'center':'Donnée nationales brutes'}, xlabel='date'>
On voit que les données nationales sont plus fines : les "vaccinés complet" sont séparés en 6 sous groupes, qu'il convient de sommer.
On rajoute une colonne "Complet" somme des sous groupes
# Liste des 6 colonnes Complet ...
cols_complet = [col for col in nation_pivot.columns if 'Complet' in col]
# On crée une colonne "Complet" somme des 6 autres
nation_pivot["Complet"] = sum(nation_pivot[col] for col in cols_complet)
On retrouve bien les mêmes chiffres que la somme des données régionales
# Chiffres nationaux
nation_pivot.plot(y=["Non-vaccinés", "Primo dose efficace", "Primo dose récente", "Complet"], figsize=(10, 5), title="chiffres nationaux")
<AxesSubplot:title={'center':'chiffres nationaux'}, xlabel='date'>
# Chiffres nationaux
region_sum.plot(figsize=(10, 5), title="données régionales sommées")
<AxesSubplot:title={'center':'données régionales sommées'}, xlabel='date'>