CovidTracker est un site internet fréquenté par des dizaines de milliers de personnes tous les jours. Il permet de visualiser toutes les données disponibles liées à la pandémie de covid-19 en France sous la forme de graphiques actualisés chaque jour. Un succès sans précédent qui a débuté à Nancy.
À l’origine de CovidTacker, il y a Guillaume Rozier. Un jeune homme passionné par les données. Son truc à lui, ce sont toutes ces informations disponibles, dont on ne fait rien et qui pourtant devraient servir "avant de prendre une décision".
C’est bien sur son temps personnel, en plein premier confinement, qu’il a mis au point cet outil numérique. Au départ, il ne souhaitait le partager qu'avec quelques amis sur les réseaux sociaux. Mais très vite, ses graphiques sont repérés et utilisés par les rédactions, mais aussi par les hôpitaux. Les données chiffrées sont assez indigestes à utiliser.
Après quelques mois, son compte Twitter explose. Avec les derniers outils, dont il a doté son site récemment, il a franchi le cap des 15.000 abonnés. Ces dernières semaines, ses pages font des millions de vues. Le site est sans publicité et entièrement gratuit.
Jamais, je n'aurais imaginé avoir cinq ou 6.000 abonnés sur Twitter. À la fin du printemps, j’ai fait mes adieux. Et maintenant j’ai 15.000 abonnés.
Des outils, statistiques et numériques qui suscitent l’engouement
Ces dernières semaines, Guillaume Rozier a développé en plus des tableaux de bord pour chaque département et pour chaque région, quatre nouveaux outils grâce à ses algorithmes.CoviDep est un outil qui présente les départements ayant dépassé le nombre d’hospitalisations pour Covid-19 du pic de la première vague et ceux qui ne l'ont pas encore dépassé.
Le comparateur de vague permet de comparer la hauteur des deux différentes vagues épidémiques de Covid-19 : celle du printemps 2020, et celle de l’automne 2020. Trois variables sont comparées : les hospitalisations, les réanimations et les décès hospitaliers.
Le Calculateur de déconfinement permet de calculer la durée du confinement en fonction de la valeur du taux de reproduction du Coronavirus sur chaque semaine. Plus le taux de reproduction est élevé, plus le confinement devra durer longtemps.
Le calculateur de risques c’est celui qui a le plus de succès : "il permet d’estimer le risque qu’une personne soit positive dans un événement. Pour cela, on a besoin de deux informations : le taux d’incidence qui est le nombre de cas sur une semaine pour 100 000 habitants. Et la deuxième information est le nombre de personnes qui participent à l’événement. Le taux d’incidence est automatiquement rempli à partir du moment où on indique son département… " Guillaume Rozier insiste : "Ce n’est pas le risque d’attraper le virus qui est indiqué, mais le risque d’être en présence d’une personne positive… Il se peut que vous soyez en présence d’une personne positive, mais si tout le monde porte un masque et que les autres consignes sont respectées, il n’y a plus de risque".
Pendant ce temps, au Canada ils ont de beaux graphiques avec axes, titre et moyenne mobile ?@EmmanuelMacron @JeanCASTEX @olivierveran https://t.co/PkLT792Lkm
— GRZ - Guillaume Rozier CovidTracker (@GuillaumeRozier) November 20, 2020
Pendant le pic épidémique, il y avait 100 000 personnes connectées en simultané sur le site. En temps normal, ce sont plusieurs dizaines de milliers d’utilisateurs par jour.
Guillaume Rozier, un passionné des données avant tout
En temps normal, ce sont plusieurs dizaines de milliers d’utilisateurs par jour.
Pour Guillaume Rozier qui continue d’y travailler plusieurs heures par semaine en plus de son travail, c’est avant tout une passion. "Toute la chaîne de données m’intéresse, de la collecte de la donnée numérique jusqu’à la visualisation en bout de chaîne en passant par le traitement, et même le stockage. Les traitements peuvent être simples ou passer par des traitements complexes comme de l’intelligence artificielle, du machine learning. Ce n’est pas le cas de CovidTracker".
Aujourd’hui dans sa vie professionnelle Guillaume Rozier est "data Scientist" à Paris.
C’est dans une école d’ingénieur en Lorraine, Telecom Nancy qu’il a pris goût aux données : "Telecom Nancy m’a permis d’avoir les compétences pour mettre en place ses outils. Toute la partie traitement de données : comment faire des algorithmes pour télécharger des données, pour les transformer, pour générer des graphiques... De 2016 à 2020. Normalement, c’est trois ans. Moi, j’y suis resté quatre ans car j’ai passé un double diplôme".
Il s'est spécialisé dans la filière Big Data appliquée au domaine biomédical.
Exploiter les données est donc une évidence pour Guillaume Rozier. Mais il insiste : pas n’importe comment "en respectant toutes les règles d'anonymisation des données et la protection de la vie privée. C’est complètement possible dans le cadre".Je ne vois pas comment on peut prendre une décision sans données. Les données sont une mine d’or. Une donnée brute est inutile.
Il faut aussi les remettre en perspective dans leur contexte. Il raconte volontiers l’histoire d’un journaliste publiant une donnée brute sortie de son contexte. "Il a publié le chiffre brut du nombre de décès un lundi en plein déconfinement. Ce chiffre est toujours plus élevé le lundi pour différentes raisons, il contient aussi les chiffres du dimanche, etc. Alors qu’on était dans une période où ça ne faisait que baisser. Ce qu’il a écrit était vrai en valeur brute, mais faux, car la donnée n’est pas mise dans son contexte. S’il avait fait un graphique, en deux secondes, il aurait vu la réalité des choses".
Les données sont toutes vérifiables
Guillaume Rozier "ne fait que" récupérer des données existantes. Tous les jours, Santé Publique France publie les chiffres liés à la pandémie. L’INSEE et d’autres sources lui donnent le nombre de lits disponibles et le nombre de lits occupés. Grâce aux algorithmes qu’il a développés, tous ces chiffres ce déversement quotidien dans son ordinateur qui les digère et les rend visibles sous forme de graphiques. Il a l’idée de croiser certaines de ces données, par exemple les lits occupés et les lits disponibles et par ce simple rapprochement des chiffres, il met en évidence les informations essentielles pour comprendre les différentes situations. Il lui est même arrivé de signaler à sa source des inversions de colonnes sur sa publication, car le graphique qui apparaissait était totalement improbable.Je fais des choix quand je fais un graphique. Je fais des choix de couleur, de forme, de taille.
? Et voici CoviDep !
— GRZ - Guillaume Rozier CovidTracker (@GuillaumeRozier) November 9, 2020
Cet outil vous permet de voir en un coup d’œil les départements ayant dépassé leur première vague, et de comparer la situation actuelle au printemps dernier.
Données Santé publique France. Mises à jour en permanence.
C’est ici ➡️https://t.co/IYHZDo87YJ pic.twitter.com/hGawBun7WQ
"Je fais des choix quand je fais un graphique. Je fais des choix de couleur, de forme, de taille. Le simple fait de changer d’échelle peut influer sur la perception de choses".
En disant ces mots, Guillaume Rozier a conscience que ses outils sont désormais utilisés par beaucoup de professionnels. Avec ses graphiques et ses time-lapses, il rend visible cette pandémie. Il sait que ce ne sont que des outils et rien d’autre. Il reçoit de nombreux messages de soutien et d’encouragement et cela suffit à son bonheur.