Développé en 2003 par un jeune chercheur de Montpellier, le logiciel PhyML est capable de retracer toute la généalogie de n'importe quel ensemble d'organismes pourvus d'ADN. Il a permis de remonter aux origines du COVID-19 et pourrait aider à prévoir son évolution.
Savez-vous ce qu'est un arbre phylogénétique ? C'est une sorte d'arbre généalogique qui montre les liens de parentés entre différents groupes d'organismes. C'est exactement ce qu'est capable de réaliser PhyML, un logiciel développé par un jeune chercheur de Montpellier.
Très utilisé par les ingénieurs-techniciens d'Universités et les chercheurs en laboratoire du monde entier (la France est très minoritaire), il a déjà permis de remonter aux origines du COVID-19 et pourrait prévoir son évolution.
Conçu pour le suivi des épidémies virales
C'est lors de sa thèse, en 2003, que Stéphane Guindon, bio-informaticien et chercheur au CNRS au sein du Laboratoire d’informatique, de robotique et de microélectronique de Montpellier (Lirmm), a développé PhyML :
Le prinicpe mathématique sur lequel repose le logiciel existait déjà, mais on ne savait pas l'optimiser. Mes travaux de recherche se sont focalisés sur cette question.
A l'origine, le logiciel est conçu pour suivre les épidémies virales classiques, telles que la grippe saisonnière. Il s'utilise de deux manières :
- soit via le site internet du Lirmm, à partir duquel les chercheurs scannent leurs séquences d'ADN. Le serveur va alors les analyser et construire l'arbre phylogénétique du virus. Les utilisateurs n'ont plus ensuite qu'à récupérer les résultats.
- soit les chercheurs téléchargent le code source du logiciel, qui est en accès libre et collaboratif. Ils réalisent alors eux-mêmes leurs analyses.
Un logiciel montpelliérain gratuit
Dès les premières semaines de la pandémie de coronavirus, la méthode de l'arbre phylogénétique sur laquelle repose PhyML a connu un regain d'intérêt. Gratuit et accessible via la plateforme du Lirmm, le logiciel a rapidement démontré son utilité, comme l'explique Stéphane Guindon :
Dès le début du mois de mars, les premières analyses phylogénétiques nous ont indiqué que la taille de population du virus doublait tous les 5 à 7 jours.
Remonter aux origines de la pandémie
Des résultats rendus possibles par le séquençage d’ADN du SARS-CoV-2. Des séquences que PhyML a comparées à toutes celles contenues dans des bases de données existantes. Ces comparaisons ont démontré qu'il existait un lien de proximité fort avec un virus présent chez la chauve-souris et le pangolin. Un virus initial qui ne provoquerait pas de mortalité chez la chauve-souris, contrairement à l’Homme.
Des algorithmes au service de l'enquête scientifique
Le logiciel a également établi que le point de départ de l’épidémie a été un seul et unique cas de transfert animal-Homme, selon Stéphane Guindon :
S’il y avait eu plusieurs évènements, l’arbre phylogénétique du virus n’aurait pas la même forme : il présenterait plusieurs sous-arbres, chacun correspondant à un transfert d’une souche virale de l’animal à l’homme.
Prévoir l'évolution du COVID-19
La prochaine étape pourrait être de prédire comment va évoluer le virus dans le temps, à l'instar de ce qui se fait déjà pour les virus saisonniers de la grippe. PhyML contribuerait alors à la conception de vaccins efficaces.