Aller au contenu principal
Please wait...
BioSample microscope

La bioinformatique pour lutter contre la pandémie de Covid-19

Si les scientifiques ont pu comprendre le fonctionnement du SARS-CoV-2, l’identifier et comprendre sa propagation, c'est en grande partie grâce à la bio-informatique ou biologie computationnelle. Comme l’explique Hélène Touzet, du Centre de recherche en informatique, signal et automatique de Lille, « la pandémie de COVID-19 a été un véritable test grandeur nature pour la bio-informatique. Elle a révélé combien les outils que nous développons sont désormais essentiels pour analyser les données et accélérer la recherche sur le virus ». La bio-informatique est une combinaison d'informatique, de mathématiques, de biologie et de physique. Cette discipline récente fournit des modèles de calcul, des algorithmes et autres logiciels pour traiter un grand nombre de données biologiques et y découvrir des informations clés.

« La pandémie de COVID-19 a été un véritable test grandeur nature pour la bio-informatique.

 

À quoi sert la bio-informatique ?

La bio-informatique a prouvé son utilité dès le début de l’épidémie. En effet, après la détection en décembre 2019 des premiers malades infectés par le virus, les scientifiques chinois se sont lancés dans le séquençage du génome de ce nouveau virus à partir d'échantillons prélevés chez les patients. C’est grâce à des algorithmes de bio-informatique que les biologistes ont pu établir la séquence complète.

La bio-informatique est également utile pour rendre lisible les données obtenues par séquençage. En effet, les données brutes sont composées de millions de petites séquences partielles, de centaines de nucléotides et d’origines multiples.

Afin de rendre plus lisible le séquençage, un premier algorithme compare tous les fragments à ceux présents dans une  base de données recensant tous les génomes du monde vivant connus à ce jour. Un second algorithme est ensuite utilisé. Celui-ci remet tous les morceaux bout à bout dans le bon ordre.

 

Comment la bio-informatique a-t-elle fait avancer l’étude du génome du SARS-CoV-2 ?

On comprend alors pourquoi et comment le génome du SARS-CoV-2 a pu être révélé en seulement douze jours. Hélène Touzet explique que « cette rapidité s'explique à la fois par les progrès réalisés ces dix dernières années sur les algorithmes, mais aussi par l'accès en open source des logiciels et le partage des données génomiques à l'échelle mondiale. Cette tendance avait débuté dans les années 2010 avec l'épidémie d'Ebola notamment, mais elle est devenue la norme avec la COVID-19 ».

L'analyse comparative des génomes par des algorithmes a permis de fournir aux scientifiques un premier aperçu de la biologie du virus. « Par analogie avec les autres virus dont on a déjà dressé le portrait-robot en laboratoire, nous avons pu identifier les séquences du génome codant pour des protéines, déterminer précisément quelles sont ces protéines, acide aminé par acide aminé, et ainsi pointer du doigt les points communs et les différences avec les protéines des autres virus », explique Hélène Touzet.

Ainsi, les biologistes ont pu découvrir les principales protéines nécessaires au fonctionnement du virus. Comme tous les virus, SARS-CoV-2 a besoin d’une cellule hôte pour se multiplier et se propager. Aussi, grâce à la bio-informatique, les biologistes ont pu identifier la protéine Spike, qui assure la reconnaissance des récepteurs cellulaires avant de pénétrer dans son hôte.


La bio-informatique a également d’autres intérêts. En effet, les données génomiques permettent aussi de retracer l'histoire de la propagation de l'épidémie. Samuel Alizon, directeur de recherche CNRS au laboratoire Maladies infectieuses, explique notamment que « l'accumulation régulière de mutations, au cours des infections, dans les génomes des virus – une à deux par mois en moyenne – peut être utilisée comme une ''horloge moléculaire'' : si des personnes sont infectées par des virus qui se ressemblent, cela signifie qu'elles sont proches dans la chaîne de transmission. Ainsi, en comparant les génomes des virus de patients infectés, et en utilisant les informations sur la date et le lieu d'échantillonnage, on peut retracer l'évolution de l'épidémie au cours du temps et de l'espace ».

 

Source : Journal du CNRS

Étiquettes