banner societe 2016
mercredi, 04 mars 2020 10:49

Le génotypage avec SHAPEIT4

Écrit par

C’est le nom de l’algorithme super puissant de nouvelle génération mis au point en Suisse par des chercheurs des Universités de Genève et de Lausanne, ainsi que du SIB, pour faciliter l’interprétation des Big Data du génome qui ne cessent de prendre de l’ampleur. Cet outil devrait se révéler très utile pour l’étude de la génétique des populations et pour la médecine de précision.

Comme l’ont expliqué les chercheurs, en décembre 2019, SHAPEIT4 va permettre de mieux comprendre le rôle des haplotypes. Ceux-ci constituent un ensemble de variations génétiques. Situés côte à côte sur un même chromosome, ils sont transmis en un seul groupe à la génération suivante. Leur examen permet de comprendre l’héritabilité de certains traits complexes, comme par exemple le risque de développer plus tard une maladie. Cependant, pour effectuer cette analyse, il faut généralement disposer du génome des membres d’une même famille (parents et enfants), un procédé long et cher.

Pour contourner ce problème, des chercheurs de l’UNIGE, de l’UNIL et du SIB (Institut suisse de bioinformatique) ont mis au point SHAPEIT4, un puissant algorithme informatique permettant d’identifier très rapidement les haplotypes de centaines de milliers d’individus sans lien familiaux, avec un résultat aussi fin que dans le cadre d’analyses familiales impossibles à mener à si large échelle. Leur outil d’analyse (mais pas les corpus de données) est mis à la disposition de la communauté internationale des chercheurs, sous licence open source.

Étudier le destin génétique de l’humanité

À l’heure actuelle, l’analyse des données génétiques prend de plus en plus d’importance, notamment dans le champ de la médecine personnalisée. Preuve en est: le nombre de génomes humains séquencé chaque année croît de manière exponentielle et les grandes bases de données comptent maintenant près d’un million d’individus. Cette masse de données est d’une extrême richesse pour mieux comprendre le destin génétique de l’humanité, qu’il s’agisse de déterminer le poids génétique dans telle ou telle maladie ou de mieux comprendre l’histoire des migrations humaines.

Pour faire sens, cependant, ces données de masse doivent être traitées informatiquement. «Or la puissance de calcul des ordinateurs reste relativement stable, contrairement à la croissance ultra-rapide des Big Data du génome», souligne Olivier Delaneau, professeur à la Faculté de biologie et de médecine de l’UNIL. C’est lui qui a dirigé les travaux. «Notre algorithme vise ainsi à optimiser le traitement des données génétiques, de façon à pouvoir absorber cette quantité d’information et les rendre exploitables par les scientifiques.»

En médecine de précision, comprendre le rôle des haplotypes se révèle particulièrement crucial. Pour déterminer le risque génétique de maladie, par exemple, les scientifiques évaluent si une variation génétique est plus ou moins présente chez les individus ayant développé cette maladie, afin de déterminer le rôle de cette variation dans la maladie étudiée. «En connaissant les haplotypes, nous conduisons le même type d’analyse, souligne Emmanouil Dermitzakis, professeur à la Faculté de médecine de l’UNIGE. Par contre, nous passons d’un seul variant à une combinaison de nombreux variants, ce qui permet de déterminer quelles combinaisons alléliques 〈combinaisons génétiques reçues en héritage〉 sur un même chromosome ont le plus d’impact sur le risque de maladie. C’est beaucoup plus précis!»

La méthode développée par les chercheurs permet de traiter un nombre de génomes extrêmement important, de l’ordre de 500’000 à 1’000’000 d’individus, et de déterminer leurs haplotypes sans connaître leur ascendance ni leur descendance, tout en utilisant une puissance de calcul standard. L’outil SHAPEIT4 a été testé avec succès sur les 500’000 génomes individuels que compte la UK Biobank, une banque de données scientifiques développée au Royaume-Uni.

Autre avantage, et pas des moindres par les temps qui courent, SHAPEIT4 se révèle beaucoup plus efficace que ses prédécesseurs, plus rapide et moins cher: il permet donc de limiter l’impact environnemental numérique.

Lu 242 fois