Vers le pangénome humain, la carte la plus complète des gènes et des variantes est prête.

L'objectif du pangénome humain , la construction d' un « atlas » complet des gènes humains et de toutes leurs variantes possibles , se rapproche. Vingt-deux ans après l'achèvement du Projet Génome Humain, qui a produit en 2003 la première séquence du génome humain à partir de l'ADN d'une poignée de personnes, et dix ans après le Projet 1000 Génomes, qui a séquencé en 2015 le code génétique de plus de 2 500 individus, deux études publiées dans la revue Nature annoncent aujourd'hui des résultats capables d'offrir « l'aperçu le plus complet du génome humain » disponible à ce jour. Les auteurs qualifient ces données de « véritable trésor » et sont le fruit de la relecture de plus de 1 000 échantillons d'ADN du Projet 1000 Génomes, rendue possible grâce aux technologies de séquençage développées ces dernières années. Le Laboratoire européen de biologie moléculaire (EMBL) de Heidelberg, en collaboration avec l'Université Heinrich Heine de Düsseldorf (HHU) en Allemagne, dirige cette initiative. Ils collaborent également avec le Centre de régulation génomique (CRG) de Barcelone, en Espagne, et l'Institut Siegfried Schloissnig de pathologie moléculaire (IMP) de Vienne, en Autriche, pour la première étude, et avec les centres américains du Consortium sur les variations structurelles du génome humain pour la seconde.
« Il y a une quinzaine d'années », se souvient Jan Korbel, chef de groupe et directeur par intérim de l'EMBL, co-auteur principal des deux études, « la plupart des séquençages du génome humain reposaient sur la lecture de petits fragments d'ADN, précieux, mais « insuffisants pour reconstruire un génome complet ». Depuis environ cinq ans, cependant, les technologies de « lecture courte », capables de lire uniquement de minuscules fragments d'ADN à la fois, ont été rejointes par les technologies de « lecture longue » : la capacité de lecture de l'ADN atteint des dizaines de milliers de lettres à la fois, permettant « d'assembler le génome entier et d'évaluer la variation génétique dans toutes ses parties ». À travers ces deux études, explique Korbel, « nous voulions exploiter la puissance de ces nouvelles méthodes pour mieux comprendre la variabilité génétique humaine », qui contribue à rendre chacun de nous unique et joue un rôle clé dans la santé et la maladie. Cette variabilité peut se traduire par d'infimes différences (une ou quelques lettres d'ADN différentes), ainsi que par des fragments entiers d'ADN supprimés, inversés, répétés ou ajoutés. » Ces variantes structurelles peuvent être à l'origine de diverses pathologies, dont le cancer, et qui sont aujourd'hui « cartographiées » de la manière la plus complète possible.
La première étude a reséquencé 1 019 génomes de 26 populations réparties sur cinq continents , révélant « un trésor de variations génétiques » caché principalement dans des régions répétitives de l'ADN, des zones du code génétique autrefois considérées comme « poubelles » ou trop difficiles à étudier. En réanalysant les génomes examinés à l'aide de nouvelles techniques, les scientifiques ont découvert et catégorisé « plus de 167 000 variantes structurelles, doublant ainsi la quantité connue de variations structurelles » dans l'ADN humain ; chaque personne présentait des modifications portant sur un nombre médian de 7,5 millions de lettres. « Il s'agit d'une étape importante dans la cartographie des zones aveugles du génome humain et la réduction du biais qui a longtemps favorisé les génomes d'origine européenne, ouvrant la voie à des tests et des thérapies efficaces pour les populations du monde entier », déclare Bernardo Rodríguez-Martín, co-auteur principal de l'étude, qui a travaillé à l'EMBL avant de rejoindre le CRG.
Selon les chercheurs, les résultats de cette première étude pourraient multiplier par plus de 20 les informations publiées en 2023 par le Human Pangenome Reference Project. De plus, comme « environ 3 variants sur 5 (59 %) découverts étaient présents chez moins de 1 % des individus analysés, un niveau de rareté crucial pour le diagnostic des maladies génétiques, car il permet de filtrer plus efficacement les variants inoffensifs », les auteurs ont « réduit la liste des mutations suspectées de plusieurs dizaines de milliers à quelques centaines, accélérant ainsi le diagnostic des syndromes génétiques rares et d'autres types de maladies, dont le cancer ». De plus, l'étude a clarifié un nouveau mécanisme par lequel les transposons, ou « gènes sauteurs », peuvent aider à déplacer des segments d'ADN vers de nouvelles positions au sein du génome, donnant naissance à de nouveaux variants. Cela représente une avancée dans les connaissances biologiques, mais aussi une contribution concrète à la médecine de précision.
La deuxième étude s'est concentrée sur un échantillon de seulement 65 génomes , les passant au peigne fin grâce à plusieurs méthodes de séquençage performantes et les reconstruisant avec un niveau de détail jugé « sans précédent ». Les scientifiques ont pu décoder même les segments d'ADN les plus difficiles à lire, y compris les centromères des chromosomes, points de jonction des deux « bras » chromosomiques. L'assemblage « quasi complet et sans faille » de chaque chromosome des sujets examinés a permis aux auteurs de détecter d'importantes variantes génétiques dans des régions ignorées par la première étude et d'autres travaux antérieurs.
Pour les deux études, des algorithmes innovants ont été développés afin de garantir à la fois l'étendue et la profondeur de l'analyse (la première étude). « L'une des études utilise une puissance de séquençage plus faible, mais une cohorte beaucoup plus importante. L'autre utilise une cohorte plus petite, mais une puissance de séquençage par échantillon beaucoup plus élevée. Cela a conduit à des conclusions complémentaires », explique Korbel.
« Grâce à ces études », explique Tobias Marschall, professeur à l'HHU et co-auteur principal des deux articles, « nous avons créé une ressource complète et cliniquement pertinente, désormais utilisable par les chercheurs du monde entier pour mieux comprendre les origines de la variabilité génomique humaine et observer son influence par une multitude de facteurs. Il s'agit d'un excellent exemple de recherche collaborative qui ouvre de nouvelles perspectives en génomique et marque un pas en avant vers un pangénome humain plus complet. » (Par Paola Olgiati )
Adnkronos International (AKI)