Comment j’ai fait séquencer mon ADN, partie 1

Les progrès de la recherche en génétique et particulièrement la mise au point de techniques de séquençage de l’ADN à haut débit il y a une dizaine d’années ont réduit spectaculairement le coût de l’analyse de l’ADN humain, au point qu’aujourd’hui plusieurs entreprises proposent ce service directement aux particuliers, et non plus aux seuls laboratoires et chercheurs. Par exemple Pathway Genetics vend des dépistages pour des maladies ou conditions spécifiques, mais on trouve aussi des offres de séquençages « global » couvrant l’ADN entier, auprès de trois compagnies: la plus connue est 23andme, récemment racheté par Google, il y a aussi FamilyTreeDNA et ses partenaires FamilyFinder et Ancestry.com ou encore le projet Genographic proposé par le groupe média National Geographic.

Chacun a une orientation spécifique: 23andme vise (ou plutôt visait principalement au départ) le séquençage à fins médicales générales, FamilyTreeDNA comme son nom l’indique vise plutôt à retrouver ses origines immédiates (enfants illégitimes ou adoptés, réfugiés / déportés et migrants). Cette distinction est importante: pour des raisons de coût et de rapidité chacun d’entre eux a mis au point sa propre puce de séquençage ou utilise un modèle « industriel » spécifique et du coup ils ne testent pas exactement la même chose.

L’ADN humain est subdivisé en 23 paires de chromosomes, portant chacun de 50 à 250 millions de bases (représentant entre 300 et 2000 gènes pour chacun), ainsi que 16000 bases environ d’ADN mitochondrial (pour 37 gènes). Un séquençage du type proposé au grand public est une lecture « en diagonale » de l’intégralité de cet ADN, et le résultat de ce séquençage est stocké sous la forme d’une liste de SNPs (pour single nucleotide polymorphism) ou ‘snip’, c’est-à-dire qu’on ne garde de cette longue lecture que les bases qui varient entre les humains, et on omet l’écrasante majorité des bases dont on est raisonnablement sûr qu’elles sont identiques pour tout le monde. Donc on n’obtient pas au final une longue liste de ATCG représentant son ADN du début à la fin, mais une litanie de lignes de type « référence de SNP – numéro de chromosome – emplacement génétique – bases relevées sur chaque exemplaire de chromosome »:

...
rs3737717 1 1242084 AA
i6054370 1 1246013 GG
i6019334 1 1248166 CC
i6019335 1 1248974 TT
...

On connaît aujourd’hui environ un million de ces bases variantes, on pense qu’il y en aurait environ 2 millions au total, on devrait les connaître à peu près toutes d’ici 2050, mais en attendant chaque compagnie se concentre sur 500 à 600 000 SNPs parmi les mieux connus et variant plus fréquemment, ou ayant le plus d’intérêt médical ou généalogique. Le nombre de SNPs marche un peu comme les pixels des images numériques: c’est un simple niveau de résolution. Ce sont les premiers quelques gros pixels qui en disent le plus, et chaque niveau supplémentaire de résolution apporte de moins en moins de détail et de précision.

Il faut aussi tenir compte du fait que les machines de séquençage ne sont pas parfaites: elles peuvent échouer à lire un SNP voire faire une mauvaise lecture. Pour illustrer: 23andme garantit commercialement qu’ils fourniront au moins 99,9% de résultats pour les SNPs qu’ils analysent, soit moins de 0,1% de « non-lectures » (no-call), et réalise plusieurs lectures de votre ADN pour s’en assurer. Mais loi des grands nombres oblige, il faut aussi compter entre une grosse dizaine et une petite centaine de SNPs qui seront rapportés avec un résultat erroné. Et aussi qu’une erreur humaine reste toujours possible.

Je n’ai pas trop regardé mais il me semble que les prix sont comparables entre les trois grands fournisseurs. Les frais de port sont conséquents parce qu’un échantillon vivant d’ADN ça ne se conserve pas longtemps et que c’est expédié à l’international. D’ailleurs il y a quelques pays qui interdisent carrément ce genre d’envoi, comme la Russie et quelques pays d’Amérique Latine. Mais on peut circonvenir à ces limites en se faisant réexpédier le kit dans un pays voisin grâce à un réexpéditeur commercial, et en mentant lors de l’envoi en retour de l’échantillon.

Dans mon cas j’ai fait appel à 23andme. Leur kit arrive dans une grande pochette (via DHL, qui est probablement le partenaire de choix de 23andme pour l’Europe), avec une seconde pochette prépayée plus petite dedans pour le retour, et perdu dedans: une petite boîte contenant le tube d’échantillonnage et les explications (en anglais uniquement). Il faut enregistrer un compte associé au numéro figurant sur le kit avant de le renvoyer rempli.

La plus grosse contrainte pour le test c’est clairement l’envoi en retour, donc il faut soit habiter juste à côté d’un centre DHL Express (et pas un centre DHL ordinaire, attention !), soit organiser un enlèvement avec eux. Il faut n’avoir rien mangé depuis au moins 30 minutes avant de remplir le tube avec sa salive. Il y a la place pour au moins 3 ou 4 échantillons dans la pochette de retour (de mémoire elle est prépayée pour 500 grammes), donc on peut aussi économiser pas mal en faisant plusieurs tests d’un coup.

Le kit met 48h à arriver au labo, ensuite il faut 3 à 6 semaines pour les résultats. Dès l’enregistrement du compte on peut participer aux études de recherche génétique auxquelles 23andme s’associe, en répondant à une bonne douzaine de questionnaires de toutes sortes (sur la dépression, arthrite, Parkinson, cancer, droitier-ou-gaucher, bronzage, allergies, souplesse, qualité du sommeil, etc.). Comme la FDA (autorité sanitaire fédérale US) a brutalement interdit fin 2003 à 23andme de fournir des informations générales de santé à ses clients (alors qu’ils reçoivent des grants du NIH, voilà pour la cohérence étatique…), ils se sont précipitamment respécialisés en origine ancestrale et généalogique, donc il y a aussi des pages pour renseigner son arbre généalogique, soit manuellement soit par import d’un fichier GEDCOM qu’on peut par exemple exporter depuis un service comme geneanet. Le kit comprend d’ailleurs un abonnement limité à myheritage.com de 6 mois mais qui n’apporte franchement rien d’utile (quasiment toutes les fonctions restent payantes). Mieux vaut s’inscrire sur geneanet et transférer les données par fichier GEDCOM.

23andme-chromosome-painting-f
Comment se présentent les origines par segment de chromosome sur le site – notez que ce ne sont pas mes données.

Ce qui est bien: 23andme a plus de 800 000 ADNs déjà en banque, leur fonction de recherche de cousins distants est très efficace et précise, en plus de permettre d’exporter toutes les correspondances au format CSV, donc il y a de quoi s’occuper si on recherche ses origines généalogiques.

Ce qui est moins bien: les fonctions « pays d’origine » et haplotypes (=caractérisation patrilinéale et matrilinéale respectivement par le chromosome Y et l’ADN mitochondrial) sont inexactes voire fausses. Les origines non-européennes des segments d’ADN sont largement sous-estimées, et certaines populations entières ne sont pas du tout référencées (Arméniens et Romanichels, par exemple) ou basées sur un nombre insuffisant d’échantillons. Le typage du Y s’arrête à la mutation M418 pour la branche R1a, et pour toutes les branches certaines variantes récemment identifiées (=depuis 2013, en gros) sont simplement manquantes (c’était le cas pour mes ADN mitochondrial et Y).

Et bien sûr, 23andme ne donne plus (du moins pour l’instant) d’informations de santé. Heureusement toutes ces limitations peuvent être réduites ou levées en exploitant de nombreux outils disponibles sur l’Internet, on verra ça dans la partie 2.

À propos jesrad
Semi-esclave de la République Soviétique Socialiste Populaire de France.

3 Responses to Comment j’ai fait séquencer mon ADN, partie 1

  1. Ping: Comment j’ai fait séquencer mon ADN | Contrepoints

  2. Celina MANCEAU says:

    Bonjour,
    Comment faites-vous pour exploiter les correspondances téléchargées en format CSV ?
    MyHeritage indique que je peux cartographier les données téléchargées mais je ne sais pas comment.
    Merci de votre réponse 🙂

Laisser un commentaire