Il existe une autre catégorie de test de généalogie génétique, plus grossiers que ceux évoqués plus haut : les tests d’origine. Laurent en a d’ailleurs reçu un en cadeau à Noël 2015. Il a prélevé sa salive suivant les instructions, puis envoyé le petit tube par la Poste. Les résultats sont arrivés quelques semaines plus tard. On lui a appris ainsi qu’il est italien à 25%. Pourtant, en creusant sa généalogie il n’avait trouvé aucun ancêtre transalpin. Quatre ans plus tard, il refait le même test et, surprise, on lui annonce cette fois 2% d’Italien. En outre, une nouvelle origine apparaît dans les résultats : il est Français à 23%. Qu’est-ce que signifie être Italien à 2% ou 23%, et pourquoi les résultats ont-ils changé ?
Pour répondre, il faut comprendre comment fonctionne ces tests. Votre salive contient des cellules qui referment de l’ADN. Quand la société qui mène le test d’origine reçoit votre ADN, elle y lit certaines portions connues pour être variables selon les populations humaines et les compare à des ADN de référence. L’opération est effectuée pour des milliers de bouts de l’ADN, ce qui permet de calculer un pourcentage. « 25% de votre ADN est italien » signifie que le rapprochement avec la population de référence a collé dans un quart des cas.
Première donnée importante pour comprendre la variation des résultats d’un test à l’autre : ces tests comparent votre ADN à celui des populations de référence qu’a pu se constituer la société. Or si, dans les articles scientifiques, la manière avec laquelle est constituée une population est bien cadrée et décrite, la formation des populations de référence demeure en quelque sorte la boîte noire des sociétés qui proposent ces tests.
En recherche, en général, on choisit pour définir une population de référence les individus dont les 4 grands-parents viennent de ce groupe. C’est une manière de s’affranchir des migrations du XXe siècle, comme si l’on remontait dans le temps jusqu’aux années 1900. Il est raisonnable de penser que les sociétés de tests suivent le même protocole, mais cela n’est nullement démontré.
La deuxième interpellation porte sur la signification des populations utilisées. Par exemple, que veut dire « Français » ? Oublions le problème de la catégorie administrative, la question des DOM et TOM, etc., et supposons que le terme désigne un individu sur le territoire métropolitain. Or les études sur la diversité génétique montrent qu’à l’échelle de l’Europe, la proximité génétique entre deux individus suit la géographie si l’on considère des populations où les individus ont leurs 4 grands-parents qui viennent du même endroit, c’est-à-dire dans un rayon de moins de 50km ou 100km. En un mot, il y a nettement plus de similarité entre un Alsacien et un Allemand de Francfort qu’entre un Marseillais et un Lillois, pourtant tous les deux Français !
Si, par exemple, vos ancêtres sont du Nord et que la population de référence française est constituée de Français du Midi, il est possible que les tests vous désignent comme Belge. Si un individu a des ancêtres qui sont Italiens du Nord et que, dans une autre société, la population « Italien » est constituée d’Italiens du Sud et celle de France de Français du Sud-Est, eh bien, il sera certainement étiqueté Français et non Italien.
À une échelle géographique plus large, imaginons que vous avez des ancêtres sibériens et que vous faites vos tests avec des populations de référence d’Amérique du Nord qui incluent des Amérindiens, mais pas de Sibériens : vos origines seront cataloguées « Amérindiens », car ceux-ci sont partis il y a 15 000 ans de Sibérie, alors que vous n’avez aucun ancêtre ayant foulé le sol américain.
Evelyne HEYER, L’odyssée des gènes, 7 millions d’années d’histoire de l’humanité révélée par l’ADN, Paris, Flammarion, 2020, pp. 291-294.