4篇Nature论文通过分析古人类基因组数据,追溯了人类疾病的遗传痕迹和地理起源
来源:生物谷原创 2024-01-29 09:46
4篇论文表明,这个由5000个古人类基因组组成的大型数据集作为一种精确的工具,当与对当今人类 DNA 数据的分析以及其他几个研究领域的投入结合在一起时,能够提供对疾病的新见解。
如今,来自英国、美国、德国、澳大利亚、瑞典、丹麦、挪威、法国、波兰、瑞士、亚美尼亚、乌克兰、俄罗斯、哈萨克斯坦和意大利的研究人员在Nature期刊上发表四篇论文,追溯了人类疾病的遗传痕迹和地理起源。这些分析提供了史前人类多样性和迁徙的详细图景,同时提出了多发性硬化症遗传风险上升的解释。
通过分析迄今为止世界上最大的数据集中来自欧洲和西亚(欧亚大陆)的 5000 个古人类基因组的数据,这些新研究以前所未有的细节揭示了欧亚大陆西部的史前人类基因库。
这些研究发现基于对 5000 个基因组中的一个亚集的分析,其中包括(1)直到大约4000年前,一个由文化决定的屏障从欧洲南部的黑海一直延伸到欧洲北部的波罗的海,贯穿整个欧洲;(2)绘制出几种疾病(包括 2 型糖尿病和阿尔茨海默病)的风险基因是如何在 5000 多年前的大迁徙事件后分散到欧亚大陆的;(3)古代移民的新科学证据解释了为什么斯堪的纳维亚半岛的多发性硬化症发病率是南欧的两倍;(4)绘制丹麦在一个千年内两次几乎完全的人口更替图。
这些研究结果是通过比较古人类基因组数据集与来自丹麦大型 iPYSCH 联盟的去身份化基因数据以及来自英国生物库中登记的 40 万现存个体的 DNA 资料而得到证实的。
5千古人类基因组项目
通过与欧洲和西亚的博物馆和大学建立科学合作关系,这些作者对骨骼和牙齿进行分析,重建了史无前例的 5000 个古人类基因组数据集。他们的测序工作利用了 Illumina 技术的强大功能。
样本的年代从中石器时代和新石器时代到青铜时代、铁器时代和维京时期,直至中世纪。这个数据集中最古老的基因组来自一个生活在大约 3.4 万年前的个体。
哥本哈根大学的三位教授Eske Willersle、Thomas Werge和Rasmus Nielsen说,“这个古人类基因组项目的初衷是重建1000个来自欧亚大陆的古人类基因组,作为脑部疾病研究的新型精准工具。”他们在2018年提出了建立这个DNA数据集的想法,并最初勾勒了这个项目的概念。
这项研究的目的是建立一个独特的古人类基因组数据集,用于研究尽可能久远的脑部疾病的踪迹和遗传进化史,以获得对这些疾病的新的医学和生物学认识。要实现这一目标,需要将古人类 DNA 图谱中的信息与其他几个科学学科的数据进行比较。
图片来自Nature, 2024, doi:10.1038/s41586-023-06865-0
这三位教授最初确定的候选大脑疾病包括帕金森病、阿尔茨海默病和多发性硬化症等神经系统疾病,以及多动症和精神分裂症等精神疾病。
诸多挑战
Werge教授回忆说,该项目的前提是实验性的。“我们想收集古人类样本,看看我们能从他们身上得到什么,比如试图了解疾病和障碍如何进化的一些环境背景。在我看来,Nature期刊希望利用这四篇论文来描述这个庞大而复杂的项目,这是非常独特的。”
Willerslev教授评论说,编制这个DNA 数据集在后勤方面提出了重大挑战。“我们需要获得人类牙齿和骨骼的考古样本,我们知道这些样本散落在欧亚地区的博物馆和其他机构中,这就需要达成许多合作协议。但是,一旦签订了这些协议,事情就真正开始了---这个数据集迅速增长,如今已超过了 5000 个古人类基因组。这个数据集的规模极大地增强了这些结果的可用性和精确性。”
Nielsen教授负责规划哥本哈根大学实验室对从古人类牙齿和骨骼中收集到的信息进行统计和生物信息学分析。他要处理的是大量数据,其中的DNA往往已经严重降解。
“以前没有人分析过如此多的古人类基因组。如今,我们必须找出如何处理如此庞大的数据量。问题是,原始数据非常难以处理,因为你最终会得到许多错误百出的短 DNA 序列,然后必须将这些序列正确对应到人类基因组的正确位置。此外,还有来自古人类牙齿和骨骼上所有微生物的污染问题。”
Nielsen教授说,“想象一下,一个由数百万块拼图组成的拼图与其他四套不完整的拼图混在一起,然后把所有拼图放在洗碗机里洗一个小时。之后再把它们拼起来可不是一件容易的事。我们最终取得成功的关键之一是,我们与洛桑大学的Olivier Delanau博士合作,他开发了克服这一问题的算法。”
国际兴趣
很快,科学界就传出了正在编制大型古人类基因组数据集的传言。Werge教授、Willerslev教授和Nielsen教授说,自2022年以来,人们对这一消息的兴趣一直很高。“我们不断收到来自全球各地科学家的咨询,特别是那些研究疾病的科学家,他们通常都要求获得探索古人类DNA数据集的权限。”
这4篇论文表明,这个由5000个古人类基因组组成的大型数据集作为一种精确的工具,当与对当今人类 DNA 数据的分析以及其他几个研究领域的投入结合在一起时,能够提供对疾病的新见解。
Willerslev教授认为,这本身就非常了不起。“毫无疑问,如此规模的古人类基因组数据集将在疾病研究的许多不同领域得到应用。随着从这个 5000 个基因组数据集中获得的新科学发现的发表,更多的数据将逐步免费提供给所有科学家。最终,这个完整的数据集将向所有人开放。”(生物谷 Bioon.com)
参考资料:
Morten E. Allentoft et al. Population genomics of post-glacial western Eurasia. Nature, 2024, doi:10.1038/s41586-023-06865-0.
Evan K. Irving-Pease et al. The selection landscape and genetic legacy of ancient Eurasians. Nature, 2024, doi:10.1038/s41586-023-06705-1.
William Barrie et al. Elevated genetic risk for multiple sclerosis emerged in steppe pastoralist populations. Nature, 2024, doi:10.1038/s41586-023-06618-z.
Morten E. Allentoft et al. 100 ancient genomes show repeated population turnovers in Neolithic Denmark. Nature, 2024, doi:10.1038/s41586-023-06862-3.
Discoveries gleaned from ancient human DNA
https://phys.org/news/2024-01-discoveries-gleaned-ancient-human-dna.html
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。