Nature:科学家揭开基因“功能组”奥秘,利用在线资源描述了2万多个人类基因的功能
来源:生物谷原创 2025-03-12 10:08
如今这一最新的里程碑在知识库中能提供一种新的资源,并利用进化模型来使这一工具更加强大;这种方法就能允许研究人员将收集自人类基因的实验数据与模式生物(比如小鼠和斑马鱼)中相关基因中获得的数据相结合。
基因本体联盟(Gene Ontology Consortium)是一种全面的百科全书,其涵盖了所有蛋白质编码人类基因的已知功能,如今来自该联盟的一个新的资源已经完成且在一个新的网站上进行了发布。
近日,一篇发表在国际杂志Nature上题为“A compendium of human gene functions derived from evolutionary modeling”的研究报告中,来自南加利福尼亚大学等机构的科学家们通过研究首次利用大规模进化模型成功将人类基因数据与收集自其它生物体的遗传数据进行了整合并分析。这最终就会形成一种可搜索的公共资源,该资源库利用最准确和完整的证据列出了2万多个基因的已知功能。
作为一个不断扩大并完善超过25年的一个知识库,基因本体(Gene Ontology,是一个在生物信息学领域中广泛使用的本体)如今已经成为了生物医学研究过程的支柱,每年都有超过3万份出版物使用其来辅助数据分析和解释。从事“组学”实验(对DNA、RNA、蛋白和其它生物分子进行大规模研究)的生物医学研究人员所产生的数据就能识别出数百个感兴趣的基因,比如,研究人员可能会学习相比健康细胞而言,癌症细胞中哪些基因会被开启或关闭。
回顾数千篇关于每个基因已知功能的已经发表的文章是不可能的,因此很多科学家们转向求助于基因本体,研究者Paul D. Thomas博士说道,我们的知识库就能促使科学家们通过仅仅一个基因列表就能理解其生物学功能,包括可能对开发疗法有用的基因。如今这一最新的里程碑在知识库中能提供一种新的资源,并利用进化模型来使这一工具更加强大;这种方法就能允许研究人员将收集自人类基因的实验数据与模式生物(比如小鼠和斑马鱼)中相关基因中获得的数据相结合,并能提供一张关于人类基因功能更完整的图片,包括填补科学知识的空白,而通过对来自人类研究的直接证据或许是不可用的。
研究者Thomas说道,此前我们积累了一个大型的知识库,而这已经成为了关于人类基因功能的权威参考。如今,通过添加关于每种功能在进化中何时出现的信息,我们就能针对人类基因所编码的功能提供更为完整、准确和简洁的描述;而这种新的资源是由来自全球各地的150多名生物学家所组成的团队进行编写的。
PAN-GO注释的实验证据来源
从1998年以来,这一团队就仔细分析了175,000份关于基因功能的科学出版物,同时在经过充分研究的生物体和人类基因组中的每个基因(能控制机体关键生物学功能的2万多个编码蛋白的基因)中寻找关于基因功能的数据。通过对这些文献进行回顾,研究人员根据基因所发挥的生物学功能来对其进行分类,无论是单独使用还是与其它基因结合使用,他们从所开发的4万多种功能目录中进行选择,这些功能涵盖细胞分裂、细胞信号、免疫反应、分子运输等等。理解基因群的精确功能或能帮助研究人员理解癌症和其它疾病中的问题所在,并开发出有针对性的策略;研究人员将这种基因功能描述的新资源称之为“PAN-GO功能组”(PAN-GO functionome),其基本上能被科学界以同样的方式使用,并在其它应用中分析组学数据,但其会产生更为准确的结果。这是因为最近的工作利用了大规模的进化模型(该模型能追踪数千个基因和相关蛋白的进化历史)来汇集知识库中的所有信息,并能创造一副更为完整且准确的基因功能图谱。
在很多情况下,研究人员往往无法获得来自人类基因的实验数据,但如今他们已经研究了多种物种中的相关基因,包括小鼠、大鼠、斑马鱼、果蝇、酵母和大肠杆菌,通过理解特定功能进化的时间和方式(比如能量处理或细胞信号),研究人员就能利用来自其它物种的数据进一步深入理解人类机体中的基因功能;这或许就能帮助推断人类基因的特征,即使没有来自人类基因自身实验的直接证据。
展望未来,基因本体联盟要求研究人员在其分析中利用PAN-GO功能组,这些信息能以机器可读的格式结构化,从而促使它们利用诸如人工智能等计算工具来快速搜寻并利用相关数据。同时该联盟还发出行动呼吁,即如今研究人员能通过该项目的网站提交更新特定基因知识库的建立,即基因功能知识的“众包”(Crowd-sourcing),并以结构化的方式对其进行分类从而确保共享资源能随着时间延续不断被改进,并以根据其见解易于应用。
尽管目前PAN-GO功能组是一种最为全面的基因功能资源,但其仍然不完整,其包含了82%的蛋白质编码基因的数据,但并没有其它18%的实验数据,即大约3600个基因;而且其生物学功能目前研究人员并不清楚。研究者Thomas表示,如今我们对丢失信息的位置有了一个真实的了解,而这也是该领域未来需要关注的地方。(生物谷Bioon.com)
参考文献:
Feuermann, M., Mi, H., Gaudet, P. et al. A compendium of human gene functions derived from evolutionary modelling. Nature (2025). doi:10.1038/s41586-025-08592-0
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
