打开APP

Science:开发出新方法确定物种基因组中的直系同源基因

  1. 机器学习
  2. 直系同源基因
  3. 基因注释

来源:生物谷原创 2023-05-05 07:24

由于技术上的巨大进步,如今可以快速地对生物的遗传物质进行测序。无论是密切相关的物种还是完全不同的物种,对其基因组的比较都能显示出特别有趣的发现。通过这种方式,可以获得关于系统发育关系、特征的形成或适应

由于技术上的巨大进步,如今可以快速地对生物的遗传物质进行测序。无论是密切相关的物种还是完全不同的物种,对其基因组的比较都能显示出特别有趣的发现。通过这种方式,可以获得关于系统发育关系、特征的形成或适应能力的信息。

然而,比较基因组数据带来了棘手的技术挑战。为了简化分析过程,由德国LOEWE转化生物多样性基因组学中心Michael Hiller教授领导的一个科学家团队在一项新的研究中开发出一种新方法。相关研究结果发表在2023年4月28日的Science期刊上,论文标题为“Integrating gene annotation with orthology inference at scale”。

在比较不同有机体的基因组时,科学知识的获得需要经过两个步骤:首先,必须对各自物种的基因组内的基因进行定位。这个过程被称为基因注释(gene annotation)。然后,为了进行比较,第二步是确定两种有机体中哪些基因是相互对应的;这类对应的基因被称为直系同源基因(orthologs)。这两个步骤在技术上都要求很高,而且很难从要比较的基因组数据中获得新的信息。

这种新的计算方法---TOGA(Tool to infer Orthologs from Genome Alignment, 从基因组比对中推断直系同源基因的工具)---简化了这种分析,并同时解决了这两个挑战。为了确定直系同源基因,这些作者利用这样一个事实:直系同源基因中编码蛋白的部分彼此之间通常比其他基因的编码部分更相似。TOGA方法将这一相似性原则扩展到基因的整个基因组背景。

一种不同的直系同源基因推理范式。图片来自Science, 2023, doi:10.1126/science.abn3107

Hiller解释说,“我们有接近完整的基因组,所以我们不妨利用它们,而不是只关注蛋白编码部分。通过比较不同有机体的全基因组并使用机器学习,我们可以以非常高准确地确定直系同源基因。”

这项新的研究表明,只需使用来自人类或小鼠的已知基因,其他哺乳动物基因组中的直系同源基因就能被准确定位。同样地,来自鸡的已知基因也可以用来定位其他鸟类基因组中的直系同源基因。

Hiller补充说,“这使我们能够将TOGA应用于数百种其他物种的基因组。通过注释和确定超过500种哺乳动物和500种鸟类基因组的直系同源基因,我们为这些脊椎动物群体生成了迄今为止最大的跨物种基因资源。这些资源有助于确定物种的系统发育,并将基因的变化与性状的变化联系起来。”

除了Hiller团队,这项研究还有来自Zoonomia联盟的科学家们的参与,该联盟是一个研究哺乳动物常见和特殊性状的基因组基础的国际研究联盟。该联盟的目标是利用比较基因组学的可能性作为人类医学和生物多样性保护的工具。(生物谷 Bioon.com)

参考资料:

Bogdan M. Kirilenko et al. Integrating gene annotation with orthology inference at scale. Science, 2023, doi:10.1126/science.abn3107.

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->