Science:利用人工智能确定人类基因组转录起始的序列基础
来源:生物谷原创 2024-05-26 12:20
Puffin程序显示,根据这些序列模式的排列方式,它们可以激活或抑制基因的转录。它还能预测这些序列模式的排列如何引导 RNA 聚合酶优先转录 DNA 的单链或同时向相反方向转录两条链。
在一项新的研究中,来自德克萨斯大学西南医学中心等研究机构的研究人员开发出了深度学习模型,以确定一套简单的规则来调控启动子-——启动基因产生蛋白过程的DNA区域的活性。他们的研究结果可帮助人们更好地理解启动子如何在健康和疾病中促进基因调控。相关研究结果近期发表在Science期刊上,论文标题为“Sequence basis of transcription initiation in the human genome”。
论文通讯作者、德克萨斯大学西南医学中心生物信息学系助理教授 Jian Zhou 博士说,“尽管启动子对每个基因的功能都至关重要,但我们对这些遗传因子如何运作的了解并不全面,尽管数十年的研究已经确定了它们的许多特征。我们的研究揭示了这些序列在人类和其他哺乳动物体内的工作原理。”
合成细胞用于执行其活动的蛋白始于一种称为转录的过程。这时,RNA聚合酶蛋白抓住DNA链,将编码信息复制或转录成RNA分子。RNA 聚合酶结合开始转录的DNA区域称为启动子。
在人类中,启动子通常由数百个碱基对组成。尽管人们已发现了一些 DNA 区域中的启动子具有共同的碱基对序列,但这些序列在人类的启动子中往往并不存在,因此 DNA 序列如何指导转录过程的规则并不明确。
为了更好地确定人类的启动子及其运作方式,这些作者开发了一款名为 Puffin 的机器学习程序。在分析了数万个公认的人类启动子的数据后,该程序确定它们由三种类型的序列模式组成:基序(motif)、起始子(initiator)和三核苷酸(trinucleotide)。
图片来自Science, 2024, doi:10.1126/science.adj0116
Puffin程序显示,根据这些序列模式的排列方式,它们可以激活或抑制基因的转录。它还能预测这些序列模式的排列如何引导 RNA 聚合酶优先转录 DNA 的单链或同时向相反方向转录两条链。这种双向转录在人类基因中很常见。
Puffin程序进一步表明,小鼠和其他哺乳动物都有类似的启动子运行规则。此外,它还能让这些作者预测如果启动子发生突变,转录是否会发生以及如何发生,这些发现与实验结果非常吻合。
这些作者认为Puffin程序可能帮助他们了解启动子在健康细胞中是如何运作的,以及与疾病相关的启动子改变是如何导致基因转录变化的。
Puffin程序可在免费网络服务器(tss.zhoulab.io)上使用,因此科学界可以测试任何感兴趣的启动子序列。他们补充说,使用类似的机器学习方法可能深入了解基因组中仍未被充分理解的其他方面。(生物谷Bioon.com)
参考资料:
Kseniia Dudnyk et al. Sequence basis of transcription initiation in the human genome. Science, 2024, doi:10.1126/science.adj0116.
Machine learning sheds light on gene transcription
https://www.utsouthwestern.edu/newsroom/articles/year-2024/may-machine-learning-gene-transcription.html
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。