打开APP

Nature:用条形码标记基因组中的顺式调控元件提供了对人类基因组的深入了解

  1. 转录因子
  2. 顺式调控元件
  3. lentMPRA

来源:生物谷原创 2025-01-20 10:27

在这项研究中,这些作者基于大规模实验数据,开发了几种机器学习模型来预测顺式调控元件(CRE)的调节活动。

在一项新的研究中,来自加州大学旧金山分校和华盛顿大学等研究机构的研究人员在了解基因表达如何在人类基因组中受到控制方面迈出了重要一步。他们全面分析了“顺式调控元件(cis-regulatory element, CRE)”,即调节基因转录的DNA序列。这项研究揭示了这些调控元件如何促进细胞特异性基因表达,以及它们内部的突变如何影响健康和疾病。

相关研究结果于2025年1月15日在线发表在Nature期刊上,论文标题为“Massively parallel characterization of transcriptional regulatory elements”。

包括增强子和启动子在内的CRE对于控制基因何时何地开启或关闭至关重要。虽然它们的重要性已经得到很好的证实,但大规模研究它们的活性一直是一个挑战。

论文共同第一作者Fumitaka Inoue博士解释道,“人类基因组包含无数CRE,这些区域的突变被认为在人类疾病和进化中起着重要作用。然而,很难全面定量确定它们在整个基因组中的活性。”

为了解决这个问题,这些作者使用了一种名为基于慢病毒的大规模并行报告分析(lentivirus-based massively parallel reporter assay, lentMPRA)的前沿技术,这是他们之前开发的。这种方法通过用追踪CRE活性的独特DNA条形码标记数千个CRE,实现了对它们的同时分析。

利用lentMPRA,他们在三种广泛使用的细胞类型——肝细胞(来自肝脏的细胞)、淋巴细胞(一种白细胞)和诱导性多能干细胞(一种由正常体细胞制成的人造干细胞)中研究了多达68万个候选CRE。

这项研究揭示了几个关键的见解。在这三种细胞类型中,约41.7%的他们分析的CRE表现出活性。启动基因转录的启动子显示出对序列方向的依赖性,但对细胞类型的特异性较低。促进基因转录的增强子无论其方向如何都是活跃的,并表现出细胞类型特异性。这些发现突显了这两种CRE功能的根本差异。

在这项研究中,这些作者基于大规模实验数据,开发了几种机器学习模型来预测CRE的调节活动。作为一种在庞大的lentMPRA数据集上训练的模型,MPRALegNet被发现在预测任何DNA序列的调控活性方面是最准确和最有效的。它的预测与实验结果非常吻合,在某些它的表现与实验重复一样好。

针对三种细胞类型的lentiMPRA分析

这种模型还证明了它识别重要转录因子结合基序——决定CRE活性的短DNA序列的能力,从而为特定转录因子如何驱动细胞类型特异性基因表达提供了见解。例如,该研究确定HNF4和GATA基序分别对肝细胞和淋巴细胞的活性至关重要。

通过精确鉴定和定量确定增强子活性,该研究为探索人类疾病的分子机制开辟了途径。未来的研究将侧重于将这种方法应用于研究遗传多态性,即导致个体差异和疾病易感性的DNA序列变异。

Inoue博士说,“最近,几乎完整的人类基因组已经被测序,但其许多功能区域仍然未知。我们的发现将DNA序列信息与其功能作用联系起来。我们希望这些结果将有助于更深入地了解生物现象,包括人类疾病和进化。”

这项研究还为ENCODE门户网站提供了一个可公开访问的CRE活动数据库,为全球研究人员提供了宝贵的资源。通过将大规模实验数据与机器学习相结合,这项研究为基因组学和个性化医学的未来发现奠定了基础。

此外,使用lentMPRA和MPRALegNet等工具将有助于科学家们更好地解开基因调控的复杂性,并探索人类基因组的广阔未知领域。(生物谷 Bioon.com)

参考资料:

Vikram Agarwal et al. Massively parallel characterization of transcriptional regulatory elements. Nature , 2025, doi:10.1038/s41586-024-08430-9.

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->