Nature:新研究利用人工智能破解基因调控密码
来源:生物谷原创 2023-12-28 17:07
有机体由成千上万种不同的蛋白组成,每种蛋白都由特定的基因编码。一种细胞类型要获得其独特的身份、形态和功能,就必须通过“增强子”来激活基因。长期以来,科学家们一直试图破解增强子的
有机体由成千上万种不同的蛋白组成,每种蛋白都由特定的基因编码。一种细胞类型要获得其独特的身份、形态和功能,就必须通过“增强子”来激活基因。长期以来,科学家们一直试图破解增强子的运作密码。如今,在一项新的研究中,奥地利维也纳生物中心分子病理学研究所的Alexander Stark实验室和欧洲分子生物学实验室的Eileen Furlong实验室利用基因组学和人工智能破解了第二种遗传密码,即基因调控的基础密码。2023年12月12日在线发表在Nature期刊上,论文标题为“Targeted design of synthetic enhancers for selected tissues in the Drosophila embryo”。
复杂有机体的每个健康细胞都含有完全相同的基因组拷贝,其中包括数千个基因,即构建蛋白的蓝图。为了形成不同的细胞类型、组织和器官,需要额外的机制来高精度地开启和关闭特定基因的表达。
作为基因组中的DNA片段,增强子是开启基因的关键因素。Stark实验室把破解将增强子 DNA 序列与它的基因调控功能关联在一起的密码作为自己的使命。虽然第一批增强子是在 20 世纪 80 年代初发现的,但是科学家们只是在过去十年中才开发出通过实验识别增强子的方法。
在此基础上,Stark实验室和合作者如今瞄准了三项任务,它们共同构成了一个似乎不可能实现的长期目标:根据增强子的DNA序列预测它们的活性;预测增强子突变的后果;为特定组织从头设计增强子。换句话说:读取、理解和编写第二种遗传密码。
随着基因组学和人工智能的最新进展,破解这一密码的机会出现了。这些作者开发了一种功能强大的深度学习和迁移学习模型,并利用以前在黑腹果蝇(发育生物学中广泛使用的模式生物)中研究获得的大量数据对它进行了训练。
从实验室到人工智能再到实验室
首先,利用全基因组 DNA 序列和相应的 DNA 可访问性数据对这种模型进行了训练。随后,深度学习模型被用来对迁移学习模型的微调进行初始化,其中迁移学习模型学习将DNA序列与特定的增强子活动直接联系起来。
Stark说,“你可以这样解释迁移学习:想象一下,你想训练一个模型来识别图片中的猫,但你只有很少的猫图片可用。但是,你有很多狗的图片。因此,你首先在狗的图片上训练一个人工智能模型,然后在第二步中对其进行微调,如今就能识别猫了。”
图片来自Nature, 2023, doi:10.1038/s41586-023-06905-9。
通过迁移学习,该模型能够预测果蝇胚胎中五类组织---中枢神经系统、大脑亚节、表皮、肠道和肌肉---的增强子活性。
在这一预测的基础上,这些作者把他们的研究工作从抽象的大数据和人工智能世界带回了实验室工作台。利用成熟的分子生物学工具,他们在活体果蝇胚胎中测试了通过计算设计的40个合成增强子。事实上,这些增强子是活跃的,并能驱动目标组织中的基因表达。
论文第一作者、维也纳生物中心的Bernardo de Almeida 说,“能够构建具有特定特性的合成增强子,为控制基因的定向表达提供了前所未有的机会。未来的应用可能是合成生物学或基因疗法,在这些领域,精确设计和操纵基因表达模式是先决条件。”
不过,对于Stark来说,针对一种生命基本现象提供新的见解是这项研究最重要的方面:“大约 60 年前,科学家们了解到第一种遗传密码是如何起作用的,即DNA 分子蓝图是如何转化为蛋白的。借助基因组学和人工智能的力量,我们如今成功破解了生命的第二种遗传密码,即基因活动是如何被控制的。”(生物谷 Bioon.com)
参考资料:
Bernardo P. de Almeida et al. Targeted design of synthetic enhancers for selected tissues in the Drosophila embryo. Nature, 2023, doi:10.1038/s41586-023-06905-9.
Artificial Intelligence cracks code of gene regulation
https://www.imp.ac.at/news/article/artificial-intelligence-cracks-code-of-gene-regulation
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。