打开APP

Nature:告别定向进化?Riff-Diff策略,实现人工酶活性的“一步到位”

来源:生物探索 2025-12-07 10:50

一种名为 Riff-Diff 的全新混合深度学习策略。它不仅成功实现了“一步到位”的高活性酶设计,更在某些指标上直接比肩甚至超越了经过多轮进化的天然或人工酶。

在生命科学中,酶(Enzyme)无疑是最为精密的杰作。它们在温和的生理条件下,以惊人的特异性和效率催化着复杂的化学反应。长期以来,合成生物学领域的研究人员一直怀揣着一个梦想:如果我们能够摆脱自然进化的束缚,从零开始设计出能够催化任意化学反应的全新酶,那将彻底改变医药、化工和材料科学的面貌。

然而,现实是骨感的。尽管计算蛋白质设计(Computational Protein Design)在过去十几年里取得了长足进步,但传统的“理性设计”往往陷入一个尴尬的怪圈:设计出来的酶,活性通常极低,往往比自然酶慢几个数量级。为了让这些“初稿”真正能用,研究人员不得不依赖定向进化(Directed Evolution),一种在实验室中模拟自然选择的繁琐过程。

12月3日,《Nature》的研究报道“Computational enzyme design by catalytic motif scaffolding”,展示了一种名为 Riff-Diff 的全新混合深度学习策略。它不仅成功实现了“一步到位”的高活性酶设计,更在某些指标上直接比肩甚至超越了经过多轮进化的天然或人工酶。
图片

困在“能量低谷”的早期尝试

要理解这项突破的分量,我们先来看看“从头设计酶”(de novo enzyme design)的困境。

传统的酶设计策略主要基于过渡态理论(Transition-state theory)。研究人员首先计算出反应过渡态的理想几何构型,然后在一个理论模型中通过氨基酸侧链来稳定这个过渡态,构建所谓的“理论酶”(Theozyme)。随后,他们会在天然蛋白质结构数据库中寻找能够容纳这些关键侧链的骨架(Scaffold),试图将催化中心“移植”进去。

这种方法听起来逻辑严密,但在实践中却屡屡碰壁。早期的设计,如著名的逆羟醛酶(Retro-aldolase)或 Kemp 消除酶,虽然在试管中显示出了活性,但这种活性往往微乎其微。

问题出在哪里?

核心难题在于“精度”与“口袋”的矛盾。要实现高效催化,活性中心的原子位置偏差不能超过 1 埃。然而,之前的计算方法在生成蛋白质骨架时,很难同时兼顾骨架的折叠稳定性和活性口袋的深埋程度。

论文中提到了一组发人深省的数据:在 PDBbind 数据库的天然酶-底物复合物中,平均有 7.1 个 α-碳原子位于底物 8 埃的范围内(归一化后)。

这意味着天然酶倾向于将底物深深地“拥抱”在内部,通过紧密的疏水口袋来排除溶剂干扰并固定底物。然而,早期的 AI 生成模型(如原始的 RFdiffusion)在生成骨架时,往往为了避免原子冲突,倾向于生成平坦的表面,无法形成这种深邃的结合口袋。这就好比你想给一颗钻石定制一个完美的镶嵌底座,但你手里的工具只能造出平滑的金属板。

Riff-Diff:带着“模具”去扩散

为了解决这个问题,研究团队开发了 Riff-Diff。这不是一个单一的算法,而是一套将传统原子建模与现代生成式 AI 巧妙结合的流水线。Riff-Diff 的核心逻辑可以概括为:先确立核心,再强制留空,最后精雕细琢。

首先,研究人员不再是被动地寻找骨架,而是主动构建“人造基序库”(Artificial Motif Libraries)。他们从已知的活性位点出发,将关键的催化残基(Catalytic residues)及其周围的骨架片段预先组装好。这就像是先造好了发动机的核心气缸组件。

接下来的步骤是该研究最巧妙的创新点之一。为了强迫扩散模型(Diffusion Model)生成一个深邃的结合口袋,研究人员在这些催化基序上人为地添加了一个“占位螺旋”(Placeholder helix)。

这个螺旋就像是一个模具,插在预想的结合位点上。在 RFdiffusion 生成蛋白质骨架的过程中,通过一个定制的辅助势能函数,强制新生成的骨架原子紧紧包裹住这个占位螺旋。

当扩散过程结束,拔掉这个“占位螺旋”,一个完美的、深邃的、形状互补的结合口袋便诞生了。这直接解决了 AI 生成蛋白质“口袋过浅”的顽疾。最后,通过 LigandMPNN 和 Rosetta 的反复迭代优化,序列被“穿”在这些新生成的骨架上,确保侧链能够精确地按照设计意图进行折叠和堆积。

逆羟醛酶:不仅是快,更是准

为了验证 Riff-Diff 的威力,研究人员选择了经典的逆羟醛反应(Retro-aldol reaction)作为试金石。他们的目标是设计能够催化 (R)-methodol 裂解的酶。

他们选取了一个名为 RA95.5-8F 的高效人工酶作为参照,提取了其中的催化四联体(Catalytic tetrad)——这是一个包含赖氨酸、两个酪氨酸和天冬酰胺的精密结构。利用 Riff-Diff,他们生成了 36 个全新的设计序列。

实验结果令人震惊:在 36 个设计中,有 35 个可以作为可溶性蛋白表达,其中 32 个(91%)表现出了显著的催化活性。这个成功率在从头设计领域简直是闻所未闻。更令人兴奋的是具体的数据,其中表现最好的两个设计,被命名为 RAD29 和 RAD35。

RAD29
催化速率常数(kcat)达到 3.1 × 10-2 s-1

RAD35
催化速率常数(kcat)高达 3.6 × 10-2 s-1

这两个数字意味着什么?这比未催化的反应速率提高了约 5 × 106 倍。更重要的是,这个活性已经超越了著名的催化抗体 38C2(1.1 × 10-2 s-1),并且与经过多年定向进化优化的 RA95.5-8F 处于同一个数量级。

要知道,38C2 是免疫系统在千万级库容量中筛选出来的,而 RA95.5-8F 经历了 13 轮艰苦的实验室进化。Riff-Diff 仅通过筛选不到 40 个克隆,就达到了它们的高度。这就是“一步到位”的含金量。

此外,RAD35 还展现出了极高的立体选择性。在逆向反应的动力学拆分中,它对 (R)-构型底物的偏好极其明显,在正向醛缩合反应中,其产物的对映体过量值(ee值)高达 99%(E-value > 200)。这意味着它不仅是一台高效的机器,更是一台高精度的机器。

挑战非自然反应:Morita-Baylis-Hillman

如果说逆羟醛反应还是自然界中存在的反应类型,那么 Morita-Baylis-Hillman (MBH) 反应则是纯粹的有机合成化学产物,自然界中并没有已知的酶能高效催化这一碳-碳键形成反应。这正是检验 Riff-Diff 通用性的绝佳战场。

研究人员选取了两个通过定向进化获得微弱 MBH 活性的酶(BH32.14 和 BH1.8)作为起点,提取了它们的活性中心几何结构。BH32.14 依赖一个精氨酸来稳定带负电荷的氧阴离子中间体,这对几何位置的要求极其苛刻。

结果再次证明了 Riff-Diff 的鲁棒性。在基于 BH32.14 活性中心的 18 个设计中,17 个显示出活性;在基于 BH1.8 的 45 个设计中,42 个显示出活性。总体成功率超过 93%。

其中,表现最优的设计 MBH48,其催化转化率虽然还未达到工业级水平,但其 kcat 值已经超过了作为模板的进化中间体 BH32.8,并且比仅含有活性中心基团的小分子催化剂强得多。这表明,Riff-Diff 能够为一个完全非生物学的反应构建出有效的催化微环境。

结构生物学的“恐怖谷”:完美并非真相

为了探究这些设计为何如此成功,以及为什么有些设计(如 RAD13)虽然有活性但不如 RAD35 高,研究人员解析了六个设计的晶体结构。这就引出了该研究中最发人深省的部分:静态结构的完美并不等同于动态功能的完美。

晶体结构数据显示,所有解析的设计(包括活性较低的 RAD13 和活性最高的 RAD36、MBH48)都展现出了惊人的结构精确度。设计模型与实验结构的骨架 RMSD(均方根偏差)均小于 1.2 埃。特别是对于活性位点的侧链,RAD13 的实验结构与设计模型的偏差仅为 0.42 埃,几乎达到了原子级的重合。

然而,RAD13 的活性却比 RA95.5-8F 慢了 10 万倍。

这是一个巨大的悖论:如果原子都在它们该在的位置,为什么酶不工作?传统的酶设计理念过度强调了“锁钥模型”般的静态匹配。研究人员通常认为,只要活性位点的侧链 RMSD 足够低,酶就应该具有高活性。但 RAD13 的例子无情地打破了这一迷信。它告诉我们,仅仅把氨基酸摆在正确的位置是不够的,侧链均方根偏差(Sidechain RMSD)并不是预测活性的可靠指标。

动态的幽灵:从静态快照到动态电影

为了解开这个谜题,研究人员利用分子动力学(MD)模拟和 AlphaFold3 对这些酶进行了更深入的“体检”。

通过 20 纳秒的分子动力学模拟,差异开始显现。尽管在晶体结构(静态快照)中看起来完美,但在溶液状态(动态视频)下,许多设计酶的活性中心表现出了过度的柔性。与经过高度进化的 RA95.5-8F 相比,设计酶的活性位点残基在模拟过程中更容易发生构象漂移。例如,在 RAD36 的晶体结构中,甚至直接观察到了催化赖氨酸的三种不同构象,其中一种构象完全指向了活性口袋之外。这种“心不在焉”的催化残基,自然无法维持高效的反应。

更关键的发现来自于 AlphaFold3 的预测。

研究人员并没有让 AlphaFold3 预测酶的空载结构,而是让它预测酶与反应中间体(hemiaminal intermediate)共价结合后的复合物结构。结果发现,AlphaFold3 预测的结构特征与实验测得的催化活性之间存在显著的相关性(Spearman ρ = -0.64)。

具体来说,那些 AlphaFold3 预测能够形成完美的“近进攻构象”(Near-attack conformation)、氢键距离理想、且酪氨酸能够正确充当质子穿梭机的设计,往往具有更高的活性。

这揭示了一个深刻的道理:酶的设计不能仅基于对基态或单一过渡态模型的静态模拟,必须考虑到蛋白质在反应过程中的动态重构能力。进化优化的不仅是结构,更是结构的“刚性”与“柔性”之间的精妙平衡——既要刚性地固定底物,又要柔性地适应反应进程中的电子重排。

稳定性与耐受性:超越天然酶的潜质

除了活性,工业应用还非常看重酶的稳定性。在这一点上,Riff-Diff 设计的酶展现出了 de novo 蛋白一贯的优势。

圆二色谱(CD)热变性实验显示,除了一个设计外,其余所有逆羟醛酶设计在 95°C 的高温下依然保持折叠状态。在化学变性剂盐酸胍(GdnHCl)的挑战下,RAD29 和 RAD35 的变性中点均超过了 3.0 M,表现出极高的热力学稳定性。

这种超高的稳定性不仅仅意味着它们耐热,更意味着它们能够容忍通过后续突变带来的不稳定性影响,为进一步的工程化改造提供了广阔的“突变空间”。

从“发现”到“创造”的范式转移

这项研究之所以能登上 Nature,不仅是因为它设计出了几个高活性的酶,更因为它标志着酶工程领域的一个范式转移。

在过去,我们是自然的“淘金者”,在庞大的基因组数据库中挖掘可能有用的序列;后来,我们变成了“修补匠”,对天然酶进行突变和拼接。而现在,借助 Riff-Diff 这样的 AI 工具,我们正在成为真正的“建筑师”。

Riff-Diff 证明了,只要我们能够定义一个合理的催化基序(Catalytic Motif),我们就有能力从零开始构建出一个与之完美适配的蛋白质环境。这个环境不仅能容纳活性中心,还能通过深邃的口袋提供必要的底物结合能,通过精准的支架提供催化所需的几何约束。

当然,挑战依然存在。RAD13 的例子提醒我们,目前的算法在处理蛋白质动力学方面仍有欠缺。如何将“动态特征”显式地纳入设计流程,将是下一代酶设计算法的圣杯。但这并不妨碍我们为这一刻欢呼。当 RAD35 在试管中以惊人的速度将底物转化为产物时,它转动的不仅是分子,更是合成生物学的未来齿轮。我们距离那个“按需定制催化剂”的时代,从未如此之近。

参考文献

Braun M, Tripp A, Chakatok M, Kaltenbrunner S, Fischer C, Stoll D, Bijelic A, Elaily W, Totaro MG, Moser M, Hoch SY, Lechner H, Rossi F, Aleotti M, Hall M, Oberdorfer G. Computational enzyme design by catalytic motif scaffolding. Nature. 2025 Dec 3. doi: 10.1038/s41586-025-09747-9. Epub ahead of print. PMID: 41339546.

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->