打开APP

Science:征服“不可成药”靶点!AI为蛋白质世界的“幽灵”量身打造分子枷锁

来源:生物探索 2025-07-21 11:50

这项发表于《科学》的研究,无疑是蛋白质设计领域的一个里程碑。它提供了一套强大而通用的计算框架,系统性地解决了靶向IDR这一长期存在的挑战。

蛋白质是生命活动最主要的执行者,长久以来,我们对蛋白质的理解都建立在一个经典的模型之上:蛋白质会折叠成一个精确的三维结构,就像一把拥有特定形状的“钥匙”,去开启特定的生命过程“锁”。然而,在蛋白质世界里,还存在着一群特立独行的“幽灵”——它们被称为本质无序蛋白质 (Intrinsically Disordered Proteins, IDPs) 或含有本质无序区域 (Intrinsically Disordered Regions, IDRs) 的蛋白质。

这些IDR不像规矩的“钥匙”,它们缺乏稳定的三维结构,如同一根柔软的面条或一条随波逐流的丝带,在细胞内不停地变换着形态。这种“无形”的特性,让它们能够灵活地参与多种生命活动调控,但同时也让它们成为了现代药物研发中最令人头疼的“幽灵靶点”。传统的药物或抗体设计,如同制造一把钥匙,需要一个明确的锁孔。面对这些形态不定的IDR,传统方法常常束手无策。更糟糕的是,许多IDR与癌症、神经退行性疾病等重大疾病的发生发展密切相关。例如,臭名昭著的EWS/FLI融合蛋白,就是驱动尤文氏肉瘤的关键,而它的大部分功能区域都是无序的。

如何才能精准地捕捉并控制这些细胞内的“幽灵”?这曾是一个困扰了生物医药领域数十年的难题。7月17日发表在《Science》 上的研究,题为 “Design of intrinsically disordered region binding proteins”,为我们展示了一种颠覆性的解决方案。研究团队利用人工智能技术,不仅直面了“无序”这一挑战,甚至巧妙地将其转化为一种优势。他们开发出一种计算设计流程,能够为任意一段无序的氨基酸序列,量身定做一种高亲和力、高特异性的结合蛋白——就如同为一根柔软的面条,定制一副能将其牢牢抓住并固定成特定形状的“分子手套”。这项工作,为靶向这些“不可成药”的靶点,打开了一扇全新的大门。

当“锁钥”失灵:蛋白质世界的“无形之手”为何难倒英雄汉?

要理解这项研究的突破性,我们首先要深入体会问题的棘手程度。生命科学的中心法则告诉我们,序列决定结构,结构决定功能。对于绝大多数蛋白质而言,这句话是金科玉律。比如,酶的活性位点是一个精确的口袋结构,抗体的抗原结合区也是一个特定的凹槽。药物研发的核心,就是在这些固定的结构上,找到或设计出能够嵌入并发挥作用的小分子或大分子。

但IDR打破了这一定律。它们的氨基酸序列决定了它们不形成稳定的结构。这些区域富含极性或带电荷的氨基酸,缺乏足够的疏水核心来驱动折叠。因此,它们在生理条件下呈现为一种动态的构象集合体,像一群舞者,时刻在变换舞姿。

这给靶向带来了两大难题:

第一,没有固定的靶点。你为它的一个“舞姿”设计了药物,但它下一秒就变成了另一个姿态,药物便失去了结合位点。这就像试图用一把钥匙去开一个形状不断变化的锁,几乎是不可能的。

第二,特异性难以保证。由于缺乏独特的结构特征,一段IDR序列可能与其他蛋白质中的相似序列难以区分。如果设计的结合蛋白不够精准,就可能“误伤”其他无辜的蛋白质,引发严重的副作用。

以往,人们尝试通过筛选抗体库或免疫接种的方式来获得针对IDR的抗体,但这些方法费时费力,且成功率不高。更重要的是,无序的抗原在注射后容易被降解,难以激发有效的免疫反应。因此,能够通过计算方法,仅根据一段IDR的氨基酸序列,就从头设计出能与之紧密结合的蛋白质,一直是蛋白质设计领域一个遥不可及的“圣杯”。该研究团队的工作,正是要摘取这颗“圣杯”。

三步造“神兵”:AI“炼金术”如何打造定制化分子手套?

研究人员并没有试图去适应IDR的千变万化,而是反其道而行之:设计一个强大的结合蛋白,强行将目标IDR片段“诱导”或“固定”到一个有利于结合的特定构象上。这个策略被称为“诱导契合 (Induced fit)”。为了实现这一宏大的目标,他们开发了一套名为“Logos”的通用计算流程,整个过程如同一次分为三幕的“炼金术”表演。

构建“乐高”零件库——从重复序列到通用口袋

万丈高楼平地起。研究人员没有一开始就挑战复杂、无序的天然序列,而是从最简单的模式入手:重复的二肽序列。他们选择了五种具有代表性的二肽重复序列(如LK, RT, YD, PV, GA),这些序列能形成相对规整的伸展构象。利用经典的Rosetta设计方法,他们设计出了一系列能够像螺旋一样包裹住这些重复肽链的蛋白骨架。在这些骨架上,每一个重复单元都形成一个“口袋 (pocket)”,恰好能容纳目标肽链上的一个二肽。

实验验证表明,这一策略初步可行。例如,针对LK和PV重复肽设计的蛋白,显示出了纳摩尔 (nM) 级别的紧密结合。然而,对于极性更强的RT和YD序列,结合力则较弱。这说明,简单的重复设计不足以应对所有类型的氨基酸。更重要的是,天然的IDR并非简单的重复序列。因此,研究人员需要一种方法,将这些针对不同氨基酸的“口袋”进行自由组合,就像拥有了各种形状的乐高积木,现在需要将它们拼成一个全新的、非重复的模型。

AI“建筑大师”登场——用RFdiffusion组装与泛化

这正是深度学习生成模型大显身手的舞台。研究人员使用了他们开发的强大工具——RFdiffusion。RFdiffusion如同一个经验丰富的“建筑大师”,它能根据一些关键的结构片段(在这里就是那些预先设计好的“口袋”),智能地“脑补”出连接这些片段的其余部分,并最终生成一个完整、稳定且结构合理的蛋白质。

通过这个方法,研究人员将来自不同设计的、针对不同氨基酸的“口袋”进行排列组合,并用RFdiffusion将它们无缝连接起来,创造出大量全新的“嵌合体”蛋白骨架。这个过程不仅是简单的拼接,RFdiffusion还会对连接处和口袋本身进行优化和多样化改造。最终,他们构建了一个庞大的“模板库”,其中包含了大约1000个各不相同的、预置了结合界面的蛋白模板。这个库就像一个巨大的“分子手套”仓库,里面存放着各式各样、能够容纳不同氨基酸序列的手套雏形。

“穿针引线”与“精雕细琢”——为任意目标IDR找到最佳匹配

有了这个强大的模板库,接下来的任务就清晰了。当面对一个全新的、任意的天然IDR靶点时,“Logos”流程会启动最后的两步:

1. “穿针引线” (Threading):首先,系统会筛选出目标IDR中那些序列独特、不易在人体蛋白质组中引起交叉反应的8-40个氨基酸的短片段。然后,将这些短片段的序列,像穿线一样,“滑过”模板库中所有1000个模板的肽链结合槽。计算程序会评估每一个“序列-模板”组合的匹配度,寻找最有可能形成稳定结合的几个“最佳候选”。这就像在手套仓库里,为你的手找几副尺寸最合适的毛坯手套。

2. “精雕细琢” (Refinement):找到最佳候选后,研究人员会再次祭出AI工具,包括ProteinMPNN(一个能根据蛋白骨架预测最佳氨基酸序列的AI)和RFdiffusion,对“手套”和被抓住的“肽链”进行联合优化。这个过程会对结合界面进行精细调整,优化氢键网络和疏水相互作用,以最大化亲和力。经过这一轮精雕细琢,一副为特定IDR序列量身定做的、高亲和力的“分子手套”就正式诞生了。

整个“Logos”流程将物理模型与深度学习巧妙结合,实现了从无到有、从通用到特异的飞跃,为解决IDR靶向难题提供了一套系统化的强大武器。

从代码到现实:这些“分子手套”的实战成绩单有多亮眼?

一个设计方法是骡子是马,终究要拉出来遛遛。研究人员对他们设计的“分子手套”进行了全面而严苛的实验验证,其结果令人印象深刻。

他们首先挑战了18个合成的肽链靶点,其中包括一些拼写出英文单词和人名的序列,以检验该方法的通用性。在平均每个靶点测试约22个设计的情况下,他们成功获得了对所有18个靶点的结合蛋白。其中大部分设计的结合亲和力(以解离常数Kd值衡量,越小越紧密)都达到了纳摩尔级别。例如,针对一个名为“DANIELSILVA”的肽链,最佳结合蛋白的Kd值仅为9 nM。

更重要的是特异性。研究人员进行了一项“全员对战 (all-by-all)”的结合实验,用18种结合蛋白去分别测试它们与18种靶肽的结合情况。结果显示,一个设计出的结合蛋白,只与它被设计用来结合的那个靶肽有强烈的信号,而与其他17个靶肽几乎没有反应。这清晰地证明了这些“分子手套”戴对了手,不会抓错目标。

真正的考验,来自于真实的、具有重要生物学功能的天然IDR。研究人员选取了21个与疾病高度相关的IDR作为靶点。这些靶点来源广泛,涵盖了癌症相关受体、GPCR配体(如神经肽)、疾病标志物以及重要的支架蛋白,其序列和理化性质千差万别。

结果是惊人的。在这场大规模的“实战演习”中,研究人员总共为43个不同的靶点(包括18个合成靶点和21个天然靶点中的部分片段)设计了结合蛋白,并成功获得了其中39个的紧密结合物。这是一次性的设计流程,成功率极高。这些结合的亲和力非常出色,大多数Kd值都在皮摩尔 (pM) 到纳摩尔 (nM) 之间。例如,针对在癌症中高表达的间皮素 (Mesothelin, MSLN) 的一段IDR,他们获得了Kd小于1 nM的结合蛋白。针对与慢性疼痛相关的神经肽Dynorphin A,更是通过一轮优化,将Kd值从最初的约1 nM,降低到了惊人的低于60皮摩尔!这比许多商业化的抗体药物还要紧密。

尤其值得称道的是,该方法成功攻克了极性靶点这一“硬骨头”。蛋白质设计通常偏爱疏水相互作用,而极性或带电荷的氨基酸因为会带来能量上的不利,一直被视为设计中的“禁区”。研究人员挑战了多个极性残基比例极高的靶点,包括EWS/FLI融合蛋白的一段序列(84%为极性氨基酸)和疟疾环子孢子蛋白CSP的一段(80%为极性氨基酸),并都成功获得了结合蛋白。数据显示,针对这些极性靶点,设计出的“分子手套”与靶肽侧链之间形成的氢键数量,是针对非极性靶点时的三倍之多(平均每10个氨基酸,从4.3个氢键增加到12.3个)。这说明,“Logos”方法能够智能地构建出复杂的氢键网络来“中和”这些极性残基,实现了对传统设计“禁区”的征服。

眼见为实:X射线揭示“分子手套”如何驯服“顽皮丝带”

计算机模型终究是虚拟的。研究人员设计的“分子手套”在现实世界中到底长什么样?它又是如何抓住那条“顽皮丝带”的?为了回答这个问题,他们付出了巨大的努力,最终成功解析了一个结合蛋白(DYNA_1b7)与它的靶肽Dynorphin A复合物的共晶结构,分辨率为3.15埃。

当晶体结构的图像呈现在眼前时,所有人都为之振奋。实验测定的原子结构,与他们最初的计算设计模型惊人地吻合。将两者重叠后,结合界面的骨架原子均方根偏差 (RMSD) 仅有1.2埃——这是一个极小的值,有力地证明了他们的计算设计是精确和可靠的。

结构图清晰地揭示了“诱导契合”的奥秘。游离的Dynorphin A肽链本身是无序的,但在结合蛋白DYNA_1b7的“怀抱”中,它被固定成了一个伸展的、类似于β-折叠的构象。它的一些关键氨基酸侧链,如积木般完美地嵌入到结合蛋白预设的“口袋”中。同时,结合蛋白的多个天冬酰胺 (Asn) 残基,像伸出的“小手”,与肽链的主链骨架形成了多个关键的氢键,将它牢牢锁住。有趣的是,这个被“诱导”出的构象,与Dynorphin A在结合其天然受体(KOR阿片受体)时的紧凑螺旋构象截然不同。这说明,研究人员的设计有能力将目标IDR引导到一个全新的、非天然的、但有利于高亲和力结合的状态。

核磁共振 (NMR) 实验也从另一个角度证实了这一点。NMR谱图显示,自由状态下的Dynorphin A确实是无序的(信号弥散),而一旦与设计的结合蛋白结合,其谱图信号立刻变得清晰而分散,这是肽链从无序变为有序的典型特征。眼见为实,这些原子级别的证据,为“Logos”方法的成功提供了坚实的支撑。

不止于结合:这些AI造物在真实世界中能做什么?

设计出能紧密结合的“分子手套”只是第一步,更重要的是,它们在真实的生物学和医学场景中能发挥什么作用?研究人员展示了几个激动人心的应用案例,证明了这些AI造物巨大的潜力。

1. 细胞生物学研究的“捕捞网”

WASH复合物是细胞内一个调控物质运输的关键蛋白机器,其中一个名为FAM21的亚基含有一条长达1000个氨基酸的无序“尾巴”。研究人员为这条“尾巴”的一小段设计了一个结合蛋白。在免疫沉淀实验中,这个结合蛋白成功地从复杂的细胞裂解液中,像一张精准的“捕捞网”,将FAM21蛋白连同与之相互作用的其他四个WASH复合物成员一同“捕捞”了上来。这为研究蛋白质相互作用网络提供了一个前所未有的强大工具。

2. 疾病诊断的“探测器”

胱氨酸贮积症是一种罕见的遗传病,由CTN4基因突变引起。在蛋白质组学分析中,检测血液中微量的突变CTN4蛋白片段对于诊断和监测病情至关重要。研究人员设计了一个针对该突变肽段的结合蛋白,并将其固定在磁珠上。当这些磁珠与混有目标肽段的缓冲液甚至血液样本一起孵育时,它们能像“探测器”一样,精准地捕获目标肽段,回收率高达90%。这预示着,未来或许可以利用这类结合蛋白开发出低成本、高灵敏度的疾病诊断芯片。

3. 癌症靶向治疗的“导航弹”

间皮素 (MSLN) 是多种癌症(如胰腺癌)细胞表面高表达的蛋白,是热门的治疗靶点。研究人员将他们设计的MSLN结合蛋白与绿色荧光蛋白 (GFP) 融合。当这种融合蛋白与表达MSLN的胰腺癌细胞 (HPAC) 一起孵育时,绿色荧光清晰地标记在了细胞表面,如同“导航弹”精确命中目标。而对于不表达MSLN的对照细胞 (MCF7),则完全没有荧光信号。这表明,这些结合蛋白有潜力作为载体,将抗癌药物精准地递送到肿瘤细胞,实现靶向治疗。

4. 功能抑制的“拮抗剂”

Dynorphin A通过激活KOR受体来传递信号,与慢性疼痛和成瘾有关。研究人员在细胞水平测试了他们最优的Dynorphin A结合蛋白 (DYNA_2b2) 是否能阻断这一过程。结果显示,该结合蛋白能有效地“劫持”Dynorphin A,阻止其与KOR受体结合,从而抑制下游信号通路,其半抑制浓度 (IC50) 约为50.3 nM。这证明,这些设计的蛋白本身就可以作为功能性的拮抗剂,发挥类似药物的作用。

5. 活细胞内的绝对“专一性”

最后,为了检验这些结合蛋白在拥挤复杂的细胞环境中的特异性,研究人员设计了一个巧妙的共定位实验。他们将6种不同的结合蛋白分别与GFP融合,并将它们各自对应的6种靶肽与红色荧光蛋白mCherry和一个线粒体定位信号融合。结果,只有当“正确的结合蛋白”与“正确的靶肽”在同一个细胞中表达时,绿色的GFP荧光才会和红色的线粒体荧光完美重合。任何“错配”的组合,GFP都依然弥散在细胞质中。这一系列实验,加上一个20x20的体外结合矩阵,强有力地证明了这些“分子手套”即使在活细胞内也具有极高的专一性,绝不“脸盲”。

开启新大陆:当“无序”不再是障碍,而是设计的“蓝海”

这项发表于《科学》的研究,无疑是蛋白质设计领域的一个里程碑。它提供了一套强大而通用的计算框架,系统性地解决了靶向IDR这一长期存在的挑战。其核心的智慧在于,它将“无序”这一看似的“劣势”,转变成了设计的“优势”。对于一个结构刚性的蛋白质靶点,合适的结合界面可能寥寥无几;但对于一个柔性的IDR,它却可以被“塑造”成多种可能的高亲和力结合构象。研究人员正是通过在巨大的构象空间中进行搜索和诱导,为每一个IDR找到了它的“最优解”。

“Logos”方法的成功,为我们打开了一片广阔的“蓝海”。细胞中近三分之一的蛋白质含有IDR,它们参与了几乎所有的生命过程,也与无数疾病息息相关。这片曾经因为“不可成药”而被忽视的靶点大陆,如今正等待着我们去探索。我们可以想象,未来,利用这种技术,能够设计出针对阿尔兹海默症中tau蛋白无序区域的聚集抑制剂,或是针对癌症中关键转录因子无序激活域的降解剂。

更进一步,研究人员在论文中也展望了未来的方向:比如,设计能够识别特定磷酸化或乙酰化修饰的“分子手套”,从而可以探测或调控信号通路的动态变化;甚至,在这些结合蛋白上引入催化位点,将它们升级为能够对特定IDR进行切割或修饰的“定制酶”。

从追逐“幽灵”,到驯服“幽灵”,再到利用“幽灵”,这项工作代表了我们在理解和改造生命分子机器能力上的一次巨大飞跃。当AI的强大计算能力与研究人员对物理化学原理的深刻洞见相结合时,我们正以前所未有的速度,开启一个精准设计生命、对抗疾病的新纪元。那片由无序蛋白质构成的、充满神秘与挑战的新大陆,其大门已被叩开。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->