Nature Biotechnology——从“一对多”到“多对多”——PRIM-seq开启RNA-蛋白质互作研究的系统性新纪元
来源:生物探索 2025-09-14 09:44
研究人员开发了一种名为PRIM-seq的创新技术,首次系统性地揭示了人类细胞中数以万计的RNA-蛋白质相互作用,为我们理解基因表达调控和疾病机制打开了一个全新的维度。
生命是如何运作的?我们常常从“中心法则” (Central Dogma) 开始理解,DNA承载遗传密码,转录为RNA信使,再翻译成功能性的蛋白质。这个线性模型简洁而有力,但它描绘的仅仅是生命蓝图的骨架。真实的细胞世界远比这更为繁杂和动态,它更像一个熙熙攘攘的超级都市,充满了无数分子间的对话、合作与制衡。在这座都市里,RNA远不止是信息的传递者,它本身就是一位活跃的社交家,通过与各种蛋白质“伙伴”的结合,共同编织出一张复杂而精准的调控网络,指挥着细胞的生长、分化、应激乃至存亡。然而,想要窥探这张覆盖全基因组的RNA-蛋白质社交网络的全貌,一直是一项巨大的挑战。传统方法如同城市人口普查员,一次只能探访一个家庭(研究一种RNA或一种蛋白质),效率低下且视野局限。我们渴望拥有一张“卫星地图”,能同时捕捉到这座城市里所有分子的社交动态。
9月9日,《Nature Biotechnology》的研究报道“Genome-wide mapping of RNA-protein associations through sequencing”,为我们带来了这样一张前所未有的高清地图。研究人员开发了一种名为PRIM-seq的创新技术,首次系统性地揭示了人类细胞中数以万计的RNA-蛋白质相互作用,为我们理解基因表达调控和疾病机制打开了一个全新的维度。
大海捞针的困境:为何绘制“分子社交图谱”如此艰难?
在深入了解这项突破性技术之前,我们先来看看它所要解决的难题有多么艰巨。想象一下,人类基因组中大约有20,000个编码蛋白质的基因,同时还有数量相当的非编码RNA基因。如果任何一种RNA都可能与任何一种蛋白质相互作用,那么潜在的互作组合将是一个天文数字,高达4亿(20,000 x 20,000)种。这还未考虑可变剪接产生的不同蛋白质亚型和RNA异构体。要从如此庞大的可能性中筛选出真实存在的相互作用,无异于大海捞针。
过去的研究策略主要分为两大流派:“RNA中心” (RNA-centric) 策略,像一位明星的狗仔队,紧紧盯住一个特定的RNA分子,然后想方设法“钓”出所有与它结合的蛋白质。技术如RNA亲和纯化 (RNA affinity purification, RAP) 就属于此类。这种方法的优点是目标明确,但缺点是你必须预先知道你感兴趣的“明星RNA”是谁。对于功能未知的广袤RNA世界,这种方法显得力不从心。另一派是“蛋白质中心” (Protein-centric) 策略,类似于一位CEO的传记作者,聚焦于某一个蛋白质,通过免疫共沉淀等技术(如CLIP-seq),捕获所有被它结合的RNA。这种方法同样强大,帮助我们发现了大量RNA结合蛋白 (RNA-binding proteins, RBPs) 及其靶点。但它同样存在“管中窥豹”的局限性,我们一次只能了解一个蛋白质的“社交圈”。
这两种策略本质上都是“一对多” (one-to-many) 的研究模式。它们为我们绘制了许多局部的、零散的地图碎片,但我们始终缺乏一种能将所有碎片拼接起来,同时观察所有RNA和所有蛋白质相互作用的“多对多” (many-to-many) 的全局性方法。这正是PRIM-seq技术应运而生的背景,它旨在提供一个无偏见的、高通量的解决方案,一次性构建出整个人类RNA-蛋白质关联网络 (Human RNA-Protein Association network, HuRPA)。
巧妙的设计:PRIM-seq如何让蛋白质“自报家门”并“牵手”RNA?
PRIM-seq的全称是“通过测序进行蛋白质-RNA相互作用图谱绘制” (protein-RNA interaction mapping by sequencing),其核心思想极其巧妙:将每一个“RNA-蛋白质”的相互作用事件,转化为一条独特的、可被高通量测序解码的“嵌合DNA” (chimeric DNA) 分子。这条嵌合DNA的一端编码了蛋白质的身份信息,另一端则是与之结合的RNA序列。整个过程可以分解为两个关键模块:
模块一:SMART-display——为每个蛋白质贴上独一无二的“身份条码”。研究的第一步,也是最具创造性的一步,是如何在高通量水平上标记成千上万种不同的蛋白质。研究人员利用了一种名为SMART-display的技术。他们首先从细胞中提取所有的信使RNA (mRNA),这些mRNA是合成蛋白质的模板。然后,通过一个巧妙的分子生物学操作,在每条mRNA的3'末端连接上一个特殊的分子——嘌呤霉素 (puromycin)。嘌呤霉素是一个神奇的分子,它模拟了携带氨酸的tRNA,可以在核糖体翻译蛋白质的过程中“混”入其中。当核糖体沿着mRNA模板合成蛋白质链到达末端时,嘌呤霉素会被连接到蛋白质链的C端。由于嘌呤霉素已经预先被连接到了mRNA上,这就形成了一个共价连接的“mRNA-蛋白质”复合物。这个过程的绝妙之处在于,每个蛋白质都被它自己的编码mRNA“贴身标记”了。
模块二:REILIS——捕捉“社交瞬间”并转化为可读的DNA信号。有了这个带有“身份条码”的蛋白质文库,下一步就是让它们与细胞中的所有RNA分子进行“社交”。这个过程被称为REILIS (reverse transcription, incubation, ligation and sequencing)。首先,蛋白质上的mRNA“名牌”被逆转录成更稳定的互补DNA (cDNA),我们称之为cDNA1。接着,将来自目标细胞的整个转录组RNA文库加入其中,让它们充分相互作用,并使用甲醛进行交联,“定格”这些瞬间。最关键的一步,是通过一系列酶促反应,与蛋白质结合的RNA分子,会被“缝合”到该蛋白质自身的cDNA1身份标签上,形成一个“RNA-接头-cDNA1”的线性嵌合分子。最后,这些嵌合分子被高通量测序,通过双末端测序 (paired-end sequencing),生物信息学软件就能解码出“谁与谁互动”的全景网络图。
一张恢弘的蓝图:人类RNA-蛋白质关联网络 (HuRPA) 的诞生
利用PRIM-seq技术,研究人员对两种常用的人类细胞系:HEK293T(人胚肾细胞)和K562(人淋巴母细胞),进行了系统性的分析。将所有数据合并后,他们构建了一个前所未有的人类RNA-蛋白质关联网络,并将其命名为HuRPA。这张网络的规模令人震撼。它包含了超过365,094个独特的RNA-蛋白质相互作用,涉及11,311种蛋白质和7,248种RNA。其中,有2,610种蛋白质,每一种都至少与10个不同的RNA分子存在相互作用,显示了这些蛋白质在调控网络中的核心地位。
这张网络是什么样子的?研究发现,HuRPA呈现出典型的“无标度网络” (scale-free network) 拓扑结构。这在复杂系统中普遍存在,通俗地说,就是网络中大部分节点只有少数几个连接,而极少数“核心节点” (hubs) 却拥有大量的连接,如同社交网络中的“超级明星”。为了验证其可靠性,研究人员将其与已知的RNA结合蛋白 (RBP) 数据库进行了比较。在一个包含2,311个已知RBP的数据库中,HuRPA成功地识别出了其中的2,137个,覆盖率高达92.5%。统计学分析显示,HuRPA蛋白是已知RBP的富集程度极高,其比值比 (Odds Ratio, OR) 达到了17.0,这意味着在一个HuRPA蛋白中发现一个已知RBP的可能性,是随机情况下的17倍。这为PRIM-seq技术发现的数千个新的、潜在的RNA结合蛋白赋予了极高的可信度。
深入网络的肌理:三个来自HuRPA的精彩故事
一张宏大的地图固然重要,但其真正的价值在于图上那些详尽的标记和隐藏的宝藏。研究人员选择了一些在HuRPA网络中表现突出的分子,通过传统的实验方法进行验证,为我们讲述了几个精彩的“分子故事”。
故事一:LINC00339,RNA世界中的“社交名媛”。在HuRPA网络中,拥有最多蛋白质“朋友”的RNA是LINC00339,这是一个长链非编码RNA (lincRNA)。为了验证,研究人员挑选了15个与LINC00339互作的蛋白质,使用“RNA邻近连接技术” (RNA Proximity Ligation Assay, RNA-PLA) 在细胞原位进行观察。以胰岛素样生长因子2受体 (IGF2R) 蛋白为例,实验结果清晰地显示,在同时检测LINC00339和IGF2R的细胞中,平均每个细胞可以观察到16.3个明亮的荧光斑点。而在只检测蛋白质的对照组中,这个数值几乎为零,信号强度高出了69倍。所有15个被测试的组合都得到了阳性结果,这揭示了LINC00339可能扮演着一个前所未知的、多功能的调控中枢角色。
故事二:SMC1A, SMC3, RAD21,染色质“建筑师”的“兼职工作”。在经典生物学中,SMC1A、SMC3和RAD21是“黏连蛋白” (Cohesin) 复合体的核心成员,是DNA世界的“建筑师”。然而,PRIM-seq数据显示它们与大量的RNA存在关联。为证实这一点,研究人员采用“RNA免疫沉淀后测序” (RIP-seq) 技术。结果显示,RIP-seq发现的SMC1A结合的RNA靶点,与PRIM-seq的鉴定结果存在非常显著的重叠,统计检验的P值达到了惊人的1.1 x 10-66,这是一个极强的相关性信号。这一发现拓展了我们对这些经典染色质蛋白功能的认知,它们不仅是DNA的管理者,还可能通过与RNA的相互作用,参与到更广泛的基因表达调控中。
故事三:PHGDH,一个代谢酶的“秘密身份”。这个故事完美展现了PRIM-seq作为无偏见发现工具的威力。PHGDH(磷酸甘油酸脱氢酶)是一个众所周知的代谢酶,但在任何RBP数据库中都找不到它。然而,在HuRPA网络中,它却是一个耀眼的蛋白质核心节点,与多达885种不同的RNA存在关联。巧合的是,另一项研究也曾报道PHGDH内存在潜在的RNA结合结构域 (RBDs),而PRIM-seq的数据与之惊人地吻合。研究人员进一步证实,PHGDH确实能与调控细胞自噬 (autophagy) 的BECN1和调控凋亡 (apoptosis) 的ATF4这两种重要mRNA相结合。
更关键的是,这种结合有什么生物学意义?研究人员通过siRNA技术在细胞中将PHGDH的蛋白水平降低了约50%。奇妙的现象发生了:PHGDH被敲低后,BECN1和ATF4的mRNA水平没有改变,但它们的蛋白质水平却显著上升了!这个结果表明,PHGDH在正常情况下扮演着一个“翻译抑制者”的角色。更有趣的是,即便是“酶活性死亡”的PHGDH突变体,也依然能发挥这种抑制作用。这说明,PHGDH的RNA结合与调控功能,是其一个独立的、非经典的“月光功能” (moonlighting function),与其经典的代谢功能无关。
在一个更复杂的世界里重新思考生命
PRIM-seq技术的诞生和HuRPA网络的构建,不仅仅是为生命科学研究增添了一个强大的工具和一份宝贵的数据资源。更重要的是,它促使我们从一个更宏大、更网络化的视角来重新审视生命的复杂性。首先,它打破了蛋白质功能单一化的传统观念。PHGDH的故事告诉我们,“月光功能”可能远比我们想象的更为普遍。细胞内的分子世界,充满了跨界和兼职,这种多功能性赋予了生命系统更高的稳健性和适应性。
其次,它彰显了无偏见发现策略的巨大潜力。正是因为PRIM-seq不需要预设任何假设,它才能捕捉到像PHGDH这样完全意想不到的RNA结合蛋白。在生命科学进入“后基因组时代”的今天,这种能够系统性、全局性地提出新问题的技术,其价值甚至超过了那些只能验证已知假设的方法。
最后,HuRPA网络为我们理解人类疾病提供了一个全新的“藏宝图”。许多疾病,如癌症、神经退行性疾病和病毒感染,都与RNA-蛋白质相互作用的失调密切相关。通过分析特定疾病状态下HuRPA网络的变化,研究人员可以快速锁定关键的调控节点和异常的相互作用,为开发新的诊断标志物和治疗靶点提供前所未有的机遇。从简单的线性法则,到复杂的互作网络,我们对生命的理解正在经历一次深刻的范式转换。PRIM-seq为我们提供的,不仅是一张静态的地图,更是一个动态的、充满无限探索可能的全新大陆的入口。在这片大陆上,每一个新发现的RNA-蛋白质连接,都可能是一条通往未知生物学原理和疾病治疗新策略的路径,等待着我们去发掘和探索。细胞的秘密社交网络,其精彩的故事,才刚刚开始。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
