Nature Methods | 突破蛋白质功能研究瓶颈:ORFtag高效标记与筛查技术
来源:生物探索 2024-07-14 12:47
为了克服这些挑战,研究人员开发了一种名为ORFtag的创新技术。ORFtag是一种多功能、成本效益高且效率高的方法,能够在蛋白质组范围内进行大规模平行标记和功能研究。ORFtag使用含有启动子、选择基
蛋白质在细胞中的各种功能执行过程中起着关键作用,系统地研究其功能对于现代生物学来说是一项重要而又复杂的任务。传统的遗传筛查方法,通过基因敲除或抑制来研究基因功能。尽管这些方法非常强大,但通常不能直接揭示蛋白质的具体功能,同时还受到功能冗余和基因必需性的限制。为了解决这些问题,研究人员开发了基于基因功能充分性的筛选方法。这些方法通过引入开放阅读框(ORF)文库直接评估蛋白质功能。然而,现有的系统方法不仅成本高昂且难以维持,还倾向于偏向较短的ORFs(<5 kb),这是由于DNA合成、克隆、病毒包装和细胞内传递的限制造成的。随着CRISPR-Cas9技术的发展,基因编辑和基因功能研究取得了显著进展。
利用这项技术,研究人员可以精确地在基因组中特定位点引入标签或进行基因敲除,从而研究基因功能。这些技术已经成功应用于多达1300个基因的系统标记。然而,实现全基因组范围的覆盖仍然是一个巨大的挑战,因为许多基因的表达水平或基因长度限制了传统方法的适用性。在这一背景下,ORFtag技术应运而生。ORFtag是一种创新的方法,通过使用含有启动子、选择基因、功能标签和剪接供体序列的逆转录病毒载体,实现了对内源开放阅读框(ORFs)的融合标记。ORFtag技术的多功能性、成本效益高且效率高,能够在蛋白质组范围内进行大规模平行标记和功能研究。(7月5日Nature Methods “Proteome-scale tagging and functional screening in mammalian cells by ORFtag”)具体而言,ORFtag通过大规模转染培养的细胞,使ORFtag盒随机整合到基因组中,并通过将功能标签与整合位点下游的剪接受体位点剪接,驱动邻近内源基因座的转录,形成近N端融合蛋白。利用这种方法,研究人员能够在小鼠胚胎干细胞中进行转录激活因子、抑制因子和转录后调控因子的功能筛查。筛查可识别出新的调控因子,包括通过其他方法无法获取的长ORFs。
综上,ORFtag技术的开发和应用,代表了蛋白质功能研究领域的一次重要进步。这一方法不仅为系统地研究蛋白质功能提供了新的工具,还为未来的基因功能研究和蛋白质工程奠定了坚实的基础。通过这种创新技术,研究人员可以在大规模上进行蛋白质功能的高通量筛查,从而更全面地理解蛋白质在细胞生物学中的重要作用。
蛋白质在几乎所有细胞过程中的核心作用,使得系统地研究其功能变得至关重要。然而,现有的方法在确定蛋白质功能方面仍然面临挑战。遗传性功能缺失筛选尽管能够识别参与特定细胞过程的基因,但通常不能直接提供蛋白质功能的深入见解。此外,功能冗余和许多基因的必需性也会限制这些方法的效果。
相比之下,基于充分性的检测方法能够直接确定蛋白质的功能。然而,目前系统的方法依赖于开放阅读框文库(open reading frame libraries, ORFeomes)的传递和表达,这不仅成本高昂且难以维持,还倾向于偏向于较短的ORFs(<5 kb),这是由于DNA合成、克隆、病毒包装和细胞内传递的限制造成的。
通过工程化的本地基因位点可以克服这些限制,最近的CRISPR–Cas9技术已经能够系统地标记多达1300个基因,但实现全基因组覆盖仍然具有挑战性。
为了克服这些挑战,研究人员开发了一种名为ORFtag的创新技术。ORFtag是一种多功能、成本效益高且效率高的方法,能够在蛋白质组范围内进行大规模平行标记和功能研究。ORFtag使用含有启动子、选择基因、功能标签和剪接供体序列的逆转录病毒载体。通过大规模转染培养的细胞,ORFtag盒随机整合到基因组中,并通过将功能标签与整合位点下游的剪接受体位点剪接,驱动邻近内源基因座的转录,形成近N端融合蛋白。
具体来说,ORFtag是基于逆转录病毒载体,这些载体包含一个启动子、一个选择基因和一个功能标签。标签后面接一个剪接供体序列。大规模转染培养的细胞后,ORFtag盒随机整合到基因组中,通过将功能标签与整合位点下游的剪接受体位点剪接,形成近N端融合蛋白。
在该研究中,研究人员通过三种不同的筛查方法验证了ORFtag的效用:
转录激活因子筛查:将蛋白质与细菌四环素阻遏蛋白(TetR)的DNA结合域融合,使其能够招募到整合的绿色荧光蛋白(GFP)报告基因上游的TetO结合位点。通过荧光激活细胞分选(FACS)筛选出GFP表达增加的细胞,鉴定出转录激活因子。
转录抑制因子筛查:使用构建的报告基因使GFP报告基因持续活性,通过FACS筛选出GFP表达减少的细胞,鉴定出转录抑制因子。
转录后基因调控因子(PTGR)筛查:将候选ORFs与lambda噬菌体N(λN)蛋白融合,使其能够招募到在报告基因3'非翻译区(UTR)中的boxB位点。通过筛选GFP表达减少的细胞,鉴定出在转录后水平上调控GFP表达的蛋白质。
ORFtag是蛋白质组功能筛查的多功能工具(Credit: Nature Methods)
图a. ORFtag方法的总体概述。ORFtag基于逆转录病毒载体,这些载体包含一个强启动子(Pstrong)、选择基因(NeoR)和功能标签。标签后面接一个剪接供体序列。在大规模转染的细胞中,ORFtag盒随机整合到基因组中,通过将功能标签与整合位点下游的剪接受体位点剪接,形成近N端融合蛋白。
图b. 三种不同的筛查方法。转录激活因子筛查:融合的蛋白质与TetR(细菌四环素阻遏蛋白)的DNA结合域融合,使其能够招募到TetO结合位点上游的GFP报告基因。通过荧光激活细胞分选(FACS)筛选出GFP表达增加的细胞,鉴定出转录激活因子。转录抑制因子筛查:构建的报告基因使GFP报告基因持续活性,通过FACS筛选出GFP表达减少的细胞,鉴定出转录抑制因子。转录后基因调控因子(PTGR)筛查:候选ORFs与lambda噬菌体N(λN)蛋白融合,使其能够招募到报告基因3'非翻译区(UTR)中的boxB位点。通过筛选GFP表达减少的细胞,鉴定出在转录后水平上调控GFP表达的蛋白质。
图c. ORFtag整合位点的基因组信息,显示了在Yap1(转录激活因子)、Zfp57(转录抑制因子)和Cnot9(PTGR因子)等基因座的插入位点。结果表明,在这些基因座存在显著的筛查特异性的插入富集。
图d. 火山图(volcano plot),突出显示了已知和新发现的筛查结果。
通过这三种筛查方法,研究人员发现了显著的、筛查特异性的插入富集,例如:
转录激活因子筛查:Yap1(转录共激活因子)
转录抑制因子筛查:Zfp57(含KRAB域)
PTGR筛查:Cnot9(mRNA去腺苷化酶复合物亚基)
使用严格的阈值(FDR < 0.1%,log2比值≥1)确定了139个潜在的转录激活因子,207个抑制因子和77个PTGR蛋白。激活因子靶蛋白包括几个已知的转录激活因子,如p65、Ep300、Mediator复合物亚基和所有Kmt2(a-d)组蛋白甲基转移酶,这些因其长ORFs(长达17 kb)无法通过传统方法筛查。抑制因子靶蛋白包括75个KRAB锌指抑制因子及其共抑制因子Trim28、HP1家族蛋白、H3K9甲基转移酶和Polycomb抑制复合物组件。PTGR筛查识别出microRNA路径(Ago2、Tnrc6a/b/c)和无义介导降解路径(Smg1、Smg9、Upf2)的核心组件,以及Ccr4-Not去腺苷化复合物(Cnot2、Cnot3、Cnot9)和翻译抑制剂(Eif4e2、Eif4enif1)。
ORFtag方法在蛋白质功能研究中的高特异性(Credit: Nature Methods)
实验设计与数据分析
不同筛查结果的重叠性: 图a展示了转录激活因子(绿色)、转录抑制因子(蓝色)和转录后基因调控因子(PTGR,黄色)筛查靶蛋白的重叠性。结果显示,三种筛查的靶蛋白几乎没有重叠,表明ORFtag不导致非特异性基因的反复和人为检测。
筛查靶蛋白的功能富集: 图b显示了筛查靶蛋白在人类同源基因中的富集情况,包括DNA结合域、激活域、抑制域和RNA结合蛋白。此外,激活因子筛查靶蛋白显著富集于ORFeome激活因子,尽管重叠有限。
功能领域的富集: 图c展示了激活因子、抑制因子和PTGR筛查靶蛋白的蛋白质结构域、生物过程和细胞成分的GO富集情况。结果显示,这些基因均与其相关的功能一致,进一步验证了筛查结果的特异性。
实验验证
独立验证筛查靶蛋白: 图2d展示了对选定筛查靶蛋白的独立验证结果。通过流式细胞术检测GFP强度,结果显示所有测试候选蛋白质,包括先前未与相应生物过程相关联的靶蛋白,均能够在招募实验中验证其功能。例如:骨架蛋白Pxn或未表征蛋白1700102P08Rik的招募足以强烈激活转录。E3泛素连接酶Trim8和未表征蛋白Msantd3的招募则足以抑制转录。神经活动相关蛋白Maco1和E3泛素连接酶Trim13在招募到mRNA的3'UTR时能够抑制报告基因表达。
未表征蛋白质的细胞功能分配: 为评估ORFtag在未表征蛋白质细胞功能分配中的潜力,进一步研究了锌指蛋白Zfp574的内源功能。ORFtag筛查特异性地将Zfp574识别为转录激活因子。使用生长素诱导降解系统(AID),结果显示Zfp574的耗竭导致显著的生长缺陷,表明Zfp574对细胞适应性至关重要。快速耗竭Zfp574后进行的PRO-seq进一步揭示了Zfp574严格作为转录激活因子的作用,这与ORFtag的结果一致。通过Cut&Run技术识别了Zfp574的140个基因组结合位点,其中大多数(87.9%)位于基因转录起始位点(TSS)附近,表明Zfp574作为选择性转录激活因子,特异性地结合并激活一小部分支持细胞适应性的基因。
为了验证筛查结果,研究人员选择了每个筛查中的八个,跨越广泛的富集得分,重点是尚未证明直接功能的蛋白。通过单独克隆和转染每个筛选出的蛋白,发现所有测试的候选蛋白质,包括先前未知的调控因子,都能够在招募实验中验证其功能。例如:Pxn和1700102P08Rik蛋白质的招募足以强烈激活转录。Trim8和Msantd3的招募则足以抑制转录。Maco1和Trim13在招募到mRNA的3'UTR时能够抑制报告基因表达。
为了评估ORFtag在未表征蛋白质的细胞功能分配中的潜力,研究人员进一步研究了Zfp574的内源功能。ORFtag筛查特异性地将Zfp574识别为转录激活因子。使用生长素诱导降解系统(AID),显示Zfp574的耗竭导致显著的生长缺陷,表明Zfp574对细胞适应性至关重要。快速耗竭Zfp574后进行的PRO-seq进一步揭示了Zfp574严格作为转录激活因子的作用,这与ORFtag的结果一致。通过Cut&Run技术识别了Zfp574的140个基因组结合位点,其中大多数(87.9%)位于基因转录起始位点(TSS)附近,表明Zfp574作为选择性转录激活因子,特异性地结合并激活一小部分支持细胞适应性的基因。
ORFtag的多功能性和高效性使其成为研究蛋白质功能的一种强有力工具。通过这种创新技术,研究人员可以大规模进行蛋白质功能的高通量筛查,从而更全面地理解蛋白质在细胞生物学中的重要作用。ORFtag不仅为系统地研究蛋白质功能提供了新的工具,还为未来的基因功能研究和蛋白质工程奠定了坚实的基础。通过这种创新技术,研究人员可以更深入地了解蛋白质在细胞过程中的具体角色,从而推动生命科学研究的不断发展。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。