打开APP

Nature Genetics:解锁癌症的第三维度!当基因组从“线性”变“立体”,研究人员发现了肿瘤演化的新法则

来源:生物探索 2025-08-22 09:00

这项工作说明,三维基因组并非DNA序列的被动载体,而是癌症演化中一个积极、动态的参与者。它像一只“无形的手”,通过重塑染色质的空间构象,在基因表达的汪洋中掀起波澜,最终决定了肿瘤这艘巨轮的航向。

癌症,这个在生命科学领域中如幽灵般存在的顽疾,其根源深植于我们的基因组 (genome) 之中。长久以来,我们习惯于将基因组想象成一条由A、T、C、G四种碱基构成的线性序列,就像一本厚重的天书,而癌变则是书页上出现了错别字——基因突变。然而,真实的情况远比这复杂。我们的DNA并非随意地堆砌在微小的细胞核内,而是经过了精密的折叠与组织,形成了一个动态、复杂的三维结构,即“三维基因组” (3D genome)。这个结构决定了基因“天书”的哪些章节能够被阅读,哪些则被隐藏。

如果说一维的基因序列是剧本,那么三维基因组结构就是舞台的布景和导演的调度,它决定了哪个“演员”(基因)在何时何地登场,发挥怎样的作用。那么,当一个正常细胞一步步滑向癌变的深渊时,这个三维舞台是如何变化的?癌细胞是否通过重塑其基因组的三维结构,来激活“作恶”的基因,并抑制“守卫”的基因?

8月18日,《Nature Genetics》的研究报道“Tracing the evolution of single-cell 3D genomes in Kras-driven cancers”,为我们揭开了这个谜题的冰山一角。

研究人员以前所未有的分辨率,实时“直播”了在单个细胞内,从癌前病变到侵袭性肿瘤的整个过程中,基因组三维结构的演化全景。这不仅是一次技术的突破,更是一次对癌症演化认知维度的提升。

图片

建造“基因组GPS”:如何在细胞内给染色质定位?

要窥探单个癌细胞内部的三维基因组奥秘,首先需要一个足够强大的“显微镜”。传统的三维基因组研究技术,如Hi-C,通常需要数百万个细胞作为样本,最终得到的是一个“平均”的三维结构图。这就像试图通过分析整个城市所有居民的平均通话记录,来理解某两个人的社交关系一样,会丢失掉大量关键的个体信息。在肿瘤这个高度异质性的“社会”里,每个癌细胞都可能心怀鬼胎,走着不同的演化路径,因此,单细胞层面的解析至关重要。

为此,研究人员采用了一项名为“染色质追踪” (chromatin tracing) 的前沿成像技术。这项技术的原理十分巧妙,可以将其比作一个高精度的“基因组GPS系统”。研究人员首先在小鼠全部19条常染色体上,精心挑选了473个特定的基因组位点 (genomic loci),这些位点涵盖了经典的癌基因、抑癌基因和超级增强子等关键区域。随后,他们为每个位点设计了独特的“条形码”——一段特定的DNA序列。

实验中,他们将携带这些条形码的“初级探针” (primary probes) 注入到组织样本中,让它们精确地与基因组上的目标位点结合。接着,再用带有荧光分子的“二级探针” (secondary probe) 一轮一轮地去识别这些条形码,每次只点亮对应特定编码的位点。通过50轮双色成像,每次都像点亮夜空中的一两颗星星,最终就能在三维空间中描绘出这473个位点的精确坐标,从而重构出单个细胞内染色质的折叠路径。

更进一步,为了能清晰地追踪癌症的演化阶段,研究人员构建了一种特殊的K-MADM-Trp53小鼠模型。这种模型能模拟人类最常见的由Kras基因突变驱动的肺腺癌 (lung adenocarcinoma, LUAD) 的发生过程。它最巧妙之处在于,利用“马赛克分析双标记系统” (mosaic analysis with double markers, MADM),可以用不同颜色的荧光蛋白来标记不同基因型的细胞。例如,正常的肺泡二型上皮细胞 (AT2 cells) 不发光,而携带不同Trp53基因突变的癌前腺瘤 (adenoma) 细胞会分别显示为红色、黄色或绿色。只有那些完全失去Trp53抑癌基因功能的绿色细胞 (Trp53-/-),最终才会演变成致命的侵袭性肺腺癌。这样一来,研究人员只需通过观察细胞的颜色,就能轻松区分出正常细胞、不同阶段的癌前病变细胞以及最终的癌细胞,并对它们进行三维基因组的“拍照”。

癌症进化的“瓶颈”:先收紧,再放松的基因组之舞

有了这套强大的工具,研究人员开始仔细审视从正常细胞到癌细胞演化过程中,三维基因组究竟发生了怎样的变化。一个惊人的发现浮出水面:这种变化并非一路朝着某个方向线性发展,而是呈现出一种“非单调” (nonmonotonic) 的模式,仿佛一支先收紧、再放松的舞蹈。

在从正常的AT2细胞向癌前腺瘤细胞演化的早期阶段,研究人员观察到染色体内部的互作变得更加紧密,整个基因组呈现出一种“全局性压缩” (global compaction) 的状态。同时,一个更令人意外的现象是,在腺瘤阶段,不同细胞之间的三维基因组结构差异性(即异质性,heterogeneity)竟然显著降低了。数据显示,超过60%的基因组位点对 (locus pairs) 都表现出这种异质性减小的趋势。

这是一个非常反直觉的发现。通常我们认为,癌症的演化是一个不断累积多样性的过程,以适应复杂的环境并筛选出最具优势的“赢家”。为何在癌前病变这个关键的十字路口,所有细胞的基因组结构反而趋于一致了呢?研究人员推测,这可能是一个“结构性瓶颈” (structural bottleneck)。也就是说,癌变的早期阶段可能存在一个非常严苛的结构筛选机制,只有那些能够形成特定“紧凑且均一”三维基因组构象的细胞,才能存活下来并获得继续演化的“门票”。这种趋同性并非由新的基因突变驱动,因为在腺瘤细胞中并未检测到显著的基因突变,而更像是一种表观遗传或结构层面的适应性演化。

然而,这支舞蹈并未就此结束。当癌细胞突破瓶颈,从腺瘤发展为侵袭性的肺腺癌 (LUAD) 时,基因组结构又开始“放松”和“恢复”。染色质的紧凑程度下降,甚至比最初的正常细胞还要松散,这直接导致了LUAD细胞核的体积显著增大。同时,细胞间的异质性也再度升高,仿佛通过瓶颈筛选出的“种子选手”们,开始朝着不同的方向“野蛮生长”,为肿瘤的侵袭和转移积蓄力量。

更重要的是,这种“紧缩-放松”的非单调演化模式并非肺癌所独有。当研究人员将目光转向另一种同样由Kras驱动的恶性肿瘤——胰腺导管腺癌 (pancreatic ductal adenocarcinoma, PDAC) 时,他们观察到了几乎完全相同的演化轨迹。这强烈暗示着,这种结构性瓶颈可能是在Kras基因驱动的癌症演化中一个普遍存在的、至关重要的生物学事件。

“读心术”:仅凭3D基因组图谱就能分辨癌细胞身份?

既然不同癌症阶段的细胞拥有特征性的三维基因组“指纹”,那么我们是否能够反过来,仅凭这张“指纹”图谱就准确地判断出一个细胞的身份和它所处的演化阶段呢?

为了回答这个问题,研究人员开发了一个名为“Trace2State”的计算流程。他们没有直接使用复杂的染色质三维坐标,而是提取了一个更具生物学意义的特征——单细胞A/B区室得分 (scA/B compartment score)。在基因组中,A区室通常对应着基因活跃、染色质开放的区域,而B区室则对应基因沉默、染色质致密的区域。scA/B得分反映了每个基因位点在单细胞内所处的局部环境是偏向于“活跃”还是“沉默”。

他们将这些高维度的scA/B得分数据输入到机器学习模型中进行训练。结果喜人:模型能够以极高的准确率对细胞进行分类。在肺癌模型中,一个支持向量机模型预测细胞状态(正常、腺瘤或LUAD)的总体准确率达到了90%!这表明,单细胞的三维基因组构象确实蕴含了足够丰富的信息,足以作为区分癌症不同阶段的可靠生物标志物。

更有趣的发现来自于对那些“命中注定”要进展为恶性肿瘤的绿色腺瘤细胞 (AdenomaG, Trp53-/-) 的分析。通过降维聚类分析,研究人员发现,这些AdenomaG细胞的三维基因组结构,恰好散布在那些不会进展的腺瘤细胞和最终的LUAD细胞之间,呈现出一种过渡状态。进一步的定量分析显示,相比于其他良性腺瘤细胞,有更高比例的AdenomaG细胞已经提前采纳了“LUAD样” (LUAD-like) 的三维基因组构象。

这揭示了一个深刻的演化逻辑:在细胞形态上看起来还只是良性腺瘤的时候,它的三维基因组内部已经悄然开始了向恶性状态的转变。结构上的变化,领先于功能和形态上的变化。这就像一场风暴来临前,天空首先会变得阴沉一样,三维基因组的重塑可能是癌症恶性演化的一个早期预警信号。

从结构到功能:寻找驱动癌症的“幕后黑手”

三维基因组结构的改变最终必然会影响到基因的表达,从而驱动癌症的进展。一个关键的问题是,我们能否利用这些结构变化的信息,来更精准地揪出那些在背后推动癌症演化的“幕后黑手”——也就是关键的驱动基因?

研究人员提出了一个巧妙的筛选标准。他们认为,一个真正的“候选进展驱动基因” (Candidate Progression Driver, CPD),在从腺瘤到LUAD的转变过程中,不仅其自身的表达水平要上调,而且它所在的基因组区域,其scA/B得分也应该显著增加。这意味着,这个基因从一个相对“沉默”的B区室环境,被主动地迁移到了一个“活跃”的A区室环境。这种“位置”和“状态”的双重改变,才更有可能是一个具有功能意义的、被稳定激活的事件。

根据这个标准,他们筛选出了一批CPD基因。后续的分析证实了这套标准的强大威力。首先,通过单细胞RNA测序发现,这些CPD基因在LUAD细胞中的表达具有非常高的“同质性” (homogeneity),也就是说,几乎在每一个癌细胞中,它们都处于稳定开启的状态。相比之下,其他那些虽然表达上调但位置没有显著变化的基因,其表达则在不同癌细胞间表现出更大的波动。这种稳定的高表达,恰恰暗示了CPD基因对于所有癌细胞的生存都至关重要。

接下来,研究人员在临床数据中验证了这些CPD基因的威力。通过分析癌症基因组图谱 (TCGA) 数据库中肺腺癌患者的数据,他们发现,那些肿瘤中CPD基因特征信号最强的患者,其生存期显著短于信号最弱的患者,风险比 (Hazard Ratio) 高达5.12。这表明,CPD基因是预测病人预后的强有力指标。

不仅如此,在细胞实验层面,CPD基因也显示出其“命门”的特性。利用基因编辑技术在LUAD细胞系中对这些CPD基因进行系统性的敲低,研究人员发现,在测试的18个CPD基因中,有16个基因的缺失会显著抑制癌细胞的生长和存活,有效率接近89%。这一系列证据链条有力地证明,通过整合三维基因组结构和基因表达信息,能够比单独分析任何一个维度,都更有效地锁定癌症的“阿喀琉斯之踵”。

意外发现:一个“反派”调控因子的双重身份

故事至此,一个终极问题摆在了面前:究竟是什么力量在调控着三维基因组的这支“紧缩-放松”之舞?研究人员再次运用生物信息学工具,开发了一个名为“Trace2Regulator”的流程,旨在寻找那些可能结合在CPD基因区域,并调控其变化的蛋白因子。

出乎所有人意料的是,排名最高的候选者竟然是Rnf2。Rnf2是多梳抑制复合物1 (Polycomb Repressive Complex 1, PRC1) 的一个核心组分。在经典的教科书中,PRC1和Rnf2是以“基因沉默者”的“反派”形象出现的,它们的功能是抑制基因表达,维持细胞的“身份记忆”。然而在这项研究中,Rnf2的结合位点却与那些在癌症进展中变得更加“活跃”的基因区域高度重合。

这个反常的现象立刻引起了研究人员的警觉。他们通过实验证实,在LUAD细胞中,Rnf2蛋白确实更多地结合在活跃的A区室。更关键的证据来自于敲降实验:当他们在LUAD细胞中抑制Rnf2的表达后,细胞的三维基因组结构发生了显著变化,而这种变化的方向,恰恰是朝着从LUAD“逆转”回腺瘤状态的方向发展的。这直接证明了Rnf2是调控肺癌三维基因组演化的关键因子。

那么,Rnf2是如何扮演这个与它经典功能截然相反的角色的呢?研究人员进一步探究发现,Rnf2在癌症中促进基因活化的功能,竟然不依赖其作为泛素连接酶的经典催化活性。即使是人为突变掉其催化活性的Rnf2蛋白,也依然能够在一定程度上发挥调控三维基因组的作用。

这一发现揭示了一个著名调控蛋白在癌症中的非经典功能 (noncanonical function),挑战了我们对它的传统认知。它表明,在肿瘤这个复杂的生态系统中,许多经典的生命法则都可能被改写,一些原本的“抑制者”也可能被“策反”,成为推动癌症演化的“帮凶”。

开启癌症研究的“第三维度”

回顾这项研究的历程,从构建单细胞分辨率的“基因组GPS”,到发现癌症演化中令人意外的“结构性瓶颈”;从利用机器学习“读取”细胞的三维基因组身份,到筛选出与临床预后和治疗靶点高度相关的CPD基因;最终,还揭示了一个经典调控因子的“双重身份”。

这项工作说明,三维基因组并非DNA序列的被动载体,而是癌症演化中一个积极、动态的参与者。它像一只“无形的手”,通过重塑染色质的空间构象,在基因表达的汪洋中掀起波澜,最终决定了肿瘤这艘巨轮的航向。

这为我们理解和对抗癌症打开了一个全新的“第三维度”。未来的癌症诊断,或许不再仅仅依赖于寻找基因序列上的“错别字”,而是可以通过解读患者癌细胞的三维基因组“指纹”,来更早期、更精准地判断其恶性程度和演化风险。未来的靶向治疗,或许可以超越传统的抑制某个蛋白激酶的思路,转而开发能够“修正”异常三维基因组结构的新型药物。将这张三维结构图谱与空间转录组学、蛋白质组学等技术相结合,我们有望在不久的将来,绘制出一幅关于癌症的、真正全景式的、动态的生命地图。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->