打开APP

Nature Methods:告别“猜谜”式研究!CellNEST为细胞通讯分析带来前所未有的精准度与深度

来源:生物探索 2025-06-10 15:55

他们开发了一款名为CellNEST的全新计算工具,它如同一位装备了人工智能(AI)武器的顶尖侦探,能够以前所未有的精度和深度,揭示细胞世界的秘密。

在我们的身体内,一座由亿万细胞构成的生命之城正悄然运转。细胞之间通过一套精密的“秘密电报”系统,即细胞间通讯(Cell-Cell Communication, CCC),来协调行动,共同维系着我们的健康。然而,一旦这套通讯系统出现故障,比如信息错乱或出现恶意信号,就可能引爆癌症、糖尿病等重大疾病。因此,精准“窃听”并破译这些细胞密语,已成为研究人员攻克疾病的关键。

然而,要做到这一点却异常艰难。传统方法就像把城市的所有居民打散混匀后才去分析他们的对话,完全丢失了关键的“地址”信息(空间位置),导致了大量的“冤假错案”。更重要的是,我们过去只能捕捉到零星的“点对点”对话,却对细胞间复杂的“信号接力赛”,即中继网络(relay network),一无所知。

6月6日《Nature Methods》的研究报道“CellNEST reveals cell–cell relay networks using attention mechanisms on spatial transcriptomics”,介绍了一位装备了顶尖人工智能(AI)的“细胞侦探”——CellNEST。它将空间转录组学提供的“细胞地图”与深度学习的“注意力机制”完美融合,能够以前所未有的精度,从海量背景噪音中识别出真正关键的通讯信号。它不仅能精准定位免疫细胞的“归巢信号”,更首次系统性地揭示了过去难以捉摸的“中继网络”。从破译大脑深处的“母爱密码”,到揭开“癌中之王”胰腺癌截然不同的“双面性格”,CellNEST正带领我们开启一个理解生命和对抗疾病的全新视角。

失落的“城市地图”:传统细胞通讯研究的困境

在CellNEST出现之前,研究人员已经开发了多种工具来研究细胞通讯。最常用的方法是基于单细胞RNA测序(single-cell RNA sequencing, scRNA-seq)技术。这种技术可以告诉我们单个细胞里有哪些基因正在活跃地表达。研究者们通常会这样做:在一个细胞群体中,寻找高表达“配体”基因的细胞,再在另一个细胞群体中,寻找高表达其对应“受体”基因的细胞,如果两者都大量存在,就认为它们之间可能存在通讯。

这个逻辑听起来很直观,但在实践中却困难重重,主要有以下几个核心痛点:

高“冤假错案率” (高假阳性率):仅仅因为配体和受体基因表达量高,就断定它们在进行通讯,这显然过于草率。细胞的基因表达受到多种因素调控,高表达并不等于实际的功能性通讯。研究表明,仅有约6%的基因会对配体信号产生显著的表达变化。这种“宁可错杀一千,不可放过一个”的策略,导致了大量的假阳性结果,让研究者们在信息的海洋中真假难辨。

丢失空间信息,如同把城市打成“一锅汤”:scRNA-seq技术有一个致命的缺陷——它需要将组织解离成单个细胞悬液才能进行测序。这个过程彻底破坏了细胞在组织中原有的空间位置信息。想象一下,为了研究城市里人与人的交流,我们先把所有市民从他们的家和办公室里抓出来,扔进一个巨大的搅拌机里,然后再分析他们。这样一来,你就再也无法知道谁是谁的邻居,谁和谁在同一个办公室工作。而细胞通讯,尤其是需要细胞直接接触的旁分泌(paracrine)和接触依赖性(juxtacrine)通讯,是高度依赖空间距离的。失去了这张“城市地图”,我们推断出的通讯就像是空中楼阁。

视野局限,只看到“点对点”的简单对话:过去的工具大多只能识别“发送者-接收者”这样单一的配体-受体对。但真实的细胞通讯远比这复杂。它可能是一个“信号接力赛”,称之为“中继网络”(relay network)。比如,细胞A向细胞B发送信号1,激活了细胞B;细胞B被激活后,随即向细胞C发送了全新的信号2。这种跨越多个细胞的信号传递链在生物学过程中普遍存在,但传统方法几乎无法捕捉到这种复杂的通讯模式。

为了克服这些挑战,研究人员迫切需要一种新的方法,它必须能够同时整合基因表达和空间位置信息,并且有能力从复杂的背景噪音中识别出真实、多层次的通讯模式。这正是《自然·方法》杂志上这篇重磅研究所要解决的问题。他们开发了一款名为CellNEST (Cell Neural Networks on Spatial Transcriptomics) 的全新计算工具,它如同一位装备了人工智能(AI)武器的顶尖侦探,能够以前所未有的精度和深度,揭示细胞世界的秘密。

AI侦探CellNEST登场:用“注意力”聆听细胞私语

CellNEST的强大之处在于它巧妙地融合了两种前沿AI技术:空间转录组学(spatial transcriptomics)和深度学习(deep learning)。

首先,它利用了空间转录组学技术,如Visium或MERFISH。这些技术能在保持细胞原始空间位置不变的情况下,获取其基因表达谱。这就好比我们终于拿到了一张高清的“城市地图”,上面不仅标注了每个市民(细胞)的位置,还记录了他们正在“说什么”(基因表达)。

有了这张宝贵的地图和通讯记录,CellNEST的深度学习“大脑”开始工作。它的核心是一个名为图注意力网络(Graph Attention Network, GAT)的复杂算法。我们可以这样理解它的工作原理:

构建“关系图谱”:CellNEST首先将整个组织样本转换成一个巨大的图(graph)。在这个图中,每个细胞或分析点(spot)都是一个节点(vertex),而细胞之间的潜在关系(比如空间上是邻居)则构成了边(edge)。这个图谱包含了数千个节点和数百万条边,构成了一个极其复杂的网络。

引入“注意力机制” (Attention Mechanism):GAT最神奇的地方在于它的“注意力”。当我们听一场演讲时,我们会自动地将注意力集中在最重要的关键词句上,而忽略那些无关紧要的背景噪音。GAT也是如此。在分析这个庞大的细胞关系图谱时,它会为每一条代表潜在通讯的“边”分配一个“注意力分数”。这个分数衡量了这条通讯对于理解整个组织区域的通讯模式有多重要。那些构成关键通讯模式、反复出现的信号,会获得很高的注意力分数;而那些随机的、孤立的“噪音”信号,则得分很低。

“对比学习”练就火眼金睛:那么,在没有任何“标准答案”(ground truth)的情况下,GAT是如何学会分配注意力分数的呢?CellNEST采用了一种名为深度图信息最大化(Deep Graph Infomax, DGI)的无监督对比学习(contrastive learning)策略。这就像训练一位艺术品鉴定师。我们不直接告诉他什么是真迹,而是给他看一幅真正的梵高《星空》,再给他看一堆随机涂鸦的“赝品”。通过反复对比,鉴定师的大脑会自己学会总结出真迹的“规律”和“模式”。DGI做的就是类似的事情:它会对比真实的细胞网络图和一个被随机打乱、破坏了结构的“腐败”网络图。通过学习最大化这两者之间的差异,模型就能深刻理解真实细胞通讯网络中蕴含的内在规律,从而为重要的通讯模式打上高分。

通过这一系列复杂的计算,CellNEST最终输出的不再是一张杂乱无章的通讯清单,而是一幅经过AI“侦探”精炼、标注了重点的“犯罪现场地图”。它能告诉我们,在组织中的哪个具体位置,哪些细胞之间,通过哪些特定的“电报”(配体-受体对),正在进行着最关键的对话,甚至这些对话是如何形成“接力赛”的。

牛刀小试:在淋巴结中精准定位“归巢信号”

理论再好,也需要实践来检验。为了验证CellNEST的准确性,研究团队首先选择了一个已经非常了解的生物学场景——人淋巴结中的T细胞归巢(T cell homing)。

我们知道,淋巴结是免疫系统的“指挥中心”,其中的T细胞区是T细胞集结和活化的地方。T细胞之所以能精准地找到这个区域,是因为一种被称为“归巢信号”的化学通讯在起作用。其中最经典的一对信号就是CCL19-CCR7。T细胞区的基质细胞会分泌趋化因子CCL19(配体),而T细胞表面则有它的受体CCR7。就像灯塔指引船只,CCL19-CCR7信号引导着T细胞精准地“停靠”到T细胞区。

研究团队将CellNEST应用于人淋巴结的Visium空间转录组数据上。他们假设,如果CellNEST足够准确,它一定能从数万个可能的配体-受体对中,识别出CCL19-CCR7,并将其定位在T细胞区。结果令人振奋:

精准识别:在数据库中超过12,605个可能的配体-受体对中,CellNEST成功地将CCL19-CCR7识别为T细胞区内丰度第二高的通讯信号。而排名第一的是CCL21-CXCR4,这是另一个已知的、功能相似的T细胞迁移信号。这证明了CellNEST能够从海量数据中准确地“钓”出关键的大鱼。

“注意力”的威力:更有趣的是,研究人员发现,虽然CCL19-CCR7信号的“注意力分数”极高(Fisher's exact test, P = 9.16 × 10⁻²²⁴),但它的原始基因共表达分数(coexpression score)其实并不在最高之列。这说明了什么?传统方法如果只看基因表达量,很可能会错过这个关键信号。而CellNEST凭借其强大的模式识别能力,洞察到这个信号在T细胞区内形成了稳定而重要的通讯模式,因此给予了它极高的权重。这正是“注意力”机制的威力所在。

空间定位的完胜:当研究人员根据注意力分数高低来可视化CCL19-CCR7信号时,发现得分最高的信号完美地集中在预先标注好的T细胞区内。随着筛选阈值的提高,信号的定位也越来越精准。相比之下,其他几种主流的细胞通讯分析工具,如COMMOT和NICHES,虽然也能检测到一些信号,但其预测的信号分布与真实的T细胞区位置存在明显偏差。CellNEST在空间定位的精准度上取得了完胜。

这个淋巴结的例子有力地证明了CellNEST不仅能“找对”,还能“找准”,其准确性和可靠性远超现有方法。

不止于点对点:揭开细胞间的“信号接力赛”

CellNEST最令人兴奋的突破,在于它能够识别并重构前面提到的“中继网络”。这是一个从“点对点”通讯到“网络化”通讯的认知飞跃。

在淋巴结的研究中,CellNEST不仅找到了单个的通讯信号,还进一步挖掘了它们之间的“接力”关系。它发现了一个丰度极高的“两跳”(two-hop)中继网络:CCL19-CCR7 → CCL21-CXCR4。

这个模式的生物学意义是:一个细胞(比如树突状细胞)释放CCL19,激活了携带CCR7受体的T细胞;这个被激活的T细胞可能随即被附近的另一个信号CCL21所吸引(CCL21的受体之一是CXCR4),从而完成更复杂的迁移或功能调节。这两个信号共同参与调控T细胞的活动,形成了一个功能单元。

通过分析参与这个中继网络的细胞类型,CellNEST发现主要是T细胞、树突状细胞等免疫细胞在“唱主角”,这与我们已知的免疫学认知完全吻合。为了进一步确认这些预测的可靠性,研究团队还为CellNEST配备了一个“证据库”,整合了已发表的蛋白质相互作用和转录因子调控数据。结果显示,CellNEST预测出的这些中继网络,其获得外部实验数据支持的置信度分数远高于随机组合,这表明它们很可能是真实存在的生物学事件。

这种发现中继网络的能力是革命性的。它意味着我们终于可以从分析孤立的“对话”,走向理解一场完整的“群聊”,从而更全面地洞悉细胞社会的复杂运作机制。

从大脑到肿瘤:CellNEST的跨界破案实录

一个强大的工具,必须能应对各种复杂的“案发现场”。研究团队在多个物种、多种组织和多种技术平台上测试了CellNEST,结果展示了其惊人的通用性和强大的实战能力。

鼠脑中的“母爱密码”

研究人员将CellNEST应用于小鼠大脑下丘脑视前区的MERFISH数据。这是一个达到单细胞分辨率的更高精度的技术平台。他们比较了有育幼行为的母鼠和未交配的处女鼠的大脑。

解码“母爱”信号:CellNEST发现,在育幼母鼠的大脑中,一个由催产素(Oxytocin, Oxt)及其受体Oxtr介导的通讯信号(Oxt-Oxtr)非常活跃。催产素被誉为“爱的荷尔蒙”,在建立母婴情感连接中扮演着核心角色。CellNEST精准地捕捉到了这个与育幼行为直接相关的关键信号。

惊人的分辨率:更令人惊叹的是,CellNEST能够将通讯定位到两个独立的单细胞之间。例如,它清晰地展示了一个兴奋性神经元(释放Oxt)与一个邻近的小胶质细胞(表达Oxtr)之间的直接对话。这证明了CellNEST的分析精度已经深入到单个细胞的“私语”层面,而不仅仅是细胞群体的“合唱”。

3D通讯网络:利用连续的脑切片,研究团队还构建了三维(3D)的细胞通讯网络。CellNEST不仅重现了二维切片中的发现,还识别出了一些跨切片的、只有在三维空间中才能看到的独特通讯,比如与能量代谢和情绪行为相关的Adcyap1-Mc4r信号。这展示了CellNEST向更高维度空间分析拓展的巨大潜力。

肺癌中的“侵略信号”

接下来,战场转移到人类疾病——肺腺癌(lung adenocarcinoma, LUAD)。肿瘤微环境是一个由癌细胞、免疫细胞、基质细胞等构成的复杂生态系统,其内部的细胞通讯是决定癌症进展的关键。

锁定关键“恶人”:在肿瘤区域,CellNEST发现了一个极其强势的通讯信号:APOE-SDC1。APOE(载脂蛋白E)已被证实能促进肺癌细胞的增殖和迁移,与患者的不良预后密切相关。CellNEST的发现与这一临床观察高度一致,并将这个信号的空间位置精准地“钉”在了癌巢区域。

识别“帮凶”网络:除了APOE,CellNEST还检测到了一系列与癌症转移密切相关的TGFβ信号。这些信号主要分布在肿瘤周围的基质区域,揭示了癌细胞如何“教唆”周围的正常细胞,为自己的侵略和扩散“铺路”。

预测转移路径:在肿瘤组织内的淋-巴结区域,CellNEST还识别出了与淋巴结转移相关的信号通路,如FN1-RPSA。这暗示了癌细胞可能通过这些特定的通讯途径,实现了向远处的“跳跃”式转移。

通过这些发现,CellNEST如同一位法医,不仅识别了肿瘤的“致命武器”(如APOE-SDC1),还绘制出了其完整的“犯罪网络”和“逃跑路线”。

胰腺癌的“双面性格” (压轴大戏)

胰腺导管腺癌(pancreatic ductal adenocarcinoma, PDAC)是“癌中之王”,其异质性极高,治疗极为困难。根据基因表达特征,PDAC主要分为“经典型”(Classical)和“基底样型”(Basal-like)两种亚型。经典型肿瘤分化较好,对化疗相对敏感;而基底样型则更具侵袭性,预后极差。这两种亚型为何会有如此天差地别的“性格”?它们内部的细胞通讯网络有何不同?这是该领域的一个核心谜题。

研究团队将CellNEST应用于两例包含不同亚型区域的PDAC患者样本。

发现共有的“地基”信号:在两种亚型共存的区域,CellNEST识别出了一个非常强的通讯信号LGALS3-ITGB4。LGALS3(半乳糖凝集素-3)是一个著名的“多面手”,在肿瘤与基质的相互作用中扮演关键角色。有趣的是,通过对PDAC类器官模型的验证,研究人员发现无论经典型还是基底样型,都高表达LGALS3,这说明它可能是维持胰腺癌基本恶性表型的一个“通用”信号。

揭示亚型专属的“秘密武器”:最关键的发现来了!CellNEST发现,在经典型肿瘤区域,一个名为PLXNB2-MET/MST1R的信号通路被特异性地、高强度地激活了。Plexin B2 (PLXNB2) 及其共受体MET是经典的信号分子,它们原本在神经系统发育中负责“导航”,但在癌症中却被“劫持”,用于驱动肿瘤的生长和迁移。通过对大量PDAC类器官模型的RNA测序数据进行验证,研究团队证实,MET基因的表达在经典型类器官中确实显著高于基底样型 (two-sided Fisher-Pitman permutation test)。

临床意义的佐证:这一发现意义重大。它首次在空间原位上,为两种预后截然不同的PDAC亚型找到了专属的、可区分的通讯“指纹”。利用癌症基因组图谱(TCGA)数据库进行生存分析,研究人员发现,CellNEST识别出的这些关键基因,如MET、PLXNB2、ITGB4等,都与PDAC患者的不良预后显著相关。这不仅验证了CellNEST预测的临床相关性,也为开发针对特定亚型的靶向治疗(如MET抑制剂用于经典型PDAC)提供了全新的思路和理论依据。

发现复杂的“粘连”中继网络:在胰腺癌中,CellNEST还发现了大量与细胞粘附、迁移和炎症相关的中继网络,其中最丰富的是FN1-RPSA → FN1-RPSA。这揭示了癌细胞和周围的成纤维细胞如何通过层层递进的信号,构建一个利于自身生存和扩散的“粘性”微环境。

可以说,在胰腺癌这个最复杂的“案发现场”,CellNEST展现了其作为顶尖“侦探”的非凡能力,它不仅能区分不同“罪犯”(亚型)的作案手法,还能找到他们各自的“致命弱点”。

未来已来:从“看”细胞到“懂”细胞

CellNEST的诞生,标志着细胞通讯研究进入了一个全新的时代。它完美地解决了传统方法的三大痛点,其优势可以总结为:

高分辨率和空间精准性:将基因表达与空间位置信息无缝结合,实现了从单细胞到组织区域的精准定位。

强大的模式识别能力:利用图注意力网络,从海量噪音中发现有意义的通讯模式,而不仅仅依赖于基因表达的绝对值。

革命性的中继网络检测:首次实现了对复杂“信号接力赛”的系统性识别和重构。

无与伦比的通用性:在不同物种(人、鼠)、不同技术平台(Visium, MERFISH, Visium HD)和不同生物学场景(健康、癌症、大脑)中都表现出色。

当然,作为一项计算工具,CellNEST也并非完美。它目前还无法完全确定一个信号是激活还是抑制,也无法判断通讯发生的时间先后。但它为我们提供了一幅前所未有的高精度“嫌疑犯地图”,极大地缩小了后续实验验证的范围。

为了让全球研究人员都能方便地使用这一利器,研究团队还开发了一个名为CellNEST-Interactive的可视化网页工具。研究者可以上传自己的数据,在三维交互式网络图中探索细胞通讯的奥秘,点击任何一个细胞,就能看到它正在参与的“对话”,这让复杂的数据变得直观而生动。

未来,随着空间多组学技术的发展,未来的CellNEST或许还能整合蛋白质组、代谢组甚至表观遗传组的信息,构建一个更加立体、动态的细胞通讯全景图。我们将不再仅仅满足于“看到”细胞在说话,而是能够真正“听懂”它们在说什么,以及为什么这么说。

从破译大脑的“母爱密码”,到揭示癌症的“双面性格”,CellNEST正在带领我们以前所未有的深度,探索生命这座复杂而精密的“细胞都市”。这位AI“侦探”的故事才刚刚开始,它必将在未来的生命科学和医学研究中,为我们带来更多颠覆性的发现。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->