打开APP

Nature Genetics:解码自闭症“千人千面”——从“一体”到“四型”,我们离个性化干预又近了一步

来源:生物探索 2025-07-20 11:02

研究人员采用了一种巧妙的“以人为本”的计算方法,成功地将庞大的自闭症人群“分解”为四个截然不同的亚型,并首次清晰地揭示了每个亚型背后独特的遗传学和分子生物学“程序”。

在人类心智的广阔图景中,自闭症谱系障碍(Autism Spectrum Disorder, ASD)无疑是最复杂、最令人着迷,也最充满误解的领域之一。我们常说自闭症是一个“谱系”,意指它并非单一状态,而是一个包含了从轻微到严重、从社交困难到重复行为等各种特质的连续体。然而,“谱系”这个词,或许仍旧低估了其内在的惊人多样性。每一个被诊断为自闭症的个体,都拥有一个独一无二的世界——他们的行为模式、认知能力、共病(co-occurring conditions)以及内在体验,构成了一幅幅截然不同的“肖像画”。这种“千人千面”的现象,即异质性(heterogeneity),长期以来不仅困扰着家庭和临床医生,也为科研探索设置了重重迷雾。

我们如何才能穿透这片迷雾,理解自闭症为何以如此多变的方式呈现?这些表型差异的背后,是否隐藏着不同的生物学根源和遗传密码?7月9日,一项发表于《Nature Genetics》的重磅研究“Decomposition of phenotypic heterogeneity in autism reveals underlying genetic programs”,为我们提供了前所未有的答案。研究人员采用了一种巧妙的“以人为本”的计算方法,成功地将庞大的自闭症人群“分解”为四个截然不同的亚型,并首次清晰地揭示了每个亚型背后独特的遗传学和分子生物学“程序”。

图片

一片迷雾:为何自闭症研究如此棘手?

在探索自闭症的道路上,研究人员一直面临一个核心挑战:如何处理其极端复杂的异质性。传统的医学研究,往往倾向于寻找“共同点”。例如,研究心脏病,医生会关注所有患者都可能出现的高血压或高血脂;研究糖尿病,会关注血糖水平。这种“一刀切”的模式,在许多疾病中都取得了巨大成功。

然而,当这套逻辑被应用到自闭症上时,却屡屡碰壁。想象一下,你面前有几千名自闭症儿童。研究人员可能会尝试寻找一个能解释所有病例的“主基因”,或者一个所有人都表现出的“核心生物标志物”。但结果往往令人失望。某个基因突变在这个孩子身上似乎是关键,但在另一个症状相似的孩子身上却找不到;一种干预方法对某些孩子效果显著,对另一些孩子却毫无作用。

为了应对这种复杂性,研究人员转向了所谓的“以特征为中心”(trait-centric)的方法。他们不再试图解释整个自闭症,而是专注于某个单一的特征,比如社交沟通能力、重复行为的严重程度,或是智力水平。这种方法确实带来了一些进展,比如,我们知道某些基因与更严重的智力障碍(Intellectual Disability, ID)相关。

但这种方法也有其根本局限。它就像是盲人摸象,只抓住了大象的一部分。一个人的表型,从来都不是孤立特征的简单拼接。在真实的发育过程中,各种特征相互影响、相互塑造。一个孩子的语言延迟,可能会加剧他的社交退缩;而强烈的焦虑情绪,又可能放大他的刻板行为。这些特征交织在一起,形成了一个复杂的、动态的系统。将它们强行拆分,分别与遗传因素关联,就忽略了这种整体性的联系,好比试图通过单独研究面粉、鸡蛋和糖,来理解一块蛋糕的味道和口感。

因此,一个根本性的问题摆在了所有研究者面前:我们能否找到一种方法,不再将个体“碎片化”,而是将他们作为一个完整的“人”来看待?我们能否识别出那些由相似特征组合(combination of traits)所定义的人群,并进而探索这些人群背后共同的遗传学基础?这正是研究团队试图攻克的难题,而他们手中的“利器”,是一种强大的数学模型。

破雾之刃:一种全新的“以人为本”的研究范式

面对自闭症这片由数千个数据点构成的“迷雾”,研究团队没有选择传统的手术刀,而是祭出了一台精密的“超级分拣机”。这项技术的学名叫生成性混合模型(general finite mixture model, GFMM),但我们可以更形象地称之为“表型模式识别器”。

它的工作原理,可以用一个比喻来理解。想象你有一大堆混在一起的乐高积木,它们颜色、形状、大小各不相同。你的任务是把它们分类,但你事先并不知道应该按什么标准分。GFMM就像一个聪明的机器人,它不会简单地把所有红色的放在一起,所有圆形的放在一起。相反,它会观察所有积木的所有特征,然后自主学习,发现这些积木天然地倾向于形成几个“组合包”。比如,它可能会发现,有一类积木总是“小的、红色的、方形的”;另一类总是“大的、蓝色的、带齿轮的”。这种“以组合包为单位”的分类,就是一种“以对象为中心”(person-centered)的思路。

研究人员将这种思路应用到了人身上。他们收集了来自SPARK队列(一个旨在加速自闭症研究的大型美国数据库)的 5,392名 自闭症儿童的庞大数据。这些数据不是简单的诊断标签,而是极其详尽的表型信息,涵盖了 239个 不同的特征条目。这些特征来自多个标准化的问卷,包括评估社交核心困难的社交沟通问卷-终生版(SCQ),衡量重复行为的重复行为量表-修订版(RBS-R),评估广泛情绪和行为问题的儿童行为核查表(CBCL),以及记录关键发育里程碑的背景历史表。

这239个特征,共同构成了一个孩子在行为、社交、情绪和发育上的全景图。研究团队将这 5,392名 儿童的“全景图”数据,全部输入到GFMM模型中。模型不带任何预设,开始在海量数据中寻找潜在的、反复出现的“特征组合模式”。它的目标是找到一种分类方式,使得同一类别内的孩子们尽可能相似,而不同类别之间的孩子们尽可能不同。

经过复杂的计算和多轮的严格统计学评估(比如贝叶斯信息准则, Bayesian Information Criterion, BIC),一个清晰的答案浮现了:这 5,392名 自闭症儿童,可以被最稳定、最具有临床解释力地划分为 四个截然不同的亚型。这个“四分类”方案,不仅在数学上最优,也得到了临床专家的认可,认为它精准地捕捉到了他们在实际工作中观察到的不同类型的自闭症儿童。

四种色彩:自闭症谱系中的“隐藏部落”

通过GFMM模型的巧妙“分拣”,四个独特的自闭症亚型(或者说“部落”)显现出来,每个亚型都有其鲜明的“画像”。研究人员根据它们的特征,对它们进行了命名。

1. 中度挑战型 (Moderate challenges) - 占比 34% (n=1,860)
这是人数最多的一个群体。正如其名,这个亚型的孩子在各项评估中的困难程度相对“温和”。他们在社交沟通、重复行为等自闭症核心症状上的得分,虽然明确高于非自闭症的兄弟姐妹,但在所有自闭症儿童中处于较低水平。他们的特点是“核心症状为主,共病问题较少”。在发育方面,他们没有显著的整体性发育迟缓(Developmental Delay, DD),各项发育里程碑的达成时间与另外两个没有发育迟缓的亚型相比,没有显著差异。可以把他们想象成自闭症谱系中的“典型”代表,其挑战主要集中在自闭症的核心定义上,而较少受到其他严重认知或行为问题的困扰。

2. 广泛影响型 (Broadly affected) - 占比 10% (n=554)
这个亚型虽然人数最少,但其画像却最为深刻和复杂。这些孩子在几乎所有的评估维度上都表现出严重的困难。他们的社交沟通障碍和重复行为都非常显著,同时,他们还承受着沉重的共病负担。数据显示,他们在焦虑/情绪问题、注意力缺陷、破坏性行为等方面的得分极高。此外,他们也存在显著的发育迟缓,例如,他们开始说话的平均年龄显著晚于其他群体。这个亚型的孩子,其挑战是“广泛”且“深刻”的,自闭症核心症状与严重的精神、行为问题交织在一起,形成了一种非常复杂的临床表现。

3. 社交/行为型 (Social/behavioral) - 占比 37% (n=1,976)
这是人数第二多的群体,其画像非常有特点。这些孩子在自闭症的核心症状上,特别是社交沟通方面,表现出显著的困难。然而,他们最突出的特征是在行为问题上。数据显示,他们在注意力缺陷和破坏性行为方面的得分,与“广泛影响型”一样高,甚至在某些方面超过了他们。但与“广泛影响型”形成鲜明对比的是,这个群体的孩子没有普遍的发育迟缓。他们的发育里程碑,如第一次走路的时间,与非自闭症的兄弟姐妹相比,没有统计学上的显著差异。这意味着,他们的主要挑战集中在社交和后天习得的行为调控上,而非早期的基础性发育问题。

4. 混合型ASD伴发育迟缓 (Mixed ASD with DD) - 占比 19% (n=1,002)
这个亚型的画像呈现出一种“混合”或“精妙失衡”的状态。一方面,他们像“广泛影响型”一样,存在着非常显著的发育迟缓。数据显示,他们是所有亚型中,第一次走路和第一次说话平均年龄最晚的群体。例如,他们首次使用单词的平均年龄接近 30个月,而“社交/行为型”则在 20个月 左右。然而,在社交沟通和行为问题上,他们的表现却比“广泛影响型”和“社交/行为型”要好。他们的表型像是被发育迟缓这块“短板”严重拖累,但在其他方面,尤其是情绪和破坏性行为上,反而没有那么突出。

这四个亚型,如同四种不同的色彩,共同构成了自闭症这幅斑斓的画卷。重要的是,这些分类并非研究人员的主观臆断,而是从 5,392名 儿童的 239个 客观特征数据中“生长”出来的。它们不仅在症状严重程度上有所区别,更在症状的组合模式上有着本质的不同。例如,“社交/行为型”和“广泛影响型”都可能有严重的注意力问题,但前者没有发育迟缓,后者则有。这种组合模式的差异,正是理解自闭症异质性的关键。

不是纸上谈兵:当数据模型遇上真实临床

一个好的科学模型,不仅要在内部数据上看起来漂亮,还必须经得起外部现实的检验。研究人员深知这一点,他们设计了两个关键的“考验”来验证这四个亚型的真实性和普适性。

第一重考验:与外部临床诊断数据的对质

在建立模型时,研究人员故意“隐藏”了一些非常重要的信息——那就是由医生给出的正式临床诊断,比如注意力缺陷多动障碍(ADHD)、焦虑症、抑郁症等。这些诊断数据,就像是模型的“场外考官”。现在,是时候揭晓答案了。研究人员将这四个亚型与这些外部诊断数据进行匹配,结果令人振奋:模型的预测与临床现实高度吻合。

“广泛影响型”和“社交/行为型”这两个在问卷中表现出严重注意力缺陷和行为问题的亚型,在真实的临床诊断中,也显示出ADHD诊断的显著富集。例如,“社交/行为型”的ADHD诊断率是其他亚型儿童的 1.65到2.36倍。而“混合型ASD伴发育迟缓”,在临床数据中也确实在语言延迟、智力障碍和运动障碍的诊断上富集程度最高,比其他自闭症儿童高出 1.38到2.33倍。更重要的是,诊断年龄也验证了模型的发现。存在显著早期发育迟缓的“混合型ASD伴DD”和“广泛影响型”,其平均诊断年龄显著早于另外两个亚型。例如,“混合型ASD伴DD”的平均诊断年龄约为 40个月,而“社交/行为型”则晚得多,接近 60个月。这完全符合逻辑:一个孩子如果很晚才说话或走路,父母和医生会更早地注意到并寻求诊断。

第二重考验:在全新人群中的“复刻”挑战

一个模型在一个数据集上成功,可能是巧合。要证明它的普适性,就必须在另一个完全独立的人群中进行复制。研究人员找到了另一个著名的自闭症研究队列——西蒙斯单基因家庭队列(Simons Simplex Collection, SSC)。研究人员用在SPARK队列上训练好的模型,来分析SSC队列中 861名 儿童的数据。结果堪称完美。研究人员计算了在两个不同队列中各类特征的富集模式的相关性,皮尔逊相关系数(Pearson's r)高达0.927!这是一个惊人的数字,意味着在两个完全独立的人群中,这四个亚型的“画像”几乎一模一样。

这证明,研究人员发现的这四个自闭症亚型是稳定、可重复、且具有普适性的。它们是自闭症人群中真实存在的“子群体”,而非数据噪音或统计假象。现在,最激动人心的时刻到来了:这些表型上截然不同的“部落”,在他们的基因组中,是否也携带着不同的“部落印记”?

常见变异描绘出的不同轮廓

人类的遗传变异,大致可以分为两类:一类是常见变异(common variants),它们像人群中的流行款,广泛存在;另一类是罕见变异(rare variants),如同限量版,只在极少数人身上出现。研究人员首先将目光投向了常见变异,并利用目前最强大的工具——多基因风险评分(Polygenic Score, PGS)进行评估。结果再次与四个亚型的临床画像精准呼应:

在ADHD的PGS上,“社交/行为型”和“广泛影响型”的得分显著高于非自闭症的兄弟姐妹,也高于其他两个亚型。这完美地解释了为何这两个亚型在临床上有更高的ADHD诊断率。在与认知能力相关的PGS上,“广泛影响型”在受教育程度和IQ的PGS上得分显著低于其他群体,这再次印证了他们在认知和发育上的广泛困难。

这些发现说明,常见变异的组合,在塑造自闭症的共病表型和认知差异方面,扮演了重要角色。不同的亚型,携带着不同的常见变异“背景板”。然而,一个有趣的现象是,在自闭症本身的PGS上,各个亚型之间并没有显著差异。这恰恰反证了自闭症的极端异质性——不存在一个统一的“自闭症常见遗传配方”。这提示我们,要寻找更具决定性的遗传因素,或许需要转向那些更具破坏力的“炸弹”——罕见变异。

罕见变异揭示的“致命一击”

罕见变异,尤其是那些新发的、破坏性强的突变,被认为是许多神经发育障碍的“元凶”。研究人员重点分析了新发突变(De Novo Variants, DNVs)和罕见遗传变异(Rare Inherited Variants)。当他们分析这些罕见变异在四个亚型中的分布时,一幅清晰的、差异化的“遗传风险图谱”被绘制了出来。

“广泛影响型”的孩子,体内携带了最多、最具破坏性的新发突变。无论是导致蛋白质功能丧失的突变(LoF),还是有害的错义突变,他们的DNV负担都显著高于其他所有群体。这表明,他们的广泛困难,很大程度上是由这些“一次性”的、高冲击力的遗传打击造成的。

“混合型ASD伴DD”的画像则更为独特。他们不仅DNV的负担显著高于正常同胞,更重要的是,他们是唯一一个在罕见遗传变异上也显示出显著富集的亚型。与非自闭症同胞相比,他们携带的罕见遗传LoF变异的风险高出 2.55倍。这揭示了一种“双重打击”的模式:他们不仅承受了新生突变的风险,还从家族中继承了罕见的易感基因。

“社交/行为型”则处于另一个极端。他们的DNV负担在所有自闭症亚型中是最低的。这说明他们的遗传基础可能更多地依赖于我们前面提到的常见变异,而非罕见的、高冲击力的突变。

这些发现,清晰地将四个亚型在遗传层面上区分开来,为它们的表型差异找到了深刻的生物学根源。但研究人员没有止步于此,他们还想知道:这些突变,具体影响了哪些基因和生物学通路?

深入细胞的“作战室”:不同亚型,不同战场

如果说不同的罕见变异是投向基因组的不同类型的“炸弹”,那么这些“炸弹”最终引爆了哪些“军事设施”(即生物学通路)呢?研究人员通过功能富集分析(GO term analysis),探查了每个亚型中受突变影响的基因所参与的核心生物学过程。结果发现,不同的亚型,其细胞内的“战场”也截然不同。

“社交/行为型”和“中度挑战型”的突变基因,显著富集在与染色质组织、组蛋白修饰和DNA修复相关的通路上。这些过程是基因表达的“总开关”,这暗示着,这两个亚型的核心问题,可能出在基因表达的“宏观调控”层面。

“混合型ASD伴DD”的突变基因,则指向了一个完全不同的战场——神经元活动本身。这些基因显著富集在神经元动作电位、膜去极化和电压门控钠离子通道活性等通路上。这表明,这个亚型的核心病理,可能在于神经元通信的“硬件”层面出了问题。

“广泛影响型”的突变基因,则与一种名为脆性X智力低下蛋白(FMRP)的靶基因高度相关。FMRP在突触可塑性(synaptic plasticity)——即学习和记忆的细胞基础——中扮演着关键角色。这再次印证了“广泛影响型”在认知和发育上的严重困难,其根源可能与大脑最核心的学习记忆机制受损有关。

这些发现令人激动。它们表明,我们划分的四个亚型,不仅在行为上、遗传上不同,在分子和细胞层面也存在着本质的差异。它们是沿着不同的生物学路径,最终汇合到了“自闭症”这个共同的诊断标签之下。

时间的剧本:基因在何时“出错”决定了自闭症的模样

这项研究最巧妙、最令人惊叹的发现,在于将基因与时间联系了起来。我们知道,大脑的发育是一个漫长而精确的过程。那么,一个基因突变,发生在哪个发育阶段活跃的基因上,是否会影响最终的临床表型?

研究人员利用了一个单细胞人脑前额叶皮层发育转录组图谱,将这个“时间-空间-基因”图谱,与四个亚型的突变基因进行了匹配。一个美妙的、符合逻辑的模式出现了:

“混合型ASD伴DD”的孩子,其新生突变显著富集在那些主要在发育早期(胎儿期和新生儿期)高表达、之后表达量下降的基因上。这些基因,如同建筑的“地基”和“框架”,对大脑的早期构建至关重要。它们的突变,自然会导致严重的、早期的发育迟缓,这与该亚型的核心临床特征完美吻合。

与此形成鲜明对比的是,“社交/行为型”的孩子,他们的DNVs则显著富集在那些主要在发育后期(出生后)高表达的基因上。这些基因,如同建筑的“内部装修”和“智能家居系统”,负责大脑功能的精细调优。它们的突变,对早期的基本框架影响不大,但却严重影响了后期的社交、行为等高级功能的完善。这也与该亚型的临床特征完美契合。

这个发现,如同一把钥匙,解开了自闭症异质性中一个最核心的谜题。基因突变发生的时间点——或者说,受突变影响的基因在哪个发育阶段扮演关键角色——深刻地决定了自闭症最终呈现出的“模样”。这不再是简单的基因-行为关联,而是一个包含了“时间”维度的、动态的、四维的“遗传-发育-行为”模型。

解码之后:我们离个性化干预还有多远?

这项里程碑式的研究,为我们描绘了一幅前所未有的自闭症内部图景。它告诉我们,自闭症不是一个单一的实体,也不是一个模糊的谱系,而是一个由至少四个具有不同临床画像、不同遗传基础、不同生物学通路和不同发育轨迹的亚型构成的“联邦”。

这一发现的意义是深远的,为未来的研究和临床实践指明了方向:

从“一刀切”到“量体裁衣”:既然存在不同的亚型,未来的诊断和干预,就必须走向个性化。针对“社交/行为型”,或许可以更多地关注行为疗法和情绪调节;而针对“混合型ASD伴DD”,早期的发育支持和针对神经元功能的干预可能更为关键。

更精准的遗传咨询和预后判断:一个家庭如果得知孩子的突变基因属于“早期发育”类别,他们可以更早地获得关于孩子未来可能面临的发育挑战的信息,从而进行更有针对性的早期干预。

药物研发的新靶点:通过识别每个亚型特有的生物学通路(如染色质重塑、离子通道功能),研究人员可以为不同的自闭症亚型开发更具靶向性的药物,提高疗效,减少副作用。

未来研究的新范式:这项研究证明了“以人为本”的计算方法在解析复杂疾病异质性方面的巨大威力。未来的研究,需要收集更丰富、更多维度的表型数据,并与更全面的基因组数据相结合,去发现更多、更精细的自闭症亚型。

当然,我们必须承认,这只是解码之路的开始。这四个亚型,可能只是对复杂现实的一级近似,在它们内部,或许还存在着更细微的子分类。但毫无疑问,这项研究,已经为我们提供了一张宝贵的“藏宝图”。它让我们得以穿透迷雾,看到自闭症谱系内部的壮丽山川与河流,并指引我们去探索每一片独特风景背后的生命奥秘。

对于那些生活在自闭症世界里的个体和家庭而言,这项研究带来的最大希望或许是:他们的独特性,终于开始被科学所看见、所理解、所尊重。而这种理解,正是通往一个更包容、更有效的支持体系的第一步。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->