Nature Medicine:破译衰老与遗忘的密码?一部前所未有的“人体蛋白质地图集”如何改写神经科学的未来?
来源:生物探索 2025-07-18 09:50
汇集全球23个研究机构的力量,分析了超过35,000份生物样本,产生了约2.5亿个独立的蛋白质分析数据,构建了迄今为止世界上最大的、针对神经退行性疾病的蛋白质组学数据库。
我们的大脑如同一位精密的指挥家,协调着思想、情感与行动的交响乐。然而,神经退行性疾病的悄然侵入,试图让这曲华美的乐章逐渐失声、走向沉寂。全球有超过5700万人在与这种“大脑的慢性霜冻”作斗争,这个数字预计每20年就会翻一番。从逐渐侵蚀记忆的阿尔茨海默病 (Alzheimer's disease, AD),到束缚身体的帕金森病 (Parkinson's disease, PD),再到罕见但同样残酷的额颞叶痴呆 (frontotemporal dementia, FTD) 和肌萎缩侧索硬化 (amyotrophic lateral sclerosis, ALS),它们共同构成了一个巨大的医学挑战。尽管我们付出了巨大努力,但治愈的钥匙依然遥不可及。
为什么攻克它们如此艰难?部分原因在于,这些疾病像一群狡猾的“千面人”,每个患者的病理过程和临床表现都千差万别。更棘手的是,它们往往在出现明显症状前的数年甚至数十年,就已经在大脑中“潜伏”下来,等到我们察觉时,往往已错过了最佳的干预时机。我们需要一双能洞察“迷雾”的眼睛,一种能在疾病早期就捕捉到其蛛丝马迹的工具。
7月15日,《Nature Medicine》上发表的一项重磅研究“The Global Neurodegeneration Proteomics Consortium: biomarker and drug target discovery for common neurodegenerative diseases and aging”,为我们带来了前所未有的希望。该研究宣告了一个全球“超级英雄联盟”——全球神经退行性疾病蛋白质组学联盟 (The Global Neurodegeneration Proteomics Consortium, GNPC) 的诞生及其初步的惊人发现。他们完成了一项看似不可能的任务:汇集全球23个研究机构的力量,分析了超过35,000份生物样本,产生了约2.5亿个独立的蛋白质分析数据,构建了迄今为止世界上最大的、针对神经退行性疾病的蛋白质组学数据库。
积沙成塔的挑战:为何“众人拾柴”是唯一的出路?
在探索疾病的道路上,研究人员如同拼图玩家。单个研究机构拥有的数据,就像是拼图的一小块,虽然珍贵,却难以窥见全貌。尤其是在神经退行性疾病这个复杂领域,个体差异、疾病异质性以及多种病理共存的“共病理”现象,使得小规模研究得出的结论往往难以在其他人群中重复,如同在沙滩上建城堡,一阵风浪便可能将其冲垮。
蛋白质是生命活动的直接执行者。血液中的蛋白质组学 (proteomics)为我们提供了一个独特的窗口,让我们能实时“窥探”身体内部,包括远在大脑中发生的微妙变化。如果说基因 (gene) 描绘了生命的蓝图,那么蛋白质 (protein) 就是按照蓝图施工的建筑工人和机器,它们的状态更能直接反映当下的“施工”状况,即健康或疾病。
然而,要从血液中数千种蛋白质的微小波动中,找出与特定大脑疾病相关的可靠信号,需要极其庞大的数据量。这就好比在一场百万人级别的音乐会中,试图分辨出某个角落里一把小提琴发出的微弱杂音。单个研究机构的力量显然不足以应对如此浩大的工程。数据“孤岛”现象——即各个研究机构的数据相互独立、标准不一、难以共享——长期以来一直是阻碍该领域取得突破的巨大障碍。
为了打破这些壁垒,GNPC应运而生。这个由公共和私营机构组成的国际合作组织,目标明确:建立一个规模空前、标准统一的蛋白质组学数据库,并向全球研究界开放。他们汇集了来自世界各地的宝贵生物样本,包括血浆 (plasma)、血清 (serum) 和脑脊液 (cerebrospinal fluid),覆盖了AD、PD、FTD、ALS以及健康衰老等多种人群。更重要的是,他们对这些数据进行了“标准化”处理,确保来自不同实验室、使用不同技术版本(如SomaScan v3, v4, v4.1平台)的数据,都能在同一个框架下进行比较和分析。这就像让说不同方言的人学会了普通话,使得跨地域、跨队列的深度对话成为可能。
这个庞大的数据库,被安全地存放在一个名为“阿尔茨海默病数据倡议工作台”(AD Workbench) 的云端平台上。它不仅解决了数据存储和安全问题,还巧妙地应对了不同国家和地区(如欧洲的《通用数据保护条例》(GDPR) 和美国的《健康保险流通与责任法案》(HIPAA))复杂的数据隐私法规。这为全球研究人员提供了一个前所未有的“虚拟实验室”,让他们可以足不出户,就能探索这座数据的金矿。
现在,让我们一起跟随GNPC的脚步,看看他们从这座金矿中挖掘出的第一批“宝藏”。
第一批宝藏:从血液中倾听大脑的“求救信号”
研究人员首先将目光投向了血浆,这种易于获取的生物样本,是理想的“信使”,承载着来自全身器官(包括大脑)的信息。他们运用强大的统计学工具,对比了数千名患者(包括1966名AD患者、607名PD患者、175名FTD患者和254名ALS患者)与5879名健康对照者的血浆蛋白质谱,试图找出每种疾病独特的“分子指纹”。
阿尔茨海默病的特征:能量代谢与突触健康的双重警报
在AD患者的血液中,一幅清晰的蛋白质变化图景浮现出来。研究人员发现,有27种蛋白质的水平在AD患者中表现出持续且显著的升高。其中,一些蛋白质的名字对于神经科学领域的研究人员来说并不陌生,比如乙酰胆碱酯酶 (acetylcholinesterase, ACHE),它与大脑中重要的神经递质——乙酰胆碱的代谢密切相关,而靶向该系统的药物早已用于AD的症状治疗。另一些新发现的蛋白质则指向了新的方向,如SPC25、LRRN1和CTF1,它们在多个独立的队列中都表现出一致的升高。
与此同时,有130种蛋白质的水平在AD患者中一致性地降低。这些“沉默”的蛋白质同样提供了宝贵线索。例如,NPTXR,一种与神经元突触(神经细胞之间的连接点)功能和可塑性密切相关的蛋白质,其水平的降低,可能直接反映了AD患者大脑中突触连接的丢失——这是导致认知功能减退的核心病理过程之一。
更有趣的是,当研究人员将这些变化的蛋白质进行功能通路富集分析时,发现它们并非杂乱无章,而是巧妙地指向了几个核心的生物学过程。结果显示,AD相关的蛋白质变化与“糖代谢 (glucose metabolism)”和“糖酵解 (glycolysis)”通路高度相关。这为“AD是一种大脑能量代谢障碍性疾病”的理论提供了强有力的分子证据,表明大脑的“能源危机”可能通过血液信号反映出来。此外,“RAB蛋白香叶基香叶基化 (RAB geranylgeranylation)”通路的富集,则暗示了细胞内物质运输(即囊泡运输)系统可能也陷入了混乱,这会影响神经递质的释放和细胞废物的清理。
帕金森病的线索:蛋白质稳态与神经元导向的微妙失衡
转向PD患者,研究人员同样发现了一组独特的蛋白质变化。有40种蛋白质的水平显著升高,其中SUMF1、PRR15和RDH16等在多个队列中表现稳定。这些蛋白质的功能多样,例如SUMF1参与蛋白质的修饰和稳定性调控,暗示PD可能与细胞内蛋白质质量控制系统的失灵有关,这与PD的核心病理——路易小体(主要由错误折叠的α-突触核蛋白构成)的形成不谋而合。
在降低的蛋白质中,CLEC3B和SEMA4G等引起了研究人员的注意。SEMA4G是一种参与神经轴突导向的分子,它的减少可能与PD患者大脑中神经元连接的退化有关。
PD的通路分析也揭示了其独特的生物学特征。与AD相似,PD的蛋白质谱也显著富集在与“囊泡介导的运输 (vesicle-mediated transport)”和“RHO GTP酶信号通路 (signaling by RHO GTPases)”相关的通路上。这表明,尽管AD和PD的临床表现大相径庭,但它们在分子层面可能共享了某些共同的病理机制,特别是在细胞内物质运输这个关键环节上。这为开发能够同时干预多种神经退行性疾病的“广谱”疗法提供了新的思路。
寻找痴呆的“通用标尺”:一种跨越疾病的严重程度分子特征
除了识别各种疾病的“专属”蛋白质特征外,GNPC的研究人员还提出了一个更具雄心的设想:是否能找到一个“通用”的分子标尺,来衡量所有痴呆患者的疾病严重程度,无论他们得的是AD、PD还是FTD?
为此,他们利用了LASSO机器学习算法,对数千名患者的蛋白质数据和临床痴呆评定量表 (Clinical Dementia Rating, CDR) 得分进行了建模。CDR是一个评估痴呆严重程度的金标准,从0分(正常)到3分(重度痴呆)不等。
结果令人振奋。模型成功地筛选出了一个由256种蛋白质组成的“临床损伤特征 (clinical impairment signature)”。这个蛋白质组合的得分,与患者的CDR得分呈现出强烈的正相关性(训练集中相关系数r = 0.68,测试集中r = 0.58),意味着这个分子标尺能够较准确地反映患者的临床严重程度。更重要的是,这个标尺具有“跨诊断 (transdiagnostic)”的特性:无论是在AD患者 (r = 0.55)、FTD患者 (r = 0.85) 还是PD患者 (r = 0.70) 中,该蛋白质特征分都随着疾病的加重而升高。
这就像发明了一把可以测量“认知健康度”的分子尺子。在这把“尺子”上,贡献最大的“刻度”包括在AD分析中提到的ACHE和NPTXR,再次印证了它们在神经退行性病变中的核心地位。此外,还有一些与神经可塑性(如EPHA4、CNTFR)和免疫激活(如MSMP、KLK3)相关的蛋白质也名列前茅。这一发现的意义非凡,它不仅为评估疾病进展提供了客观的生物学指标,还可能帮助我们在临床试验中更精确地衡量药物疗效,加速新药的研发进程。
第二批宝藏:身体的“器官时钟”揭示了不同的衰老轨迹
衰老是神经退行性疾病最大的风险因素,但我们对衰老的理解,常常停留在“chronological age (时序年龄)”这个单一维度上。然而,我们身体内部的衰老速度并非整齐划一。你的心脏可能比你的肝脏“年轻”,而你的大脑可能又比你的肌肉“衰老”得更快。近年来,研究人员开发出一种巧妙的方法,可以通过血浆蛋白质组来估算不同器官的“biological age (生物学年龄)”,即所谓的“器官时钟”。
GNPC的研究人员将这一前沿技术应用到了他们庞大的数据集中,试图探寻不同神经退行性疾病是否与特定的器官加速衰老模式有关。他们计算了大脑、心脏、肝脏、肌肉等11个不同器官的“年龄差”(age gap)——即生物学年龄与时序年龄之间的差距。正的年龄差意味着该器官正在加速衰老。
分析结果描绘了一幅引人入胜的“器官衰老地图”:
阿尔茨海默病 (AD) 的系统性衰老特征:AD患者不仅表现出大脑(特别是与认知功能相关的部分)的显著加速衰老,其动脉 (artery)、肝脏 (liver) 和肠道 (intestine) 的“时钟”也走得更快。具体数据显示,动脉年龄差每增加一个标准差,患AD的风险就增加18%;肝脏年龄差的相应风险增加为11%;而肠道年龄差的风险增加则在12%到18%之间。这一发现有力地支持了“AD是一种全身性疾病”的观点,大脑的病变可能与身体其他系统的健康状况,特别是血管健康和代谢功能密切相关。
帕金森病 (PD) 的独特肌肉联系:与AD不同,PD患者的器官衰老模式呈现出独特的焦点。除了大脑的加速衰老外,最显著的关联出现在肌肉 (muscle) 上。肌肉年龄差每增加一个标准差,患PD的风险就增加12%。考虑到PD是一种以运动障碍为主要特征的疾病,这一发现暗示了肌肉系统的状态可能在PD的病理生理过程中扮演着比我们以往想象中更重要的角色,它可能是疾病的早期标志,甚至是致病因素之一。
额颞叶痴呆 (FTD) 的大脑中心模式:FTD患者的加速衰老主要集中在大脑,其他外周器官的关联则不那么明显。
这些发现如同为我们展示了一部交响乐的不同演奏版本。在健康的衰老中,各个器官(乐器)大致同步、和谐地老化。而在不同的神经退行性疾病中,某些特定的器官(乐器)却出现了“抢拍”或“跑调”的现象,导致了不和谐的旋律。这不仅加深了我们对这些疾病系统性影响的理解,也为未来的干预策略提供了新思路:我们是否可以通过改善特定外周器官(如肝脏或肌肉)的健康,来延缓甚至阻止大脑的退化?
第三批宝藏:解开“主风险基因”APOE ε4的双重身份之谜
在探索AD的遗传因素时,一个基因的名字如雷贯耳——载脂蛋白E ε4 (apolipoprotein E ε4, APOE ε4)。携带一个APOE ε4等位基因会使AD的发病风险增加3-4倍,携带两个则会增加12倍以上。它是迟发性AD最强的遗传风险因素。然而,一个长期困扰研究人员的问题是:当我们在AD患者血液中发现某种蛋白质水平发生变化时,这种变化究竟是由AD疾病本身引起的,还是由患者携带的APOE ε4基因引起的?或者两者兼而有之?
GNPC庞大的数据集和巧妙的分析设计,为解开这个“双重身份”之谜提供了绝佳机会。研究人员采取了一种“解耦”策略,试图将基因的影响和疾病的影响分离开来。
基因的“烙印” vs. 疾病的“伤痕”
他们发现,一些蛋白质的变化与APOE ε4基因的携带状态强相关,而与是否患有AD关系不大。例如,我们在前面提到的SPC25和LRRN1,无论是在健康的APOE ε4携带者还是在患病的APOE ε4携带者中,它们的血浆水平都显著高于非携带者。这表明,这些蛋白质的变化更像是APOE ε4基因在人体内留下的一个固有“烙印”,是基因表达的直接或间接结果。
与此形成鲜明对比的是,另一些蛋白质,如我们熟知的NPTXR和GDF2,它们的变化则与AD的诊断状态紧密相连,而基本不受APOE ε4基因型的干扰。无论患者是否携带APOE ε4基因,只要他们患上了AD,这些蛋白质的水平就会发生显著变化。这说明,这些蛋白质的变化更像是疾病过程在大脑和身体上留下的“伤痕”。
这种区分至关重要。它帮助我们筛选出真正反映疾病病理过程的生物标志物(如NPTXR),也让我们识别出那些可能揭示APOE ε4基因如何增加AD风险的分子(如SPC25)。
一个五蛋白模型即可“猜出”你的APOE基因型
APOE ε4对血浆蛋白质组的影响是如此之强,以至于研究人员仅用5种蛋白质(SPC25, NEFL, S100A13, TBCA, LRRN1)就构建了一个机器学习模型,该模型能在不知道任何人基因信息的情况下,仅凭血浆样本就能以极高的准确率预测出一个人是否是APOE ε4携带者。在独立的测试数据中,这个模型的预测准确性(以ROC曲线下面积AUC衡量)高达0.90到0.96。这是一个惊人的结果,意味着血浆蛋白质组中包含了关于我们遗传密码的丰富信息。
寻找疾病的“萌芽”:当基因风险与疾病早期信号重合
最激动人心的发现,来自于对“基因烙印”和“疾病伤痕”交集的探索。研究人员比较了两组人群的蛋白质谱:一组是认知健康的APOE ε4携带者,另一组是没有APOE ε4风险基因的AD患者。他们想知道,是否存在一些蛋白质,在这两组看似不同的人群中,都表现出相同的变化趋势?
答案是肯定的。他们找到了44种这样的“重叠”蛋白质。这些蛋白质,在尚未发病的APOE ε4携带者中就已经开始变化,并且这些变化的方向与AD患者中的变化完全一致。这就像是在疾病的“潜伏期”就捕捉到了它最早的分子足迹。这些蛋白质涉及免疫血管信号(如MMP8)、突触囊泡融合(如SNAP23)和脂质运输(如APOB),这些都与APOE ε4的已知生物学功能和认知衰退密切相关。
这一发现为我们描绘了APOE ε4可能如何“播下”疾病的种子:它可能通过改变这些特定蛋白质的水平,让大脑在年轻时就处于一种“易感”状态,为日后AD病理的全面爆发埋下了伏笔。这也为AD的超早期预防和干预提供了极具价值的潜在靶点。
一部待续的史诗:新大陆的地图,而非旅程的终点
GNPC及其首批研究成果,并非一个故事的结局,而是一部宏伟史诗的开篇。它向我们展示了,当全球智慧汇聚、数据壁垒被打破时,我们能取得多么巨大的飞跃。这个项目所建立的,远不止是一个数据库,它更像是一幅全新的“神经退行性疾病大陆地图集”。
这幅地图集首次以空前的精度和广度,描绘了不同疾病的分子地貌,标记出了重要的“山脉”(如AD的能量代谢障碍)和“河流”(如PD与AD共享的囊泡运输通路)。它还为我们提供了追踪“天气变化”(即疾病严重程度)的分子气压计,以及识别不同地区“地质特征”(即APOE ε4基因影响)的勘探工具。
当然,这幅地图目前还不是完美的。研究人群的多样性仍有待提高,需要纳入更多来自不同种族和地理背景的参与者。未来的版本还需要整合更多维度的数据,如基因组学、影像学以及更详细的临床信息,让这幅地图变得更加立体和丰富。
但毫无疑问,GNPC已经为神经退行性疾病的研究开启了一个“大数据”驱动的新纪元。它所揭示的蛋白质靶点,如NPTXR,正在为新药研发提供强有力的支持。它所验证的生物标志物,正在为构建更精准的早期诊断和预后评估工具铺平道路。最重要的是,通过秉持开放科学 (open science) 的精神,GNPC将这座数据的宝库向全世界的研究人员敞开。正如论文所言,这只是“一小部分研究人员的初步探索”,是向全球科学界发出的“合作邀请”。
当更多的探索者带着他们独特的工具和视角,踏上这片新大陆时,我们有理由相信,那些隐藏在衰老与遗忘背后的终极密码,终将被我们一一破译。而那一天,我们将能够真正地对神经退行性疾病说:你的时代结束了。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
