Nature Medicine:生命并非线性衰老!LifeClock模型首次揭示18岁为界的“发育”与“衰老”双轨生物时钟
来源:生物探索 2025-11-02 14:57
研究人员开发出一种名为“LifeClock”的全新生物钟模型。它不依赖任何高精尖的组学技术,而是仅仅利用我们最熟悉、最常规的电子健康档案和实验室检验数据,便能描绘出一个人从婴儿期到老年期的完整生命轨迹
我们每个人都携带着两种时间。一种是写在身份证上的“年代年龄”(Chronological Age, CA),它公平地为每个人每年增加一岁,记录着我们从出生那一刻起在地球上度过的时光。而另一种,则是一种更为隐秘、更具个性化的时间——“生物学年龄”(Biological Age, BA)。它衡量的是我们身体内部细胞、组织和器官的真实损耗与衰老程度。你或许会发现,同样是40岁,有些人已显疲态,而另一些人则精力充沛,这背后,正是生物学年龄在悄然作祟。
长久以来,精确测量生物学年龄一直是生命科学和医学领域研究的热点。从最初基于DNA甲基化(DNA methylation)和转录组(transcription patterns)的“表观遗传时钟”,到后来融合了蛋白质组学、代谢组学乃至医学影像的“多组学时钟”,研究人员们不断尝试用更精准的刻度来度量生命。然而,这些方法大多依赖昂贵且复杂的技术,并且主要聚焦于成年后的衰老过程,对于生命早期,从呱呱坠地的婴儿到茁壮成长的青少年,这一关键阶段的生物学节律,我们知之甚少。
10月27日,《Nature Medicine》的研究报道“A full life cycle biological clock based on routine clinical data and its impact in health and diseases”,为我们带来了颠覆性的突破。研究人员开发出一种名为“LifeClock”的全新生物钟模型。它的独特之处在于,它不依赖任何高精尖的组学技术,而是仅仅利用我们最熟悉、最常规的电子健康档案(Electronic Health Records, EHR)和实验室检验数据,便能以前所未有的精度,描绘出一个人从婴儿期到老年期的完整生命轨迹。这不仅意味着一个更普适、更低成本的生物学年龄评估工具的诞生,更重要的是,它揭示了我们如何能够透过一份普通的体检报告,窥见未来数年甚至数十年的健康风险。

时间的“骗局”:为什么60岁的你,可能比隔壁80岁“更老”?
在深入了解这项研究之前,我们先来厘清一个核心概念:为什么要区分年代年龄和生物学年龄?
年代年龄是一个社会学和物理学上的常量,它忠实地记录了时间的流逝。然而,它却无法真实反映我们身体的健康状况。遗传背景、生活方式、环境暴露、疾病史……无数因素共同作用,导致每个人的衰老速率千差万别。生物学年龄正是为了捕捉这种差异而生。
当一个人的生物学年龄超过其年代年龄时,我们称之为“加速衰老”(accelerated aging)。这种“年龄差”(age gap)越大,通常意味着个体面临更高的疾病风险和死亡风险。例如,先前有研究表明,大脑生物学年龄偏大的人,往往伴随着感觉运动功能的衰退和更显老的外貌。慢性病患者的生物学年龄也常常会“超速”前进,提示疾病本身就是衰老过程的强力催化剂。
因此,一个准确的生物学时钟,就如同一个健康领域的“晴雨表”或“导航仪”。它不仅能告诉我们现在身处何方,还能预警前方的风暴,为我们争取到宝贵的干预窗口期,从而延长“健康寿命”(healthspan),而不仅仅是“生命长度”(lifspan)。
然而,构建这样一个理想的时钟并非易事。过去的模型,虽然在特定人群中表现优异,但普遍面临几个挑战:
数据获取成本高:依赖基因测序、质谱分析等技术,难以大规模应用于普通人群。
“快照”而非“电影”:多数研究基于单次或横断面的数据,无法捕捉个体健康状态随时间演变的动态轨迹。
忽略生命早期:几乎所有的衰老时钟都从成年开始“计时”,完全忽视了婴幼儿及青少年时期的“发育”过程。儿童期的生理变化是程序化的、快速的“发育”,而非成年期那种累积性损伤的“衰老”,将二者混为一谈,本身就是一种定义上的谬误。
正是这些尚未被填补的空白,构成了“LifeClock”研究的起点。研究人员们提出了一个大胆的设想:我们能否利用医疗系统中最庞大、最廉价、也最容易获得的数据宝库——电子健康档案(EHR),来构建一个覆盖全生命周期的生物钟?
大海捞针的艺术:如何从千万份病历中“炼制”生命时钟?
这项研究的规模是惊人的。研究人员整合了一个名为“中国健康衰老调查”(China Healthy Aging Investigation, CHAI)项目中的海量数据,涵盖了来自多个医疗中心的 9,680,764 名个体,总计 24,633,025 次的纵向临床访问记录。这是一片真正意义上的数据海洋。
然而,机遇与挑战并存。EHR数据虽然丰富,但也极其“粗糙”,充满了各种“噪音”:异构性(Heterogeneity)、数据缺失(Missing values)、批次效应(Batch effects)和纵向复杂性(Longitudinal complexity)。
为了驯服这头“数据巨兽”,研究人员开发了一个名为 EHRFormer 的核心算法模型。这是一个基于Transformer架构的深度学习模型。你可能对Transformer在自然语言处理领域的强大能力(例如驱动ChatGPT)有所耳闻,它最擅长的就是理解序列数据中的“上下文”和长程依赖关系。研究人员巧妙地将其应用到医学领域:将一个人的历次就诊记录,看作是一句描述其健康状况的“长句子”,而每一次就诊的各项检验指标,就是这句话里的“单词”。EHRFormer的任务,就是读懂这句“健康之语”。
为了实现这一目标,研究人员设计了一系列巧妙的训练策略:输入-输出掩码机制,迫使模型去理解各项指标之间复杂的生理学关联;对抗性训练,引入“判别器”来消除不同医院带来的“批次效应”;以及自回归训练,让模型根据过去预测未来,真正实现了从“静态快照”到“动态电影”的跨越。
通过这一系列复杂的“炼制”过程,EHRFormer成功地将每一个患者在每一次就诊时的庞杂EHR数据,转化为了一个简洁而信息密集的“数字健康表征”(digital representation)。这个表征,就是构建生命时钟的基石。
颠覆认知:生命的前18年不是“衰老”,而是“发育”
当研究人员利用这个强大的模型,对覆盖全生命周期的数据进行初步分析时,一个意料之外却又在情理之中的发现浮出水面。他们发现,生命的发育和衰老遵循着两种截然不同的生物学模式。以18岁为界,人体的各项生理指标呈现出显著不同的变化轨迹。
这启发他们放弃了构建单一“全生命周期时钟”的想法,转而为两个截然不同的生命阶段,分别打造了专属的生物钟:
1. 0-18岁:“儿童发育时钟”(Pediatric Development Clock)
这个时钟旨在衡量儿童和青少年的生理成熟度。研究结果显示,它的预测极为精准。模型预测的生物学年龄与真实年代年龄之间的平均绝对误差(Mean Absolute Error, MAE)仅为 1.07年,皮尔逊相关系数(PCC)高达 0.97。这意味着,仅凭常规的实验室检查结果,模型就能相当准确地判断一个孩子的生理发育进程。更有趣的是,驱动这个“发育时钟”的指针主要是与生长、代谢和器官成熟紧密相连的指标,例如肌酐(Creatinine, crea)、天冬氨酸氨基转移酶(Aspartate aminotransferase, AST)和总蛋白(Total protein, TP)。
2. 18岁以上:“成人衰老时钟”(Adult Aging Clock)
这个时钟则用于衡量成年人累积的生理损耗。它的平均绝对误差为 5.67年,皮尔逊相关系数为 0.90,表现出强大的预测能力。而驱动这个“衰老时钟”的,是另一组截然不同的生物学指标,包括经典的衰老标志物如尿素(Urea)、白蛋白(Albumin, ALB)和红细胞分布宽度(Red cell distribution width, RDW)。
一个至关重要的观察是:驱动“发育时钟”和“衰老时钟”的前20个最重要生物标志物,几乎完全不同。 这为“生命双时钟”理论提供了强有力的证据。它告诉我们,不能用衡量成年人衰老的尺子,去度量一个孩子的成长。这项研究首次在数据层面清晰地将“发育”(development)和“衰老”(aging)这两个过程区分开来,这本身就是对衰老生物学理论的重大贡献。
“健康水晶球”:你的体检报告,早已写下未来疾病的剧本
如果LifeClock仅仅是能更准确地“报时”,那它的价值还只实现了一半。这项研究最激动人心的部分在于,它证明了这个生物钟不仅能“回顾”过去和“衡量”现在,更能“预测”未来。
研究人员利用EHRFormer生成的“数字健康表征”,对整个超过900万人的队列进行了降维和聚类分析,识别出了 64个 具有不同健康轨迹的独特“患者集群”(patient clusters)。这些集群每一个都对应着一种特定的健康状态或疾病风险模式,构成了一幅令人惊叹的“健康风险地图”。
在儿童疾病的早期预警方面,模型展现了惊人的预测能力。例如,被划分到集群14的儿童,在未来发展为垂体功能亢进和肥胖的风险,分别是对照人群的 15.36倍 和 11.07倍!而在成年人慢性病的精准定位上,这种预测能力同样强大。例如,集群20的个体,其未来发生肾功能衰竭的风险暴增了 37.7倍。这意味着,在疾病的临床症状出现很久之前,常规血液检查中可能就已经显露出了特定的模式,而LifeClock成功捕捉到了这些微弱的“信号”。
研究团队进一步验证了模型直接用于疾病预测的性能。对于当前疾病的诊断,模型表现出了媲美甚至超越临床医生的能力,例如在诊断糖尿病时,其AUC值高达 0.98。对于未来疾病的预测,模型预测未来5年内多种主要疾病风险的AUC值普遍在 0.80到0.90 之间,预测未来10年风险的AUC也保持在 0.81到0.91。为了确保模型的普适性,研究人员还在著名的英国生物样本库(UK Biobank)中进行了测试,结果表明LifeClock的表现依然稳健,证明了其跨越种族、地域和医疗系统的强大泛化能力。
从“群体医学”到“个体导航”:生命时钟将如何改变我们的未来?
这项研究为我们描绘了一幅精准、个性化、且可及的未来医疗图景。
首先,它重新定义了“常规体检”的价值。 这项研究告诉我们,那些看似“正常”的数值,当它们以纵向、多维的视角被审视时,同样蕴含着比单个异常值更有价值的深层信息。
其次,它让“预测与预防”变得前所未有的具体和可行。 想象一下未来的场景:当你完成一次年度体检,你得到的将不再是一张布满数字的表格,而是一个动态的、可视化的个人健康报告。这种“个体导航”式的健康管理,将使医疗资源更有效地投向最高危的人群,实现真正的“上医治未病”。
最后,它为衰老研究本身打开了一扇新的大门。 通过LifeClock识别出的不同“衰老轨迹”集群,研究人员可以更深入地探究不同衰老模式背后的分子机制,为开发延缓衰老、防治老年疾病的干预措施提供全新的靶点。
当然,正如所有开创性的研究一样,LifeClock也并非完美无缺。但无论如何,这项研究已经为我们指明了方向。它巧妙地证明,解开生命奥秘的钥匙,有时并不在于寻找更奇异、更昂贵的分子,而在于用更智慧的方法,去解读那些我们早已拥有、却视而不见的海量数据。
这部隐藏于我们血液与病历中的“生命时钟”,它的指针已经开始转动。它不仅在度量我们的过去,更在昭示我们的未来。而我们,正站在一个能够读懂并可能重塑这个未来的新起点上。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。