Nature Medicine:疫苗的“水晶球”!AI VaxSeer精准锁定未来流感毒株,有效性或将大幅提升
来源:生物探索 2025-09-01 10:13
研究人员开发了一个名为 VaxSeer 的创新性人工智能(AI)模型。
每年秋冬季,很多人都在重复一个熟悉的仪式:卷起袖子,接种最新的流感疫苗。这小小的一针,承载着我们对健康的期盼,希望它能像一道坚实的屏障,将肆虐的流感病毒拒之门外。然而,我们内心深处或许都有过这样的疑问:为什么去年的疫苗今年就不管用了?为什么即便接种了疫苗,有时还是没能幸免于一场重感冒?这背后,是一场人类与流感病毒之间永不停歇、分秒必争的演化竞赛。病毒如同一位狡猾的“伪装大师”,不断变换着自己的外形(即抗原性),试图逃脱我们免疫系统的识别。
而我们的疫苗,就像是发给免疫系统的一张“通缉令”,上面画着病毒的“肖像”。如果病毒的伪装变得太快,这张“通缉令”就会过时。事实上,这场竞赛的天平在过去很长一段时间里,并不完全向我们倾斜。根据美国疾病控制与预防中心(Centers for Disease Control and Prevention, CDC)的数据,在2012年至2021年的十年间,流感疫苗对门诊病人的总体有效性(vaccine effectiveness, VE)平均低于40%。在某些“糟糕”的年份,比如2014-2015年的流感季,疫苗的有效性甚至低至惊人的19%。这不仅仅是一个冰冷的数字,它背后是无数本可以避免的病痛、医疗资源的消耗,甚至是生命的逝去。
如何才能更精准地预测流感病毒的“下一步行动”,从而“绘制”出更准确的“通缉令”?这已成为全球公共卫生领域最棘手的挑战之一。
8月28日,《Nature Medicine》的研究报道“Influenza vaccine strain selection with an AI-based evolutionary and antigenicity model”,为我们展示了一条充满希望的新路径。研究人员开发了一个名为 VaxSeer 的创新性人工智能(AI)模型。它如同一位高明的“病毒猎手”,能够以前所未有的精准度,在数以万计的病毒变种中,预测出未来最可能流行的毒株,并评估候选疫苗对它们的“抓捕”能力。这或许将从根本上改变我们与流感病毒的博弈规则。
一场预知未来的豪赌:流感疫苗选株为何如此艰难?
要理解VaxSeer的革命性,我们首先需要走进那间决定全球数亿人健康的“作战指挥室”,了解传统的疫苗株选择过程是多么充满挑战。
每年,世界卫生组织(World Health Organization, WHO)都会召集全球顶尖的病毒学家和流行病学专家,举行两次闭门会议,分别针对南半球和北半球的下一个流感季,推荐疫苗所应包含的病毒株。这个决策过程,堪称一场基于科学数据的“高风险赌博”。专家们必须分析来自全球流感监测网络的海量数据,包括病毒的基因序列、抗原特性、地理分布和传播趋势,然后像侦探一样,从纷繁复杂的线索中,推理出几个月后最可能在全球范围内“称霸”的病毒株。
这场“赌博”的“赌注”之所以如此之高,其核心难点在于两个方面:病毒的“七十二变”与时间的“紧箍咒”。
流感病毒,尤其是在我们讨论的甲型流感病毒中,其表面有两个关键的蛋白质,如同它伸出的两只“手”:血凝素(hemagglutinin, HA)和神经氨酸酶(neuraminidase, NA)。其中,HA蛋白的角色至关重要,它像一把钥匙,负责识别并“撬开”我们呼吸道细胞的“锁”,从而入侵我们的身体。因此,我们的免疫系统在感染或接种疫苗后,产生的大部分保护性抗体,主要就是针对这把“钥匙”——HA蛋白。抗体一旦与HA蛋白结合,就能阻止病毒入侵细胞,从而实现免疫保护。
然而,流感病毒的遗传物质是RNA,其复制过程非常“粗心”,容易出错,导致HA蛋白的氨酸序列频繁发生微小的变异。这种持续不断的、渐进式的变异,被称为“抗原漂移”(antigenic drift)。这就像一个通缉犯,今天戴顶帽子,明天加副眼镜,不断微调自己的外貌。当这些变化积累到一定程度,我们免疫系统里原有的抗体“警察”就可能认不出它了,导致之前的免疫力失效。这就是为什么我们需要每年重新接种流感疫苗。
而时间的“紧箍咒”则让这个预测问题雪上加霜。从WHO推荐疫苗株,到疫苗完成生产、质检、分发并最终送到人们的手臂上,整个过程需要长达6至9个月。这意味着,专家们在每年2月份(针对北半球)做出决策时,他们预测的不是当下,而是远在半年多以后、横跨秋冬的未来。在这漫长的半年里,病毒的演化大军早已“开疆拓土”,完成了数代的更迭。当时看起来只是“小角色”的某个变种,完全有可能在半年后异军突起,成为新的“主角”。这就好比天气预报员不仅要预测明天的天气,还要精准预测半年后某一天是否会下雨,其难度可想而知。
传统的预测方法,很大程度上依赖于专家的经验和对现有数据的解读。他们会关注那些新出现的、具有抗原变化的、且显示出传播优势的病毒簇(clade)。但这种方法在面对病毒演化的高度复杂性和不确定性时,难免会显得力不从心。CDC的数据也印证了这一点:在2012年至2021年的十年中,有五个年份的疫苗整体有效性都未能达到40%的及格线,与之相伴的,是流感相关的住院率不断攀升。这场与病毒的赛跑,我们迫切需要一个更强大的“加速器”。
VaxSeer的水晶球:AI如何“双管齐下”预测病毒的未来?
VaxSeer的出现,正是为了打破这一困局。它并非要取代人类专家,而是为他们提供一个前所未有的强大数据分析工具,一个能够洞察病毒演化底层逻辑的“水晶球”。这个“水晶球”的核心,是一个巧妙的“双轨”预测模型,它同时回答了两个关于疫苗成功的终极问题:“未来的敌人主要是谁?” 以及 “我们的武器对他们有效吗?”
优势度预测器(Dominance Predictor):锁定未来的主要威胁
首先,VaxSeer需要预测在即将到来的流感季中,哪些病毒株会成为最主要的流行株。研究人员将病毒株在某个季节的流行频率,定义为其“优势度”(dominance)。一个疫苗即便对某个病毒株有完美的保护力,但如果这个病毒株在人群中非常罕见,那么这个疫苗的总体公共卫生价值也会大打折扣。因此,精准预测未来病毒的“势力版图”是第一步,也是最关键的一步。
为了实现这一目标,VaxSeer采用了一种极其前沿的技术:蛋白质语言模型(protein language models)。这是一个非常有趣的概念。我们都熟悉像GPT这样的大语言模型,它们通过学习海量的文本数据,掌握了人类语言的语法和逻辑,从而能够预测下一个最可能出现的单词或句子。蛋白质语言模型与此类似,只不过它学习的不是人类语言,而是“生命的语言”——由氨基酸组成的蛋白质序列。
通过“阅读”数以万计的流感病毒HA蛋白序列及其收集时间,VaxSeer的优势度预测器学会了蛋白质演化的“语法规则”。它不仅能理解单个氨基酸突变可能带来的影响,更能捕捉到跨越整个蛋白质序列的、复杂的相互作用。更巧妙的是,研究人员将蛋白质语言模型与一个常微分方程(ordinary differential equation, ODE)相结合。如果说蛋白质语言模型理解了病毒的“静态”特征,那么常微分方程则赋予了模型理解“动态”变化的能力。它能够基于病毒序列的内在特性,数学化地描述其优势度随时间演化的轨迹。这使得VaxSeer的预测不再是一个静止的快照,而是一个动态的、着眼于未来的演化趋势预测。它试图回答的是:“根据一个病毒株当前的序列特征,它在未来6个月后的流行潜力有多大?”
抗原性预测器(Antigenicity Predictor):评估疫苗的“战斗力”
预测了未来的主要敌人后,下一步就是评估我们的“武器”,候选疫苗株,对这些敌人的“杀伤力”如何。在病毒学中,我们用“抗原性”(antigenicity)来描述疫苗诱导的抗体与病毒结合并中和它的能力。
传统上,评估抗原性依赖于一项经典的实验室技术——血凝抑制(hemagglutination inhibition, HI)试验。这个试验的过程大致是:用候选疫苗株去免疫雪貂,获得含有特异性抗体的血清;然后将这些血清与待测试的流行病毒株混合,再加入红细胞。由于HA蛋白能与红细胞结合,引起凝集,如果抗体能有效“罩住”病毒的HA蛋白,红细胞就不会凝集。抗体能被稀释的最大倍数,就是HI滴度,滴度越高,说明抗体的中和能力越强。
HI试验是金标准之一,但它有明显的缺点:耗时、昂贵,且对实验动物有依赖。这导致WHO的专家们每次只能对数量非常有限的(通常少于10个)候选疫苗株进行广泛的HI测试。面对成千上万个潜在的病毒变种,这无异于大海捞针。
VaxSeer的抗原性预测器则彻底改变了游戏规则。它是一个完全在计算机中(in silico)进行的虚拟HI试验。研究人员利用一种名为MSA Transformer的先进神经网络架构,训练模型学习大量的“疫苗株HA序列-病毒株HA序列-实验HI滴度”数据对。训练完成后,这个模型就能做到:只要输入任意一对疫苗株和病毒株的HA蛋白序列,它就能迅速预测出它们之间的HI滴度,也就是疫苗的“战斗力”指数。这使得研究人员能够以前所未有的速度和规模,对任何候选疫苗与任何流行病毒的匹配程度进行评估,极大地扩展了筛选的范围。
点睛之笔:“覆盖分”(Coverage Score)
当两个预测器都准备就绪后,VaxSeer使出了它的“杀手锏”:一个名为“覆盖分”(coverage score)的综合评估指标。这个指标的设计思想既简单又深刻,它的计算方式可以通俗地理解为:
覆盖分 = Σ [(某个流行病毒株的预测优势度) × (候选疫苗对该病毒株的预测抗原性)]
这个公式将两个轨道的工作成果完美地融合在一起。一个高“覆盖分”的候选疫苗,意味着它不仅能有效中和病毒,而且它能中和的,恰恰是那些在未来最可能大范围流行的病毒。它不再是单点打击,而是对未来整个病毒“战场”的有效火力覆盖。通过计算每个候选疫苗的“覆盖分”,VaxSeer能够提供一个清晰的排行榜,告诉决策者们,哪个选择的胜算最大。
回到过去“纠正未来”:VaxSeer在十年回顾性评估中的惊人表现
一个再巧妙的模型,也必须经过实践的检验。由于我们不可能在真实世界中去测试一个AI推荐的、但未被采纳的疫苗的有效性,研究人员设计了一场严谨的“回到未来”式的回顾性评估。他们利用2012年至2021年这十年的历史数据,让VaxSeer去“重新选择”每年的疫苗株,并将其选择结果与当年WHO的实际选择进行对比。
为了建立一个公平的评判标准,他们首先构建了一个“事后诸葛亮”式的黄金标准——“经验覆盖分”(empirical coverage score)。这个分数是用当季结束后真实观测到的病毒流行频率(优势度)和实验室测量的HI滴度计算出来的。它代表了对一个疫苗株在那个季节“真实”抗原匹配度的最佳估计。
在进行正式比较之前,研究人员首先验证了这个“经验覆盖分”本身的价值。他们分析了过去WHO推荐的疫苗株的“经验覆盖分”与CDC公布的真实世界疫苗有效性(VE)之间的关系。结果令人振奋:两者之间存在极强的正相关性。皮尔逊相关系数(Pearson correlation)高达0.895,斯皮尔曼等级相关系数(Spearman rank correlation)更是达到了0.976。这意味着,“经验覆盖分”确实是一个非常可靠的替代指标,分数越高,真实世界的保护效果就越好。这个发现本身就极具价值,它为评估和比较不同的疫苗选择策略提供了一个坚实的量化基础。
有了可靠的裁判,VaxSeer与WHO的“历史对决”正式开始。结果是惊人的。在绝大多数年份里,VaxSeer基于其“预测覆盖分”推荐的疫苗株,其最终的“经验覆盖分”都显著高于WHO当年的推荐。
让我们来看具体数据:
对于棘手的A/H3N2亚型流感病毒,在评估的十年中,VaxSeer的选择有九年都优于WHO的实际选择。
对于A/H1N1亚型,VaxSeer的选择也有六年胜出。
更深入的分析显示,VaxSeer不仅是“更好”,而且常常能精准地选中“最优”的那个。在所有候选疫苗株中,“经验覆盖分”最高的那个,我们称之为当年的“最佳菌株”。
对于A/H1N1,VaxSeer在十年中成功推荐了七次“最佳菌株”,而WHO的推荐与“最佳菌株”吻合的只有三次。
对于A/H3N2,这个数字对比更加悬殊:VaxSeer成功推荐了五次“最佳菌株”,而WHO的推荐则一次也未能命中“最佳菌株”。
这组对比数据有力地证明了VaxSeer的潜力。它不仅在平均表现上超越了传统方法,更有能力在复杂的病毒群体中,挖掘出那些最具保护潜力的“明星菌株”。研究中展示的小提琴图(violin plots)甚至暗示,在过去的病毒库中,还存在大量VaxSeer评分很高、但由于实验资源的限制从未被WHO广泛测试的候选疫苗。这就像一片未被开采的金矿,等待着我们去发掘更有效的疫苗。
一次精准“预判”的案例分析:2019年A/H3N2流感季的博弈
为了更直观地感受VaxSeer的“智慧”,让我们聚焦于2019年北半球A/H3N2流感季的疫苗选择过程,这是一个展现不同决策逻辑的绝佳案例。
在2019年初的决策时刻,病毒学家们观察到一个新的病毒进化支(clade),名为3C.3a1,正在崛起,显示出传播的苗头。面对一个新出现的、具有潜在威胁的“敌人”,最直观的策略当然是迎头痛击。因此,WHO最终推荐的疫苗株,其抗原性与这个新兴的3C.3a1进化支非常匹配。这是一个合乎逻辑、也符合传统决策思路的选择。
然而,VaxSeer的“水晶球”却给出了一个不同的“建议”。AI模型在对所有候选株进行打分后,推荐了另一个菌株。这个菌株对新兴的3C.3a1进化支的覆盖并不完美,但它却能对当时占据主导地位的几个主要进化支,如3C.2a1b.1a/b和3C.2a1b.2b/a,提供更广泛、更强大的中和能力。
这里体现了两种截然不同的防疫哲学:
WHO的选择,可以看作是一次“精确打击”:集中火力,赌注押在消灭那个最显眼的新威胁上。
VaxSeer的选择,则更像是一种“区域防御”:它不求单点击杀,而是构建一道更宽广的防线,确保对当前战场上的“主力部队”形成有效压制,同时兼顾那些正在积蓄力量、准备扩张的“潜力股”。
那么,谁的判断更胜一筹呢?事后对2019年流感季的复盘,以及对后续病毒演化趋势的追踪,给出了答案。VaxSeer推荐的菌株,其“经验覆盖分”确实更高。更有趣的是,从该研究展示的病毒进化树(phylogenetic tree)上可以看到,VaxSeer所覆盖的那个3C.2a1b.2a进化支,在后续的季节里确实继续发展壮大,成为了一个不容忽视的流行分支。这表明,VaxSeer不仅更清晰地看清了当时的病毒“势力版图”,甚至对其未来的演化方向,也拥有更深邃的洞察力。它所做出的选择,具有更强的战略前瞻性。
从代码到临床:VaxSeer的真正价值与未来的挑战
VaxSeer在回顾性研究中展现的强大能力,无疑为我们战胜流感带来了新的曙光。但这是否意味着AI将很快取代WHO的专家委员会呢?答案是否定的。VaxSeer的真正价值,并不在于“取代”,而在于“赋能”。它为人类专家提供了一个前所未有的强大“外脑”和决策辅助工具。
在未来的流感疫苗选株工作中,VaxSeer可以从两个层面发挥关键作用:
1. 一个互补的“第二意见”来源:在专家们进行决策时,VaxSeer可以提供一个完全基于数据驱动的、量化的、无偏见的评估结果。当AI的推荐与专家的判断一致时,可以增强决策的信心;当两者出现分歧时,则可以促使专家们从新的角度重新审视数据,发现那些可能被忽略的关键信息,从而做出更周全的决策。
2. 一个高效的“候选池筛选器”:这或许是VaxSeer最直接、最革命性的应用。传统方法由于资源限制,只能对极少数“种子选手”进行深入评估。而VaxSeer的计算效率极高,它可以在短时间内,从包含数千甚至数万个病毒株的巨大候选池中,快速筛选出“覆盖分”最高的几十个“精英候选株”。然后,人类专家可以集中宝贵的实验资源,对这个经过AI精炼的、高质量的候选池进行深入的实验室验证和评估。这将极大地提高疫苗研发的效率和命中率,甚至为“从头设计”(de novo)全新的、具有广谱保护效力的疫苗分子打开了大门。
当然,VaxSeer也并非完美无缺,它只是这场漫长竞赛中的一个重要里程碑。研究人员在论文中也坦诚地指出了当前模型的局限和未来的努力方向。例如,当前的模型主要聚焦于HA蛋白,而病毒的另一个表面蛋白:神经氨酸酶(NA),同样在病毒的复制和传播中扮演重要角色,并且也是免疫系统攻击的靶点之一。将NA等其他病毒蛋白的信息整合进模型,有望构建更全面的病毒“画像”。此外,模型所依赖的序列数据可能存在地域和采样策略上的偏差,而抗原性评估所用的HI试验数据本身也存在一定的“噪音”。随着全球病毒监测数据变得更均衡、更标准化,以及更多如“高通量中和试验”等更精准的抗原性测量技术的应用,VaxSeer的预测能力还将得到进一步的提升。
另一个激动人心的方向,是让VaxSeer不仅能“评估”已知的病毒,更能“生成”未知的病毒。通过将其优势度预测器作为一个生成模型,研究人员或许能够预测并“创造”出未来可能出现的新型病毒序列。这将使我们从被动的“追赶者”,转变为主动的“布局者”,真正实现对病毒演化的“先发制人”。
与流感病毒的斗争,本质上是一场关于演化、适应与预测的智慧博弈。VaxSeer的诞生,标志着人工智能正式加入了这场博弈,并成为我们手中一张强有力的“王牌”。它向我们证明,通过深度学习生命的语言,我们有能力揭示病毒演化的底层规律,将疫苗的选择从一门“艺术”转变为一门更精确的“科学”。前路依然充满挑战,但有了VaxSeer这样的“领航员”,我们在这场永无止境的竞赛中,无疑又向前迈出了坚实而充满希望的一大步。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
