Immunity | 王毅全/吕惠彬等开发记忆B细胞语言模型用于抗体特异性预测
来源:生物探索 2024-08-22 10:44
研究团队开发了记忆B细胞语言模型(mBLM),使其学习功能性抗体的内在“语法”,并进一步区分血凝素(HA)头部和茎部抗体以及针对其他抗原的抗体。
伊利诺伊大学香槟分校Nicholas Wu课题组在Immunity在线发表了题为An explainable language model for antibody specificity prediction using curated influenza hemagglutinin antibodies的研究成果。该研究中从发表文献和专利中挖掘整理了5,561种针对流感Hemagglutinin(HA)蛋白的人抗体。
通过分析这些HA抗体,该团队识别出了常见的序列特征, 并在此基础上,进一步开发了一种基于七个特异性类别(包括HA头部(head)和茎部(stem)) 结构的记忆B细胞语言模型(mBLM)用于抗体特异性预测。通过对mBLM的解释性分析表明,在特异性预测过程中,有趣的发现语言模型能够识别关键的结合位点以及体细胞突变(somatic hypermutation)。
此外,其团队应用mBLM在HA抗体库中进一步确认可识别HA stem的抗体,并通过实验验证了这些抗体的有效功能性。Hemagglutinin(HA)作为流感病毒的主要抗原,其茎部域具有高度保守的特性。AI 模型的应用能够极大促进新流感病毒抗体的发现和表征,对开发通用的流感治疗方法和疫苗具有重要意义。
研究团队开发了记忆B细胞语言模型(mBLM),使其学习功能性抗体的内在“语法”,并进一步区分血凝素(HA)头部和茎部抗体以及针对其他抗原的抗体。简而言之,mBLM利用来自GenBank和Observed Antibody Space数据库中的共计253,808条独特的抗体配对序列,从而使用屏蔽氨基酸残基方法进行预训练,从而预测抗体重链和轻链配对序列。随后,对预训练的mBLM进行了微调以预测抗体特异性,预测涵盖了七个特异性类别,分别是:流感HA头部,流感HA茎部,HIV,SARS-CoV-2 S NTD,SARS-CoV-2 S RBD,SARS-CoV-2 S S2,以及其他(图1)。
图1 mBLM模型结构及表现(Credit: Immunity)
为了理解记忆B细胞语言模型(mBLM)在抗体特异性预测中所学到的内容,该团队利用梯度加权类激活映射(Grad-CAM),识别了抗体特异性中各个氨基酸的重要性,把已知的HA茎部抗体分为6类,这些不同类别捕捉到了不同的序列特征。例如,由抗体D基因IGHD3-9编码,并在抗体重链互补决定区CDR H3区域具有特征性“FxWL“氨基酸序列的抗体。mBLM还识别了其他已知的特征,包括具有QxxV氨基酸序列的IGHV1-18重链家族抗体,以及Y98氨基酸表位的IGHV1-69重链家族抗体。同时,作者将显著性得分投射到抗体结构上表明,与表位更接近的残基往往具有更高的得分。对18个HA茎部抗体结构的分析证实了残基与表位距离和显著性得分之间的中等负相关性,反映了更靠近结合界面并且序列多样的CDR区域残基的重要性。
前面所述mBLM被应用于在有已知抗体-抗原结构的抗体中捕捉重要的表位识别位点。接下来,作者将mBLM应用于未知抗原识别位点的抗体分析中。例如其中一个模型识别的HA 茎部结合抗体,C1-3.7F02,有趣的是,mBLM模型可以识别出多个重要的抗体识别抗原氨基酸,例如在CDR H2中的N58和CDR H3中的W100a。已知抗体重链和轻链的互补决定区CDR是抗原与抗体主要结合的重要位点,让作者意想不到的是mBLM模型还识别到在CDR区域外的氨基酸结合位点,例如在抗体重链骨架区域(FR2)中的G76、L78和D85也对抗体结合产生了重要影响 。
更重要的是,该团队利用mBLM发现并验证了许多新HA stem抗体。酶联免疫吸附测定(ELISA)结果显示,57%(17/30)的抗体能够结合到H1 茎部蛋白、H3 茎部蛋白或两者。这一验证率与模型的置信度评分呈正相关关系。在16个置信度评分大于0.6的抗体中,有13个(81%)被验证为HA茎部抗体。
综上,这项工作通过开发可解释的记忆B细胞语言模型(mBLM)用于抗体特异性预测。总体而言,该工作对抗体分子理解以及加速新抗体发现具有重要意义。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。