Nature系列综述:大分子药物研发中的人工智能公司
来源:生物世界 2023-11-02 11:38
AI在大分子药物发现中的应用正在迅速增加。然而,尽管这些AI工具的潜在价值已经在学术研究中得到了令人信服的证明,但到目前为止,它们的大规模部署仍然具有挑战性。
机器学习等人工智能(AI)技术正在改变药物研发格局,这得益于不断增长的数据量和计算能力。
历史上,小分子药物一直处于AI在药物发现中的应用前沿,包括建模小分子-靶点相互作用、先导候选药物优化和安全性预测。然而,AI工具正越来越多地应用于大分子药物,包括抗体、基因疗法和基于RNA的疗法,此类药物/疗法在生物制药领域的重要性越来越高,例如,它们在2022年批准的新分子中占比已达40%。而在肿瘤学领域,预计到2030年,大分子药物将占到药物收入的约50%,其中超过80%将来自抗体药物。
近日,Nature 旗下综述期刊 Nature Reviews Drug Discovery 发表了题为:The company landscape for artificial intelligence in large-molecule drug discovery 的文章。
该文章概述了AI技术是如何被应用于大分子药物发现的,分析了当前进行AI大分子药物开发的公司及其研发管线,并指出了生物制药行业需要如何在该领域取得成功。
AI在大分子药物研发中的应用
机器学习等AI工具正在被应用到药物研发的各个领域。这篇文章重点关注了AI在大分子药物发现的三个方面——结构预测、功能预测和新候选药物生成,这些方面的方法正在迅速成熟。本文未涵盖利用AI预测有应答的患者人群、降低试验风险或加速试验等方向。
预测大分子结构的工具
蛋白质结构预测对于大分子药物发现来说具有重要价值,从靶标鉴定(例如预测抗原结构)到先导药物的鉴定和优化。2020年,机器学习模型AlphaFold2仅通过氨基酸序列就成功预测了蛋白质的三维结构,这是一个里程碑式的进步。如今,许多公司正在使用AlphaFold2或其他具有类似准确性的蛋白质结构预测模型(例如RoseTTAFold)。
目前的开发正在改进这些结构预测工具的易用性、可扩展性、对孤儿蛋白的预测性能和可再训练性,例如ColabFold、FastFold、OmegaFold和OpenFold,并使用与大型语言模型(例如GPT-4)类似的不同架构(例如ESMFold)提高普适性和速度。
预测大分子功能的工具
人工智能工具已被开发用于预测大分子治疗候选药物的功能,包括抗原-抗体或RNA-蛋白的结合,以及它们的可成药性。可以使用机器学习模型(例如梯度提升树)或计算模型(例如分子动力学模拟)进行这些预测。
最近,深度学习方法(包括基于模型、卷积神经网络、循环神经网络或大分子语言模型)已经被使用来预测抗体亲和力等治疗的关键属性。这些方法可以使用大分子的各种表示形式,例如,抗体抗原氨基酸的三维坐标,或者用于卷积神经网络或大分子语言模型架构的氨基酸或核苷酸序列。
生成大分子疗法候选物
快速增长的数据可用性正在支持可以大规模生成蛋白质、抗体或mRNA的算法的开发,作为先导药物生成或优化的一部分。例如基于扩散模型、变分自编码器模型或使用类似于GPT-4的大型语言模型,根据模态数据(例如蛋白质序列信息)进行训练。
实施这些算法的具体例子包括开发新的抗原结构,确定稳定和免疫原性的最佳mRNA结构,以及新型蛋白和抗体的设计。设计的分子通常随后在高通量系统中进行评估,以实验确认功能性质,并进一步加强和改进候选分子的生成。
上述工具都有通用性,例如,RFdiffusion或ESM模型已被用于生成新蛋白质以及蛋白质结构和功能的预测。这些工具现在正在补充或取代传统的计算方法。
新兴公司全景图
本文系统分析了从事大分子药物设计的AI驱动的生物技术公司,确定了其中82家活跃在该领域的公司,其中超过60%的公司都是在过去5年里成立的,这表明这是一个在最近的技术变革(例如AlphaFold的出现)推动下的一个新兴行业。
82家专注于大分子药物研发的AI驱动生物技术公司
每年成立的专注于大分子药物研发的AI驱动生物技术公司的数量,以及这些公司与排名前20的生物制药公司的合作的数量
2021年,该领域公司共融资了39亿美元,其中仅风险投资就高达27亿美元,但在2022年下降到了7亿美元。其中值得关注的有,AbCellera和Absci(这两家公司均专注于抗体发现)分别在2020年和2021年通过IPO募资了5.55亿美元和2亿美元,Generate Biomedicines(专注于蛋白质药物发现)在2021年完成了3.7亿美元的B轮融资。
大分子药物研发的AI驱动生物技术公司的融资类型
一些知名生物制药公司正在通过内部组建和收购的方式建立用于大分子药物发现的AI能力,例如,基因泰克(Genentech)2021年收购了Prescient Design(这是一家AI驱动的生物技术公司,将机器学习应用于抗体发现)。
一些知名大型生物制药公司也在与AI驱动的生物技术公司展开合作,双方在2021年确定了51个合作伙伴关系,显著高于2016年的10个。例如,BigHat(专注于抗体发现)与安进(Amgen)、AbCellera(专注于抗体发现)与艾伯维(AbbVie)以及Mabsilicon(专注于抗体发现)与OSE的合作。
基于AI的大多处于早期临床阶段,目前只有3款进入临床2期,分别是Evaxion公司开发的用于转移性黑色素瘤的基于肽的个性化癌症免疫疗法,ZielBio公司开发的用于实体瘤的抗凝集素单克隆抗体,PharmCADD公司开发的用于SARS-CoV-2的mRNA候选疫苗。此外,还有3款处于临床1期,分别是Peptilogics公司开发的用于治疗假体周围感染的肽类抗生素,SparX公司开发的用于治疗胃癌的靶向Claudin 18.2的单克隆抗体,以及PharmCADD公司开发的另一款SARS-CoV-2的mRNA疫苗。
在候选大分子药物开发中,这些利用了基于AI的靶点识别、功能(结合)预测和抗体生成(包括使用生成式AI)。
基于AI的大分子药物研发公司的管线的研发进度
在临床前阶段,AI驱动的生物技术公司开发的候选大分子药物中最多的在肿瘤领域,有8个候选分子。在药物类型方面,处于临床前开发阶段的RNA和多肽类(约占所有分子的50%)比抗体类更多。这可能是由于抗体设计的复杂性更高,而且缺乏用于训练机器学习工具的功能数据。
展望
这些分析表明,AI在大分子药物发现中的应用正在迅速增加。然而,尽管这些AI工具的潜在价值已经在学术研究中得到了令人信服的证明,但到目前为止,它们的大规模部署仍然具有挑战性。
要实现AI在该领域的潜力,需要解决几个问题。首先,AI模型必须充分融入研究过程,并适当培养研究科学家的能力。通过这样做,公司可以快速训练和验证机器学习算法,同时也克服了人工智能工作的潜在“孤岛”。例如,当使用大语言模型进行抗体亲和力的高通量预测时,通过整合的研究系统进行及时的体外实验验证将进一步训练和提高计算机模型的性能。其次,必须建立技术环境,例如复合型数据工程管线(集成并能够自动标记公共和内部数据)、合适的计算基础设施以及源系统的集成建模环境。这使得公司能够训练和改进模型,以指导和改进下一个实验。最后,在药物发现之外的整个研发过程中,需要将AI技术整合到试验设计和患者亚群识别等领域,以进一步提高试验效率和成功概率。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。