新功能、新界面、新体验,扫描即可下载生物谷APP!
首页 » 癌症研究 » IBM再开源3个癌症AI项目 推动癌症研究

IBM再开源3个癌症AI项目 推动癌症研究

来源:创鉴汇 2019-08-19 18:32

 

癌症是全球第二大死亡原因, 2018年估计有1,810万新病例以及960万人死于癌症。学术界和工业界也不断致力于寻找更有效的抗癌药物。IBM位于苏黎世的研究团队正在构建一些人工智能机器学习的方法,加速人们对复杂疾病的主要驱动因素、分子机制以及肿瘤组成的差异等几方面的理解。

为了推动新疗法的研究进展,帮助人类更快地攻克癌症。IBM在不久前开源了3个治疗癌症的人工智能项目。同时IBM也在第18届欧洲计算生物学大会(ECCB)和第27届分子生物学智能系统大会(ISMB)上,对这三种旨在加速癌症研究的机器学习解决方案做了发布。下面是对这些方案的简要讨论。

1. 关于深度学习预测和解释药物功效的 PaccMann

研发任何一种抗癌药物都需要投入数亿美元,若提高药物研发的效率则可以一定程度降低研发的成本。PaccMann 算法可以自动分析化合物,并预测哪些化合物最有可能对抗癌症菌株。

算法基于神经网络来预测抗癌化合物敏感性,这是一种多模态深度学习解决方案,使不同来源的数据能帮助预测病变组织中的细胞对给定药物的反应。同时AI在执行预测时,还能标出哪些特定基因和化合物分子结构最受科学家关注。经过多次实验表明,与现有的化合物筛选预测算法相比,PaccMann 更为智能。该领域的研究人员则可以使用 PaccMann 的这些信息作为指导,帮助他们改进或重新利用现有药物,开发新药物。

2. 能从科学论文中自动提取知识的 INtERAcT

INtERAcT 采用无监督学习(unsupervised learning)的方式,能从科学论文中提取蛋白质与蛋白质相互作用的信息。特别值得关注的是,它可以从与癌症有关的、有价值的科学文献中自动提取数据。

通常,一些生物医药领域研究成果、论文都会被刊登在权威杂志上,这些杂志期刊是科学家们阅读科学成果的唯一途径。最近,有一篇论文数据表明,仅在癌症研究领域,平均每年就有大约1.7万篇科学论文发表,而且论文数量还在呈指数级增长。面对如此大量的论文数量,从事癌症领域相关研究的科学家们无法对其进行一一阅读,INtERAcT系统的诞生则旨在通过AI技术从海量论文中,帮助科学家快速提取有效信息,在学术方面减轻他们的负担。

INtERAcT 利用词嵌入的概念处理大量科学论文的文本,并定义了一个新的度量标准来量化蛋白质之间的相互作用。对于从事生物医学领域相关工作的人们来说,全面了解蛋白质相互作用是基础,同时变异的蛋白质也被认为是导致细胞癌变的一个潜在因素。所以一旦 INtERAcT 能自主提取与蛋白质相互作用有关的详细数据,科学家们就能在短时间内获取到有用信息,并且进一步了解关于癌症的疾病机制。

3. 利用分子数据进行病情预测的算法 PIMKL

PIMKL,使用多核学习(multi-kernel learning),利用目前在分子相互作用方面已知的数据集,来预测患癌者的病情发展和患者的潜在复发情况。基于从病理组织中获得的分子生物信息不仅能预测疾病进展,还能相应地对患者进行分类,从而使医生能为不同病患提供更具针对性的、个性化的治疗方案。

为了证明该算法的有效性,IBM研究团队进行了一次实验,他们使用PIMKL预测了乳腺癌患者在术后5年是否会再次复发疾病。此外,为了实验数据的可靠性,研究团队将PIMKL算法能力与现有的、应用于乳腺癌预测的另外14种AI算法进行多次比较。经实验结果表明,PIMKL表现优于同类算法。

这三种算法展现了机器学习对癌症等复杂疾病以及生物医学研究的推动作用。对于这些癌症的解决方案,IBM表示,他们会不断对其进行优化改进。此次,IBM开源这三个人工智能在癌症领域的研究项目,是希望能最大限度地发挥AI在生物医学界的积极影响。(生物谷Bioon.com)

 

温馨提示:87%用户都在生物谷APP上阅读,扫描立刻下载! 天天精彩!


相关标签

最新会议 培训班 期刊库