Nat Cancer:新型人工智能模型有望实现对170多种癌症的检测
来源:生物谷原创 2025-06-12 14:51
crossNN框架的开发为跨平台DNA甲基化数据的肿瘤分类提供了一种新的解决方案,该模型的简单性和可解释性使其在临床应用中具有巨大潜力。
在当今医学领域,肿瘤的精准诊断是提高治疗效果和患者生存率的关键,随着基因组学和表观遗传学的飞速发展,DNA甲基化作为一种重要的表观遗传修饰已被广泛应用于肿瘤的分类和诊断。然而,不同的检测平台(如微阵列、全基因组亚硫酸氢盐测序、靶向甲基化测序等)产生的数据格式和覆盖范围各异,这给跨平台的数据整合和分析带来了巨大挑战。
近日,一篇发表在国际杂志Nature Cancer上题为“crossNN is an explainable framework for cross-platform DNA methylation-based classification of tumors”的研究报告中,来自德国柏林夏里特医学院等机构的科学家们通过研究开发了一种名为crossNN的神经网络框架,其能准确地对来自不同平台的稀疏甲基化组进行肿瘤分类,这一突破性进展为肿瘤的精准诊断提供了新的工具。
DNA甲基化在基因表达调控和细胞分化中起着重要作用,其异常模式与包括癌症在内的多种人类疾病密切相关。基于DNA甲基化的肿瘤分类已成为一种强大的诊断工具,尤其是在中枢神经系统肿瘤的分类中,且已被世界卫生组织(WHO)采纳。然而现有的分类方法大多依赖于单一平台的数据,且需要固定的甲基化特征空间,这就限制了其在不同平台间的兼容性。这项研究中,研究人员旨在开发一种能够处理不同平台数据的机器学习框架以提高肿瘤分类的准确性和普适性。
研究中的实验对象包括来自不同平台的肿瘤样本,涵盖多种肿瘤类型和亚型,研究人员使用了包括DNA甲基化微阵列(如Illumina 450K和EPIC)、全基因组亚硫酸氢盐测序(WGBS)、靶向甲基化测序和纳米孔测序等在内多种技术,这些技术能提供不同分辨率和覆盖范围的DNA甲基化数据;同时研究者还使用了PyTorch框架来构建和训练crossNN模型及R/Bioconductor和Python工具进行数据预处理和可视化。
crossNN模型的架构、训练和交叉验证
文章的实验流程主要包括以下几个步骤:
1. 数据预处理:研究者将不同平台的甲基化数据进行标准化处理,包括数据的二值化和特征选择。
2. 模型训练:他们使用Heidelberg脑肿瘤分类器v11b4参考数据集(包含2,801个样本,82种肿瘤类型和亚型)训练crossNN模型。通过随机掩蔽输入数据来模拟不同平台的稀疏甲基化数据。
3. 模型验证:研究人员在多个独立队列中验证模型的性能,包括不同微阵列和测序平台的数据。
4. 模型解释:研究人员通过分析模型权重来解释特征的重要性从而揭示与肿瘤类型相关的甲基化位点。
研究者指出,crossNN模型在多个平台的数据上表现出色,整体准确率达到99.1%(脑肿瘤模型)和97.8%(泛癌模型),该模型不仅在准确性上优于其它深度学习和传统机器学习模型,而且在计算需求上更为高效。此外,crossNN模型的轻量化架构允许快速重新训练和交叉验证,使其能适应不断更新的癌症参考图谱。
crossNN框架的开发为跨平台DNA甲基化数据的肿瘤分类提供了一种新的解决方案,该模型的简单性和可解释性使其在临床应用中具有巨大潜力。通过分析模型权重,研究人员就能识别与肿瘤类型相关的甲基化位点,从而为生物学机制研究和生物标志物发现提供了新的视角。此外,crossNN模型的泛化能力使其能扩展到泛癌分类并为多种癌症类型的诊断提供了新的工具。尽管如此,该研究仍存在一些局限性,如对某些肿瘤类型的分类准确率较低,这可能与当前组织学分类的不足有关。未来的研究需要在更大的多中心队列中进一步验证模型的性能并探索其在临床实践中的应用。
综上,crossNN模型为肿瘤的精准诊断提供了一种新的、跨平台的解决方案,其高效、准确且可解释的特点使其在临床应用中具有广阔前景。随着技术的不断进步和数据的不断积累,crossNN有望成为肿瘤诊断领域的一个重要工具,为提高患者的治疗效果和生存率做出贡献。(生物谷Bioon.com)
参考文献:
Yuan, D., Jugas, R., Pokorna, P. et al. crossNN is an explainable framework for cross-platform DNA methylation-based classification of tumors. Nat Cancer (2025). doi:10.1038/s43018-025-00976-5
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
