打开APP

Cell子刊:天津医科大学李祥春/陈可欣团队开发AI大模型,对原发灶不明癌症进行分类和定位

来源:生物世界 2025-09-06 09:16

该研究开发了一款基于大语言模型的 AI 工具——OncoChat,其能够从基因组数据中对原发灶不明癌症(CUP)进行肿瘤类型分类和定位。

准确的肿瘤类型定位对于确定恰当的治疗策略、优化临床结果以及使患者能够接受靶向治疗和临床试验至关重要。明确肿瘤类型及其原发部位,能让肿瘤科医生根据肿瘤的生物学特性为其制定个性化治疗方案。分子分析方面的最新进展改进了癌症分类,并推动了个性化医疗的发展。然而,尽管有这些创新,诊断复杂癌症,尤其是转移性肿瘤,仍是临床面临的一大挑战。

原发灶不明癌症(CUP)是肿瘤学中最具挑战性的临床情况之一。CUP 指的是尽管进行了广泛的诊断努力,包括组织病理学、影像学和分子检测,但原发部位仍无法确定的转移性肿瘤。在全球范围内,CUP 占所有癌症的 3%-5%,这些癌症通常具有侵袭性,对治疗有抗性,并且预后不良,中位生存期在 6-16 个月之间。由于原发部位未知,治疗通常采用经验性化疗,其效果不如针对特定部位的疗法。因此,确定肿瘤的组织来源对于扩大治疗选择和改善预后至关重要。尽管病理学,包括免疫组化、肿瘤形态学和临床发现,在确定原发肿瘤方面发挥着关键作用,但传统方法在高度转移性或低分化 CUP 病例中往往效果不佳。这些局限性,再加上观察者之间的差异,凸显了对更可靠诊断方法的迫切需求。

2025 年 9 月 4 日,天津医科大学李祥春、陈可欣等人在 Cell 子刊 Cell Reports Medicine 上发表了题为:Large language models enable tumor-type classification and localization of cancers of unknown primary from genomic data 的研究论文。该研究开发了一款基于大语言模型的 AI 工具——OncoChat,其能够从基因组数据中对原发灶不明癌症(CUP)进行肿瘤类型分类和定位。

 

图片

该研究开发的 AI 模型 OncoChat,通过整合多种基因组改变来对 69 种肿瘤类型进行分类。该模型基于 158836 个肿瘤的基因组数据开发而成,这些肿瘤是通过靶向癌症基因面板测序获得的。OncoChat 表现出色,微平均精确召回曲线下面积(PRAUC)达到 0.810,准确率为 0.774,F1 分数为 0.756,优于基准方法。

该研究的亮点:

OncoChat 是一种大语言模型,能够根据基因组变异对肿瘤类型进行分类;

OncoChat 能够以极高的准确度对已知和未知的原发性癌症进行分类;

结构变异整合极大地提高了肿瘤分类的准确性;

OncoChat 预测对原发灶不明癌症患者的生存具有预后意义。

图片

在 26 例原发灶不明癌症(CUP)的数据集中,OncoChat 正确识别了其中 22 例癌症类型。在两个更大的 CUP 数据集(n=719 和 158)中,OncoChat 预测的肿瘤类型与已知肿瘤类型的生存结果和突变谱一致。OncoChat 在临床决策支持方面展现出巨大潜力,特别是在处理原发灶不明癌症(CUP)患者方面。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->