打开APP

《自然·衰老》:患阿尔茨海默病的风险,藏在7年前的病历里!UCSF团队基于电子健康记录,开发出可提前7年预测AD风险的AI模型

来源:代丝雨 2024-02-26 09:13

研究者认为,这项研究为如何利用机器学习预测难以诊断的疾病提供了一个很好的例子,将来可以使用类似的方法预测狼疮和子宫内膜异位症等疾病。

《自然·衰老》杂志发表了来自加州大学洛杉矶分校(UCSF)科学团队的新研究成果,研究者们利用UCSF医学中心的电子健康记录(EHR)数据开发了AD发病的AI预测模型,并从中找出了关键预测因子与AD背后的生物学联系。

 

该模型可提前7年预测AD发病,工作特征曲线下面积(AUROC)达0.72。该模型还可进一步识别具有预测能力的因子,包括高血压、高血脂、维生素D缺乏等通用的因素,以及男性特异的前列腺功能障碍和女性特异的骨质疏松

 

图片

论文题图

 

UCSF的EHR数据库包含超过500万人的数据,研究者从中筛选接受过痴呆评估并被诊断为AD的患者,为其匹配无痴呆的对照,并需要具有诊断前7年的纵向数据,最终确定了749名AD患者和250545名对照组。

 

图片

模型原理

 

基于临床特征的随机森林(RF)模型可提前7年准确预测AD诊断,AUROC达0.72。继续增加人口统计学等相关特征可进一步提高模型性能,AUROC提升至0.86。

 

在匹配队列上训练模型,研究者找出了较为重要的AD预测因子,包括健忘等认知问题、高血脂、头晕、白内障、充血性心衰、骨关节炎等。这些预测特征与时间点有关,例如高血脂和充血性心衰在全阶段均有重要的预测能力,骨质疏松、头晕、背痛等在发病前3年作用凸显,而记忆力减退和维生素D缺乏在接近AD发病的时间点才会变得较为重要。

 

图片

不同时间点的AD预测因子

 

由于AD发病具有较为显著的性别差异,因此研究者也进行了性别特异性的模型训练。

 

对女性,较早期的预测因子包括呼吸/循环系统特征,AD发病5年前的肌肉骨骼特征,较晚期的感知和精神障碍。男性中,早期内分泌/代谢/循环系统疾病有重要预测意义,随后是消化和泌尿生殖系统疾病,以及晚期的精神障碍。

 

高血脂、充血性心衰和记忆认知障碍在两性中都是通用的。

 

图片

不同性别的重要预测因子

 

为了搞清楚AD和这些预测因子之间的生物学联系,研究者利用SPOKE医疗知识引擎来解释模型。

 

与预测因子相关的生物学特征中,优先级较高的包括APOE、AKT1、INS、ALB、IL1B、TNF、IL6、SOD1等基因,以及阿托伐他汀、辛伐他汀、麦角钙化醇、黄体酮、雌激素、氰钴胺素和叶酸等化合物。这些生物学特征与家族性高血脂症和骨质疏松之间的联系也非常紧密。

 

图片

通过SPOKE建立的生物学特征优先级

 

在生成的所有模型中,高血脂症都表现出了非常优先的预测作用。研究者分析了加州大学系统中5家医院的EHR数据,发现诊断为高血脂症的个体AD进展速度更快,与未暴露个体相比HR达1.52。

 

参考其他GWAS研究及英国生物库可发现,在APOE基因处AD和高血脂症存在遗传联系。

 

类似的,骨质疏松也作为女性特异的AD预测因子被关注。分析发现MS4A6A是二者之间的遗传关联位点。

 

研究者认为,这项研究为如何利用机器学习预测难以诊断的疾病提供了一个很好的例子,将来可以使用类似的方法预测狼疮和子宫内膜异位症等疾病。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->