打开APP

Nature子刊:冯建峰/程炜团队开发机器学习模型,识别自杀行为风险因素

来源:生物世界 2024-07-05 09:47

研究团队开发了一种基于行为学、代谢组学和蛋白组学的机器学习判别模型,用以区分是个体是否发生自杀行为。研究发现基于16种行为学特征的分类模型在区分有无自杀行为上表现出高判别准确性。

复旦大学类脑智能科学与技术研究院冯建峰教授/程炜研究员团队(博士后张蓓为第一作者)在 Nature 子刊 Nature Human Behaviour 上发表了题为:Identifying behaviour-related and physiological risk factors for suicide attempts in the UK Biobank 的研究论文。

该研究基于英国生物样本库(UK Biobank)30多万人的行为学、神经影像组学、血液和代谢组学及蛋白组学数据,通过多组学关联分析,全面评估与自杀行为关联的多维度风险因素,最终识别出与自杀行为及其遗传易感性显著关联的246个行为学风险因素和200个生物学风险因素,如社会经济环境、生活方式、身心健康、童年经历和脑灰质体积等。在此基础上,研究团队开发了一种基于行为学特征的机器学习判别模型,在区分有无自杀行为上表现出高判别力(AUC=0.909)。该研究对自杀行为的多维度风险因素识别提供了全面的见解,有助于自杀行为的早期预警和个性化干预。

图片

研究团队基于UK Biobank数据,首先估算了334706名参与者的自杀行为的多基因风险评分(polygenic risk scores,PRS),对涵盖12个不同类别的行为学和生物学因素(2291个)进行全表型关联分析(phenome-wide association study,PheWAS),最终识别了与自杀行为遗传易感性显著关联的246个行为学风险因素(63.07%)和200个生物学风险因素(10.41%)。

图片

图1:研究的总体思路

其中,与自杀行为PRS显著关联的行为学风险因素(图2A)主要包括生活方式、心理健康、社会经济环境、躯体健康等类别。较高的自杀行为PRS与较低的社会经济环境等因素有关,比如家庭收入、居住质量、工作方式以及教育水平等。此外,较高的自杀行为PRS也和不良的生活方式有关,比如睡眠问题、吸烟饮酒行为、饮食习惯、电子设备使用行为等。此外,较高的自杀行为PRS也和身心健康状态有关,比如较高的自杀行为PRS和躯体疾病(如总体健康状况、癌症、糖尿病)以及心理状态(抑郁症状、创伤事件、神经质评分)等因素有关。

图片

图2:PheWAS分析中与自杀行为PRS关联的行为学表型(图A)和病例-对照分析中与自杀行为关联的行为学表型(图B)

 

对于显著识别的200个生物学风险因素,涵盖20个神经影像学表型(包括13个脑区的灰质体积和7个脑区的白质微结构)、76种血液和代谢生物标志物和104种蛋白标志物。具体而言,在影像学表型上,较高的自杀行为PRS和较低的灰质体积相关,包括右侧岛叶、杏仁核、腹内侧前额叶皮层、内侧和外侧眶额皮层、缘上回、左侧颞上回、双侧中扣带回等(图3A)。此外,较高的自杀行为PRS与白质微结构的各向异性(Fractional Anisotropy)降低(涉及胼胝体辐射线额部纤维束、内侧丘系纤维束和上后部丘脑辐射纤维束)显著相关(图3B)。

图片

图3:PheWAS分析中与自杀行为PRS显著关联的神经影像学标志物

在血液和代谢表型上,较高的自杀行为PRS与较高的白细胞指数(如白细胞和淋巴细胞计数)和红细胞指数相关(图4A)。在血液生化方面,较高的C 反应蛋白、甘油三酯和γ-谷氨酰基转移酶以及较低的 IGF-1、维生素 D 和高密度脂蛋白胆固醇与较高的自杀PRS 呈显著相关(图4A)。此外,研究团队还发现104 个蛋白与自杀PRS呈显著相关(图4B)。相对于其他类别蛋白,炎症蛋白与自杀PRS的关联更为明显,其中 BTN3A2 和 CXCL17 的关联最为显著。

图片

图4:PheWAS分析中与自杀行为PRS显著关联的血液和代谢标志物以及蛋白标志物

其次,为了验证这些风险因素,研究团队对3,558名自杀未遂个体和149,976名对照个体的所有表型进行逻辑回归分析,发现83%与自杀行为PRS关联的行为风险因素得到验证(图2B)。

随后,研究团队利用孟德尔随机分析探究以上关联的表型与自杀行为之间潜在的因果关系。研究结果发现57个行为学因素(主要包括神经质、抑郁程度、首次性行为年龄、抽烟、家庭收入情况、身体健康状况等)和1个生物学因素(即白细胞计数)是导致自杀行为形成的潜在因果因素(图5)。针对导致自杀行为形成的行为学风险因素,研究团队进一步利用中介分析探究了这些行为学因素潜在的生物学基础。

图片

图5:风险因素与自杀行为之间潜在的因果关系(部分)

最后,研究团队开发了一种基于行为学、代谢组学和蛋白组学的机器学习判别模型(图6),用以区分是个体是否发生自杀行为。研究发现基于16种行为学特征的分类模型在区分有无自杀行为上表现出高判别准确性(AUC=0.909)。其中,最重要的预测因素包含:是否遭受精神痛苦、是否感到毫无价值、首次抑郁发作时的年龄、是否因焦虑或抑郁看精神病医生、以及是否在抑郁期间产生死亡想法。这个结果强调,患有精神痛苦是识别有无自杀行为史个体的最关键预测因子。这一结果与Shneidman在1993年提出的假设相一致,即心理痛苦是导致自杀行为的一个重要诱发因素。

图片

图6:基于行为学特征的机器学习分类模型预测因子的重要度排序和预测准确度

论文共同通讯作者,复旦大学类脑智能科学与技术研究院冯建峰教授表示,这项研究开发了一个基于行为学特征的机器学习模型。排名前16位的预测因子在区分有无自杀行为的个体方面表现出很高的辨别准确性。这可能有助于识别未来识别自杀高危人群。除了精神痛苦以及抑郁症相关的预测因子外,主要的行为学预测因子是个体的童年经历和性侵犯受害者。这些因素为临床医生制定更好的预防策略提供了潜在的可操作目标。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->