Nature:世界首例,脑机接口+AI算法,帮助渐冻症患者实时“说话甚至唱歌”
来源:生物世界 2025-06-25 11:28
这项临床研究为那些想说话却失去能力的人带来了希望,研究结果展示了如何让一位瘫痪失语者借助合成的自己声音来说话,这种技术可能会给他们的生活带来变革。
脑机接口(Brain–computer interface,BCI)有可能为因神经系统疾病(例如渐冻症)或损伤而丧失说话能力的人恢复交流能力。脑机接口已被用于将试图说话时的大脑神经活动解码并转化为文字。然而,文字交流无法捕捉人类言语中的细微差别,比如语调以及即刻听到自己声音的感觉。
而最近,一项临床试验结果显示,BrainGate 公司开发的脑机接口(BCI)首次真正实现了帮助瘫痪者“说话”——将大脑中的想法实时转化为语言,有感情的说出来,甚至还能唱歌。
该研究于 2025 年 6 月 12 日发表于国际顶尖学术期刊 Nature,论文题为:An instantaneous voice-synthesis neuroprosthesis,论文作者来自加州大学戴维斯分校。
该研究利用植入式脑机接口(BCI),结合低延迟处理和 AI 驱动的解码模型,将一位已瘫痪的渐冻症(ALS)患者大脑中的神经活动转化为语言,并通过扬声器实时合成并输出(仅延迟 8.5 毫秒),从而帮助他实现流畅、且有感情地“说话甚至唱歌”。
研究团队将脑机接口(BCI)植入到一名已经几乎完全失去发音能力的渐冻症(ALS)患者的大脑,通过 256 个微电极记录负责语言运动功能的腹侧中央前回的神经活动,并实时合成语音,通过闭环音频反馈进行调整,克服了训练神经解码器时缺乏真实语音的难题,成功准确合成了他的声音。除了语音内容,研究团队还从大脑神经活动中解码出了副语言特征,使患者能够实时调节其脑机接口合成的声音,从而改变语调并哼唱简短的旋律。这项临床研究表明,通过脑机接口让瘫痪者清晰且富有感情地说话是可行的。
这名因渐冻症而几乎完全丧失了说话能力的男性参与了在加州大学戴维斯分校健康中心进行的名为 BrainGate2 的脑机接口临床试验。研究团队给他植入了一个实验性的脑机接口(BCI)。该脑机接口由四个微电极阵列组成,通过手术植入负责产生语言的大脑区域——腹侧中央前回。这些微电极记录大脑中神经元的活动,并将其发送到计算机,计算机对信号进行解码以重建他的声音(合成的音色跟他本人的声音很像)。
要想将大脑中想法实时合成语音,其主要障碍在于,无法确切知晓失语者试图说话的具体时间和方式。在这项研究中,研究团队开发了基于人工智能(AI)的算法,能够将神经活动映射到每个时刻的预期声音。这使得合成语音的细微差别成为可能,并让使用者能够控制其脑机接口语音的节奏。
因此,该脑机接口能够将使用者的神经活动信号迅速转化为通过扬声器播放的可听语音,整个过程仅需几十分之一秒。这种短暂的延迟与人们正常说话并听到自己声音时的延迟相当。此外,该技术还允许参使用说出新词汇(系统之前未录入的词汇)以及发出预期感叹词,能够调节生成的电脑语音的语调来发出疑问句,或在句子中强调特定的词,使用者还能够唱出简单的旋律。测试结果显示,使用者通过脑机接口合成的声音通常能让人听懂,听众能够正确理解约 60% 的词,而没使用脑机接口时,这一比例仅为 4%。
之所以能够将使用者的大脑神经活动实时转化为合成语音,得益于先进的人工智能(AI)算法,该算法是通过参与者在电脑屏幕上看到句子并尝试说出这些句子时所收集的大脑神经信号数据进行训练的。大脑中植入的电极测量了数百个神经元的放电模式,研究团队将这些模式与使用者当时试图发出的语音相对齐,从而让算法从其大脑神经信号中准确地重建声音。
研究团队表示,声音是我们身份的一部分,对于患有神经系统疾病的人来说,失去说话能力是一个毁灭性的打击。而这项临床研究为那些想说话却失去能力的人带来了希望,研究结果展示了如何让一位瘫痪失语者借助合成的自己声音来说话,这种技术可能会给他们的生活带来变革。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
