Nature:大脑视觉密码破解——AI压缩术让“大模型”缩水5000倍,发现神经元偏爱小圆点!
来源:生物谷原创 2026-02-27 09:38
来自冷泉港实验室等机构的科学家们另辟蹊径,他们的思路很独特:与其构建更大的模型,不如想办法把大模型压缩到极致。
当你正盯着手机屏幕阅读这段文字,你的眼睛在字里行间快速跳动,而大脑则在毫秒之间完成了一场极其复杂的视觉盛宴—识别每一个汉字,理解它们的含义,构建出完整的语义图景。这一切发生得太自然,以至于我们很少会思考:大脑究竟是如何做到的?这个看似简单的问题,其实困扰了神经科学家数十年。而今天,一个令人惊喜的答案可能来自一个意想不到的方向—让AI模型“缩水”。
近年来,人工智能领域掀起了一场“大模型”狂潮。从ChatGPT到Sora,参数动辄千亿万亿,规模之大令人咋舌。这些模型确实在模拟人类智能方面表现出色,但对于想要理解真实大脑运作机制的神经科学家来说,它们却带来了新的困扰—用一个“黑箱”去解释另一个“黑箱”,这本身就是个悖论。试想一下,如果我们想知道大脑的视觉系统如何工作,传统的做法是训练一个深度神经网络来模拟它。但问题是,这个网络本身就有数百万甚至上亿个参数,复杂程度堪比一团乱麻。即便它能准确预测大脑的反应,我们依然不知道它内部发生了什么。这就像你买了一个能准确预测天气的神秘盒子,却永远不知道盒子里是怎么运作的。
逆向思维:让大模型“瘦身”5000倍
日前,发表在国际杂志Nature上题为“Compact deep neural network models of the visual cortex”的研究报告中,来自冷泉港实验室等机构的科学家们另辟蹊径,他们的思路很独特:与其构建更大的模型,不如想办法把大模型压缩到极致。文章中,研究人员首先对猕猴视觉皮层进行了系统性的神经信号记录,他们给猕猴展示精心挑选的自然图像,同时追踪它们视觉皮层中哪些神经元被激活。这些数据被用来训练一个超大的深度神经网络模型,使其能准确预测特定图像会引发哪些神经元反应。这个模型规模相当可观—拥有6000万个参数,预测精度比竞品高出30%以上。

但真正精彩的环节才刚刚开始,研究人员运用压缩技术,将这个庞然大物的参数数量锐减到原来的五千分之一;最终得到的模型,小到可以用电子邮件附件发送。你可能会问:一个缩水五千倍的模型,还能准确预测大脑反应吗?答案是肯定的。压缩后的模型虽然体型“瘦身”,但预测精度几乎保持不变。这意味着,模拟大脑视觉处理的核心机制,可能并不需要那么多参数。
发现“点”偏好的神经元
模型变小了,好处立刻显现出来—研究人员终于可以看清它的内部运作机制了。通过深入分析这个紧凑模型,他们发现了一个有趣的计算模式:模型中的神经元首先会将图像分解成最基本的特征,比如边缘和颜色。然后,这些基础信息会以不同的方式被“整合”,形成每个神经元独特的偏好。最令人惊喜的发现是,在模型模拟的V4视觉区域中,有一组神经元特别“喜欢”小圆点。这听起来似乎有些莫名其妙——我们的大脑里为什么会专门有一群细胞对圆点情有独钟?
但仔细想想,圆点在日常生活中扮演着多么重要的角色。眼睛是什么?不就是两个充满信息的圆点吗?想想眼神交流在人际交往中的重要性,从婴儿时期注视母亲的眼睛,到成年后恋人之间的深情对视,圆点承载了太多意义。研究人员甚至还能追踪到这些“点偏好”神经元的具体工作机制:它们如何接收来自初级视觉皮层的输入,如何整合边缘信息,最终形成对圆点的特异性响应。这种机制不仅存在于计算机模型中,也指向了真实的神经回路假设,未来可以在生物大脑中进行验证。
从视觉到疾病:小模型的大前景
这项研究的突破不仅在于我们理解了视觉皮层的运作机制,更在于它建立了一种全新的研究范式—通过构建既精准又简约的模型,让“可解释的人工智能”不再是空话。研究人员进一步验证发现,同样的压缩方法对初级视觉皮层V1和下颞叶皮层IT同样有效,这就表明,“先构建大模型再压缩”可能揭示了视觉系统的一个通用计算原则。
这项工作的意义还不止于此。研究人员展望了更广阔的应用前景,例如,在阿尔茨海默病中,我们知道突触会逐渐丢失。如果我们知道哪些图像能够驱动神经元之间的交流,或许就有可能重建那些曾经被认为因疾病而永久丧失的突触连接。这项研究给我们最大的启示或许在于:在追求“大”的同时,不要忘记“小”的价值。当全世界都在追逐更大规模的模型时,一群科学家选择逆向而行,用压缩技术寻找最核心的机制,这种“小思维”恰恰带来了突破性的发现。
研究者指出,计算机科学家想通过构建大规模AI来模拟人类智能,但对于神经科学家来说,我们需要的是能够揭示大脑工作机制的模型,而不是另一个黑箱。从6000万参数到1.2万参数,从占据整个服务器到可以邮件发送,这个小小的模型正在打开一扇通往大脑奥秘的大门。而门后的世界,或许比我们想象的更加精彩。(生物谷Bioon.com)
参考文献:
Cowley, B.R., Stan, P.L., Pillow, J.W. et al. Compact deep neural network models of the visual cortex. Nature (2026). doi:10.1038/s41586-026-10150-1
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。