“养成系”AI诞生！谷歌DeepMind研发的这款程序可“像婴儿一样思考”

来源：生物探索 2022-07-18 17:11

这项研究则顺利地通过少到惊人的训练数据就让AI拥有了稳定的VoE效应。在面对超出5个直观物理学概念的情况发生时，PLATO仿真系统会显示出稳定的VoE效应。

近日，受到婴儿学习模式的启发，DeepMind的计算机科学家设计了一种人工智能（Artificial Intelligence，AI）的程序，相关结果以题为“Intuitive physics learning in a deep-learning model inspired by developmental psychology”发表在Nature Human Behavior上。该程序在物体行为的简单物理规则被打破时竟会表现惊讶，表现得像婴儿一样“思考学习”。该研究大大推进了AI在直觉感知领域的发展，使人工智能真的更像“人”了！

图1 研究成果（图源：[1]）

发育心理学家一直测试婴儿如何通过追踪注视来理解物体的运动。例如，当播放一段突然从视野中消失的球的视频时，婴儿注视着这一场景会瞪大眼睛表示惊讶，而研究人员就是通过测量婴儿注视特定方向的时间来量化这种惊讶。在此启发下，计算机科学家Luis Piloto和其研究团队开发了一种名为PLATO的AI系统，名字来源于Physics Learning through Auto-encoding and Tracking Objects（通过自动编码和跟踪对象进行物理学习）的首字母缩写。

PLATO仿真系统由两个模块组成：前馈感知模块（左）和循环动态预测器模块（右）。前馈感知模块中，通过编码器将图像转换为一组对象代码，通过解码器模块将对象代码解码成对应的图像。利用重建和原始图像之间的差异来训练编码器和解码器的参数。循环动态模块中，动态模块通过预先训练好的解码器对下一时刻的对象状态进行预测。

具体来说，研究者通过给PLATO重复观看涉及直观物理学的动画视频来训练它（图2），此动画视频由立方体和球等简单物体组成，展示的也多为一些简单动作，如球落到地上，球滚到其他物体后面又再次出现，很多球弹来弹去等。研究人员发现，在经过28小时的训练后，PLATO在看到一些没有意义的运动场景（如物体互相穿过却没有发生相互作用）时表现出了像婴儿一样的“惊讶”情绪。

图2 训练PLATO模型的“自由形式”数据中的视频（图源：[1]）

最重要的是，PLATO只观看了28小时便获得了以上的学习效果，实为惊人！此外，此次研究还有两个惊喜的发现：其一、该模型能够概括那些与集中视频训练不同的对象和事件；其二、通过在一个相对较小的视觉动画上集中训练，该模型能够成功地演示学习。

对此，美国西北大学教授Susan Hespos评价道，“与许多关键的研究发现一样，该研究可以成为人工智能和发展科学之间的协同机会。他们的工作正在突破日常经验可以和不可以解释智能的界限。这篇论文的结果表明，图灵可能是对的。”

Piloto表示，“PLATO系统所展现出来的效率就好比我们去看电影一般，我们仿佛随时可以预测接下来会发生什么。并且，随着电影的不断深入，预测会变得越来越准确”。

婴儿眼里的直观物理学是什么？

直观物理学是什么？我们可以简单地把它理解为“直觉”或者“常识”。比如往空中抛出一个物体，根据常识所知，物体不会飘浮在半空中，更不会穿过固体掉到地面上，这就是“直观物理学”带给人类的判断。直观物理学代表了人类了解世界的基础物理概念，也是思维中“常识”的关键组成部分。

在发展心理学领域中，直观物理学被分为5个方面的概念：

1. 连续性：物体不会从一个地方传送到另一个地方，而是在时间和空间中有一定的连续路径；

2. 对象持久性：物体在看不见时不会消失；

3. 固体性：物体不会相互渗透；

4. 不变性：对象的属性（如形状）不会更改；

5. 定向惯性：物体运动的路径与惯性原理一致。

以上就是我们容易理解和接受的“常识性”概念范畴，但是当事物的发展违背了我们的常识，例如本该落在桌子上的物体悬浮在半空中，我们便会对这样违背直观物理学的现象表现出惊讶，这种惊讶反应被称为违反期望（violation-of-expectation，VoE）效应，即使三个月大的婴儿也不例外。而如今我们的AI机器人在人为训练下，也可表现出VoE效应。

婴儿认知世界是与生俱来还是后天习得？

关于婴儿认知世界，一直存在“先天”与“后天”的争议。许多发展科学家认为这是“先天”的，也有一些学者更支持从无到有的“后天”理论。为了探究这个争论不休的议题，Piloto等人利用PLATO仿真系统，试图测试深度学习系统是否能够通过学习视觉动画，来获得对直观物理学的理解（图3）。如果“后天”的理论是正确的，那么智力发展可以通过处理大量经验和大量数据来进行锻炼。

图3 PLATO应用感知模型和动力学模型预测物体运动（图源：[1]）

这项研究则顺利地通过少到惊人的训练数据就让AI拥有了稳定的VoE效应。在面对超出5个直观物理学概念的情况发生时，PLATO仿真系统会显示出稳定的VoE效应。

研究人员发现，此现象可以解释一些直观物理学的概念，但是又与婴儿身上看到的现象并不完全适用。研究人员认为，虽然视觉动画的经验对智力发展有很重要的贡献，但不足以解释我们在婴儿身上看到的现象。换言之，智力发展并非全部依靠于“后天”的经验和数据。要形成完整的智力，还需要一些先天的认知。这项研究则介于“先天”和“后天”之间，保持着中立的中间立场。

研究团队将仿真建模和发展心理学中的关键问题融合起来，得到了意想不到的研究结果。目前，研究团队正在将VoE效应的研究扩展到神经生理学领域，这可能为后续研究开辟更多新的方向，也为AI的发展提供了更多的可能。

87%用户都在用生物谷APP 随时阅读、评论、分享交流请扫描二维码下载->