DeepMind认为他们的神经网络可以实现类似人类的想象力 - kdnuggets

20-09-17 banq

为了在深度学习代理中实现“想象力”,DeepMind团队依赖于称为I2A的聪明的神经网络架构。I2A体系结构的关键元素是一个称为Imagination Core的组件,该组件使用环境模型,在获得有关当前环境的信息的情况下,对其未来状态进行预测。

对于指定过去的状态和当前的动作,这个环境模型可以预测下一个状态以及来自环境的任何数量的信号。I2A体系结构通过使用当前的实时观测值初始化想象的轨迹,然后将模拟的观测值输入到模型中,在未来的多个时间步骤中推出环境模型。每个部署中产生的操作有助于定义代理策略,然后由Imagination Core模块使用该策略。

 

为了检查I2A模型的运行情况,DeepMind团队创建了一个尝试玩著名的推箱子游戏的实现。推箱子是一个经典的计划问题,模型必须将多个箱子推入给定的目标位置。因为只能推箱子(而不是拉箱子),所以许多动作都是不可逆的,而且错误会使拼图变得无法解决。因此,人类玩家被迫提前计划动作。想象力增强的模型展示了从不完善的环境(如Sokoban)中学习的惊人能力,DeepMind团队将I2A模型与更传统的深度RL技术进行了基准比较,结果令人瞩目。I2A达到了令人震惊的85%的性能,大大优于其他策略。

 推箱子实验最令人印象深刻的收获之一是:增强想象力的机器学习模型能够在可能不完美的环境模型中想象轨迹并忽略不准确信息的能力。鉴于越来越多的场景需要AI使用不完善的信息和有限的数据进行操作,因此这种能力特别重要。

 

想象力是人类思维中将我们与其他物种区分开的那些神奇特征之一。从神经科学的角度来看,想象力是大脑在没有任何直接感觉输入的情况下形成图像或感觉的能力。想象力是我们学习过程的关键要素,因为它使我们能够将知识应用于特定问题并更好地计划未来的结果。当我们执行日常生活中的任务时,我们不断地“想象”潜在的结果,以优化我们的行动。毫不奇怪,从认知的角度来看,想象力通常被认为是进行计划的基础。

想象力是可以为新一代AI打开大门的关键功能之一。诸如I2A之类的技术仍处于起步阶段,但可以成为强化学习体系结构的关键组成部分,在这种体系结构中,机器人不仅能够学习现在,而且能够“想象”未来。​​​​​​​

 

         

猜你喜欢