专栏名称: 两个质子
我们是谁?我们从哪里来?我们到哪里去?一群为科学着迷的普通人,一群为生活着迷的科学家。我们就是两个质子。
51好读  ›  专栏  ›  两个质子

谷歌推出会“做梦”机器人,在梦境中不断学习

两个质子  · 公众号  · 科学  · 2017-02-14 16:56

正文

随着神经科学领域的最新发现揭示了梦对于巩固记忆的重要性,谷歌(Google)下属的人工智能公司DeepMind开创了一项新的技术,该技术使机器人具有做梦的能力,从而提高其学习效率




鉴于谷歌的公司背景,毫无疑问这些人工智能机器人做梦的内容主要包括雅达利公司(Atari)视频游戏的场景。DeepMind最早的成功就在于训练人工智能打视频游戏,如“打砖块”(Breakout)和“爆破彗星”(Asteroids)等。


但是,该公司的终极计划是让人工智能像人类一样做梦,让人工智能挑战现实世界的情况,这对于学习和记忆的形成非常重要。


想要理解做梦对于人工智能机器人的重要性,首先要理解哺乳动物(例如,人类)头脑中如何形成梦境。


以神经科学的角度理解做梦的作用时,科学家的主要发现之一是——梦境的内容主要是消极性或威胁性的。尝试进行为期一个月的“梦境日记”记录,你可能会发现你的梦境包括不同程度的威胁性或尴尬的情况。


事实证明,像梦到“赤裸着去上学”这种古老的噩梦几乎是条普遍的准则而非个别例外的状况。当然,这种超乎预料的消极梦境内容毫无意义,除非用神经科学的视角仔细研究。


该领域的主流理论认为梦境能够强化近期事件的神经元回路,有可能梦境中遇到的消极性或威胁性的感觉能够帮助记忆深刻地印入大脑,从而增强记忆的形成。而DeepMind公司正是利用梦境极为相似的作用,通过专注于游戏场景中消极性或者挑战性的内容,加速人工智能的学习速度。


那么,对于人工智能机器人来说,什么样的情景才是具有挑战性、威胁性的?


目前,世界上最先进的人工智能也只是挑战更复杂的视频游戏,如“星际争霸II”(Starcraft II)和“魔幻迷宫”(Labyrinth)等,因此威胁性的情景可能包括一个特别难缠的大Boss,或一个棘手的迷宫。


“梦镜”并不是毫无意义地预演整个游戏而对玩家的整体分数提升没有多大意义,相反,特定的“梦镜”能帮助人工智能专注于游戏的某些特别具有挑战性的部分,并且周而复始地重复,直到掌握这些专门知识和技能。利用这种技术,DeepMind研究人员能够将人工智能的学习速度提升10倍之多,十分令人震撼。




你可能会问,既然人工智能机器人已经能在大多数游戏如象棋和围棋中打败人类了,这样的“梦境”还有必要吗?


想要领会这一点,就有必要区分使用“监督学习”与“无监督学习”的人工智能。


迄今为止,那些令人印象深刻的大部分人工智能的赫赫战绩都是通过监督学习实现的,在这个过程中,程序员向人工智能提供有组织的“训练数据集”进行训练学习,而人工智能则学习检测数据集内的特定模式。这是一个相当简单、直接的训练人工智能机器的方法,但这决不是人类自然学习的方式


人类的学习方式更类似于程序员所称的“无监督学习”方法,其中智能体自主进行试验来确定不同的行动方案如何影响其预期目标。当然,这种类型的学习要比监督学习花费更多的时间,因为这涉及到大量的试验。


DeepMind研究者主要关注人工智能的“无监督学习”,因为这更有希望创造出拥有人类一般智力的人工智能。


虽然目前仍不确定是否会有一天机器人能够梦到“电子绵羊”,考虑到我们一直为机器人设想的社会角色,似乎很快人工智能机器人就可能“梦到”一些社交尴尬情况如“赤裸着去上学”。


现在,你可以尽情的想象一个裸体人工智能机器人看起来是什么样子,虽然RealDolls公司创始人马特·麦克马伦(Matt McMullen)似乎已经有了一些生动的想法。