专栏名称: 36氪
36氪(36Kr.com)是中国领先的科技新媒体,我们报道最新的互联网科技新闻以及最有潜力的互联网创业企业。
目录
相关文章推荐
36氪  ·  跨年夜,新老霸总轮番演讲 ·  昨天  
现代财经  ·  《现代财经-早读早分享》2025年元月2日周 ... ·  2 天前  
现代财经  ·  《现代财经-早读早分享》2025年元月2日周 ... ·  2 天前  
新浪科技  ·  【#蔚来李斌开始2200公里东北行程#,挑战 ... ·  3 天前  
新浪科技  ·  【#公募2024年度成绩单#:七成主动权益基 ... ·  3 天前  
51好读  ›  专栏  ›  36氪

Deepmind在训练AI「花式摔跤」, 我们离「西部世界」又近了一步 | 潮科技

36氪  · 公众号  · 科技媒体  · 2017-07-12 08:15

正文



“阿尔法狗”的制作团队Deepmind可谓是人尽皆知了,他们最近却开始用火柴人教AI“跑酷”。




文 | 石筱玉

编辑 | 傅博



Deepmind在今年早些时候“一战成名”,在中国乌镇围棋峰会上,AlphaGo战胜了世界冠军柯洁九段。在这之后,我们知道了Deepmind将会把AlphaGo的技术运用在疾病诊断等造福人类的领域。

所以,Deepmind最近在做什么“高大上”的事情呢?

……他们在教AI“跑酷”(下图为动图)。

最近,Deepmind放出了一段“搞笑视频”。其中的火柴小人看似将以酷炫的动作翻越路上的障碍物,但不幸演绎了各类“花式摔跤”。在视频中,还有四条腿的“蚂蚁”和只有身子和腿的“走路器”。


Deepmind表示,这些小人的动作都是AI进行控制的。在AI的帮助下,小人们能做出走路、跳跃等一系列动作,甚至能模仿行动不便的老人走路时的样子(下图为动图)。

为什么Deepmind的AI不去下围棋了,而是开发了“跑酷”的新爱好呢?

在Deepmind发布的文章中,研究人员称“跑酷”和围棋在目的上显著不同,而这一点就是他们希望AI能够学习的。研究人员在文章中这么解释:

“在一些AI的问题中,比如玩Atari电脑游戏和下围棋,它们的目标非常容易定义——就是赢。但是你如何解释一个后空翻的目标呢?或者一个跳跃动作?

在训练自动化系统进行运动的时候,如何清楚地对它们解释复杂动作,是一个经常遇到的问题。”

在实践中,研究人员在火柴小人的必经之路上放入了“矮墙”、松动的“地砖”等障碍物。AI控制下的小人在一次次翻越障碍不成功后,它们也学会了如何“安全”跑到终点。

Deepmind将这项技能形容为:

“我们的实验对象能够在不接受指令的情况下演化出复杂技能。这是一个能被用于训练系统中不同模拟人体运动的技术。”

Deepmind解释称,它们采用的是一种“反馈学习算法”(reinforcement learning algorithm)。这种算法能够帮助未来的AI在不同环境中灵活、自然地运动。

在研究者们的眼中,人工智能控制下的灵活行为是人工智能拥有“运动智慧”的标志。在这一技术的助力下,计算机们很快就能胜任更复杂的任务,甚至能变得和人类越来越像。

你走路的时候是这个样子吗?

Deepmind对这项技术有不少的展望。研究者们在文章的最后写道:

“未来,我们可以将这些技术运用在复杂环境中,对更多的(机器)行为进行调控。”

对一大堆能够模仿人类行为的机器进行调控?听起来它们能做很多事情,比如说……组成一个《西部世界》一般的游乐园。所以,Deepmind今天还在花式摔跤的火柴小人,能变成明日《西部世界》里心思缜密、运动灵活的机器人吗?

Deepmind研究人员讲述这项技术的原始博文名叫《在模拟环境中进行灵活运动》。


点击关键词,查看过去两周的潮科技


环保:「城市鸟街」「快速种树」

上天:和霍金同游太空

消费:「科学剁手」

技术:VR眼动追踪

教育:「VR体验吸毒」

感情:「VR恋爱设备

智慧生活:「蜘蛛侠电梯」「万能魔戒「自动除臭衣架「汗水充电

影视:「裸眼3D阿凡达