专栏名称: AI数据派
THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。
目录
相关文章推荐
环球物理  ·  【物理笔记】学霸笔记力学篇全部汇总 ·  20 小时前  
中科院物理所  ·  太空航行不再需要燃料? ·  昨天  
中科院物理所  ·  出生日期覆盖1-9所有数字的概率很小吗?莫非 ... ·  3 天前  
51好读  ›  专栏  ›  AI数据派

有意识的机器人问世!突破狭义AI上的自我学习(附视频)

AI数据派  · 公众号  ·  · 2019-02-25 07:30

正文

来源:新智元

本文 3000字 ,建议阅读 8分钟

本文介绍了哥伦比亚大学打造了“有意识的机器人”,突破狭义上的AI。



[ 导读 ] 哥伦比亚大学打造一只“从零开始”认识自己的机器人,这个机器人在物理学、几何学或运动动力学方面没有先验知识,但经过35小时训练,能够100%完成设定任务,具备自我意识。


“有意识的机器人”在春节前现身。


过去几十年来,拥有自我意识的机器人一直是科幻小说最喜欢的题材之一,现在,这个过去只存在与科幻小说中的事物离我们越来越近了。


哥伦比亚大学工程学专业的研究人员打造了一种“从零开始”认识自己的机器人,这个机器人在物理学、几何学或运动动力学方面没有先验知识,最初并不知道自己是蜘蛛、蛇还是手臂,不知道自己长什么样子。


在经过35个小时的“初步学习”之后,机器人创建了一套自我模拟。然后利用自模拟器来考虑和适应不同的情况,处理新任务,甚至能检测并修复机体损伤,继续处理任务。


最近,这项成果近日发表在Science Robotics上。



成功率100%,堪比人类闭眼睛拿一杯水


虽然人类和动物都可以通过思考来进行自我调节,但目前对大多数机器人来说,仍在学习使用人类提供的模拟器和模型,或者通过费力耗时的试验来纠正错误。机器人还没有学会像人类那样模拟自己。


论文作者之一,哥伦比亚大学机械工程学教授、创意机器实验室主任Hod Lipson和他的博士生让一个四自由度的铰接式机械臂能够思考,具体过程如下:


最初,机器人会进行随机移动,收集大约1000个移动轨迹,每个轨迹中包括100个点。然后利用深度学习,来创建一个自我模型。



不过,创建出的第一个模型是非常不准确的,机器人并不知道自己是什么,也不知道自己的关节是如何连接的。但 经过不到35小时 的训练,自我模型已经和机器人的真实情况高度相符。


这个模型会在闭环系统中执行“拾取和放置”任务,使机器人能够完全基于内部自我模型,在移动轨迹的每一步上相对原始位置进行重新校准。通过闭环控制,机器人能够抓取地面上特定位置的物体,并将它们放入指定容器中, 成功率高达100%。



即使在开环系统中,机器人也是完全基于内部自我模型来执行任务,没有任何外部反馈,机器人完成拾取任务的成功率为44%。


看上去很简单,但机器臂跟流水线上的机器臂不同,后者是设定好的固定程序,而前者完全是自主学习。


“这任务就好像闭着眼睛捡起一杯水,即使人类也很难完成。” 论文一作、Lipson的计算机科学系博士生Kwiatkowski说。


检测自我损伤,再次模拟自我


这个机器人的强大之处还在于,它可以检测到自身的损伤。


研究人员利用3D打印打造了一个变形的部件 (下图红色部件) 来模拟机体损伤,结果机器人能够检测到这一变化,并重新训练自我模型。新模型能够以很少的性能损失为代价,重新成功执行拾取和放置任务。




此外,自我建模机器人还可以用于完成其他任务,比如使用标记笔书写文本。未来,可能会自己写对联。



Hod Lipson说,迄今为止,机器人需要通过人类明确地模拟指令来实现操作。 “但是,如果我们希望机器人能够独立、快速适应无法预见的情景,那么它们就必须学会模拟自我。”

抽取自我模型,无需额外实验完成多项不同任务


自建模 (self-modeling) 并非新技术,很多机器人系统都采用端到端训练的方式,在完全无模型的情况下学会一项任务。但是,通过这种方式学会的任务,往往无法扩展,也即机器人只能完成被训练好的那一项任务。


因此,如何实现无模型的扩展,也即通用端到端,就成了一个需要被解决的问题。


考虑到这台机器人本身 (从设计上) 是可以用来完成多项任务的,研究人员便想,何不从中抽象出一个的“自我模型” (self-model) ,然后以此为基础,让机器人学习各种新的任务,在此过程中不断调整原有的自我模型。这样一来,不就能够实现持续的自监督学习了吗?



于是,他们让机器人 (或者准确说,机械臂) 自行随机运转,就像婴儿自己乱动手脚一样,得到的数据集用于训练一个专门设计的神经网络,也即生成一个原始的“自我模型”。


接下来,机器人使用自我模型,开始完成不同的任务 (上图步骤3) ,即“抓取并放置” (Pick-and-place) 和“写字” (Handwriting) 。无论从机械臂运行的轨迹和下手轻重,这都是两个完全不同的任务。


作者解释说,闭环控制让机器人能通过从位置传感器接收到的反馈重新校准沿轨迹上每个步骤的实际位置。相比之下,开环控制则完全基于内部的自我模型,没有任何外部反馈。



由上图可见,从“抓取并放置”改为“写字”时,机器人发现前后不一致,为了模拟全新的任务,形态发生了突然改变 (上图步骤4) ,并使用新数据更新了最初的自我模型 (步骤5) 。更新自我模型后,机器人迅速转变状态,开始继续执行任务 (写字)


视频时长约2分钟,建议WIFI条件下观看


作者特别强调,他们提出的这种新方法 能够让机器人自动完成两种不同的任务,并且不需要进行额外的物理实验。 从某种意义上说,做到了 “无模型可扩展的第一步”

突破狭义AI,迈向自我意识机器的重要一步







请到「今天看啥」查看全文