用 10 周时间,让你从 TensorFlow 基础入门,到搭建 CNN、自编码、RNN、GAN 等模型,并最终掌握开发的实战技能。4 月线上开课,www.mooc.ai 现已开放预约。
雷锋网按:如何让机器人的大脑 “模仿” 得更像人类的大脑?科学家们给出的答案是研究人脑结构的分子层面,尝试深入地了解人脑细胞的情况,进而将 “拼图” 完成,还原大脑。那么,什么是神经认知学,神经认知在机器人领域都有哪些应用?
本期雷锋网硬创公开课邀请到 TIANBOT 资深机器人研究工程师田博,为我们做主题为《神经认知学在机器人中的发展和应用》的分享。
内容介绍
本期公开课包含但不限于以下内容:
神经认知在机器人领域应用简介
BBD 与神经区域连接猜想
RatSLAM,ehSLAM 与空间认知细胞
HMax 与视觉皮层
Neuromorphic 与神经元连接
嘉宾介绍
田博,TIANBOT 资深机器人研究工程师,清华大学企业家协会(TEEC)青创会员。温州市机器人与智能制造特聘专家,580 计划创业人才。知乎机器人话题优秀回答者。于 2007 年开始从事机器人研发工作,工作范围涵盖机械设计、控制、算法等,在校期间获得 RoboCup 人形组第四名。
参与过研发小型和大型的人形机器人,轮式机器人的环境感知算法。发表多篇机器人(IROS)和人工智能顶级国际会议(AAAI)文章,开发移动机器人超过十种,包括足式与轮式。回国后进行移动服务式机器人创业,受邀在人工智能大会、机器人核心器件计算法等大小会议上发表演讲,创业项目获得南京创赢未来金奖,创办南京天之博特机器人科技有限公司,志在培养机器人技术与开发人才。参加央视财经频道的创业英雄汇。
公开课完整视频(共 96 分钟):
在雷锋网「leiphone-sz」微信后台回复「0422」,获取公开课视频。
以下为嘉宾分享内容实录精编。
我从 07 年开始做机器人研究,并且有幸在 2011 年加入唐华锦博士在新加坡科技局信息所创建的计算神经组,从属于李海洲博士的人类语言科技部门与机器人技术项目部门。我于 2011 年 5 月至 2015 年 1 月在组内从事神经认知机器人的研发,也是这个组发展最好的时期。本次讲座的主要内容都来自我在组内三年半时间的研究经历,涉及到整个组的工作,而这个组由唐华锦领导,所以在这里介绍下他本人。
唐华锦教授于浙江大学、上海交通大学完成本科和硕士学习,于新加坡国立大学计算机工程系留学获得博士学位。 其后在意法半导体公司担任研发工程师,并于澳大利亚昆士兰大学脑科学研究所从事博士后研究,2008-2014 年在新加坡科技研究局资讯通信研究院任认知计算和机器人认知实验室主任。2014 至今,担任四川大学计算机学院类脑计算研究中心主任。入选国家青年千人计划、四川省千人计划。
唐华锦教授担任多个国际一流学术期刊包括 IEEE Transactions on Neural Networks and Learning Systems, IEEE Transactions on Cognitive and Developmental Systems 和 Frontiers in Neuromorphic Engineering 的 Associate Editor,Frontiers in Robotics and AI 编委,并担任多个国际会议主席或程序委员会主席,IEEE 计算智能学会教育分委会主席、IEEE 认知与发育系统技术委员会副主席等。
唐华锦当时是计算神经组的主任,于 2014 年在四川大学正式任教授,他离开以后我也就在 15 年回国创业了。现在我主要从事 ROS 的职业培训,并进行移动式服务机器人的开发。另外我也在知乎上经常回答关于机器人的话题,ID 为【贾子枫】,欢迎大家关注!
机器人技术发展趋势
这是基于我个人对机器人发展的理解对机器人的划分。最早是工业机器人,研究内容是规划和控制,从 1960s 就开始了。
后来的军用机器人包括火星机器人、救灾机器人、水下机器人、空中机器人、地面机器人,研究的主要是机器人的移动性能,包括本田的 ASIMO 和波士顿动力的机器人,虽然本田的目标是让 ASIMO 成为服务机器人,但是研究的主要是机器人的移动性能。
军用机器人的下一步我们希望做服务机器人,这几年随着机器人的发展,大家对服务机器人的概念也越来越熟悉。让工业机器人变成移动机器人,我们需要增加它的移动性能,但是一个会动的机器人,我们往往用遥控的方式,如果想要它自己动是非常困难的,所以具备适用性和空间认知是服务机器人的共性基础技术,包括语音对话。
再往后,我们希望机器人能够发展成家庭机器人或是个人机器人,这时候机器人需要足够的理解能力和足够的安全性。
我们认为目前机器人的发展处在军用机器人向服务机器人跨越的阶段,现在所有技术都处在这个节点,也就是移动技术和语音交互方面。
为什么机器人要应用神经认知的方法?
传统的方法是用世界的模型加上机器人模型,也就是说在这两个模型里面我们需要知道所有的细节,然后得到一个非常工程的解决方案,比如早期的工业机器人上,我们知道它的关节、链接长短,我们用运用机器学算它的路径,得出一系列的解。但是,现在我们发现,这种解决方案只适合汽车工业,3C 领域比如做分拣是不适用的,因为我们面临的环境是千变万化的,也就是说我们没办法用单一的世界模型去描述机器人所处的环境,所以我们要抛弃世界模型的方案。
这是我们设想的未来机器人结构,首先从大脑得出一个模型,然后得出一个记忆模型。为什么是记忆模型?因为大脑有很多功能, 从神经认知学的角度讲,人类之所以能成长为万灵之长,主要是因为人类大脑的新皮层足够大并且急剧扩张,而新皮层主要任务就是存储, 相当于我们记忆经过编码后存储在新皮层,而骨皮层和中皮层从最早的啮齿类动物到现在灵长类动物并没有发生特别大的变化,我们认为人类之所以产生智能,可能最主要的原因就是记忆的量变到质变。所以,我们希望将这个模型应用在机器人上,也就是把大脑放进去,工程师不需要为机器人做世界模型的建立,而是机器人自己去建立世界模型,这种机器人我们称之为 NEural COgnitive Robot,即神经认知机器人。
当然,我们也在思考光一个大脑能否产生智能,目前普遍的说法是不行,所以光放入大脑是不行的,还需要很多传感器一起产生作用,因为在这个大闭环中,需要先获取外部的信息,经过大脑神经网络处理,最后到执行机构,然后再回到感知系统获取信息,是一个不断判断、反馈到抉择的过程,也就是产生智能的过程。
神经认知(计算神经)的研究内容
我本身是做机器人的,但为什么当初会愿意加入这个神经认知组呢?我们感觉机器人发展到现阶段,算法是不足以支持我们对机器人的想象空间的,即使不断堆砌工程师,机器人能达到的智能水平也只是一个有限值,而神经认知学的方法有可能从根本上改变现下机器人智能低下的状况。
神经认知学的整个体系有两个大的分类:微观的神经电路和宏观的人工智能。
对于微观的神经电路研究,大家是想研究模拟神经比较基本的规则,包括我们研究 Synapse(突触)是怎样激发的,我们希望把一个神经元的模型做好,然后慢慢堆砌,当数量级达到一定程度的时候,也许系统就产生智能了,当然这也只是一种猜测。另外,人类的神经元实在太多了,所以我们会根据认知心理学做分类,包括 Memory Coding(记忆编码)、Associative Memory(记忆关联)、Synaptic Learning(突触学习)、Neural Coding(神经编码)、Episodic Memory(片段记忆)。
从宏观的角度来说,我们希望在机器人上体现出智能,也就是说我们在研究机器人的时候不是特别在意内部怎样实现的,或者说当整个系统应用在机器人上的时候,我不关心你在生理级别与生物系统的类似性,我们只关心机器人体现出应有的智能。对于机器人的智能,我们 强调对环境的适应性,也就是对不同环境是否能够适应。
神经认知学及其在机器人学科中的发展简介
在这里介绍几位神经认知学或是机器人学研究领域比较有代表性的人物,也是代表着神经认知学在机器人应用上的发展。Edward Tolman 是早期的心理学家,研究了很多认知相关的内容,所以他算一个认知心理学方面的专家,非常有名,主要是提出了空间认知地图的概念,不过已经过世了;Gerald Edelman 应该在 2014 年刚刚过世,我在神经认知组的时候参考了很多他的研究,他也是 BBD(Brain-based Device)的提出者;做视觉的同学应该对 Tomaso Poggio 比较熟悉,他是 Hmax 的创始人;Michael Milford 是做 RatSLAM 的,也是我最为熟悉的。
这几个人的工作好像没什么关系,又是地图,又是 BBD,又是视觉的,在这里也就不每个点都详细讲了,我就按照我们组为什么要去研究这个东西、我们是怎么想的这个思路来讲下。
一系列的神经认知机器人——NECO
我们当时做机器人,想法很简单,因为神经认知学试验刚开始大家都用老鼠,各种各样的迷宫里,给它们一些食物,研究它们的行为,所以我们就在想是否可以用机器人替代这只老鼠,把神经认知模型放进机器人里面。这也是为什么唐华锦教授当初要让做机器人的人加入他们神经认知组,而且他们其实主要偏向于计算神经学。我们去了之后,最开始就找对照模型,就是前面提到的心理学家 Edward Tolman 在 1940s 年做的一个实验,让一个老鼠在一个十字型迷宫里(上图图左),我们是放了一个机器人进去(上图图中和图右),机器人可以看见墙上我们给出的 landmark(地标),从而对环境做出判断,最终它的任务是找到奶酪。
这些也是我们做过的实验,机器人在实际环境中的应用,看机器人是否能适应各种不同的环境。
最初的认知机器人概念——类脑芯片的架构
这是我们对第一个十字迷宫做的类脑芯片的架构,首先要对空间有简单的感知,但这个空间只是一个十字型,所以我们只需要对几个选择有一个选择性,相当于机器人在空间的认知只有四个点,只有四个方向,所以只有四个选择。另外,我们需要机器人认识一些物体,因为用的是视觉方案,所以我们需要了解在记忆中是如何表达的,而不是传统的比如我看下颜色做二制化,然后与颜色模板进行匹配得出一个结果,我们是用整体图像做输入,给它一个记忆表达,然后会有神经连接的强化,促使输出。机器人最后得到的系统输出值,其实是在整个系统四个神经元里面选择一个神经元,这个神经元的输出就代表一个方向,会命令机器人转到某一方向。
这个架构是用神经认知的模型,部分架构用的是机器人工程化的方法,这个方法也是贯穿了我们那几年的研究,我们认为神经认知学难以解决的部分,就会用机器人工程化的方法去替代。当然,当神经认知模型比较成熟了以后,这部分也是可以替换的。
雷锋网按:接下来内容涉及到大量理论知识,嘉宾讲解了 BBD、HMAX 、空间认知地图以及 RatSLAM 的理念,文字难以描述,雷锋网直接附上 PPT,感兴趣的读者可以观看上面的视频,此部分内容可在 33min 开始观看。
未来的工作
Behavior learning(行为学习):这是我们一直想实现的机器人功能,就是说我来教,它来学。能将学到的东西做举一反三。
Active and lifelong learning(主动和终生学习):像教小孩儿一样教机器人。让机器人从没有任何知识表达的存储就开始学习,以现在机器人的技术来说,是没办法实现的,所以未来需要借助于神经认知学。
Neuromorphic(神经形态学):人类大脑内所有的神经元最后都是将我们所看到的信息转化为电信号,整个神经系统是一个大的电路,Neuromorphic 的工作就是模拟神经元的连接,前面一个神经元的信号传过来,如何激发后面的神经元,形成一个大型的并行电路,再把每个部分的 Neuromorphic 的芯片连接到执行机构上,形成一个与大脑神经架构类似的电路,这个时候我们可以做或者说只能做端到端的学习,现在深度学习非常喜欢讲端到端的学习,而人本身就是一个端到端学习的案例,我们自己的神经系统放上神经认知学,换上 Neuromorphic 的芯片,这是一个很顺畅的逻辑,也是我们未来的工作,现在还是觉得比较远。
Q&A 环节
雷锋网 (公众号:雷锋网) 读者:目前在研究中遇到最大的难点是什么?
田博:因为我本身是做机器人的,做神经认知研究后关于神经学的概念刚开始理解起来会比较吃力,因为是跨学科、强交叉,可以说在第一年我大量阅读 Science、Nature 的文章,与我本身工作背景差异非常大,所以是非常吃力的。如果你是学工科的,想从事神经学的研究,这个坎儿是一定要过去的。CMU 的机器人所和匹兹堡大学神经所有一个联合培养的人才项目,世界上最知名的研究机器人的学校也意识到传统的方法无法解决我们想解决的机器人问题。所以最主要还是客服跨学科的问题,跨过这个坎儿,后来就越来越顺了。
另外,就是神经的模型这块,因为我们得到的神经模型是神经学家从动物上经过表述过来的,这时候我们需要将计算模型翻译成程序,再把程序放在机器人里面,这个工作量相当大,从理论到实践,中间要做假设和测试,相对来说是比较累的。
雷锋网读者:目前在应用上有哪些走在前面的企业和产品?
田博:基本上还是大企业,IBM 有一个类脑芯片 TrueNorth,还有一个叫 DVS 的摄像头,这些摄像头我觉得最有可能最先应用的与 Neuromorphic 相关的产品,对于机器人来说,我是觉得还有点难,当时研究的东西直接应用是非常困难,但是主导思想是非常关键的,会让我们在产品开发时,架构是合理的,但直接应用是非常难的。
雷锋网读者:神经认知学与意念控制是同一概念吗?
田博:不是,这个我非常肯定。就我自己的理解,意念控制大多偏向于 EEG,主要就是获取脑电信号,包括康复机器人就是获取运动信号,然后让机器人带动你的肌肉运动,这个和神经认知有着根本性的区别,我们做神经认知是希望模拟神经活动的原理,而 EEG 希望扑捉神经的一些现象从而进行应用,所以简单来说,神经认知是一个更加根本性的问题,和意念控制还不太一样。
2017 新智造成长榜评选启动
雷锋网正式启动 2017「新智造成长榜」评选,旨在寻找智能未来三年十倍的创新变量。
即日起雷锋网接受创新企业的报名,最终榜单将由雷锋网于 7 月份举行的 CCF-GAIR 2017 大会期间公布。
如果您有意参加我们的评选活动,可以点击「阅读原文」,加入榜单评选!