导读:
地平线机器人资深算法研究员罗恒参加了钛坦白第33期,与百度资深工程师、Paddle API重构设计负责人于洋及第四范式联合创始人、首席研究科学家陈雨强一同讨论分享了自己关于AI时代机器学习的看法与见解。
我的博士是在上海交通大学念的,刚开始的时候其实并没有确定自己研究方向,只是对机器学习很感兴趣,看了很多机器学习方面的书和论文,最感兴趣的是“支持向量机”,感觉实际中有广泛应用,同时又有非常完善的理论,所以花了一定的精力在读相关的论文和书。看了一段时间之后,发现Vapnik似乎已经把所有他想要解决的问题都解决完了,很多识别的问题解决得不好,是由于没有专家设计出合理的核和函数,而这不是SVM或统计学习理论所关心的问题。当时看到这儿,感觉好像已经没什么工作可做了。
在这个时候看到了Yoshua Bengio写的一个关于深度学习的一个技术报告,觉得很有趣,因为角度完全不一样。SVM考虑的问题都是如何限制模型的复杂度,如何来增强模型的推广能力,而在Bengio的论文里讨论的都是如何学习数据的表示,他认为如果我们能够学习到关于数据的抽象表示,那么分类就会变得非常简单,也就是说我们不需要去用一个像知识像机那么复杂的分类器,可能一个简单的线性分类器就能实现我们的目标。
当时就觉得这个非常有潜力,这可能是一个全新的方向,那时候是2008年,关注神经网络、深度学习的人还比较少,我也从来没有想到过后来会有这样大的发展,当时觉得最大的可能也就是在学术界引起一波新的研究的热潮,想不到深度学习后来会被广泛应用到实际中,并且又一次引发了公众对于人工智能的关注。
开始做深度学习研究的时候,面临一个很大的困扰。别人问我在做什么,回答在做深度学习,那么下一个问题一定是“什么是深度学习”。甚至论文投出去有很多审稿人会觉得你怎么在做神经网络,这不都是已经很古老的东西了吗?没想到,过了短短的五六年之后,再去开会的时候,当有人问我在做什么方向,我回答说做深度学习的时候,往往换回来的回应都是“怎么又是在做深度学习”,那时候好像所有人都在做深度学习了。
好不容易发了几篇论文能够毕业了,一次开会正好遇见Yoshua Bengio,他正好在招博士后,就去了他那里做博士后。其实当时觉得自己博士毕业后很大可能是去学术界,想先做博士后,回国找个学校教书。
做了两年博士后之后,突然发现深度学习已经变得非常火爆了,不但是在学术界引起了非常大的轰动,甚至在工业界也开始有很多人关注起来,甚至很多深度学习的应用都已经被应用到了工业系统里边。所以2014年初离开加拿大回国,一方面很好奇工业界用深度学习到底怎么样,想来看一看,另一方面也是学术界的工作其实不是太好找,工业界反倒工作很多,所以就加入了百度IDL深度学习研究院。在百度实际上就是做一些应用深度学习到搜索系统中的工作,也参与了Paddlepaddle开发,周一的时候于洋已经介绍了Paddlepaddle的一些情况,我和于洋认识好久了。
去年加入了地平线机器人,现在在地平线机器人做一些模型压缩方面的工作,我们的想法就是希望能够把硬件、芯片、算法到应用场景打通,把它们放在一起联合优化,其实这个也就好象做深度学习总是喜欢端到端来进行,end to end来训练模型。我们希望能够把从应用场景中的需求一直传递到软件,传递到算法,传递到硬件,传递到芯片,能够把它放在一起联合优化。
先简单回顾下深度学习的发展。深度学习是源于上世纪60年代开始神经网络进一步的发展,它现在在机器视觉、自然语言理解、一些工业级的应用都产生了巨大的影响。近来还慢慢出现了一些受深度学习启发的新应用方向,比如医疗图像分析、自动驾驶。国内的情况是,自从百度在2013年的时候创建了深度学习研究院,这些年来一些大公司也都开始有一些部门从事深度学习相关的研究工作。
真正引起人工智能火爆的是去年出现的AlphaGo。一方面,我本人也下围棋,当然我是普通的业余爱好者的水平,另外一方面,我自己也做机器学习,因此也常常会关注这方面的进展,但是其实在AlphaGo出现之前,总觉得电脑击败人类顶尖棋手是一个非常遥远的事情。
我在大概2011年、2012年的时候,看到过Hinton的学生发表的一篇论文,里面开始用卷积神经网络来处理棋谱,把棋谱当成一张图片输入卷积神经网络,然后去预测下一步的位置。那篇论文估计也只是两个学生的游戏之作,发表在不是很著名的会议上。我当时觉得这个想法很有意思,因为其实从下棋人的角度,很多时候他就是凭着大致的一个感觉,并没有很多的计算,只是对棋的形状的一种感觉,常常可以做出一些直觉上的判断,而且很多时候这种判断还比较准。
但是只是对棋行的把握是远远不够的。所以当我听说DeepMind在做围棋的时候,就觉得可能会有突破(从本质上讲,围棋和DeepMind之前做的那些打游戏的任务,并没有什么不同)。听说能够赢了樊辉(职业棋手)当时就觉得很震惊了,以往的围棋软件大概只能到业余棋手的水平,而业余棋手到职业棋手往往有一条非常巨大的难以跨越的鸿沟。而很快,AlphaGo就击败了李世石。李世石是大概十多年才一出的天才,从樊辉到李世石,这中间其实也有一条非常大的鸿沟。让人没有想到的是,对于AlphaGo来说,似乎这两条巨大的鸿沟都不存在,只是不停的去训练,机器就不断的提升,轻松击败人类的天才,带领人类看到前所未见的围棋新境界。这当时对我是很大的震撼,而且从后来来看,其实对整个世界都有巨大的震撼。
AlphaGo一定会成为人工智能史上的里程碑,但是这并不意味着AI会迅速到来。现在对于AI的火爆关注,里面存在相当的泡沫。更何况,目前AlphaGo本身的细节其实只有DeepMind的少数人知道,前两天田渊栋来地平线访问也聊起过这个,他遇到黄士杰,聊起了他们新的进展。黄士杰的讲法就是在Nature论文之后,又做了很大的改进,那么这很可能意味着沿着Nature那篇论文继续往下做会遇到瓶颈。而且从应用AlphaGo的角度,如何应用到实际问题,会有什么样的商业模式,都是完全不确定的。所以我个人怀疑现在的这种火爆的场面里面有相当的泡沫的成份存在。
这些泡沫造成什么样的影响呢?从去年到今年,出现了大量的AI相关的创业公司,然后突然之间做算法的,无论是做机器视觉、自然语言理解、语音识别,还是深度学习算法,突然出现了很多的高薪职位,然后不断传出新毕业的学生拿到了如何如何的高薪。除此之外,很多大公司也在纷纷的成立AI相关的部门、相关的研究院等等。
原文链接:
https://mp.weixin.qq.com/s/wT3Sa3xciVDsgpl1ZbMDDA