没有什么是永垂不朽的,没有什么会一直昌盛,所以我宁愿做点真正有意义的事情,来致敬这个风起云涌的人工智能时代。
------- 题记。
近日,田渊栋受地平线曾经在 Facebook 的同事邀请,赴中国做了一期大牛讲堂,分享了关于游戏和增强学习等的话题。分享会后,AI 科技评论采访了田渊栋,就他为什么离开 Google 无人驾驶团队去 Facebook 人工智能研究院,现在正在做的工作,如何平衡工作中理论和应用的比率,怎么看待绝艺和 AlphaGo 的棋艺水平,怎么看待智能围棋的实用价值,接受了 AI 科技评论的采访。以下是采访正文。
1. AlphaGo 目前是世界第一的围棋选手,在此之后,研究智能围棋还有什么意义?
我觉得围棋是很有意思的游戏,AlphaGo 虽然把它做出来了。但很多东西的做法和人是不一样的。人在学围棋的时候有很多概念,按照概念做判断,但是机器解决他还是比较暴力的。
一方面,你可以说人用概念来做推理局限了他的计算能力,体现出人本身有一个高度抽象的能力,就是用非常非常局限的计算能力,能达到那么强的棋力。而 AlphaGo 就是用非常多的计算能力去弥补这些不足,所以恰恰是互补的,我相信还是有意义的。
另一方面,联系到后面那个问题(目前你的研究团队,对围棋 AI 的研究进展到何种地步?相比 AlphaGo 如何。),我们这边在开源之后就先放在那儿了,可能等到以后我们有新想法再拿过来试一试。我们这边是七八十人的研究机构,要让我们花二十人做围棋,这个是不可能的。我们这边都是很有名的研究员,这些研究员每个人都有自己的方向,像计算机视觉和自然语言处理等等,不可能把自己的方向放弃掉来专门(搞围棋)。
最后,从本质上来说,我们的风格跟其它公司不一样。我们研究员的一个目标是说在大家不做这个东西的时候,在比较冷门或者大家不相信它能做得更好的时候去做它,证明这条路能走通。比如说我们在做 DarkForest 的时候,围棋还是很冷门的方向,大家都不认为围棋可以做出来。我们的文章比 AlphaGo 早了三个月出来,证明这个东西确实有效果,而且能提高挺多的,这就是我们的贡献。我之前在采访里面说过,好的研究就是 “于无声处听惊雷”。
像星际这样的游戏,大家都不知道怎么做,研究员们的任务就是要想办法找到一些突破口,这个突破口可能没有人想到,或者是没有人觉得能做成,我们的目标是在这儿。我回到第一个问题,就是说智能围棋之后还有什么意义,就是我刚才说的,如果有人愿意想要做下去的话, 就看能不能自动从里面学出一些概念来,学出一些有意思的东西,比如说人有大局观或者是大势,或者是各种下棋时候的概念,概念是不是能从这里面自动学出来。像这些,目前大家都没什么办法。
(你说大局观吗?)
对,像这样的东西其实对于我们如何理解人的思维方式是更重要的。职业棋手是很厉害的,人脑的神经传导是毫秒级的,这点时间机器可以干很多事情,但人就是用这么慢的处理速度达到了这么强的水平。
2. 绝艺和 AlphaGo 有差距么,差距是多少,是什么造成了这种差距?
3. 跟 AlphaGo 3 月份比赛的水平比如何?
(AlphaGo 用其他的方法迭代的?)
4. 绝艺这次是跟电脑围棋比赛,跟下一次的真人比赛区别在哪?
(那我可以这样理解吗?跟电脑围棋比赛的是两个既定程序的对战,比如说电脑围棋绝艺跟真人,比如柯洁对战的时候,是变动性更大一点,是吗?)
5. 以 DarkForest 为例,除了围棋,这种完全信息博弈的游戏智慧要应用在其他领域需要解决哪些问题?
(如果是要针对某一个特定领域呢?)
6. 你刚才讲 PPT 的时候,讲到你们的围棋理论可以应用在游戏方面,还有其它现实生活中的应用场景吗?
一个问题就是说像完全信息博弈游戏,你知道你下完这步后局面会变成什么样子,你心里非常非常清楚。但到了现实世界的时候,有时候并不那么清楚,没有一个现实世界给你玩,你做完决定之后你得对这个决定的后果负责,所以对这个世界在你下完决定之后变成什么样子,你要有一个大概的估计。
所以你在现实世界做规划的时候,其实需要一个前向模型(forward model), 就是你对将来会发生什么事情的一个预计,前向模型是一种规划,是对将来会发生什么样事情的预计 。比如说你下完这步之后,可能整个情况变成什么样子,之后你再做下一步的计划。所以这个其实是很大的问题,是游戏和现实生活中是不同的。
7. 能详细介绍一下前向模型?
8. 我们看到绝艺那边,腾讯的副总裁姚星说他们可以把其 “精准决策” 能力用在无人驾驶,量化金融,辅助医疗等,这个是不是说得太早了?
长远来说,通过在绝艺上投入的人力和物力,这些工程师的思考本身可以变成经验。比如说它在人工智能上通过对于绝艺的提高,他知道了蒙特卡罗树的适用范围,知道了增强学习算法的适用范围,对这些算法有一个切身的理解。这样之后,如果去从事其它方向的 AI,就更加得心应手 。
我不知道 “绝艺” 是怎么做的,如果他们用的是 Alphago 相似的(原理)的话,要用到其他领域上,就不是特别容易 。比如说像辅助医疗,可能更多的是去识别图片,去怎么样去找到病变组织,这个其实更多的是图像识别的问题,而不是说关于决策的问题。所以这个其实关系不是特别大,但是不好说,说不定他们有方法。
9. 李开复之前说 “AlphaGo 其实做了相当多的围棋领域的优化,除了系统调整整合之外,里面甚至还有人工设定和调节的一些参数,因此还不能算是一个通用技术平台,不是一个工程师经过调动 API 就可以使用的,而且还距离比较远。” 假如要应用在其他领域,以金融为例,这套系统大概需要改动或调整多少?
(比如信用体系一般比较多。)
(这个是要靠 AI 加某个垂直应用场景的实践,是吧?)
10. 你除了围棋还有其他的研究领域吗?
(现在最主要的哪一部分是重点?是理论还是偏应用。)
11. 其实之前看你知乎的文章,好像是讲过目前深度学习在复杂推理的一些,还有今天的分享里面你也讲了有一些进展和挑战,在这么多挑战里面,最大的一个挑战是什么?
12. 你刚才说的目前研究的领域来说,能透露一下你最近一段时间比较重要的进展?
下一步工作也是围绕上面说的那些,继续往下进行?
13. 你目前负责项目和研究领域在整个 Facebook 公司的架构里面,是处于一个什么样的位置,起什么样的作用?
(像您刚才说的做研究,需要把一个现在还冷门的东西钻进去。)
(之前看过您那篇在谷歌和 Facebook 的一个比较,在谷歌是没有这种自由度的?)
14. 你其实特别喜欢写博客和杂文,甚至我还看到有古文,我想问写作不管是中文的还是英文的,对于你研究来说有什么帮助?
(但是其实写博客和写论文还是两种东西嘛,因为写博客可能不会写得那么深。)
15. 经常看见你说表达的重要性,它在你不管是做研究还是之前在谷歌做产品的时候,它扮演了一个什么样的角色?
(必须要把现在这个事情给别人说清楚,得到别人的认可?)
16. 对于 AI 领域的后进者们,比如说学生、创业者或者是研究者们来说,你作为一个过来人,当然还在继续往前走,对他们有什么建议?
(你现在在 Facebook 的头衔是什么?)
(就是把眼前的事情做好?)
小结:
AI 科技评论在采访田渊栋的时候,
在问到 DarkForest 现在的进展时,他表示 “我们这边其实目前还没有继续做,在开源之后就先放在那儿了。”。
在说道人工智能有什么意义的时候,他表示 “就是我刚才说的,如果你继续做下去的话,我们想能不能自动从这里面学出一些概念来,学出一些有意思的东西…… 像这样的东西其实对于我们如何理解人的思维方式是更重要的。”
在问道你现在在 Facebook 的头衔是什么时,他表示我的 “头衔就是研究科学家,其实就是研究员。”
类似这样的风格的回答很多很多,给近在迟尺的 AI 科技评论展现了一个直白坦率,严格待己,谦虚待学的生动形象。这跟我们采访 AI 业界公司大佬时他们觉得他们能解决这个问题,他们没遇到什么困难,他们即将所向披靡的那一面然不同,眼前的这个年轻科学家体现的是学界人士低调,谨慎,求是的另一面。但值得一提的事,AI 科技评论看到那张谦逊却带了一点点桀骜不驯的脸的背后,的是一个对自己有极高要求,对理想有极高追求的,不愿意人云亦云,却希望真的在人工智能领域有所作为的科学家的心。在孤独和庸俗,在跟着心走和大流之间,他选择了孤独和跟着心走。