专栏名称: 钱皓频道
从VC视角观察互联网新趋势,分析背后原因与影响的新媒体分析平台,已有80多万互联网从业者与投资人关注
目录
相关文章推荐
光子星球  ·  双11,这批商家找到了新变量 ·  6 天前  
光子星球  ·  双11,这批商家找到了新变量 ·  6 天前  
PE星球  ·  “VC说宁可7折出售,也不愿赴港IPO” ·  6 天前  
PE星球  ·  “VC说宁可7折出售,也不愿赴港IPO” ·  6 天前  
科技美学官方  ·  华为Mate70,要来了 ·  1 周前  
51好读  ›  专栏  ›  钱皓频道

阿尔法狗之父哈萨比斯访谈:人工智能未来将如何碾压一切

钱皓频道  · 公众号  · 科技自媒体  · 2017-01-05 21:34

正文



来源:虎嗅(ID:huxiu_com)、造就(ID:xingshu100)


少年柯洁输棋,AI完胜,我就问你服不服


“人类第一围棋高手”柯洁终于兑现和人工智能一战的豪言,却执黑中盘认输。而在连胜55场后,谷歌官方终于狡黠的宣布横扫人类棋手的Master,就是升级版AlphaGo。在阿发狗轻取李世石大半年之后,Master以60:0扫平人类实在不是意外。


少年柯洁输棋后,在曾经向AlphaGo下战书的微博号感叹“人类数千年的实战演化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋的边”。尽管柯洁并没有放弃,表示“我们棋手将会结合计算机,迈进全新领域达到全新境界”,然而以人工智能以半年时间就从战胜二流水平的北美围棋冠军晋级到战胜超级棋手李世石的进化速度,时间并不站在人类一边。

高晓松也在Master战胜柯洁时发了一条比柯洁更加伤感的微博,“作为自幼学棋,崇拜国手的业余棋手,看了Master 50:0 横扫中日韩顶尖高手的对局,难过极了。为所有的大国手伤心,路已经走完了。多少代大师上下求索,求道求术,全被破解。未来一个八岁少年只要一部手机就可以战胜九段,荣誉信仰灰飞烟灭。等有一天,机器做出了所有的音乐与诗歌,我们的路也会走完。”

AI真的可怕么?

AlphaGo狗2代卷土重来赢得如此干脆轻松,给棋霸柯洁和杂学大家高晓松对人类的信心不小的打击。高速发展的人工智能挑战人类再次成为热点话题。就在去年AlphaGo战胜李世乭后不久,哈萨比斯接受了这次采访。


除了AlphaGo,我们的谈话还触及到计算机游戏、下一代智能手机助手、DeepMind在谷歌所扮演的角色、机器人、AI如何辅助科研等等话题。


“围棋一直是人工智能研究中的一个圣杯。”



对于不是很了解AI或围棋的人,你怎么描述人工智能这场胜利引起的文化震动?

哈萨比斯:我要说的有几点。围棋一直是完全信息博弈的最高峰。就其可能性而言,它比国际象棋复杂得多,所以,它一直是人工智能研究中的一个圣杯,或者说是巨大挑战,尤其是在“深蓝”(Deep Blue)攻克国际象棋以后。你也知道,虽然在围棋AI方面的投入很多,但进展一直并不明显。

蒙特卡洛树搜索是十年前一个不小的创新,但我想AlphaGo所做的,无非就是在神经网络中引入了“直觉”——如果可以管它叫直觉的话。而顶尖围棋手区别于一般棋手的地方,就是这种直觉。

让我没想到的是,就连迈克·雷蒙(Michael Redmond)在现场解说的时候都有点不太利索,他还是个专业九段棋手!从这里可以看出来,为围棋写价值函数有多么难。

AlphaGo有没有哪几着棋出乎你的意料之外?

哈萨比斯:有。在双方第一局对战时,AlphaGo在李世乭的左侧地盘大胆突进,我们都大吃一惊,我想李世乭也没有料到,从他的面部表情可以看出来。那应该是相当出人意料的一着。

因为这种攻击性?

哈萨比斯:对,攻击性,还有胆量。而且,这本来是李世乭所擅长的。他以喜好剑走偏锋而闻名,这次比赛也不例外,我们之前就有这方面的预期。李世乭开局四处挑起战况,在那个时候,胜负还很难预料。围棋程序历来不善于应对这种局面。它们的局部计算能力不错,但全局判断就比较薄弱了。

举办这些比赛,输也好,赢也好,都是为了评估AlphaGo的能力。从这次的比赛中,你有哪些认识?

哈萨比斯:我们了解到,这个结果虽不能说超出了自己的期待,但至少跟希望的差不多吧。之前我们本来是跟人说,胜负该是两两之数。

接着你的第一个问题,谈到AI的重要性,我提到过的另一点就是它和深蓝的区别。深蓝是一个手动打造的程序,程序员将来自象棋大师的信息精炼成具体规则和启发式算法,而我们的做法是给AlphaGo灌输学习能力,让它在实践中去学习,这样做更类似于人类。

下一步是什么?未来还会不会举行别的AI大决战?

哈萨比斯:“最终,我们想把AI应用到现实世界的问题中去。”

我想就完全信息博弈而言,围棋就是最高峰。当然还有其他的顶尖棋手可以对弈。还有其他的游戏——比如无限额扑克就很难,多人游戏有它的难度,因为它是一种不完全信息博弈。还有很多游戏是人类明显玩得比计算机好的,比如在韩国比较热门的《星际争霸》。

策略性游戏需要你在信息不完全——也叫做“部分可观测”——的情况下,施展高水平的策略能力。围棋的特点就是,棋盘上有什么一清二楚,所以对计算机来说会略微容易一些。




从你个人角度来说,有没有兴趣搞一场《星际争霸》人机大战?


哈萨比斯:也许吧。我们对一个东西感兴趣,前提是它跟我们的研究项目在同一条道上。所以打赢游戏虽然趣味十足,但不是DeepMind的目的所在。我个人非常热爱游戏,以前也开发过游戏。

但前提是它们能充当有用的测试平台,可以在上面编写算法思路,测试其可扩展性和实际性能,这样做很有效率。最终,我们想把AI应用到现实世界的问题中去。

90年代的时候,计算机杂志上常出现你的名字,跟各种野心勃勃的游戏联系在一起。后来渐渐看到你的名字和DeepMind一起出现,我心想,“还挺配你的。”你能不能画一条线,把之前在游戏业的职业生涯跟现在的工作联系起来?

哈萨比斯:可以,我的终极目标一直是像DeepMind这样一个东西。从某种意义上说,这个计划我酝酿了二十多年了。如果你站在最终建立AI企业的角度,再看我之前的经历,你会发现我的选择都不是那么随机的。如果你熟悉我在Bullfrog这些地方所做的事情,你就会知道,AI是我一切工作的核心组成部分。

彼得·莫利纽(Peter Molyneux,Lionhead创始人)的游戏恰好也都是AI游戏。开发《主题公园》对当时十六七岁的我来说,是一件在内心深处种下种子的事情,我意识到如果我们真的尝试去拓展AI,它可以变得何等强大。那款游戏卖出几百万份,很多人都喜欢玩,因为有AI,游戏会根据你的玩法不断进化。我们把它当作正事来做,我也想把它延伸开来,作为日后游戏生涯的努力方向。

后来我从游戏业抽身,回到学术界,去搞神经科学,是因为到了2005年前后,我感觉到很难再进一步——我们打着开发游戏的旗号,实则是在偷偷做AI研究,结果搞得很艰难,毕竟发行商要的只是游戏。

是不是因为在那个年代,游戏就是AI最显而易见的应用方向?

哈萨比斯:我想是的。我们那时候做的AI其实是非常尖端的。90年代的时候,关于AI的学术研究被束之高阁,神经网络、深度学习、强化学习,这一大批新技术都还没有真正地普及或规模化。所以,最好的AI都进了游戏。它们不是现在这种学习型的人工智能,更接近于有限状态机(finite-state machine),但也相当复杂,而且会进化。

像《黑与白》这样的游戏都涉及到了强化学习——我觉得它仍然是AI应用于游戏的一个最复杂的案例。到了2004、2005年前后,游戏业很明显开始叛离90年代的氛围——那种活跃和创造力,想到什么就可以去做出来的氛围——变得越来越讲究图形效果、系列作品和FIFA比赛之类,已经没原来那么有趣了。

在游戏界,我能做的都已经做了,是时候开始收集不同的信息,为发布DeepMind做准备了。那就要靠神经科学;我想看看人脑是怎么解决问题的,并从中得到点启发。要达到这个目的,还有什么比读一个神经科学博士更好的办法呢?


如果能运用今天的学习型AI,电子游戏将会上升到一个全新的层次。



可能对你来说太没有挑战性了,但能不能把AI的进展应用到现在的游戏中去呢?


哈萨比斯:嗯,要是这样就太好了。最近EA有人联系到我……[若有所思状]这个事确实应该做,就是要做的事情太多了![笑]这些技术都挺广义的,比较好应用,我也很乐意去做。

只不过要有时间和精力,目前我们专注的是医疗保健和推荐系统这些方面。将来或许可以,这样我的游戏生涯就圆满了。如果你的对手是能够不断进化的,这样的游戏会有很大的市场。而且游戏开发者应该会很高兴,不必每做一款游戏,都建立一个新的AI,或许他们只要训练一个AI来帮他们开发游戏就好了。

我一直想,你在家玩游戏的时候,肯定被那些非玩家角色郁闷得够呛。

哈萨比斯:没错[笑]是的,在大型多人在线游戏里面,那一直让我极度郁闷。我从来没有真正进入过角色,因为那些非玩家角色实在是太蠢了。他们没有任何记忆,不会改变,没有任何来历。“如果能运用今天的学习型AI,电子游戏将会上升到一个全新的层次。

关于未来AI的主要用途,你在提到过医疗保健、智能手机助手和机器人。我们来一一展开一下。谈到医疗保健,IBM的“沃森”已经在癌症诊断等方面做了一些工作——DeepMind能贡献些什么?

哈萨比斯:我们在这方面还刚刚起步。之前我们宣布了和英国国民保健署(NHS)的合作,但这还只是构建一个平台,为机器学习的应用创造条件。照我的理解,沃森和我们所做的工作很不一样,它更像一个专家系统,所以是一种风格迥异的AI。

这类AI一般会从事于医疗影像诊断、生命体征的纵向追踪或一段时间内的生活量化(Quantified Self),帮助人们拥有更加健康的生活方式。这些对强化学习来说,还是挺适合的。

和NHS的合作中,你们推出了一款应用,但跟AI或机器学习的关系好像不是很大。你们是怎么想的?NHS为什么要用它,而不用其他人的软件?

哈萨比斯:据我所知,NHS的软件还挺烂的,所以第一步就是让它实现现代化。这些软件还没有进行移动化改造;当今消费者习以为常的东西,他们都没有。医生护士们应该都非常郁闷,因为这东西在拖他们的后腿。

所以第一个阶段就是给他们提供更多有用的工具,比如可视化和基本统计信息。我们就先构建出来,看具体怎么样,然后,更先进的机器学习技术才能介入进来,并发挥作用。


“我们当然希望这些智能手机助手能够名副其实地智能一些。”



谈谈是智能手机助理。我看你在演讲里用过一张来自《她》(Her)的图片——难道这就是人类的终局? 


哈萨比斯:没有,《她》只代表了一种比较浅显的主流观点。我只是觉得,我们当然希望这些智能手机助手能够名副其实地智能一些,具备语境理解能力,更能理解你想做些什么。

目前的系统大都非常脆弱——一旦你偏离预编程的模板,它们就一无是处。所以关键是要让它们真正具备进化能力、灵活性,更经得住考验。

实现这些改进需要哪方面的突破?为什么不能明天就开始改进?

哈萨比斯:不是不可以,只是你需要一种不同的解决方式。还是涉及到预编程和学习的对立统一。目前,几乎所有的智能手机助手都是预编程的,特殊问题特殊解决,这意味着它们都比较脆弱,只能完成预编程的任务。

而现实世界纷繁复杂,用户会做各种不可预知的事情,你不可能提前知晓。在DeepMind,我们相信,实现智能的唯一方式就是从零开始循序渐进地学习。当然,这也是我们创立之初就秉承的宗旨。

AlphaGo得以大成,有赖于一开始灌输给它的很多棋路。但智能手机上的各种输入要比这复杂多了,这又怎么运用起来呢?

哈萨比斯:是啊,这方面有大量的数据供你学习。其实这是未来几个月我们要尝试的东西,对于AlphaGo的算法,我们可以去掉最初的监督式学习,让它去自我对弈,做到真正意义上从零开始。训练时间会变得更长,因为随机试错要花费很长时间,也许要几个月。但我们认为,从零开始的纯粹学习是可以做到的。

可以做到,是不是因为现在的算法已经达到很高程度?

哈萨比斯:不是,我们之前就能做到了。它不会让程序更加强大,只不过是一个纯粹的学习过程,也就是没有加入监督的成分。这些算法可以在没有任何监督的情况工作。去年做的雅达利(Atari)游戏项目就没有任何人类知识的引导,从像素着手,真的就是从屏幕上的随机操作开始的。

游戏要相对容易一点,是不是因为它们更好区分胜负?

哈萨比斯:是因为得分更有规律性。在围棋里面,不论你最后是输是赢,你都只有一个分数。这叫做信度分配问题;问题在于,一盘棋你走出100多步,到最后,你并不能切确地知道哪一步决定了你的输赢,所以说“信号”很弱。而在大部分的雅达利游戏里,你大多数的动作都会得到一个分数,从而有更多的蛛丝马迹可以追踪。

这些进展什么时候能让手机系统智能水平出现质的飞跃,你能否给出一个时间表?

哈萨比斯:我想未来两三年就会逐渐出现。一开始会比较微妙,某些方面只会逐步地改善。也许四五年、五六年以后,性能上就会出现显著的飞跃。

在你指出的未来可能性当中,这个跟谷歌整体的联系最为明显。

哈萨比斯:是的。

谷歌有没有给你任何指示说,这一切要怎么契合它的产品路线图或者是商业模式?

哈萨比斯:没有,我们可以相当自由地优化研究进展。这是我们的使命,也是我们加入谷歌的初衷——也就是更快地实现这个使命。过去的几年,我们也都如愿以偿。

当然,我们参与了很多谷歌内部产品的相关工作,但它们都处在非常早期的阶段,所以还不能拿出来探讨。当然,我觉得智能手机助手是非常核心的——桑德尔·皮凯(Sundar Pichai,现任谷歌CEO)就多次提到说,它对谷歌的未来至关重要。


谷歌的支持对AlphaGo“非常重要”



 谷歌还有其他的项目,比如Google Brain,还推出了涉及到机器学习的功能,比如Google Photos、搜索,以及一大堆面向用户的东西。


哈萨比斯:对,很多。

你们会不会和Google Brain有交集,有没有相互重叠的部分?

哈萨比斯:当然有,两边其实非常互补。我们每周都要交流。Google Brain主要专注于深度学习,有像杰夫·迪恩(Jeff Dean)这样出色的工程师,让深度学习渗透到公司每一个角落,所以我们才有了像Google Photos搜索这样好用的东西。他们的工作非常出色。

另外,他们在山景城,更靠近产品部门,研究周期常常在12到18个月左右,而我们更多的是做算法开发,一个项目能持续两三年,不一定一开始就有直接的产品。

谷歌对AlphaGo的支持有多重要?没有谷歌你们能不能做?

哈萨比斯:非常重要。AlphaGo在比赛的时候,其实用不到太多的硬件;但我们要训练它,做很多不同的版本,让它们在云端里对撕,这其中要用到很多硬件。要高效地完成这些过程,也需要很多的硬件。所以没有那些资源,我们不可能在这么短的时间内走到今天这一步。

再讲到机器人。日本作为对机器人情有独钟的国家,其企业开发的机器人主要分成两种。一种就是像发那科(Fanuc)公司的那些工业机器人,在某个具体用途上做得非常好。另一种是礼宾机器人,像软银的Pepper等等,都挺有野心的,但用例有限。对于这个领域的现状,你怎么看?

哈萨比斯:正如你所说,发那科的机器人确实四肢发达,但缺少智能。礼宾机器人就有点像是智能手机助手——反正我见过的那些都是这样,预先设定了应答模板,一旦你脱离预定轨道,它们就傻眼了。

那自然就要问到,机器学习之类的技术将如何提升机器人的能力?

哈萨比斯:就是提供一种完全不同的方法。从零开始构建学习新事物和应对突发事件的能力。我想,任何要在现实世界中和真人用户打交道的机器人或软件,都需要这样的能力,这样它们才能真正派上用场。我觉得到头来,学习必定是最佳途径。

你觉得学习型机器人的用例当中,最快实现的会是哪些?

哈萨比斯:其实,这方面我们没有特别关注。自动驾驶汽车也算机器人,但大部分是狭隘的AI,尽管用到了学习型AI的一些方面来实现计算机视觉。特斯拉所采用的,就是标准的现成技术,一种基于深度学习的计算机视觉技术。我想,老年人护理机器人,或者家政机器人,肯定都是日本很感兴趣的,它们对社会非常有用。特别是在老龄化社会——这是一个相当紧迫的问题。


“如果有一天,AI参与了某种新粒子的发现过程,那应该还挺酷的。”