对于不是很了解AI或围棋的人,你怎么描述人工智能这场胜利引起的文化震动?
哈萨比斯
:我要说的有几点。围棋一
直是完全信息博弈的最高峰。就其可能性而言,它比国际象棋复杂得多,所以,它一直是人工智能研究中的一个圣杯,或者说是巨大挑战,尤其是在“深蓝”(Deep Blue)攻克国际象棋以后。你也知道,虽然在围棋AI方面的投入很多,但进展一直并不明显。
蒙特卡洛树搜索是十年前一个不小的创新,但我想AlphaGo所做的,无非就是在神经网络中引入了“直觉”——如果可以管它叫直觉的话。而顶尖围棋手区别于一般棋手的地方,就是这种直觉。
让我没想到的是,就连迈克·雷蒙(Michael Redmond)在现场解说的时候都有点不太利索,他还是个专业九段棋手!从这里可以看出来,为围棋写价值函数有多么难。
哈萨比斯
:有。在双方第一局对战时,AlphaGo在李世乭的左侧地盘大胆突进,我们都大吃一惊,我想李世乭也没有料到,从他的面部表情可以看出来。那应该是相当出人意料的一着。
哈萨比斯
:对,攻击性,还有胆量。而且,这本来是李世乭所擅长的。他以喜好剑走偏锋而闻名,这次比赛也不例外,我们之前就有这方面的预期。李世乭开局四处挑起战况,在那个时候,胜负还很难预料。围棋程序历来不善于应对这种局面。它们的局部计算能力不错,但全局判断就比较薄弱了。
举办这些比赛,输也好,赢也好,都是为了评估AlphaGo的能力。从这次的比赛中,你有哪些认识?
哈萨比斯
:我们了解到,这个结果虽不能说超出了自己的期待,但至少跟希望的差不多吧。之前我们本来是跟人说,胜负该是两两之数。
接着你的第一个问题,谈到AI的重要性,我提到过的另一点就是它和深蓝的区别。深蓝是一个手动打造的程序,程序员将来自象棋大师的信息精炼成具体规则和启发式算法,而我们的做法是给AlphaGo灌输学习能力,让它在实践中去学习,这样做更类似于人类。
哈萨比斯
:“最终,我们想把AI应用到现实世界的问题中去。”
我想就完全信息博弈而言,围棋就是最高峰。当然还有其他的顶尖棋手可以对弈。还有其他的游戏——比如无限额扑克就很难,多人游戏有它的难度,因为它是一种不完全信息博弈。还有很多游戏是人类明显玩得比计算机好的,比如在韩国比较热门的《星际争霸》。
策略性游戏需要你在信息不完全——也叫做“部分可观测”——的情况下,施展高水平的策略能力。围棋的特点就是,棋盘上有什么一清二楚,所以对计算机来说会略微容易一些。
从你个人角度来说,有没有兴趣搞一场《星际争霸》人机大战?
哈萨比斯
:也许吧。我们对一个东西感兴趣,前提是它跟我们的研究项目在同一条道上。所以打赢游戏虽然趣味十足,但不是DeepMind的目的所在。我个人非常热爱游戏,以前也开发过游戏。
但前提是它们能充当有用的测试平台,可以在上面编写算法思路,测试其可扩展性和实际性能,这样做很有效率。最终,我们想把AI应用到现实世界的问题中去。
90年代的时候,计算机杂志上常出现你的名字,跟各种野心勃勃的游戏联系在一起。后来渐渐看到你的名字和DeepMind一起出现,我心想,“还挺配你的。”你能不能画一条线,把之前在游戏业的职业生涯跟现在的工作联系起来?
哈萨比斯
:可以,我的终极目标一直是像DeepMind这样一个东西。从某种意义上说,这个计划我酝酿了二十多年了。如果你站在最终建立AI企业的角度,再看我之前的经历,你会发现我的选择都不是那么随机的。如果你熟悉我在Bullfrog这些地方所做的事情,你就会知道,AI是我一切工作的核心组成部分。
彼得·莫利纽(Peter Molyneux,Lionhead创始人)的游戏恰好也都是AI游戏。开发《主题公园》对当时十六七岁的我来说,是一件在内心深处种下种子的事情,我意识到如果我们真的尝试去拓展AI,它可以变得何等强大。那款游戏卖出几百万份,很多人都喜欢玩,因为有AI,游戏会根据你的玩法不断进化。我们把它当作正事来做,我也想把它延伸开来,作为日后游戏生涯的努力方向。
后来我从游戏业抽身,回到学术界,去搞神经科学,是因为到了2005年前后,我感觉到很难再进一步——我们打着开发游戏的旗号,实则是在偷偷做AI研究,结果搞得很艰难,毕竟发行商要的只是游戏。
是不是因为在那个年代,游戏就是AI最显而易见的应用方向?
哈萨比斯
:我想是的。我们那时候做的AI其实是非常尖端的。90年代的时候,关于AI的学术研究被束之高阁,神经网络、深度学习、强化学习,这一大批新技术都还没有真正地普及或规模化。所以,最好的AI都进了游戏。它们不是现在这种学习型的人工智能,更接近于有限状态机(finite-state machine),但也相当复杂,而且会进化。
像《黑与白》这样的游戏都涉及到了强化学习——我觉得它仍然是AI应用于游戏的一个最复杂的案例。到了2004、2005年前后,游戏业很明显开始叛离90年代的氛围——那种活跃和创造力,想到什么就可以去做出来的氛围——变得越来越讲究图形效果、系列作品和FIFA比赛之类,已经没原来那么有趣了。
在游戏界,我能做的都已经做了,是时候开始收集不同的信息,为发布DeepMind做准备了。那就要靠神经科学;我想看看人脑是怎么解决问题的,并从中得到点启发。要达到这个目的,还有什么比读一个神经科学博士更好的办法呢?
如果能运用今天的学习型AI,电子游戏将会上升到一个全新的层次。
可能对你来说太没有挑战性了,但能不能把AI的进展应用到现在的游戏中去呢?
哈萨比斯
:嗯,要是这样就太好了。最近EA有人联系到我……[若有所思状]这个事确实应该做,就是要做的事情太多了![笑]这些技术都挺广义的,比较好应用,我也很乐意去做。
只不过要有时间和精力,目前我们专注的是医疗保健和推荐系统这些方面。将来或许可以,这样我的游戏生涯就圆满了。如果你的对手是能够不断进化的,这样的游戏会有很大的市场。而且游戏开发者应该会很高兴,不必每做一款游戏,都建立一个新的AI,或许他们只要训练一个AI来帮他们开发游戏就好了。
我一直想,你在家玩游戏的时候,肯定被那些非玩家角色郁闷得够呛。
哈萨比斯
:没错[笑]是的,在大型多人在线游戏里面,那一直让我极度郁闷。我从来没有真正进入过角色,因为那些非玩家角色实在是太蠢了。他们没有任何记忆,不会改变,没有任何来历。“如果能运用今天的学习型AI,电子游戏将会上升到一个全新的层次。
关于未来AI的主要用途,你在提到过医疗保健、智能手机助手和机器人。我们来一一展开一下。谈到医疗保健,IBM的“沃森”已经在癌症诊断等方面做了一些工作——DeepMind能贡献些什么?
哈萨比斯
:我们在这方面还刚刚起步。之前我们宣布了和英国国民保健署(NHS)的合作,但这还只是构建一个平台,为机器学习的应用创造条件。照我的理解,沃森和我们所做的工作很不一样,它更像一个专家系统,所以是一种风格迥异的AI。
这类AI一般会从事于医疗影像诊断、生命体征的纵向追踪或一段时间内的生活量化(Quantified Self),帮助人们拥有更加健康的生活方式。这些对强化学习来说,还是挺适合的。
和NHS的合作中,你们推出了一款应用,但跟AI或机器学习的关系好像不是很大。你们是怎么想的?NHS为什么要用它,而不用其他人的软件?
哈萨比斯
:据我所知,NHS的软件还挺烂的,所以第一步就是让它实现现代化。这些软件还没有进行移动化改造;当今消费者习以为常的东西,他们都没有。医生护士们应该都非常郁闷,因为这东西在拖他们的后腿。
所以第一个阶段就是给他们提供更多有用的工具,比如可视化和基本统计信息。我们就先构建出来,看具体怎么样,然后,更先进的机器学习技术才能介入进来,并发挥作用。
“我们当然希望这些智能手机助手能够名副其实地智能一些。”
谈谈是智能手机助理。我看你在演讲里用过一张来自《她》(Her)的图片——难道这就是人类的终局?
哈萨比斯
:没有,《她》只代表了一种比较浅显的主流观点。我只是觉得,我们当然希望这些智能手机助手能够名副其实地智能一些,具备语境理解能力,更能理解你想做些什么。
目前的系统大都非常脆弱——一旦你偏离预编程的模板,它们就一无是处。所以关键是要让它们真正具备进化能力、灵活性,更经得住考验。