专栏名称: AI科技评论

「AI科技评论」是国内顶尖人工智能媒体和产业服务平台，专注全球 AI 业界、学术和开发三大方向的深度报道。

柯洁说“输得没脾气”？8个问题解读人机大战第一局

AI科技评论 · 公众号 · AI · 2017-05-23 17:42

正文

AI科技评论消息，经过四个多小时的对弈，柯洁以四分之一子之差败给了AlphaGo。

比赛后，曾参与训练AlphaGo的棋手樊麾，与围棋九段常昊一同回顾了整个对弈过程。柯洁也与Deepmind创始人Demis Hassabis，以及AlphaGo的主程序员David Silver一同接受了媒体采访，谈及对比赛的感想。

AlphaGo注重整体局势的发展

樊麾提到，在经过年初Master的60局比赛后，很多棋手也在尝试用点三三这种下法。而柯洁也模仿了这种开局。

常昊在分析中表示，对整个棋局印象最深的，是白棋在开局后不久第24手的大飞，这显示出AlphaGo更更注重中央势力的发展，对厚薄和棋局的发展有更多注重，因为这一步在未来棋局中的效率会更高。

AlphaGo另一个令人印象深刻的也是在开局后不久，在棋局的左上方，采取了一步断。在断之前，黑棋（柯洁）看起来很厚，但之后白棋（AlphaGo）也变得厚了。常昊称，“这是走的一步后手，但却留下了很多余味。”

第24手“大飞”，第54手“断”

“这一步带给了我们新的想法，有些棋不是不能下，下了以后还会有新的思路。它提供了一种思路的创新，我们可以共同去研究，为围棋的下法带来更多发展。”

虽然被围棋围住的4个字看起来已经没救了，但AlphaGo依然会更多利用这4个子，它会想把棋盘上所有子的价值都利用起来。

柯洁：输得没脾气

柯洁在回顾比赛时也对第54手的断，表示了肯定。他称，“很震惊，这在人类的下法中是不能有的”。在断之后，它把自己的脚步实地化，变得更厚，一石二鸟。

柯洁感叹道，“实在下得太出色了，输得没什么脾气。”

Demis Hassabis在赛后表示，这是一场非常精彩的比赛，他非常尊敬柯洁，这一战的表现令人佩服。他认为柯洁表现出了顽强与精彩的实力，在赛前也做了很多战前的准备。

“柯洁同时做了战略和战术的准备，比如点三三（这种策略），这是他从年初Master的60场比赛中的总结。他有自己的战略，有好几手都是非常漂亮的。第24手是全盘皆活的一手。接下来还有很多场比赛，我非常尊敬柯洁，让AlphaGo也必须用全力以赴对付你。”

比赛的结果虽然有了，但外界对AlphaGo和柯洁的好奇心没有满足。在采访中，双方也回答了很多大家关心的问题。

比赛后柯洁为什么笑了？

柯洁称，这是苦笑，不是很开心的笑。

“很早就知道自己会输。AlphaGo的每一步棋都是匀速的，到最后时已经知道会输多少了。”

对于自己的评价，柯洁称，“AlphaGo下得很精彩，但我自己也尽了全力。它下得太好了，有很多地方值得棋手去学习和探索。它对围棋的理念带来了冲击，在改变我们最初对围棋的下法，没什么棋是不能下的。对AlphaGo的想法也有改变，我们可以大胆去创新，开拓自己的思维，可以自由地去下棋。今天也是大胆地开拓了自己的思维。”

柯洁还曾想用AlphaGo的策略来对付它。“我的印象中AlphaGo是会非常贪恋实地的，比如点三三的方法，今天我也是在使用这种策略。但这种意图被AlphaGo打败了，完全进入了它的调子中。它真的下得非常的好。”

柯洁认为，AlphaGo的棋与去年完全是两个人。第一次时它很接近人的，但现在越来越像“上帝”。

AlphaGo有弱点吗？

柯洁认为，弱点暂时没有看见。以前还是有弱点的，但现在AlphaGo对棋的理解与判断已经远胜于我们人类了，赢的话只能找一些bug出来。

但他同时说，“对自己永远要有信心。”

Hassabis称，在李世石后再次参加比赛，就是希望棋手们能找到AlphaGo的弱点，找到它跟自己对弈时不知道的缺陷。

“李世石当时在第4局找到了这个缺口，后来我们改善了体系。当然还会有新的领域，我们和AlphaGo都不知道，所以才会参加比赛。”

David Silver解释称，AlphaGo的做法是将它的获胜的概率最大化，而不是接近式赢得比赛。它会寻找一些确定的路线，实现少风险的获胜机会。这也是一个取舍问题，要决定如何扩大胜利的比例。当然，它还有一些其它目标，比如将胜利的步伐迈得更大，如果重点只是放在获胜上，它可能会降低风险，即使很小的风险也会去关注。

对围棋的影响？

Hassabis认为，围棋是一个非常有意思的主题，它有无限的可能性。通过比赛，可以改进对于围棋的理解，这是我们可以用的工具，让伟大的棋手发现更多围棋的奥妙。

AlphaGo完全不依赖棋手的训练吗？

David Silver解释称，AlphaGo一开始就是跟人类来学习的，它通过自身对弈来学习时，也必须要跟人类专家对弈才行，因为与顶尖的棋手对决才能改善。新版本是更多与自身对弈来学习，实现自我的搜索，对人类数据的依赖更小了。而DeepMind的目标是让它的规则超越围棋，应用到其它领域。

战胜位于围棋顶端的柯洁后，AlphaGo是否就此隐退？

对这一问题，Hassabis没有正面回应，只是表示，本周晚些时候会宣布下一步怎么做。像第一版在学术期刊上发布了技术细节一样，他们以后也会发布更多新版本的细节，会披露更多技术细节，让其它团队与实验室做自己的版本。

技术细节？多少个TPU？单机版？

这次比赛的AlphaGo是新版本，它改善了新的算法，主要进步是计算量少了十倍，自我对弈更强。

Hassabis称，在比赛中程序是在一个单一的机器上运作的，这与去年不一样，当时是分布式的。这次有更强大的算法，运作起来更简单也更好，获得的速度更快。

Hassabis表示，计算力可以“在Google云中获得，用的是TPU，十个处理单位，少了十倍的计算量”。简单点说，这次的AlphaGo是单机版。

柯洁再也不与人工智能比了？

赛前，柯洁发微博表示，这次比赛是最后三场与人工智能的比赛。赛后，他对这一决定再次做了确认。

“考虑了很久，AlphaGo进步太快了，每一步都是巨大的进步，在以后会更加完美，而人与它的差距不是靠自己的努力就能去弥补的。我相信科技的力量，未来是人工智能的。对围棋来说，我还是喜欢和人来下，因为机器与人的差距会越来越大，人赢的概率会越来越小，这样下棋太痛苦了，一盘都赢不了。”

他表示，以后也不会去训练机器了，这是最后的三盘棋。

“希望以后还是下人类的棋，对软件把它当作一个老师，一个学习的对象去看待。”

他表示，对自己的表现也有点不满意，觉得自己可以做得更好，但有时候无论怎么努力都无法做到。所以这最后一次，他希望不留遗憾，下出让自己满意的棋局。

“令AlphaGo的主机发烫也好。”

那如果人类棋手不想和AlphaGo打了怎么办？

Hassabis表示，从他们的角度来说，想要AlphaGo作为围棋的工具，能为人类所用，所以会有架构知识的分享，让大家知道它。也希望它能走进寻常百姓家，在医学与科学找到应用场景。

“12小时零基础入门深度学习”，欢迎来玩！

“AlphaGo的划时代意义在于它不仅仅缩短了机器与人的智能距离，还将颠覆人与人智商差异的感知。” 这是在去年AlphaGo战胜李世石后，有业内人士如是说。

The rich get richer，门外汉也想窥探人工智能背后的神秘。AI慕课学院自上线以来推出了不少人工智能专业课程，有不少像小编这样的AI小白空有一腔热情却只能望而却步。现在，雷锋网携手AI慕课学院推出《12小时零基础入门深度学习》（线下周末班，仅50个名额），邀请了IOT农业机械和MLAQI预测算法项目的深度学习工程师Chris、“深度学习”和“无人驾驶”领域有丰富教学经验的Max博士、曾参与某大型算法金融项目研发的深度学习工程师杨杰等中外讲师，12小时现场授课，采用“探索+实践”的硅谷教学模式，用最流行的深度学习技能 CNN、RNN、VGG16、ResNet、InceptionCNN等动手操作9大项目，fastai中文社区最活跃的四位贡献者为你打开深度学习入门的那扇门，快速构建你的深度学习应用。目前课程回馈价599元，史上最低，欢迎来玩。

讲真，小编在一个月前知道“AI慕课学院” 在密谋这个课程福利的时候就已经悄悄预约了，名额有限，快来面基呀。

详情请点击“阅读原文”查看，或直接访问 http://www.mooc.ai/course/92

AI科技评论招聘季全新启动！

很多读者在思考，“我和AI科技评论的距离在哪里？”答案就是：一封求职信。

AI科技评论自创立以来，围绕学界和业界鳌头，一直为读者提供专业的AI学界、业界、开发者内容报道。我们与学术界一流专家保持密切联系，获得第一手学术进展；我们深入巨头公司AI实验室，洞悉最新产业变化；我们覆盖A类国际学术会议，发现和推动学术界和产业界的不断融合。

而你只要加入我们，就可以一起来记录这个风起云涌的人工智能时代！

如果你有下面任何两项，请投简历给我们：

＊英语好，看论文毫无压力

＊理工科或新闻相关专业优先，好钻研

＊对人工智能有一定的兴趣或了解

* 态度好，学习能力强

简历投递：

[email protected]