关键时刻出现失误，柯洁又输一局！不过AlphaGo中途曾突然“评估”柯洁表现完美

腾讯科技 · 公众号 · 科技媒体 · 2017-05-25 20:48

正文

点击上方“腾讯科技”，选择“置顶公众号”

关键时刻，第一时间送达！

微信公众号 / DeepTech深科技

不出意料，人机大战的总比分变成了2：0，今天这场比赛比上一局明显结束的更快，柯洁盘中认输，AlphaGo大比分获胜。虽然在比赛的前半段中情节发展的跌宕起伏，柯洁一度占据优势地位，不过最终的结局还是难逃落败的宿命。

而在棋局之外，AlphaGo之父Demis Hassabis也似乎早已看透这一切，他在比赛进行到1个小时的时候更新了一条推特，“难以置信，根据AlphaGo的判断，柯洁的表现堪称完美。”寥寥几字，个中细节耐人寻味。

整体来说，今天的棋局比前天的第一局要激烈精彩很多。第一盘棋在很早的时候就进入了AlphaGo的步调，并且AlphaGo一直控制着局势直到比赛结束。而今天柯洁下得非常积极，棋局也进入了非常复杂多变的局面，比赛出现了复杂的劫争，也出现了多条大龙互相搏杀的局面。

在进入中盘后期观战的职业棋手对局势的判断仍然很不相同。用现场解说的话来说“柯洁下了一盘很大的棋”。在此前公开的60多局棋局中，AlphaGo很少走出多片棋激烈对杀的刺激局面，因此本场比赛其实让大家可以直接观察AlphaGo在应对混乱局面的分析能力。一般来说，计算机（尤其是非人工智能的围棋程序）应对混乱的大龙对杀的能力较弱。

不过，AlphaGo显然经受住了考验，在劫争中，准确地判断出柯洁的一个劫材较小，果断消劫，一举奠定胜势。

不过虽然如此，柯洁本场比赛的表现仍然让人钦佩。

实际上，一直以来，就有一种说法认为DeepMind 团队掩藏了AlphaGo的真正实力，他们这么做只是为了不让人类选手在比赛中输得太过难看。如果按照Master完胜60位围棋高手的表现来看，AlphaGo应该早已进化到远超人类的水平。

对此，DeepMind 的CEO Demis Hassabis 表示，AlphaGo的最终目标就是获胜机率的最大化，而如果要做到这一点，就势必要寻找最佳的路径来降低取胜的风险，如此一来，AlphaGo的打法也就会有保守的表现。

图丨David Silver

DeepMind 研究科学家兼AlphaGo程序员 David Silver 补充道，AlphaGo会将获胜机率尽量扩大，以求在比赛中取胜，而进一步扩大胜出的子数是AlphaGo未来需加强的地方。但目前而言，AlphaGo被设定为可以为了取胜而放弃更多赢子数，只为了降低不能取胜的风险，即使是很小的差距仍会纳入考虑。从赢子数来理解就是“赢 3 子获得90% 胜率”而“赢 1/4 子则可以获得95% 胜率”，毫无疑问，AlphaGo倾向选择了后者。

Demis Hassabis 在昨天的演讲中也提到围棋不像象棋等游戏靠计算，更是依靠直觉，AlphaGo明显已经具备一定创造力，能在预测落子位置时拥有类似人类棋手的直觉。不过，他认为AlphaGo在经过不断强化学习训练后，虽然可在围棋这个领域实现类似的直觉，但始终与人类的自主意识有差别，强人工智能也还需要数十年的发展才能实现。

令人意外的是，Hassabis在比赛过程中发了一条令人匪夷所思的推文，他表示：“难以置信，根据AlphaGo的评估，柯洁目前在比赛中发挥完美！”但Hassabis并未透露AlphaGo是如何评估人类棋手表现的。

回顾比赛全程，范廷钰九段在赛前表示，在大贴目的情况下，白棋下模仿棋是一种可行的策略，尤其是对人工智能。在前几个月的时候，棋手在跟中国的绝艺软件采用模仿棋的时候，获得了不错的效果。但是不知道AlphaGo是否能克服这一弱点。

此外，虽然DeepMind表示AlphaGo可以让之前的版本三子。但范廷钰认为这只是AlphaGo知道之前版本的弱点，而不是可以让人类棋手三子。

AlphaGo执黑开局时候下出了小目三三的布局，和前天柯洁的开局一模一样。在已经公布的60多局棋局中，这是AlphaGo首次在三三布局。这种方式非常复古，仿佛回到了日本的坂田荣男时代。

柯洁在第四步的时候就开始长考。一般来说，人类棋手在如此早期的布局阶段不太会花这么多时间。但是AlphaGo的对弈决策却表明，早期决定大势的布局也有可能出现巨大的优劣差距。这可能也体现了人工智能对人类的帮助。

一种常见的说法认为，AlphaGo经常采取三三等取实地的策略的原因是，它希望迅速引发局部战斗并定型，简化比赛，减少搜索树的宽度。不过Michael Redmond九段认为，在李世石和AlphaGo对局时他也这么认为，但是在Master的对局中，AlphaGo却不怕把局面变得复杂化，而且在复杂的局面中表现的也比人类强。

柯洁在早期的时候就在右上角挑起了激烈的战斗。碎片状的黑棋和白棋互相缠斗，白棋上方的三子和黑右上四子都有可能被杀。AlphaGo曾不止一次通过弃子引诱柯洁，但是柯洁没有上钩。柯洁最后在下面直接脱先，在下方拆边，黑棋也应了一手。虽然黑棋再补一手杀死白三子，但仍然可以接受。Michael Redmond九段认为，在四路拆可以和潜在的左下角的三路攻角搭配。

和右上角的紧凑战斗相比，双方在下方和左方则在迅速地寻求势力扩张。其中，黑35不理会白棋对下方的攻击脱先，范廷钰九段认为，这几步棋体现了AlphaGo一贯注重棋子之间互相配合的特点。另外，白36有些过分，可能体现出柯洁放手一搏的心态。

刘菁八段表示，AlphaGo的走棋时间相对均衡：在很难抉择的情况下走得很快，在很明显的地方反而需要一些时间。这样会无形给人类对手施加压力。人类在苦苦思索下完一步后对手很快做出应对时，会本能地觉得形势被对方掌控。

黑53挤是出乎所有人意料的强手，将局面导向复杂化。白56飞是腾挪的好手。这样，黑棋右下角巨大的实空被白棋钻了进去，但同时，白棋左边三子，右下三子和下面的一块棋全部没有活棋并且难以连接，整体棋形变薄。这时，下方的战斗将决定四五块棋的死活。周睿羊九段表示，如果是他自己执黑，可能不会选择这么刺激的转换和变化。现在局面非常考验柯洁整体的控制能力。

白100开劫，双方开始让人心跳加速的劫争。

黑棋121试图截断白棋到白130，双方继续你死我活的激烈战斗。局面非常复杂。现场解说的张璇和古力认为柯洁占优，而范廷钰九段认为黑棋占优，但是柯洁正在试图把水搅浑。

范廷钰表示，黑棋的有利之处在，黑棋可以容忍劫争失败的结果，因为仍然可以吃白棋上方五子吃住，并将白棋右下大块吃净。而白棋在劫争中没有退路，因此黑棋选择较多，比较有利。

白棋136的劫材比较小，AlphaGo直接在黑137消劫，白棋进入了比较困难的局面。

最终比赛以柯洁投子认输告终！

关键时刻出现失误，柯洁又输一局！ 不过AlphaGo中途曾突然“评估”柯洁表现完美

正文

关键时刻出现失误，柯洁又输一局！不过AlphaGo中途曾突然“评估”柯洁表现完美