专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

关键时刻出现失误，柯洁又输一局！ AlphaGo 中途曾突然“评估”柯洁表现完美！

DeepTech深科技 · 公众号 · 科技媒体 · 2017-05-25 14:02

正文

不出意料，人机大战的总比分变成了2：0，今天这场比赛比上一局明显结束的更快，柯洁盘中认输，AlphaGo大比分获胜。虽然在比赛的前半段中情节发展的跌宕起伏，柯洁一度占据优势地位，不过最终的结局还是难逃落败的宿命。

而在棋局之外，AlphaGo之父Demis Hassabis也似乎早已看透这一切，他在比赛进行到1个小时的时候更新了一条推特，“难以置信，根据AlphaGo的判断，柯洁的表现堪称完美。”寥寥几字，个中细节耐人寻味。

整体来说，今天的棋局比前天的第一局要激烈精彩很多。第一盘棋在很早的时候就进入了AlphaGo的步调，并且AlphaGo一直控制着局势直到比赛结束。而今天柯洁下得非常积极，棋局也进入了非常复杂多变的局面，比赛出现了复杂的劫争，也出现了多条大龙互相搏杀的局面。

在进入中盘后期观战的职业棋手对局势的判断仍然很不相同。用现场解说的话来说“柯洁下了一盘很大的棋”。在此前公开的60多局棋局中，AlphaGo很少走出多片棋激烈对杀的刺激局面，因此本场比赛其实让大家可以直接观察AlphaGo在应对混乱局面的分析能力。一般来说，计算机（尤其是非人工智能的围棋程序）应对混乱的大龙对杀的能力较弱。

不过，AlphaGo显然经受住了考验，在劫争中，准确地判断出柯洁的一个劫材较小，果断消劫，一举奠定胜势。

不过虽然如此，柯洁本场比赛的表现仍然让人钦佩。

实际上，一直以来，就有一种说法认为DeepMind 团队掩藏了AlphaGo的真正实力，他们这么做只是为了不让人类选手在比赛中输得太过难看。如果按照Master完胜60位围棋高手的表现来看，AlphaGo应该早已进化到远超人类的水平。

对此，DeepMind 的CEO Demis Hassabis 表示，AlphaGo的最终目标就是获胜机率的最大化，而如果要做到这一点，就势必要寻找最佳的路径来降低取胜的风险，如此一来，AlphaGo的打法也就会有保守的表现。

图丨David Silver

DeepMind 研究科学家兼AlphaGo程序员 David Silver 补充道，AlphaGo会将获胜机率尽量扩大，以求在比赛中取胜，而进一步扩大胜出的子数是AlphaGo未来需加强的地方。但目前而言，AlphaGo被设定为可以为了取胜而放弃更多赢子数，只为了降低不能取胜的风险，即使是很小的差距仍会纳入考虑。从赢子数来理解就是“赢 3 子获得90% 胜率”而“赢 1/4 子则可以获得95% 胜率”，毫无疑问，AlphaGo倾向选择了后者。

Demis Hassabis 在昨天的演讲中也提到围棋不像象棋等游戏靠计算，更是依靠直觉，AlphaGo明显已经具备一定创造力，能在预测落子位置时拥有类似人类棋手的直觉。不过，他认为AlphaGo在经过不断强化学习训练后，虽然可在围棋这个领域实现类似的直觉，但始终与人类的自主意识有差别，强人工智能也还需要数十年的发展才能实现。

令人意外的是， Hassabis 在比赛过程中发了一条令人匪夷所思的推文，他表示：“难以置信，根据AlphaGo的评估，柯洁目前在比赛中发挥完美！”但 Hassabis 并未透露AlphaGo是如何评估人类棋手表现的。

回顾比赛全程，范廷钰九段在赛前表示，在大贴目的情况下，白棋下模仿棋是一种可行的策略，尤其是对人工智能。在前几个月的时候，棋手在跟中国的绝艺软件采用模仿棋的时候，获得了不错的效果。但是不知道AlphaGo是否能克服这一弱点。

此外，虽然DeepMind表示AlphaGo可以让之前的版本三子。但范廷钰认为这只是AlphaGo知道之前版本的弱点，而不是可以让人类棋手三子。

AlphaGo执黑开局时候下出了小目三三的布局，和前天柯洁的开局一模一样。在已经公布的60多局棋局中，这是AlphaGo首次在三三布局。这种方式非常复古，仿佛回到了日本的坂田荣男时代。

柯洁在第四步的时候就开始长考。一般来说，人类棋手在如此早期的布局阶段不太会花这么多时间。但是AlphaGo的对弈决策却表明，早期决定大势的布局也有可能出现巨大的优劣差距。这可能也体现了人工智能对人类的帮助。

关键时刻出现失误，柯洁又输一局！ AlphaGo 中途曾突然“评估”柯洁表现完美！

正文

请到「今天看啥」查看全文