不出意料,人机大战的总比分变成了2:0,今天这场比赛比上一局明显结束的更快,柯洁盘中认输,AlphaGo大比分获胜。虽然在比赛的前半段中情节发展的跌宕起伏,柯洁一度占据优势地位,不过最终的结局还是难逃落败的宿命。
而在棋局之外,AlphaGo之父Demis Hassabis也似乎早已看透这一切,他在比赛进行到1个小时的时候更新了一条推特,“难以置信,根据AlphaGo的判断,柯洁的表现堪称完美。”寥寥几字,个中细节耐人寻味。
整体来说,今天的棋局比前天的第一局要激烈精彩很多。第一盘棋在很早的时候就进入了AlphaGo的步调,并且AlphaGo一直控制着局势直到比赛结束。而今天柯洁下得非常积极,棋局也进入了非常复杂多变的局面,比赛出现了复杂的劫争,也出现了多条大龙互相搏杀的局面。
在进入中盘后期观战的职业棋手对局势的判断仍然很不相同。用现场解说的话来说“柯洁下了一盘很大的棋”。在此前公开的60多局棋局中,AlphaGo很少走出多片棋激烈对杀的刺激局面,因此本场比赛其实让大家可以直接观察AlphaGo在应对混乱局面的分析能力。一般来说,计算机(尤其是非人工智能的围棋程序)应对混乱的大龙对杀的能力较弱。
不过,AlphaGo显然经受住了考验,在劫争中,准确地判断出柯洁的一个劫材较小,果断消劫,一举奠定胜势。
不过虽然如此,柯洁本场比赛的表现仍然让人钦佩。
实际上,一直以来,就有一种说法认为DeepMind 团队掩藏了AlphaGo的真正实力,他们这么做只是为了不让人类选手在比赛中输得太过难看。如果按照Master完胜60位围棋高手的表现来看,AlphaGo应该早已进化到远超人类的水平。
对此,DeepMind 的CEO Demis Hassabis 表示,AlphaGo的最终目标就是获胜机率的最大化,而如果要做到这一点,就势必要寻找最佳的路径来降低取胜的风险,如此一来,AlphaGo的打法也就会有保守的表现。
图丨David Silver
DeepMind 研究科学家兼AlphaGo程序员 David Silver 补充道,AlphaGo会将获胜机率尽量扩大,以求在比赛中取胜,而进一步扩大胜出的子数是AlphaGo未来需加强的地方。但目前而言,AlphaGo被设定为可以为了取胜而放弃更多赢子数,只为了降低不能取胜的风险,即使是很小的差距仍会纳入考虑。从赢子数来理解就是“赢 3 子获得90% 胜率”而“赢 1/4 子则可以获得95% 胜率”,毫无疑问,AlphaGo倾向选择了后者。
Demis Hassabis 在昨天的演讲中也提到围棋不像象棋等游戏靠计算,更是依靠直觉,AlphaGo明显已经具备一定创造力,能在预测落子位置时拥有类似人类棋手的直觉。不过,他认为AlphaGo在经过不断强化学习训练后,虽然可在围棋这个领域实现类似的直觉,但始终与人类的自主意识有差别,强人工智能也还需要数十年的发展才能实现。
令人意外的是,
Hassabis
在比赛过程中发了一条令人匪夷所思的推文,他表示:“难以置信,根据AlphaGo的评估,柯洁目前在比赛中发挥完美!”但
Hassabis
并未透露AlphaGo是如何评估人类棋手表现的。
回顾比赛全程,范廷钰九段在赛前表示,在大贴目的情况下,白棋下模仿棋是一种可行的策略,尤其是对人工智能。在前几个月的时候,棋手在跟中国的绝艺软件采用模仿棋的时候,获得了不错的效果。但是不知道AlphaGo是否能克服这一弱点。
此外,虽然DeepMind表示AlphaGo可以让之前的版本三子。但范廷钰认为这只是AlphaGo知道之前版本的弱点,而不是可以让人类棋手三子。
AlphaGo执黑开局时候下出了小目三三的布局,和前天柯洁的开局一模一样。在已经公布的60多局棋局中,这是AlphaGo首次在三三布局。这种方式非常复古,仿佛回到了日本的坂田荣男时代。
柯洁在第四步的时候就开始长考。一般来说,人类棋手在如此早期的布局阶段不太会花这么多时间。但是AlphaGo的对弈决策却表明,早期决定大势的布局也有可能出现巨大的优劣差距。这可能也体现了人工智能对人类的帮助。