专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
新浪科技  ·  【#救命神器3年救回7条人命# ... ·  3 天前  
新浪科技  ·  【#2女子吃自助打包近400元海鲜肉类#】# ... ·  3 天前  
51好读  ›  专栏  ›  DeepTech深科技

关键时刻出现失误,柯洁又输一局! AlphaGo 中途曾突然“评估”柯洁表现完美!

DeepTech深科技  · 公众号  · 科技媒体  · 2017-05-25 14:02

正文

不出意料,人机大战的总比分变成了2:0,今天这场比赛比上一局明显结束的更快,柯洁盘中认输,AlphaGo大比分获胜。虽然在比赛的前半段中情节发展的跌宕起伏,柯洁一度占据优势地位,不过最终的结局还是难逃落败的宿命。


而在棋局之外,AlphaGo之父Demis Hassabis也似乎早已看透这一切,他在比赛进行到1个小时的时候更新了一条推特,“难以置信,根据AlphaGo的判断,柯洁的表现堪称完美。”寥寥几字,个中细节耐人寻味。


整体来说,今天的棋局比前天的第一局要激烈精彩很多。第一盘棋在很早的时候就进入了AlphaGo的步调,并且AlphaGo一直控制着局势直到比赛结束。而今天柯洁下得非常积极,棋局也进入了非常复杂多变的局面,比赛出现了复杂的劫争,也出现了多条大龙互相搏杀的局面。



在进入中盘后期观战的职业棋手对局势的判断仍然很不相同。用现场解说的话来说“柯洁下了一盘很大的棋”。在此前公开的60多局棋局中,AlphaGo很少走出多片棋激烈对杀的刺激局面,因此本场比赛其实让大家可以直接观察AlphaGo在应对混乱局面的分析能力。一般来说,计算机(尤其是非人工智能的围棋程序)应对混乱的大龙对杀的能力较弱。


不过,AlphaGo显然经受住了考验,在劫争中,准确地判断出柯洁的一个劫材较小,果断消劫,一举奠定胜势。


不过虽然如此,柯洁本场比赛的表现仍然让人钦佩。


实际上,一直以来,就有一种说法认为DeepMind 团队掩藏了AlphaGo的真正实力,他们这么做只是为了不让人类选手在比赛中输得太过难看。如果按照Master完胜60位围棋高手的表现来看,AlphaGo应该早已进化到远超人类的水平。


对此,DeepMind 的CEO Demis Hassabis 表示,AlphaGo的最终目标就是获胜机率的最大化,而如果要做到这一点,就势必要寻找最佳的路径来降低取胜的风险,如此一来,AlphaGo的打法也就会有保守的表现。

  

图丨David Silver


DeepMind 研究科学家兼AlphaGo程序员 David Silver 补充道,AlphaGo会将获胜机率尽量扩大,以求在比赛中取胜,而进一步扩大胜出的子数是AlphaGo未来需加强的地方。但目前而言,AlphaGo被设定为可以为了取胜而放弃更多赢子数,只为了降低不能取胜的风险,即使是很小的差距仍会纳入考虑。从赢子数来理解就是“赢 3 子获得90% 胜率”而“赢 1/4 子则可以获得95% 胜率”,毫无疑问,AlphaGo倾向选择了后者。


Demis Hassabis 在昨天的演讲中也提到围棋不像象棋等游戏靠计算,更是依靠直觉,AlphaGo明显已经具备一定创造力,能在预测落子位置时拥有类似人类棋手的直觉。不过,他认为AlphaGo在经过不断强化学习训练后,虽然可在围棋这个领域实现类似的直觉,但始终与人类的自主意识有差别,强人工智能也还需要数十年的发展才能实现。


令人意外的是,Hassabis在比赛过程中发了一条令人匪夷所思的推文,他表示:“难以置信,根据AlphaGo的评估,柯洁目前在比赛中发挥完美!”但Hassabis并未透露AlphaGo是如何评估人类棋手表现的。



回顾比赛全程,范廷钰九段在赛前表示,在大贴目的情况下,白棋下模仿棋是一种可行的策略,尤其是对人工智能。在前几个月的时候,棋手在跟中国的绝艺软件采用模仿棋的时候,获得了不错的效果。但是不知道AlphaGo是否能克服这一弱点。


此外,虽然DeepMind表示AlphaGo可以让之前的版本三子。但范廷钰认为这只是AlphaGo知道之前版本的弱点,而不是可以让人类棋手三子。


AlphaGo执黑开局时候下出了小目三三的布局,和前天柯洁的开局一模一样。在已经公布的60多局棋局中,这是AlphaGo首次在三三布局。这种方式非常复古,仿佛回到了日本的坂田荣男时代。



柯洁在第四步的时候就开始长考。一般来说,人类棋手在如此早期的布局阶段不太会花这么多时间。但是AlphaGo的对弈决策却表明,早期决定大势的布局也有可能出现巨大的优劣差距。这可能也体现了人工智能对人类的帮助。


一种常见的说法认为,AlphaGo经常采取三三等取实地的策略的原因是,它希望迅速引发局部战斗并定型,简化比赛,减少搜索树的宽度。不过Michael Redmond九段认为,在李世石和AlphaGo对局时他也这么认为,但是在Master的对局中,AlphaGo却不怕把局面变得复杂化,而且在复杂的局面中表现的也比人类强。


柯洁在早期的时候就在右上角挑起了激烈的战斗。碎片状的黑棋和白棋互相缠斗,白棋上方的三子和黑右上四子都有可能被杀。AlphaGo曾不止一次通过弃子引诱柯洁,但是柯洁没有上钩。柯洁最后在下面直接脱先,在下方拆边,黑棋也应了一手。虽然黑棋再补一手杀死白三子,但仍然可以接受。Michael Redmond九段认为,在四路拆可以和潜在的左下角的三路攻角搭配。


和右上角的紧凑战斗相比,双方在下方和左方则在迅速地寻求势力扩张。其中,黑35不理会白棋对下方的攻击脱先,范廷钰九段认为,这几步棋体现了AlphaGo一贯注重棋子之间互相配合的特点。另外,白36有些过分,可能体现出柯洁放手一搏的心态。



刘菁八段表示,AlphaGo的走棋时间相对均衡:在很难抉择的情况下走得很快,在很明显的地方反而需要一些时间。这样会无形给人类对手施加压力。人类在苦苦思索下完一步后对手很快做出应对时,会本能地觉得形势被对方掌控。


黑53挤是出乎所有人意料的强手,将局面导向复杂化。白56飞是腾挪的好手。这样,黑棋右下角巨大的实空被白棋钻了进去,但同时,白棋左边三子,右下三子和下面的一块棋全部没有活棋并且难以连接,整体棋形变薄。这时,下方的战斗将决定四五块棋的死活。周睿羊九段表示,如果是他自己执黑,可能不会选择这么刺激的转换和变化。现在局面非常考验柯洁整体的控制能力。



白100开劫,双方开始让人心跳加速的劫争。



黑棋121试图截断白棋到白130,双方继续你死我活的激烈战斗。局面非常复杂。现场解说的张璇和古力认为柯洁占优,而范廷钰九段认为黑棋占优,但是柯洁正在试图把水搅浑。



范廷钰表示,黑棋的有利之处在,黑棋可以容忍劫争失败的结果,因为仍然可以吃白棋上方五子吃住,并将白棋右下大块吃净。而白棋在劫争中没有退路,因此黑棋选择较多,比较有利。


白棋136的劫材比较小,AlphaGo直接在黑137消劫,白棋进入了比较困难的局面。



最终比赛以柯洁投子认输告终!



-End-


点击图片查看报名方式