AI科技评论按:本文作者刘利,自学围棋多年,弈城8D水平,曾获重庆大学围棋赛冠军,重庆市高校联赛冠军,重庆市首届周日围棋赛冠军。AI科技评论经授权独家首发,未经许可不得转载。
苦等两个月的的人机大战终于如期举行了。基于赛前的预测, 多数观点认为, 柯洁在三盘棋中能赢至少一盘的概率仅为 10%,甚至更加悲观,很多人更是开玩笑说,只要柯洁能赢一盘,就要吃棋盘电脑翔啥的,或者让自己身上的零件少点啥的,更是认定了柯洁能赢一盘的概率无限趋近于零。但第一盘的结果下来,柯洁只输了 1/4 子,是不是又让人看到胜利的希望了呢?
首先值得一提的是这次比赛的奖金,如果柯洁获胜,将会获得 150 万美元,而无论胜负,柯洁会获得 30 万美元的出场费,这个数字对围棋界来讲确实是一个天文数字,多年以来,世界各大赛中奖金最高的四年一届的应氏杯,冠军奖金才不过 40 万美元。一方面反映出对世界等级分排名第一的柯洁的尊重,另一方面也反映出柯洁获胜的概率极小。
DeepMind 团队不打无把握之仗,早在去年 3 月,人机大战的第一季,DeepMind 团队选中了十年来获得世界冠军头衔最多,人气极高的韩国选手李世石作为挑战对象。据赛后的爆料,其实 AlphaGo 的自评实力已经远高于李世石的等级分。李世石五盘中的唯一一胜其实是击中了 AlphaGo 程序计算中的软肋——在有限的算力下,为了保证计算的深度,需要对一些不太可能的变化进行剪枝。李世石的神之一手,虽然事后看并不成立,却正是围棋中的盲点,在 AlphaGo 的眼中,这一手出现的概率仅有万分之四,因而并没有太多考虑。突然出现的这一手,使得所有变化都得重新计算,因而犯下大错。DeepMind 团队事后也积极的想策略解决这一问题,但看得出,他们赛前其实对拿下李世石是很有信心的。然而,4:1 的比分毕竟使得人工智能已经完全征服围棋这一长期难题的结论不那么使人信服,所以有了今年的柯阿之战。
一是因为,柯洁是当前的世界第一人,早在人机大战第一季结束的时候就发出了「就算 AlphaGo 战胜了李世石,但它赢不了我」的豪言壮语。
二是 DeepMind 公司在修复了 AlphaGo 的程序 BUG 之后,总想有再次找高手试手的兴奋。
三是看看一年多以后,科技到底能让 AlphaGo 进步到了何种程度。
其实早在今年年初,去年年底, AlphaGo 就悄悄地出来试水了,化身「Master」 的阿法狗在弈城围棋和野狐围棋上各下了 30 盘棋,取得了 60:0 的战绩。从中我们可以看出 AlphaGo 的一些「性格」:大多数棋局在 100 手以前就已取得了压倒性的优势,优势后的 AlphaGo 显得保守和谦让,后半盘尤其是小官子经常犯错,这是职业棋手很难犯错的领域。不过最终的结果,反正是 AlphaGo 不管大胜小胜,最终全部都赢下来了,最少的赢了 0.5 目。真不知道是幸运还是早有成算。因为毕竟只胜 0.5 目的盘数并不多,并不能做为结论。而且根据 AlphaGo 论文所开发出的各个 AI,目前都有收官弱项的共同毛病。
再来回顾一下今天的这盘棋,早上 10 点半,比赛正式开始,柯洁猜到黑棋,不知道对压力山大的柯洁的心理有没有影响。目前的棋界普遍是愿意下白棋的,尤其是中国规则下。中国规则黑棋贴 3 又 3/4 子,可能是偏向白棋一方了。从 AlphaGo 的自评胜率中执黑也是胜率稍差,对柯洁本人近年来的战绩来看,执白的胜率也是明显比执黑要好的。笔者开着免费棋软 LEELA 最新版 0.10.0,静静的欣赏这盘棋。柯洁显然是有备而来,小目大飞守角加一个三 3,然后第 7 手,点对手星星下的三 3,很彻底的表明先捞后洗的策略,先捞足实地,然后和电脑比大型死活。
笔者还是很认可这一策略的,最近在野狐上很火的骊龙 AI(绝艺老版),大杀四方,偶尔输棋,基本也只吃大型死活偶尔犯错这一招了。 AlphaGo 是不是也有这样的弱点呢?
由于黑棋的位置低,第 5 手黑棋的胜率从开局的 48% 降到 46%,看来电脑并不认可三 3 这手棋。黑棋第 7 手点右下角三 3 至 22 手征掉一子告一段落,不知道柯洁此时有没有后悔左上角是三 3。如果左上角是星位,那么 22 是征不掉黑子的。
24 是极其出乎笔者意料的一手, AlphaGo 果然是高者在腹。
这手棋如果按笔者的理解叫中途半端,是要被老师批评的,没有拨掉一子那么干净,对二路的夹也没有补到。柯洁看到这手棋时的表情也非常有意思,一下笑了,然后直起身子,不停的摸自己的头。考虑良久之后,拆了一个边,限制的外势。白棋 26 打入进入战斗,面对柯洁的 29、31 两记重拳, AlphaGo 都没有应,让笔者想起了太极高手的闪转腾挪。这狗也太灵活了,这让人怎么下? 好在后面的进程还算正常,到 46 告一段落,黑棋胜率 45%。50,54 刺和断,又是出乎人类棋手的意料!人类棋手不会在四颗子还有跑的可能的时候,去让刺和黑拐头相交换,让四子彻底死掉,也不会在大场还那么多的时候花一手断来换取一点点的借用的。 AlphaGo 大师真乃神出鬼没!它会走在哪你真是猜不到的。
黑 55 被动得来的先手,柯洁没有选择拆边加强自身,而是选择了继续打入破空,坚决贯彻自己的战略意图。
至 65,黑棋在左下又成功掏掉一个角,不过胜率下降到 39%。
后面便是 AlphaGo 稳如泰山的表演了,先攻击两子,再洗掉上边。局面的差距越拉越小,黑胜的机率却越来越小,真是一个怪圈!其中不乏 AlphaGo 有一些劝降的招数,比如第 200 手的提,最终黑棋输了 1/4 子。
回顾整盘棋,进程和年初的 MASTER 赢棋的过程非常类似。如果说年初下快棋,人类棋手来不及思考,犯了很多低级错误导致输棋,那么今天这盘棋,时间很充裕,可以说没有什么低级错误了。笔者很难确定究竟哪几步是坏棋,导致了棋局的落后,只能说是 AlphaGo 凭借神经网络技术训练出的棋感确实比人类选点更精确。如果说输的多少不能认为是实力的差距,那么从 ELO GO-RATINGS 等级分的差距可以大致的预测一下。等级分比对手高 300 分的话,每盘棋胜率在 85% 左右,比对手高 600 的话,胜率在 97% 左右。柯洁的等级分大约在 3600-3700 之间,去年战胜李世石版本的 AlphaGo 自评等级分在 4500 左右。而经过了一年多之后, AlphaGo 的等级分进步到多少我们不得而知,但至少不会比去年的版本低。所以,如果找不到 AlphaGo 一些未知弱点的话,人类几乎可以说是一胜难求。
柯洁认为,Alphago 的棋与去年完全是两个人。第一次时它很接近人的,但现在越来越像「上帝」。所以,虽然只是 1/4 子,其实是人类棋手无法逾越的一条鸿沟。在冰冷的数据面前,再如何说让柯洁继续努力的话,都显得苍白无力,接下来的比赛,让我们就期待精彩的过程吧。
AI科技评论招聘季全新启动!
很多读者在思考,“我和AI科技评论的距离在哪里?”答案就是:一封求职信。
AI科技评论自创立以来,围绕学界和业界鳌头,一直为读者提供专业的AI学界、业界、开发者内容报道。我们与学术界一流专家保持密切联系,获得第一手学术进展;我们深入巨头公司AI实验室,洞悉最新产业变化;我们覆盖A类国际学术会议,发现和推动学术界和产业界的不断融合。
而你只要加入我们,就可以一起来记录这个风起云涌的人工智能时代!
如果你有下面任何两项,请投简历给我们:
*英语好,看论文毫无压力
*理工科或新闻相关专业优先,好钻研
*对人工智能有一定的兴趣或了解
* 态度好,学习能力强
简历投递:
深圳:[email protected]