今年元旦的时候,化名
Master(Magist)
的神秘高手在网络平台上大杀四方,对阵人类职业棋手的成绩为不可思议的60胜0负,最终幕后的人肉手臂Aja Huang承认
Master就是AlphaGo
,并且是个新版本,对计算机围棋的强大有了重新的认识。今天终于传来了最新的消息,人类第一人柯洁九段终于要对阵AlphaGo了!他能捍卫人类的荣耀吗?
根据新华社的消息,从国家体育总局获得的信息确认在今年的五月下旬,AlphaGo将在浙江乌镇与包括柯洁在内的人类顶尖高手下三番棋。因为柯洁九段最近两年长期雄踞Gorating的
人类棋手排行榜第一名
,所以他的棋力就是代表了人类目前的最高水平。
Goratings上面柯洁九段雄踞榜首已经很长时间
从AlphaGo横空出世以来,到去年3月与李世石的人机大战五番棋,吸引了全世界的目光。围棋由于要在一个19X19的棋盘交叉点上落子,所以穷举的数学空间是所有竞技游戏中最高的,一直以来普遍认为很难在短期内解决。但是来自谷歌Deepmind团队的AlphaGo通过蒙特卡洛搜索树剪枝算法、走子网络、价值网络和策略网络的三重神级网络进行上亿盘机器学习训练之后的AlphaGo已然能够战胜了人类顶尖高手李世石九段,颠覆了我们对于计算机围棋的认知。
AlphaGo纪录片的宣传海报
AlphaGo的故事还被拍成了纪录片,过不久将在电影节上开始放映,我们很快就会看到关于更多内幕的内容。然而,柯洁九段在五月份要对付的,是却并非李世石面对的AlphaGo。
我们回到自然杂志论文发表的去年初,当时欧洲冠军樊麾对阵的版本在Deepmind内部是V13,当时杂志上提供的棋谱让中韩日这种围棋大国一片哗然,普通认为樊辉的棋力不够,换个当打的九段AlphaGo赢不了。
分布式计算的AlphaGo下一盘棋电费就要3000美元……
到了去年三月对阵李世石的时候,Deepmind的创始人哈萨比斯坦言对阵李世石的版本是V18的分布式版本,有1300多个CPU和280个GPU,
一盘棋的电费就要3000美元
。可以看到V13和V18的区别很大,尤其是棋力的提升,而没升级一个版本,则需要对阵旧版本的时候胜率达到90%,才能称之为新版。
Master获胜之后的官方声明:new version
再到今年初的时候下快棋的Master,根据事后Deepmind的官方声明,指出这是一个全新的版本,那么版本的编号一定是大于V18,不过deepmind曾经在韩国kgs网络对弈平台注册过账号,只是没有下棋,当时的版本是V20,这事情发生在Master出现之前,所以Master的版本一定是V20之后的.
一个没有输入过古代棋谱、只知道规则训练出来的围棋智能会有多强大?
再强的版本都基于一个事实,那就是事先输入过人类高手对弈的棋谱进行训练。而谷歌要做的事情是,从零开始训练,训练出一个从来不知道金角银边、立二拆三的人工智能对弈思路出来,让它完全跳出传统的条框限制,这极可能是与柯洁九段介时对弈的版本,如果输入过棋谱的称之为1.0时代,这个倒是可以称之为2.0.
可以简单的用两个字概括:没有,这不是我说的,是这几天搞德州扑克人机大战中国版的时候,李开复说的。前不久柯洁九段曾经参与了央视的一档阅读节目,在里面坦诚的说如果是和李世石对阵的版本,自己还是有信心的,而在Master出世之后,已经没有人类可以赢它了。
人民体育推出的对局精解里面可以看到普遍难以撑过50手
仅仅看到60胜0负的战绩其实并不能说明问题,因为谁跟博尔特跑百米都是输,
问题在于差距有多大
。这要看过程。在今年对弈的60盘快棋里面,人类的职业高手基本都是50手(一人25子)就已经溃不成军了,不过当时的AlphaGo一旦确立起来巨大的领先优势,就开始下很多我们人类看起来的损棋,收官之后可能人也就输几目甚至半目,所以只看目数显然不行,在对弈的过程中,AlphaGo超强的子效、无比灵活的转换,基本都是早早就确立了领先。
不过那是快棋,后来很多高手的解说里面,说当时AlphaGo对于很多定式的变招让他们根本没时间思考,所以如果慢棋,会想的更清楚些,不至于那么惨。但事实上,如果给AlphaGo更多的时间,它会进行更精确的蒙特卡洛搜索剪枝算法,所以说快棋下AlphaGo也没有使劲全力。
当年“让天下一先”的昭和棋圣吴清源(图左)
那么怎么才能知道它到底有多强?在日本的近代围棋里面,番棋制度是很好的办法。比如AlphaGo在对人不断的赢,那么可以5:0后,它不再贴目,而是让人类先手,即人类先执黑在天元上落子之后再正常下。如果先手还是连胜,让一子,当年的吴清源横扫日本棋坛的时候就是让天下一先……但是以Deepmind的效率以及高昂的成本,再加上Deepmind只是个人工智能的研发机构,围棋也不是唯一的项目,所以这种旷日持久的番棋制度恐怕Deepmind也吃不消。
对称的模仿棋或许是熬过布局阶段的办法,不过九段高手怕是不屑于这么做
还有种办法。那就是下完全对称的模仿棋,这样可以挺过前五十手恐怕问题不大,虽然很难看,但也算一种能试探出AlphaGo中盘或是官子实力的办法,当然作为世界冠军,一般来说不屑于这么下。
在Deepmind团队的论文发表之后,很多机构都深受启发,研究了基于多层网络的对弈软件,目前比较厉害的是腾讯团队的绝艺以及日本的DeepZenGo(深度天顶围棋),网友俗称地震狗。