Ⅰ
“黑棋中盘投子认负!”
坐在棋盘对面的少年棋手执白,他抓了抓头,嘴角还是没憋住地向上翘起,构成一个快乐的弧度。代替AlphaGo落子的业余棋手在电脑宣布认输后,向对手鞠了一躬,走下台去。
“自古英雄出少年啊!”
“当初吹的牛都圆回来了啊!”
他早习惯了,其实每次赢了棋都是一样。业内,家里,网上,等着他的都是一片祥和热闹的言论。不过这一次不同往日,这些表扬声中,多少掺着些天将降大任于斯人的味道。
因为对手太特殊:AlphaGo, 一款围棋人工智能程序。
早在数十年前,五子棋和象棋就已经被机器破解。这些棋类游戏的状态数量有限,电脑可以暴力地穷举出每一步的胜负推导。任何棋手与电脑对弈,就相当于和全能的上帝下棋。只有围棋,在十九路棋盘上,棋子排布的可能性高达10^172,远超宇宙里的原子数。最强大的计算机也不可能单纯只使用穷举法,把它变成一个一眼望到头的游戏。
相比之下,一个优秀的人类棋手需要经历数十年,数千局的对弈。不仅仅为了让他们熟记定式,熟练收官,更是培养一种棋感。纳棋盘上的行云流水入胸中,落子之时,自然是带势的。
什么是势?
电脑就永远理解不了“势”。
人类最大的强项就是善于创造抽象概念。用抽象概念简化问题, 类比答案,帮助决策。电脑可以利用强化学习(Reinforcement Learning),在一个晚上与自己下上百万局棋,并调整参数从中受益。但它从上百万局棋中得到的提高,真的比人在一局棋里悟到的多吗?
于是人们说:“围棋,是人类智力在人工智能面前的最后一个堡垒。”
但世界上是不存在坚不可摧的堡垒的。
名为AlphaGo的程序,数月前分别以5-0和4-1大破欧洲冠军和前世界冠军,围棋爱好者和伪围棋爱好者们纷纷扼腕叹息。人类就是一种奇怪的生物,明明是自己造出了超越人类智能的围棋算法,却又对人类智慧高地的沦丧感到悲哀。
这个时候,大家把目光纷纷投向一位中国的少年。
他也是一位传奇的职业九段棋手。在十八岁那年便获得了三冠王,世界排名稳居第一,代表了世界围棋最高水平。如果他在AlphaGo面前败下阵来,就等于宣布,人工智能在单项工作上,已经正式超越人类了。
Ⅱ
他没有辜负众望。
这是第三局。3-0。
连来自英国的围棋程序开发团队,也认为AlphaGo与他暂时不在一个水平层次上。
就在胜利刚刚来临之时,少年棋手开口了:
“这只是单机版的Alpha go,赢它没什么光荣的。接下来的两局……让它联网吧。”
很快,几十个不同频道的主持人就把刚刚那句话复述成十数种不同语言,传达给了世界各地。
“这小子……太狂了!”
“究竟还是只有19岁啊!如此傲慢,违背了围棋的谦逊淡然之道。”
“其实也可以理解,3-0锁定胜局了,之后搏一下赢了能够传为美谈,输了也无伤大雅。”
少年棋手笑了笑,他太熟悉这些言论了。每次只要自己稍稍放出一点自信的言论,一定有人会给他扣上“年少轻狂”的帽子。但当他真的攻城拔寨赢了棋,又会有人说:“啊他就是围棋未来的希望。”
说着这两种截然不同言论的人,会不会是同一拨呢?
这就是人性的弱点。会因为外界因素变化,而喜怒不自持。
所以他们才输。
电脑没有弱点,他的程序里没有被编进愤怒和快乐,只编进去了一条,赢。
他也想赢。
但他更想碾压性地赢,华丽地赢,毋庸置疑地赢。
用自己的毫无悬念的赢堵住那些人的嘴。告诉他们,他的实力不因他们的看好看衰而改变。
“就一局,接下来的这一局。之前的三盘都不算,我们最后的一局定输赢。”
台下又是一片惊愕。
“胡闹,这不符合国际围棋比赛的规则,也不符合常规!”有人窃窃私语。
少年棋手转过头,从右到左扫视了一遍众多对着他的摄像机,最终选了其中一个定下来:“这本来就不是一场常规的比赛啊。我的对手——这位,”他指了指空无一人的棋盘对面,“它,可不是一位‘常人’。这比赛又怎么能套用常规呢?”
于是在座议论声渐起,大家都等着比赛的裁判长做决断。
裁判长正是上一场1-4负于AlphaGo的前世界冠军。
他是眼看着这个少年成长起来的。从追赶自己,到与自己比肩,再到把自己打败。他的性格像也极了10年前的自己。
他在年幼时同样张扬,经历过拒赛和退赛风波,第一次问鼎世界冠军的时候也曾饱受争议。
如今,上万盘的对弈,已经让他褪去当初的棱角锋芒,变得淡定从容。
如果那是自己,如果那个坐在棋盘前的少年是自己——我会希望得到怎样的答案呢?
裁判长闭上眼睛,他想起了几个月前与Alphago对弈时的情形。计算机强大的运算能力,就像一面墙倒塌,他赤手空拳,无能为力。那种窒息的感觉让落子的手微微颤抖,这颤抖被无数摄像头捕捉,化作电子信号传送到世界的每个角落,变成文人笔尖的讽刺和闲人茶余饭后的谈资。
他羡慕少年棋手。如果自己年轻10岁,是不是能够翻盘?如果自己的指尖停止颤抖,是不是能够放胆做劫?
如果他是少年棋手,他此刻最渴望的是什么?
——赢!
不仅仅是赢一局棋,是赢了那个冰冷的程序。
碾压性地赢,让那堵冰冷的墙反向坍塌,让电脑并不存在的指尖因为注定的败局颤抖,让它所有的失败没有任何借口——因为人类的大脑,还没有被打败。
裁判长睁开眼,他眼睛里有一个19岁的少年。
“尊重选手的意见,裁判长没有异议。”
很快地,主办方也传来消息,他们支持选手的提议。
对于主办方来说,一局定胜负的生死之争,远比两局“荣誉之战”要来得精彩。怎么会不愿意呢?
“由于赛制调整,下一场比赛,将会于一个月后举行。”主办方下达了最后的决定。
裁判长皱起眉头,一个月以后……本来按照原定计划,应当是两天之后应该进行下一局的……他明白这其中有什么蹊跷:
联网,代表着计算机停止“放水”。
一方代表着人工智能和互联网技术的最高成就,一方是地球上最厉害的围棋天才,要在一局比赛里一决高下。这太精彩了,他们需要用一个月的时间造势!网络上的预测和宣传将铺天盖地而来,人们的情绪将在精准无误的一个月后被推到最高点。那个时候再比,赛事才会获得最大关注。
只是,主办方的小九九,无形中将会给少年棋手造成更大的困难。
除了超强的博弈技术——蒙特卡洛搜索树,AlphaGo还仰仗于自身的强化学习能力和google的云计算资源。在这多出来的一个月的时间里,电脑可以学习数据库里多达16万次的高手比赛,让自己的路数更加贴近一个“人类高手”,也可以自我“对弈”:一遍又一遍运行围棋程式,在一局棋的不同结局中找出围棋最优的下法,修正算法的参数。
一个月后的少年棋手,还是少年棋手,而一个月以后的Alphago,还会是Alphago吗?
但裁判长的忧虑被激动的人群忽视了。
Ⅲ
接下来的几天,到处的文章都是都对比赛胜负的预测,对人工智能的忧虑,对围棋的入门科普,甚至是对那位少年棋手年幼糗事的深度八卦。
这让人不胜其烦。
幸运的是,这个瞬息万变的时代,任何新闻都不可能吸引你的眼球超过10秒。一个月里,国际上还发生了很多大事,它们如此普通——朝鲜,美国,中国,中东……每件事情的发生如此情理之中。那些陈词滥调十年来被提了100次,“严肃警告”“不遗余力打击”“侵略行为”“反抗到底”……严厉而空洞的政治辞藻,对于你我来说都不陌生。但谁真正地把它们当一回事儿?它们会发生吗?它们真的发生了,会影响自己的柴米油盐酱醋茶吗?
“还有三天……这次它可是联网的。怕么?”
一局罢了,裁判长问少年棋手。他们曾经是对手,但在Alphago横空出世后,人工智能和职业棋手的敌对关系泾渭分明,他们竟然变成了微妙的战友。
“不怕。”
少年棋手嘴上这么说,心里却没底,联网的Alphago能随时通过互联网读取世界上任何一台电脑上的公开资料,它可以边比赛边学,对弈变成一场开卷考试。
“真不怕的话,刚才可不会输给我。”
“嗯,分心出错了。”
“过几天比赛,可不能出错,一个错都不行。你知道它的局面评估函数和策略函数吗?”裁判长叹了一口气,“前者衡量每一颗棋子的意义,后者则着眼如何将大局布置完美。每一次落子,都是这两个函数之间的一次平衡。有了它们,电脑的任何一颗子,找的都是最优下法。它可不会出错。”
少年棋手撇撇嘴:“那大不了就输。”
“输了不觉得丢脸?不怕网上那些人又去你主页开喷?”
“哈哈……这我倒不担心,现在已经不是一个月前了,世界变成这样,还有多少人会有心情关心一盘棋?”少年又露出笑容。
……谁会去关心一盘棋?
这……真的还只是一盘棋?
裁判长原本对于强大的人工智能有一种难以言表的忧虑,可当抬头看到少年棋手开朗的笑容,又宽心了。
请你……一定要赢啊!!!
Ⅳ
可三天之后,他还是输了。
但输的方式是所有人都没有想到的。
刚刚开局时,大家都以为经历了一个月,比赛时又可以联网,Alphago的棋力会大大提升,很明显少年棋手也是这么想的,可以看出他布局时相当谨慎。没想到,此时相比于之前三局,电脑水平似乎不升反降,基本上是被压制的。