一年之前,世界排名第一的柯洁(九段)开始搜索蒙特卡洛算法、深度学习等信息,作为所有棋手的代表,这一次他的对手是人工智能系统 AlphaGo。
4月17日,和人工智能系统AlphaGo的赛程敲定后的一周内,柯洁将自己的微博昵称从“柯洁大棋渣”改为“棋士柯洁”。他清楚,自己将不仅仅以柯洁的身份,而是作为所有棋手的代表,带着人类的尊严去迎战一个超人般的存在。
一个月之后的5月23日,DeepMind研发的人工智能系统AlphaGo与世界排名第一的柯洁九段在浙江乌镇围棋峰会对战三局。和“人机大战”第一季有所不同的是,这一次无论输赢都下满三盘,双方各有三小时。
柯洁在乌镇围棋峰会与AlphaGo对战。
每个在场的人似乎都已判断,这是一场必输的比赛。判断柯洁必败的理由很简单,今年农历新年前夕,AlphaGo曾化名Master现身中国线上围棋对战平台,一周内60战60捷,无一败绩,柯洁参与了其中三盘,三战皆败。
2016年12月30日,柯洁与Master两战两败。“像是被打了一记冷枪,这是哪个世外高人啊”,柯洁回忆道,“与李世石对战的V18(AlphaGo)还是人类的下法,但Master下棋很仙。”这也是他一开始不相信Master是AlphaGo的原因——它的进步实在太快了。
为了钻研Master的棋谱,柯洁几乎废寝忘食,他开始把Master下的所有棋谱找来研究。2017年1月3日再次败北后,柯洁的身体再也支撑不住,急性肠胃炎将他送进了医院,这也是他人生第一次住院。
在乌镇比赛之前,没有人比柯洁自己更清楚,几乎没有人相信他能赢。
但没有多少人意识到,柯洁承受着一名职业棋手可能承受的最沉重的压力。在对战的前一天夜里,他在新浪微博上发表《最后的对决》,表示与AlphaGo的三番棋会是他与人工智能最后的三盘棋。
第一天的比赛结束后,柯洁解释了这个决定背后的原因:“与人工智能的差距不是靠自身努力可以弥补的。”而随着将来人工智能的继续发展,获胜的可能也就越来越渺茫。应战一场胜算几乎为零的比赛,柯洁没有选择退缩的原因很简单,“我觉得我是一名棋手,作为棋手,从来只有输和赢,输棋的痛苦,外人无法想象,只有胜利是唯一真谛,所以不惜我的一切,真的去拼了。”他这样回答。
应战一场胜算几乎为零的比赛,柯洁没有选择退缩。
5月23日的第一场,下午2点51分,柯洁收完了最后一个单官(单官即占不到棋盘上空交叉点的一手棋),一只手在自己的棋盒里打着转,另一只手托着腮,眼睛直勾勾地盯着棋盘,似乎想再从裁判的手中多抠出哪怕半目。但结果如同他已经心算过几十遍的数字,落后1/4目。
在一个多月的备战中,柯洁曾反复思考击败AlphaGo的策略。在今天的比赛中,他在第三手就用了AlphaGo擅长的点三三下法,希望能够借此取得优势。然而出乎柯洁的意料,AlphaGo不但处理得很好,反而还占了上风。
“我印象中它是非常贪恋实地的,今天这盘棋(我)也在贯彻先捞后洗的策略,没想到被它打破了意图,棋完全进入了它的调子中。”柯洁说:“如果用棋手比喻,这个AlphaGo和去年完全是两个人,那一次它的棋很接近人类,但现在更接近我理解中的围棋上帝。”
5月25日第二场,柯洁中盘告负,但这却是他离战胜AlphaGo最近的一场。
这一场,柯洁的战术表现都堪称完美。“在前50手,柯洁的每一手都是AlphaGo计算中的最佳解,”AlphaGo之父、DeepMind创始人Demis Hassabis向所有人透露了后台的数据:“而在前100手也从来没有哪位棋手能够像柯洁这样与AlphaGo Master版本在胜率上咬得如此之紧。”
柯洁赛后称,自己曾经一度有“可能战胜AlphaGo”的预感,这也是当时在比赛现场他反复用手按住胸口的原因,“我的心在跳,我想让它跳得慢一点。” 但极度的兴奋却影响了他的判断,在关键手上出现失误。
5月27日第三场,柯洁中盘告负,在比赛期间他曾一度落泪。
柯洁在比赛中落泪。
虽然比赛已经宣告结束,但柯洁的战斗似乎还没有停止,他左手手肘支着脸颊,右手执着地在棋盘的左上方码着棋子,把几个子抠掉,又把几个子填回来,像是希望在这里施放什么时间倒流的魔法。
“今天我有点失态,和AlphaGo下棋非常痛苦。”柯洁在赛后媒体发布会上说道,声音有些哽咽,“每一步我担心的棋它都会下,而我想不到的棋它都能下得更好,它太过完美了。”
“我不想说我输了棋是什么双赢的局面,我下得很糟糕,不值得大家的赞美。”柯洁的回答中充满了愧疚。然而,虽然身为棋士的骄傲让柯洁难以接受自己输得如此难堪,但身为人类的观众更在意的是他在与人工智能对决中,展现出来的独属于人类的品质——荣誉、智慧与英勇。
“柯洁九段放下了一切,毅然无悔地寻找机会,搜索着最艰难的状况,他拿出了自己最大的能力。”李世石九段在韩国接受采访时这样说道:“我想告诉他,他真的辛苦了。”
柯洁输掉了比赛,但这三局人类顶尖棋手与人工智能的对决,肯定会成为围棋世界的宝贵财富。AlphaGo的开发公司DeepMind在赛后表示,他们将会与柯洁合作,深入研究三盘对局,共同分析比赛,并将分析做成视频与全球的围棋爱好者共同分享。
围棋一直被认为是最复杂的策略性游戏,也是人工智能难以攻破的终极智力活动。即使1997年,IBM的电脑“深蓝”(Deep Blue)战胜了当时的国际象棋世界冠军卡斯帕罗夫,大多数人仍是这么认为。
深蓝的原理很简单:依靠摩尔定律背书的超强计算能力穷尽每一步棋的可能性,选择最优解。国际象棋的棋局可能性约有10的47次方,而围棋大约有10的170次方,比全宇宙已知的粒子总数多100个数量级。这意味着,摩尔定律无法战胜围棋。
但现在,超越深蓝的人工智能出现了。
“深蓝的时代结束了,AlphaGo的时代刚刚开始。”AlphaGo创始人Demis Hassabis说道。
一年前,在“人机大战”第一季,李世石与AlphaGO正面交锋的时候,《第一财经周刊》曾采访到了柯洁。那时的他,对战胜AlphaGo还曾怀有信心……
一年前,柯洁对战胜AlphaGo还曾怀有信心。
一年前
在2016年AlphaGo对阵李世石的那场比赛前不久,柯洁九段刚刚战胜李世石获得世界冠军,看到AlphaGo和樊麾的对战棋谱他很吃惊,因为这个AI没有下“电脑棋”。
不懂电脑的他开始搜索蒙特卡洛算法、深度学习等信息,并在接受采访时向科技记者打听原理。他大概理解了这个AI能不断进步,但即便如此,他也不相信AlphaGo能在5个月内从准职业“选手”变成顶尖高手。
当时,几乎所有的职业棋手都不看好AlphaGo,他们等着李世石在3月9日捍卫尊严。谁也没想到李世石会连输3盘。
在那场对决中,第二盘对柯洁的冲击尤其大。李世石在没有巨大失误的情况下完败。胡盼盼则被AlphaGo的第37手彻底震撼,这步棋初看损失巨大,“如果职业选手这么下会被骂死”,但随着棋局深入,胡盼盼越发怀疑自己的判断,她觉得37手有可能是步极有远见的好棋。
柯洁在李世石输掉第一盘后发布并置顶了一条微博:“就算阿法狗战胜了李世石,但它赢不了我。”而在李世石输掉第三盘后,这条微博被撤下了置顶。
这时,AI专家以外的人才意识到,AlphaGo与之前所有的围棋电脑都不一样。它像人一样懂得布局、判断大势,它计算精准、棋风稳健,胡盼盼评价它下棋像李昌镐。在李世石之前,李昌镐曾称霸世界棋坛十几年,因为内心强大,被称为“石佛”。
柯洁的焦虑很直接。“当时就觉得下棋没意思了。以后职业棋手可能不再是围棋的权威。一个入门级别的观众在看直播时都可以通过AI来点评这步棋。作为竞技的乐趣大大折扣。”他对《第一财经周刊》说。
如今,即使是对围棋和人工智能都不了解的人,都能简述AlphaGo两个网络的决策模式:“策略网络”(policy network)推荐几种下法,“价值网络”(valuenetwork)评估这几步棋的优劣,选择胜率最大的一手。这种模式与人类落子的决策类似,通过对3000多万盘棋的深度学习(deeplearning),它成了顶尖高手。
在李世石3场全败之后,柯洁说,如果AlphaGo能像App那样方便,那“我肯定可以用它来进步棋艺”。一个事实是,柯洁早就在用不那么聪明的AI来提高棋艺。网络对弈是新一代棋手主要的训练方式,这使得他们的训练量比上一代棋手更大。“深蓝”战胜卡斯帕罗夫19年以来,国际象棋的棋手们也像这样改变了传统的训练方式。
柯洁每年下上千盘网棋,在围棋网站上,他的ID是“潜伏”。
在告诉记者“下棋没意思”之后5分钟,柯洁就坐到了电脑前,登录弈城网,以“潜伏”之名继续一场网络十番棋,对手是韩国顶级棋手朴廷桓。柯洁赢了。
就胜败而言,人类输了。但围棋还是那个古老而诱人的游戏。
(本文版权归《第一财经周刊》所有,未经许可不得转载或翻译。)
欲知更多柯洁与AlphaGo之间的对战故事和AlphaGo研究进展,请关注《第一财经周刊》6月5日刊特别报道。
王杰夫
All those moments will be lost in time...like tears in rain...Time to die.
肖文杰
第一财经周刊主笔 关注汽车、制造业、城市商业