1:0,没有悬念,AlphaGo首胜柯洁。
北京时间下午15:00许,人机围棋首场对战结果出炉。升级版的AlphaGo 2.0版本用时4小时30分钟结束比赛,执白1/4子战胜目前世界排名第一的柯洁九段。如同李世石一役,柯洁在比赛前半段颇具优势,胜率一度上升至45.10,但最终不敌败下阵来。
柯洁执黑VSAlphaGo
赛前,无论是职业棋手,还是人工智能科技领域的业内专家,给出的预测大多是“基本没有胜的可能”。中国围棋界的泰山北斗、棋圣聂卫平表示,“尽管我很希望柯洁能赢,但还是要理性看待这个问题”。
AlphaGo是一款由DeepMind公司开发的围棋人工智能程序,问世不久就名扬天下。去年4月,在举世瞩目的首场围棋“人机大战”中,AlphaGo以4:1的战绩“碾压”过去10年最强的人类棋手之一、世界围棋冠军李世石九段。联想李世石赛前信心满满的“除了以5比0战胜它外,其他没有意义”,求这位前世界第一当时的心理阴影面积。
今年还不满20岁的柯洁是目前最年轻的世界围棋冠军,同时也是围棋等级分排名世界第一的中国棋手。在讲究温良恭俭让的中国围棋界,这位年少成名的”天之骄子“以高调敢言著称,卖萌耍酷的”网红画风“更为其收获了大批粉丝。
在赛前的新闻发布会上,柯洁曾向外界喊出:“能够代表人类出战是自己的荣幸”,“将抱着必胜的心态和必死的信念与AlphaGo对局”。相比以往,柯洁此番向死求生的表态显然低调了不少。现任中国围棋协会主席王汝南也在比赛过程中一度评价:“看得出来,柯洁是有备而来,备战还是很详细的“。
柯洁微博截图
然而,代表着顶尖智力水平的中韩高手先后不敌,#感觉人类真的已经拼尽全力了#
事实上,在今年年初,此次上阵的2.0版本AlphaGo就曾化名“Master”(大师),以在线30秒快棋的形式击败了包括柯洁在内的几乎所有现役世界顶尖棋手,60战无一败,更直接把柯洁“打”去了医院。“知道对手不是人后心态就坏了,当时也吃不下饭,后来就住院了”,柯洁赛后表示。
与“Master”交手过三盘的“八冠王”古力评价柯洁此战的胜率时则称:“百分之百状态的话,可能胜率在百分之五左右吧。”至于给柯洁的建议:“把自己的实力展示出来。这次的目标就是发挥好自己。”
欧洲博彩公司则已经给AlphaGo获胜开出了1:1.05的赔率,与中国乒乓球女团的夺冠概率相当,柯洁获胜是1:8。而在去年6月1日,AlphaGo已经悄然登上围棋世界排名第二,仅次于柯洁。面对崛起中的机器智慧,已经是“世界最难智力游戏“最强者的柯洁,在这场号称”事关人类尊严的对战“中真的没机会了吗?
16年6月1日围棋世界排名,柯洁第一,AlphaGo第二
要搞清楚AlphaGo如何碾压人类,先来看看围棋到底是什么。围棋是世界上最复杂的的智力游戏之一,被称为是“人类智力的最后堡垒”。“信息论之父”克劳德·香农曾经论证,一盘国际象棋的变化总数至少在10^120这个数量级,相比之下,一盘19路围棋的变化总数不少于10^600,而目前可观测宇宙的原子总量10^80。
据知乎大V@不会功夫的潘达,一首棋的决策一般分为两步。第一步“选点”:凭经验或感觉给出几个候选的点;第二步“判断”:对着几个点做形式判断,并进行比较。难就难在形式判断,棋局进行过程中,双方地盘尚未封闭,界定模糊,判断的速度和准确度构成了职业棋手之间的水平差异。
由于围棋棋局的海量变化,对计算力的要求远远超出了人脑的能力,选点和判断的作用就在这里:帮助棋手快速将有限的计算力集中到几个重要选择上,避免复杂计算,减小风险的同时缩短时间。
想要战胜人类,AlphaGo面对的困难和人类棋手一样:围棋太难了,计算力不够。对此,AlphaGo团队的做法是,像人类一样去选点和判断。
基于深度卷积神经网络,AlphaGo的大框架分为“策略网络”和“价值网络”两部分,大致对应人类棋手的“选点”和“判断”:根据输入的局面,输出候选招法和形式判断,综合以后基于蒙特卡洛搜索树算法,给出最终决策输出,决定最终的落子点。
AlphaGo如何下棋
对于机器在围棋对弈中的优势,业内专家表示,AlphaGo擅长大局观判断,对局势的掌控比人类强的多,其基于概率的胜率估算比起人类棋手比较地盘多寡的形式判断更为精准,也更接近围棋的本质。
相形之下,机器的软肋同人类一样:计算力的不足。现任中国围棋队总教练俞斌赛前撰文写道:“阿尔法围棋现在唯一的弱点,就是在对李世石第四盘中所表现出来的‘无中生有’的失误,我把这种失误称为‘开放性计算的误算’。这种误算,阿尔法围棋在对李世石第五局的角上计算也出现过。”
不过,比起人类,机器的计算力仍是绰绰有余。此外,人类棋手还会受到情绪波动的影响,机器没有,所以越到比赛后半段,机器的优势往往越发明显。事实上,此前Master快棋赛60战全胜的战绩已经表明:在围棋对弈中,人工智能的水平与人类已经不在一个层面。
那么,人们长久担心的问题来了:人工智能是否已经威胁到了人类的生存?对此,卷积神经网络的创始人之一、Facebook人工智能实验室负责人Yann LeCun在一篇文章中表示,“绝大多数人类和动物的学习方式是非监督学习。如果智能是个蛋糕,非监督学习才是蛋糕主体,监督学习只能说是蛋糕上的糖霜奶油。”
YannLeCun文章截图
目前,AlphaGo的算法运用依然限于监督学习和强化学习,几乎没有用到非监督学习。而对于提起人工智能的动辄“妖魔化“,可能才是人类现阶段更应该担心的。
既然如此,大批网友不禁要问:人机对战还有何意义?DeepMind创始人及CEO戴米斯·哈萨比斯(DemisHassabis)称,AlphaGo为围棋带来了丰厚的遗产,职业棋手在与AlphaGo的对弈中,获得了丰富的启发。李世石也因为去年的比赛重新激发了对围棋的激情,乐于更深入地探索围棋的真谛。
DeepMind创始人 哈萨比斯
柯洁也在赛前表示,与人工智能的多次对弈是十分有收获的,AlphaGo的很多下法带来了很多想象,很多思想都带给棋界飞跃性的革命,为棋手们带来了长远的影响。“以前AlphaGo的很多招法看上去还觉得像人类,现在的招法给人感觉就是很‘仙’。我也在理解它的招法,有些招法试了试,发现效果还可以。“
有业内人士总结,过去几十年来,世界围棋布局套路泛滥,每年上千场的职业比赛,5个以内的流行套路就能将布局完全揽括,千人一面千篇一律,业内甚至流行称“布局无用”。年轻选手大多选择略过布局,直接到中盘决战。
在AlphaGo战胜李世石后,中国围棋队多次复盘了所有比赛,从中发现了很多新的思路。AlphaGo的出现给棋坛高手们带来一场思想上的风暴:原先以为不过如此的布局还有太多太广的变化,而且可以决定棋局走向。而相比拼精力拼计算,布局才是拉开大师与匠人差距的真正所在。
除了探索围棋新的打法,对DeepMind团队而言,AlphaGo的最终目的在于优化人工智能的多个应用选择,包括医疗、能源等难题,在其他领域为人类带来帮助。
AlphaGo的每一次升级,都意味着人工智能科学家对“如何在有限信息下做出更优选择”这一问题有了更深刻的认识,而这一问题正是让人工智能理解人类、产生思维的关键。
正如DeepMind创始人在今天的演讲中所言,“无论结果如何,最终胜利都属于人类。”
为期5天的围棋挑战赛还在继续,柯洁仍有可能创造奇迹。最后,让我们来听听业内专家和达人们的观点:
客观来说,如果柯洁能赢一盘,那就已经很了不起了。我预测结果是 0 比 3,AlphaGo 胜出。当然我很希望柯洁能赢一盘,给我们职业围棋手争个面子,但这种可能性实在太小了。
我们职业棋手现在和 AlphaGo 的差距是全方位的,从布局开始到终局,我们都不是它的对手。只要它自个儿不出问题,我们可以说没机会战胜它。
在这场“人机大战”中,柯洁输给 AlphaGo 是一件理所应当的事情。不过,即使 AlphaGo 获胜,也仅仅只能够证明人类的程序设计能力超强,并不能说明人工智能已经超越了人类。只有当 AlphaGo 将来可以独自去购物甚至去海滩度假的时候,也许才有资格讨论人工智能是否可能真正“战胜”人类。
如果出现以下 3 种情况,柯洁还是有可能赢棋的:
1. AlphaGo 断电。
2. 狗主人开恩,调成送分模式,让柯洁赢一盘,给人类点面子。
3. 突然出现一种过去从来没有出现过的死活题(这种可能性几乎为 0),AlphaGo不认识,导致搞错死活或者干脆停钟认负。
如果 AlphaGo 双手互博了600 万局,它就相当于一个下了 10 万年围棋的老妖怪,谁知道它是否自己下了 6000 万还是 6 亿局而相当于一个百万年老妖、千万年老妖?
柯洁面对的正是一位这样的棋神。然而人算不如天算,我是持万事皆有可能的态度,毕竟是程序就有 bug。
看过这么多观点,你认为人机大战最终的比赛结果是?
本期编辑:杨松
联系作者:shenys@21jingji.com