谷歌旗下Deepmind公司近日在德国慕尼黑的DLD创新大会上正式宣布,将推出真正的2.0版AlphaGo。
新版“阿法狗”将正式摒弃人类棋谱,只靠计算机自身深度学习的方式成长——即探索“深度学习”方式的极限,臻至“围棋之神”的境界。2.0版的AlphaGo,将通过数学模型下的自我对局和深度学习,下出真正属于人工智能(AI)的围棋。
在2017年开年,化身Master的阿法狗风卷残云完成60胜,唯一一场平局还是因为对弈者掉线。
当时“棋圣”聂卫平就表示:“围棋远不像我们想象的那么简单,还有巨大的空间等着我们人类去挖掘。阿法狗也好,Master也罢,都是‘围棋上帝’派来给人类引路的。”
而柯洁则说他一夜无眠,“人类千年的实战演练进化,计算机却告诉我们,人类全都是错的……”
既然人类的围棋智慧如今落入下风,那么人工智能会带来怎么样的围棋变革呢?
DeepMind公司其实早已有过设想——抛弃人类棋谱套路,走AI自己的路。该公司创始人哈萨比斯此前在一次采访中曾透露,他们的团队正在尝试训练一个没有学习过人类棋谱的人工智能。而当Master大杀四方后,也有外界猜测,Master是否也未曾研习人类棋谱。
但无论是人类套路还是自成一派,阿法狗更可怕的还是它的学习能力。在2015年10月,阿法狗在与欧洲冠军樊麾的对弈中就在公平的情况下以5比0完胜。樊麾在接受媒体采访时认为,阿法狗的可怕在于“从不犯错”。
在樊麾与阿法狗的五盘大战棋谱被放上网络后,就有不少围棋业余高手在网络上发表评论,其中不少人认为樊麾这次的棋下得并不出色。
但当时《自然》杂志就写道,“人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。”
“围棋AI的学习能力非常强大,就像当初‘深蓝’第一次输给了卡斯帕罗夫,但不到一年第二次对弈就赢了比赛。”
据《自然》杂志介绍,阿法狗的核心是两种不同的深度神经网络:“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋。
更恐怖的是它的“进化”深度学习能力,用了2000万局的对子对弈进行训练,每一次都能提升棋力。▼▼点击下方阅读原文了解更多体育资讯