5月23日,人机围棋大战第一局在浙江桐乡打响,围棋人工智能AlphaGo执白1/4子战胜目前等级分排名世界第一的中国棋手柯洁,暂时1比0领先。
一场人机大战,让又是挠头又是苦笑的柯洁贡献了不少“表情包”。提及自己丰富的表情,柯洁自嘲说,为什么苦笑大家都懂的。在赛后发布会上,柯洁表示,AlphaGo是太厉害了,后两盘棋目标“让主机发烫”。
AlphaGo 2.0棋风更稳健 想找BUG不容易
AlphaGo 2.0棋风更稳健 想找BUG不容易
人机大战前,众说纷纭。古力说,赢一盘可能性10%;聂卫平说,能赢一盘就是烧香了;柯洁自己说,一直在备战秘密招数。可惜首盘对决,柯洁失利收场。
亮点更多来自序盘阶段。柯洁执黑先行,前四手棋下了两个三三。直接点三三,正是AlphaGo的标志性招法。柯洁选择“以彼之道,还施彼身”,却没能收获AlphaGo惊愕的表情。
面对柯洁的“先捞后洗”,AlphaGo高效率应对。“我印象最深的是那一手断。”柯洁赛后复盘有点震惊,“人类对局是不可能下的,否则就落了后手了。但后来分析是好棋,不但劫材多了,还兼顾了角,加固了自己,一石二鸟,实在下得太出色了。”
业内人士评论,但凡有流派和风格,就还有局限性。只有当所有流派合一看不出流派的时候,才到达致高境界。AlphaGo 2.0已经没有风格,稳如磐石。
此外,柯洁在赛后对媒体表示,AlphaGo很多地方都值得我们去学习、探讨,TA改变我们对棋的最初的看法。感觉AlphaGo和去年判若两人,当时觉得他的棋很接近人,现在感觉越来越像围棋上帝。我希望尽全力去拼每一盘棋。很感谢有AlphaGo这样的对手,感谢DeepMind团队给我机会去下这三盘棋,也希望通过这次比赛让大家了解围棋这个好项目,给大家带来快乐。
技术重大提升:和1.0原理大不同 2.0更接近于人
AlphaGo 1.0是巧妙地混合了三种算法:蒙特卡洛树搜索+监督学习+增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算,比1997年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是AlphaGo获得突破性进展的关键算法。而增强学习作为辅助,是两台AlphaGo从自我对战众中学习如何下棋,据悉对棋力提升有限。
王小川在知乎上发布帖子指出,根据公开资料推测,此次AlphaGo2.0的技术原理与之前有着巨大不同:
1. 放弃了监督学习,没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。
2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。
3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。
在这样的算法下,AlphaGo 2.0对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。猜测如此算法下,有可能仅仅依靠一个GPU工作,每一步棋消耗的能源接近人的大脑。
去年AlphaGo和李世石的对战后,人工智能进入大众的视野,并促使业界开始重新思考机器和人的关系。
Deepmind创始人哈萨比斯曾表示:”本次比赛的宗旨是探索新的围棋打法。alphago再过一万年也不可能穷尽所有围棋的定式。这次比赛其实不是人机大战,而是人类使用电脑作为工具探索新的东西,就像哈勃望远镜让人类发现新的领域一样。人工智能可以帮助专家以更快的速度解决问题。本次比赛的目的也不是alphago还是棋手赢,最终还是人类赢。”
围棋已经有两千多年的历史,在漫长岁月的琢磨中,围棋理论不断进化,到达了很高的水准,AlphaGo的获胜,我们大可以解读于“青出于蓝”,毕竟是在人类围棋进化的主路径上又攀高峰。
而AlphaGo2.0完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。
这会给大家带来什么启示呢?如果跳出围棋的规则,类比看地球生命的进化:人类是从原始的有机物,到单细胞开始逐步变成灵长类动物,并且发展出超越其他一切生物的智慧。这条路径是唯一的么?人类的生命形态和最顶级的生命形态还有多大距离?
AlphaGo告诉我们:我们还有极大的发展空间;
AlphaGo2.0告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。
(资料来源:北京青年报、知乎、中国新闻网
图片来源于网络)
信用·让你我更好互联
看你靠不靠谱,点击阅读原文测分