“
AlphaGo2.0完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。
知友:王小川
从这盘棋上看,柯洁是完败。
知友:范廷钰
经历去年的人机大战之后,这次许多舆论更加冷静客观一些,人机对弈更加回归真实,这是可喜的。当然有些宣传问题上有遗憾,也是无奈的。但重要的不是这些,用围棋界的话说,“胜负不在这儿”,重要的是未来。
知友:高飞龙
”
柯洁和 AlphaGo 的第一盘棋有哪些值得关注之处?
知友:范廷钰(职业九段棋手,第七届「应氏杯」世界围棋锦标赛冠军)
大家好,我是范廷钰,很高兴在这里跟大家一起分享我的看法。
柯洁使用了 AlphaGo 的开局,但是并不成功。
中盘果断,先是掏取了角部,又成功处理弃子,非常成功。
这盘棋柯洁 输了四分之一子,为了方便让不懂围棋的知友理解,是围棋中最小的差距。半目的设置是为了避免用整数出现双方平目和棋的情况出现。
赛前关于AlphaGo 和顶尖棋手的差距,我根据我自己的经验,在Live中提出:AlphaGo 领先顶尖棋手有“一先” 以上。
从这盘棋上看,柯洁是完败。
下半盘黑棋弃子治理非常成功,抓住了AlphaGo的缓手。
这里我谈两Live 里提到的局部的看法和一点疑问。
【局部看法】
这里 AlphaGo 无论如何还是直接提掉比较好,白棋棋型非常完整厚实,实战后来柯洁巧妙地利用这里的形状问题走出了比较成功的处理。
这里是全局黑棋最得分的部分,AlphaGo 从立被黑棋先手挡下,轻松断在这里,处理的非常成功。
【一点疑问】
这里柯洁黑棋实战选择了c 点,当时在Live之中我摆了很久,可以说a/b/c 三个选点,实战是选的最差的。
【小结】
从这盘棋来看,AlphaGo 明显还是强过柯洁,但是也不必神话,仍然有很多明显问题出现。
感谢大家能来支持我和 @云天外 合作的 全程解析。
我注意到很多媒体对比赛的称呼为“人机对弈”而非“人机大战”,这是一个很好的姿态。因为胜败与悬念固然是最容易产生故事,也最容易动人心弦,但人类棋手和机器下棋,值得关注的不仅仅是胜败结果。
这次AlphaGo的版本,比起去年4:1战胜李世石的18.0版本,明显有了很大的进步,可以说从绝对实力上来说明显超越了人类棋手的水平。在超越节点之后的人机对弈,更像是测试,而竞技比赛作为人类激发自身潜能的仪式化活动,可以产生更好的测试效果。人们一边期待着从棋局的过程来探究棋盘上的客观真理,借助程序作为工具来更好的了解围棋,另一边也想看看能不能对人工智能的进一步发展提供什么参考和借鉴。这是两个领域的双赢,无论如何都将导致人类的进步。
而今天的棋局内容,则相对比较常规。柯洁开局就采用了Master(AlphaGoV19.0)元旦期间60盘网棋中常用的三三定式,策略很明显,你喜欢捞实地,我就先捞实地,你在复杂局面下有可能出错,我就尽可能先捞后洗,在中盘战斗中找机会。但棋局的过程,虽然双方都发挥出色,但相对平淡,柯洁过早选择点三三,在传统的棋理中稍亏,实战效果也差不多,然后双方始终不温不火的保持差距,都没犯什么明显的错。中盘时,黑棋最多只有盘面优势,然后白棋就收兵了。白棋后半盘多次目数亏损,导致差距缩小,最终以1/4子的最小差距取胜。
要关注1/4子的胜负结果,首先要知道围棋研究与围棋实战的不同。研究棋理,就像探究客观真理,当然要追求最佳,也就是最大收益;而实战,因为赢多赢少都是赢,所以完全可以追求稳健。而蒙特卡洛的算法是按照不同后续下法,跑出海量棋局然后统计胜率,AlphaGo模型设定为取最高胜率的后续下法为实际下法,所以实战中这个模型在封闭空间中可能导致非最佳下法,但一般情况下不影响胜负。
所以最后的1/4子,虽然也说明了柯洁的拼搏,但大家必须明白,这不是实际差距。也就是说,今天棋局显示出黑白双方的发挥差距,实际上不是半目而是更多,但也没有达到很多夸张的说法所说的两个子。我个人感觉实际差距不到一先,因为在AlphaGo后半盘收兵之前,黑棋盘面稍好,白棋至少握有4目左右的优势,这个数目应该更接近于今天双方的发挥。
当然大家必须知道一点,围棋实战结果的差距,并不见得能说明实际差距,人和人之间的对弈,如果看清楚会小败,经常会释放胜负手博取翻盘可能,结果要么翻盘,要么崩盘。今天的柯洁斗志昂扬,但是AlphaGo整盘棋控制力非凡,柯洁落后不多,但始终没有什么明显的机会,上边想要强杀白棋,可惜AlphaGo下出精彩手筋,有惊无险的活出。如果AlphaGo中后盘稍露破绽,柯洁一定也会宁为玉碎、不为瓦全,可惜AlphaGo始终那么稳。嗯,找不到玉碎的机会,这正是今天AlphaGo强大发挥的说明。
对于AlphaGo的下法,今天阿老师的下法非常常规,或者说很像人类棋手。去年和李世石对弈的18.0版本,每盘开局都有一些对局部变化的选择与人类常见下法不同,或者说是冷僻下法,效果大多不错,但有些也存疑。今年元旦新版的Master(19.0)上线,带来的最明显的新变化就是“早点三三”。而这种下法已经被职业棋坛大量研究和模仿,颇有收获。可惜今天柯洁的开局点三三,效果上来看并不上佳,甚至可以说此下法可能导致了细微劣势。但正如前所述,这更像是测试而非比赛,所以试探性着法是必然的,不然人还跟机器下什么?总要有收获的嘛!未来几天的比赛,希望能看到各种姿势的测试,今天这样的平淡,一局足已。
经历去年的人机大战之后,这次许多舆论更加冷静客观一些,人机对弈更加回归真实,这是可喜的。当然有些宣传问题上有遗憾,也是无奈的。但重要的不是这些,用围棋界的话说,“胜负不在这儿”,重要的是未来。
如何看待柯洁将于 5 月底与 AlphaGo 进行的终极人机大战?这对围棋、人类和人工智能会有什么影响?
该来的终于来了。
一年前AlphaGo发布,看完论文后我就在知乎上发文预测机器会完胜人类。好些行业朋友不相信,为此我收了很多“智商税”,之后微信发红包一直发到春节才发完。此外我还立了两个断言:一个是Google很有可能再研发出AlphaGo 2.0,摆脱“监督学习”,不再需要人类下围棋的历史数据,而是只通过“增强学习”,两台AlphaGo自我对战学习如何下棋,并达到登峰造极的地步。从公开的资料判断,此言中了。这意味着什么呢,又有什么看点呢?
技术重大提升:和1.0原理大不同 更接近于人
AlphaGo 1.0 是巧妙地混合了三种算法:蒙特卡洛树搜索+监督学习+增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算,比1997年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是AlphaGo获得突破性进展的关键算法。而增强学习作为辅助,是两台AlphaGo从自我对战众中学习如何下棋,据悉对棋力提升有限。
根据公开资料推测,此次AlphaGo2.0的技术原理与之前有着巨大不同:
1. 放弃了监督学习,没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。
2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。
3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。
在这样的算法下,AlphaGo 2.0对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。我猜测如此算法下,有可能仅仅依靠一个GPU工作,每一步棋消耗的能源接近人的大脑。
最大看点: AlphaGo2.0 棋风完全脱离人类经验
今年年初,AlphaGo 化身Master连胜人类顶尖棋手60局。在围棋领域,机器完胜已经变成公认的定论。这导致很多人开始问:这次人机大战还有意义吗?我们的关注点不再是机器是否会赢——而是机器将用什么姿势战胜人类。
AlphaGo学习了3000万步人类棋谱,走棋风格也近似于人。在比赛现场,偶有AlphaGo走棋和人的经验不符合,就被评为“愚蠢”,只是在中盘之后发现机器渐渐局面占优最终获胜,为了自圆其说解读为“AlphaGo中盘逆转”,前两局莫过如此。第三局开始评论者长了教训,开始尊称AlphaGo为“阿老师”,有了欣赏和敬畏的心态。这带给围棋界很大的冲击,以前大家认为正确的东西,其实是不正确的。柯洁曾经评价说:“AlphaGo出现,很多理论都被推翻,再看以前定式变得好笑,亏那么多目就不再是两分。”人类通过数千年实战,总结了围棋理论,然后计算机告诉人类:这些全都是错的。现在在很多比赛上,人类棋手已经开始向机器学习,模仿AlphaGo的下法,棋圣聂卫平也曾表示“理论被颠覆了”。
而AlphaGo2.0脱离了机器对人模仿,走棋风格也将完全脱离人的定式。在与柯洁的比赛中,会不断出现我们意想不到的走棋,而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻,但凡一个正常的棋手都不会这么玩,但凡一个新手这么玩都会被点拨这样不对。而AlphaGo2.0会不断制造这样的局面,关键他还是对的。可想对专业棋手的心里会有多大的震撼:不仅自己这一辈子都没这么想过这么下棋,整个围棋界都没有想过。会不会怀疑自己白活了?会不会反思两千年围棋的发展为什么有这样的瓶颈?还有多少海阔天空等着我们去探索?可等不及我们去探索,计算机就给出了终局的答案,多么惆怅。
我们会津津乐道,AlphaGo是什么棋风。但可以这样推理:但凡有流派和风格,就还有局限性。只有当所有流派合一看不出流派的时候,才到达致高境界。AlphaGo 2.0便会是这么一台机器,没有风格,稳如磐石。
可以想见这次与柯洁的对弈,能频现“怪招”,完全颠覆人类对围棋的理解——这会是比赛最大的看点。英勇的柯洁,要解锁108种姿势来抵挡了。
2017人机大战的意义:重演一部进化史 重新认识智慧的边界
2016年在AlphaGo和李世乭的对战后,人工智能进入大众的视野,我们开始重新思考机器和人的关系。
围棋已经有两千多年的历史,在漫长岁月的琢磨中,围棋理论不断进化,到达了很高的水准,AlphaGo的获胜,我们大可以解读于“青出于蓝”,毕竟是在人类围棋进化的主路径上又攀高峰。
而AlphaGo2.0完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。
这会给我们什么启示?如果跳出围棋的规则,类比看地球生命的进化:人类是从原始的有机物,到单细胞开始逐步变成灵长类动物,并且发展出超越其他一切生物的智慧。这条路径是唯一的么?人类的生命形态和最顶级的生命形态还有多大距离?AlphaGo告诉我们:我们还有极大的发展空间;AlphaGo2.0告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。
让我们欢呼人的智慧造就了AlphaGo,这也帮我们开了眼界,看到我们离最终的生命形态和智慧依然有遥远的距离。
保持敬畏,坚定前行,终得圆满。
本文内容来自「知乎」
转载请联系知乎原作者
未经作者授权同意,禁止转载
国手范九段说:「虽然大家普遍看好机器,但是我觉得如果柯洁全力发挥的话,三盘棋局中柯洁赢一盘还是值得期待的。」(听说中午吃饭的时候,范九段还在纠正之前的比赛变化,真是棋痴!来知乎 Live,听围棋国手范廷钰实况解说「巅峰之战」,看懂棋局奥秘不是梦。
本次 Live 主要包括以下内容
• 5.23 10:00 - 5.23 14:00 柯洁对战 AlphaGo 第一局全程讲解
• 5.24 20:00 - 5.24 20:30 升级版 AlphaGo 的下法变化
• 5.25 10:00 - 5.25 14:00 柯洁对战 AlphaGo 第二局全程讲解
• 5.26 20:00 - 5.26 20:30 当日棋局点评分析 + 实时互动
• 5.27 10:00 - 5.27 14:00 柯洁对战 AlphaGo 第三局全程讲解