观点 | 王小川评AlphaGo 2.0：和1.0原理大不同更接近于人

AI科技评论 · 公众号 · AI · 2017-05-23 17:42

正文

AI科技评论按：去年3月谷歌的AlphaGo一举战胜韩国围棋职业九段李世石震惊国际。就在比赛之前，大多数人都将胜利的天枰压在了李世石一方，他们认为人类输的几率很小，即使输也不会是4:1这样惨烈的结果。之后当我们分析结果，我们意识到科技发展水平与大众认知水平的脱节，另外这场比赛的主办方也是AlphaGo的研发方谷歌一直以谦卑的姿态面对比赛结果，让很多人以为这场比赛只不过是谷歌的一次程序测试而已。当然，也有人一开始就坚定地为AlphaGo摇旗呐喊，其中搜狗CEO王小川甚至断言，AlphaGo不仅会赢得比赛，甚至是完胜。

就在今日，谷歌再次携升级后的AlphaGo 2.0来到中国乌镇，对弈中国围棋职业九段棋手柯洁。对于这场对弈，人类剩下的只是防守，赢已经不再变得那么重要，只要不输甚至不要输的那么难看已经成为大多数正在关注这场对弈的人的心境。所以，这次大家更关注的是，AlphaGo 2.0又有了哪些的不同。

这次，王小川再次在知乎上发表了自己的看法，他断言AlphaGo 2.0已经摆脱了监督学习，不再需要人类下围棋的历史数据，而是只通过“增强学习”，另外，两台AlphaGo自我对战学习如何下棋，并达到登峰造极的地步。此次在与柯洁的对弈中，AlphaGo 2.0的棋风完全异于常人，在王小川看来这正是这场对弈最大的看点。

搜狗CEO王小川

该来的终于来了。

一年前AlphaGo发布，看完论文后我就在知乎上发文预测机器会完胜人类。好些行业朋友不相信，为此我收了很多“智商税”，之后微信发红包一直发到春节才发完。此外我还立了两个断言：一个是Google很有可能再研发出AlphaGo 2.0，摆脱“监督学习”，不再需要人类下围棋的历史数据，而是只通过“增强学习”；两台AlphaGo自我对战学习如何下棋，并达到登峰造极的地步。从公开的资料判断，此言中了。这意味着什么呢，又有什么看点呢？

技术重大提升：和1.0原理大不同更接近于人

AlphaGo 1.0 是巧妙地混合了三种算法：蒙特卡洛树搜索+监督学习+增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算，比1997年深蓝的暴力计算更聪明。而这里的监督学习，是通过学习3000万步人类棋谱，对六段以上职业棋手走棋规律进行模仿，也是AlphaGo获得突破性进展的关键算法。而增强学习作为辅助，是两台AlphaGo从自我对战众中学习如何下棋，据悉对棋力提升有限。

根据公开资料推测，此次AlphaGo2.0的技术原理与之前有着巨大不同：

1. 放弃了监督学习，没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法，也是今天主流机器学习不可避免的核心条件：依赖于优质的数据，在这个特定问题下就这么被再次突破了。

2. 放弃了蒙特卡洛树搜索，不再进行暴力计算。理论上，算法越笨，就越需要暴力计算做补充。算法越聪明，就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看，走棋非常迅速，约在每10秒钟就走棋一步，如此速度很可能是放弃了暴力的计算。

3. 极大地强化了增强学习的作用，之前敲边鼓的算法，正式成为扛把子主力。想想看有多励志：两台白痴机器，遵守走棋和获胜规则，从随机走棋开始日夜切磋，总结经验，不断批评和自我批评，一周后终成大器。

在这样的算法下，AlphaGo 2.0对计算资源开销极小，把当前棋局输入神经网络，电流流过，输出就是最佳的走棋方案。我猜测如此算法下，有可能仅仅依靠一个GPU工作，每一步棋消耗的能源接近人的大脑。

最大看点： AlphaGo2.0 棋风完全脱离人类经验

今年年初，AlphaGo 化身Master连胜人类顶尖棋手60局。在围棋领域，机器完胜已经变成公认的定论。这导致很多人开始问：这次人机大战还有意义吗？我们的关注点不再是机器是否会赢——而是机器将用什么姿势战胜人类。

AlphaGo学习了3000万步人类棋谱，走棋风格也近似于人。在比赛现场，偶有AlphaGo走棋和人的经验不符合，就被评为“愚蠢”，只是在中盘之后发现机器渐渐局面占优最终获胜，为了自圆其说解读为“AlphaGo中盘逆转”，前两局莫过如此。第三局开始评论者长了教训，开始尊称AlphaGo为“阿老师”，有了欣赏和敬畏的心态。这带给围棋界很大的冲击，以前大家认为正确的东西，其实是不正确的。柯洁曾经评价说：“AlphaGo出现，很多理论都被推翻，再看以前定式变得好笑，亏那么多目就不再是两分。”人类通过数千年实战，总结了围棋理论，然后计算机告诉人类：这些全都是错的。现在在很多比赛上，人类棋手已经开始向机器学习，模仿AlphaGo的下法，棋圣聂卫平也曾表示“理论被颠覆了”。

而AlphaGo2.0脱离了机器对人模仿，走棋风格也将完全脱离人的定式。在与柯洁的比赛中，会不断出现我们意想不到的走棋，而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻，但凡一个正常的棋手都不会这么玩，但凡一个新手这么玩都会被点拨这样不对。而AlphaGo2.0会不断制造这样的局面，关键他还是对的。可想对专业棋手的心里会有多大的震撼：不仅自己这一辈子都没这么想过这么下棋，整个围棋界都没有想过。会不会怀疑自己白活了？会不会反思两千年围棋的发展为什么有这样的瓶颈？还有多少海阔天空等着我们去探索？可等不及我们去探索，计算机就给出了终局的答案，多么惆怅。

我们会津津乐道，AlphaGo是什么棋风。但可以这样推理：但凡有流派和风格，就还有局限性。只有当所有流派合一看不出流派的时候，才到达致高境界。AlphaGo 2.0便会是这么一台机器，没有风格，稳如磐石。

可以想见这次与柯洁的对弈，能频现“怪招”，完全颠覆人类对围棋的理解——这会是比赛最大的看点。英勇的柯洁，要解锁108种姿势来抵挡了。

2017人机大战的意义：重演一部进化史重新认识智慧的边界

2016年在AlphaGo和李世乭的对战后，人工智能进入大众的视野，我们开始重新思考机器和人的关系。

围棋已经有两千多年的历史，在漫长岁月的琢磨中，围棋理论不断进化，到达了很高的水准，AlphaGo的获胜，我们大可以解读于“青出于蓝”，毕竟是在人类围棋进化的主路径上又攀高峰。

而AlphaGo2.0完全抛弃掉人类这两千年来进化的围棋经验，另寻他径，仅凭两台机器自我对弈中学习和进化，最终不仅赶超了人类进化的速度，还发展出一套截然不同的下棋方法，并且更加接近完美的状态，实现了对人类的碾压，重演了一部围棋的进化史，而且得出了与这两千年来不同的进化结果。

这会给我们什么启示？如果跳出围棋的规则，类比看地球生命的进化：人类是从原始的有机物，到单细胞开始逐步变成灵长类动物，并且发展出超越其他一切生物的智慧。这条路径是唯一的么？人类的生命形态和最顶级的生命形态还有多大距离？AlphaGo告诉我们：我们还有极大的发展空间；AlphaGo2.0告诉我们：如果有合适的条件，完全可能有其他的生命进化路径，以及更不一样的进化结果。

让我们欢呼人的智慧造就了AlphaGo，这也帮我们开了眼界，看到我们离最终的生命形态和智慧依然有遥远的距离。

保持敬畏，坚定前行，终得圆满。

“12小时零基础入门深度学习”，欢迎来玩！

“AlphaGo的划时代意义在于它不仅仅缩短了机器与人的智能距离，还将颠覆人与人智商差异的感知。” 这是在去年AlphaGo战胜李世石后，有业内人士如是说。

The rich get richer，门外汉也想窥探人工智能背后的神秘。AI慕课学院自上线以来推出了不少人工智能专业课程，有不少像小编这样的AI小白空有一腔热情却只能望而却步。现在，雷锋网携手AI慕课学院推出《12小时零基础入门深度学习》（线下周末班，仅50个名额），邀请了IOT农业机械和MLAQI预测算法项目的深度学习工程师Chris、“深度学习”和“无人驾驶”领域有丰富教学经验的Max博士、曾参与某大型算法金融项目研发的深度学习工程师杨杰等中外讲师，12小时现场授课，采用“探索+实践”的硅谷教学模式，用最流行的深度学习技能 CNN、RNN、VGG16、ResNet、InceptionCNN等动手操作9大项目，fastai中文社区最活跃的四位贡献者为你打开深度学习入门的那扇门，快速构建你的深度学习应用。目前课程回馈价599元，史上最低，欢迎来玩。

讲真，小编在一个月前知道“AI慕课学院” 在密谋这个课程福利的时候就已经悄悄预约了，名额有限，快来面基呀。

详情请点击“阅读原文”查看，或直接访问http://www.mooc.ai/course/92

AI科技评论招聘季全新启动！

很多读者在思考，“我和AI科技评论的距离在哪里？”答案就是：一封求职信。

AI科技评论自创立以来，围绕学界和业界鳌头，一直为读者提供专业的AI学界、业界、开发者内容报道。我们与学术界一流专家保持密切联系，获得第一手学术进展；我们深入巨头公司AI实验室，洞悉最新产业变化；我们覆盖A类国际学术会议，发现和推动学术界和产业界的不断融合。

而你只要加入我们，就可以一起来记录这个风起云涌的人工智能时代！

如果你有下面任何两项，请投简历给我们：

＊英语好，看论文毫无压力

＊理工科或新闻相关专业优先，好钻研

＊对人工智能有一定的兴趣或了解

* 态度好，学习能力强

简历投递：

[email protected]

观点 | 王小川评AlphaGo 2.0：和1.0原理大不同 更接近于人

正文

技术重大提升：和1.0原理大不同 更接近于人

最大看点： AlphaGo2.0 棋风完全脱离人类经验

2017人机大战的意义：重演一部进化史 重新认识智慧的边界

观点 | 王小川评AlphaGo 2.0：和1.0原理大不同更接近于人

技术重大提升：和1.0原理大不同更接近于人

2017人机大战的意义：重演一部进化史重新认识智慧的边界