专栏名称: 前海征信中心
深圳前海征信中心是独立的第三方商业征信机构。我们致力于为消费者普及信用知识、培养信用意识,也帮助广大中小金融机构提升风险管理和信用评估专业能力。
目录
相关文章推荐
大道无形我有型  ·  回复@A大师-懒惰的投资人: ... ·  18 小时前  
启四说  ·  下周不妙,可能是心跳行情 ·  昨天  
库斯卡娅的朋友们  ·  今年还在投流的公募,会不会被拉黑名单?每天都 ... ·  昨天  
库斯卡娅的朋友们  ·  今年还在投流的公募,会不会被拉黑名单?每天都 ... ·  昨天  
大道无形我有型  ·  我们买茅台主要用的是人民币,所以茅台并没有这 ... ·  3 天前  
51好读  ›  专栏  ›  前海征信中心

好信热点 | AlphaGo 2.0牛在哪儿?竟让柯洁口服心服

前海征信中心  · 公众号  ·  · 2017-05-24 19:19

正文




5月23日,人机围棋大战第一局在浙江桐乡打响,围棋人工智能 AlphaGo执白1/4子战胜目前等级分排名世界第一的中国棋手柯洁,暂时1比0领先



一场人机大战,让又是挠头又是苦笑的柯洁贡献了不少“表情包”。提及自己丰富的表情,柯洁自嘲说,为什么苦笑大家都懂的。在赛后发布会上,柯洁表示,AlphaGo是太厉害了,后两盘棋目标“ 让主机发烫 ”。



AlphaGo 2.0棋风更稳健 想找BUG不容易



AlphaGo 2.0棋风更稳健 想找BUG不容易


人机大战前,众说纷纭。古力说,赢一盘可能性10%;聂卫平说,能赢一盘就是烧香了;柯洁自己说,一直在备战秘密招数。可惜首盘对决,柯洁失利收场。


亮点更多来自序盘阶段。柯洁执黑先行,前四手棋下了两个三三。直接点三三,正是AlphaGo的标志性招法。柯洁选择“以彼之道,还施彼身”,却没能收获AlphaGo惊愕的表情。


面对柯洁的“先捞后洗”,AlphaGo高效率应对。“我印象最深的是那一手断。”柯洁赛后复盘有点震惊,“人类对局是不可能下的,否则就落了后手了。但后来分析是好棋,不但劫材多了,还兼顾了角,加固了自己,一石二鸟,实在下得太出色了。”


业内人士评论,但凡有流派和风格,就还有局限性。只有当所有流派合一看不出流派的时候,才到达致高境界。AlphaGo 2.0已经没有风格,稳如磐石。


此外,柯洁在赛后对媒体表示,AlphaGo很多地方都值得我们去学习、探讨,TA改变我们对棋的最初的看法。感觉AlphaGo和去年判若两人,当时觉得他的棋很接近人,现在感觉越来越像围棋上帝。我希望尽全力去拼每一盘棋。很感谢有AlphaGo这样的对手,感谢DeepMind团队给我机会去下这三盘棋,也希望通过这次比赛让大家了解围棋这个好项目,给大家带来快乐。



技术重大提升:和1.0原理大不同 2.0更接近于人




AlphaGo 1.0是巧妙地混合了三种算法:蒙特卡洛树搜索+监督学习+增强学习。 其中蒙特卡洛树搜索是一种优化过的暴力计算,比1997年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是AlphaGo获得突破性进展的关键算法。而增强学习作为辅助,是两台AlphaGo从自我对战众中学习如何下棋,据悉对棋力提升有限。


王小川在知乎上发布帖子指出,根据公开资料推测,此次 AlphaGo2.0的技术原理与之前有着巨大不同:


1. 放弃了监督学习,没有再用人的3000万局棋谱进行训练。 这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。

2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。 理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。

3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。 想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。


在这样的算法下,AlphaGo 2.0对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。猜测如此算法下,有可能仅仅依靠一个GPU工作,每一步棋消耗的能源接近人的大脑。



人工智能开拓无限可能的未来




去年AlphaGo和李世石的对战后,人工智能进入大众的视野,并促使业界开始重新思考机器和人的关系。


Deepmind创始人哈萨比斯曾表示:”本次比赛的宗旨是探索新的围棋打法。alphago再过一万年也不可能穷尽所有围棋的定式。这次比赛其实不是人机大战,而是人类使用电脑作为工具探索新的东西,就像哈勃望远镜让人类发现新的领域一样。人工智能可以帮助专家以更快的速度解决问题。本次比赛的目的也不是alphago还是棋手赢,最终还是人类赢。”







请到「今天看啥」查看全文


推荐文章
启四说  ·  下周不妙,可能是心跳行情
昨天