专栏名称: 三节课
三节课是一所互联网人的在线大学。这里有成体系的线上产品+运营课程,有线下“每年培养300位顶尖互联网人”的3.3计划,以及每日互联网大事的观点汇总。
目录
相关文章推荐
人人都是产品经理  ·  工作事情太多太碎,怎么合理安排和处理事情? ·  昨天  
人人都是产品经理  ·  怎么成为年薪53万的AI产品经理?我分析了2 ... ·  昨天  
人人都是产品经理  ·  如何跨界转型,成为AIGC产品经理? ·  4 天前  
人人都是产品经理  ·  2年产品经验,被领导diss像新人,问题出在哪? ·  1 周前  
51好读  ›  专栏  ›  三节课

柯洁惜败,那又如何?

三节课  · 公众号  · 产品  · 2017-05-23 21:01

正文

本文作者付晓萌,三节课新媒体运营喵。


5小时的对弈后,世界第一柯洁惜败。


今天下午,浙江乌镇举行了“人机终极对决”的第一局,世界排名第一的中国围棋选手柯洁,以四分之一子输给了 Google 旗下的人工智能程序 AlphaGo 。各家媒体第一时间纷纷报道此事,我们为大家摘取了部分媒体的精彩观点,与你共享。


一、更强的 AlphaGo


本次和柯洁对决的并不是一年前和李世石对决的 AlphaGo 了,而是升级版的 AlphaGo 。据DeepMind 的创始人 Demis Hassabis 透露,当前AlphaGo版本比跟李世石下棋的版本快10倍,硬件方面利用的谷歌自主研发的TPU,之后还会公布该版本AlphaGo更多的技术细节。


去年和李世石对决的 AlphaGo 是巧妙地混合了三种算法:蒙特卡洛树搜索+监督学习+增强学习。

简单介绍

蒙特卡洛树搜索:通过值网络来评估大量选点,并通过策略网络选择落点;

监督学习:通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿;

增强学习:两台AlphaGo从自我对战中学习如何下棋。


搜狗公司CEO@王小川 在知乎上根据公开资料,推测了此次AlphaGo2.0 与AlphaGo1.0 在技术原理上的不同之处:

1. 放弃了监督学习,没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。


2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。


3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。


@王小川 猜测,AlphaGo 2.0对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。如此算法下,有可能仅仅依靠一个GPU工作,每一步棋消耗的能源接近人的大脑。


也就是说,此次柯洁所面对的,是更强、更难应对的 AlphaGo 。


@爱范儿 今日第一时间推送的《柯洁输了!人不是那个人,「狗」更不是那个「狗」》一文中,作者@李帅飞&常岩 也指出了AlphaGo2.0 的骇人之处:

它已经跳出了学习人类棋盘的方法,而进入了自己左右手互搏,自己学习各种情况的局面,一方面它所学习到的棋局广度非人类可想象,另一方面它的出招可能越来越没有“套路”可言。更别提 AlphaGo 只要有电就可以无休止学习这件事了,由于围棋本身有明确的规则判断胜负,所以 AlphaGo 可以在无需人类标注的情况下就能判断自己出招的好坏,更是强化学习的一大优势。


意思很明显,现在的「狗」,是人类智慧和机器智慧的结合体了。


二、胜负既已定,为何还要继续?


比赛开始前,很多媒体和网友都对这场比赛做过预测,认为升级后的 AlphaGo 恐将完胜柯洁。柯洁在昨晚自己的微博长文《最后的对决》中也有说到,现在的AI进步之快远超我们的想象......我相信未来是属于人工智能的。




李开复曾预料:人类的胜算恐怕为零,胜负已经意义不大了。

棋圣聂卫平也表示:我预测结果是 0 比 3,AlphaGo 胜出。


明知胜负已定,那为何人机对抗还要继续下去呢?《柯洁输了!人不是那个人,「狗」更不是那个「狗」》就引用了《智能革命》一文中李彦宏的说法:

2017 年初,AlphaGo 的变身 Master 横扫中韩顶级高手,一时间人们分化为悲观派、降临派、冷静派、脑洞派……我们希望有更多人是默默学习派。


并认为,进行 AI 与人类的对抗,根本目的还是检验和优化算法,并且力争在其他更有价值的行业中进行应用:

从最初的 AlphaGo,到 Master,再到今天的 AlphaGo,三代产品,三段历程,对应的恰好是“理论,实验,再创新”的三段论。

而这种基于互联网大数据的深度学习和决策支持系统,将在很多人类算力不可及的领域提供支撑。


文中也提到了 Google 大中华区总裁石博盟所透露的:AlphaGo 的第一个结合点会是医疗领域,AI 将在一定准确率的情况下,给予医生诊疗判定方面的辅助,对于糖尿病、癌症等疾病的治疗和研究大有裨益。


而未来在更大的深度和广度上,AlphaGo 积累的决策模型,将逐渐把人力从需要反复的劳动中解放出来,同时对脑力劳动进行反哺,对绝大多数社会元素进行快速解构并解读,再反馈给人类。


如同去年大热的科幻片《降临》一样,人工智能与人类本体,终将会找到一条智慧结合的发展大路。


三、对决的意义


去年李世石与AlphaGo的人机围棋对战大比分1:3的时候,@黄有璨 写了一篇文章《李世石所面临的拷问,也许可以在中找到答案》,文中,黄有璨对比分表达了感伤:

一个天才级的职业棋手,理当是视自己的名誉和技艺为性命的,但与AlphaGo的这轮对决,在前三局李世石是完败。

要知道,这场完败,可能不仅会影响到他的名誉,甚至,更加可怕的是,他作为一位棋手的职业信仰——甚至可能不只是他,所有职业棋手们的职业信仰都将从此受到巨大的挑战。


之后,黄有璨提出了一个问题:假如机器的计算能力已经强大到了远超人类的地步,以至于在一些复杂决策上已经可以比人更加智能,那么人类的出路在哪里?甚至是,人类存在的意义在哪里?而人类,又是否会逐渐被机器所奴役?


沿着这个命题,他提到了刘慈欣的一部短篇科幻小说,情节大概是这样的:

某一天,人类终于遇到了一个科技发展程度远超自己的外星种族,对方是一个技术驱动的种族,他们的技术能力和已有的运算能力,成百上千倍于人类,以至于人类世界中的一切,在对方眼中,都是自己借助技术可以轻易实现的,看起来都如此破旧和不值一提。

在如此巨大的差距面前,外星种族认为人类世界中的一切都是无意义的,想要毁灭掉人类世界中的一切。

但,人类代表在与对方对话时,显得执着又顽固,他们坚称,人类世界中的有些东西,是哪怕科技程度发展远超人类的外星种族都做不到的。比如:诗歌,尤其是那种可以带来一种直击人类心灵的美感的作品。

崇尚以科技为核心的外星种族被这个观点激怒了,他们试图要凭借科技写出超越人类伟大诗人——李白的诗歌,为此,他们开发了计算能力强大到了极致的程序,甚至开始让程序模仿李白在写诗前的一切行为,依靠学习获得相似的体验,例如:饮酒、游山玩水、美色相伴。

在技术的驱动下,外星种族试图去结构和分解所有这些体验背后的一切,获得“伟大的诗”产生背后的特定逻辑。但,最终外星文明痛苦的发现,在技术和算法的推动下,自己虽然已经能够写出一些不错的诗,但它们并未能够写出超越李白的诗歌。因为,很多时候,伟大诗歌的创作,都是非逻辑的。

于是,为了写出超越李白的诗,技术驱动下的外星文明想到了另一条理论上可行的路径——穷举法。也即,在符合韵律等规则的情况下,把所有可能的字词组合都穷举出来。

最终,外星文明成功的完成了这一壮举——不计其数的诗歌被创作了出来,其中也必定包含了那些能够超越李白的诗歌。

但是,外星种族最终仍然认输了。

因为,虽然那些诗歌上的巅峰之作已经必然被创作了出来,但外星种族却无法开发出一个具备诗歌鉴赏能力的程序,也就无法借助伟大的技术把这些巅峰之作从几亿亿首诗中检索出来。

这意味着,技术层面上外星种族虽然已经确实超越了李白,但他们却仍然没有真正得到和拥有那些巅峰之作,因为它们无法被找到,无法被鉴赏,更无法被品味。


以上情节,我们可以认为:即使外星文明的技术能力和运算能力,甚至是作诗的能力都超过了人类,也不代表人类就输了,因为他们不具备鉴赏的能力。@半轻人 推送的《柯洁 vs.  Google AlphaGo 第一局速记》一文中, 作者@王咏刚 从哲学的角度也提到了对决的意义:

围棋之道,如只论胜负,人类的所有围棋书都可以烧了。还好,人类还可以在围棋中求快乐,求感悟,求哲理。


文中,作者引用了职业棋手李喆说的话,他读哲学的一个目的是为了探究下围棋这件事对人类社会而言到底有何价值。人工智能来了,人们其实也可以从哲学层面去探究,人这样一种神奇的存在对宇宙而言到底有何价值。如果我们只是宇宙的偶然过客,那我们有什么资格对机器智慧品头论足?人的智慧和机器的智慧真的有高低贵贱之分?


AlphaGo 的创造者——人工智能企业 DeepMind 的创始人 Demis Hassabis 表达了这场比赛的最终目的是去学习、探索围棋的真谛:

这绝不是人和电脑之间的对抗,这是人用机器发现新的知识,就像哈勃望远镜,它能带来新的奥秘的发现。同时,它也能用在其他的领域,比如在制药、医疗等方面,都可以使用人工智能来解决疑难问题。比如 Google 目前已经在使用 DeepMind 的技术在数据存储上节能减排了。而这场比赛的最终目的不是人类获胜还是机器获胜,最终目的都是去学习、探索围棋的真谛。


当然,今天只是柯洁和 AlphaGo “人机终极对决”的第一局,根据赛事安排,5月25日、27日还有两场比赛,鹿死谁手尚未有定论,我们可以耐心静待。


但是,结局或许已经不重要了吧?(完)




PS:今天给大家推荐一个名字稍有点拗口的微信公号:璃语职美人

这个公号的主人赵晓璃老师,是一位知性的畅销书作者,她的公号内容,多聚焦于职场问题、职业规划等,偶尔犀利,偶尔也会有暖心的鸡汤。

职业规划这个东西怎么说呢,本质上我觉得它其实寻求的不是一种确定的答案,而是一种对自己的了解。就像一家企业和一个公司的发展过程中面临决策时如果有一些模型或工具帮助你来进行辅助判断可能会让你更清晰更高效一样,职业规划的各种工具和方法对一个人的作用可能也是类似的。

如果你正好处于职业生涯的转型期、或者对于未来还不是那么清晰,不妨可以关注下赵老师的公号,相信会有收获的。 


↓↓↓扫这里↓↓↓

↑↑↑扫这里↑↑↑