专栏名称: 澎湃新闻
有内涵的时政新媒体
目录
相关文章推荐
中国新闻网  ·  多地明确:今年春节可燃放烟花爆竹! ·  昨天  
湛江日报  ·  12356来了! ·  2 天前  
湛江日报  ·  12356来了! ·  2 天前  
人民日报  ·  【夜读】这一年,别忘了谢谢自己 ·  2 天前  
江苏新闻  ·  江苏一市确诊22例!紧急提醒 ·  2 天前  
51好读  ›  专栏  ›  澎湃新闻

阿尔法狗2.0要的根本不是胜利,然而柯洁又输了

澎湃新闻  · 公众号  · 社会  · 2017-05-25 17:03

正文



代表人类现阶段围棋最高水平的柯洁,在与围棋人工智能程序阿尔法狗(AlphaGo)的人机大战中,首战失利。今日二战,虽打出模仿棋和变招,无奈出现失误,仍然抵不过阿尔法狗2.0,投子认输,人类再次落败。

这个“输得没脾气”的耿直少年,说他遇到了“围棋上帝”

而一年多前,当韩国李世石九段败于阿尔法狗1.0时,他还曾在微博上肆意挥洒年少轻狂。谁知之后在逐渐认识阿尔法狗的过程中,他的语气从不屑到谦逊再到悲壮,俨然一出青春励志电影。

1

它赢不了我
  • 就算阿法狗战胜了李世石,但它赢不了我。

  • 来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来的猛烈点吧!

2

它颠覆了我们对围棋的认知
  • 人类数千年实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。

  • 它颠覆了我们对围棋的认知,所以说它的出现是我们的幸运。

  • 它非常了不起,每天可以自我学习几百万盘,这个数量是人的一生或者好几辈子都无法企及的一个高度。

3

人类只要拼搏过,输也没有遗憾
  • 我不会怕输给AlphaGo而被大家嘲讽,怕就输了一辈子的东西。

  • 跟机器人对抗失败是非常正常的事情,因为人就是一个血肉之躯会疲劳会疲惫,但是机器不会。

  • 我将尽全力争胜,一决胜负,抱有必胜的信念和必死的决心,不轻易言败。

  • 我觉得我们人类只要努力过了拼搏过了,就算输也没有什么遗憾的,因为机器早晚会战胜人类。




一年多的时间让柯洁认清了对手,却未必足够武装自己。

然而一年多后的阿尔法狗,早已不是当初那个依靠监督学习就能战胜李世石的初级对手了。阿尔法狗2.0采用了增强学习的策略,改进了原本自身的弱点Bug,大幅提升了对棋局的判断和理解,探索出更多新的打法招式,加之谷歌在人工智能底层架构TensorFlow的提升,也让阿尔法狗速度更快。


三番棋大战只剩最后一局,还能期待柯洁获胜吗?

然而,我们又为什么非得期待人类棋手获胜呢?


用“阿尔法狗之父”Deepmind创始人哈萨比斯的话说:”就像是天文学家利用哈勃望远镜观察宇宙一样,利用AlphaGo,围棋专家可以去探索他们的未知世界,探索围棋世界的奥秘。我们发明AlphaGo,并不是为了赢取围棋比赛,我们是想为测试我们自己的人工智能算法搭建一个有效的平台,我们的最终目的是把这些算法应用到真实的世界中,为社会所服务。 ”



关于围棋与人工智能之间的相爱相杀,问吧请来韩国明知大学围棋系特任教授孙远与大家聊聊。


我是孙远,上海外国语大学围棋高水平运动队主教练;韩国明知大学围棋系特任教授;上海交通大学管理科学与工程专业博士生;职业棋手、围棋国际级裁判。乌镇围棋峰会举世瞩目,既是棋界的盛会,亦将成为科技进步的里程碑。关于围棋与人工智能,围棋与素质教育,欢迎在这里和我交流。



1还能期待柯洁赢吗?


WavE:老师,可以简答点评一下可解的发挥吗?相对于上次于李世石的比赛,这次比赛能看出AlphaGo的那些进步,可以预见它的极限在哪呢?站在我们的角度,通过什么手段能增加对它的胜算呢?谢谢!


孙远:应该说柯洁首局的发挥是出色的,如起手三三布局以及黑7直接点三三,这些针对性的招法显然是有备而来,并且全盘也没有很明显的大失误。但AlphaGo对局面的阅读能力显然超过了人类棋手许多,比如白50、54,这两手的“无用之用”,赋予了围棋更深奥的内容。

个人认为在19路棋盘上,人类棋手很难再与AlphaGo进行抗衡,把它看成是棋手探究围棋真理的辅助工具即可。如果非得想着“报仇”,因为AlphaGo毕竟不是通用系统,如果我们将棋盘扩大成21路或23路,对人类的认知影响有限,但对电脑程序恐怕是颠覆性的修改。

开句玩笑,此仇可报。


无明:四分之一子是个多大的差距?这是否意味着两者实力不相伯仲,柯洁翻盘机会较大?


孙远:AlphaGo的目标是取胜的最大可能和最简化路径,而不是追求获胜目数的最大化。所以在官子阶段,当AlphaGo把确保胜利作为中心任务的时候,就会最简化局面(选择最稳健取胜路径而非最优路径)。1目半看似差距不大,但事实上是不可逾越的。


月半梢:还能期待柯洁赢么?


孙远:作为棋手,我们更期待的是AlphaGo能带来怎样的技术革新,至于胜负,人与机器之间的竞争本身并不是公平的。科技进步的目的是造福人类,正如哈萨比斯所言:“就像是天文学家利用哈勃望远镜观察宇宙一样,利用AlphaGo,围棋专家可以去探索他们的未知世界,探索围棋世界的奥秘。我们发明AlphaGo,并不是为了赢取围棋比赛,我们是想为测试我们自己的人工智能算法搭建一个有效的平台,我们的最终目的是把这些算法应用到真实的世界中,为社会所服务。”

阿尔法狗之父哈萨比斯


蓝白色拍no:柯洁原来说有绝招,可以一击制敌,您认为阿法狗存在这种命门么?


孙远:柯洁所说的绝招应是模仿棋,虽然个人认为对于整体算法已超越人类棋手的电脑不会奏效,但接下去的两盘棋,或许可以期待一下模仿棋的出现。


曾祥胤:按照目前了解到阿尔法狗的工作原理来推测,理论上人类是不是不可能战胜他?或者出现什么例外情况可以?如果按吴清源的起手下天元会出现什么情况?


孙远:您说的是吴清源与木谷实第一次正式比赛对局时执黑第一手下天元的模仿棋吗?虽然个人认为人工智能在整体算法上对人类棋手的超越,下模仿棋也是无效的。但柯洁曾透露过要用“秘密武器”对付电脑,或许在未来两局中可以期待一下是否有模仿棋的出现。


何万凌:请问围棋如何判胜负?如果一方时间用尽怎么办?毕竟AI下棋的速度明显快于人类。谢谢。


孙远:这次人机大战采用的是中国规则(黑先贴3又3/4子暨180.5归本计算,黑185以上胜,白177以上胜)。用时为:每方3小时,5次1分钟读秒,超时判负。


蓝白色拍no:请问这次的规则和上次李世石的那五番棋有什么不同?


孙远:两人人机大战的不同主要是在用时规则上,这次是每方3小时,5次1分钟读秒;上一次是每方2小时,5次1分钟读秒。一般认为,相比电脑的快速走子,更宽裕的时间设置会对人类棋手有利。




2阿尔法狗如何学习围棋?


徐霆Alphago究竟是如何学习围棋的?


孙远:我不是计算机领域的专家,只能根据之前公布的资料回答您的问题。

AlphaGo1.0(也就是人机大战VS李世乭的版本),是由走棋网络(Policy network)+快速走子(Fast rollout)+估值网络(Value network)+蒙特卡洛树搜索(MCTS)这几个部分组成。蒙特卡洛树搜索把上述三个部分连接起来,形成一个完整的系统。它通过学习3000万局人类棋谱,获得了突破性进展。而这次对柯洁的AlphaGo2.0,据说是完全摆脱高水平样本,从零开始自我学习的全新程序。但在DeepMind公布权威信息前,这样的推测还有待验证。


Zzzz:阿尔法狗的用电量现在是多大?


孙远:根据最新发布的消息,这次AlphaGo用的是单机版,结构和算法有了很大更新,现在计算量只需要原来的十分之一。因此并不需要耗费巨量的能源。


胖胖爱琪琪:老师您好,一直以来媒体都称AlphaGo为人工智能,但是我总感觉,它仅仅是一部高速运算,超大存储的超级电脑,确实是人工,但谈不上智能,智能应该是体现在创新创意上,您的观点,AlphaGo到底算不算智能,它距离自己产生创意创新距离有多远,毕竟棋类游戏还是可以靠代码来写好规则的,谢谢!


孙远:围棋的算法至今未能被穷尽。与之前的围棋系统相比,AlphaGo较少的依赖围棋领域知识,而是通过自我深度学习来达到棋力目标,这是突破性的进展。我想能够自我进行完善,是人工智能的标志之一吧。


  • Rationalism-Prophet:阿法狗的运算速度,处理能力与超级电脑差太远了。暴力破解不可能,必须依赖的是算法与深度学习。这就是人工智能,能够学习,能够自主的探索,feedback,再自我改进。


Joyes:人工智能会不会像科幻电影里描述的以后能控制整个人类?


孙远:这个问题的答案只能留给未来。




3围棋中蕴藏“神秘基因”


柠檬味雨点:请问教练,围棋怎么入门比较好呢?有什么比较系统的入门方法吗?


孙远:如果是小朋友学棋,我想可以先从培养兴趣开始(如有一部非常好的动画片《棋魂》),然后以7-9路小棋盘进行循序渐进的学习。当然,在启蒙阶段,建议报班学习,找到一位好的老师引导是关键。


风子:科普一下执黑3/4是啥意思?是用了总棋子数的3/4?


孙远:围棋竞赛中,为了平衡先行权利,现行中国规则为黑先贴3又3/4子(暨日本规则中的7目半)。1子=2目,3/4子暨1目半(设置半目的贴目规则就是为了避免和棋的出现)。


木子li硕儿:孙教练您好!看到您是韩国明知大学围棋系教授的介绍,对大学里设置围棋系的颇诧异。国内高校里似乎也仅仅是以大学生社团形式存在。请问在韩国在棋手的大学教育上是怎样的呢?您认为国内是否也有吸纳相应经验的必要呢?谢谢~


孙远:您好,因为今年在明知大学访学,所以临时有了这个身份。您的问题也是我之前一直在思考的,正好前段时间给《围棋天地》写过一篇稿,有些冗长,权当引玉之砖。

如果把“围棋学”作为学术研究的兴趣或与教育学,心理学,计算机科学等学科进行交叉研究,大家似乎乐见其成。但一说起要建立相关围棋专业,谁来做研究?研究什么?如何定位,学科归属等等,疑问恐怕还不少。

三年前的热播韩剧《未生》,描绘了韩国棋院院生出身的主人公“张克莱”定段失败后被迫转型,作为实习生在世界五百强贸易公司顽强生存下来的成长故事。由于长期只生活在围棋与胜负的有限世界里,缺乏有效的知识背景和与人接触的社交能力,张克莱刚进公司时甚至连复印机都不会使用。身处名牌大学高材生林立的激烈环境中,他又是如何坚持下来的呢?随着剧情的发展,张克莱用围棋经历中得到的“神秘基因”帮助他度过了各种难关。不过,普通的观众或许会质疑:这只是剧情设定而已吧,之前的人生只有围棋的人,真的能办得到吗?

如果有人问我这样的问题,基于曾经浸淫在胜负世界的经历,回答是肯定的。进入一个未知或陌生的领域,围棋技术可能没有了用处,但技术不是棋手拥有生存竞争力的全部,在职业围棋生涯的修行过程中,有一些“神秘基因”自然养成,比如专注力、抗压能力、品德等等。而这样的“神秘基因”又与围棋的内涵和功能息息相通。我所认识的优秀棋手中,虽然棋风不同性格迥异,但他们都有一个共同的强悍的特质,就是唯我的较真和坚韧,水平越高越明显。他们从小起,只要是认定的事就会坚持到底。

棋手转型的例子其实有不少,在我目前工作的韩国明知大学的教授中就能找到。郑寿铉教授是明知大学围棋系的创系教授之一,职业九段棋手的同时又拿到了高丽大学的教育学博士学位,这在围棋界是绝无仅有的,其《围棋学概论》、《围棋教育学》、《围棋高手经营论》等著作构成了明知大学围棋系的基础课程体系。南治亨教授也是职业棋手,硕士毕业于首尔大学英语语言文学专业(首尔大学社会学专业博士在读),精通多国语言,十年前用英语编写的《围棋术语辞典》在欧美围棋普及市场影响广泛。并且笔锋犀利,在她认为行业失范时,会果敢发出质疑的声音。这两位教授都曾是作为国家代表的职业棋手,中途转向学业,取得成功后又肩负起责任,教书育人,为行业培养和输送人才。

心中一直住着一个“围棋学科”梦,明知大学围棋系已经存在了20年,而中国呢?在围棋赛事活动愈益喧嚣的当前,是不是该回答——除了提供小众群体的“精彩胜负”和利益驱动式的少儿培训之外,围棋还能为社会提供什么?

我想,围棋中蕴藏的“神秘基因”,是围棋对于社会的贡献所在,而探明这些“神秘基因”的序列,正是进行围棋学术研究的原动力所在吧。




在围棋面前,阿尔法狗已经被

代表人类现阶段最高水平的柯洁认可为“上帝”了。

那么,我们能在什么领域中挣回面子呢?

你说,打麻将行不行?







澎湃问吧

澎湃新闻问答社区

id:pengpaiwenba








欢迎戳阅读原文↓↓来澎湃问吧提问!