专栏名称: 环球科学
《科学美国人》独家授权中文版—《环球科学》杂志—www.huanqiukexue.com
目录
相关文章推荐
科普中国  ·  维 C 含量是橙子的 6 ... ·  2 天前  
宇宙解码  ·  如果我们吃下干冰,身体会发生什么变化? ·  3 天前  
地刊速览  ·  Science综述:地球科学中的大数据——新 ... ·  4 天前  
51好读  ›  专栏  ›  环球科学

柯洁惜败,人机大战AlphaGo先胜一局 | 现场报道

环球科学  · 公众号  · 科学  · 2017-05-23 14:55

正文

《环球科学》首席记者 刘洋


尽管从传播的角度看,AlphaGo与柯洁的对战不如前者与李世石的激战那么具有传播性;但从难度上看,与柯洁的对战才是检验人工智能成色的最好标准。所以,柯洁和AlphaGo5月23日在乌镇的对弈,仍然吸引到了全球围棋界的一干名将和多位公司高层。


作为一个20岁的棋手,柯洁已经4次赢得世界冠军。与同年龄段的他相比,曾经的世界名将——曹薰铉、李世石、古力、聂卫平都没有任何优势,尽管他们的整个职业生涯都非常成功。柯洁最后的惜败,也让人们意识到人类最后的堡垒已经被攻破。


柯洁也从不掩饰自己对围棋技艺的自信,这和一贯强调中正平和的传统中国棋手形成了鲜明的对比。在和日本围棋第一人井山裕太对战前,柯洁针对后者要借中日对抗让日本围棋转运的说法回敬到“我要让他血溅五步”;在和韩国围棋第一人李世石交手前,柯洁又针对后者自认有五成胜算的说法告诉记者“如果一共是一百成的话,他确实有五成胜算”;在告诉李世石“传奇应该谢幕”之后,他又说“我的传奇在我的呼吸停止之前,永不停止”。


惟一让他辗转的对手就是AlphaGo。2017年新年前半小时,柯洁在微博发文称:“昨夜辗转反侧,不想竟一夜难眠,人类数千年的实战演练进化,计算机却告诉我们人类全是错的。我觉得,甚至没有一个人沾到围棋真理的边。但我想说,从现在开始,我们棋手将会结合计算机,迈进全新的领域达到全新的境界。新的风暴即将来袭,我将尽我所有的智慧终极一战!”


终极一战开始前,人工智能已经在其他领域取得成绩。例如,在将DeepMind开发的算法应用在数据中心的制冷系统之后,其公司的数据中心制冷耗电量就降低了40%;此外,DeepMind还和伦敦医院合作,通过调用视网膜扫描数据寻找退行性疾病的早期症状,并开始利用人工智能技术探索蛋白质折叠领域的前沿知识,这在以前都是最高深的科研领域。


终极一战将进行三场,每场都采用中国围棋规则,黑棋让三又四分之三子,对战双方各有三小时和五次一分钟的读秒。但对AlphaGo来说,时间是一个没价值的概念,它不疲劳、不困顿也不迷惘,只是按照每40秒一步棋的速度完成工作。相比之下,柯洁每步棋的耗时大约为两分钟。再棋局开始不到一个小时,柯洁还去了两次洗手间,这也耗费了几分钟。


比赛开始仅仅几分钟后,柯洁就开始玩扇子、皱眉毛和抓头发。现场解说、中国围棋协会的秘书长华以刚说:“抓头发是柯洁的标志性动作,不论比赛顺利还是不顺,他都愿意抓头发。”结果,差不多两个小时过后,随着长考的次数越来越多,时间越来越长,柯洁本来梳理得很顺的头发竟然已经有点凌乱了。


但问题是,人类的进化相比于计算能力的提升和算法的完善而言太慢了,柯洁还是很难在变化的棋局中迅速找到漏洞,他不断尝试希望可以赢得这个挑战。他很享受这种对战的难度,但似乎没办法享受其中。对战开始之前,他在微博上告诉人们:无论胜败,这都是他和人工智能的最后三局棋。如无意外,这也许也将是人类和人工智能的最后三局。





延伸阅读:AlphaGo是怎样战胜人类世界冠军的


一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。


为了应对围棋的巨大复杂性,AlphaGo 采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。



在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。


更多阅读


超大质量黑洞如何吞噬恒星?

他是“深度学习教父”,造就了今天的AI风口

一场数学革命将在量子物理领域爆发


Facebook智能围棋负责人解读:

AlphaGo为何能赢李世石

《环球科学》总编专栏:2016,AI春暖花开


转载请联系 [email protected]



2017年美国NASA夏令营招募即将截止,点击了解详情


《环球科学》启动“科学小记者“计划,为孩子提供5类培训、5大作品发表平台,点击了解详情


点击文末阅读原文购买《天文专刊·修订版》等精彩期刊。