柯洁惜败，人机大战AlphaGo先胜一局 | 现场报道

环球科学 · 公众号 · 科学 · 2017-05-23 14:55

正文

《环球科学》首席记者刘洋

尽管从传播的角度看，AlphaGo与柯洁的对战不如前者与李世石的激战那么具有传播性；但从难度上看，与柯洁的对战才是检验人工智能成色的最好标准。所以，柯洁和AlphaGo5月23日在乌镇的对弈，仍然吸引到了全球围棋界的一干名将和多位公司高层。

作为一个20岁的棋手，柯洁已经4次赢得世界冠军。与同年龄段的他相比，曾经的世界名将——曹薰铉、李世石、古力、聂卫平都没有任何优势，尽管他们的整个职业生涯都非常成功。柯洁最后的惜败，也让人们意识到人类最后的堡垒已经被攻破。

柯洁也从不掩饰自己对围棋技艺的自信，这和一贯强调中正平和的传统中国棋手形成了鲜明的对比。在和日本围棋第一人井山裕太对战前，柯洁针对后者要借中日对抗让日本围棋转运的说法回敬到“我要让他血溅五步”；在和韩国围棋第一人李世石交手前，柯洁又针对后者自认有五成胜算的说法告诉记者“如果一共是一百成的话，他确实有五成胜算”；在告诉李世石“传奇应该谢幕”之后，他又说“我的传奇在我的呼吸停止之前，永不停止”。

惟一让他辗转的对手就是AlphaGo。2017年新年前半小时，柯洁在微博发文称：“昨夜辗转反侧，不想竟一夜难眠，人类数千年的实战演练进化，计算机却告诉我们人类全是错的。我觉得，甚至没有一个人沾到围棋真理的边。但我想说，从现在开始，我们棋手将会结合计算机，迈进全新的领域达到全新的境界。新的风暴即将来袭，我将尽我所有的智慧终极一战！”

终极一战开始前，人工智能已经在其他领域取得成绩。例如，在将DeepMind开发的算法应用在数据中心的制冷系统之后，其公司的数据中心制冷耗电量就降低了40%；此外，DeepMind还和伦敦医院合作，通过调用视网膜扫描数据寻找退行性疾病的早期症状，并开始利用人工智能技术探索蛋白质折叠领域的前沿知识，这在以前都是最高深的科研领域。

终极一战将进行三场，每场都采用中国围棋规则，黑棋让三又四分之三子，对战双方各有三小时和五次一分钟的读秒。但对AlphaGo来说，时间是一个没价值的概念，它不疲劳、不困顿也不迷惘，只是按照每40秒一步棋的速度完成工作。相比之下，柯洁每步棋的耗时大约为两分钟。再棋局开始不到一个小时，柯洁还去了两次洗手间，这也耗费了几分钟。

比赛开始仅仅几分钟后，柯洁就开始玩扇子、皱眉毛和抓头发。现场解说、中国围棋协会的秘书长华以刚说：“抓头发是柯洁的标志性动作，不论比赛顺利还是不顺，他都愿意抓头发。”结果，差不多两个小时过后，随着长考的次数越来越多，时间越来越长，柯洁本来梳理得很顺的头发竟然已经有点凌乱了。

但问题是，人类的进化相比于计算能力的提升和算法的完善而言太慢了，柯洁还是很难在变化的棋局中迅速找到漏洞，他不断尝试希望可以赢得这个挑战。他很享受这种对战的难度，但似乎没办法享受其中。对战开始之前，他在微博上告诉人们：无论胜败，这都是他和人工智能的最后三局棋。如无意外，这也许也将是人类和人工智能的最后三局。

延伸阅读：AlphaGo是怎样战胜人类世界冠军的

一直以来，围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间，更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

为了应对围棋的巨大复杂性，AlphaGo 采用了一种新颖的机器学习技术，结合了监督学习和强化学习的优势。通过训练形成一个策略网络（policy network），将棋盘上的局势作为输入信息，并对所有可行的落子位置生成一个概率分布。然后，训练出一个价值网络（value network）对自我对弈进行预测，以 -1（对手的绝对胜利）到1（AlphaGo的绝对胜利）的标准，预测所有可行落子位置的结果。这两个网络自身都十分强大，而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索（MCTS）中，实现了它真正的优势。最后，新版的AlphaGo 产生大量自我对弈棋局，为下一代版本提供了训练数据，此过程循环往复。

在获取棋局信息后，AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性，进而决定最佳落子位置。在分配的搜索时间结束时，模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后，AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

更多阅读

超大质量黑洞如何吞噬恒星？

他是“深度学习教父”，造就了今天的AI风口

一场数学革命将在量子物理领域爆发

Facebook智能围棋负责人解读：

AlphaGo为何能赢李世石

《环球科学》总编专栏：2016，AI春暖花开

转载请联系 [email protected]

2017年美国NASA夏令营招募即将截止，点击了解详情。

《环球科学》启动“科学小记者“计划，为孩子提供5类培训、5大作品发表平台，点击了解详情。

点击文末阅读原文购买《天文专刊·修订版》等精彩期刊。