专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

独家专访“AlphaGo之手”黄士杰：机器是没有感情的，而我会微笑 : )

DeepTech深科技 · 公众号 · 科技媒体 · 2017-06-07 22:15

正文

早在上世纪 60 年代，就已经有人开始对围棋的计算机程序进行研究。当时还在威斯康辛大学麦迪逊分校读计算机博士的 Albert Zobrist 引入了 影响函数（influential function） ，为棋盘的每个空位计算数值，从而划分黑白领域并为每个子的影响力打分。

图丨 w：白子影响函数；b：黑子影响函数；m：相互影响函数

1972 年，密歇根大学的 Walter Reitman 和 Bruce Wilcox 开始把人工智能研究应用于围棋。

从上世纪 80 年代末起，中国科学家也在相关领域做过一些工作，其中影响力最大的是 陈志行和他的围棋程序“手谈”。 从 1994 年到 1997 年，“手谈”在两个重要的国际计算机围棋比赛应氏杯和 FOST 杯中共获得了六个冠军。

进入 21 世纪后， 机器学习技术和蒙特卡罗树搜索 等方法开始被大量引入围棋程序中，也让围棋人工智能出现了飞跃。

2004 年，法国的 B Bouzy 和 B Helmstetter 发表论文，在评估某个行棋位置的时候，他们让自己的蒙特卡罗围棋程序随机选取一些点，并以此为基础完成一定数量的棋局，从而计算某个点引发的棋局最终结果的平均分数。

图丨蒙特卡罗树搜索

在此基础上，法国计算机科学家 Rémi Coulom 开发出了 围棋程序 Crazy Stone。 2008 年，Crazy Stone 在被让 8 子的情况下战胜了职业棋手青叶熏四段—— 这是计算机首次在让 9 子之内战胜职业棋手。

在那时，Rémi Coulom 也曾经指导了一名台湾师范大学的博士生，他叫做黄士杰。他从小学习围棋，属于围棋业余六段选手，还曾在台湾师大读书期间创办过围棋社，并获得大专杯围棋赛冠军。

图丨黄士杰的博士论文

在读硕士期间，黄士杰就将围棋定为他的研究课题。 为了写程序，黄士杰有时在实验室一待就是十几个小时。他甚至还为了延续自己的研发成果而推迟两年毕业，最终，功夫不负苦心人，他设计的程序不仅获得了 19 路电脑围棋金牌，更是击败了当时最强的围棋程序 Zen。

在当时，这名计算机专业博士提出了一些新的蒙特卡罗树搜索的启发式算法，包括应用了 模拟平衡算法（Simulation Balancing）和时间控制方法 ，极大地提升了程序的棋力。黄士杰用自己妻子的英文名 ERICA 给程序命名。

不过，这些程序都没有达到职业水准。 性能最好的 Crazy Stone 和 Zen 也只达到了业余 5 段的水平。 在那个时候，围棋界一般认为，计算机战胜职业围棋选手的那天还远远没有到来。

图丨围棋程序Crazy Stone

2012 年，在加拿大阿尔伯塔大学做了一年博士后研究员后， 黄士杰加入了英国的人工智能创业公司 DeepMind。 当时 DeepMind 创建刚刚两年，创始人是Demis Hassabis，Shane Legg 和 Mustafa Suleyman，早期投资人包括 Elon Musk、Peter Thiel 的 Founders Fund、以及李嘉诚的 Horizons Ventures。

2014 年 1 月，谷歌以 5 亿美元的价格收购 DeepMind，那时的 DeepMind 尚未发布任何一个产品，只有一篇还没有发表的论文。 当时，黄士杰名列公司内两位首席工程师之一。

DeepMind 早期希望通过机器学习和系统神经生物学理解智能。2014 年 10 月，公司发布了一款原型产品，可以让计算机模拟人类大脑的短期记忆功能。

图丨 Demis Hassabis、David Silver和黄士杰

2014 年，DeepMind 组建了 AlphaGo 项目，用来检测使用了深度学习的神经网络能否应用于围棋。公司的科学家通过增强学习让 AlphaGo 自己下了数千盘棋，矫正模型。

随后，AlphaGo 又与 Crazy Stone、Zen 等围棋程序下了 495 盘棋，只输了 1 盘。为了增加难度，AlphaGo 又与 Crazy Stone，Zen 和 Pachi 下了让四子棋，胜率分别为 77%、86%和99%。

2015 年 10 月，AlphaGo 随后以 5：0 的比分完胜欧洲冠军樊麾二段， 这是计算机程序第一次在正式比赛中战胜人类职业选手。

图丨AlphaGo完胜樊麾二段

2016 年 3 月，AlphaGo 在普遍不被看好的情况下以 4：1 的比分战胜了 18 次世界冠军李世石九段。这标志着计算机已经足以战胜顶尖的人类围棋选手，象征意义可以媲美 19 年前“深蓝”战胜国际象棋大师卡斯帕罗夫。 赛后，韩国棋院授予 AlphaGo 名誉九段证书，《科学》杂志将之评为 2016 年十大突破之一。

在 2016 年 2 月， DeepMind 在《自然》杂志上发表了一篇文章，介绍了自己的研究方法。他们在论文中表示，研究团队使用监督学习的方法研究人类专家的棋局，同时也使用增强学习的技术让 AlphaGo 自己和自己下棋。

5 月 23 日，中国·乌镇围棋峰会的人机围棋大战打响。最终，AlphaGo 三胜柯洁，也毫无悬念地战胜了 5 位世界冠军组成的联队。赛后，AlphaGo 获得了中国棋院颁发的九段证书。至此，在围棋领域，人机对战的胜负不再有悬念。

独家专访“AlphaGo之手”黄士杰：机器是没有感情的，而我会微笑 : )

正文

请到「今天看啥」查看全文