首先我们回顾一下过去20多年的著名人机大战项目具体情况:
可以看到,过去20年人工智能所攻克的棋牌类游戏,基本属于“动态双人非合作的零和博弈”,而且基本没有时间因素的影响,目前人工智能仍然难以解决下面几个挑战:
1.面对多人合作博弈,策略空间和收益函数都难以确定。
2.面对非零和博弈,强化学习所依赖的回报函数难以确定。
3.面对开放的领域空间,时间维度因素对强化学习的影响难以确定。
其实今年初的德州扑克人机比赛也是一对一不限注,面对多人合作博弈此前人机比赛基本没有尝试。而我们再看看下周乌镇巅峰对决赛程的赛程:
5月23日 柯洁 VS AlphaGo
5月25日 柯洁 VS AlphaGo
5月26日 古力+AlphaGo VS 连笑+AlphaGo
5月26日 时越+陈耀烨+芈昱廷+唐韦星+周睿羊(相谈棋)VS AlphaGo
5月27日 柯洁 VS AlphaGo
除去柯洁的比赛之外,我们首次看到了人机多人合作博弈的比赛:一是棋手与AlphaGo相互合作进行对战,另一场是多人合作与AlphaGo对战。相信这两场比赛才是谷歌再次举办此次AlphaGo人机大战的最重要的原因之一。而如果人工智能在多人合作博弈能够取得突破,对于取得更广泛领域应用将具有非常重要的意义。
另一方面,这次比赛值得关注的还有柯洁的"秘密武器”。柯洁曾在其微博上透露对战某围棋AI时,使用了非常规手段取得了胜利,业界普遍预测是"模仿棋”。柯杰也透露在上一次与“Master”的对弈中,他就曾经猜测对手是AlphaGo,当时就想准备用模仿棋的套路,试一下对人工智能管不管用,最后因为住院最后一战没上场,不过猜测谷歌应该早就有了测试。AlphaGo在面对柯洁针对性的招数时,是否会有意外的表现,值得期待。
无论比赛结果如何,结果都是人类的胜利。人工智能将把我们带入一个新的发展纪元。就像中国棋手柯洁在与Master对弈后说:“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个沾到围棋真理的边。从现在开始,我们棋手将结合计算机,迈向全新的领域达到全新的境界。”