王路：阿尔法狗，阿尔法元，阿尔法人

王路在隐身 · 公众号 · 热门自媒体 · 2017-10-20 12:47

正文

昨天看了AlphaGo Zero（阿尔法元）的新闻，有很多感想。这些感想中，绝大多数，和大家差不多，就不再重复了。制造冗余信息，是一种罪过。所以，只聊聊剩下的。

1、

阿尔法元是靠跟自己下棋成长起来的。人类也是。阿尔法元达到目前人类的棋力，只花了3天时间，大约70小时，下了490万局。很多人说，阿尔法元3天，超过了人类3000年。我想补充一种视角。整个人类历史上，下过的所有围棋局数，也就是数百万的量级。如果针对个体看，比如柯洁，他看过的所有盘数，不会超过10万局，目前人类的顶级棋手，一生最多看过的局数都没有超过10万。相当于阿尔法元的五十分之一不到。从这个意义上讲，人类的学习能力，不能说是很弱的。

整个20世纪，人类棋力进步的幅度超过了此前两千年。但这么比没有意义。之前的人类围棋，缺乏交流传授的机制。很多前人走过的路，后人要从头再走一遍。这就好比，把阿尔法元放到70台机器上，每台跑1小时，和放在1台机器上跑70个小时，是没法比的。

阿尔法元达到人类顶级水平，用了70个小时。如果我们把它比喻成一个人，70个小时看作70年。会发现，这样的进步方式，在人类社会，是行不通的。——你按照这种成长路径，可以在70岁时，成为人类顶级高手。但你在50岁以前，始终要人被虐，以至于根本不能进入围棋圈子。

阿尔法元幸运在哪里呢？它被允许在50岁以前很笨。——纵然很笨，它仍然可以坚持既定路线，按照自己的方式去成长。如果是一个人，你在30岁，还比不上同龄人，你就被社会淘汰了。社会不会等你到70岁。所以人类学棋，从小就要背棋谱、学定式。你要先拿到门票，才能走上这条路。你要先向时代妥协，等本事大了，再试图挣脱时代束缚，去克服时代的局限性。想上来就克服时代的局限性，就会先被时代克服掉。而一旦你先向时代妥协，就势必染上时代气息，后来再想克服时代的局限性，就很难了。——时代的局限性，已经成了你的局限性。不过，你可以生个儿子，克服你所在时代的局限性。

这就是为什么阿尔法狗要花几千万局战斗经验，才达到人类水平，阿尔法元只花了几百万局。其实，有很多围棋软件，在最初设计时就考虑过完全不用人类棋谱，结果根本不行，上来就被人类打的稀里哗啦。阿尔法元为什么可以？因为阿尔法元是从阿尔法狗来的，它虽然是一张白纸，但白纸的质地上，带着阿尔法狗的基因。这就好比，阿尔法狗先向人类学习，拿到门票，又生个儿子阿尔法元，克服了人类的局限性。

2、

阿尔法元很幸运：在他能够打败对手之前，始终是靠自己跟自己下棋来成长的。这就避免了，一些很好的苗头被扼杀在摇篮中。最开始，它是不会征子的，它可能过了十个小时以上，才慢慢学会征子和点三三。如果人类棋手，学棋十年才会征子和点三三，老师早就让他改行了。但阿尔法元并不因此吃亏。因为他的对手和他一样，也是慢慢学会征子、点三三的。如果一开始对手就是人类或者阿尔法狗，就会因此被痛虐。为了应付人类，它就会放弃一些可能发展很好的下法，被人类带着走，受到人类下棋模式的染污。

这就好比，一个创业公司，哪怕别的方面很强，很先进，就因为融资能力不行，就要被淘汰。它没有办法活下来。因为活不下来，那些先进的地方，也会随着它的死掉而死掉。

再比如，一个孩子很有物理天赋，完全有潜力成为一流的物理学家。前提是，他要进入好的大学。但是，他的英语不好。因为英语不好，他连一本都考不上。假如他的竞争者英语和他一样差，他就可以靠物理的优势，进入好的大学，成为物理学家。他最终没有成为物理学家，并不是因为他的物理不行，而是因为英语差，拖了后腿。

这个世界上，很多人不能充分发挥天赋，是因为不能像阿尔法元那样，始终成长在自己和自己竞争的环境里。人类社会，面临的是和别人竞争。你为了成为物理学家，要把很多精力花在补英语上。很多时候，我们要首先关注自己的短板，而不是发挥自己的长项。从短期看，和他人竞争会让自己在一开始时少吃亏；但从长期看，它会制约成长速度。

现在很多基础学科，人才流失很严重。如果一个人智商很高，十分适合去研究基础数学、物理。但是他会转行搞金融、计算机。因为来钱更快。我们活在世界上，要和别人竞争。如果搞基础研究，能拿到热门领域待遇的话，整个世界的科学进步会更快。这就是为什么，阿尔法元进步比阿尔法狗快。

有人讲，阿尔法元的例子，是不是说明，我们以后做研究就不用写文献综述了？阿尔法元表明，可以在一个新领域内从一张白纸出发，做到顶级水平。

但是，这有个前提，就是你要活得足够久。比如说，你从零开始研究物理，起步是阿基米德时代普通人的物理水平，不受人类历史上一切物理学家的影响，独立研究。你完全有可能在第1000年或者2000年的时候，研究出来超过人类现在水平的成果。但问题是，你在活到100岁之前就死了。阿尔法元成功的前提是，战斗经验超过这世界上任何人类50倍以上。它在10万局经验内和人类对弈，是要被吊打的。如果你可以保证你的寿命是一般人的50倍，你可以不写文献综述，不基于别人的任何研究。

还可以延伸到其他事上，比如婚姻。“门当户对”很重要，或者说：旗鼓相当。这样，彼此能够共同成长，谁也不嫌谁幼稚。如果出发时两人就认知相差太远，有依附与控制的关系，对谁的长远发展都不会太好。

4、

再说定式。实际上，没有什么定式。在阿尔法元70小时经验里，没有任何定式是一开始就有的。一切定式（我们把对局中出现概率大于某个数值的下法组合叫定式），都是到了某些时间节点才出现的，慢慢达到峰值，又渐渐下降，在某个时间节点后，渐渐消失。

这和人类定式发展的过程差不多。100年前的定式，现在有很多淘汰了，有些还保留着。保留至今的，也不代表一定成立，只是寿命比那些淘汰掉的更长一点。如果某个定式寿命超出了一代人，从你学棋的时候，就知道它是定式，等你死的时候，它还是定式。你就可能认为这个定式是天经地义的。实际上，可能再过两年，它就不成立了。

所谓定式，只是当对方棋力在某一水平区间内时，你按照这个套路下，不容易吃亏。一旦对方棋力突破了那个区间，旧有的定式就废掉了。我们看古代让子棋的很多下法，现在是不成立的。这种不成立，是在现在的人类棋力下不成立。古人当时那么下，考虑到对手的水平，用这个套路欺负他，是没毛病的。

我想从定式聊聊佛教。佛教有八万四千法门，可以看成八万四千定式。每一种定式，都有它适合的契机和土壤。过去的人可以靠某个法门成佛证果，现在的人就不一定行。因为任何定式，都有它适用的条件和环境。如果有永恒的定式，佛陀只需要说一个法门就够了，没有必要开演八万四千法门。

有些声闻乘修行者，不承认大乘佛教，认为大乘不是佛说的。这就好比，阿尔法元在前30小时里没有出现的定式，就认为它不成立。佛教有个词叫“圣言量”，释迦牟尼佛说过的，就叫圣言量。实际上，不止释迦牟尼佛说过的才叫圣言量。其他人只要证到圣果，说的话，也是可以作为依据的。阿罗汉、八地菩萨也是圣者，他们的话，也是可以作为依据的。如果认为，只有释迦牟尼的话才叫圣言量，才是唯一的依据，就否认了其他众生也可以修行成佛，否认了过去未来十方诸佛的存在。

释迦牟尼佛有些东西没明讲，是因为他在娑婆世界只示现了80年世寿。但不能仅仅通过80年的有限示现，去理解他全部的智慧。就好比阿尔法元在第40个小时中，不会下出一切定式，很多定式是后来才出现的。《解深密经》说：阿陀那识甚深细，我于凡愚不开演。为什么不开演？因为当对手在这个水平的时候，很多别的定式是不需要的。到现在，南传佛教不承认中有身，不承认第八识。理由是没见释迦牟尼佛明讲过那些定式。不过，虽然不承认中有身、第八识，但也承认“有分心”，靠“有分心”建立起三世流转。这“有分心”，与潜在相续的“细心”、“第八识”等，只不过是定式的不同变化，是并没有什么矛盾的。

再比如，念佛法门。如果去考察梵文，会发现“念佛”的“念”，本义是用心系念，不是口念称名。有些人就讲，中国传下来的净土法门搞错了，错会了经文意思。这就是不了解，法无定法，“定式”是不断变化的。过去合用的定式，后来可能就不好用了。最早的时候，念佛是要观想佛像的，这是此前流行很久，在印度就流行的定式。到了后来，不好用了，照这个定式修，能成就的人越来越少。为什么？因缘变化了。

“法”有不同的时代：正法时代、像法时代、末法时代。正法时代的定式，到像法时代就不好用了，像法时代的定式，到末法时代也不好用了。据此，道绰法师强调了新的念佛法门，到了善导大师，发扬光大。佛教不是像考古学，过去有的东西，就是成立的，没有的，就不成立。更像是科学，后起的研究，承续了前人，在表现上有所不同，只要内在精神一致，就是应当信受的。而表现形式不同，正是内在精神一致的必然要求。

今天，汉传佛教的修行者，一般都说现在是末法时代。但南传佛教不这么认为，上座部认为现在是正法时代。这并不矛盾。上座部到现在还流行着传统而古老的法门。这就好比，针对不同的对手，应该下不同的“定式”。所谓定式，并非一成不变，永恒有效。

5、

阿尔法元在官子方面，和人类下法相差不大。这没有任何疑问。因为官子是一种有固定解的题目。既然有固定解，谁下都差别不大。但阿尔法元在布局方面，和人类相似，可能说明两点：1、阿尔法元的布局还没有达到最高阶段。2、人类很聪明，在没有达到阿尔法元棋力的时候，就可以下出和阿尔法元接近的布局了。

如果在人类内部，比方假定，中日韩的围棋，不能进行任何交流，各自封闭发展一段时间，棋力应该会出现明显的高下之分。但这并不意味着，彼此下棋天赋有差距，而意味着其他变量的差别。一旦放开交流机制，彼此棋力就会渐渐趋同。因为，人和人在构造上，差别是很小的。而人类和人工智能，棋力不可能趋同，因为彼此的构造不一样。

不过，由人类研发的不同人工智能，未来有一天，会达到同样的棋力水平，那个时候，就接近了围棋的终点。也就是说，人类是可以穷尽围棋的。人类穷尽围棋，并不能靠自己死下，而是要借助人工智能。当围棋被穷尽的时候，也不是人工智能穷尽了围棋，而是人类穷尽了围棋。

阿尔法元虽然目前棋力已经高出人类很多，但并不是围棋的终点。什么时候会是围棋的终点呢？可以从两方面看，一方面，棋力最高的人工智能自己跟自己下，胜负完全取决于执白执黑，就接近围棋的终点了。

另一方面，不同的围棋软件，给定某个局面，会下出非常接近、甚至一样的下法——不是说某一手的下法，而是说随后到终局的序贯下法，那就接近围棋的终点了。为什么说“接近”呢？因为，能不能给出一致的下法，主要取决于给定局面进展到什么程度。越接近收官，越容易趋同；在布局阶段就下得一样，是不太容易的。假如说现在的顶级围棋AI，平均在100手的时候，能够给出一致的判断，未来会慢慢变成50手，甚至20手，10手。如果在给定任意10手的情况下，不同的围棋AI，能给出完全一致的胜负判断。就是说，下十手，棋就结束了，胜负已定。我们可以说，穷尽了围棋。

6、

现在很多文科博士不好毕业。很多文科博士很累，并不是因为需要你有多聪明，而是需要你看很多文献。这样的工作，是可以被人工智能取代的。有了数据库，我们做学术和古人做学术就很不一样了。清朝的乾嘉学派做了很多考据工作，那些工作如果交给AI做，很快就完成了。那些人如果生在今天，就会不幸一些，他们博闻强识的长处，没有办法发挥得淋漓尽致。我们照着过去的路子做学术，很多时候就不再能走得通。很多人想，过去的大师有什么禀赋，如果我也有，就可以达到跟他一样的高度，这是不会的。禀赋要跟时代结合起来才有意义。吴承学老师写了一篇《微信上的万里校书记》，放在过去，是不可以想象的。过去谁做了这样的工作，非常不容易。今天，完全有可能一个文科博士，花了七八年时间做好一篇博士论文，在他快写成的时候，人工智能介入，半个小时完成了同样的工作。

王路：阿尔法狗，阿尔法元，阿尔法人

正文

请到「今天看啥」查看全文