昨天看了AlphaGo Zero(阿尔法元)的新闻,有很多感想。这些感想中,绝大多数,和大家差不多,就不再重复了。制造冗余信息,是一种罪过。所以,只聊聊剩下的。
1、
阿尔法元是靠跟自己下棋成长起来的。人类也是。阿尔法元达到目前人类的棋力,只花了3天时间,大约70小时,下了490万局。很多人说,阿尔法元3天,超过了人类3000年。我想补充一种视角。整个人类历史上,下过的所有围棋局数,也就是数百万的量级。如果针对个体看,比如柯洁,他看过的所有盘数,不会超过10万局,目前人类的顶级棋手,一生最多看过的局数都没有超过10万。相当于阿尔法元的五十分之一不到。从这个意义上讲,人类的学习能力,不能说是很弱的。
整个20世纪,人类棋力进步的幅度超过了此前两千年。但这么比没有意义。之前的人类围棋,缺乏交流传授的机制。很多前人走过的路,后人要从头再走一遍。这就好比,把阿尔法元放到70台机器上,每台跑1小时,和放在1台机器上跑70个小时,是没法比的。
阿尔法元达到人类顶级水平,用了70个小时。如果我们把它比喻成一个人,70个小时看作70年。会发现,这样的进步方式,在人类社会,是行不通的。——你按照这种成长路径,可以在70岁时,成为人类顶级高手。但你在50岁以前,始终要人被虐,以至于根本不能进入围棋圈子。
阿尔法元幸运在哪里呢?它被允许在50岁以前很笨。——纵然很笨,它仍然可以坚持既定路线,按照自己的方式去成长。如果是一个人,你在30岁,还比不上同龄人,你就被社会淘汰了。社会不会等你到70岁。所以人类学棋,从小就要背棋谱、学定式。你要先拿到门票,才能走上这条路。你要先向时代妥协,等本事大了,再试图挣脱时代束缚,去克服时代的局限性。想上来就克服时代的局限性,就会先被时代克服掉。而一旦你先向时代妥协,就势必染上时代气息,后来再想克服时代的局限性,就很难了。——时代的局限性,已经成了你的局限性。不过,你可以生个儿子,克服你所在时代的局限性。
这就是为什么阿尔法狗要花几千万局战斗经验,才达到人类水平,阿尔法元只花了几百万局。其实,有很多围棋软件,在最初设计时就考虑过完全不用人类棋谱,结果根本不行,上来就被人类打的稀里哗啦。阿尔法元为什么可以?因为阿尔法元是从阿尔法狗来的,它虽然是一张白纸,但白纸的质地上,带着阿尔法狗的基因。这就好比,阿尔法狗先向人类学习,拿到门票,又生个儿子阿尔法元,克服了人类的局限性。
2、
阿尔法元很幸运:在他能够打败对手之前,始终是靠自己跟自己下棋来成长的。这就避免了,一些很好的苗头被扼杀在摇篮中。最开始,它是不会征子的,它可能过了十个小时以上,才慢慢学会征子和点三三。如果人类棋手,学棋十年才会征子和点三三,老师早就让他改行了。但阿尔法元并不因此吃亏。因为他的对手和他一样,也是慢慢学会征子、点三三的。如果一开始对手就是人类或者阿尔法狗,就会因此被痛虐。为了应付人类,它就会放弃一些可能发展很好的下法,被人类带着走,受到人类下棋模式的染污。
这就好比,一个创业公司,哪怕别的方面很强,很先进,就因为融资能力不行,就要被淘汰。它没有办法活下来。因为活不下来,那些先进的地方,也会随着它的死掉而死掉。
再比如,一个孩子很有物理天赋,完全有潜力成为一流的物理学家。前提是,他要进入好的大学。但是,他的英语不好。因为英语不好,他连一本都考不上。假如他的竞争者英语和他一样差,他就可以靠物理的优势,进入好的大学,成为物理学家。他最终没有成为物理学家,并不是因为他的物理不行,而是因为英语差,拖了后腿。
这个世界上,很多人不能充分发挥天赋,是因为不能像阿尔法元那样,始终成长在自己和自己竞争的环境里。人类社会,面临的是和别人竞争。你为了成为物理学家,要把很多精力花在补英语上。很多时候,我们要首先关注自己的短板,而不是发挥自己的长项。从短期看,和他人竞争会让自己在一开始时少吃亏;但从长期看,它会制约成长速度。
现在很多基础学科,人才流失很严重。如果一个人智商很高,十分适合去研究基础数学、物理。但是他会转行搞金融、计算机。因为来钱更快。我们活在世界上,要和别人竞争。如果搞基础研究,能拿到热门领域待遇的话,整个世界的科学进步会更快。这就是为什么,阿尔法元进步比阿尔法狗快。
有人讲,阿尔法元的例子,是不是说明,我们以后做研究就不用写文献综述了?阿尔法元表明,可以在一个新领域内从一张白纸出发,做到顶级水平。
但是,这有个前提,就是你要活得足够久。比如说,你从零开始研究物理,起步是阿基米德时代普通人的物理水平,不受人类历史上一切物理学家的影响,独立研究。你完全有可能在第1000年或者2000年的时候,研究出来超过人类现在水平的成果。但问题是,你在活到100岁之前就死了。阿尔法元成功的前提是,战斗经验超过这世界上任何人类50倍以上。它在10万局经验内和人类对弈,是要被吊打的。如果你可以保证你的寿命是一般人的50倍,你可以不写文献综述,不基于别人的任何研究。
还可以延伸到其他事上,比如婚姻。“门当户对”很重要,或者说:旗鼓相当。这样,彼此能够共同成长,谁也不嫌谁幼稚。如果出发时两人就认知相差太远,有依附与控制的关系,对谁的长远发展都不会太好。
4、
再说定式。实际上,没有什么定式。在阿尔法元70小时经验里,没有任何定式是一开始就有的。一切定式(我们把对局中出现概率大于某个数值的下法组合叫定式),都是到了某些时间节点才出现的,慢慢达到峰值,又渐渐下降,在某个时间节点后,渐渐消失。
这和人类定式发展的过程差不多。100年前的定式,现在有很多淘汰了,有些还保留着。保留至今的,也不代表一定成立,只是寿命比那些淘汰掉的更长一点。如果某个定式寿命超出了一代人,从你学棋的时候,就知道它是定式,等你死的时候,它还是定式。你就可能认为这个定式是天经地义的。实际上,可能再过两年,它就不成立了。
所谓定式,只是当对方棋力在某一水平区间内时,你按照这个套路下,不容易吃亏。一旦对方棋力突破了那个区间,旧有的定式就废掉了。我们看古代让子棋的很多下法,现在是不成立的。这种不成立,是在现在的人类棋力下不成立。古人当时那么下,考虑到对手的水平,用这个套路欺负他,是没毛病的。
我想从定式聊聊佛教。佛教有八万四千法门,可以看成八万四千定式。每一种定式,都有它适合的契机和土壤。过去的人可以靠某个法门成佛证果,现在的人就不一定行。因为任何定式,都有它适用的条件和环境。如果有永恒的定式,佛陀只需要说一个法门就够了,没有必要开演八万四千法门。
有些声闻乘修行者,不承认大乘佛教,认为大乘不是佛说的。这就好比,阿尔法元在前30小时里没有出现的定式,就认为它不成立。佛教有个词叫“圣言量”,释迦牟尼佛说过的,就叫圣言量。实际上,不止释迦牟尼佛说过的才叫圣言量。其他人只要证到圣果,说的话,也是可以作为依据的。阿罗汉、八地菩萨也是圣者,他们的话,也是可以作为依据的。如果认为,只有释迦牟尼的话才叫圣言量,才是唯一的依据,就否认了其他众生也可以修行成佛,否认了过去未来十方诸佛的存在。
释迦牟尼佛有些东西没明讲,是因为他在娑婆世界只示现了80年世寿。但不能仅仅通过80年的有限示现,去理解他全部的智慧。就好比阿尔法元在第40个小时中,不会下出一切定式,很多定式是后来才出现的。《解深密经》说:阿陀那识甚深细,我于凡愚不开演。为什么不开演?因为当对手在这个水平的时候,很多别的定式是不需要的。到现在,南传佛教不承认中有身,不承认第八识。理由是没见释迦牟尼佛明讲过那些定式。不过,虽然不承认中有身、第八识,但也承认“有分心”,靠“有分心”建立起三世流转。这“有分心”,与潜在相续的“细心”、“第八识”等,只不过是定式的不同变化,是并没有什么矛盾的。
再比如,念佛法门。如果去考察梵文,会发现“念佛”的“念”,本义是用心系念,不是口念称名。有些人就讲,中国传下来的净土法门搞错了,错会了经文意思。这就是不了解,法无定法,“定式”是不断变化的。过去合用的定式,后来可能就不好用了。最早的时候,念佛是要观想佛像的,这是此前流行很久,在印度就流行的定式。到了后来,不好用了,照这个定式修,能成就的人越来越少。为什么?因缘变化了。
“法”有不同的时代:正法时代、像法时代、末法时代。正法时代的定式,到像法时代就不好用了,像法时代的定式,到末法时代也不好用了。据此,道绰法师强调了新的念佛法门,到了善导大师,发扬光大。佛教不是像考古学,过去有的东西,就是成立的,没有的,就不成立。更像是科学,后起的研究,承续了前人,在表现上有所不同,只要内在精神一致,就是应当信受的。而表现形式不同,正是内在精神一致的必然要求。
今天,汉传佛教的修行者,一般都说现在是末法时代。但南传佛教不这么认为,上座部认为现在是正法时代。这并不矛盾。上座部到现在还流行着传统而古老的法门。这就好比,针对不同的对手,应该下不同的“定式”。所谓定式,并非一成不变,永恒有效。
5、
阿尔法元在官子方面,和人类下法相差不大。这没有任何疑问。因为官子是一种有固定解的题目。既然有固定解,谁下都差别不大。但阿尔法元在布局方面,和人类相似,可能说明两点:1、阿尔法元的布局还没有达到最高阶段。2、人类很聪明,在没有达到阿尔法元棋力的时候,就可以下出和阿尔法元接近的布局了。
如果在人类内部,比方假定,中日韩的围棋,不能进行任何交流,各自封闭发展一段时间,棋力应该会出现明显的高下之分。但这并不意味着,彼此下棋天赋有差距,而意味着其他变量的差别。一旦放开交流机制,彼此棋力就会渐渐趋同。因为,人和人在构造上,差别是很小的。而人类和人工智能,棋力不可能趋同,因为彼此的构造不一样。
不过,由人类研发的不同人工智能,未来有一天,会达到同样的棋力水平,那个时候,就接近了围棋的终点。也就是说,人类是可以穷尽围棋的。人类穷尽围棋,并不能靠自己死下,而是要借助人工智能。当围棋被穷尽的时候,也不是人工智能穷尽了围棋,而是人类穷尽了围棋。
阿尔法元虽然目前棋力已经高出人类很多,但并不是围棋的终点。什么时候会是围棋的终点呢?可以从两方面看,一方面,棋力最高的人工智能自己跟自己下,胜负完全取决于执白执黑,就接近围棋的终点了。
另一方面,不同的围棋软件,给定某个局面,会下出非常接近、甚至一样的下法——不是说某一手的下法,而是说随后到终局的序贯下法,那就接近围棋的终点了。为什么说“接近”呢?因为,能不能给出一致的下法,主要取决于给定局面进展到什么程度。越接近收官,越容易趋同;在布局阶段就下得一样,是不太容易的。假如说现在的顶级围棋AI,平均在100手的时候,能够给出一致的判断,未来会慢慢变成50手,甚至20手,10手。如果在给定任意10手的情况下,不同的围棋AI,能给出完全一致的胜负判断。就是说,下十手,棋就结束了,胜负已定。我们可以说,穷尽了围棋。
6、
现在很多文科博士不好毕业。很多文科博士很累,并不是因为需要你有多聪明,而是需要你看很多文献。这样的工作,是可以被人工智能取代的。有了数据库,我们做学术和古人做学术就很不一样了。清朝的乾嘉学派做了很多考据工作,那些工作如果交给AI做,很快就完成了。那些人如果生在今天,就会不幸一些,他们博闻强识的长处,没有办法发挥得淋漓尽致。我们照着过去的路子做学术,很多时候就不再能走得通。很多人想,过去的大师有什么禀赋,如果我也有,就可以达到跟他一样的高度,这是不会的。禀赋要跟时代结合起来才有意义。吴承学老师写了一篇《微信上的万里校书记》,放在过去,是不可以想象的。过去谁做了这样的工作,非常不容易。今天,完全有可能一个文科博士,花了七八年时间做好一篇博士论文,在他快写成的时候,人工智能介入,半个小时完成了同样的工作。