目前取得重大进展的以深度学习为代表的 AI 技术,
本质上还是基于数据的统计,是一种高维空间的模式识别
。这使得 AI 无法“理解”任务内容,在 AI 看来所有的任务都是寻找 f 使得 f(X) -> Y 的过程。这样AI的效果将极其依赖于给定的输入 X 与输出 Y。
前面两节已经提到,在投资任务中,输入 X 中包含了大量的垃圾信息,又将很多真正有意义的信息排除在外;输出 Y 又不易准确量化评价。对于人类来说,存在大量的领域背景知识,可以轻松的滤掉“显而易见”的无用或错误信息。
但是现阶段技术下,这种领域背景知识很难迁移到 AI 中。AI 将对所有信息一视同仁,努力在其中发现模式,而这种模式将完全不同于人类的思维和理解方式,对于人类来说几乎是一个黑箱。
这等于 AI 放弃了人类文明千百年来的持续积淀,仅通过目前人类给他划定的一部分信息,采用不同于人类的方式自学成才。
对于围棋来说,棋盘上的信息是完全的,人类的所有领域知识积累都可以从棋盘上推演得到,人类的知识显得“多余”了。
但对于投资来说,涉及的信息无法穷尽,此时放弃人类知识就是非常危险的。那些人类闭着眼都不会踩到、甚至根本无法意识到其存在的坑,都很可能就会让 AI 阴沟里翻船。更何况现在的 AI 对于针对性构建的恶意样本还非常脆弱,一旦被人恶意利用,后果不堪设想。
图 2 针对性构建的恶意样本
同时,现阶段的 AI 投资还面临一个重大挑战就是数据
匮乏。
从基于统计的机器学习开始,到现在的深度卷积神经网络,对于复杂的问题采取了使用海量数据学习以暴制暴的方式。AlphaGo 对弈了数百万盘围棋,达到了人类的水平。而一个人类棋手从学棋开始至达到职业水平的对弈数连 AlphaGo 的零头都不到。在这一点上,目前的 AI 与人类的思维方式还有着显著的差别。
AlphaGo 击败了人类也不意味着机器就比人更聪明。
人类的优势是对复杂数据进行高层次的抽象,大道至简;而深度学习算法则是充分发挥机器的优势,以量取胜。这使得人类能够从少量的样本中总结出深层次的简单规律,并利用这些规律做出各种预测;而 AI 在目前阶段无法做到这一点。
观察到苹果落地,牛顿总结出是因为地球的引力,据此发展出万有引力定律;爱因斯坦总结出是因为地球质量造成时空弯曲,据此发展出广义相对论。
他们都通过少量(相对 AI 的训练数据规模)的观察准确的抽象出了高层次的一些规律。
在小样本上的学习能力、深层次规律的抽象泛化能力,人类远远强过 AI。
如果巴菲特是 AI,他可能需要看过 100 万家“可口可乐”公司的成功,才能在实际中选出可口可乐。但很可惜,可口可乐公司只有一个,历史也只有一次。
对于 AI 来说,这样的学习数据实在是太少了。
现阶段的 AI 算法,如果学习数据太少,会非常轻易的陷入过拟合的陷阱
——
AI 记住了所有的学习数据,而非其中真正能够持久生效的一些深层规律。
从投资到计量经济学,都注定了只有唯一的历史数据可以学习,时间持续流逝,环境不断变化,你也无法控制同样的环境反复的实验验证。此时就要求必须能够从这少量的甚至是唯一的样本中总结规律。
现在 AI 言必称大数据,而爱因斯坦 100 年前没有任何实际的观测,通过“零数据”就预言了引力波的存在,直到 100 年后的今天才被实际观测到,这种能力现阶段的 AI 是无法企及的。专家们早已注意到了
机器学习过于依赖样本的局限性,小样本学习的问题已经被推到 AI 领域前沿,但迄今未出现像深度学习算法这样的重大突破。
目前 AI 仍然无法脱离模式识别的范畴,我们离实现真正的智能还有很长的路要走。