英国文豪狄更斯在他的名著《双城记》中开篇第一句说,“这是最好得时代,也是最坏的时代。”一百多年来,这句话不断地被人引用。在这里,我们再次引用来形容智能革命给我们带来的未来社会。智能革命无疑将给我们带来一个更美好的社会,它是智能的、精细化的和人性化的,从这个角度看智能社会无疑是迄今为止人类文明史上最好的社会。但是另一方面,智能革命也将给我们带来空前的挑战。
2016年是智能技术可以载入史册的一年,这是智能时代的开始,也是前智能时代的结束。1956年,也就是整整一个甲子之前,麦卡锡、明斯基、罗切斯特和香农等人提出了人工智能概念。整整六十年后,Google的围棋计算机AlphaGo在与世界著名选手李世石的对局中,以4:1取得了压倒性的胜利,成为第一个战胜围棋世界冠军的机器人,当历史发展的指针走到这一刻,再也没有人可以否认智能时代已经到来。
在《智能时代》整本书的开头,吴军想输出给大家的一个概念就是信息是关于世界、人和事的描述,它比数据来得抽象,而数据虽然最大的作用在于承载信息,但是并非所有的数据都承载了有意义的信息。
古埃及人观察天象开创了天文学,美索不达米亚平原的苏美尔人利用天文观测数据建立起我们今天所说的数学模型,利用这些模型他们能够计算出月亮和五大行星的运行周期并预测日食和月食,毕达哥拉斯、阿基米德、托勒密、哥白尼和开普勒等等一个个如雷贯耳的名字,他们的成果都是从数据中总结出来的。
数据中隐藏的信息和知识是客观存在的,但是只有具有相关领域专业知识的人才能将它们挖掘出来。对数据和信息进行处理后,人类就可以获得知识。
既然数据如此重要,我们来看看对于大数据的特征吴军老师是如何定义的,他认为传统的3V定义(vast大量、variety多样性和velocity及时性)并不全面准确,他给出的特征如下:
1.体量大
这个是最明显的特征,这个特征应该不存在异议。语言识别是最早获得比较多数据的领域,因此数据驱动的方法从这个领域最先产生。
2.多维度
多维度比多样性更简明准确。为了获得相关性通常需要多个维度的信息,这样预测的准确性就会大很多。
3.全面性,或者说完备性
过去任何基于概率统计的模型都会有小概率事件覆盖不到,但是当数据具备完备性以后,“黑天鹅效应”这种小概率事件的灾难就不会发生了。
所以,如果没有大数据的如上特征,机器就不可能拥有智能。
比如,在举世瞩目的人机大战中,机器之所以能战胜人类,是因为机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠大数据和智能算法。在数据方面,Google使用了几十万盘围棋高手之间对弈的数据来训练AlphaGo,这是它获取智能的原因。在计算方面,Google采用了上万台服务器来训练AlphaGo下棋的模型,并且让不同版本的AlphaGo相互对弈了上千万盘,这才保证它能做到算无遗策。
AlphaGo在训练时使用了上万台服务器,但是它在和李世石对弈时仅仅用了几十台服务器(1000多个CPU的内核以及100多个GPU)。AlphaGo和李世石的对弈,实际上是对当今机器智能水平的一个测试。这还仅仅只是一个开始。将来还会有更惊人的奇迹发生。
很多时候,落后与先进的差距,不是购买一些机器或者引进一些技术能够弥补的,落后最可怕的地方是思维方式的落后。西方在近代走在了世界前列,很大程度上是思维方式全面领先。我想这不用无多言,自从1840年鸦片战争之后,中国人民在整个近代化被拖入全球发展大潮中,从洋务运动的器物学习,到辛亥革命的制度模仿,再到新文化运动的思想改造,这一次次的深度思考的结果正式对自身民族思维水平的 提升。
要说明大数据思维的重要性,先回顾一下自17世纪以来一直指导我们行动的最重要的一种思维方式——机械思维。
今天说起机械思维,很多人马上想到死板僵化,但是机械思维曾经是改变人类工作方式的革命性的方法论,它直接导致了人类迄今为止最伟大的工业革命,并且在后来全球工业化的过程中起到了决定性的作用,今天它在很多地方依然能指导我们的行动。机械思维的核心思想可以概括为这样几句话:
第一,世界变化的规律是确定的;
第二,因为有确定性做保障,因此规律不仅是可以被认识的,而且可以用简单的公式或者语言描述清楚。
第三,这些规律应该是放之四海而皆准的,可以应用到各种未知领域指导实践。
但是今天我们面临的复杂情况,已经不是机械时代用几个定律就能讲清楚的了,不确定性是今天社会的常态,世界上很多事情是难以用确定的公式或者规则来表示的,但是他们并非没有规律可循。在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。
随着技术革命的发展,并非每一个人的发展机会都是越来越多的,更可能是越来越少。现在,我们必须面对一个问题:当全社会各行各业的从业人数都因为机器智能而减少时,全世界几十亿劳动力怎么办?
比如制造智能机器的人,他们可能只占人口的不到2%甚至更少,却在某种程度上控制着世界。
这绝不是危言耸听,实际上今天已经发生。大家不妨想一下每天有多少时间挂在微信上,有多少商品是从电商渠道购买的,有多少次出行是靠网约车。这些公司没改变产品的形态,亿万用户的生活却被它们所左右。更重要的是这些公司完全掌握了我们衣食住行的生活细节,它们可能比我们身边的任何人甚至我们自己更了解我们,既然做到了对我们如此精确的把控,它们挣我们的钱便是不言而喻的事情。
所以,在每一次重大的技术革命开始的时候,真正勇敢地投身到技术革命大潮中的人毕竟是少数,受益者更少,大部分人则会犹豫和观望。在智能革命到来之际,每一个人也有两个选择,要么加入到这一次浪潮中,要么观望徘徊,最后被淘汰。当然,大多数人的观望、犹豫和徘徊,给了2%的人以机会,使得愿意吃螃蟹的人在奋斗的道路上少了很多竞争对手。
这其中,必须要提到的是埃隆马斯克,2012年5月,通过自己SpaceX猎鹰9号运载火箭发射的“龙”号货运飞船,成功地完成了为国际空间站运送货物的任务,成为第一家完成此挑战的民间私营公司,这也是人类太空史上的一个新的里程碑。马斯科则坚持认为,如果我们要等到地球上的全部问题都解决再前往火星的话,那么人类永远也到不了火星。试想如果当年哥伦布等到欧洲变成太平盛世才开始探险的话,那么他永远也发现不了新大陆。相反,开拓新边疆所带来的希望,才会反过来帮助我们改变旧世界。
吴军在书中想说给大家的是埃隆马斯克的成功其实给予我们一个启示,那就是,如果我们不可避免地要被那2%的人通过大数据和机器智能控制,与其抱怨,不如干脆加入他们的行列。
至于我们怎样才能加入他们的行列?我想说的不是每个人都要到上述公司去找工作,而是希望大家接受一个新的思维方式,利用好大数据和机器智能。
最后,本期推荐书目吴军《智能时代》,一部迎接未来的智能时代文字纪录片,带你走进智能新时代。
作者:[美]吴军
副标题: 大数据与智能革命重新定义未来
豆瓣评分:8.6
邓艳任,微信公众号:文科作坊。
文章仅代表作者本人观点。