“读书的人必是有追求的人”,今天我们提倡人们多读书、读好书,但市场提供的能够称得上是“书”的经典产品,严重不足,大多数是有书号的印刷品。信息时代,如何“回归内容本源,把握阅读趋势”,在2017杭州“阅读与大数据应用”峰会上,出版传媒、内容投资与大数据领域的顶尖专家共聚一堂,热烈探讨出版、阅读与大数据应用相关话题。以下为数联铭品(BBD)创始人、首席科学家周涛和BBD创始人、CEO曾途在峰会上的精彩发言。
数联铭品(BBD)创始人、首席科学家周涛
今天,我想讲讲阅读。
作为一个爱读书的人,我来讲讲对读书的看法。我非常爱读书,爱到什么程度呢?爱到须臾一刻不能没有书。我在中学的时候,骑自行车看书、洗澡看书、上厕所看书、洗衣服看书,任何时候都在看书。爱屋及乌,我不仅喜欢看书,还爱闻新书的味道。以前,在中学的时候,我帮老师发教材,只要是发新书,我都要先闻一段时间,才能舍得发下去。
今天,我想跟大家分享的是读了三十多年书,我的感受,读书的价值、意义到底是什么,以及我们应该怎么读书。
我觉得,书的功能大体上可以分为两类:一是以书作为老师,二是以书作为朋友。
>>学知识
把书本当作老师,我们首先学到的是知识。
读书学知识,我觉得要注意两点。
第一点是我希望大家是由底向上读书。
我们看数学、看物理,很多人读一本教材,很容易陷入局部,当你有一定认知能力的时候,你首先要怎么办?打个比方,我们要进去的这个风景区,你要了解它的全景全貌是什么——哪里有高山,哪里有沟壑,哪里是湖泊,哪里是森林,这样才能防止你陷入一个沟壑中,不能自拔。
比如,一个中学生,当他进入大学要开始学数学的时候,并不是一开始就要看高数,而是应该先读一下克朗的《数学是什么》或者克莱因的《古今数学思想》,通过读这样的书,来了解整个数学的学科方向,以及方向与方向之间的关系,了解了学科的整个发展脉络,这个时候,你再深入,才不会错过真正的美景。
读书求知识的第二点,我希望大家读得非常宽广。
每个合格的、优秀的高中生、本科生,他不仅是学一门专业,比如我学物理,对经济学、新闻学、管理、金融、生命科学、数学等等,这些特别重要的专业方向,也应该基本达到本科的水平。基本达到是什么意思?不是说几十本教材都读完,一个大的学科,支撑起这个科学的,可能就是四五本重要的教材。
比如说,物理,最重要的就是经典力学、电动力学、量子力学、统计力学,当你读完这四本教材,就差不多了。经济学,读完宏观经济学、微观经济学,了解货币、银行,再读一些金融学,那我觉得可能百分之四五十的关键思想,你就有了。这就是我们要做的第二件事,广阔地读书,而且在求知中先读核心的教材,着重了解那些几百年、上千年的这些学者遗留的思想精髓。
>>学智识
以书作为老师的第二点,我觉得是智识。智识和知识不一样,我觉得它是驾驭和统治知识的一种能力,给予我们的是智慧。
智识主要从哲学、历史这些学科中学习。读哲学和读数学一样,我们首先要有一个宏观架构的认识,哲学一定要从哲学史开始,但是哲学和数学物理又不太一样,它强调的是时间演化的脉络。几千年哲学家问的问题并没有太大变化,但是数学和物理的问题变化非常大,所以我们读哲学史,比如罗素的《西方哲学史》,我们要把握的是几千年几百年思想演化发展的时间脉络。
同样的道理,读心理学,可以读黎黑的《心理学史》,读美学,可以读鲍桑葵的《美学史》,都要先从历史读起。
读历史书呢?我建议先从分析读起,比如,读《中国大历史》《万历十五年》《中国历代政治得失》,先去读大的、分析性的东西,建立我们从宏观的政策、经济、气候、环境,包括民族冲突等方面的认知,去了解整个历史发展的内在逻辑和结构,然后才进入史实的细节。
>>学德识
以书作为老师的第三点,是学德识。
学德识要解决两个问题,第一个问题是人生观,第二个就是价值观。我们为什么要活着,而不是死去,选择一个支撑我们走下去的理由,以及判断做什么样的事情是正确的,什么样的事情是有价值的,怎样做才能无悔自身。
我觉得,学德识并不是要我们重读儒释道的经典,重新去看诸子的东西,不是靠这些教育我们,而是通过小说,从中找到活生生的人物,以这种人物为我们道德的牵引。
我举个例子,我很喜欢读武侠书,武侠书里特别看重“侠义”精神。比如“义”,它在汉字里面有很多阐释,但我特别看重“正义”。中国有句古话:“菩萨重因,凡夫畏果。”大意是普通人特别担心这件事结果不好,我做了一件事,最后被法律制裁了,或者办企业亏损了,单看结果,我觉得不好;一旦我们逃过了法律制裁,我们就觉得我做的事情是对的。但是,真正修为很高的人,看重的是原因,就是你做这件事的出发点对不对,如果我努力做事,真心做事,哪怕最后结果不好,我心里也很踏实。
这个从本质讲,就是正义的概念。我做一件事情是有善因的,是有善的回报的。这是我从武侠书里学到的第一件事。武侠世界很单纯,善有善报,恶有恶报。从小看武侠,基本上不太敢做坏事。
我刚有小孩,有人问我怎么教育小孩?我说,一个孩子啊,最重要的就是通过奖励他、惩罚他来教育他,让他做社会希望的好的事情。当他乐于助人、阳光开朗的时候给他奖励,当他变得很自私、凶暴的时候给他惩罚。小孩子很聪明,不需要几十条军规,你只要给他足够的奖励和惩罚,他就会明白社会是怎么区分是非善恶的。
第二,就是侠义中的“侠”字。
我觉得“侠”有两个特点。第一个特点,像郭靖一样,胸怀天下,为国为民,侠之大者;第二个特点,放荡不羁。我特别喜欢令狐冲,能够笑傲江湖,很潇洒。稍微弱一点,比如杨过,虽然为情所困,也很潇洒。
这些经典著作实际上是在塑造一个中国年轻人独立自主的灵魂和探索力量。但是,我有这样的精神诉求,包括这样的道德诉求,并不是来自于儒家学说,而是来自于一个个活生生的武侠人物。
为什么文学力量大?是因为文学塑造人是润物无声的。德识就是你能找到一些鲜活的榜样,你希望成为他,甚至超过他。
以书为友,有三个部分:第一是求共鸣,第二是求辩证,第三是求消遣。
>>求共鸣
首先,求共鸣。共鸣有两种。第一是求事理上的共鸣。当你读到一段话,突然觉得豁然开朗,拨开了困惑你很久的人生迷雾。第二是精神上的共鸣。很多时候,我们读书都能感觉到共鸣。比如,我看余华先生的《活着》和《许三观卖血记》,有一种很深的、冷月寒蝉的悲伤在里面。就好像你生活在很稠密的血或沥青的世界里,很难从中挣脱出来。
一个人什么时候最容易产生精神共鸣呢?一定是你悲伤的时候、难过的时候,当你感情、事业遇到巨大挫折,亲人逝世的那个时候,这时你再去读中国的诗词、小说,你能感觉到心里最深的痛。
我给大家的建议就是,当你遇到真正的痛苦和挫折的时候,千万不要去读一些很快乐的书,希望看一些笑话、一些喜剧,就能让自己从痛苦中拔出来。其实不然。这个时候你应该读一些让你更痛苦、更难过的书,因为一个人的精神力量,很大程度上取决于你的情感张力,你能够上到多高的快乐的巅峰,你能够沉到多深的悲伤的深谷,在这种痛苦中不被打倒,从深渊再慢慢攀爬起来,那你的人格力量就厉害了。
>>求辩证
第二就是辩证。读书很多时候,是在求知中,要跟我们原有的观点做争斗。
有一个很大的问题是,我们读一些知识和观点的书,总喜欢找材料来支撑自己,我建议大家读书的时候求辩证,要特别着重读一些和自己的观点和理念不一样的书,通过读这些不一样的东西,佐证或修正自己的观点,这样的话,如果你的观点还站得住,这才是一个真正有力量的观点。
>>求消遣
最后,我觉得读书最大的功能还是求消遣。读书本身不是一个功利的事情,它应该是我们快乐生活中不可或缺的一部分。
求消遣,我觉得环境都是其次的。以前有人说,“雪夜闭门读禁书”“红袖添香”等等,环境固然重要,水高云阔的时候我们读书,感觉要比我们宅在家里好。但是我觉得更更重要的是读书的心境,心境决定了我们在读书的时候能不能真正的快乐,能不能沉入其中去感受书里主人翁在体验在思考的东西,重新经历他所经历的东西。
我给大家的建议就是,我们当前的社会,特别需要一个“静”字,我希望大家每天都能有一两个小时去读书,不管是读Kindle还是读纸质书。读书的时候关掉手机,使得我们全身心都能投入到阅读中,这种集中力量的阅读给你带来的快乐,大家可能难以想象。
最后,我想说书这种载体,从英国的羊皮纸卷、中国刻在龟甲上的一个个刻画,包括岩壁上的刻画符号,到现在,已经有很多很多的演化,这很大程度上不仅是知识的一种传承,也是我们独自自由的民族精神的一种传承。
历史上有很多次焚书,秦始皇焚书坑儒,德国希特勒在二战时也是焚书。海涅曾经写过一首诗:“今天你会烧书,明天你就会烧人。”书里面承载的精神,其实和我们人类在几千年苦苦挣扎前进的精神是一样的。我不知道未来,我们再过一百年,我们还会不会有纸质书,但是我相信我们这代人还是在书中成长,在书中获得快乐。我不敢说我能跟未来的科技做斗争,但我希望我这辈子,还能够看到纸质书一直存在下去。■
大数据对于我们未来的改变,不仅是个要素的组合,还是一个维度的组合,里面最关键的关系是一种非线性关系,所以我今天谈到的也是一种非线性组合。
当大数据行业和出版业跨界的时候,我们有哪些新的创新和认识?
首先,我来讲一下大数据。可能我们一般会认为做大数据的往往更加理性一些,做文学的、做出版的可能更加感性一些,但是我不是这么认为的。我们大数据和出版业这两个行业最重要的价值,就是要在未来善于去发现潜在、未知的事件。
大数据最本质的东西是预测,关于大数据的定义,它是多元异构、跨域关联的海量数据产生的决策流程、商业模式、科学范式、生活方式、观念形态上颠覆性变化的组合。这句话读起来比较长、比较拗口,其实简单说就一句话:大数据将用相关性的思维和全量的数据思维,面向预测,改变我们的生活。这就是我们认为的大数据最核心的本质。
面向预测,从已知的世界去捕捉出弱信号,把它抽象出来,变成一种可预测的行为。这就是我们强调大数据的第一个观点,它的相关性分析。例如,我们用全量数据去代替抽样数据,从而去面向预测,这里面可以做决策辅助,比如说我们去找到合适的IP,我们找到合适的网红,我们找到合适的出版物,等等,去精准地描述抽取对象现实事件的特征,去做面向比如金融行业、经济行业,还有我们出版行业的一些精准的管理。
其实大数据第一次被提出是在2008年,那么它为什么从2012年开始变得这么火。
对于大数据,我们要从根本上对它进行要素分析,看它是怎么来的。我们可以纵观互联网的历史。从20世纪80年代里根政府提出来的“星球大战”计划,到20世纪90年代克林顿政府提出的“信息高速公路”计划,再到美国前总统奥巴马提出的大数据的整个国家战略,这一路的发展当中,实际上就是信息化改变传统产业的一个颠覆性过程,而每一次改变都是对过去以往的总结、翻新和不断升级。
我们可以看一下大数据作为我们认为的“第三次工业革命”,它分别在几个要素方面的不同。第一个是时间点,第二个是我们认为的能源,第三个是材料,第四个是工艺,第五个是特征。
在这里面,未来最重要的一个,不管是企业和组织——这个组织包括营利性组织和非营利性组织——包括政府机构,其核心能力是计算能力,并且在这里掌握的核心资源就是,数据不再是简单的一个文档、一个档案,它将作为我们面向未来决策的新的“石油”,它将成为我们最重要的材料。谁掌握了算法,谁掌握了分析的技能,谁掌握了人工智能对于现实社会的这种改造提升的能力,从而进行个性化的服务,谁掌握了这五种要素与技能,我们认为谁就能决胜于未来。
大数据给我们带来几个重要的改变。
第一个是数据总量在不断地翻新。我们可以看到,从以前的竹简到羊皮书,再到我们现在的电子阅读,到我们的kindle,这是什么样的变化?第一,数据总量发生了巨大的变化;第二,数据类型发生了巨大的变化,不仅有文本,还有图像,不仅有图像,还有视频,不仅有视频,还有音频,还有错综复杂、交叉组合的媒体展现方式。同时,我们要把这么多数据多元异构地处理起来,这里有大量的实施性处理要求,不再是靠传统的人去算、眼睛去看,而是用超大功能的计算能力,从海量的信息当中进行实体抽取,让我们更加精准地去发现、去做个性化的内容推荐。
大数据它具备了这些要素,才会在现在对我们产生这么大的影响。
我们对数据的认识经过了几个阶段。
第一个阶段是对数据没有认识,觉得数据是数据、生活是生活,两个毫无干系。
突然有一天,大家觉得数据还挺重要的,有了数据就可以抽象出很多东西,把我们的生活变得便捷起来——这叫有认识无重视,觉得可有可无。
到我们现在这个阶段,在一些重点的行业,比如航空航天、智能制造、金融风险分析,到我们现在的出版业,我们都有了需要用数据去帮助我们决策辅助和决策分析的认识。在有限范围内,谁先使用数据,谁就能决策于未来。
未来的社会是什么?未来是从传感器到互联网、到云计算、到大数据、到人工智能,一系列界定的新科技的技术体系,把数据变成我们未来最重要的生产要素和核心竞争力,我们的资源完全要依赖数据去进行决策。当对数据的认识可以反映我们对现实生活的指导意义的时候,这又变成了完全依赖数据决策的时代。所以说,我们要去做一个捕风者,我们要站在未来的趋势上看今天,我们做的是不是对的。我们认识事物的任何一个方向,都有这样的规律,我们希望从发布“中国青年阅读指数”开始,从一个有限范围的使用,带领这个行业用新技术去植入这种新的理念,从而用数据决胜未来。
大数据行业的技术是怎么引进的?
第一,是自己有数据,就是闭路信息来做闭路的分析,这是传统数据挖掘。
第二,是用外部数据和内部数据相结合,产生巨大的关联性。周涛博士翻译的一本书叫《大数据时代》,在这本书上有一个经典的案例,叫“Google用搜索关键词去预测流感”,这个分析极其精准,这就是典型的用外部数据与内部数据相结合产生的交叉互验,产生的相关性对一个事实进行推演的精准体现。这就叫融合内外部数据,数据即决策。
到了未来,数据量极其膨胀、极其丰富的时候,我们可以分门别类地在一个集中的地方、有科学数据管理的地方,去调用我们的数据,用智能可感知的API接口的方法去调用我们的数据,用不同的数据按照我们的需求做成数据产品,变成一个对数据质量、影视安全都有保护的体系,形成一个针对不同行业的完整的数据市场,从而支持我们的决策。政府、文化、金融、商贸、物流、互联网,还有医疗,这些行业都将深刻地受到大数据的一些改变。
在谈了整个的一个商业模式后,我们可以再看一下传统的分析。传统的分析,我们叫基于逻辑的线性分析,它是布尔代数的。而现在大数据的分析,它是强调关联性,它是基于向量和张量计算的分析,它是非线性的。非线性的理念体现在数据量大、计算复杂、更难挖掘、应用性广,所以,第一是从结构化数据到非结构化数据的转变,第二是从孤立数据到相关数据的转变。
大数据如何从数据原材以及存储到应用呢?大数据的价值,在于你是不是有足够的应用去满足解决你行业的痛点,你的数据产品足够优秀与否。我们做了很多数据分析,其中涉及到很多核心技术,现在这些技术可能我们比较熟悉,包括图计算、全文检索等,把这些技术用到什么地方呢?比如拿一篇文章过来,我就可以分析出谁是主语、谁是宾语、谁是谓语,主语他有什么行为,行为有什么特征,我就通过这种对实体抽取的方法进行人工智能分析,这就给我们传统行业进入智能化的时代提供了基础。
我们认为传统出版业拥抱大数据是必然趋势。阅读形态发生重大改变,从传统的纸质的阅读到电子阅读,再到多媒体的阅读,现在可看可听,其实传统的阅读量没有增加,只是阅读的渠道和方式发生了深刻的变化,该读书的人还在读书,只是读的地方不一样。所以说在媒介和信息转变的时候,内容本身变得特别重要,而信息内容,什么样是好的内容,什么样是差的内容,怎么样才能用数据的方式,取其精华去其糟粕,这就是我们要干的事情。而我们的“中国青年阅读指数”就恰恰是一种对于趋势的研判,去判断这种趋势的一种工具。它重要的特征就是把我们中国最大数量的青年人,他们的阅读习惯、阅读内容和阅读方式进行抽象、进行实体抽取,抽象出一个可以用量化代表趋势的一个符号,来帮助我们做精准的决策和阅读资源的重新配置。
在这里,我们有丰富的行业者,我们和中青社合作,具有丰富的场景,也有专业的关于青年人的经验和阅读的研判。我们了解青年人阅读的习惯,我们有线上资源,我们有线下的资源,我们充分地整合了所有我们可以采集的开源信息,包括微信公众号、微博,包括很多很多的数据来源,进行大量的清洗、加工、分析,然后用智能的分析方法研究出上千个阅读域。我们要看所有的青年人,你在这个阅读域当中扮演了什么样的角色,你在这个阅读域当中体现了什么样的权重,然后通过这些交叉验证计算结果,从数据的方法去计算,然后变成一个深刻地对行业变革进行预测的工具。这就使我们不是一个在山林里迷了路的人,而是走在时代前沿的领路人。
因为数据的出现、数据工具的出现,当大数据和出版业进行跨界的时候,我们就有了新的思维和新的模式。我们用指数的方式在出版业第一次提出、弥补了一个高端的空白,并且以阅读域这样一个定义去完整地连接、量化青年人的阅读行为和青年人的阅读画像,把阅读作为一个事件,对产生的一个对象模型进行了属性和要素的关联,从而我们给行业的研究提供了一个标准的方法论。我想这就是中国青年出版社和BBD创新价值的所在。这种创新的价值,今天只是从0到1,我们希望未来可以从1到100。
中青阅读指数bata版用了大量的数据,包括图书期刊的,网络文学作品的,包括点评的,包括各类期刊阅读指数,这里面有线上的,也有线下的,我们每天的数据都在动态更新当中。它不是一个榜单,因为我们所有指数是不可更改的,它是通过机器学习加专家模型进行深度量化的模型,我们未来会围绕新的场景开发不同的纸质书,这样就形成了我们的核心竞争力。
在这样一个变化的时代,我希望我们以变化的心态去迎接未来,我们将捕捉弱的信号,将弱信号组织成强信号,从而求胜于未知,求胜于未来。■
本文根据现场演讲整理,转载请注明。