专栏名称: 湖畔大学
湖畔大学首次公开阿里巴巴17年创业心法, 马云及阿里巴巴合伙人首次回顾创业历程, 锤炼创业三板斧。“战略的上三板斧是使命感、愿景、价值观,下三板斧是人、组织、KPI。”《湖畔三板斧》不教你赚快钱,而是致力于让你的企业活得更长 。
目录
相关文章推荐
第1眼新闻  ·  清华大学官宣扩招!重点培养这类人才→ ·  昨天  
第1眼新闻  ·  清华大学官宣扩招!重点培养这类人才→ ·  昨天  
创业家  ·  中国90后,全面开打 ·  2 天前  
企名片  ·  融资合作!seelink企业间合作平台 ... ·  3 天前  
企名片  ·  融资合作!seelink企业间合作平台 ... ·  3 天前  
河南环境  ·  洛阳市新增5家国家级绿色工厂 ·  3 天前  
51好读  ›  专栏  ›  湖畔大学

曾鸣:大数据的本质不是“大”

湖畔大学  · 公众号  · 科技创业  · 2017-05-25 23:22

正文

我们身处互联网时代,可是你真的理解互联网的本质吗?互联网、云计算、大数据,当这三个东西开始正向循环的时候,我们可能就真正迎来跨时代的变化。


【互联网】👉 曾鸣:你真的知道什么是互联网吗?

【云计算】👉 曾鸣:要把云计算当做一个公共事业来提供


大 数 据

第三个我想跟大家讲一下大数据,这可能是近一年来最时髦的词了。


大数据真正的本质不在于“大”,而是在于背后跟互联网相通的一整套新的思维。大数据跟传统的数据最大的差别在哪呢?


1)在线。 首先大数据必须是永远是在线的,而且在线的还得是热备份的,不是冷备份的,不是放在磁带里的,是随时能调用的。不在线的数据不是大数据,因为你根本没时间把它导出来使用。只有在线的数据才能马上被计算、被使用。


2)实时。 大数据必须实时反应。我们上淘宝输入一个商品,后台必须在10亿件商品当中,瞬间进行呈现。如果要等一个小时才呈现,我相信没有人再上淘宝。十亿件商品、几百万个卖家、一亿的消费者,瞬间完成匹配呈现,这才叫大数据。


3)全貌。 大数据还有一个最大的特征,它不再是样本思维,它是一个全体思维。以前一提到数据,人们第一个反应是样本、抽样,但是大数据不再抽样,不再调用部分,我们要的是所有可能的数据,它是一个全貌。其实叫全数据比大数据更准确。


这是大数据的三个本质,在线、实时、全貌。



为了让大家对大数据有更多的理解,我再把它展开跟大家讨论一下。大家做企业,最容易想到的两个数据应用,一个是市场调研,派个市场公司或市场部门做一个调查,去看下各公司什么反馈。第二个就是商业智能BI、数据挖掘,查看数据经营的报表。这是最传统的两个数据应用。这样的 数据应用有几个典型特征:


1)要知道准备达成的目标,从而主动收集这些数据。 由于每个企业的计算能力跟成本不一样,数据数据保留多少时间、哪些数据能用,是有所不同的。而大数据是实时的记录数据。原则上,任何人上任何一个网站、做的任何事情,所有事情都会被记录下来,没有人事先做区分。所以大家不再去问,是数据就记录下来,所以这是第一个差别。


2)第二个差别:参与的人不再是有意识的参与,而是无意识的参与,你是为自己的利益在做事情。 你用一次搜索,你就参与了谷歌的大数据搜集,因为你的每次点击就是一个数据来源。如果让你参加一个市场调研,80%的情况下你会拒绝,15%的情况下你可能会要求某种意义上的补偿。很少有人愿意主动的参加市场调研,因为对你来说是个负担。但是线上的大数据对绝大部分人来说,完全是一个无意识的、自利的行为。我上淘宝就是为了买东西,我上微博是为了看新闻,我上百度是为了搜索,你都是为了自己利益而触发的一个无意识的行为,但这个无意识的行为,都为大数据做了贡献。


3)第三个差别,一个是单向,一个是双向。 我们以前做的数据分析也好,都是先假定一个目的,然后拿到现成的数据,分析行为,来测试我的猜测。这些都是有一个单向的主导。大数据本质上一定是双向的,就像搜索,你点击搜索引擎点击的时候,你是给它输入了数据,它给你的结果就是它与你的互动,就是它带给你的数据价值。这个大数据本身也在随时为你创造价值,这样的话就变成一个双向互动的正循环,双方都给对方贡献了数据价值。 任何大数据应用,如果在设计时就没有这种双向、互利的正循环的话,是跑不起来的,本质上就不是大数据。



最后一点还想强调的是反应速率,大数据的数据价值越大,它的反应速率就要越高。 比如说谷歌的搜索,你输入一个关键字看到的结果,跟一个小时以后再输入同样的关键字得到的结果,很可能已经不一样了。因为它已经把一个小时内全球所有的点击重新计算了一遍,然后把信息做了结果优化再反馈给你。所以大家可以想想看,反馈的速度越快,它创造的价值越大,消费者参与的动机就越大。数据越跑越大、反应越来越快、结果越来越好、用户参与会越来越大,才能变成一个黑洞效应。这是我想讲的大数据的核心概念。



互联网的本质,讲完这三个词基本上已经讲完了。我给大家提供的是一些最基本的思考工具。你怎么用这种思考的方法去解决问题?最重要的是有互联网的思维,你先有了互联网的思维,你才能够去用互联网的技术。


讲完了一些最基本的概念之后,接下来给大家再介绍一下基本的推论。 基于互联网的本质,我们会得出一些什么样的结论?


互联网精神是什么?什么才叫用互联网的思维做事情?我刚才讲的那三个,已经把评判标准告诉大家了,拿这标准往上一套,基本上就知道是不是大数据的应用。那么互联网精神是什么呢?



1)平等。 为什么是平等?这是由技术决定的,就像生产力决定生产关系。一个网状结构的互联网,是没有中心节点的,它不是一个层级结构。虽然不同的点有不同的权重,但没有一个点是绝对的权威。所以互联网的技术结构决定了它内在的精神,是去中心化,是分布式,是平等,是互动。 平等是互联网非常重要的基本原则。


2)开放。 为什么要开放?你越开放,你跟别人的连接就越多。在一个网状社会,一个“个人”跟一个“企业”的价值,是由连接点的广度跟厚度决定的,。你的连接越广、连接越厚,你的价值越大,这也是纯信息社会的基本特征,是由你的信息含量决定你的价值。 所以开放变成一种生存的必须,你不开放,你就没有办法去获得更多的连接。


3)互动。 无论是从互联网还是从大数据的角度,一定是双向的,互动才创造价值。其实 “来往”本身就是互动 ,有来有往嘛。


4)迭代。 什么叫迭代?一个想法也好,一个产品也好,得先有原型,扔出去、用起来、别人给你反馈、你把坏处修正,这是一个实时互动的过程,而不再是理论。无论是研发产品还是提供服务,各个方面不再是原来那样通过一个看起来严谨的理论来实施的,更多的是通过实践、通过优化来逼近。所以更多的是计算,不再是数学理论。这是很大的一个差异。


以统计为例,统计的理论都是在计算能力不够的情况下,用一种算术的方法找到最想要的,能够倒推出总体的状态。统计所有的力量都集中在理论、数学理论,而大数据所有的力量都集中在算法的优化。我根本不假定理论,我只是通过一轮一轮的迭代中回归,来逼近真实。用户的需求是什么?首先打出去,然后再校验,只要有双向的反馈,我总是离真实越来越近。所以迭代是互联网整个产品的最关键的一个基石。跟这相关的还有A/B test,这也是互联网的特殊性跟它的技术架构决定的,比如说要测试任何一个产品,我可以把淘宝流量的1%切出来,先给它试这个东西,试完这个程度我再把它放大到20%、80%。迭代跟A/B test的结合使用,让互联网企业的效率远远超过传统企业所能想象的。


5)第五点是演化,而不是计划。 大家应该有一定的感知了,我刚才讲的迭代也好,A/B test也好,它本质上不是通过一个完美计划来实现的,而是通过一种演化的方式,来逐渐优化、接近更好的状态,这是互联网精神。

我总结,互联网的精神就是:

平等、开放、互动、迭代、演化…

既然叫精神就要深入骨髓,

贯彻到你的产品、服务、团队、组织、运营当中去。


最后总结一下,互联网到底给我们带来什么? 从一个最大的角度来说,互联网让我们从工业文明走向了信息文明,从工业经济走向了知识经济。 这些话喊了二三十年,正是因为不断的喊,今天我们才可能跨过这个门槛。我把云计算的普遍使用,当做这个社会进入信息时代的标志。当然云计算作为一个公用事业,达到30%或40%的覆盖率,可能还需要十年左右的时间。但是我们应该已经像100年前状态,即1910到1920年这十年快速发展的状态。同时正是因为有了云计算,大数据变成了可能。如果没有海量数据的存储和计算能力让成本变得非常低廉的话,根本不可能做大数据,数据的成本就把你压垮了。


我们在从一个机械系统的时代走向一个生态系统时代,从工业文明走向信息文明,从工业经济走向知识经济。 从这个角度看,如果说农业文明时代最重要的资产是土地跟农民的话,工业时代则是资本、机器 (机器是固化的资本)







请到「今天看啥」查看全文