文|刘金玲 36大数据合伙人
有人说大数据是「石油」是「黄金」,涂子沛说大数据是「土壤」,而马云说大数据是「生产资料」,我觉得他们说得都对,但是也都不对。
因为大数据就是「大数据」。
当大数据应用在不同的领域和不同的场景下,所产生的意义及其所代表的意义也都不一样,你没有办法用一句话完全概况。大数据是互联网时代不可或缺的产物,不管你愿不愿意,大数据就在那里,你我都是大数据的制造者同时也是受惠者,这个生态圈的闭环已经形成,而且还在不断的延伸到各行各业,为不同的行业创造着更新、更大的价值。
2015年9月,我曾经写过一篇名叫《一文了解大数据领域创业的机会与方向》的文章,该文章首发钛媒体,后来得到了金融界、网易财经、新芽NewSeed、新浪科技等多家知名媒体的转载,直至今日,在知乎、微信公众平台和微博上,仍然还有很多朋友不停的点赞和转发。在这篇文章里,我曾经把大数据的商业模式划分为广告/营销、数据交易、工具与数据服务、数据报告和解决方案以及跨界融合五大项,这个论述当时也得到了大数据行业人员的认可和支持。
同样在那篇文章里,我提出了一个自己的观点,我说大数据不像电子商务、网游那样有着「直接明确」的商业变现模式,今天我仍然保持这个观点。没有直接的变现商业模式不代表没有商业模式。人类对科技新兴产业以及新兴技术的探索是永无止境的。
两年的时间弹指一过,在这两年间,中国诞生了大大小小超过400家的大数据新创公司,大数据的应用更是拓展到了我们生活、工作和学习的方方面面,更多的大数据商业变现模式也在逐渐的被发现和应用,部分大数据公司已经可以扭亏为盈,甚至可以实现盈利。
现在问题来了,大数据的商业模式到底是什么?如何利用大数据赚钱呢?今天我就分享一下我所了解到大数据商业模式以及优势。
首先展示一个常见的大数据平台架构
图1:量化派基于Hadoop、Spark、Storm的大数据风控架构
这是一个典型的大数据架构,且对架构进行了「分层」,分为「数据源层」、「数据传输层」、「数据存储层」、「编程模型层」和「数据分析层」,如果继续往上走的话,还有「数据可视化层」和「数据应用层」。
图2 极星大数据分析平台架构
整套架构体系里,在每个不同的层级,都分别用了不同的技术和软件,比如Kafka、Sqoop、Storm、Spark、SQL、HDFS等等。关于大数据架构的设计和各个大数据技术的作用,在此不做一一细表。想进一步了解的小伙伴可以到36大数据网站上去看。
为什么要把大数据的架构一开始就抛出来呢?很简单,大数据所有商业变现模式,都是围绕这大数据架构展开的,不同的企事业单位、应用场景的不同,那么大数据架构也有所不同。大数据架构图也是大数据产业链的核心。美国投资公司FirstMark Capital的Matt Turck每年都会更新北美的大数据产业链版图,依据也是以大数据架构平台为基础的。投资人在投大数据项目的时候,也会让创业者在这个图谱上指出自己公司所对应的层级,层级既代表了行业地位,也代表了商业模式。
我们完全可以这么认为:整个大数据架构图谱上,每一块都是机会,每一块都能产生商业价值。所以这篇文章里,我们将从大数据架构的角度,去说说大数据的商业变现模式。
搭建一个大数据平台、搭建政务云平台都是基础设施典型的应用。把大数据当作基础设施来建设,费用主要产生在“建设”和“维护”上。建设方面又可以分为整体建设和部分建设,这一部分的商业价值在于输出技术能力,由于输出技术的多少不同,收取的费用也不同。做这一块的公司很多,比如说百分点、阿里数加、亚信数据等等。
甲乙双方的合作方式可以按照年签、可以按照项目来签订,具体的金额都是上百万的。随着甲方数据业务的不断增加,大数据基础设施也需要扩容和维修,这个时候就会产生新的费用。我们可以把基础设施当作把“大数据技术”进行打包卖,而基础设施往往都是定制化的,不同的单位和公司都不同。
前面我们说过,大数据架构是一个整体,而每一个层级上都会用到不同的软件或者技术。当技术应用到商业活动上,技术和软件都是需要商业化才能支撑下去的。虽然大数据的众多技术(例如Hadoop、Spark)都有开源版本,但是开源版本在实际业务中也有很多局限和安全因素,于是出现了将Hadoop商业化的公司,比如Hadoop的三驾马车公司Cloudera、Hortonworks、MapR。这3家美国大数据公司都通过将Hadoop商业化找到了新的商业模式,从而获得了巨大的商业价值。其中,Cloudera、Hortonworks已经在纽交所挂牌上市。在中国,做Hadoop商业化做得比较好的公司是星环科技。使用Hadoop商业化版本的好处在于,Hadoop开源的是个通用的版本,而Hadoop商业化版本会增加更多的套件,而且在更新维护方面也有专人负责,安全性能也会更高一些。
除了将Hadoop商业化,在大数据架构上所有用到的技术和软件也都是分别有不同的商业公司在做的。比如上海的Kyligence公司,他们所提供基于Apache Kylin的企业级智能分析平台及产品。Kylin处于大数据架构的分析层,也可以和其他技术组合成新的商业化大数据平台。
数据库、数据可视化产品等大数据架构里的技术,目前也都纷纷实现了商业化。典型的企业有巨杉数据库 SequoiaDB、Tableau、Oracle、MongoDB等。
数据源层也产生众多的商业模式,比如说数据增值。数据增值的模式是什么呢?
数据源增值是一种合作授权然后分成模式。这种模式在通信运营商用得比较多。一句话介绍就是你手里有多少数据,我拿来这些数据去做个什么市场活动,产生了商业费用咱两分成就是了。
数据源整合这一块,我比较了解的是因特睿软件和博为软件。他们可以帮助政府、企事业单位来打通“数据孤岛”,自己扮演的是一个“管道”的角色,让数据流动起来,整个过程中是以第三方的身份参与的,只是帮助甲方解决数据整合流通的问题。这个合作模式大多数是亦“项目制”进行的。
数据源这一块还有一个数据爬取和数据采集的模式。无论数据爬取还是数据采集,商业模式都在于“工具”。比如八爪鱼就是一款数据爬取的工具,你可以免费使用一些功能,但是也有部分收费的功能。
数据API就比较有意思了,这里的商业模式有点像我们日常生活中的“水”和“电”,你通过API调取了多少数据,就付多少的费用。当然,前提是这些数据是合法及安全的。目前网上也有很多免费的数据API供开发者调用,聚合数据主要做的就是数据API。
随着国家《网络安全法》的实施,买卖个人信息属侵权,贩卖50条可入罪,网络运营者不得泄露其收集的个人信息;中介买卖交换个人信息也算侵权;提供个人信息违法所得5000元以上可入刑。
那么大数据交易所交易的又是什么呢?其实他们的业务里,大部分商业模式属于数据增值模式,也有数据标注、数据源整合和数据API模式。单纯的数据源是不能够交易的,这里的交易只是一种说法。
这一类的公司其实在大数据时代之前就存在了。比如麦肯锡、波士顿咨询、易观和艾瑞。他们的最终输出的商业价值是数据报告。数据报告的价值在于其分析的结果具有总结性和前瞻性。数据报告的合作方式,一种是委托式调研出报告,一种是行业研究定期出报告,需要看到详细报告的企业,需要付费来获取。
很多情况下,咨询机构会通过互联网的渠道放出报告的一部分,如果你想看到报告的全部,需要付费获取。当然了,也有不少公司是利用数据报告来做企业品牌PR宣传的。数据报告这种商业模式也存在一定的诟病,在此不作细表。
查询类的大数据产品很多,比如天眼查、启信宝、新榜、清博大数据这些新型的公司。天眼查是一款服务于个人的企业工商数据信息查询系统,启信宝提供全国企业信用信息查询服务,新榜、微信指数上可查到微信公众号的价值,请博大数据还做了大数据舆情分析。
当用户需要查询数据和信息时,部分数据为公开免费的数据,而更详实、相关联的数据则需要用户成为会员,可以按次查询收费,也可以按时间段查询收取费用。
数据查询的意义在于数据具有指导性,可以找到更多相关的信息。这对调研机构、投资人、征信机构来说是非常有用的。
在广告营销领域,大数据早已成为「神器」。在广告营销方面,大数据起到的作用是“助力型”的催化剂。花更少的钱获得更多更具价值的客户,这是大数据的体现。在广告营销方面,晶赞科技、秒针系统、Admaster精硕科技都处于领先且完善的地位。数据量越大,机器学习的算法越准确,所触达的用户及质量也会越好,广告营销的效果也会越好。
数据是数字营销的关键,基于大数据的营销应用,让未知可知,让隐见显见,让过程无过。在4A广告公司,或者部分广告营销公司里,大数据是他们的核心竞争力。大数据营销产生的价值(如节约的费用、创造的收入)一般是由广告公司和甲方一起来分成的。也有很多公司是把大数据做成了DSP平台,需求方按需付费。
移动互联网的产生的数据量是呈爆发式而增长的,2013年左右,中国做移动统计分析工具的企业也就三四家,比如Talkingdata和友盟。但是今天你去数数看,做移动互联网应用统计分析、APP数据管理的公司不下20家,包括腾讯、阿里巴巴、亚马逊、谷歌、百度等这些老牌的互联网企业,都纷纷的推出了自家的移动互联网统计分析工具,这也说明,在现在的世界里,移动互联网数据是个关键,移动互联网数据非常非常值钱。
移动统计分析工具一般情况下是按照时间段来计费的,比如咱们签约一年,我按月给你付费使用;也有免费使用部分功能,能够查到部分数据,而其他更重要的数据和分析结果是需要付费才能使用的。
还有淘宝卖家天天都在用的生意参谋、店铺分析工具,也都是商业运营中必不可少的工具。这种工具的商业模式和移动统计分析工具相同,基础数据功能免费,更详实的数据和工具需要付费。
说起日志分析,就不得不提Splunk。Splunk的产品可以实时对任何APP、服务器或网络设备的机器数据进行索引、监控与分析,并将结果生成图形化报表,在此基础上帮助客户避免服务性能降低或中断。
Splunk面向的是细分市场,分析Machine Log,并在上面集成了完整的专用模块。它的核心竞争力应该是领域知识和抽象,以及相关的优化和功能,而不是大数据。Splunk的商业模式和软件商业模式大致相同,你需要用到,那你就购买。
大数据在金融方向的应用就更加广泛了,基础设施肯定要架构,数据源肯定要存储,除了技术方向之外,大数据在征信、反欺诈、P2P互联网金融、保险、理财产品上都大有作为。目前,所有的中国银行都部署了大数据架构,同时也将大数据当作自身的软实力。
说到大数据在垂直领域的商业模式,那就更多了。足球、汽车、房产、影视、工业、医疗等等,凡是你能想到的行业,几乎都可以利用大数据是实现互联网+。
举个例子,比如说专注家电品牌数据分析的星图数据和奥维云网,通过数据,他们可以帮助家电企业提前预测下一季的爆款产品,也可以分析出目前市面上家电的售卖情况以及渠道的销售情况等等。大数据在品牌制造商和消费者之间,起到了信息对等、赋能等作用。同时,在营销方面,大数据也能产生巨大的价值。
如果一个要说大数据在垂直领域的商业化模式,那么在垂直领域,大数据往往是以第三方、工具、平台等形式出现的。商业模式可以按需付费,也可以按时间段付费。
对于新兴的互联网产品来说,大数据很多时候是以功能的形式出现的。比如说猫眼电影APP,你既可以看到数据,也可以看到电影的资讯,而整个过程中,数据更像是完整产品里的一个功能,因为有大数据在,可以让用户更加准确的了解这个行业。
在垂直领域,大数据是一切商业活动的“土壤”,你可以在这块土地上种上不同的“种子”,从而衍生出不同的产品,最后到使用产品人的手上,由使用产品的人来买单。人工智能、深度学习、图像/语音识别、自动驾驶汽车等新兴高科技,也需要有大数据这块土地才能长出新的产品,产生商业价值。
除此之外,大数据的预测能力、分析能力也能实现商业价值变现。由于文章篇幅很长,关于大数据在预测和分析方面的商业模式,我将在后面的文章和大家详谈。
也许大数据没有最直接、明确、简单和通用的商业模式,但是经过近几年的发展,我们可以看到的是所有的大数据企业都在寻求商业机会,深耕探索出了适合自己的商业模式,也许并不通用,但是可以让自己的公司最大化的实现商业价值。这也符合一个新兴产业的发展逻辑。
大数据的未来是什么样的?
我不知道,但是我知道,大数据的道路会越来越宽广,产生的经济回报越来越大,值得所有人投入进来。
End
为了让大家能有更多的好文章可以阅读,36大数据联合华章图书共同推出「祈文奖励计划」,该计划将奖励每个月对大数据行业贡献(翻译or投稿)最多的用户中选出最前面的10名小伙伴,统一送出华章图书邮递最新计算机图书一本。投稿邮箱:[email protected]
点击查看:你投稿,我送书,「祈文奖励计划」活动详情>>>
如果有人质疑大数据?不妨把这两个视频转给他
视频:大数据到底是什么 都说干大数据挣钱 1分钟告诉你都在干什么
人人都需要知道 关于大数据最常见的10个问题
从底层到应用,那些数据人的必备技能
如何高效地学好 R?
一个程序员怎样才算精通Python?
排名前50的开源Web爬虫用于数据挖掘
33款可用来抓数据的开源爬虫软件工具
在中国我们如何收集数据?全球数据收集大教程
PPT:数据可视化,到底该用什么软件来展示数据?
干货|电信运营商数据价值跨行业运营的现状与思考
大数据分析的集中化之路 建设银行大数据应用实践PPT
【实战PPT】看工商银行如何利用大数据洞察客户心声?
六步,让你用Excel做出强大漂亮的数据地图
数据商业的崛起 解密中国大数据第一股——国双
双11剁手幕后的阿里“黑科技” OceanBase/金融云架构/ODPS/dataV
金融行业大数据用户画像实践
“讲述大数据在金融、电信、工业、商业、电子商务、网络游戏、移动互联网等多个领域的应用,以中立、客观、专业、可信赖的态度,多层次、多维度地影响着最广泛的大数据人群
搜索「36大数据」或输入36dsj.com查看更多内容。
投稿/商务/合作:[email protected]