在任何一个有摄像头的地方,这台人工智能都能通过五官识别技术定位你。
上帝凝视下,你无处可逃。
(《疑犯追踪》剧照)
虽然这种超级机器不存在于当下,但在智能机、云服务、互联网蓬勃发展的时代,当你手握智能机用来社交、娱乐、支付、出行时,海量的数据样本每时每刻都在产生。
如果这些留存在云端服务器的数据被搜集起来集中分析,那这些结果又将如何被应用、如何改变目前的商业形态、技术形态以及生活方式呢?
举个简单的例子,只通过你的手机定位能够获得你的多少社会信息呢?
通过LBS技术精准定位,你的地理位置和移动轨迹将全面暴露在运营商及应用软件后台面前。通过你早上几点出门,公司所在位置判断出你的收入水平与消费水平;通过与你处在相同时间相同空间的用户推测出你的社交关系;通过你住址位置推测出你的房价、房贷压力甚至是家庭成员状况……
这是如何做到的?大数据。
基于对你每时每刻产生的大数据的采集、处理、应用和管理,大数据能够产生的商业价值已经逐渐被发现。
盈动实验室举办了盈动实验室第1期,邀请了三位大牛:王磊、夏真、风剑,还有盈动资本的男神大象、合伙人蒋舜以及投资总监束欢一起聊聊关于大数据的定义、对数据来源的分析和算法经济的认识。
沙龙现场的小伙伴们也热情参与到干货满满的分享活动中,盈动君整理出此文分享给大家。以下:
(盈动实验室活动第1期现场)
什么是大数据?
了解一件事物之前必先对其定义。
根据Gartner的定义,大数据是使用高效的信息处理方式以具备更强的洞察力、决策力和流程优化能力的、海量的、多元的数据资产。
专注于大数据应用领域的阿里云创新负责人
风剑认为,阿里云在大数据领域应用领域在全球属于领先水平,致力于把大数据的理念和思想植入到入数据的框架之中。大数据分一下三个大的层次:大数据平台类、大数据工具类和大数据应用类。
专注于大数据人工智能客服领域,易云科技负责人
王磊认为,大数据的特点在于量大、没有明确的规则,复杂性、非相关性、变化非常快。大数据的容量大主要体现在以下方面:就技术层面而言,
-
大数据对存储、计算能力要求高;
-
数据的帧数不断加快且呈现爆炸式加快,就要求分析能力快,对实时性要求高;
-
数据的种类多,文本音频照片等不同形式;
就应用层面而言:
-
全数据才能真实还原事物本身的规律;
-
要求应用场景丰富,不间断的学习;
-
基于对现实世界变量的关联分析来对未来预测,只有加入越来越多的变量才能真实模拟现实的运行。
(盈动实验室活动第1期现场)
大数据最大的价值是什么?这是企业和创业者最常问的问题。
风剑认为,获得数据和数据管理是前提,场景化才是大数据的价值所在。把数据做成不同的应用场景,不同的业务场景会产生不同的价值。
大数据最大的魅力就是不确定性。
这种不确定性不仅因为数据来源的不确定性和处理过程的不确定性,还因为其结果的不确定性。比如,用人工智能去预测奥运会项目的胜负就违背了大数据的魅力。
既然大数据如此有价值有魅力,那么应该如何发挥大数据的魅力?
专注于大数据征信领域的
夏真认为,
数据量多并不意味着就具有竞争优势,
单一纬度的数据无用,
数据链接能力才是决定数据是否能发挥价值的因素。
如何将看似不相关的、比较断裂的信息链接起来去解决问题,才是大数据分析的关键。这就要求对大数据进行即使处理的同时,发展出有效的模型去有效预测趋势。
(注:发言者为
阿里云创新、数澜科技负责人风剑
)
如何尽可能获得海量多元的数据?
既然大数据如此重要,那么应该如何获得海量的信息样本呢?互联网+的发展使多个行业产生的数据得到纪录,数据范围和所属行业不断被丰富。对企业而言,企业内部、外部市场的大数据都有潜在的价值。风剑指出,企业大数据包括三大块,三块之间来源不同,获取难度越来越高,也具有不同的采集跟合作方式:
-
企业社会类数据:社会活动相关信息;
-
企业日志类数据:企业运营活动留下的足迹;
-
企业经营类数据:最核心的机密数据,是企业生存的根本。
风剑认为,
大数据的未来在传统企业,不在互联网企业,
因为互联网企业对数据的掌控能力太强了。
夏真认为,数据来源是大数据公司首要要解决的问题。
第一类来源主要是具有平台性质的搜索引擎与社交软件,目前大数据的主要来源还是集中在有用户入口的企业,用户在网络或者APP上的用户行为、内容、交互产生的数据都在不断地被积累,比如国内的百度、阿里、腾讯、平安、京东,国外的Google、Facebook、雅虎。第二类来源于具有广泛的用户人群的运营商的快速搜集。
初创公司的机遇就在于掌握数据分析技术去辅助已经掌握大数据的企业,通过接触用户来积累数据。
在可以预见的未来,数据的产生、积累、建模、应用都会由不同的公司来做,在这个链条上发展不同的能力就是初创公司的机遇。
强大的数据分析能力、数据变现能力、数据建模能力、对应用场景切入的深刻度,都是初创公司的竞争力所在。
(注:发言者为EcreditPal负责人
夏真
)
目前国内大数据处理技术是否成熟?应用前景如何?