专栏名称: 大数据D1net
大数据D1net隶属于企业网D1Net,提供大数据存储、大数据分析、大数据挖掘等有关大数据的最新技术和资讯。
目录
相关文章推荐
数据派THU  ·  AAAI 2025 | ... ·  2 天前  
CDA数据分析师  ·  Deepseek爆火,CDA持证人如何确保不 ... ·  4 天前  
CDA数据分析师  ·  Deepseek来袭,数据分析师会失业吗? ·  3 天前  
数据派THU  ·  LLM模型的通病:模型坍塌 ·  5 天前  
51好读  ›  专栏  ›  大数据D1net

反思现实:反映2018年的数据世界的复杂性

大数据D1net  · 公众号  · 大数据  · 2018-07-17 11:41

正文

点击上方“ 蓝色字体 ”,选择 “ 设为星标

关键讯息,D1时间送达!



如今,企业比以往任何时候都更加认识到数据采样和可视化是购买精确和相关的第三方数据的关键组成部分。在我职业生涯中检查过的数千个数据集中,有很多都包含了最初并不明显的重大差距或差错。但是,审查这些数据集只是组织目前面临的难题之一。



虽然人们普遍认为高质量的数据随时可用且唾手可得,但情况并非总是如此。然而,这在具有三个共同属性的地区中更常见。


如今,企业比以往任何时候都更加认识到数据采样和可视化是购买精确和相关的第三方数据的关键组成部分。在我职业生涯中检查过的数千个数据集中,有很多都包含了最初并不明显的重大差距或差错。但是,审查这些数据集只是组织目前面临的难题之一。


如果数据连买都不能买怎么办?如果在你欲知详情的地区没有可信的信息该怎么办?


随着实体、数字、移动和交易数据呈指数级上升,很多人认为,关于所有人,所有事物或所有地方的完整的,最新的以及可靠的数据是唾手可得的。好吧,我想说的是他们错了。这些信息根本不像他们想象的那么容易获得。


探索对数据的需求


在你研究当今企业收集的数据的来源时,你会发现这是由人员,联网的设备和活动生成的。人们采集它并使其变得有用,因为他们需要由此生成的数据。反过来,一旦能以合理的价格向买家提供这样的数据,数据就会遍地开花。


当我们检查那些具有最多可用数据的地区时,通常会发现三个共同的属性。这些饱含数据的区域具有下列属性:


1. 人口和企业都众多


2. 政府数据法规较少,政府往往会参与数据的创建和发布


3. 数据采购成本低


缺少一个或多个基本因素的地区可供使用的数据就比较少,这是可以理解的。


比较全球的数据收集


我们以美国为例。美国的绝大多数州人口众多,拥有很多工业化和数据驱动的组织,数据法规寥寥,由于《信息自由法案(Freedom of Information Act)》,这些州有大量由政府创建的可作为商业用途的基础的数据。这一系列因素是商业数据相对于世界其它地区较能以较低的价格提供的原因。因此,关于美国人口的数据不计其数。


相比之下,非洲农村人口集中度很低,缺乏正规的现代化劳动力。如今,对于以美国为中心的数据用户所期望的很多商业应用程序而言,关于非洲的数据很少(或者应该说可靠的数据很少)。


如果我们看看世界上人口最多,有着最为复杂的现代劳动力的国家中国,人们会认为中国的数据量肯定很惊人,而且对这些数据的商业需求也很强劲。但是,中国拥有世界上最为严格的一些数据法规,这些法规使得国外组织从中国获取和输出数据变得非法。


虽然世界上一些最大的数据驱动型组织,以及一些最新、最完整、视觉上最美观的数据都在英国,但享有皇家著作权的数据要收取很高的费用,使大多数以美国价格为参考的人望而却步。


因为仍有很多组织仍在为哪些数据可以共享以及以何种量级共享寻求共识,GDPR的新法规增加了使用的复杂性。


对今天数据的期望


我们发现自己处在数据收集的关键时刻,随着分析和机器学习推动了越来越多的业务决策,这种情况尤甚。虽然我们的期望是整个世界在同一水平上得到反映、计算和描述,但事实并非如此。用数据描述世界会受到很多因素的影响,由于GDPR和引进和最近的公共数据安全漏洞的出现,人员和企业在共享信息方面变得比以往任何时候都更加保守。


虽然数据无形中重塑了我们构想世界的方式,但我们最大的优势仍然领先于我们。由于组织渐渐融入了数据使用和GDPR合规性的节奏,我们可视化数据的方式肯定会发生变化。与此同时,消费者对新法规的理解也会有所不同。在我们还没有完全对世界形成一个整体观时,就数据共享而言,更高一级的舒适度是必须的。


(来源:企业网D1Net)


如果您在企业IT、网络、通信行业的某一领域工作,并希望分享观点,欢迎给企业网D1Net投稿 投稿邮箱:[email protected]







请到「今天看啥」查看全文