专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
数据派THU  ·  大数据能力提升项目|学生成果展系列之一 ·  2 天前  
软件定义世界(SDX)  ·  AI博士NeurIPS现场崩溃后悔读博,NY ... ·  2 天前  
数据派THU  ·  【CMU博士论文】优化的新视角: ... ·  4 天前  
黑马程序员  ·  大数据BI工程师,如何利用AI技术赋能工作? ·  4 天前  
黑马程序员  ·  大数据BI工程师,如何利用AI技术赋能工作? ·  4 天前  
51好读  ›  专栏  ›  大数据文摘

把可视化从业者的生存现状可视化出来:他们是谁?

大数据文摘  · 公众号  · 大数据  · 2017-02-28 06:43

正文

大数据文摘作品,转载要求见文末

原作者 | Bill Shander

编译团队 | Aileen,蒋晔,刘小楚,姚佳灵


-----------------

【限时免费报名:2017在线技术峰会 】

主题:阿里开源项目最佳实践

讲师:8位阿里资深技术大V

时间:2017年03月01日14:00~17:00

报名方式见文末

-----------------


引言


几十年来,在数据可视化实践上进行了大量研究,包括在当今学术界和商界中进行的一系列新研究。

但是对从事这些工作的从业者自身还没有什么研究:

  • 什么人在做数据可视化?

  • 在哪些组织和这些组织内的哪些部门有这些专业工作?

  • 他们在做什么类型的数据可视化,以及出于什么目的?

  • 他们的工作是否有影响力?如果是,有什么类型的影响?

  • 为什么其中一些人比其他人有更大的影响力——也即,什么使得他们在其工作上比其他人更成功? 

随着这一领域的发展和成熟,这些问题正在(或将很快)被各地的组织机构所问到。 

这项调查是开始阐明数据可视化工作状态和性质的一个尝试。 在2016年夏季和早秋时分,我们在线收集了近100份(精确地说有99份)来自数据可视化专业人士的调查报告。 受访者是自我选择的,并通过社交媒体独家推广。


主要结论


1.从业者正在使用一系列广泛的难以置信的工具来完成他们的工作,与此同时,一些市场领导者也开始出现。

2.“增加了解”是数据可视化的主要目标,但除此之外,意见各不相同。

3.良好的数据和训练有素的员工是成功的关键,而在数据中“找出故事”仍然是许多人面临的一个关键挑战。

4.那些正在衡量其成果的人预计,可视化的支出会增加,近五分之一的人预计会有显著增长。


领导者VS落后者


评估调查数据最有趣的方法之一是将某些活动(在这种情况下为数据可视化)中的“领导者”与“落后者”进行比较。那些制造趋势并在其组织中有着更大影响的人与那些影响较小的人有什么不同? 在这次调查中,有两个问题帮助我们区分领先者与落后者。

受访者被问及:“总体上,您所在组织的可视化数据做得有多好?”可选用的答案是从“非常差”到“很好”的五点李克特量表(Likert Scale)。 这个问题,显然不是“领导力”或“落后”的科学证据,但可以用来衡量一个组织对自身业绩拥有(或缺乏)的信心。 这是所有以下“自信组”与“不确定组”比较的来源。 这两个群体都由41个受访者所构成。

总体上,您所在组织的可视化数据做得有多好?

  受访者还回答了这个问题:“如果您正在评估成果,您是否在您的可视化项目中看到ROI(投资回报率)(财务方面或者其他)?”这个问题也提供了一个从“非常积极”到“非常负面”李克特量表选项。 取得“正投资回报率”(PROI)受访者是那些回答“非常积极”或“有点积极”的人,剩下的是回答“中性到负的投资回报率”(N2NROI)的人。 有28名PROI受访者(其测量结果的53%)和25名N2NROI(47%)受访者。 正如人们所期望的,PROI组中的75%也在自信组。 N2NROI组在“自信”(44%)和“不确定”(56%)之间分布更均匀。

如果您正在评估成果,您是否在可视化项目中看到ROI(投资回报率)?(财务方面或者其他)

  在“领导者”和“落后者”这两组之间有什么区别? 很难得出广泛的结论。 无论如何,我尽可能指出他们的不同,并给出结论。


主要结论


工具!工具!更多的工具!


这项调查最令人惊讶的发现集中于所使用的工具。 当被问及“贵组织用于数据可视化最常用的3个软件工具是什么?”时,答案是非常不同的。 

我们得到的答案是有不止62种不同的工具被使用。并且这是在将“我们自己的平台”和“其他图像和图表”等答案汇总到一个“其他”分组中,以及将任何Adobe软件划分到一组之后的答案。 

同样有趣的是,所使用工具的多样性是许多受访者所依赖的工具类型。 Excel - 用于计算和创建图表的电子表格,发布于30多年前 – 提及的次数最多(43),其次是第二组流行工具:Tableau(26),Adobe Suite(25)和D3 (21)。然后最接近的是R,被提及12次。 其余的大多数都只有被提及一次或者几次。 

这究竟是一个有着守旧的垄断者主宰了市场份额和影响力的成熟行业? 还是一个对于新工具有着足够空间来扩散及主导的不成熟行业? 或者,这是一个正在成熟的行业,其中的标准正在制定中,各种公司正在营造下一个垄断者?

我认为答案是非常肯定的“是”(在一定程度来说,以上三种都对)。 很难准确预测未来对数据可视化工具有着怎样的影响。 传统的主导工具很难被取代。 同时,新的工具又不断地出现。 但在较新的工具中,Tableau和D3正在成为清晰的标准。 这里还有空间给其他人分一杯羹吗?如果考虑到大量的工具在使用,毫无疑问是有的。

那么自信组和不确定组的情况又是如何呢? 他们是否使用不同的工具? 自信组比不确定组更多使用Tableau和Excel,而使用D3和Adobe工具的以同样大的差距少于不确定组。 这究竟意味着什么? 很难说。 但很有意思,值得进一步调查。

与自信组和不确定组的受访者相比,PROI组和N2NROI组的受访者有不同的工具使用模式,表明可衡量的成功与信心之间存在明显的区别。 例如,Tableau在两个组中的使用情况相同,其他所有三个顶级工具正在PROI组中得到更广泛的使用。那么, 那些看到成功的人,更有可能使用更多的“自定义”工具,如D3和Adobe? 或者他们更可能使用的顶级工具范围更大? 这很难得出直接的结论,但这同样是一个值得更多研究的领域。


本工作的第一目标:增强观看者对数据的理解


人们出于各种原因而可视化数据。 这并不奇怪。 但令人惊讶的是(确切的说是令人欣慰),当被问到“当你的组织正在可视化数据时,你的主要目标是什么?”时,90%的受访者认为是”增加理解“。远远超过第二个回答”影响影响者 “,只有40%选择了该选项。 当我讲授让数据讲故事和可视化时,我认为增加理解应该是主要目标,因此很高兴看到几乎所有的同行都同意!

当您的组织正在将数据可视化时,您的主要目标是什么? (如果你在为客户提供数据可视化的机构工作,请确定其主要目标。)(选中所有适用选项。)

再一次得到非常多样的回答,多个受访者(实际上,每种情况都有超过10%的受访者)从提供的选项选择相同的关键目标。 (一个例外是“接受投票”。这项调查是在总统选举期间进行的,因此也许所有的政治工作者都忙于为候选人拉票,没有回答问卷调查!)

自信组和不确定组之间的最大区别是,自信组(32%)中“提高品牌知名度”几乎是不确定组的两倍,“提高品牌知名度”很难评估。 同时,与N2NROI(12%)相比,“获得媒体报道”对于PROI(36%)来说是一个更重要的目标,这很容易(因此经常)被评估。 因此,与那些不切实际的人相比,寻求媒体报道的人更有可能感觉到他们获得了PROI。


成功必备因素:好的数据和训练有素的员工排名靠前


调查中的多个问题有助于确定数据可视化面对的挑战和成功的秘密。 

其中最令人激动的发现之一是投资回报率。 在所有评估其工作成果的受访者(仅占所有受访者的一半)中的53%表示他们看到“非常乐观”或“有点乐观”的投资回报率。 只有4%的受访者看到负面的投资回报率。 因此,96%的受访者表示有正的或至少中性的投资回报率。 每个报告“非常乐观”的投资回报率的人都属于自信组。

什么导致成功? “好的数据”(71%),“训练有素的员工”(70%)和“正确的工具”(61%)主导了所有的回答。 虽然“文化”不是多项选择中的一个选项,但它出现在“其他”选项中的手工输入中。 例如,有一个人说,“有一个热情的‘数据能手’等同于从高级职员到基层人员都是‘数据可视化能手’”。

数据可视化项目成功的关键因素是什么?

有趣的是,一个类似的问题作为开放问题被提出时,得到的结果有点不同于多重选择的。 在开放式回答中,工具被排到列表底部,受访者更加注重培训、人才、文化、投资回报率、数据质量和故事的讲述。

自信组(Confident)和不确定组(Unsure)解答多项选择的主要区别是,自信组中有非常高的比例的人(83%),认识到需要好的数据,相较而言,不确定组只有59%的。 再次,PROI和N2NROI组与自信组(Confident)和不确定组(Unsure)有着显著不同。 足足有86%的PROI组将训练有素的员工(Trained staff)确定为关键成功因素,而N2NPOI组仅为60%。可以理解的是,N2NROI组更可能将“足够的资金(Sufficient funding)”(24%,而PROI组为11%)确定为关键成功因素。

当被问及“您所在的组织在可视化数据时所面临的最艰巨的挑战是什么?”,再一次,我们有多个受访者(每个组超过10%)选择每个可选答案。“找出故事(Figuring out the "story")”(48%),“找到时间(Finding the time)”(41%)和“清理数据(Cleaning the data)”(40%)领先。 自信组(Confident,59%)与不确定组(Unsure,24%)相比,认为“找到时间(Finding the time)”更难。与此同时,不确定组(Unsure)的人更纠结于找到人才(Finding the talent,39%)和预算(Finding the budget,29%),而自信组(Confident)分别为22%和15%。


您所在的组织在可视化数据时面临的最艰巨的挑战是什么?(选择所有适合的选项)

PROI和N2NROI组之间的最大差异又一次不同于自信组(Confident)和不确定组(Unsure)。PROI难以“找出故事来沟通(figuring out the story to communicate)”(61%,相比N2NROI的40%),而N2NROI难以“分析数据(analyzing the data)”(32%,相比PROI的21%)。N2NROI更不可能“难以找出故事”是因为他们倾向于容易地搞明白或因为他们甚至没用考虑一下故事?他们真的是难以做数据分析或只是受访者认为那是个困难的部分只因为他们是做那个工作的人? (这可能很容易将他们对自己所做工作难度感到骄傲等同于“挣扎”)。

值得一提的是,正如文化是受访者所描述的关键成功因素之一,它看起来也是许多人需要克服的障碍。一个受访者表示:“需要文化向数据可视化变迁”。


支出:绝大多数预算低于25万美元的增长


根据他们自己的估计,在回答“您认为在2016年您的组织打算在数据可视化方面花多少钱?”时,大多数受访者(51%)每年支出低于5万美元,而87%的受访者支出低于25万美元 。这组受访者偏向于来自于规模较小的组织(73%来自雇员少于1000人的公司),所以这个结果并不奇怪。除了所有回答每年花费超过1百万美元的人属于自信组(Confident)外,自信组(Confident)和不确定(Unsure)组之间没有显著差异。

您认为在2016年您的组织打算数据可视化方面花多少钱?

比总支出更有趣的是随着时间的变化,受访者是如何看待支出的变化。 几乎没有人(4%)表示他们预计在未来一年数据可视化方面的支出会缩减。43%的人预期支出会有所增长或显著增长。 自信组(Confident)更有可能(7%)说会显著增长,相较而言,不确定组(Unsure)这么认为的只有2%,但这仍是一个小数字。PROI组更有信心,61%的受访者期望增长(相比之下N2NROI组为28%),18%的受访者期望有显著的增长。有趣的是,与自信组(Confident)和不确定组(Unsure)相比,即使是N2NROI组的预期也有较高水平(12%)的显着增长。


在2016年到2017年间,您的组织在数据可视化方面的支出会变化多少?


结论


那么,对数据可视化专家来说,所有这些意味着什么? 数据点出了如何改进他们的工作和组织影响的几个结论。


明智地选择您的工具


数据可视化工具集是巨大并且不断增长的,但也围绕一些领导者在巩固着。您的组织需要合适的工具来完成工作,您需要选择那些工具,它们是能够更容易找到人才来使用的工具,无论是现在,还是在未来。您需要易于使用且功能足够强大的工具,并且它们允许您创建能够和受众对话的视觉效果。


明白为什么您在做这些自己正在做的事

这似乎显而易见,但您需要真的想想为什么您要将可视化的数据放在第一位。您不需要因为其他人都这样做而这样做,正如几乎所有的受访者都同意的,您需要做到“增加理解”,并且实现特定的目标。了解您的目标,衡量您的结果,改变您正在做的,用以改善这些成果。


克服挑战

好的数据,训练有素的工作人员,文化和找出故事是人们在这个宇宙中发现的具有挑战性的事情。因此,构建一个以数据为中心的组织,并将可视化视为一种强大的数据通信工具。并向大量员工提供培训和支持,即使这些员工不直接参与可视化工作,他们也将紧跟可视化的潮流。


跟随领导者

基于几个问题和方差,以及如何将PROI和N2NROI与其余的数据集进行叠加,可以得出结论,无论实际的ROI如何,单单测量结果就可能使一个人成为“领导者”。PROI和N2NROI组比任何其他群体都期望明年数据可视化支出有更高的增长率。这两组相比于自信和不确定组,在他们认为主要成功因素和挑战上的差异上,在整体上更加接近一致。

接下来


和大多数调查一样,尤其是第一类调查,这个调查带来了更多的问题,而不是答案。 我很想跟进很多问题,如下(但远远不限于此): 

- 为什么您用这些您正在使用的工具?确切地说,如果您发现更好的工具是一个关键的成功因素,那将意味着什么?

- 根据您确定的目标、挑战和成功因素,您可以在2017年实现或克服什么?例如,培训是重要的,那么您和您的同事具体需要什么培训?

- 您如何衡量您的成功?

- 您的文化如何进行转变?  

数据可视化实践是一个年轻正在成长的领域。它是任何组织中许多不同角色和部门内的活动子集。给它下定义是困难的,但可以为在这个领域工作的我们所有人阐明什么可行,什么不可行。随着它的成熟,我们应该看到很多,像所用的工具在数量上的缩减和巩固、预算和支出增加,同时也对主要挑战和成功因素有了更明确的方向。

明年,我们会再次进行这项调查,我希望得到更多社区里的人们的支持和参与。如果您能想到一些问题您想要添加到明年的调查中,或者对今年的这些问题的改进和调整,请与我分享!也请不要犹豫与我分享任何其他想法。


注意


该项在线调查(托管于SurveyMonkey.com)在2016年春季开发,并在线共享到2016年10月结束。它由社交媒体独家推广。由于受访者人数和这个非随机抽样的数量很少,科学的来讲,它不能被认为是准确的,但是提供了有趣的见解。在上面的总结报告中,为了简单起见,所有百分比都被四舍五入了。


其他问题和数据


所有额外的问题和回答如下所示,完整的原始结果可供下载。只需发送电子邮件至[email protected]请求回复。

以下哪项最能描述您的组织?

受访者主要来自专业服务、高科技行业。


您的组织大小?

受访者所在组织规模普遍较小。


以下哪项最能说明您在组织中的角色?

受访者的职位主要为数据分析师、研究员。



您所在的组织中有哪些部门定期并且频繁地可视化数据?

所在组织中,分析部门和市场营销部门的数据可视化频率最高。


您所在的组织中有多少人经常处理数据可视化?

一个组织里进行数据可视化工作的通常有1-4人。


您所在组织中有多少人经常使用其他人创建的数据可视化?

组织间,经常使用他人创建的可视化的人群规模差异不明显。


您的数据可视化工作是由您所在组织中的员工还是供应商完成的?

数据可视化主要是由各组织中的员工自己完成的。



您所在组织的年度运营预算是多少?

受访者在不同年度预算的组织间分布较均匀。



当您所在的组织可视化数据时,目标受众是谁?(如果您与代理商合作为客户进行可视化,请从客户的角度回答这个问题 - 例如,如果您为客户的员工开发可视化数据,则可以选择“内部受众Internal Audiences”。)

可视化结果既有外部受众,也有内部受众。


当您所在的组织可视化数据时,您可视化内部数据还是外部数据? (如果您为代理商为客户进行可视化工作,请从客户的角度回答问题 - 例如,如果您为客户开发其内部数据的可视化,则可以选择“内部数据(Internal Data)”。)

用于可视化的数据,既有内部数据,也有外部数据。


当您所在的组织可视化数据时,下列哪一项最能描述输出? (可解释性VS探索性经验)

可视化分析中,解释性分析比探索性分析更普遍。


在为您所在的组织可视化数据时,您是否测量与销售、筹集资金等目标相关的结果? 

多数组织对销售额、筹资相关数据进行了一定的分析。


原文链接:https://rockthevizcomm.com/2016/11/08/charting-chartists-2016-survey-data-visualization-professionals


扫码加入“大数据文摘-阿里云栖社区”,

有专人指导报名和进行相关交流。

 

 

如果扫码入群有问题,请加微信bigdataGJJ,备注"阿里"




关于转载
如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 |bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:[email protected]

志愿者介绍

回复“志愿者”了解如何加入我们


 

往期精彩文章

点击图片阅读文章

为创业公司CEO定制的完美日程表:如何安排你的一天最高产?