专栏名称: 新语数据故事汇
《新语数据故事汇,数说新语》科普数据科学、讲述数据故事,深层次挖掘数据价值。
目录
相关文章推荐
51好读  ›  专栏  ›  新语数据故事汇

数据可视化中的常见误区:让数字讲真话

新语数据故事汇  · 公众号  ·  · 2024-07-06 17:20

正文

数据可视化能够揭示数据中的意想不到的见解,通过直观的方式将复杂的信息呈现给观众。这种图形化的表达方式不仅使数据更容易理解,还能够突出其中的关键趋势和关系,让人们在短时间内获得大量的信息。

"卓越的图形表现能以最少的墨水和空间,在最短的时间内给观众最多的想法,因此数据可视化在信息传递和决策支持中具有重要意义。" —Edward R. Tufte, The Visual Display of Quantitative Information

然而,由于人类的视觉和认知特点,可视化图表常常导致误解和偏见。我们的眼睛很容易受到影响,大脑在处理视觉信息时倾向于寻找快速结论,这就使得人们容易忽略细节和上下文,导致认知偏差和客观性丧失。即使是无意的错误也会误导观众,因此在设计数据可视化时,必须特别注意避免这些潜在的问题,确保图表能够准确、清晰地传达数据的真正意义。

以下是十个常见的数据可视化错误。

错误一:误导性的颜色对比

颜色是最有说服力的设计元素。即使是细微的色调变化也会引发强烈的情感反应。数据可视化中的一个挑战是:高对比度的颜色可能会让观众认为数值差异比实际更大。

例如,热力图通过颜色显示数值大小。高数值显示为橙色和红色,而较低数值显示为蓝色和绿色。数值之间的差异可能很小,但颜色对比却营造出热度和活动加剧的印象。

尽管使用各种颜色有助于解释数据,但过多的颜色可能会让用户感到困惑。坚持使用有限数量的独特颜色至关重要。

"误导性的颜色对比"不良影响:

  • 用户误解了哪个值更重要。

  • 如果可视化中的颜色过多,用户可能需要更长的时间来理解信息。

应用"颜色对比"常见的注意事项:

  • 使用颜色来显示哪个值高于或低于其他值。高对比度的颜色会让观看者感知到更多的数据值。

  • 确定对比度值的最简单方法是比较灰度上的对比色,以检查您选择的颜色是否显示差异。

  • 使用暖色调/冷色调:暖色调/冷色调的颜色有助于表明价值观和积极/消极情绪的显著差异。

错误二:不当使用3D图形

二维空间的三维表示形式数百年来一直吸引着观众,但3D图形对数据可视化带来了两个严重问题。

  • 遮挡现象:发生在一个3D图形部分遮挡另一个图形时。这是模仿自然世界空间的结果——物体有不同的X、Y和Z坐标。在数据可视化中,遮挡会隐藏重要数据,并且会创建虚假的层级关系,使得未被遮挡的图形显得最为重要。

  • 扭曲现象:发生在3D图形通过透视缩短进入或突出图像平面时。在绘画中,透视缩短使物体看起来像是处于三维空间中,但在数据可视化中,它会产生更多虚假的层级关系。前景图形显得更大,背景图形显得更小,数据系列之间的关系被不必要地扭曲了。

比如这个饼图的前半部分看起来比后半部分大,尽管实际值分别为 30% 和 35%。

使用3D图形前要注意须知:

  • 3D图形引人入胜,但它们可能会遮挡重要信息并混淆数据系列之间的比例关系。

  • 除非绝对必要,否则应以二维形式可视化数据。

错误三:图表上展示过多的数据

在追求清晰传达的过程中,应该包含什么以及应该舍弃什么。这也是数据可视化的一个挑战,尤其是当数据既丰富又发人深省时。

当可视化包含过多数据时,信息会让人不知所措,数据会融成一锅图形大杂烩,让大多数观众难以消化。

"图表上展示过多的数据" 的不良影响:

  • 用户无法理解所有的可视化细节。

  • 用户不知道将注意力集中在哪里。

  • 在短时间内破译该信息将会很困难。

常见的注意事项:

  • 首先确定用户需要关注的内容,这样您就可以将数据限制为与您想要传达的信息最相关的数据。

  • 不要将所有见解都放在一张图表中。多种可视化可以帮助您更有效地传达数据。

  • 建议单次可视化中使用的颜色不要超过 5 至 6 种。

错误四:省略基线和截断刻度

数据会有差异,有时差异很大,比如根据地理区域测量收入水平或投票习惯时。为了使可视化更引人注目或更美观,设计师可能会选择操纵图表的刻度值。

一个常见的例子是省略基线或从Y轴的某个非零点开始,以使数据差异更显著。另一个例子是截断数据系列的X值,使其看起来与低值系列可比。


"省略基线和截断刻度"的不良影响:

  • 观众不能完全理解这些数据,这会导致误解。

  • 当观众意识到可视化显示的是错误的信息时,他们就会对该组织失去信任。

常见的注意事项:







请到「今天看啥」查看全文