截至目前,全球 COVID-19 确诊病例超 100 万例
图片来源于 Johns Hopkins University
二月初,国内疫情发生,我们推送了第一篇
用数据直面疫情
,分享了国内数据分析师的疫情可视化作品及中国疫情数据。
如今,全球抗疫!更多的国外数据分析师,用自己的方式助力抗疫。
在英国读书的中国留学生
吴芃
,在社交媒体发布自制的英国疫情数据增长图,受到英国媒体和官方的关注和好评。
图片来自网络
Yes,数据分析师们正在凭一己之力帮助抗疫:用数据和图表的形式去展现客观事实!
今天,我们首先看几个 Public 中关于全球疫情不同角度的分析作品。
作者 Rally for Restaurants 使用 Toast 平台的数据,创建了这个仪表板,呈现了日均收入趋势以及从堂食向外卖就餐方式的转变,旨在帮助美国各地的餐厅及其顾客更好地了解 COVID-19 疫情如何影响餐饮行业与饮食方式。
Public 链接
:
https://public.tableau.com/profile/toast7104#!/vizhome/HowCOVID-19isAffectingRestaurants-City/CityLevelView
疫情防控期间,世界各国政府对学校实行停课。在下面这个可视化中,作者介绍了各国学校停课和相关社会保护战略的教育对策。
Public 链接
:
https://public.tableau.com/profile/nicco.cirone#!/vizhome/COVID-19EducationalResponsestoSchoolClosures/COVID-19EducationalResponsestoSchoolClosures
Public 链接
:
https://public.tableau.com/profile/devexdevdata#!/vizhome/COVIDFundingvisualisation/COVID-19funding
为帮助数据用户更好的了解和分析疫情数据,Tableau 专门开设了关于 COVID-19 可视化的专题页面,以便人们可以及时了解并准确地探索 COVID-19 全球数据可视化。
链接地址:
https://public.tableau.com/en-us/s/covid-19-viz-gallery
同时,对于
疫情数据的可视化分析思路及方法,以及如何便捷获取疫情数据源
方面,Tableau 也给出了一些建议:
创建疫情数据可视化时,请务必记住,尽管它包含来自受信任来源的数据,但由于测试和报告方法大相径庭,因此很难估算出全球 COVID-19 病例的准确数据。
而使用正确的数据和分析方法,创建负责任的数据可视化,可以尽量避免误导与恐慌。
相信下面列出的 10 项注意事项,可以助力大家构建疫情仪表板一臂之力!
要深入了解数字背后的含义,而不仅仅是直接下载与钻取数据集
有关 COVID-19 病例的可用数据不是一个可以自动操作并使用不同图表概念的数据集,尤其是你打算公开发布时。
始终了解你正在使用的数据的上下文是个好习惯,但这对于在流行病期间创建和共享可视化来说,是必不可少的。
病例数据虽是易于获取、全面且定期更新的数据源,但这并不意味着它们易于可视化
你可以从主要资料来源(如疾病预防控制中心、卫生部、国家卫生有关部门和其他机构收集的数据)中找到病例数量,并汇总数据集(例如 Johns Hopkins COVID-19 仪表板的数据集)。
病例数据似乎很适合用地图可视化来呈现,
并且有助于回答:在我居住的地方/旅行的地方/打算去的地方附近有病例吗?
但是这些数字的可视化很容易产生误导。请清楚说明它们代表哪种病例,你可以在 WHO 网站上找到病例的定义。
如果要建立地图,在创建自己的地图之前,可以先参考 Kenneth Field 制作的 Viz(如下图)。
与右边的版本相比,左边的地图并不是个很好的用例。右边的版本用比率来呈现数据,而非计数。而且颜色的运用上感觉更平缓,而非让人容易感到惊恐。
通过 Tableau 和其他工具,你可以轻松快速地创建图表、图形和地图,并使用这些数据进行计算。在数据可视化中创建组和国家之间的基准或比较也是一种常见的做法。
但是,在对COVID-19 数据创建可视化时,这些计算需要反映流行病学的基本原理。
不
同病例定义(包括 COVID-19 定义)的细微差别会影响它们是否可以聚合。
在公共卫生中,有一些计算指标(例如病死率),具有非常具体的定义,它们用于理解和监控疾病的传播和对人类的影响。你拥有
可以在一组健康统计数据上执行一个数学函数的能力,但并不意味着就应该这样做
。
所以,在计算任何比率时要格外小心,最好将比率的计算留给流行病学家。
很多因素都会影响病毒的传播和影响,例如政府采取措施来控制传播和潜在的人口统计。
由于存在这些差异,
在人口规模、政治环境和公共卫生系统相差悬殊的国家之间进行比较时,要考虑一下隐含的内容。
例如,意大利的人口老龄化程度高于中国或美国。由于老年人已被确定为感染风险较高,且更有可能需要医院护理,因此意大利需要住院治疗的病例百分比可能高于人口较年轻的国家。
用于可视化分析的数据存在很多不确定性,尤其是在试图推断到一般人群时。
对于新发的疾病,分类查看亚群体的病例和发病率可以帮助我们更好地了解这类疾病。
确诊病例的数量只是该人群中一部分感染者,需要分类查看该群体的寻求健康行为
(如果生病了,要去看医生吗?)、
试剂盒可用性
(如果去医院,我可以检查吗?)、
卫生系统因素和其他注意事项。
COVID-19 并非死刑判决,所以需要在可视化中正确注明这一点。另外在病例数量可视化中,也需要呈现“已康复的案例”这项必不可少的内容。
以上图表每天都通过 Johns Hopkins 的数据进行更新
在此重申:如果没有一个准确的分母,计算死亡率之类的计算是很有挑战性的。因此请把死亡率的计算留给流行病学家。
流行病学家和公共卫生机构创建了复杂的模型来预测疾病发展演变的可能性
这些数据可能不会被放入仪表板中,但有时会在静态图表和图形中被引用和获取。使用来自 WHO、CDC 和其他公共卫生专家的模型结果的好处是,它们通常会在发布之前经过一定程度的同行评审。
如果将这些数据加入到可视化中,请谨慎操作!
模型很复杂,因为他们综合考虑病毒的行为,人类行为和系统因素。因此,模型将会改变。
如需使用模型中的数据,请清晰全面地记录输入和源。
谨慎使用数据科学家和统计学家的疾病预测模型和相关结论
除非它们有充分的来源,记录和解释的内容,否则在构建可视化和分析时必须谨慎使用。
最好先由流行病学家或具有相关专业知识的人员进行验证。
对疾病进行建模是个复杂的过程,粗略地讲,“封底”计算更有可能适得其反。
所以,我们更应该参考公共卫生机构和专家提供的资源丰富的模型。
如果你正在致力于创建有关 COVID-19 的可视化,那么在发布任何可视化图表或地图之前,请先阅读有关此环境下负责任的可视化方法的现有资源。
Datawrapper 具有出色的 COVID-19 负责任可视化视图,并记录了他们所做的设计决策:
链接地址:
https://blog.datawrapper.de/coronaviruscharts/
出色的 Datawrapper 团队“在进行这些可视化时的考虑”
正确引用术语(请参阅 WHO 关于 COVID-19 病例的定义,R0的解释器以及CDC术语表作为参考资料),并确保在可视化中的某个位置清楚地为仪表板的受众定义每个指标
,可以是脚注、标题、副标题、注释、解释文字...
考虑在可视化中使用的语言。
请记住,每个数据点都代表着 COVID-19 数据集中的一个人。如果你不愿意让来自高危人群的人阅读你构建的可视化,请进行修改。
适时进行自我隔离。确保我们不会对来自发生大量病例的国家和地区的人有歧视甚至是侮辱性言论。
查看上图了解我们可以采取哪些其他方式来使曲线更平缓,并减慢病毒在社区中的传播
最后,如果你觉得自己没有足够的公共卫生知识来对 COVID-19 进行讨论,可以考虑可视化其他有关受影响社区的相关数据。流行病数据不应该是一个仅仅用来在社交渠道上炫耀的数据集。
data.world 的 COVID-19 数据源页面提供了不同的数据源方式,以便分析人士实现更高效的实时追踪与可视化探索。
更新时间:EST 时间每天上午9:00刷新(北京时间22:00)
-
CSV文件:
下载地址:
https://data.world/covid-19-data-resource-hub/covid-19-case-coun
ts/wo
rkspace/file?filename=COVID-19+Cases.csv