专栏名称: 协和八
协和八,小医生的大世界!源自协和的品牌,让临床妙趣横生,让思考更真诚,让生活更奇妙。
目录
相关文章推荐
51好读  ›  专栏  ›  协和八

来来来,给你的数据也美图秀秀下 | 协和八

协和八  · 公众号  · 医学  · 2017-06-14 21:58

正文

统计图是统计描述的重要工具,也是辅助作者和读者沟通的有效工具,它在视觉上比统计表更简洁明了,但是面对多种多样的统计图,你真的会用吗?

假如一张统计图只要展示一个变量,比如一组病人的某个体检指标,那么就属于单个变量的数据。变量又可以分为连续变量和分类变量。对于连续变量来说,统计图可以展示出数据的范围、分布,以及一些统计量,如均数、中位数、样本量等。在《Heart》杂志刊出的一篇综述《Graphics and statistics for cardiology: comparing categorical and continuous variables》中[1],作者对如何根据数据特点选择合适的统计图进行了详细的讲解。

单个连续变量的数据

小样本量数据

对于小样本量数据(如n<30),建议使用 点图 (Dot chart),点图可以绘制出沿着一个轴分布的观测值,假如这些点都不重合的话,采用点图可以清楚地看到每个值的分布,如图1(A)。

当出现许多相同的观测值时,可以使用 堆栈式点图 (Stacked dot chart),通过将相同的观测值竖直堆砌,可以清楚地看出观测值的重复性,如图1(B)。

中等样本量数据

对于50


总的来说,对于小样本或中等样本量的数据,点图比箱式图(Boxplot)更合适。

大样本量数据

而对于大样本量数据来说,数据点太密和太小的问题显然是无法避免的,但是对于大样本来说,个体的某个观测值也不会太影响结果的解释,因此可以直接描述数据的范围和分布,而不用必须展示出每个观测值。具体可采用 直方图 (Histogram),见图3(A); 小提琴图 (Violin Plot),见图3(B);和 箱式图 ,见图3(C)。







请到「今天看啥」查看全文