专栏名称: 量化研究方法
以量化之思想认识世界,体会量化之美。
目录
相关文章推荐
51好读  ›  专栏  ›  量化研究方法

调查不懂误差,犹如盲人骑瞎马

量化研究方法  · 公众号  ·  · 2018-01-27 23:21

正文


如果给曹冲1000头大象,
他怎么称?


小时候学过曹冲称象的故事,聪明的小曹冲利用等重量的石头来计算出大象的总重量。如果我们假设给曹冲1000头大象,让他在一天之内称完,他怎么称呢?最准确的方法当然是一头一头称,只是,曹爸爸可能没有这个耐心。


这个时候,谋士中的统计学家可能会告诉曹冲,先给1000只大象编号,然后通过抓阄的方式选出来30头大象,通过计算30头大象的重量来推测这1000头大象的总重量。在统计学上,把这30头大象叫做样本,把这1000只大象叫做总体。我们通过30头大象的重量来预测1000头大象的过程就叫做推论。在这个过程中,如果抽出来的30只大象中偏瘦的大象多一些,那么可能推测出的总重量就少于实际重量。而如果抽出来的30只大象中,小胖子多一些,那么推测出的总重量则会高于实际重量。这种误差就是抽样误差中的一种。


然而,为了完成曹爸爸交代的任务,小曹冲只能接受这种误差的存在了。


统计推论是社会学家在认识社会世界时所采用的一种非常重要的方式,当我们研究的总体非常庞大时,比如农民工、下岗工人等,我们不可能找到所有的农民工和下岗工人去调查,而只能选择一部分人,通过调查这一部分人的情况来对整个农民工群体和下岗工人群体进行研究。一个好厨师,只需要尝一口汤,就能判断整锅汤的味道。如果厨师尝了一口又一口,大概客人就没什么汤可以喝了。在综合考虑社会调查的成本和各种条件的基础上,统计推论成为了解和研究某一总体最常用的方式。


“你幸福吗”?
问卷调查中的误差


央视曾经有一个节目,在街头随机采访,问路人“你幸福吗“?


一个大爷说,我不姓福,我姓王。


大爷的调侃讽刺意味十足。从统计学的角度看,这就是问卷并未真实获取拜访人的信息。在社会研究中,当我们做好研究设计,选择好了样本,就需要设计问卷,找到被调查者来进行问题的回答和数据的采集。而在真实的调查过程中,有很多不可控的因素。例如,一个调查员带着问卷去四川农村做调查,被调查的大爷正好“点泡”(就是让别人胡牌),心情不爽,这个时候调查员傻傻地问:大爷,你如何评价支农惠农政策?大爷说,不好,非常不好!本来大爷的真实态度是认为这项政策挺好,但调查员偏偏选择大爷输局的时候问问题,得到了这种相反的回答。


这个问题就没有得到受访者的真实信息。这是在问卷访谈环节中的误差。再比如,如果你问一个司机,你是否闯过红灯?为了自尊,他可能会隐瞒自己闯红灯的事实。这是问卷调查环节可能存在的误差。当受访者因各种原因作出违心的回答或者干脆不回答时,就产生了测量误差。


另外,调查员自己也可能产生误差。一个经典案例时,某一个调查项目的调查团队,某天赶上了下大雨,结果调查成员在房间里玩了一天扑克,到晚上每人负责填写10份问卷。这样的问卷所造成的误差,将产生严重的后果。


在问卷设计环节中,也有可能产生误差。例如,当我们想了解90后的文化特征,设置了对于火星文和网络流行语的看法,但是并没有提供其他问题。这就明显带有研究者的主观认知,认为90后就是喜欢火星文和网络流行语。这样的问题设计,就可能导致在对这个调查问题的数据误差。


误差有多种






请到「今天看啥」查看全文