专栏名称: 马同学图解数学
看图学数学!可能是中国最好的高等数学的基础概念讲解,深入浅出、形象生动。没有高深的数学符号,只有你能懂的数学内容。
目录
相关文章推荐
超级数学建模  ·  比Samba还火!这双鞋没人能拒绝,新配色难 ... ·  昨天  
超级数学建模  ·  当我有两条裙子,刚好男朋友也想试试... ·  昨天  
超级数学建模  ·  这本书拿起来,就放不下! ·  2 天前  
超级数学建模  ·  3分钟,1000年,看古建惊艳! ·  3 天前  
超级数学建模  ·  牛逼!就因为它,已经看不上2000元的飞*浦了! ·  3 天前  
51好读  ›  专栏  ›  马同学图解数学

如何理解置信区间?

马同学图解数学  · 公众号  · 数学  · 2017-12-12 09:00

正文

置信区间,就是一种区间估计。


先来看看什么是点估计,什么是区间估计。


1 点估计与区间估计

以前很流行一种刮刮卡:



游戏规则是(假设只有一个大奖):

  • 大奖事先就固定好了,一定印在某一张刮刮卡上

  • 买了刮刮卡之后,刮开就知道自己是否中奖


那么我们起码有两种策略来刮奖:

  • 点估计 :买一张,这就相当于你猜测这一张会中奖

  • 区间估计 :买一盒,这就相当于你猜测这一盒里面会有某一张中奖


很显然 区间估计 的命中率会更高(当然费用会更高,因为风险降低了)。


接下来,我们看看置信区间是如何进行区间估计的。


2 置信区间

我们通过对人类身高的估计来讲解什么是置信区间。


2.1 上帝视角


对于人类真实的平均身高,我们是没有办法知道的,因为几乎不可能把每个人都统计到。


但这个数据肯定是真实存在的,我们可以说,上帝知道。


在这里我们引入了上帝视角,即上帝看到的人类身高的真实分布。


假设人类的身高分布服从如下正态分布( ):



也就是说全体人类的平均身高为145cm,为了表示只有上帝可以看到,我把真实分布用虚线来表示:



2.2 点估计


作为愚蠢的人类,我们只能在人群中抽样统计:



比如下面是一次抽样数据,我把算出来的样本均值(记作 )画在图上(蓝色的点):



就是对真实的 的一次点估计。


通过一次次的抽样,我们可以算出不同的身高均值的点估计:



如果我们关闭上帝视角,我们分辨不出哪个点估计更好:



区间估计可以改进此问题。


2.3 置信区间


置信区间,提供了一种区间估计的方法。


下面采用 置信区间来构造区间估计(什么是 置信区间,这个我们后面解释):



通过 置信区间构造出来的区间,我们可以看到,基本上都包含了真实的 ,除了红色的那根。


关闭上帝视角,我们仍然不知道哪一个区间估计更好:



但是,和点估计比较:

  • 点估计和区间估计,都不知道哪个点或者哪个区间更好

  • 但是,按照 置信区间构造出来的区间,如果我构造出100个这样的区间,其中大约有95个会包含


这就好像用渔网捞鱼,我知道一百次网下去,大约会有95次网到我想要的鱼,但是我并不知道是不是现在这一网:



剩下的问题就是 置信区间是如何构造的。


3 置信区间

假设人群的身高服从:



其中 未知, 已知。


我们不断对人群进行采样,样本的大小为 ,样本的均值:



根据大数定律和中心极限定律, 服从:



我们可以算出以 为中心,面积为0.95的区间,如下图:



即:



也就是, 的几率落入此区间:








请到「今天看啥」查看全文