专栏名称: 新语数据故事汇
《新语数据故事汇,数说新语》科普数据科学、讲述数据故事,深层次挖掘数据价值。
目录
相关文章推荐
51好读  ›  专栏  ›  新语数据故事汇

一文带您了解卡方检验:分类变量之间的相关性检验和Python示例

新语数据故事汇  · 公众号  ·  · 2024-07-13 14:03

正文

卡方检验(Chi square test)是一种统计方法,用于检验观察数据与期望数据之间的差异是否具有显著性。它用于分析分类数据,评估变量之间的关联性,以及判断实际观测结果与理论预期是否一致。卡方检验在医学、产品设计、工程以及各种研究项目中被广泛应用,帮助决策者确定数据中的显著差异并做出科学的决策。

有关统计检验的概念,可以参考:《 一文带您了解统计假设检验:几种常见的显著性检验方法 》。

卡方检验统计量的逐步计算过程

让我们通过数据实例来了解卡方检验的具体计算步骤。使用摸您COVID数据。我们将使用卡方检验来查看某些COVID症状与是否进入ICU之间是否存在关联。

示例数据

假设我们有以下数据,显示了100位COVID患者中,出现特定症状(如咳嗽、发烧)和是否进入ICU的情况:

症状

进入ICU

未进入ICU

总计

有症状

30

20

50

无症状

10

40

50

总计

40

60

100

步骤1:构建假设

  • 原假设(H0) :症状与是否进入ICU无关。

  • 备择假设(H1) :症状与是否进入ICU有关。

步骤2:计算期望频数

根据原假设,计算期望频数:

例如,有症状且进入ICU的期望频数:


对每个单元格进行类似的计算:

症状

进入ICU (E)

未进入ICU (E)

有症状

20







请到「今天看啥」查看全文