卡方检验(Chi square test)是一种统计方法,用于检验观察数据与期望数据之间的差异是否具有显著性。它用于分析分类数据,评估变量之间的关联性,以及判断实际观测结果与理论预期是否一致。卡方检验在医学、产品设计、工程以及各种研究项目中被广泛应用,帮助决策者确定数据中的显著差异并做出科学的决策。
有关统计检验的概念,可以参考:《
一文带您了解统计假设检验:几种常见的显著性检验方法
》。
卡方检验统计量的逐步计算过程
让我们通过数据实例来了解卡方检验的具体计算步骤。使用摸您COVID数据。我们将使用卡方检验来查看某些COVID症状与是否进入ICU之间是否存在关联。
示例数据
假设我们有以下数据,显示了100位COVID患者中,出现特定症状(如咳嗽、发烧)和是否进入ICU的情况:
症状
|
进入ICU
|
未进入ICU
|
总计
|
有症状
|
30
|
20
|
50
|
无症状
|
10
|
40
|
50
|
总计
|
40
|
60
|
100
|
步骤1:构建假设
-
原假设(H0)
:症状与是否进入ICU无关。
-
备择假设(H1)
:症状与是否进入ICU有关。
步骤2:计算期望频数
根据原假设,计算期望频数:
例如,有症状且进入ICU的期望频数:
对每个单元格进行类似的计算:
症状
|
进入ICU (E)
|
未进入ICU (E)
|
有症状
|
20
|