某研究者拟观察某新药的抗肿瘤效果,将 70 名肺癌患者随机分为两组,分别采用该新药和常规药物进行治疗,观察两组肺癌患者的生存情况,共随访 2 年。研究以死亡为结局,两种治疗方式为主要研究因素,同时考虑调整年龄和性别的影响,比较两种疗法对肺癌患者生存的影响是否有差异。变量的赋值和部分原始数据见表 1 和表 2。
表 1. 肺癌患者生存的影响因素与赋值
表 2. 两组患者的生存情况
该研究以死亡为结局,治疗方式为主要研究因素,每个研究对象都有生存时间(随访开始到死亡、失访或随访结束的时间),同时考虑调整年龄和性别的影响。欲了解两种疗法对肺癌患者生存的影响是否有差异,可以用 Cox 比例风险模型(Cox proportional-hazards model,也称为 Cox 回归)进行分析。
实际上,Cox 回归的结局不一定是死亡,也可以是发病、妊娠、再入院等。其共同特点是,不仅考察结局是否发生,还考察结局发生的时间。
在进行 Cox 回归分析前,如果样本不多而变量较多,建议先通过单变量分析(KM 法绘制生存曲线、Logrank 检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再进行多因素分析,这样可以保证结果更加可靠。即使样本足够大,也不建议把所有的变量放入方程直接分析,一定要先弄清楚各个变量之间的相互关系,确定自变量进入方程的形式,这样才能有效的进行分析。
单因素分析后,应当考虑应该将哪些自变量纳入 Cox 回归模型。一般情况下,建议纳入的变量有:1)单因素分析差异有统计学意义的变量(此时,最好将
P
值放宽一些,比如 0.1 或 0.15 等,避免漏掉一些重要因素);2)单因素分析时,没有发现差异有统计学意义,但是临床上认为与因变量关系密切的自变量。
2. Analyze→Survival→Cox Regression
1)主对话框设置
:
① 将生存时间变量送入 Time 框中 → ② 将结局变量送入 Status 框中 → ③ 点击 Define Event → ④ 定义表示终点事件发生的数值(此例中为死亡,用 1 表示)→ ⑤ Continue → ⑥ 将分组因素和需要调整的变量送入 Covariates 框中 → ⑦ Method 选择 Forward:LR。
对于自变量筛选的方法(Method 对话框),SPSS 提供了 7 种选择,使用各种方法的结果略有不同,读者可相互印证。各种方法之间的差别在于变量筛选方法不同,
其中 Forward: LR 法(基于最大似然估计的向前逐步回归法)的结果相对可靠,
但最终模型的选择还需要获得专业理论的支持。
2)Categorical Covariates 选项设置:
① 将分类变量 group 选入右侧 Categorical Covariates 里
→
② 并选择 Reference Category 以 First 为参比(即选择最小数值为参照组),其他按默认选项 → ③ Change → ④ Continue。
注意:在数据录入时,建议将二分类变量赋值为 0 和 1;多分类变量赋值为 0、1、2、3 或者 1、2、3、4 等,并根据以下情况设置
Categorical Covariates
选项:
A.
以下情况,可以不定义
Categorical Covariates 选项
:当自变量是二分类变量,并且赋值的差值为 1,例如赋值为 0 和 1,也不需要绘制该变量不同组间的生存曲线时。
B. A 以外的情况都必须定义
Categorical Covariates 选项。需特别注意两种情况:① 当自变量是二分类变量,但要在 Plots 选项中设置,得到不同组间的生存曲线时。
比如本例中,group 为二分类变量,但要观察不同用药组间的生存曲线,就需要在 Categorical Covariates 选项中定义 group 变量;
② 多分类变量时。
3)Plots 选项设置:
要绘制生存曲线,① 可选择 Plots Type 中的 Survival 作为输出的图形 → ② 将主要分类变量选入右侧 Separate lines for 中,可以输出该变量不同组间对应的生存曲线,其他按默认选项 → ③ Continue。
4)Options 选项设置: