(一)21指标固定效应模型残差分析
在第一部分,我们以工业增加值同比增速与GDP同比增速的面板数据作为因变量构建固定效应模型,拟合程度良好(R2为0.89与0.82)。在本部分,我们假设模型成立,在模型的基础上算出30各省(除去西藏)2004年-2017年的残差,从而判断回归中出现的异常值(见表5与表6)。残差(residual)是因变量的观测值与根据估计的回归方程求出的预测之差,反映了用估计的回归方程去预测而引起的误差。
从模型1结果来看,北京、海南、上海、宁夏、青海、新疆、甘肃、山西残差较大且为负值,可以理解为这些省的自变量指标增长情况更好,而工业增加值增长情况低于以回归系数计算的预测值;河南、江苏、山东残差较大且为正值,可以理解为这些省份自变量指标增长一般,但工业增加值增速高于以回归系数计算的预测值。此外,黑龙江省2015年残差明显上升,江苏与山东2017年残差较大,可以视为异常值。
从模型2结果来看,北京、海南、上海、宁夏、青海、新疆、甘肃、山西残差较大且为负值,可以理解为这些省的自变量指标增长情况更好,而GDP增长情况低于以回归系数计算的预测值;河南、江苏、山东残差较大且为正值,可以理解为这些省份自变量指标增长一般,但GDP增速高于以回归系数计算的预测值。此外,黑龙江省2015年残差明显上升,江苏与山东2017年残差较大,可以视为异常值。两个模型结果基本一致。
(二)9指标指标固定效应模型残差分析
在进一步的计量中,我们以选择后的9个指标进行回归分析,指标包括:CPI、PPI、铁路货运量同比增长率、房地产新开工面积同比增长率、中长期贷款同比增长率、贷款/GDP、用电量同比增长率、商品零售总额同比增长率、进出口额/GDP。
在回归的基础上我们计算标准化残差值,标准化残差(standardized residual)是残差除以其标准差后得到的数值。如果误差项服从正态分布的这一假定成立,则标准化残差的分布也服从正态分布,大约有95%的标准化残差在-2~2之间。
从模型1结果来看,山东和上海残差较大且为正值,可以理解为这些省份自变量指标增长一般,但工业增加值增速高于以回归系数计算的预测值。海南、宁夏、青海、新疆残差较大且为负值,可以理解为这些省的自变量指标增长情况更好,而工业增加值增长情况低于以回归系数计算的预测值。
从模型2结果来看,上海、天津、广东残差较大且为正值,可以理解为这些省份自变量指标增长一般,但工业增加值增速高于以回归系数计算的预测值。海南、宁夏、山西、新疆残差较大且为负值,可以理解为这些省的自变量指标增长情况更好,而工业增加值增长情况低于以回归系数计算的预测值。
总体来看,9指标固定效应模型拟合程度较高,残差在合理范围之内,我们认为模型稳定有效,指标能够反映地区经济运行情况。