2009年世界银行发布名为《重塑世界经济地理》的世界发展报告,提出了包含密度
(Density)、距离(Distance)及分割(Division)三要素的“3D”分析框架。该框架能
够从不同地理尺度刻画世界经济地理格局,多应用于经济发展分析。该报告认为高密
度、短距离、低分割是经济发展成功的基础条件。人口流动是区域发展的重要动力,是
区域经济繁荣的表现,也受密度、距离和分割影响。在低自然增长率背景下,人口收
缩往往直接由人口流动所导致,因此可在“3D”框架下解析密度、距离、分割等因素对
人口收缩的作用(见表1)。
密度是指单位面积承载的经济体量,能较准确反映区域经济聚集度和经济发展程
度。托达罗预期收入差异理论表明,获取更多就业机会和更高预期收入是人口迁移流动
的根本动机。一个地区经济及人口密度越大,就业机会就越多,劳动力预期收入就越
高,也往往集聚着更优质和更丰富的服务产品,且能够通过集聚获得知识溢出效应。因
此,劳动力通常会做出缩减与经济密集区距离的选择,故而区域经济密度越大其人口
集聚能力越强,反之则人口收缩可能性越大。鉴于此,本文选择就业密度、人口密度、
GDP密度作为解释变量。
距离重点描述经济密集区与落后地区之间的距离,相比地级市和省会城市,山区
县往往是经济欠发达的地理空间单元,本文主要考虑山区县到地级市及省会城市的地理
距离。地级市和省会城市在经济社会发展方面虽具有较强辐射能力,但因其辐射范围有限,到上述两种城市距离的远近在一定程度上能反映山区县区位条件的优劣。区位优劣
则导致经济机会在空间上的不均衡分布,从而影响人口流动。交通基础设施的快速发展
对地方区位具有重塑作用,也为人口空间流动提供了支撑条件,对人口空间分布具有重
要影响。本文摒弃以往研究中采用的直线距离,采用山区县与其所属地级市、省会城
市的路径距离作为待考察变量。
分割相比密度和距离较为复杂,已有研究对分割并未达成一致看法。本文主要指文
化、政策、发展方向等与其他地区存在的差异,分别采用是否为重点生态功能区和少数
民族人口比例代表制度分割和文化分割。2011年国务院印发的《全国主体功能区规划》
将全国划分为四类主体功能区,其中限制开发区中的重点生态功能区是资源环境承载能
力较低,不具备大规模高强度工业化城镇化开发条件的区域,部分经济要素等往往不
能自由进入这类地区,区域经济发展条件有限,人口较易流失。少数民族地区一直以来
实行较为宽松的生育政策,加之少数民族人口在迁移过程中往往存在对其他文化的适应
障碍,因而少数民族聚居的地区在自然增长率较高的同时人口迁出可能性也较低,人口
“保持”能力较强。
为了系统考察山区人口收缩的驱动因素,还需将其他可能影响人口收缩的因素作为
控制变量纳入考察范围。人口迁移是区域人口收缩主要的直接驱动力量,除受“3D”因
素影响外,也受其他社会经济因素的作用。本文参考已有研究,将城镇化率、人均
GDP、是否曾经上榜“百强县”名单、人均财政支出、粮食产量、二三产业从业人口比例、平均受教育年限等作为控制变量衡量地区经济及社会综合发展水平。最后,人类的
生存和活动不可避免地受地理环境影响,地形等自然因素长期塑造着人口分布的空间格局,
本文加入气温、降水和地形起伏度作为控制变量表征自然地理环境①(见表1)。
本文聚焦人口收缩现象尤为明显的山区国土空间,研究范围参考2019年农业农村部
农业机械化管理司公布的丘陵山区县(市、区)名单划定。考虑到行政区划调整的影
响,本文以2020年行政区划数据为标准对研究区边界和范围进行调整,以进行年际间比
较,最后整理出共计1421个山区县作为本文研究区。
本研究所用数据主要包括:①人口普查数据。文中常住人口、少数民族人口占比、
从业人员、平均受教育年限等来源于第五、六、七次全国人口普查区县数据集。②
社会经济统计资料。计算2000年、2010年和2020年人口密度使用的行政区域面积来源
于《中国县域统计年鉴》,国内生产总值、财政支出、粮食产量等主要来源于2011年
《中国县域统计年鉴》、《中国区域经济统计年鉴》以及各地市统计年鉴;百强县数
据来源于中国社会科学院财经战略研究院、赛迪顾问等发布的2010—2020年全国县域经
济基本竞争力百强县(市)名单②;重点生态功能区数据来源于国务院2010年底印发的
《全国主体功能区规划》中《国家重点生态功能区名录》。③气象数据。气温和降水
数据来源于国家气象科学数据中心(http://data.cma.cn/)的地面气候资料日值数据集,通
过整理、计算和插值分析生成2010年各区(县)平均气温和平均降水量。④地理空间要
素信息。DEM采用中国科学院资源环境科学数据中心发布的全国1km×1kmDEM数
据,地形起伏度参考封志明等提出的方法计算获得;各山区县与其所属地级市、省份
省会的距离在DataMap For Excel中基于路网计算获得。
本文从静态的人口分布和动态的人口变化两个视角出发考察山区人口收缩。首先,
基于人口密度对中国山区县进行地域类型划分,通过山区县人口分布类型变化考察人口
收缩特征;其次,采用人口年均变化率量化表征山区县人口收缩,采用GIS空间可视化
分析方法辨识人口收缩的空间格局。在此基础上,以山区县是否发生人口收缩和人口收
缩程度为因变量,利用计量模型分析山区县人口收缩的影响因素。
2.3.1人口收缩的测度方法
人口收缩一般是指具有相对独立社会经济体系的区域在一定
时期内出现总人口(或劳动就业人口、家庭)数量持续下降的现象。由于总人口指标
相对直接,且数据丰富,易于开展长时间尺度研究,故往往采用基于总人口数据计算的
人口年均变化率测度人口收缩率,即:
式中:R(t1,t2)表示年均人口变化率;Mt1和Mt2分别表示t1和t2年份的总人口数量;n表示t1
和t2之间间隔的年数。当R(t1,t2)<0时,该区域出现人口收缩,且R(t1,t2)的绝对值越大,说明
该区域人口收缩程度越深;反之,则为人口增长。
2.3.2人口密度类型划分
本文参考葛美玲等的研究,按照人口密度将中国山区县划分为4个类型:基本无人区(<1人/km2)、稀疏区((1~100)人/km2)、过渡区((100~
200)人/km2)和集聚区(>200人/km2),通过山区县人口密度类型变化洞察山区人口收
缩的空间格局。在此基础上,通过县域人口密度类型的变化考察山区县人口收缩。
2.3.3计量回归模型
由于山区县是否发生人口收缩并非完全随机,而是受区位、经济社
会发展水平和制度、文化等因素影响,因此存在样本选择上的内生性。Heckman两阶段
模型可以解决样本选择偏误,同时能在一定程度上规避潜在的内生性问题。因此,本
文采用Heckman两阶段模型分析山区县人口收缩的影响因素。该模型的两个阶段分别估
计两个方程,被解释变量分别为“是否出现人口收缩”和“人口收缩程度”。具体来说,
人口年均变化率结果中小于0的即人口收缩,赋值为1,大于0的即人口增长,赋值为0。
将人口年均变化率中小于0的数值取绝对值表示山区县人口收缩程度,绝对值越大,收
缩程度越大。各阶段方程如下:
第一阶段:以“山区县人口是否出现收缩”为被解释变量,采用Probit模型估计人
口收缩的概率,概率方程如下:
第二阶段:利用选择后的样本对人口收缩程度进行回归,回归方程如下:
式中:Pit表示t年i县人口出现收缩的概率;X1it表示影响山区县人口是否发生收缩的多
个可观测因素;yit表示t年i县的人口收缩程度;X2it表示影响人口收缩程度的一系列因
素;λi表示逆米尔斯比率(Mills),若λ显著不等于零,说明存在“自选择”问题;μi
和εi分别表示概率方程和回归方程的误差项,均服从均值为零的正态分布;i代表县;t
代表年份。
回归方程中的λi:首先估计概率方程(2),对所有样本进行Probit回归,得到未知
参数向量的α和σ的估计值;其次通过公式,计算出各县的λ,最后将其作为新变量纳
入回归方程(3)中。λ计算公式如下:
式中:φ(-X1itασ)和
ϕ
(-X1itασ)分别为标准正态分布的密度函数和概率分布函数;α为
概率方程解释变量的回归系数集;σ为概率方程误差项μi的标准差。
Heckman两阶段模型要求两个阶段的解释变量具有严格子集关系,即公式(2)要
包含公式(3)的解释变量,且至少存在一个解释变量只影响山区县人口是否发生收缩而
不影响其人口收缩程度。一般而言,是否被评为百强县对山区县人口是否出现收缩有较
为直接的影响,而对人口收缩程度的影响并不明显,可将该变量引入模型第一阶段。
2.3.4地理探测器
地理探测器是探讨空间分异并揭示其驱动力的统计学方法,其因子探
测模块可以对影响因子进行识别,交互探测可以解释影响因子对因变量的交互作用,是
研究复杂地理因素驱动作用机理的有效工具。山区人口收缩是地表自然层、生计层、
制度层和意识形态层四个圈层中的因子共同作用且交互影响的结果,采用地理探测器中
的交互探测模块可以有效识别各圈层因子间的复杂作用路径,洞察山区人口收缩的形成
机制。地理探测器的基本模型为:
式中:q表示各变量对山区人口收缩的解释程度,数值越大说明自变量对因变量的解释
力越强;N和σ分别表示研究区整体的单元数和方差;在交互作用探测过程中,需要先对不同解释变量进行空间叠置分析产生新的交互变量,进而判别其对因变量的因子解释力
是增强还是减弱;L表示因变量Y或自变量X的分层,即分类或分区;Nh和σh分别表示层
h内的单元数量和方差。具体方法为:先计算两种因子的q值,然后将两个因子进行交互
并得到交互变量的q值;最后,通过比较交互作用和独立影响的q值。根据比较结果,可
以将因子之间的关系分为非线性减弱、单因子非线性减弱、双因子增强、独立和非线性
增强五类。