人口大数据是本次论坛的主题,那么
大数据到底为人口的服务与管理带来怎样的变革呢?
李颖女士总结了清华同衡技术创新中心在多源数据融合用于人口分析中的实践经验。
在数据源方面
,利用手机信令、企业注册信息、一卡通、滴滴出行、出租车GPS数据等新数据,也包括统计数据、普查数据、抽样数据、调查数据等传统数据,对人口活动与城市空间的关联进行解读。
多源数据的融合可以形成关联彼此互补
。通过建立总量、时间趋势、空间分布的三级分析体系对各类数据进行评估,保证数据的可靠性。研究分为几个方面:
大数据与传统数据的融合方式——扩样与常住人口转换。
扩样是将手机运营
商的用户数量转换为人口数量,主要利用手机信令进行人口数量扩样。还包括分空间结构扩样、分年龄结构扩样、分时序扩样等扩样方法。常驻人口转换,目的是建立手机居住用户数量与常住人口数量的关系,能够帮助政府实现管理服务工作的需要。
监测人群动态特性的方法——多空间尺度的人口分析。
建立出对应各空间尺度需求的应用和指标。在人口空间分布、人口迁徙、通勤联系、休闲活动、人口数量、人口特征、人口变化特征等主题上进行监测与分析。在区域城镇空间结构评估、城市功能结构评估、职住平衡评估、通勤特征、交通出行特征识别、设施布局与使用评估、人口数量测算、人口结构识别、用地功能识别等方面进行了应用。
对人口变化趋势的预测并逐步替代抽样调查的探索。
在人口预测实践中,尝试了贝叶斯时空预估算法与时空综合模型进行人口预估模型构建,其中贝叶斯时空过程模型满足数据粒度为月的预估,时空综合算法可将数据粒度细致到天,两个模型对朝阳区居住人口、活动人口的数量进行了全面解读,相对偏差小于5%,随着数据的累积,今后可以不断地补充新数据与调节参数优化模型精度。
人口综合分析平台的建设。
把研究成果电子化、平台化能够更快速、及时地满足政府部门、企事业单位以及公众对地理信息、空间定位和分析的基本需求,并且具备个性化应用的二次开发接口和可扩展空间,能够实现定制化建设。
最后,李颖女士对人口数据分析面临的
困难与思考
做了总结。困难包括推动规则标准化、改进参数质量、强化人口数据综合治理等方面。同时,建立新老数据融合的长期机制、建立实时模型与城市治理政策的互动机制等都是我们还需要思考的问题。