专栏名称: 文化产业评论
业内最专业、最优秀,中国文化产业价值分享及综合服务平台
目录
相关文章推荐
陕西省文化和旅游厅  ·  陕西过大年 | ... ·  2 天前  
陕西省文化和旅游厅  ·  陕西过大年 | ... ·  2 天前  
西安晚报  ·  明天22时10分!陕西正式进入... ·  4 天前  
51好读  ›  专栏  ›  文化产业评论

保继刚:应用大数据进行国内旅游统计的思考及操作

文化产业评论  · 公众号  ·  · 2024-07-02 21:57

正文


第4266 期三川汇文化产业

点上 方蓝字「三川汇文化产业」关注并星标


近日 ,2024中国旅游产业高质量发展研讨会在北京召开。 中国旅游协会副会长,中山大学经济与管理学 部副主任、旅游学院教授、旅游发展与规划研究中心主任,联合国旅游组织第16届尤利西斯奖获得者保继刚在会上发表题为“应用大数据进行国内旅游统计的理论思考及操作性实验案例研究”的演讲。他对旅游统计中的“说不清道不明的旅游人次”及“纵向不可加,横向不可比”的国内旅游人数发出疑问。同时,他以学者严谨缜密的理论思考和案例研究,提出将尺度观引入旅游统计,使用大数据如信令及银联数据和移动通信数据,弥补传统旅游统计的缺失。此外,还对引入了大数据技术后旅游人数统计存在的问题及原因进行深度挖掘。


编审 | 时光

编辑 | 半岛

来源 | 中国旅游协会




一、将尺度观引入旅游统计思考


对于研究者来讲,得到好的数据我们能得出正确的结论,如果研究者得到错误的数据我们会得到精确的错误结论,因为我们的模型是精确的。很感谢这些年我的团队和学术界的研究中有一些很精确的数据,这里特别表扬一下黄山,黄山每年公布的数据没有水份并且都是买票的数据,不累加别的数据,实事求是有多少就是多少,所以要为他们点赞。

只要是卖门票的地方给的数据都是准确的,因为门票的收入做不了假。城市旅游数据比较麻烦,国家公布的数据和每个省公布的数据的累加一直是不可比的,有人会说我们国家公布的数据是通过抽样调查的出行数据,各个省的数据是各个省的接待数据,但是问题是没有人说明他们两个为什么不可比,或者说我们很少会知道数据是怎么来的。

2019年文旅部公布的国内游客是60亿人次,31个省市自治区加起来是170亿人次,特别是2022年,因为疫情三年本是一个最好的挤水份的机会, 可2022年文旅部公布的数据是25.30亿人次,全国加起来是97亿人次,倍数还增加了,全国加起来的数据是国家公布的3.8倍。

我用几个极端的例子给大家展示一下这些数据,广东省、贵州省、云南省。原来云南的数字还少一些,这两年已经远远超过贵州和很多地方。广东省2018年是4.53亿人次,2019年是4.94亿人次,2021年是2.54亿人次,2022年2.01亿。贵州2018年9.67亿人次、2019年11.34亿人次,2019年是全国第一,旅游收入是1.1万亿;2021年6.44亿人次,2022年降到4.92亿人次。云南省2021年开始超过贵州,达6.49亿人次,2022年超过了更多,高达8.41亿人次。贵州和云南都超过广东很多。

这几组的数据矛盾特别大,广东1.2亿常住人口,经济全国第一,消费全国第一,酒店量全国第一,机场吞吐量广州机场是全国三大机场之一,深圳机场全国五大机场之一。广东省国内游客量比云贵这两个省的数字小很多,与我们的常识不符。广州机场吞吐量在2019年是7300多万人次,深圳大约5300万人次,昆明4800万人次,贵阳约2200万人次。

2019年国内旅游数据广州公布是5800万人次,昆明1.8亿人次,贵阳2.2亿人次。一个城市超过2亿人次游客是一个天文数字,这是一个违反常识的问题。

为什么会出现这样的问题?按照国家公布的统计方法,肯定不会出现这么大的数字,但是在实际操作的时候不是这样统计的,比如说一个省的数据可以是以县为单位的,一个县报给地级市,地级市报给省,进行累加。

还有以县或者地级市为单位的数据又是怎么得到的,有的可能是按照景区(景点)的数据,所以你们去分析全国各个大城市的旅游数据,收门票景点越多的城市数据量就会越好,如果说这个城市有20个收门票的地方,每个游客平均去了8-10个,一个游客就会被算了10次。晚上住酒店再算一次,旅行社接待算一次,一个游客就会被计算超过10次,我所研究过的以旅游为主的目的地,大概10倍是起步,10多年前大概是5-6倍,现在大概是10倍以上。没有极限的增长,一直不敢把增长速度放下来,我们的增长速度大概每年是8%-10%,一般不会低于8%。到最后本来是5、6倍的,就整成七八倍十几倍都有了,这就是过去的数字。

前两年又有一个省说我们是用大数据,使用大数据以后,如果是完全的没有处理过的原始数据,比如说现在三大运营商的手机用户是17亿多,就可能会有一个人用两个号,有路过的,有异地手机本地使用的,有汽车自动收费卡的等,都可以被计算在内。在没有对这些数据清洗情况下,大数据也会夸大实际情况。同时,大数据统计的是人天数不是人次数,因为大数据每天都会被统计到,每天统计累加起来就是人天数,一个人住了三天的信号被捕捉到就成了三个人次,这就是我们现在可能出现的问题。

中国的旅游经济在全世界相比也是高的超出旅游经济常识,西部某省一万多亿的旅游收入,省委书记省内开会问一万多亿的旅游收入,这么多钱哪儿去了。相关部门回答,藏富于民。如果说某省一万多亿旅游收入按照3900万人口,人均旅游经济收入是2.4万元,从旅游目的地视角来看这个数字非常高。但是事实不是这样的,因为这一万多亿是按游客平均消费计算出来的。 首先是进行游客抽样,多数是对异地游、跨省游的游客抽样。 比如抽样的游客人均消费是1000元,但是假如游客被统计了10次,就是10000元,实际只消费了1000元。

这就是为何现在旅游收入数据也特别高,跟我们的常识又不符,才一万多亿的GDP有一万多亿的旅游收入,尽管这两个一个是增加值,一个是总收入不可比,但是我们可以类比一下这样的占比,实际上是不可能的。

今天的旅游统计跟现实之间的矛盾已经越来越大,按照原国家旅游局的界定,现在执行的统计定义,10公里6小时离开家就算做游客,实际上特别难操作。北京这样的大城市,上班超过10公里太多了,离家上班就超过6小时,城市旅游的天文数字,这是其中一部分原因。

世界旅游组织也好,我们国家的定义也好,在现实中难以操作。这涉及多地理尺度的转换,到底我们是用地理距离来算10公里,还是用行政边界来算。西方国家也有用80公里,4小时的,但都难于操作。所以我提出如果用行政边界来计算,与税收单元相匹配,有可能解决这个问题。如果把流动的广义消费作为一种旅游消费的话,再想办法剔除那些非旅游消费的部分。我们的税收行政范围是以县为单元,只要进入到这个行政区划范围,消费就进入了这里的税收体系里,如果在两个税收单元的边界,不需要10公里就已经跨界,跨界的消费税收已计算到另外一个行政区域。从这个意义上讲,再用10公里这个空间标准不合适了。

从理论上推导一下,为什么各个省的累加会超过全国,各个地级市的累加会超过一个省,各个县级市的累加是更大的数据。国家对旅游人次的定义是指离开居住地出去旅行后回居住地算一个人次,也就是说一个北京人从北京到广州可能经过了河北、河南、武汉、湖南进入广东,如果在每个地方都停留了一下,每个省都会把你算做一次游客,但是对于国家统计来讲只算一次,从居住地离开转一圈回到居住地算一人次,这样的话地理尺度就特别重要了。

我们以省级为单位做一个理论推算,如果假设全中国所有人每年到其它30个省市都去一次,全中国会有多少个旅游人次呢,390亿。2016年全国334个地级单位,最极端的情况每个人把其他333个跑一遍,理论值会达到4329亿的旅游者。这样一个推导就说明行政尺度越小的统计单位,累加起来的数据就会越大。现在公布的数据,并不公布某个省游客里的外省游客有多少(外省游客不能是地级市的游客量相加),本省游客多少(本省游客还应该公布跨地级市的多少等)。我们用一个概念含混不清的大到违法常识的数据把真实情况掩盖了。

从理论推算来讲,尺度越小的统计,累加数据会越大。这几年我们团队一直从实践的角度来尝试游客统计的实际操作性的问题。我们先不讨论国际上和国内的定义要怎么修改,那是一个非常复杂的事情。我们以省、市、县为三级统计地理单元,比如说广东省可以首先公布每年广东省外的其它30个省市自治区的国内游客有多少,如北京有多少,上海有多少,天津有多少。广东省内21个地级市,比如广州市可以再公布一个数,另外20个地级市有多少游客到了广州,如果重点旅游县特别有必要,还可以再看看地级市内其它县市区到有多少游客,可以分层次来进行公布,这样的话这些数据就可比。 首先比外省,能吸引外省的人有多少,省内再比地级市。 这是今天讲的第一个方面部分,按地理尺度有可能从操作性上解决现在的游客统计“横向不可比,纵向不可加”问题。

二、大数据游客量统计及消费统计实验


第二个方面,我们现在特别关注消费,5月17日习总书记在全国旅游工作会议上的重要指示讲旅游已经成为新时期的战略性支柱产业。投资、出口、消费推动经济发展的三驾马车,消费越来越重要,其中旅游消费在消费中又特别重要。因此,非常有必要弄清楚旅游消费是什么样的。

过去是靠抽样,抽样大家知道会有很多问题。目前全国游客抽样一年8万份,四个季度每个季度2万份,城市1万份,农村1万份。全国城市选了30个市,30个市里省会城市都没有完全覆盖,只覆盖了4个直辖市,5个副省级市像厦门、深圳、苏州、宁波、大连,和21个省会城市,抽样的城市都是经济比较发达的城市,是中国经济最好的地方,这样推论出来的数据可能会偏高。农村是1万份,总量上太小,这就是传统抽样可能会出现的问题。

现在有机会使用大数据,中国去实体货币化的速度远远快于整个世界,已经快到让外国人到中国适应不了我们的支付方式。我们农村老太太卖菜都是微信支付,只要我们是微信支付、支付宝支付,用的是公司注册的收费程序,除了用微信(支付宝)零钱不通过银联系统统计不了外,银联数据里都会包含所有的消费,这样就有可能整合信令数据和银联数据来研究旅游经济。

我们现在的三大运营商有17.1亿用户,移动占57.6%,中国电信23%,联通将近19%,有一些地方可能会用其中一个运营商的数据来做研究和分析,这还是大样本抽样,如果只用联通,全国的用户不到19%,其结果是19%的抽样结果而不是全部用户的结果。

双卡双待、两部手机、异地手机本地使用、高速公路(铁路)路过、日常活动跨越边界居民等都会夸大游客量,需要通过编写专门的算法进行清洗。

信令数据可以计算游客量,可以知道游客的轨迹,银联数据可以分析游客的消费,结合起来可以给游客年龄、性别、来源、游览行为、消费状况等进行画像。消费层次的分析,可以分析出什么地方的游客消费高,什么地方的游客消费低,还可以把在旅游六要素的消费分开,什么地方消费、人均消费、消费喜好、消费趋势这些可以做出来。

我们组合了一个多学科的团队,对广西做了一个大数据支撑广西旅游数字营销识别和决策的项目,依据的就是信令数据、银联的消费数据和OTA的评论数据。

我们看看实际结果,2019-2023年广西客源地的空间分布,广东一般来说占广西外省游客的40%多,常年基本上最主力的客源是广东,然后是贵州、湖南、云南、河南、四川、浙江、江苏以及其它地市省份。

广东游客在广西的空间分布,南宁是第一,玉林第二,然后是贵港、梧州、桂林、贺州、青州,大家可能会看到南宁、玉林、贵港、梧州超过桂林,南宁是省会城市很容易理解,玉林晒在广东打工的人多,贵港和梧州是靠近广东。

再有一个有意思的数据是广东游客在广西14个地级市里的消费,桂林排到第一,玉林排到第三,玉林很多是返乡打工人员,这样一看就知道桂林超过了南宁、玉林、梧州,所以广东游客在广西14个地级市的消费,桂林是非常重要的。

我们再分成六要素吃住行游娱购,在桂林住、行还有购物是占了大头,吃占的不多,在贵港吃占的比较多,梧州吃占的比较多,梧州跟广东交界,很多广东人会跑到梧州吃饭。

用OTA的数据来看桂林、阳朔整体的评价,对哪些地方感兴趣,哪些地方不感兴趣,还有在桂林内部是怎么旅游的,从这个点到那个点是什么样的流量和流向关系,这个是用OTA数据得出的游客评价、产品偏好和流动轨迹。引入大数据之后,有很多问题理论上首先要理清,然后技术上做出来。

三、引入大数据技术后旅游人数统计存在的问题及原因


第一个问题还是纵向不可加,横向不可比的问题始终存在。大数据统计方面的旅游统计工作目前还是属于补充手段,因为国家还没有出台相应的文件和规范,特别是如何对大数据进行清洗。

我们看一个之前做的实验,这是2019年国庆期间做的一个实验,如果不筛选、不清洗这些重复的游客,广西得到的总人数是3586.63万人/天,把这些重复的清洗掉之后,清洗了1029万人/天,重复的、过路的等等占到了40%。不清洗的人天数和官方公布的人天数是比较相近的,没有清洗是3500万,官方公布是3300万,但是我们那个是人天,官方公布的是人次。

清洗里面占比最多的是地理尺度的变化,以外省游客为例,按照14个地级市计算累加以及只要进入广西才计算,相差了307万,占总清洗量的54%;漫游常住用户,占了30%(169万),过路客占了65万占11.6%,双卡双待智能终端占3.1%(17万),这些误差是非常大的。

玉林超过了桂林是因为,玉林是广西在广东打工最多的地级市,每年节假日大量的玉林人会返乡探亲,这部分的计算结果是,玉林从自治区之外回去的35万多,桂林是9万多,南宁是4万多,所以这样一算扣除返乡的玉林的游客人数就比不上桂林,当时我们得到初始数据觉得很奇怪,玉林已经超过桂林了,把这个数据一分析,就知道桂林实际上真正的游客要多,但是作为官方公布数据来讲,返乡的也算游客,只不过回到家没有多少消费,这些是我们实验的结果。

现在需要讨论的东西很多,比如说惯常环境怎么定义,10公里6小时是否继续使用,城市越扩越大的情况下,跨区县的流动并不全是旅游活动,区县一级的惯常环境怎么识别,游客在不同地理尺度下如何界定,省级、地级市、县级市是不是跨省也要6小时还是什么,原来的定义是不是要更改,下一步需要好好研讨,最后才能得出规范。

如果从大数据的角度,只要这些定义说的很清楚,技术是可以做到的。我们团队在做进一步的工作,比如说电子围栏的实验,比如说技术规范,我们自己在摸索,所有这些问题都有可能解决,但是一定是文旅部、国家统计局这个层面上来协调,下面我们来做技术是有可能做到的。


加入私密社区


推荐阅读


主题阅读

戴斌:文旅融合新动能与旅游经济四个新发展方向
2024中国古镇旅游发展报告:我们需要什么样的古镇旅游?






请到「今天看啥」查看全文