图片来源:百度图片
文章来源:Dai, R., Guo, D., Han, Y., & Qin, Y. (2024). Pollution-induced trips: Evidence from flight and train bookings in China. Journal of Development Economics, 171, 103340.
近年来,人们日益关注空气污染问题。为了减轻空气污染对生产生活的不利影响,人们可能会采取许多措施来躲避空气污染,例如足不出户、购买空气净化器、佩戴口罩、迁移到空气更加清新的城市等。但是,这些措施存在成本过高或危害健康等问题。因此,短期旅行可以是躲避空气污染的较为理想的选择。
本文利用中国某在线旅行社(
online travel agency
)2017-2019年22亿次火车和航班订票数据,研究了当出发地空气污染严重时人们是否会到空气较为清新的目的地旅行。具体而言,本文测度了在给定购票日期个人选择从某出发地到某目的地旅行的概率,并将其与当天出发地和目的地的空气质量相匹配。
本文主要的边际贡献如下:一是拓展了当前文献对空气污染与旅行之间关系的研究,如考虑购票当日的空气污染情况(之前的文献一般讨论的是出行日)、讨论了影响效应异质性、使用退款退票数据考察行为因素等;二是补充了当前文献对清新空气支付意愿(willingness to pay,下文简称WTP)的研究。
在中国,人们越来越多地使用携程、飞猪、去哪儿、美团等在线旅行社购买机票和火车票。本文使用中国某大型在线旅行社的数据进行研究,该数据集能够有代表性地反映中国人的线上购票行为。
作者首先提取了2017-2019年19.2亿次火车订票和6.5亿次航班订票的原始数据。为
避免测量偏误
的问题,作者识别了以下两种情况:第一种情况是一个人在同一天买了两张票并且第一张票的终点是第二张票的起点,在这种情况下作者删除了第二张票的数据;第二种情况是一个人在同一天买的两张票由一个中转城市连接在一起,在这种情况下作者把两张票合并为一张票。在进行上述处理后,作者最终得到22亿次火车和航班订票数据,其中火车票涵盖了83644个城市对,飞机票涵盖了29908个城市对。为进一步分析,作者将这些订票数据按照购票日期与出发日期之间的间隔时长(下文简称“间隔时长”)分为四类,分别为间隔时长0-1天、2-7天、8-30天和30天以上;按照购票者的年龄大小分为四类,分别为0-18岁、19-35岁、36-55岁和56-100岁。
就空气质量数据而言,由于AQI和PM2.5数据在公众的影响力较大,作者使用中国环境监测总站(CNEMC)的1500个站点的日均AQI和PM2.5数据。此外,作者还控制了天气变量的影响,天气数据来源于中国气象数据服务中心(CMDSC)的745个站点。最后,作者将这些站点数据与城市进行了匹配。
作者采用下式估计了在城市对-日期层面城市间AQI差异对短期旅行的影响:
其中,i代表出发城市;j代表终点城市;t代表购票日期;r代表前文提到的四种间隔时长;被解释变量
代表来自城市i的个体在日期t选择间隔时长为r且前往城市j旅行的概率;
核心解释变量
代表在日期t城市i和城市j的AQI差值;
代表在日期t城市i和城市j的天气变量差值的一次项和二次项,天气变量包括气温、气压、风速和降水;
分别代表出发城市的城
市-月份固定效应、终点城市的城市-月份固定效应、城市对固定效应和日期固定效应。
然而,上述估计存在以下内生性问题:(1)可能存在城市内部短期的、随时间变化的遗漏变量没有被固定效应控制;(2)反向因果问题,即城市之间的旅行人数增加可能会通过公共交通减轻出发城市的空气污染、加重终点城市的空气污染,从而使城市间AQI差值减小,导致核心效应被低估。
本文使用工具变量法解决上述内生性问题。具体而言,一个城市的污染可被分为两部分:自身生产生活产生的污染和被风带来的上游城市的污染。
基于风力和风向的外生性,作者使用后者作为空气污染水平的工具变量,并参考相关文献构造下式计算上游城市
n
对本城市
i
的污染转移:
其中,WS代表风速,D代表城市间的距离,
以及整个式子的含义如下图所示:
还需说明的是,为了保证IV的外生性和相关性,考虑影响的上游城市与本城市的距离范围设定在100-300km。之后,本文使用上游污染的差值(
UP
it
-UP
jt
)作为城市间污染差值(
P
it
-P
jt
)的工具变量,并使用2SLS估计。
下表分别展示了OLS和2SLS基准回归的结果。
2SLS第一阶段的KP-F值均大于145,显示不存在弱工具变量的问题。2SLS的估计系数大于OLS的估计系数,证实了反向因果问题使OLS的估计系数被低估。就2SLS的估计结果而言,
城市之间的AQI差距每增加50单位将使1天内和2-7天内两个城市之间的总订票数量(包括火车和航班)分别增加1.30%和1.33%,并且对火车订票的影响略高于对航班订票的影响。
接着作者检验了AQI差距对订票数量的非线性影响。如下图所示,随着AQI差距的增大影响系数呈现不成比例的增长,这和当前相关文献的发现相吻合。
之后作者进行了一系列稳健性检验,包括:(1)验证了AQI差距不影响7天以上的订票数量,证实了本文发现不是由城市对本身驱动的;(2)使用PM2.5替换AQI作为衡量空气质量的指标,结果基本不变;(3)将没有购票记录的城市对的购票数量记为0而非直接将其删除,结果基本不变;(4)分别检验了出发城市和终点城市的空气质量对订票数量的影响;(5)更换被解释变量的度量指标,结果基本不变。
在异质性分析中,作者首先研究了不同年龄段的人对空气污染的不同反应。如下图所示,
19-35岁的人群对空气污染的反应最强
,可能的原因是他们对空气质量的重视程度较高且有充足的时间和经济条件进行短期旅行。
接着,作者将终点城市按照距离分为省内城市和省外城市,按照4A级及以上的景点数量分为三类,探究人们对不同终点城市的偏好异质性。如以下两图所示,作者发现人们偏好
在一天内搭乘火车前往省内城市、在一天内前往景点数量更多的省内城市、在2-7天内前往景点数量更多的省外城市。
这些发现都验证了人们躲避空气污染的动机及其短期性。
最后,作者根据出发城市和终点城市空气污染的不同层级进行了异质性分析,发现
当出发城市的污染水平高于平均值且终点城市的污染水平低于平均值时
,人们购票躲避空气污染的行为最强。
污染诱发的旅行可能由两种动机造成:一是理性决策,即个人根据出行日的空气污染预报来躲避污染;二是非理性行为,即旅行购票行为完全来源于遭受污染时情绪冲动。
为识别这两种动机,作者首先利用退票退款数据检验非理性行为的存在,因为如果消费者完全出于冲动而购票,他/她便有较大概率在日后选择退票。具体而言,作者使用特定日期城市对的退票概率替代基准回归中的被解释变量进行估计,结果表明50单位AQI差异的提升将导致火车退票概率提高1.64%,且该结果在5%的水平上显著,证实了非理性行为的存在。有趣的是,AQI差异的提升不显著提高航班退票概率,可能的原因是人们在购买机票的时候会更谨慎。
作者接着将出发城市和终点城市的AQI预报值作为控制变量加入基准回归,因为如果消费者的购票是出于空气质量的理性预期,加入AQI预报值后购票日期的AQI差异应当不再显著影响购票概率。
结果证实了理性决策的存在,即理性决策和非理性行为均在消费者的购票决策中扮演重要作用。
之后,为检验污染诱发的旅行是个人订票日当天产生的决策还是订票日之前就已经做好的决策(等到污染爆发的时候购票),作者按照下式加入空气质量的滞后项:
通过估计
,我们可以估计
,从而估计过去AQI信息的累计效应
。
如果污染诱发的旅行是订票日之前做好的决策,那么
应当不显著不为0。
估计结果如下图所示:
图中我们可以看出,对于火车购票而言累计效应在一周内均显著不为0,说明
污染诱发的火车旅行更可能是在订票日当天产生的决策
;对于航班购票而言累计效应在一周内均不显著不为0,说
明污染诱发的飞机旅行更可能是订票日之前做好的决策。
最后,作者根据下式估计对清新空气的支付意愿(WTP):
其中,
price
ijtr
指在订票日
t
城市
i
到城市
j
的间隔时长为
r
的火车票和飞机票的平均价格。作者使用空气质量差异和票价的边际替代率作为WTP的度量,即上式中的
。
然而,票价和城市对之间的旅行数量直接正相关,这将导致