专栏名称: 旅游规划观察
展示旅游规划圈最新、最深、最有用的信息。 我们不创造新闻,我们只遴选信息。
目录
相关文章推荐
51好读  ›  专栏  ›  旅游规划观察

七条干货揭开【旅游大数据】的神秘面纱 | 清旅七问 访谈专栏

旅游规划观察  · 公众号  ·  · 2018-08-07 17:55

正文

请到「今天看啥」查看全文



清旅七问 】是清华同衡旅游规划推出的访谈专栏,通过对一线旅游规划专家的深度对话,用七个问题,梳理出一个旅游规划热点,帮助读者用最快的时间掌握行业要点。


本期嘉宾

常雪松,就职于北京清华同衡规划设计研究院旅游所,旅游经济师,长期从事旅游大数据、旅游规划、文旅策划等方向的研究。

1、旅游大数据和传统调查数据的根本差异

小璇: 旅游大数据和传统调查数据的根本差异是什么?

常雪松: 目前,学术界对大数据还未形成一个完整和统一的概念,旅游大数据亦是如此。相对传统调查数据,旅游大数据确实有一些优势,比如普遍认同的大数据4V特点,即数据规模更大(Volume),数据类型更多样(Varuety),数据更新和迭代速度更快(Velocity),数据价值密度更低(Value)等。

传统的旅游调查数据是游客为了配合调查而填写的数据 ,这样难免受问题设置、调查环境、参与人属性等多种干扰因素的影响。旅游大数据包括游客的位置信息、人口学信息、旅游行为和真实感受等,这些数据产生之初并非为了配合调查,因此它们反应的结果更客观、更真实。

从传统调查 数据 到旅游大数据


清华同衡旅游所在王彬汕所长的带领和指导下,从2014年即开始研究如何将大数据技术运用到旅游规划和相关研究中。经过几年,我们积累了一整套技术流程和方法体系,其中一些技术方法在业内是比较先进的。


但同时,我想强调的是,尽管旅游大数据方法有其优越性,但我们不能迷信大数据方法,它也不能完全取代传统调查方法。正如清华大学尹稚教授说的,大数据技术使我们更接近真实世界,但“归根到底,大数据是工具,不要把它神秘化,弄成虚无缥渺的东西;也不要认为技术发展到今天,就可以重回单一技术路线、单一技术价值、单一工具类型,这是不可能的事。”

2、哪些旅游大数据是可用和好用的

小璇: 哪些旅游大数据是可用和好用的?

常雪松 旅游大数据的分类五花八门,其中一种是 根据数据开放程度而进行 ,我们不妨从这种分类方法看看目前有哪些可用和好用的旅游大数据。

非开放型数据 主要包括政府重要数据和企业核心数据,这些数据涉及国家安全、企业生存和居民隐私等,一般不作商业性开放。但同时,市面上也存在很多可用的 开放型数据 ,并且市场也相对成熟。这些数据按照商务成本的高低主要包括三种:


一是通过企业间的战略合作或高价购买而来的数据 ,这种数据需要企业间的相互了解和多轮谈判等相对复杂的商务过程,例如与手机运营商、BAT、OTA等公司的合作,这种数据的定制性强,可信度高,但成本也高。


二是通过数据公司对外开放的成熟接口下载而来的数据 ,很多拥有大数据的公司目前已经开放了开发者API接口,例如高德和百度地图等。这种数据成本较低,但需要一定的技术支持。


三是通过对公开网页采集的数据 ,OTA、游记或点评等网页上公开的数据是可以通过程序采集下来的,这部分数据成本低,但相对比较简陋。


非开放型大数据 Vs 开放型大数据

3、数据分析对规划有哪些支撑

小璇: 这些数据能做什么样的分析?对规划有哪些支撑?

常雪松 旅游大数据可做的分析很多,基础分析包括游客画像、游客时空分布特征、游客轨迹分析、市场需求挖掘、游客满意度分析等等。对旅游规划而言,旅游大数据的分析思路和方法可以运用到大部分章节,我们说几个比较常用的方面:

一、游前、游中、游后三阶段旅游市场的分析。 通过旅游目的地的网络搜索数据可以得到搜索人群画像,了解游前市场特征;通过游客实时的空间分布数据,分析旅游赌点、游客轨迹和游客画像等,明确游中市场情况;通过点评和游记等数据的语义分析,了解游客对目的地的满意度情况,挖掘市场需求,掌握游后市场反馈。另外,利用搜索数据和实际到访数据还可以做漏损市场分析,精准分析有搜索行为却未成行的潜力市场的特点,这对旅游产品设计和营销至关重要。


二、旅游服务设施供需的全面了解和建设指导。 通过对食住行游购娱以及旅游厕所等旅游要素的全面大数据“体检”,了解设施的总量、类型和空间布局等情况,掌握供给现状。通过游客对旅游服务设施的满意度大数据分析,挖掘游客对服务设施的满意度和潜在需求。供需对比后,找出不平衡所在,从而采取精准地旅游服务设施改善和提升策略。


三、游览线路的组织设计。 对游客轨迹大数据进行分析,是对游线供给现状的了解和掌握;对同一行程中游客提及(并不一定是真实到访)的景点关联度分析,是对游线组织需求的挖掘。供需对比,高关联度多轨迹的游线是精品游线,应该加强和维持;高关联度少轨迹的游线是潜力游线,应该通过改善道路和服务设施等基础设施,重点培育该游线。


四、旅游目的地形象设计引导。 通过分析旅游目的地的相关文本大数据,提炼最能反映该目的地气质的关键词;通过分析目的地网络图片大数据,得出目的地的基础色彩和代表轮廓。以气质关键词、基础色彩、代表轮廓为依据,结合市场需求,进行旅游目的地的形象定位、宣传口号、旅游LOGO等设计。


五、旅游精准营销。 依托市场大数据分析,确定产品类型(Product);通过同类或同区域目的地大数据类比法,确定产品价格(Price);根据市场智慧化程度分析,确定营销渠道主次(Place);针对不同细分市场特征,确定不同策略、宣传和促销等(Promotion)。这是在围绕营销4P的大数据分析基础上,采取的针对性营销措施。


除此之外,大数据方法还可以对区位交通、旅游资源的分类分级、旅游发展目标的指标体系、旅游产品体系、旅游重点项目等多个方面给予支撑和引导。

4、旅游大数据相关案例浅析

小璇: 能结合案例具体说其中一两点吗?

常雪松 我们首先看一个 通过旅游市场分析,确定旅游发展大方向的例子。 2015年清华同衡旅游所承担了《广西自治区“十三五”旅游业发展规划》,当时对于广西的旅游发展龙头一直有两个观点,一是认为桂林是广西旅游发展的唯一龙头;另一个观点认为经过多年发展,广西的旅游发展已经形成两个龙头,即桂林和南宁。针对这个问题,即使广西当地的规划专家也有争议,一时无法达成共识。项目组最后决定利用数据说明问题,我们对来广西的游客分享在社交平台上超过2200万字的文本素材进行了语义挖掘。

《广西自治区“十三五”旅游业发展规划》大数据语义分析

这张图中,越靠近中心位置的词汇说明其对整个文档核心意思的代表性越强;且与之相连的词汇越多,在整个文档中的内容篇幅就越大。明显地,“桂林”是广西旅游非常核心的关键词,与之相关的词汇占据了整个图的半壁江山。而与“南宁”关联的词汇量少很多,且内容更偏向交通工具。因此,通过大数据的分析,清楚地得出,广西的旅游发展龙头是桂林,南宁是非常重要的一个旅游集散中心。


第二个例子是利用大数据分析对旅游服务设施精准规划的引导。 2014年清华同衡旅游所承接了《河北张家口草原天路规划》项目。草原天路是因修建风车而开辟的通勤路,由于沿线漂亮的景观,受到京津冀地区自驾游客的追捧,为此相关部门准备将其建设为景区,封口售票,并着手开始编制发展规划。然而,售票消息一石激起千层浪,社会负面影响显现。项目组决定利用数据分析给出合理发展建议。


项目组首先对游客分享的游记和点评文本进行语义分析,尤其对游客的不满意情绪进行了厚数据挖掘,总结出游客主要的不满意方面。

草原天路游客反映不满意因素分析1

随后,项目组对草原天路上的旅游服务设施供给现状作了全面分析,发现不论哪个渠道的数据都反映出沿线旅游服务设施十分缺乏,基本不成系统。


在明显的旅游服务设施供需不平衡状态下,项目组给出第一个发展建议:取消门票计划,完善服务设施。这样既避免了售票带来的社会负面影响,同时长远看旅游服务带来的收益远高于门票。


项目组继续深化研究,将游客的时空分布数据与评价数据结合起来,分析游客在哪个节点反应了什么样的问题。

草原天路游客反映不满意因素分析2

这样就非常具体指出哪个节点应该有怎样的对应的服务设施提升,建议更有针对性和落地性。

5、规划之外,旅游大数据还能做什么?

小璇: 除了对规划支撑外,旅游大数据还能做什么?

常雪松 实际上,除了对旅游规划的支撑外,我们在其它方面也做了不少研究和探索。举几个例子。

2017年颐和园委托我们做了《颐和园旅游大数据研究》的课题。研究中融合了POI、LBS、UGC、OD、GPS、手机信令等多种类型数据,综合运用空间分析、语义分析、情感分析以及描述性统计、聚类/分类统计、因子分析、方差分析以及可视化等多种分析方法,重点研究了颐和园游线组织与游客轨迹情况、游客需求挖掘与满意度分析、旅游设施与服务分析、旅游文创商品研究等颐和园管理方重点关注的方向,成果受到好评。

颐和园游线组织分析


颐和园与北京其它景点关联度分析

颐和园UGC内容语义挖掘

另外,我们还有多篇基于大数据的分析文章入选 《北京旅游发展绿皮书》 ,连续多年成为该报告的编委成员,我们以最近两年的两篇文章为例来看一下。


2016年,我们以北京十大热点旅游景区为研究对象,以游记文本大数据为素材,研究了基于游客角度的各景区主要特征、景区发展存在问题和市场需求等。研究中发现了一些有趣的结论,比如当年热播的《甄嬛传》、《中国好声音》等电视作品对故宫旅游线路的组织和什刹海热门酒吧的走红产生很大影响。再比如,除了长城、颐和园、故宫等传统景区外,798、古北水镇、鸟巢/水立方等新型景区正在兴起。

北京十大景区游记语义分析结果(部分)

2017年我们利用POI信息点数据和相关点评游记数据对北京旅游服务设施的供给现状和市场需求分别进行了研究,从而发现供需不平衡所在,给出北京旅游服务应该提升和完善的建议。比如我们发现,对于游客,乘坐北京地铁除了通勤需求外,也是一项独特的旅游体验活动,纵横的线路、方便的换乘、高级别安全系数,甚至高峰时期的拥挤、复杂的运行规则等都成为游客追捧的体验要素。因此,北京地铁系统应该相应地突出北京特色,提高乘坐舒适性,增强体验性等。再比如尽管北京旅游商品的购物点已经很多,而且空间分布均匀,但大多数游客还是愿意从超市购买特产,原因在于游客潜意识认为特产店是为外地游客开设,存在宰客嫌疑,而品牌连锁超市的信任度会更高。因此,是否应该考虑将特产礼品店直接进驻超市,消除游客疑虑等。

北京旅游服务设施空间分布

6、旅游大数据的技术

小璇: 做旅游大数据分析需要掌握什么技术?

常雪松 我一直认为精通大数据分析技术并不能构成我们的核心吸引力,也不应该成为我们努力的方向。分析技术始终是手段,我们的目的是通过这些手段达到我们想要的分析结果。功利一点讲,技术学的再好也赶不上IT或大数据专业毕业的同学。 我们的优势是对专业的深刻理解,我们需要敏锐地感知行业遇到的问题,大数据能给这些问题提供怎样的解决方案,把需求和工作流程想清楚,具体的实现方案就让专业的人去干专业的事 。我们的角色更像一个产品经理。

但同时,相关方向的通用知识和原理还是必须懂的。比如一些基础统计模型、常用的汇编语言(如python等)、语义分析的原理和知识、图片分析的研究和进展、R语言等可视化技术的实现路径以及经excel、gis、spss等常用分析软件的深度挖掘等,你不一定要成这些技术的专家,但你一定得知道,什么时候用什么样的技术能解决什么的问题。这就和司机一样,汽车的制造原理和3万多个汽车零件你不一定要非常清楚,但是如何操控汽车以及判断一些常见的故障,是作为司机的必备知识。

7、旅游规划单位在旅游大数据中的角色

小璇: 旅游规划单位或者研究单位,应该在旅游大数据链条中承担什么样的角色?

常雪松 一个词: 承上启下 。上承数据源,下启旅游单位。

上面我们说过,大数据的价值已经得到普遍认同,市面上拥有大数据的公司也已经很多,以出售数据资产为主营业务的公司急切地想要变现;而即使如携程、百度、手机运营商等并非以数据出售为主要赢利点的巨头公司也面临结构冗余和规模激增带来的巨额数据成本。


同时,随着智慧旅游和旅游大数据的应用普及,以各景区、旅游区、各地旅发委和相关政府部门为代表的旅游单位也在苦苦寻找合适的数据产品和解决方案供应商。但由于传统旅游单位缺乏相关技术人才和社会资源,往往事与愿违,开发出一系列简陋和初级的智慧旅游或旅游大数据产品。


相对旅游单位,规划研究单位更了解行业现状和现实问题,人才储备和社会资源也丰富很多,并且对大数据也有着深度的理解,可以帮助数据源单位和旅游单位架起一座沟通合作的桥梁。


我们也会结合时事热点做一些有趣和及时的大数分析,这些分析文章也先后在我们清华同衡旅游所的官方微信公众号进行了发布。


(1)从语义分析看《徐霞客游记》的细节

(2)游记大数据的北京十大热点景区语义分析

(3)北京旅游服务设施现状如何?游客的需求……

(4)大数据解析“中国66号公路”草原天路收费……

(5)看一个段子手如何用大数据解析高考旅游市场

(6)什刹海落选历史文化街区,大数据解析……

(7)新年特辑:大数据教你如何在元旦玩转什刹海

(8)解析“首都特区”和“北京市”四环分制给……

(9)大数据量化分析“莫兰蒂”台风对厦门……


小璇: 常荣幸能够邀请您作为我们的特约嘉宾,十分感谢!

常雪松 希望以后能有更多机会和大家交流。


素材来源:清华同衡旅游规划







请到「今天看啥」查看全文