专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
大数据分析和人工智能  ·  这届年轻人,逛商场只去B1B2 ·  4 天前  
数据派THU  ·  仅总参数量0.1%、单GPU ... ·  3 天前  
大数据文摘  ·  OpenAI长文爆料反击马斯克诉讼:“你不能 ... ·  4 天前  
51好读  ›  专栏  ›  大数据文摘

从语义分析看《徐霞客游记》的细节:他吃什么?住哪?买了什么纪念品?

大数据文摘  · 公众号  · 大数据  · 2017-05-21 13:55

正文

授权转载自清华同衡旅游规划

作者 | 常雪松 



一、写在前面的话


刚刚过去的中国旅游日(每年5月19日),之所以将这天定为中国旅游日,与中国古代著名的地理学家、旅行家和文学家徐霞客有密切关系。



徐霞客出生在南直隶江阴(今江苏江阴市)一个有名的富庶之家,书香门第,自幼饱读诗书,但他不喜仕途,少年便立下“大丈夫当朝碧海而暮苍梧”的旅行大志,徐霞客一生游历时间达24年,足迹遍及今19个省、市、自治区,行程超过5万公里。总结下来,徐霞客一生的游览经历可以分为三个阶段:


第一阶段:28岁以前的纪游准备阶段。重点放在研读祖国的地理文化遗产,并凭兴趣游览太湖、泰山等地,没有留下游记。 

第二阶段:28岁(1613)至48岁(1633)的纪游前段,历时20年,游览了浙、闽、黄山和北方的嵩山、五台、华山、恒山诸名山。但游记仅写了一卷,约占全书的十分之一。

第三阶段:51岁(1636)至54岁(1639)为纪游后段,历时4年,游览了浙江、江苏、湖广、云贵等江南大山巨川,写下了9卷游记。


徐霞客生前写下的诸多游记,他本人并没有将这些游记整理成册,他去世后别人将这些著作搜集整理成《徐霞客游记》。除佚散者外,遗有60余万字游记资料,世传本有10卷、12卷、20卷等数种。这些游记对地理、水文、地质、植物等现象,均作了详细记录,在地理学和文学上做出卓有价值的贡献。




5月19日正是徐霞客写下第一篇游记的日子,为了纪念这部鸿篇巨著,中国旅游日定在这一天。在今年的中国旅游日即将到来的时刻,希望以此篇文章表达对伟大先人的缅怀敬意。


二、这篇文章会做怎样的分析?


对于《徐霞客游记》的分析研究已经众多,但基本属于整体评述或者专项研究,对于游记通篇的细节研究很少,主要原因在于游记原文超过60万字,对每一字句的细节理解已经超出人力范围。此次研究希望利用大数据语义分析手段对《徐霞客游记》进行一次全新的尝试和解读。主要分析和结论将涉及:


  • 徐霞客一路上都在哪儿吃饭,和谁一起,吃些什么?

  • 徐霞客每天都住在哪儿?环境怎么样?他的游记是在哪些住处写成的?

  • 除了行走,徐霞客主要的交通工具是什么?

  • 徐霞客一路都买了哪些纪念品?

  • 游记透露出的诸多细枝末节如何反映整个大明王朝的命数?


尽管徐霞客游记已经属于白话文学范畴,但毕竟明朝与现代的语言习惯有很大差别,因此在没有专业词库和分析经验的基础上,我们选择了译文进行分析,版本是朱惠荣先生的《徐霞客游记全译》。


三、徐霞客一路的伙食问题


首先下个断论:徐霞客完完全全不是一个吃货。


徐霞客一路上最主要吃饭的地方不是大饭店,不是当地特色菜馆也不是连锁快餐店,而是——寺庙。徐霞客通常以拜访寺庙的名义留在那里解决餐饮,这其中徐霞客用到一个高频词“施舍”,可以看出徐霞客并没有得到平等和舒适的待遇,而且徐霞客对“烧火做饭”的过程很关注,似乎也经常参与其中。这些都或多或少看出徐大侠旅途并没有享受到很好的餐饮“服务”。




何以至此?用餐时间的高频关联词提供了答案。

文章中出现了大量的“急忙”与“吃饭”的共现词组,而且还有很多“二里”、“三里”和“五里”的词,返回原文查看,这些词基本是描述他在游览完成后通常会再急着赶几里路才能找到吃饭的地方。徐霞客游览的都是深山老林,即便再走三里五里也不一定能返回配套服务相对完善的城区,只能找到位于“山顶”、“峡谷”、“山岭”的寺庙,所以,徐霞客大多时候是被迫接受寺庙并不舒服的餐饮,是被游览时间和当时贫瘠的旅游服务设施所迫。



当然除了寺庙,徐霞客还是有一些比较舒服的进餐环境的,比如旅馆和农家,在这些地方吃饭,不但饭食质量提升,而且经常还会有饭后茶可供享用,甚至心情好的时候,徐霞客还会在“晚上”买一点酒肉回来,和“挑夫”、“脚夫”和“顾仆”一起小酌几杯,当然按照徐霞客的想法这种放松也往往包含着对跟随他艰辛一路的随从的“犒劳”。




另外一个问题是徐霞客到底每天都在吃什么?


进而延伸到明朝时候的民间食材如何?


从整体高频关联词来看,徐霞客的主食是米饭,配以蔬菜和肉类。但是具体的蔬菜和肉食类型并不是徐霞客描写的重点,这也说明,他对餐饮相对随意的态度。为了完全弄清楚这个问题,我们将原文所有的高频词进行词性和社会属性归类,筛选得出一张食材表。


徐霞客吃的最多的肉类是鱼肉,而且种类相当丰富,从原文看,包括:鲤鱼、卿鱼、香鱼、螂鱼、绿级鱼、金线鱼、青鱼、白鱼、随龙鱼、蜻鱼、黑鱼、竹鱼等。除了鱼之外,鸡肉和牛肉等也是徐霞客主要的肉类食材。这侧面反应出,在明朝,至少在明朝的南方省份,猪肉和羊肉的流行程度不及鸡肉和牛肉更不及鱼肉。


根据史料记载,猪肉在明朝时候逐渐开始流行,万历年间,猪肉一斤要0.018-0.02两纹银,而一斤牛肉则只要0.013-0.015两纹银,所以价格因素也可能是限制徐霞客和普通老百姓选择牛肉更普遍的原因。


徐霞客提到最多的蔬菜包括竹笋、韭菜和芹菜等,吃的最多的水果是荔枝和龙眼,另外,松子成为徐霞客认为最美味的零食小吃。


关于餐饮还有一件事比较有意思,就是早餐。虽然徐霞客对午饭或者晚饭往往不那么如意,或者他本身也不是很在乎,但却极其重视早餐。语义图可以看出,他对早餐的相关描述占据了很大部分。为了赶更多路,徐霞客往往“鸡一叫”、”““天一亮”甚至“黎明”时分就要起床准备出发,但是不论多么着急,他都必须吃过早餐再出发,以致不惜让“船夫”、“马帮”等为此而等待。从这一点,不得不说,徐霞客是为位养生专家,为常常不吃早餐弄坏胃口的现代人立下了好榜样。




四、徐霞客的住宿环境


比起餐饮,徐霞客的住宿环境并没有多大改善。


“县城”的“旅馆”是他最主要也是最舒服的住宿地点,他往往在“傍晚”时候“抵达”旅馆,徐霞客抵达旅馆后,一般就不再出门,连饭食都直接在旅店内解决,之后他会挑选“楼上”的“房间”入住,在那里开始他的重要工作——写“日记”。

所以,现在我们知道,《徐霞客游记》这部旷世著作的大部分是完成于一个个旅店的二楼房间。正是因为安静和相对舒适的住宿环境,让徐霞客详实和完整地记录了他的整个旅程,可惜徐霞客对于这些旅店的名字所提甚少,不然又是一处处人气旺盛的文化旅游景点。


值得注意的是,徐霞客在旅店里写下的文字,除了日记外,还有很重要的一部分内容是——家信。虽然徐霞客在外游走二十有四年,但是他对家乡的思念,对亲人的感情却从未减弱,据原文的记载,这些信多是夜深人静,徐霞客辗转反侧之时写就,望月怀远的情绪必定使这一封封家书包含着沉甸甸的牵挂,联系着相隔千里之遥的徐大侠和他的至亲。这些信的内容已经无从知晓,但有理由相信,这些信必然包含有如“吾妻安否?”“吾儿读书否?”这样朴实和日常的问候,思之令人动容。



除了旅店,寺庙再次成为徐霞客无奈的选择,“茅屋”、“竹楼”里的一张“床铺”成了徐霞客的“寄宿”之地。另外,“当地人”也常常在天色比较晚的时候向徐大侠伸出援助之手,给他安排“房屋”。尽管这些住宿条件不及县城旅店舒服,但毕竟有屋子,有床铺,更惨的时候,徐霞客只能住在“船上”,甚至露天的“荒山野岭”。


另外,徐霞客并不是一位轻装上阵的背包客,他的“行李”很多也很重要,因此不论餐饮维度还是住宿维度的关键词都反应出他为了这些行李雇佣挑夫、脚夫等随从的现象。



五、徐霞客靠什么走完全程?


在没有现代交通工具的帮助下,徐霞客是如何走完他的旅程的呢?对原文的字频进行统计,提取了关于交通的关键词。


徐霞客这一路主要的交通工具是他的两条腿,“行”以及与之相关的“走”、“布”等字出现的数量占所有交通类关键字的比例超过70%。所以尽管有人说徐霞客24年走了5万公里并不算远(这样的评价显然是参照了现代交通系统的尺度),但是这5万公里的70%是靠双腿走出来的,而且是在以上那种食宿环境下完成,所以徐霞客是真正意义上用脚步丈量祖国河山的第一人,这样的壮举,值得所有后人敬仰。


66.50%

0.25%

16.28%

轿

0.17%

8.95%

0.17%

3.81%

滑竿

0.06%

3.09%

0.04%

0.63%

0.04%


舟船是徐霞客借助最多的外力交通工具,比骡马驴等高出很多,这说明在路况和交通工具都比较差的古代,中国南方省份充分利用河流丰富的优势开发处方便、快捷和复杂的水路交通体系。


以上便是徐霞客旅行中“食住行”三个最基础的部分,对于旅游六要素的后三个“游购娱”中的“游览”的研究已有很多,徐霞客主要的游览对象是祖国各地的山川河流、民俗风情和土著文化等。


徐霞客的旅程中并没有太多的“娱乐”活动,一方面他志不在此,出行目的主要是多欣赏山水;另一方面,很多时候“被困”深山老林的寺庙道观,与和尚共餐,与道士同寝,所谓娱乐活动大概也就只有参禅悟道了。


因此,就剩下“购物”: 


六、徐霞客都买些什么纪念品?


出乎意料也在情理之中的是,徐霞客购买最多的东西是大米,与之相关的还有鱼、柴火、香蕉、橘子、衣服和火把等,对于一路上风餐露宿的徐大侠,生存应用之物应该才是购物清单上的最必需和奢侈的物品吧。


由于购买的多是日常用品,采购地点也多是“城镇”的“店铺”、“市集”和其它相关“市场”,而且这些市集很多都是临水而建,所以,徐霞客往往是坐船前往,等船“停泊”“靠岸”后再上岸进行购置。徐霞客还有一个重要卖家是“和尚”。所以,即使徐霞客经常在寺庙解决食宿,接受施舍,但也不总是能免费,有时也需付一点“费用”,不过从出现最多的费用相关词汇是“铜钱”和“文”来看,这种费用通常不会太多。徐大侠经常在“中午”逛市场购买东西,有时候也在“下午”或“晚上”,依时间安排和兴致而定。


当然除了生存必需品,徐霞客也偶尔买一些纪念品,提到最多的是“石头”和“扇子”,这和徐霞客的文人气质是相符合的。


说完了徐霞客旅程中的具体细节,接下来分析一个比较宏观的问题,这个问题可能连徐霞客本人也没有意识到,那就是:


七、《徐霞客游记》揭露出的明朝走向衰败直至灭亡的证据


徐霞客生于1587年,现在看来,这是一个特殊的时期,因为徐霞客诞生后第二年即是明朝万历十五年。

按照黄仁宇先生著作《万历十五年》所述,虽然这一年在明朝历史上看起来并无大事发生,但从大历史观看,正是这一年的诸多小事,奠定了大明王朝的灭亡。徐霞客正诞生在这样一个对于明朝帝国乃至整个中国历史都极其重要的转折时期,直至他50岁完成全部旅程时候,大明王朝的衰败之气愈显严重,而徐霞客游记中的诸多内容都反应出了这一点。

自古中国王朝的衰败先兆无外乎政治腐朽、社会动荡;民不聊生、人心浮动;强番悍夷,军队散漫;体制僵化,不思进取等。

对反映涉及当时政治、人民生活、统治阶级和起义暴动等的相关描述进行辅助词群提取后再进行情感分析。超过60%的相关描述为负面情绪结果,这一结果属于整体很消极。

对消极描述进行高频关键词统计,发现盗贼、叛军、土司、军队、官吏是主要的主语名词,与之对应的谓语多是掳掠、搜刮、抢劫、贿赂、反叛、作乱等,而主要的地理名词是广西和云南。



徐霞客旅程中多次被盗、被抢、被勒索敲诈,甚至威胁安全,他亲眼看见以土司为首的边境势力糜烂腐朽,互相残杀;看见军队组织混乱,懒散僵化;看见沿途各地王爷穷奢极欲,搜刮民脂;看见农民纷纷揭竿起义,暴乱不断;也看见刁民趁人之危,敲诈勒索。徐霞客不加粉饰,真实记录下一切。


这些都说明徐霞客时代的南方诸省早已不再是一片祥和盛世,而是上层腐败暴戾、下层水深火热、军队散漫、边番强悍、叛乱不断、民风彪悍的一片乱世之状。这些似乎每个时代或多或少有之的小问题加在一起就敲响了大明王朝走向灭亡的丧钟。

八、总结一下

朱惠荣老师说,《徐霞客游记》是导游手册,是地学百科全书,是历史实录,也是文学名著。这些是让它成为旷世著作,为后人传颂的基础。更可贵之处在于,因为这部书的完整、真实和详细的描述,为后人研究当时社会诸多细节留下线索。

5月19日是中国旅游日,这个与徐霞客千丝万缕的日子虽然刚刚过去,但还是希望通过此文让更多人了解《徐霞客游记》,了解他为后人留下的文化遗产。

扫码报名Strata Data Conference大会

大数据文摘专享八折优惠码:WENZHAI




往期精彩文章


点击图片阅读文章

手把手 | 用R分析宋词三百首 自己动手写个“机器诗人”