专栏名称: 历史地理研究资讯
汇集历史地理学研究领域的各种资讯,包括开设历史地理学的院校介绍、历史地理学名家、历史地理学图书推介、讲座信息、会议资讯、学术信息及历史地理学相关研究的文章等。
目录
相关文章推荐
历史地理研究资讯  ·  潘威 :中国历史地理学数字人文发展报告 ·  昨天  
中国社会科学网  ·  【学者的2024】韩鼎:寻龙问古赞盛世 ·  13 小时前  
国家人文历史  ·  大唐名将李靖,为什么乱入殷商“封神榜”? ·  2 天前  
鱼羊史记  ·  男女间互相生理性喜欢,才有的表现 ·  2 天前  
51好读  ›  专栏  ›  历史地理研究资讯

潘威 :中国历史地理学数字人文发展报告

历史地理研究资讯  · 公众号  · 历史  · 2025-02-07 07:30

正文

作者简介

潘威, 1981年11月出生,中国民主建国会会员。云南大学历史与档案学院历史系、云南大学历史地理研究所教授,博士生导师。中宣部“青年英才”、云南省“青年千人”、中国水利史学会副秘书长、中国地理学会气候专业委员会委员、中国科学院陆地表层格局与模拟重点实验室客座研究员、河南大学经济学院特聘研究员。在《Quaternary International》《Journal of Arid Environments》《地理学报》《中国经济史研究》《地理研究》《地理科学》《第四纪研究》《中国历史地理论丛》《沉积学报》《史学月刊》等刊物发表论文50余篇,出版专著4部,主持多项国家级课题。


前言

“数字人文”在上世纪末进入国内历史地理学领域,当时主要是以“地理信息系统”(GIS)为重点引进技术,其最初目的是用计算机取代手工的绘图作业,将纸质历史地图逐步转为电子化历史地图。复旦大学历史地理研究所和北京大学历史地理研究团队最先开始尝试使用GIS 技术,在2000 年中国历史地理学年会(昆明)上,复旦大学葛剑雄教授、北京大学李孝聪教授和王均博士分别介绍了GIS、网络在绘制历史地图、处理古旧地图和历史地理信息管理、传 输的巨大潜力。


数字人文技术通过数字化处理、空间分析、时间序列分析等方法,提高了历史地理研究的效率和精度。例如,通过数字化处理,研究者可以快速地采集和处理大量的历史地理数据,并将其转化为计算机可读的格式,方便后续的数据分析和可视化。通过空间分析,研究者可以更好地理解历史时期的地理现象和过程,例如人口分布、迁移路线、城市扩张等。通过时间序列分析,研究者可以揭示历史时期地理现象的时间变化规律,并预测未来的趋势,为决策提供重要的参考。


对GIS 手段的引入,学界普遍报以肯定和期待的态度。如葛全胜将GIS 技术的引入作为20 世纪历史地理学的主要进展之一。张伟然认为GIS 技术“很大程度上重塑了历史地理学的研究理念”。近5 年来,随着历史地理信息化实践的深入,对其发展史、研究理念、概念内涵与外延的讨论也渐趋深入细致。2014 年以来,潘威、申斌、张萍等都探讨了历史地理信息化发展的经验与展望b。目前,学界普遍认为:包括历史地理学在内的历史学研究向纵深发展离不开GIS 支持,历史地理信息化(Historical Geography Informatization, HGI)不能脱离历史地理学的问题体系。复旦大学满志敏教授是历史地理信息化重要的开拓者 和奠基人,他更注意GIS 应用中的一些具体问题,比如历史地理数据整编思想、GIS 与历史文献在具体研究上的结合方式等,这类工作对研究实践的针对性更强。因此,这类实证性的研究实际上也发挥了构建方法论原理的作用。2002 年, 满志敏初步明确了以GIS 建设与应用为主的发展方向,其内涵被扩展为“利用信息化手段、丰富研究资料来源”,HGI 不仅是辅助性手段,更应成为一种研究方法。2012 年,潘威提出历史地理信息化的外延应扩展为“地理信息科学的一类”。2014 年之后,陈刚、潘威等提出了结合数字人文与GIS 的历史地理信息化建设方向。2018 年,“历史地理信息化2.0”概念被提出,HGI 与个性化的研究结合更加紧密。HGI 日益贴近个人化研究,通过扩大技术手段边界,囊括更多相关学科的技术体系,以符合历史地理学界内差异日渐扩大的实际情况。同时,其外延也从制图扩大为数据重建工具、分析工具,成为历史地理研究实践中不可缺少的辅助手段、研究工具和思维方式。


一、历史地理学需要“数字人文”


(一)历史地理信息化的当前困境


数字人文技术在历史地理学的空间分析与应用方面也取得了重要成果,即空间数据可视化与分析。通过地理信息系统(GIS)和空间数据库,历史地理学者可以进行空间查询、空间统计和空间模拟等操作,从而深化对历史地理现象 的理解。例如,通过空间查询技术,可以快速找到特定时间或地点的地理信息;通过空间统计技术,可以分析地理现象的分布特征和变化规律;通过空间模拟 技术,可以预测历史地理现象的发展趋势和影响。


首先,空间数据可视化可以将大量的地理信息以图形、图像的形式呈现出来,使学者们能够更直观地观察和分析地理现象。例如,通过制作历史时期的地图,可以观察不同地区的人口分布、交通路线、城市扩张等情况,从而揭示历史时期的社会、经济、政治发展过程。此外,空间数据可视化还可以将不同来源的数据整合在一起,如历史文献、考古资料、环境数据等,提供全面的地理信息视图,有助于学者们深入挖掘历史信息。


其次,空间数据分析可以利用数字人文技术对地理数据进行处理和分析, 以发现其背后的历史过程和规律。例如,通过空间统计方法,可以分析历史时 期的人口分布、社会经济活动空间集中度等,揭示历史时期的区域发展模式和 趋势。此外,利用GIS 的空间查询功能,可以快速找到特定时间或地点的地理信息,为研究提供重要的数据支持。


最后,空间模拟技术可以模拟历史时期的地理现象和过程,为预测未来 趋势提供参考。例如,利用GIS 和计算机模拟技术,可以模拟历史时期的战争、气候变化等对地理环境的影响,预测未来可能发生的变化。这为历史地理学的 研究提供了重要的工具和方法。


如在某地区的历史地理研究中,研究者利用GIS 和空间数据库技术对历史时期的地图和人口数据进行了空间分析和应用。通过空间查询技术,研究者快速找到了该地区在不同时间点的地理信息;通过空间统计技术,研究者分析了该地区人口分布和迁移规律;最后,通过空间模拟技术,研究者预测了该地区未来的人口发展趋势和城市规划方案。这些成果为该地区的城市规划和资源管理提供了重要的决策支持。


总之,空间数据可视化与分析利用数字人文技术对地理数据进行处理和分析,以直观的方式呈现历史地理现象,发现其背后的历史过程和规律。这为历史地理学的研究提供了重要的支持和参考。


1.弱化了史料的基础地位


HGI 工作一定要紧密结合史料,但就目前情况而言,HGI 工作中仍然不注意确立史料基础性的地位。具体表现在:(1)不注意建立个人的或团队的史料管理系统,仅仅对史料中的相关信息进行管理;(2)过度依赖数字型史料,即主要偏向具有数字记录的史料,而这一类型的史料仅占已知史料的很少部分, 且分布时间段集中在明代以降,导致HGI 工作展现的时段和所能解决的问题受到很大限制;(3)史料文本分析能力低下,随着近年来研究领域的史料边界不断扩大,史料的规模、类型和种类较2000  年左右有了明显的增长,特别是清代民国档案类史料、民间史料、图形类史料和口述材料等,完全依靠人力阅读效 率低、费时长,且易出现错漏、误读等问题。解决上述问题需要建立适应于个 人或团队的系统性史料管理方案和计算机辅助下的史料文本分析方法,尤其是 人—机协同读史料工具,可以让研究者快速、准确地了解史料的主要指向,进 而有针对性地制订工作计划和实施步骤。


2.基础数据制作中标准规范应用不足


基础数据制作中标准规范应用不足,导致难以在数据之间建立联系,产 生“数据孤岛”现象。数据孤岛分为物理性和逻辑性两种,物理性的数据孤岛 指数据在不同部门间相互独立存储、独立维护,格式各异,彼此间相互孤立,形成了物理上的孤岛;逻辑性的数据孤岛指不同部门基于特别的目的对数据进行 理解和定义,使得一些相同的数据被赋予了不同的含义,这无形中加大了跨学 科、跨团队的数据合作成本。物理性和逻辑性的数据孤岛现象在历史地理学界普遍存在,导致HGI 数据在规模上处于无效增大状态,也加剧了学科各分支之间的隔阂,影响到历史地理学在研究深度和广度的发展,最终限制了历史地理学的问题体系跟上时代步伐。数据驱动型研究最根本的诉求是打破甚至消灭“数据孤岛”现象,在历史地理信息化中必须落实“数据驱动型研究”理念,而由于缺乏一致的语义与编码规范、存储与交换标准导致的数据孤岛是最主要的障碍之一。


3.数据互操作机制和技术应用不足


互操作可以实现异构资源整合。传统上互操作指“不同平台或编程语言之间交换和共享数据的能力”,为了达到该目的,需要包括硬件、网络、操作系统、数据库系统、应用软件、数据格式、数据语义等不同层次的互操作。其中,万维网联盟(World Wide Web Consortium, W3C)倡导的“语义互操作”制订了多种句法标准和叙词表编制国际标准,是实现异构历史地理学信息整合的重要手段。国内GIS 领域在2002 年开始引入“语义互操作”,但历史地理学界至今未重视“互操作”建设,HGI 领域内普遍缺乏不同平台之间交换和共享数据的机制和技术,存在着比较严重的“数据隔离”情况。这一方面由于共享数据的理念尚未深入人心,另一方面数据互操作技术的掌握和应用是更为重要的技术障碍。以目前历史地理学界内最具代表性的成果——中国历史地理信息系统(China Historical Geographic Information System, CHGIS)为例,该平台提供了目前国内外最完整的一套中国历史政区数据,但CHGIS 的数据由于缺乏互操作技术的应用,目前仍然是一个“数据孤岛”,其他用户必须适应其数据格式方能实现政区数据与自有专题数据的融合,而许多专题数据无法与CHGIS 的地名数据体系对接。为解决这一不足,近年来,CHGIS 项目组和哈佛大学合作开展了关联开放数据工作,提供了将历史地名信息与其他地名词表实现融合的技术路径,此项应用即应用语义网的数据互操作技术实现异构数据资源整合的案例 (参见:http://maps.cga.harvard.edu/tgaz/)。


(二)时空维度与人地关系


历史地理学是历史学与地理学的交叉学科,其主要特征是从空间视角审视历史过程,进而总结人地关系,其问题体系大多来源于地理学,而研究资料则 与历史学无二致。从传统的舆地沿革到现代历史地理学,可视化始终是重要的 研究辅助手段和成果展示手段,只不过之前是用舆图、近现代地图作为载体, 计算机技术出现之后,这一载体转变为了多种形式的数据可视化成果。历史地 理学的研究必须建立在地理信息的管理、呈现与分析之上,而GIS 技术及时空可视化是非常理想的选择,因此,“数字人文”技术在历史地理学界具有非常深厚的土壤,历史地理学对信息化技术的应用并非“跟风”之作,而是学科现实 需要所催生的自然需求。


从历史地理学的发展过程来看,新思想、新技术与新观点是推动学科发展的主要力量。“数字人文”产生的重要背景是近年来信息化社会加速发展,政府、社会和学界都需要加速信息化改革。2023 年,张晓虹、张伟然、张萍三位教授 在《光明日报》上发表了一组笔谈,分别为《GIS 与中国历史地理信息平台建设》《历史地理:数字人文的硬抓手》《数字时代:历史地理学研究方法的变革与 挑战》,这三篇笔谈是近年来对于历史地理信息化建设、历史地理学自身发展与“数字人文”浪潮三者关系的最清晰、全面、深刻的认识,对今后的工作具有重要的指导意义。


其中,张伟然教授特别指出,“数字人文”在历史地理学的发展必须重视历史地理学研究和历史地理信息化成果的应用,尤其是历史地理学作为能够生 产数据的人文学科,对于“数字人文”在史学领域的良性发展具有不可替代的 重要作用。尤其是张伟然教授清晰提出了历史地理信息化所生产的数据,不应 以追求数量为目的,而应该追求独特性。张伟然教授高度概括了历史地理学与 历史地理信息化对“数字人文”的意义,称历史地理信息化是“数字人文”的 “硬抓手”,张伟然认为“数据提取是有边界的。数字人文的目的是要更好地为人文研究服务,而非消解传统人文研究。因此,将史料提取成数据,只能针对 可量化的内容。落实到具体的操作层面,重建历史时期的地理环境应该是当务 之急。地理环境包括自然地理环境和人文地理环境。历史时期的自然地理环境 以气候、地貌最为重要,而人文地理环境则以政区为基础。前辈学者将地理作 为治史四钥匙之一,其实主要指的是沿革地理,重点是为了弄通历史地名变迁。研读史料,一定要清楚它具体的时空位置。史料所系的具体空间是靠历史地名来定位的。如果不了解其准确含义,对史料的理解便难免失真”,历史地理的数字化成果扩大了历史地理学的辐射力,也密切了历史地理与相关学科的关系。当 然,历史地理学也面临着困难和挑战。其中最大的困难是数据生产。虽然未来也许有应用遥感、人工智能等高科技手段进行数据提取的可能,但目前数据产出主要还是靠人工,要研究者从史料中去挖掘、考证、分析、判断。不妨说,历史地理学的很多研究就是一个自己生产数据的过程。但这样的产出效率偏低,在很多专题领域似乎很难有更便捷的办法。此外,由于资料密度的差异,所能复原的 地理环境在不同时代的精度有较大差异。近现代的复原可以做到很精细;中古 以前精度无疑要下降很多。有些问题可能确实无解,而有些可能只是还未想到 合理的技术路径,这就需要不断加强多学科互动,通过各种途径不断接近目标。


二、“数字人文”对历史地理学研究的促进作用


(一)从历史地理信息化到“数字人文”


历史地理学无论怎样发展,基于历史文献记录这一基础是无法改变的。因此,针对史料文本本身的信息化处理非常重要,但这一点在之前的历史地理信息化建设中往往被忽略,或者尚不够重视。就已有的成果来看,CHGIS、CCTS(Chinese Civilization in Time and Space,中华文明之时空基础构架)等多个平台都缺乏对于史料文本本身的信息化处理方法,系统中也没有设计针对文本处理的功能。“数字人文”带给历史地理信息化的启示可能有如下几点。


1.针对历史文献记录本身


数字人文技术在历史地理学领域的数据采集与处理方面发挥了重要作用。通过数字化技术,历史地理学者能够快速、准确地获取和处理大量数据,包括 历史文献、地图、照片等。例如,利用光学字符识别(OCR)技术,可以将历 史文献中的文字转化为可编辑的文本格式,方便后续的数据分析。同时,通过 空间数据可视化技术,历史地理学者能够将地图、照片等空间数据转化为交互 式的可视化图像,以便更好地观察和分析地理现象。这其中,数字化历史文献 是数字人文技术在历史地理学中广泛应用的一个重要领域。通过数字化技术, 历史文献可以被转化为电子格式,从而方便学者们更方便地筛选、整理和访问 这些文献。这一技术的应用,极大地提高了历史文献的利用效率和学术研究的 速度。


首先,数字化历史文献解决了纸质文献保存困难的问题。纸质文献在长期保存过程中,往往会因为各种因素而遭受损失,如老化、虫蛀、火灾等。而数字化技术可以将这些文献转化为电子格式,存储在计算机或云端,大大延长了其保存时间。这样,学者们可以随时随地访问这些文献,而不受时间和地点的限制。其次,数字化历史文献提高了文献检索的效率。在传统的纸质文献检索中,学者们需要手动翻阅大量的文献,筛选出与自己的研究相关的信息。这个过程既耗时又费力。而数字化技术可以通过关键字搜索、语义分析等方法,快速地筛选出相关文献,大大提高了检索效率。这使得学者们可以更快地进入研究状态,减少查找文献所花费的时间和精力。此外,数字化历史文献还推动了跨学科的研究。历史地理学是一门涉及历史学、地理学、社会学等多个学科的综合性学科。数字化技术可以将不同学科的文献整合在一起,形成一个大型的数字图书馆或数据库,方便学者们进行跨学科的研究。这有助于推动历史地理学的深入发展,提高研究的综合性和全面性。最后,数字化历史文献还为学术交流和合作提供了便利。通过电子格式的文献,学者们可以在网络上进行分享和交流,不受地理位置的限制。这有助于促进学术研究的合作和交流,推动学术研究的进步和发展。


主要的困难包括以下几点:(1)中文古籍的固有书写习惯对OCR 造成的困难。中国古籍书写习惯为直排书写,目前能够进行OCR 处理的文本基本都是被处理过的横排版本,这种版本对于职业研究者而言是不能作为研究资料使用的;


(2)断句问题。古籍中不存在格式上的句读,所以文本往往出现不应该有的连缀现象。在进行文本信息挖掘时,这种现象往往造成信息的错乱。


2.更加贴近于历史学问题


历史地理学是从地理或者空间的视角审视历史过程,由于具有明显的交叉学科特征,近年来,历史地理学除了继续保持对地理学问题的关注之外,也更 加留意对历史学热点问题的关注,比如环境史、社会史、历史人类学、财政史 等问题。胡恒在《从数字典藏走向数字人文:中国大陆数字史学发展浅思》一 文中已经指明,包括历史地理学在内的历史学整体转向“数字人文”是大势所 趋,需要强化扎实的数据建设和研究成果,以实现个人研究和学界需要的平衡。


李冀、侯甬坚采用地形模型结合军事电子沙盘,重新探讨了秦赵长平之战的人数规模问题,进而重新思考中国古代战争记录中的兵力规模问题a;欧阳琳浩与谢湜采用GIS 技术,从城市空间结构角度阐释了19 世纪后期汕头开埠之后, 人口流动对城市空间形态的影响b;王哲和侯的对1903—1942 年中国城市网络空间结构的重建中,采用GIS 技术提取了中国近代邮政网点体系,进而探讨了近代开埠通商对长江三角洲城市群体系空间结构的影响c;苏绕绕和潘威基于近代水利图,采用GIS 技术和“最优距离算法”重建了20 世纪初期新疆灌渠的空间格局。这些研究中所体现的问题意识,既符合历史地理学的传统,也使用了量化或者信息化手段,都展现了新型研究手段在历史地理问题中的重要作用。


3.研究手段趋向多元化


近年来,随着历史地理信息化向“数字人文”演替的速度日渐加快,软 件使用也趋向多样化,GIS 类软件(MapInfo 和ArcGIS)不断发展的同时, MATLAB、SPSS、TOM、SketchUp 等软件的使用也开始增多。这一现象指征了历史地理学在研究问题上向多元化发展,GIS 软件已经不能完全满足工作需要, 如复旦大学李晓杰团队所进行的《水经注》考释与绘图是传统的历史地理学问 题。但近年来,该团队也开始使用GIS 技术进行《水经注》的绘图工作,2023 年李晓杰团队获得了国家社会科学基金重大项目的支持,该项目设计了“多模 态地图绘制”子课题,计划采用GIS 技术、工程建模、动态演示等多项技术。


“数字人文”的重要追求之一是打破学科藩篱,实现真正的跨学科知识融合,最近两三年历史地理学信息化的发展已经向学界展示出这一趋势,历史地理学原有的历史自然地理、历史人文地理、历史经济地理等方向已经在信息化技术支持下,出现了取长补短、融会贯通的趋势。这一发展趋势与近年来历史地理学始终建设信息化系列会议紧密有关。HGIS 论坛是历史地理学界内以信息化建设为宗旨的定期会议,其规模不断扩大,至今已举办8届。这一平台已经成为历史地理学界内的一项重要学术会议,除了历史地理学界以外,人文地理学、计量经济学、考古学和环境考古学的学者也积极参加该项会议。


2023年,《近代史研究》编辑部与广西师范大学合作举办了“大数据与中国近代史研究”研讨会,中国社会科学院与山东大学合作举办了“首届数字边疆青年学者论坛”。这两次会议透露出一个重要信号,即传统的历史学研究开 始意识到“数字人文”的重要性,而历史地理学学者在这两项会议中所展现的空间分析技术得到了与会学者的广泛关注,历史地理学界内也通过这样的交流机会学习到了经济史、近代史、民族史青年学者在计量分析、文本挖掘方面的技术优长。


(二)信息化技术与古旧地图信息化处理


古旧地图是人文社会科学研究的重要史料,在光学字符识别(OCR)、地 理信息系统(GIS)、数据库技术等数据库信息化手段支持下,可以最大限度挖掘古旧地图中的地理信息,提升古旧地图的使用效率。历史地理学界针对古旧 地图的信息化处理已经进行多项实践,如张萍等基于多种古旧地图对西北“丝 绸之路”交通路线和古代城市定位、韩昭庆研究康熙《皇舆全览图》投影方式、潘威等对近代灌渠体系的重建和分析,皆实践了GIS 手段在古旧地图处理中的运用。不过,历史地理学界将古旧地图的信息化操作局限于GIS 环境下的人工矢量化处理,限定了对古旧地图的进一步研究和更广泛使用。解决以上问题的 方法是让历史地理信息化与图情、计算机科学、信息管理等学科领域深度融合, 持续推动GIS 在历史地理学中应用的同时,充分利用大数据环境下的数据库技术、图形计算技术、深度学习技术。


古旧地图既是历史地理学中的重要研究资料,也是长期受关注的研究对 象。目前,古旧地图研究的信息化大致可分为两个方面的工作。


1.古旧地图管理平台


这一类工作包括复旦大学历史地理研究中心的“古旧地图数字平台”、首都师范大学张萍教授“丝绸之路历史地理信息系统”、云南大学成一农教授的 “中国古地图数据平台”、多单位共建的“数字历史黄河·图形资料库”等,都是历史地理学内部比较重要或者有特色的古旧地图平台。这种特色目前还主要 体现在资料本身,平台功能和数据结构上并无太多亮点,基本都是基于开发者 自身研究需求进行数据结构设计(在历史地理学界内,这类信息化平台的开发 者其实也是最重要的使用者),这一方面支持了开发者的个性化研究,但同时, 也在相当程度上限制了这些资料平台的拓展性。


2.“深度学习”技术与古旧地图处理


古旧地图上的符号和文字信息具有重要的史料价值,陕西师范大学张光 伟团队长期致力于利用卷积神经网络实现古地图文字信息的自动化提取,在此方面,张光伟等已经实现了工具转化,将此技术转为网络在线工具。深度学习 (Deep Learning)在古旧地图地名信息提取工作中的应用已经有不少成功案例。 训练计算机习得针对不同大小汉字的检测模型—U-Net 算法 进行字符级文本检测,因此文本识别模型也采用了字符级的识别模型。 在文本识别领域,主流的 光学字符识别系统(OCR)采用的是行(列)级别的识别模型,主要采用CTC (Connectionist Temporal Classification)算法搭配卷积神经网络(Convolutional Neural Network, CNN)叠加循环神经网络(Recurrent Neural Network, RNN) 对图片中包含的文本序列进行建模,一般而言文档中的行和列相较于单个字符 更为容易检测b。 然而,古旧地图中的地名文本排列往往不如普通文献中的那 样规则,而且部分地名的字符间距较大,所以行列级别的识别在地图文本识别 中可能并不如在一般文献识别中那么有效,因此使用卷积神经网络进行字符级 别的检测和识别。 处理过程是: 根据每个字符的定界框(Bounding Box)将检测到的字符按尺寸进行分层; 将检测到的文本合并成候选地名,将排名最靠前的地名列表在原始地图上进行可视化展示; 解析文本中包含的地名(Geo- parsing),即使用自然语言处理(Natural Language Processing, NLP)技术从无结构文本中识别地名。


对老旧地图的识别目前集中在地图符号的自动识别。国外对此研究开始较早,较著名的是德国汉诺威大学地图制图研究所进行的《德国1: 5,000 地籍图的自动化》,其成功开发出地图矢量转换软件;而后美、日又在此基础上进一 步开发出各自的地图数字化识别软件。近年来随着深度学习技术的发展,学者 们越来越多地将深度学习方法与地图识别相结合。Wang   等人提出基于神经网络 的地图注记提取方法,该方法使用大量样本特征进行神经网络训练,并使用神 经网络将地图注记、线划信息与地图背景要素相分离。Velázquez 提出了一种V 型线模型,将模型与神经网络结合以实现消除地形图中与地图符号关联的其他 干扰信息,最后进行地图符号的识别。Sester 针对不同类型地图,通过构建建筑物训练集,运用卷积神经网络完成地图中建筑物的提取与识别。目前看来将深度学习应用于地图识别主要存在两类问题,其一是地图图像清晰度有限,使 得数据集训练精度较低;其二是神经网络结构需要针对地图信息作出相应调整。国内历史地理学界,最近也开始注意到这一问题。如柴宝惠基于机器学习和图 像形态学对近代上海地图中河流信息的自动化提取,潘威和张光伟等采用卷积神经网络方法对清代河工图中的文字信息进行了自动化识别与提取。虽然以上工作尚不能满足历史地理学界在这一领域日益增长的需求,但为历史地理专题数据生产的高效化和科学化提供了重要的前期工作。古旧地图普遍缺乏统一的测绘标准和绘制标准,保存情况、扫描情况也相差巨大,这一情况对古旧地图中水体信息的自动化提取造成了很大的困扰,我们发现,技术的通用性提高和提取效果成反比,追求通用性的结果是自动化提取的数据质量降低;如果对数据质量有较高要求,则技术方案的通用性就会降低,只能基于具体图形研发针对性的技术。因此,必须在技术方案的针对性与通用性之间寻求平衡。复旦大学柴宝惠博士率先尝试了图形学和深度学习方法在上海近代地形图中水系信息提取中的应用,这一工作是在一套绘制清晰、具有明显色彩差异、保存良好的近代地图上进行的,而近代地图中大量存在着绘制模糊、色彩单一、图幅有污渍和霉变等现象,导致现有技术很难推广。目前而言,真正解决古旧地图信息的自动化提取仍存在相当难度。


(三)历史地理学中的跨学科知识融合


历史地理学具有明显的综合学科特征,除了历史学和地理学两大基本支柱学科之外,近年来的历史地理学也日益与社会学、政治学、经济学、文物保护、语文学、第四纪地质学等众多学科产生了融合趋势,而涉及的二级学科则难以 统计。今后,历史地理学的发展将呈现更为丰富、更为复杂的学科交叉局面。具体表现为:(1)信息种类显著增多;(2)多学科术语体系的互相渗透;(3)“数据”成为揭示各要素之间关系的有力载体。


在这一背景下,数字人文与历史地理学的深度融合已经被一些学者所重 视。数字人文技术可以与跨学科研究相结合,推动历史地理研究的发展。例如, 数字人文技术可以与人类学、社会学、经济学等学科相结合,从多角度、多层 次研究历史时期的地理现象和过程。此外,数字人文技术也可以与新技术相结 合,例如大数据、人工智能等,提高历史地理研究的效率和精度。如何将数字 人文技术与跨学科研究相结合,推动历史地理研究的发展?如何发挥新技术在 历史地理研究中的作用?这些问题值得进一步探讨。 美国学者施耐德曾指出,数字人文有两条主线,一条是文学的,另一条是史学的,这两条主线在21 世纪初实现了交汇,美国“数字人文”发展的这一经验值得中国学界引起重视。 多学科交叉这一理念在“数字人文”引入中国 之前已经被政府和学界多方强调,“数字人文”浪潮兴起之后,多学科交叉迅速向跨学科知识融合迈进。 2021年,潘威、夏翠娟、张光伟三人合作,尝试将历史地理学、信息管理学与计算机技术进行跨学科融合,历史学者高度依赖史 料,但对于史料的管理,特别是对大规模史料的有效管理缺乏思考和实践。 图 情学界自1980年代开始将个人计算机用于文献信息管理,进入网络时代以来, 该领域亦迅速将互联网技术应用于图书信息管理,对包括历史文献在内的图书 信息管理已经构建了非常成熟的软件、方案和路径,尤其是图书馆业界已经形 成了具有规范结构的元数据以进行资源管理a。 例如“资源描述框架”(Resource Description  Framework,  RDF)是W3C 提出的用于描述知识图谱实体及其关系的数据模型b。 2009 年,“资源描述与检索”(Resource  Description  and  Access, RDA)方案依托该模型编制完成,次年网络工具包发布,2013    年开始在全球主要国家的国家图书馆中使用c。 这一技术标准体系在国外历史地理学界已有广泛应用,但尚未受到国内历史地理学界的重视。


目前,历史地理研究中,研究者和研究团队都未充分意识到个性化的历史文献管理方案的重要性,也未开发资源描述工具。近10  年来,历史文献的形式 已经由纸本文书转为电子文本;同时,研究团队中跨校、跨国、跨专业合作的现象日益明显,团队的公共资料管理平台不仅是凝聚成员的有效途径,更是开展工作的基础性设施,历史地理学界必须在团队层面建设自己的历史文献管理方案,包括个性史料的电子化、局域网的信息管理系统建设以及管理规则的制定等,而其基础是具有资源描述框架,这样才能真正实现有效的资料积存和管理,提升团队工作的持续性和管理大规模史料的能力。2023 年11 月,中国人民大学胡恒教授团队举行了“清史地理信息系统”的开题论证,胡恒提出“清史地理信息系统”将融合多种数据管理技术、空间分析技术与可视化技术,以适应清史研究所特有的资料丰富性和研究多样性。


三、“数字人文”与历史地理人才培养

2021 年3 月,国家教育部发布《教育部办公厅关于推荐新文科研究与改革实践项目的通知》(教高厅函〔2021〕10  号),正式提出了“新文科”战略。相较于传统文科研究,“新文科”需要在以下方面进行重点发展:(1)战略性。新文科建设要服务国家应对当今错综复杂的国际国内形势,增强我国在国际社会的话语表达能力;服务我国经济社会领域的全面深化改革,解决与人们思想观念、精神价值等有关的重大理论和实践问题。(2)创新性。新文科建设要通过新的学科增长点,对传统学科进行转型、改造和升级,寻求我国在人文社会科学领域新的突破,实现理论创新、机制创新、模式创新。(3)融合性。新文科建设涵盖了人文社会科学领域内多个学科的交叉、融合、渗透或拓展,也可以是人文社会科学与自然科学交叉融合形成的文理交叉、文医交叉、文工交叉等新兴领域。(4)发展性。这是新文科的动态特征。人文社会科学领域研究的问题存在很多不确定性,许多新问题会随着社会发展层出不穷,且问题解决并无固定模式,需要在实践过程中不断探索调整、日臻完善。


与学术研究中引入信息化手段几乎同时,历史地理学的研究生课程体系中也开始设置专门的“数字人文”类课程,2000  年之后,复旦大学历史地理研究 所开设了GIS 课程,教授GIS 软件的操作,随着GIS 操作的不断普及,包括陕西师范大学、暨南大学、四川大学、北京大学、云南大学等单位都开设了专门的GIS 软件培训课程,一些单位正计划将GIS、语料库搭建、数据库设计等内容糅合,以“数字人文”名义开设研究生课程。但目前,历史地理学中的“数字人文”课程的教学方法、教学案例等方面仍缺乏系统总结。


历史地理学两大最主要单位分别是复旦大学历史地理研究中心和陕西师范大学西北历史环境与经济社会发展研究院,由于这两个单位都是科研型机构, 在教学方面很难发挥引领作用。其他各依托于学院的历史地理单位在教学方面 也缺乏针对性,往往是面向历史学学生进行课程设置。目前,本科教学的历史 地理课程并不成体系,在有限的时间内要讲授历史地理的基础知识已经非常紧 张,故而很难开展针对历史地理学本科教学的“数字人文”类课程。 进入研究 生阶段学习后,历史地理专业性培养体系方才出现。 自从21   世纪初,复旦大学率先进行硕士生和博士生的GIS 技术培训课程之后,陕西师范大学、暨南大学、云南大学、西南大学等单位陆续开设了专门课程教授研究生进行电子地图绘制。 近5年来,历史地理信息化教学已经取得了长足进步,全国历史地理学位点都 设置了信息化相关课程,向研究生传授了ArcGIS/QGIS、MapInfo 等多种软件的操作方法。 近年来,随着“数字人文”对历史地理学的影响日渐显著,TOM 等软件也开始进入教学体系。 但从总体来看,历史地理学的信息化课程建设大多 不成体系,也缺乏教材建设,历次HGIS 论坛中都未专门讨论过历史地理信息化的教学问题。 历史地理学需要大量依靠野外工作进行,培养研究生的野外工作 能力是研究生教学中非常重要的一项环节。 目前,全国各主要历史地理单位都 有面向全体研究生的野外教学,21 世纪之后,GIS 技术也作为野外教学中的重要工具,在21 世纪的头一个十年中,GIS 技术开始向野外教学渗透,成为野外考察前进行地理格局现状认知以及考察成果汇总的重要工具。 但这一做法的具 体效果仍需要观察。


从人才培养的效果而言,GIS 技术目前已经被广泛采用,但绝大多数研究生还是将其作为制图工具,从信息管理层面以及空间数据分析方面利用GIS 技术的仍旧不多。这一现象的成因是多方面的,但课程体系中缺乏针对性的内容 设计,重视软件操作,轻视研究生的个人研究情况是非常重要的原因。要有效 改善这一现象,可能需要尝试研究生阶段的小组化教学,因人而异地指导学生 进行技术培训,同时建立完善的课程体系,将基础性软件操作放在本科生阶段。


四、“数字人文”在历史地理的发展趋势

评估数字人文技术在历史地理研究中的应用效果是重要的,但也是一个 挑战。评估指标可以包括:数据的质量和完整性、研究的深度和广度、可视化效果、预测的准确性、对决策的影响等。此外,还需要考虑数字人文技术的可行性和可推广性。数字人文技术是否能够满足研究的需求?是否能够被广泛应 用?这些问题也需要进行评估和探讨。数字人文技术可以为公众参与历史地理 研究提供更多的机会和平台。例如,通过在线地图、虚拟现实等技术,可以让 更多的人了解和参与历史地理研究。此外,通过社交媒体、网络论坛等渠道, 也可以促进研究者与公众之间的交流和互动。为了保证“数字人文”在历史地 理学内的健康发展,以下是需要引起学界注意的。


(一)正确的观念仍需普及


目前,历史地理学界对信息化工作的误解仍有很多,大致上可以被归纳为以下几个方面:混淆了“数字人文”的基础与目的、对技术方案与历史学问题两者关系存在错误认识、曲解了“问题引领”含义等。


首先,历史地理学界内有学者主张“数字人文”的基础是大数据,缺乏大数据这一基础,历史地理学甚至历史学界内都无法开展“数字人文”工作。这 一认识曲解了“大数据”的真正含义,“大数据”是指具备5V 属性的大量数据集,“大数据”本质上并不仅仅强调“量”的扩张,而是兼顾数据的Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值性)、Veracity(真实性)。因此, 大数据更多是一种引领技术发展和应用的理念,并非“数字人文”的基础,反 而应该成为“数字人文”的目标。







请到「今天看啥」查看全文