专栏名称: 猎卷
时间把真理引向光明
目录
相关文章推荐
51好读  ›  专栏  ›  猎卷

法社科实验室大曝光 | 《法律和社会科学》“法律数据科学”专号,破局而来

猎卷  · 公众号  ·  · 2025-02-24 17:00

正文

请到「今天看啥」查看全文


图片 点击 蓝字 关注 图片

图片


《法律和社会科学》系列丛书,自2006年创刊以来,已成为中国法学与社会科学交叉研究领域的重要学术平台。以“法律与社会科学的互动”为核心主题,致力于探索法律在社会中的实际运作及其与社会科学理论的深度融合,涵盖法律社会学、法律人类学、法律经济学、法律心理学等多个交叉学科领域,可谓法学与社会科学交叉研究的学术高地。


2025年,在人工智能的风口浪尖,第21卷第1辑带着破局信念而来。


“法律数据科学”专号,不仅是新面貌的“法社科实验室”成果的第一册,更标志着内容研究又一跃迁转型。通过融合法学、数据科学、经济学等多学科方法,突破传统研究的叙事局限,为“法律如何影响社会”提供可验证、可复现的科学答案。


正如侯猛教授在《法社会科学:研究传统与知识体系》中所言,社科法学的生命力在于“直面真实世界的复杂性”,而本辑正是这一理念的体验派升级版。






编辑

手记


本辑的主题是“法律数据科学”。 其中,我们收录了11篇使用定量方法研究法律问题的论文,另外有1篇对我国法律定量研究方法的评述,以及1篇对我国法律定量研究方法的批评。“法律数据科学”是我们起的名字,用以涵盖从基本的描述性统计,到因果关系推断,再到机器学习、人工智能等多种方法。实际上,叫什么名字并不重要——我们也可以称其为计算法学、数据法学、数字法学等——它们只是同一研究领域、同一研究方法的不同名称。离开数据,统计和算法无从成立。目前数据科学的前沿——人工智能,也只是一系列用以处理数据的算法的统称。不论我们如何称呼以上领域,其核心都只是使用数据和算法研究与法律相关的问题。


图片


在我国,使用数据研究法律是晚近出现的一个现象。我们对其也存在不少误解,其中之一是,认为计算法学、数据法学、法律数据科学只是近年来兴起的学科,或者说,认为它们是全新学科,有着全新的方法和范式,因而,我们不需要太多学科积累,不必要细读太多过往文献。只要大干快上,就能开疆拓土,弯道超车,甚至开宗立派。之所以存在这种误解,很可能是由于不熟悉法律实证研究,特别是定量研究的学术脉络。从根本上说,这又是因为不熟悉统计学、数据科学和计算机科学间的关系,以及这些学科在社会科学中的渗透和应用。


社会科学的定量研究自20世纪70年代以来日益发展起来。以使用的方法划分,这些研究大体分为三类:第一类是使用基本统计学方法,如描述性统计、相关性分析、逻辑回归、线性回归等,探索社会现象间的相关性的研究。法律领域的定量研究,随着整个社会科学的定量化一起发展。在20世纪80年代,研究者就将美国联邦最高法院的判决进行了数据化,发现法官决策与其政党背景有着很强的相关性——民主党背景的法官在判决中更倾向作出支持堕胎合法化、种族平权、限制持枪自由、加强经济管制的判决;共和党背景的法官则恰好相反。近十几年来,波斯纳晚年把主要研究精力都放在了对法官和司法系统的这类定量实证研究上。


本辑中的大部分论文使用的也都是这类基本统计方法。其中一部分研究侧重描述。比如,高凯铭的《法官说理中的经济分析运用——以民商事裁判文书为研究样本》一文,统计和描述了法官在判决文书说理中运用经济分析方法的情况;李智伟的《行贿惩处为何“严而不厉”:以1995—2022年裁判文书为研究样本》一文,统计和描述了行贿案件量刑的情况。另一部分研究更侧重相关关系的发现。比如,包康赟、卢圣华的《老有所诉:老年人如何参与诉讼》一文,使用裁判文书数据,分析了老年人诉讼参与的相关影响因素;张媛媛、张珺的《司法组织的扩散何以发生?——面向中级人民法院环保法庭的事件史研究》一文,研究了环保法庭设立的相关影响因素;张印的《网络开设赌场:罪量标准的实证检验与体系重构》一文,研究了网络 开设赌场罪 量刑的相关影响因素;刘庄的《陪审团制能促进司法信任吗?》一文,使用跨国比较数据,分析了一国采取陪审团制与该国老百姓对司法的信任程度间的相关关系。


图片


当然,相关性不等于因果关系。错误地推断因果关系可能对实践产生严重后果。这是几乎所有统计学在第一课就会强调的问题。这也是从20世纪90年代开始兴起的第二类定量社会科学将关注点集中在发现因果性的原因。这一轮定量社会科学的发展主要由经济学家主导。在经济学中,被称为实证研究的“可信度革命”。所谓可信度革命,即数据分析不仅仅满足于发现现象间的相关关系,更要能确定因果关系。可信度革命的目的也很明确:避免错误的法律和公共政策危害社会。本辑中陈若凡、孙瑞佳的《规范性文件附带审查的实施效果——基于裁判文书数据的量化评估》一文,尝试采用断点回归的因果推断方法,研究新《行政诉讼法》的颁布与规范性文件附带审查的落实之间的因果关系。


21世纪以来,定量社会科学又有了新的发展。一方面,由于互联网的发展,以及数据抓取、自然语言处理等方法的普及,用于研究的数据规模、数据多样性、数据颗粒度都得到了很大提升。这为大规模数据分析提供了原料,比如,文本数据、社交网络数据、图像音频视频数据、动态实时高频的金融经济数据都得到了大规模采集和应用;另一方面,计算机存储能力和计算能力在十几年间呈指数增长(“摩尔定律”)。这为较为复杂算法(“人工智能”)的落地与应用提供了基础——各种各样的非线性算法,特别是神经网络等深度学习方法,得到广泛使用。由于以上两方面,数据科学特别是人工智能学科取得了重大进展。与此同时,应用这些数据和智能方法的第三类定量社会研究,即近年来所说的计算社会科学,开始逐步兴起。随着整个定量社会科学的发展,在法律研究中利用大规模数据的研究也日益发展起来;机器学习的方法被探索性地应用在了很多部门法领域。本辑也收录了几篇使用这一类最新方法的佳作。吴小平的《计算传播学与法律研究:以〈人民法院报〉为例》一文,采用了自然语言处理的方法,分析了《人民法院报》2010年至2022年共27505篇法院工作的宣传报道,探究了法院在司法职业化与司法大众化、企业利益与劳动者利益、刚性执行与柔性执行、修复感情与协助离婚、控制犯罪与人权保障这几组司法价值取向间的偏向及其历史变化;张雨侠的《如何精确测算中国裁判文书的公开率》一文综合使用了统计学(“德国坦克法”)、自然语言处理、机器学习等多种方法,巧妙测算了我国各级法院的裁判文书公开率。


2023年,随着ChatGPT等大语言模型面世,人工智能再次引起大众的热切关注和议论。文本是法律的表达方式,生成文本(“写文件”)是法律领域的核心工作。不少人感到,ChatGPT等生成式人工智能在法律领域将有广阔的应用前景。 黄致韬 在《反思法律生成式人工智能:技术与法律的双重进路》一文中,使用中文法律条文和裁判文书的文本数据,训练了一套法律大语言模型,并在此基础上,研究如何从技术角度监管大语言模型。特别是如何通过中心化的数据治理机制维护法律基础数据,如何通过技术手段控制和审核人工智能的生成内容。就我们的观察和阅读来看,这是中文世界第一篇兼从法律和技术角度研究法律大模型的论文。


图片


总体来看,以上提及的三类法律定量实证研究,大体分别偏重相关性、因果性以及智能能力。实际上,从国际经验来看,这三类研究的研究者有很大的重合。最早利用相关性做研究的学者,后来也多开始采用准实验的方法。随着机器学习等算法的发展,他们也开始尝试使用更大规模的数据和较新的算法。这种重合很好理解——一个自20世纪90年代以来就擅长数据分析的研究者,很自然地会与时俱进,采用最新的研究方法。这些方法间也有明显的亲族关系:相关性分析是因果推断和准实验方法的基础;统计学家很早就发明的回归分析,到现在也是机器学习(“人工智能”)的重要方法之一。对于学习者而言,前两类研究也是第三类研究的基础,需要循序加以掌握。这也意味着,在这一领域,我们还需要补充许多知识:不仅要学习热门的、时尚的“人工智能”,更要熟悉以往所有定量实证研究的主要方法和成果。柯玉璇的《法律实证研究的工具价值与理论意义:一个评述》一文,对我国定量研究的发展进行了综述。我们从中也不难看出类似的学术脉络和传承。


定量方法是众多社会科学方法中的一种,我们要特别注意它的局限。实际上,只有重视了它的能力边界,我们才能更好地选择它的应用场景,更充分地认识到它的作用深度。刘思达的《破除数字迷信——论社科法学的“伪科学性”》一文,既中肯又切中要害,值得所有使用实证方法的研究者仔细阅读和思考。“从来就没有什么救世主”,社会科学的问题众多,情状复杂,从来就没有一劳永逸的研究方法。不对方法进行反思,就难以称得上真正掌握了方法。

图片


在美国,法律定量研究的发展与法律经济学密不可分。这当然是因为法律经济学的母体——经济学本身,高度依赖定量方法。同时,从学科的理路上看,用数据来验证(证伪)理论,是经济学的标杆——以物理学为代表的自然科学的标准做法。为此,我们还专门收录了几位学者对张永健的新作《法经济分析:方法论20讲》一书的批评与张永健的回应。这会帮助我们进一步理解定量方法在整个法律社会科学体系中的定位和作用。


在编排上,我们将三篇使用自然语言处理、机器学习、大语言模型的研究文章放在前面,以更好地展现法律定量研究的前沿。


刘庄

图片
图片



侯猛,中国人民大学法学院教授、法律与社会跨学科研究中心主任、博士生导师,教育部青年长江学者、教育部哲学社会科学重大课题攻关项目首席专家。法学博士、社会学系博士后,曾在中国社会科学院、对外经济贸易大学和北京大学工作,曾在纽约大学访学和最高人民法院研修、挂职各一年。主要从事法社会科学、政法研究、法院研究。主持出版“学做法社科系列”,包括已出版专著《法社会科学:研究传统与知识体系》,主编《法社会科学研究方法指南》。
图片

刘庄,香港大学法律学院副教授、博士生导师。北京大学学士、硕士、博士,芝加哥大学法律科学博士。主要从事经济法、司法制度、法律与数据科学等领域的研究。研究成果发表于相关领域国内外优秀期刊(包括Journal of Legal Studies, Journal of Legal Analysis等);论文被《人大复印报刊资料》《中国社会科学文摘》《高等学校文科学术文摘》等转载。主持承担多个国家科技研发项目,包括科技部国家重点研发计划项目、国家自然科学基金项目。在香港大学、芝加哥大学教授“人工智能、数据科学与法律”课程。


图片

目   录


自然语言处理、机器学习、大语言模型的应用


计算传播学与法律研究:以《人民法院报》为例 / 吴小平

反思法律生成式人工智能:技术与法律的双重进路 / 黄致韬

如何精确测算中国裁判文书的公开率 / 张雨侠


从相关性分析到因果推断


陪审团制能促进司法信任吗? / 刘 庄

老有所诉:老年人如何参与诉讼 / 包康赟 卢圣华 /

司法组织的扩散何以发生?

——面向中级人民法院环保法庭的事件史研究 / 张媛媛 张 珺

法官说理中的经济分析运用

——以民商事裁判文书为研究样本 / 高凯铭 / 193

行贿惩处为何“严而不厉”:以 1995—2022 年裁判文书为研究样本 / 李智伟

网络开设赌场:罪量标准的实证检验与体系重构 / 张 印

规范性文件附带审查的实施效果

——基于裁判文书数据的量化评估 / 陈若凡 孙瑞佳


《法经济分析:方法论20讲》书评


法经济教义学的召唤 / 贺 剑

法经济分析对民法规范功能与价值的重铸 / 汪 洋

走近法律的经济分析方法 / 熊丙万

动物辩证法:教义学、法经济学与实用主义 / 张凇纶

长江后浪推前浪

——回应四位年轻民商法学者的书评 / 张永健


学科反思


破除数字迷信

——论社科法学的“伪科学性” / 刘思达

法律实证研究的工具价值与理论意义:一个评述 / 柯玉璇

法律组织社会学在中国

——基于 CiteSpace 的可视化分析 / 吴剑峰

法律的社会科学研究进展(2020—2023) / 任 婷 童孟君


编辑手记

法律和社会科学(第21卷第1辑)

法律数据科学

侯猛 刘庄 主编

图片

在法律的严谨与数据科学的精准之间探索新天地

展现了跨学科法律研究的新高度

本辑主题为“法律数据科学”,内容聚焦使用定量方法研究法律问题。研究方法涉及自然语言处理、机器学习、大语言模型的应用,相关性分析与因果推断。本辑的研究对象与议题包括:司法裁判文书、涉老诉讼、专门法庭、网络犯罪、陪审制度、法官说理、学科反思等,此外收录了多篇《法经济分析:方法论20讲》的书评。本辑作者阵容强大,收录的内容总体上反映出国内法律数据科学的最新研究成果,代表了国内跨学科法律研究的新水平。可供法学学生、跨学科法律研究爱好者,以及部分法律实务界人士研读、学习和讨论。






- E N D -
点击 下方长图
可至 猎卷书店 购买更多经典好书
图片
图片
图片
图片
图片
图片
图片
图片
图片







请到「今天看啥」查看全文