当司法遇到大数据
国双司法大数据事业部 石鹏
日前,最高检印发《检察大数据行动指南(2017—2020年)》,通过一中心、四体系的建设方案实现从试点到全面推广的4年规划,打造数据化、科学化、智能化的“智慧检务”。作为坚守社会底线的检察机关,应对数据化、信息化的机遇,解放司法一线办案人员的生产力、提升司法质量的时代要求面前,做出了这样的承诺。
一、司法大数据应当如何定义
对于司法大数据的分类可依不同标准,如根据司法机关的不同分为法院数据和检察数据,或者根据主体的不同分为案件数据和管理数据,甚至还可以根据不同的业务条线进行详细的划分。这里,我们更想强调的是聚焦在“司法”本身,以办案为圆心,定义分布在办案周围的各种数据。包括以下几种:
1.案件本身的数据
这是最为常见、也是最能为人理解的司法大数据种类。以刑事公诉案件为例,案件从立案、侦查、审查批捕、审查起诉到最后审判、执行,整个过程中,物理形态从证据材料到电子卷宗、系统数据、法律文书等等,但其中涉及的数据种类无外乎案件实体数据,如犯罪人主体身份数据、犯罪行为数据、犯罪结果数据等,以及根据案件流程不同产生的案件程序数据,即在办案过程中产生、沉淀的案件数据,如诉讼经过、侦查监督等。
数据存在的形式刚开始可能是一份份笔录、证言、书证、物证,最终经过办案人员整理,形成终结性的办案文书,载明上述数据的内容和明细,同时将相关数据进行结构化处理,输入或者上传至办案系统,从而在实体和线上都留存了相应数据。实体数据多以文本的形式体现;线上数据,尤其是检察院统一案件管理系统、法院智能办案辅助系统的广泛适用,更多的表现为结构化的字段以及电子文本。
当这些案件数据沉淀下来、汇集起来的时候,又可以产生趋势性或者预测性的司法判断,以案例集、数据报告等形式存储,为当下以及未来的案件提供数据支持。
2.办案主体相关数据
这方面的数据往往不被司法一线人员重视,因为他们作为数据的使用者,往往忽视了自己也是数据的生产者。但在员额改革的今天,主体相关数据就显得尤为重要。例如统计年鉴中经常会涉及的政法事业编以及现在所提及的员额法官、检察官数量,都是办案主体总体上量的规模统计,但对于每名主体质的评价,也应该是司法大数据应该涵盖的范围。
如可以根据每名检察官的结案数量、结案率、结案周期、卷宗册数、案由类型、文书说理占比(起诉书中“本院认为部分”字数占全部起诉书字数的比例)、保护力度(起诉书与判决书比较的偏离程度)、案件平均开庭次数、论文报告、案件第三方评价等多个维度对每个检察官的能力情况进行立体展示,甚至可以通过团队平均值来计算每名检察官的偏离度情况,以更好的识别优秀办案能手,做到能者就列,真正发挥员额制的作用。
3.办案相关物质保障数据
与上面两个数据相比,这项数据更不容易与司法大数据进行关联,但所有的办案行为都需要借助一定的物质基础,比如提讯犯罪嫌疑人,因为看守所一般都离检察机关办案场所较远,来回的在途时间以及车辆保障就是确保案件能否按时、高效完成的重要因素,甚至有的单位车辆不足的情况下,会采取每周发车一次的做法来变相限制办案的及时性,在移送法院审查起诉、退回补充侦查等过程中也会遇到类似问题,由于案管部门人力、物力保障不足,会与办案部门口头约定每周几次的送案时间,这也导致了办案期限的人为延长。
由此,也需要用科学数据或者技术的方法来化解这些人为设限,比如可以通过远程提讯的方式解决在途的问题,通过电子卷宗传递的方式解决流程衔接的问题,通过对司法机关整体物质保障情况进行梳理,建立动态、实时的人员、车辆调配体系,切实保障一线办案部门的需求。
4.上述几种司法大数据进行相互关联、激活,可以产生更大的生产力
既往大数据强调的是以数据为核心,现在随着区块链技术的成熟,数据应用强调是以人为核心,打破传统数据条状化所带来的单维相关率问题,在数据自由流动的前提下,以司法主体、组织等不同主体为起点,通过历史数据与实时数据的融合、线上数据与线下数据的融合、文本数据与结构化数据的融合,寻找办案之间、办案与非办案行为之间的关联关系,通过每一个数据元的激活和释放能力,让司法系统乃至司法系统之外的每一个人都根据自己的自由联想和思维逻辑表达想法,相互启发,以达到新思维的碰撞、创新。
二、检察机关的司法大数据应用
1. .检察机关的地位决定了其促进全诉讼流程数据标准化的使命
从数据的流动情况来看,法院是一个数据的最终汇集地,对前续数据没有把控能力,而检察院作为一个承上启下的环节,是可以做到将前续数据进行疏导进入最终的监狱行刑环节,做好司法大数据应用作用会更加明显。未来司法大数据发挥作用应该是延伸整个司法办案流程,让数据流动起来。
因此,各级检察机关,尤其是省一级检察机关要重视“充分利用大数据为检察院与公安、法院等政法机关之间的业务协同提供服务,探索构建政法机关之间的大数据业务协同创新体系,提供基于大数据的多样化智能辅助检察应用。”
2.充分发挥检察机关统一业务应用系统优势
2012年在最高检的统一领导下,全国检察机关统一部署了案件管理系统,四级检察机关在统一系统中实现了信息数据填录的统一标准、统一维度,在统一系统中已经沉淀了大量的案件数据。在大数据应用阶段,检察机关由于数据格式更为统一、数据标准化程度更高,对于机器学习、构建各种算法模型,都更加方便、易行。
3.检察机关的司法大数据应用要确立需求主导模式
现在已经有各种智慧法院、智慧检察、人工智能类的法律大数据产品,需要对各种产品质量进行合理评估,防止游戏式的办案产品上线。真正有生命力的司法大数据产品,应该是能够切实解决一线问题、提升效率,实际效果不能只看宣传效果,而要深入一线,看一线办案人员到底用不用、效果好不好。
《行动指南》中也明确了“需求主导、技术统筹”的工作原则。司法大数据应用产品应该是产学研创一体化进行的过程,通过业务需求的明确、业务规则的提炼、汇集,利用技术优势,来实现人工不能解决的一些问题,从而提升检察工作质效。以大数据等相关技术应用为重点,形成以类案推送、量刑建议、决策支持等各项应用需求为“点”,以司法办案、管理决策、服务为民等业务需求为“线”,以服务深化司法体制改革和检察改革为“面”,以实现大数据与检察工作深度融合为“体”的应用体系框架。
三、国双“智慧检察”4.0解决方案让大数据为检察官添翼
国双是中国首家赴美上市的大数据公司,一直专注于数据的收集、检索、分析和高速处理。得益于专业的技术、优秀的数据分析处理能力和顶尖的司法垂直行业认知,国双在司法这个垂直领域具有极强的专业化深耕能力。第一,国双在司法领域内,将国双大数据平台进行二次专业化的定制开发,对于法律类的跨源数据具备高效的运算处理能力。第二,国双已经形成的司法类自然语言处理的解析能力,对这个行业内的非结构化数据能够加以准确和有效的利用。
2016年,国双支持了最高人民法院重点项目——“法信”平台的建设,并不断得到孟建柱书记、周强院长等领导的高度好评,目前“法信”已经在超过22个省法院系统配置应用,累计获得40万法律用户的青睐。国双还为最高人民法院知识产权案例指导研究(北京)基地打造了知识产权案例指导服务平台——“出释入典”。
针对检察领域,依照最高检《检察大数据行动指南》提出的目标要求并参考工业4.0、电子政务4.0等相关领域的发展情况,国双提出了“智慧检察”4.0的建设目标,并配套研发了相应的解决方案。该解决方案能够全业务、全要素、全方位的打通检察各个业务环节、各个业务场景的数据应用。
1.实现内生数据与共享数据的一体化采集。将检察院已有的案件数据与外部的法律法规、案例、裁判规则、学者观点、报刊杂志等知识数据相打通。将统一案件管理系统中的案卡数据与案件文书数据、档案数据相打通,做好数据的交互验证和互联。
2.实现数据运用的一体化解决。根据最高检推进智慧检务基础应用建设的目标要求,依托大数据为深化司法体制改革和检察改革提供数据服务。建立电子档案系统,将检察院纸质、图片、音频、word文档等非结构化的数据进行结构化、标准化的整合,形成标准化的电子档案,并进行电子文档的签章,保证文档的法律效应,形成底层标准电子档案库。建立知识库系统,在底层数据搭建好的基础上,进行事项的关联映射分析,并构建行业知识图谱,将过去检察院关于反贪、监督、诉讼等案件的法律依据、案件、审判等进行聚类分析,方便工作人员快速定位类似情况或者案例过去的处理方式、法律依据和处理结果,减少工作人员反复查找资料,一站式发现相关依据。
3.实现办案与决策体系的一体化打通。通过办案数据的采集和动态分析,实现检察工作的智能监测,监测相关工作人员在业务流程办事的情况,并将办事的准确率、时长、关键节点等进行全方位的监测,现实业务流程的优化和调整。推进大数据在司法办案、队伍管理、检察决策支持等领域的深层次的应用,探索构建政法机关之间大数据业务协同创新体系,提供多样化的智能辅助的检察应用。