专栏名称: 法律读库
法治新媒体阅读管家,传递常识,启迪法治。Less is More,少即是多。每日向用户推送优质法律类文章1至4篇。
目录
相关文章推荐
最高人民检察院  ·  罗保铭被开除党籍 ·  3 天前  
51好读  ›  专栏  ›  法律读库

大数据,能为检察工作带来什么

法律读库  · 公众号  · 法律  · 2017-07-21 10:09

正文

关于大数据 


让我不仅想起了狄更斯在《双城记》中的那段话:

这是最好的时代,这是最坏的时代

这是智慧的时代,这是愚蠢的时代

这是信仰的时期,这是怀疑的时期

这是光明的季节,这是黑暗的季节

这是希望之春,这是失望之冬

有人面前应有尽有,有人面前一无所有

面对人工智能+大数据,有的人在困惑是否机器会取代检察官、法官,有的人则在反思本来就案少人多,还要折腾大数据、智能办公干什么?

是这样吗?

我们来看一组数据▼

根据曹检2017年工作报告中披露的数据,2016年全国检察机关共批捕873148人,不批捕131675人;提起公诉1390933人,不起诉25778人。处理被告人将近140万人,按照每个批捕案件170项信息字段、每个公诉案件300项信息字段来计算,每年在统一业务系统中生成的信息数量超过6亿条

这还不算检察官制作的法律文书,提讯、开庭等活动产生的数据。

而同时检察员额制改革带来的是检察官人数从原来的22万人,到现在的72600人,仅为原来的三分之一。人均办案量上升20%,人均结案率上升18%

什么是大数据  

为什么能达到如此的效果?这就需要通过打开数字背后的奥秘。

按照我们的理解,司法大数据其实可以按照很多不同的分类方式进行分类,比如按照业务类型、按照诉讼阶段、按照不同的侧重点,如是管理数据,还是业务数据等,今天我们还是回到执法办案这个核心,以办案为核心的司法大数据,其实可以简单分为,人、案、物三个层面。

办案,办案,首先得有案,案件本身的数据是司法大数据中的关键和核心。刚才也提到了每个案件除了在统一系统中生成的数据外,其实还有很多数据没有概括进去,比如证据种类、证据数量、办案时长等等,甚至检察官制作的文书中也可以解构出很多数据。这是有关案件本身的数据。

第二个层面是有关人的数据,也就是办案主体,大数据的魅力就在于每一个应用者,都在无时无刻不再产生数据、留痕数据。但这往往也是容易被忽略的,在员额改革的今天,主体相关数据就显得尤为重要。例如统计年鉴中经常会涉及的政法事业编以及现在所提及的员额法官、检察官数量,都是办案主体总体上量的规模统计,但对于每名主体质的评价,也应该是司法大数据应该涵盖的范围。如可以根据每名检察官的结案数量、结案率、结案周期、卷宗册数、案由类型、文书说理占比(起诉书中“本院认为部分”字数占全部起诉书字数的比例)、保护力度(起诉书与判决书比较的偏离程度)、案件平均开庭次数、论文报告、案件第三方评价等多个维度对每个检察官的能力情况进行立体展示,甚至可以通过团队平均值来计算每名检察官的偏离度情况,以更好的识别优秀办案能手,做到能者就列,真正发挥员额制的作用。

第三是办案相关物质保障数据。

与上面两个数据相比,这项数据更不容易与司法大数据进行关联,但所有的办案行为都需要借助一定的物质基础,比如提讯犯罪嫌疑人,因为看守所一般都离检察机关办案场所较远,来回的在途时间以及车辆保障就是确保案件能否按时、高效完成的重要因素,甚至有的单位车辆不足的情况下,会采取每周发车一次的做法来变相限制办案的及时性,在移送法院审查起诉、退回补充侦查等过程中也会遇到类似问题,由于案管部门人力、物力保障不足,会与办案部门口头约定每周几次的送案时间,这也导致了办案期限的人为延长。

由此,也需要用科学数据或者技术的方法来化解这些人为设限,比如可以通过远程提讯的方式解决在途的问题,通过电子卷宗传递的方式解决流程衔接的问题,通过对司法机关整体物质保障情况进行梳理,建立动态、实时的人员、车辆调配体系,切实保障一线办案部门的需求。

上述几种司法大数据进行相互关联、激活,可以产生更大的生产力


既往大数据强调的是以数据为核心,现在随着区块链技术的成熟,数据应用强调是以人为核心,打破传统数据条状化所带来的单维相关率问题,在数据自由流动的前提下,以司法主体、组织等不同主体为起点,通过历史数据与实时数据的融合、线上数据与线下数据的融合、文本数据与结构化数据的融合,寻找办案之间、办案与非办案行为之间的关联关系,通过每一个数据元的激活和释放能力,让司法系统乃至司法系统之外的每一个人都根据自己的自由联想和思维逻辑表达想法,相互启发,以达到新思维的碰撞、创新。

DAAS数据即服务  

这里我们提出了一个可能是新的,也可能不太新的概念,DAAS,DATAAS A SERVICE.数据即服务。

如何利用这日增夜涨的数据来更好的为检察官服务?为办案服务?这是我们需要通过科技的手段、专业的力量来解决的。

但首先要区分一些概念

数据不是万能的,就像刑法万能思想一样,大数据时代,迷信数据万能、可以解决一切,应该是行不通的。

还有就是信息化工程的重复建设,你方唱罢我登场,就像我们的马路拉练工程一样,总是有打不完的补丁,也应该是不行的。

以及伪人工智能产品,说好的人工智能,都变成了人工+智能的产品,堆砌了大量的人工来解决本来一个专业检察官就能完成的事情,这能否代表科技的未来?

还有就是为创新而创新。大家都在做大数据、都在做人工智能,那我们看一下VR能用在什么地方,用VR来提讯?用VR来开庭?用VR来实地勘察?看上去很美。

另外,还有一种就是各管一段,智慧公诉就做智慧公诉,批捕就不能随之智慧一点吗?公诉完了,执行监督不能也智慧一点吗?

所以,这都是我们要警惕的一些做法和想法。

大数据的特征   

在此要突出一下大数据的概念。

为什么说因为大,所以小呢?

看一下我们过去三年的办案情况,位居办案数量前十位的分别是盗窃罪、走私贩卖运输制造毒品罪、故意伤害罪、危险驾驶罪、抢劫罪、交通肇事罪、诈骗罪、故意杀人罪、容留他人吸毒罪、寻衅滋事罪。

过去三年里,这10种犯罪占了全部刑事案件数量的八成左右。所以看上去几百万件的案件数量非常大,但他可以凝聚成突出的案件类型分布,让我们知道,只要解决了这十类案件的痛点和需求,就可以解决实践中80%的需求了。

大数据的另外一个特征就是因为小,所以大。

以裁判文书网为例,2013年7月裁判文书网上线以来,其使用情况和利用率如何,大家通过裁判文书公开又收获了哪些信息呢?以往,我们是很难得到这种精确分析的,但现在借助用户行为监测技术,我们可以通过在网页部署一行简单的代码,即可得到如图的热力图,可以查询任意时间段内的用户点击的行为。

不要小看这一次次小小的鼠标点击,通过这一次次的点击,不仅能看到趋势性的,比如民事案件总体点击率要远远高于刑事案件,还可以细分到每个页面、每个用户地理位置、终端使用情况等,比如,可以看到过去一年中,已经有8291万次的用户访问,浏览量2.7亿次。访问页面的平均时长是4分钟、平均每次浏览3.3个页面,首页跳出率大概八成左右。

还可以看到用裁判文书网最频繁的是广东的同学,北京、上海、江苏等省份次之,这是不是跟法律的受教育水平可以划等号呢?另外,还可以看到大家进入裁判文书网后都点击了哪些案件,主要都是刑事案件,王文华、郭建军滥用职权、受贿案,一个保定定兴县的教育局局长涉案的事实,为什么会有23,565次浏览,平均每次看了将近20分钟。

用每一次用户点击行为来深度挖掘案件背后的法律价值和社会价值,大数据因为小,所以大。

我们在用大数据辅助领导决策时,也有三个目标应当考虑的,需要做到好用、管用,有用,同时,也要有指导实践的实际效果,有效,这种决策也好、指导也好、管理也好,一定是合理的,不能为了管而管。

基于上述大数据作为服务、作为助手的作用,我们提出在检察司法大数据运用上,应该注意以下几点。

第一,全诉讼流程数据的获取和使用

这也是由检察机关地位所决定的。从数据的流动情况来看,法院是一个数据的最终汇集地,对前续数据没有把控能力,而检察院作为一个承上启下的环节,是可以做到将前续数据进行疏导进入最终的监狱行刑环节,做好司法大数据应用作用会更加明显。未来司法大数据发挥作用应该是延伸整个司法办案流程,让数据流动起来。

因此,各级检察机关,尤其是省一级检察机关要重视“充分利用大数据为检察院与公安、法院等政法机关之间的业务协同提供服务,主动寻求在党委、政法委的领导下,探索构建政法机关之间的大数据业务协同创新体系,提供基于大数据的多样化智能辅助检察应用。”

第二,充分发挥后发优势

2012年在最高检的统一领导下,全国检察机关统一部署了案件管理系统,四级检察机关在统一系统中实现了信息数据填录的统一标准、统一维度,在统一系统中已经沉淀了大量的案件数据。在大数据应用阶段,检察机关由于数据格式更为统一、数据标准化程度更高,对于机器学习、构建各种算法模型,都更加方便、易行。

第三,要确立需求主导模式

现在已经有各种智慧法院、智慧检察、人工智能类的法律大数据产品,需要对各种产品质量进行合理评估,防止游戏式的办案产品上线。真正有生命力的司法大数据产品,应该是能够切实解决一线问题、提升效率,实际效果不能只看宣传效果,而要深入一线,看一线办案人员到底用不用、效果好不好。

这种司法大数据应用应当秉持标准化、辅助化的研发思路,无论怎么宣传、怎么美化,工具终究是工具,只能是帮助检察官有了一把更快的刀,而不能代替甚至干涉检察官的办案。

同时,我们也提出了关于检察大数据利用的三个关键问题,简单说就是三个一体化,这在高检院《大数据行动指南》中体现也很明确:

1.实现内生数据与共享数据的一体化采集。

将检察院已有的案件数据与外部的法律法规、案例、裁判规则、学者观点、报刊杂志等知识数据相打通。将统一案件管理系统中的案卡数据与案件文书数据、档案数据相打通,做好数据的交互验证和互联。

2.实现数据运用的一体化解决。

数据运用应该是以审判为核心,各个阶段虽然有不同的标准,但在数据收集、运用上,不应各管一段,智慧公诉覆盖不了智慧批捕、智慧公诉也延伸不到智慧执检,这种片段化、孤岛化的数据运用模式一定要打破。实现数据运用的一体化解决。

3.实现办案与决策体系的一体化打通。

通过办案数据的采集和动态分析,实现检察工作的智能监测,监测相关工作人员在业务流程办事的情况,并将办事的准确率、时长、关键节点等进行全方位的监测,现实业务流程的优化和调整。推进大数据在司法办案、队伍管理、检察决策支持等领域的深层次的应用,探索构建政法机关之间大数据业务协同创新体系,提供多样化的智能辅助的检察应用。

作者:李斌,前检察官。文章仅代表作者观点。