作 者 | 李则立(上海高院司改办)
一起故意杀人案件,
几百页卷宗。假如有这样一位“助理”,干完下面这些活,再把卷宗交到刑事法官手里,刑事法官们愿不愿意配一个?
证据指引
,“助理”翻出多年来刑事条线专家经验总结,并提供以下办案思路参考:这起故意杀人案件属于“认罪供述得到印证型”,证据链应当包含人口失踪情况、查找被害人确认死者身份……而需要查证的事项包括作案时间、作案地点……具体的印证证据应该包括书证、鉴定意见……
单一证据校验
,
“助理”对每个证据均进行了反复审查,发现有2份由同一名侦查员在不同地点制作的笔录产生时间竟然一样,提示注意。可能错写了时间,也可能取证时程序有瑕疵。
证据链和全案证据审查判断
,根据证据链发现有15处血迹,有1处没有相对应的DNA检测报告。发现一份证据证明被害人是被刀捅死的,而尸检报告说是钝器致死,存在矛盾,提示注意。
案卷“划重点”
,
在厚厚的卷宗当中已经清楚标注散落在各处的作案时间、作案地点、作案人员、作案手段和经过、加害程度和死因、财产损失情况等等……根据这个标签可以在证据间进行搜索,比如点击作案地点标签,会自动显示所有与之相关的证据。
当然,还有
类案推送
,等等
……
有这样的“助理”?还是机器?数据打通公、检、法,给侦查员、检察官、法官都配上“智能助理”?有人已经试图摇醒我了,
醒醒吧!
这还真不是做梦。7月10日,全国司法体制改革推进会上,“上海刑事案件智能辅助办案系统”隆重登场,这项代号“206”的工程揭开神秘面纱。
倘若把时间拨到5年以后,回望这一刻,这可能是划时代的一步,人工智能与司法结合,实现了“从0到1”的突破。
虽然很多功能尚在持续改进中,还未全部实现,但已初具雏形,“1.0版本”问世。一个初生的“婴儿”,听到第一声啼哭。
当然,有人不信,吹吧,使劲吹!也有人兴奋,赶紧,指日可待!人工智能在司法领域的深度应用,我们的态度或许应该是“
理性乐观
”。
一、为什么乐观?人工智能的应用前景广阔
有人说,这不就是当年研究过的“法律自动售货机”吗?多少年前就被提出来,但是没做成啊,失败了。“人工智能”并不是我们通常理解的电脑程序。比如在a>b的情况下可以得出c,仅此而已,得不出其他结论,那只是一个写死的程序而已,没有什么“智能”。
第一,机器能“思考”会“成长”。
人工智能是机器模拟人脑“认知”,这就是所谓的深度神经网络算法。人脑在认识事物的过程中,比如学习某方面知识,大脑中某块区域就会像“肌肉”一样生长,神经突触就会增加。
机器也是如此,人工智能可以对人的意识、思维的信息过程进行模拟。人工智能不是人的智能,但能够像人那样实现“认知”和“判断”。比如“阿尔法狗”,扔给它棋谱训练,它能在围棋比赛中算出在何处落子,至于它是怎么“思考”出来的?程序员也不知道。
人工智能就像个“
黑箱
”,输入数据,通过“黑箱”,跑出结果。除了自主“认知”和“判断”,人工智能还会不断成长,就如与柯洁下围棋时,经过更多棋谱的训练,“阿尔法狗”已经比与李世石下围棋时厉害得多,让柯洁感受到了深深的无力感,以致落泪。
机器可以通过学习实现“认知”和“判断”,还能经过训练不断“成长”。也就是说,机器可以在一定程度上像人类一样,具有“经验”。因此,面对人工智能,我们并不能简单以一句“法律的生命在于经验而非逻辑”来证明机器做不到。
第二,机器有了“眼睛”和“耳朵”。
机器认知事物大体可以分为“感知”、“认知”和“判断”。就像人认识事物一样,首先是用视觉、听觉等接收到信息,然后再进行处理。随着图像识别技术(OCR)、语音识别技术等人工智能技术的发展,机器逐渐突破了“感知”这道关,可以向着认知和判断的方向不断挺进。
正如KK在《科技想要什么》里谈到的那样,“
每一项发明都是承先启后的,没有传送电力的铜线,机器之间就无法沟通,不能采集铜或铀的矿脉、在河流上筑水坝或采集贵金属来制作太阳能面板,就无法生产电力
。”
倘若把这些联系起来看,科技其实彼此关联,有其内在的发展逻辑,有了前项的发明,后面的发明“必然”出现。就像有了电,就一定会有“电灯”,发明电灯的人如果不是爱迪生,一定会有别人,人类历史上相同的发明在世界两端同时出现的事情不断重现。
人工智能的发展有赖于数据、算法、算力的发展。人工智能真正出现“智能”,有赖于“感知”的突破,当机器可以识别出讯问笔录、照片、录音录像之后,才能“认知”,进而“判断”。
反过来说,“感知”技术的突破,几乎“必然”导致机器要向着“认知”和“判断”的方向挺进、升级。这也可以解释,为什么现在看80年代关于量刑的电脑辅助系统开发设计,依然很有启发,但是那时候没有做成,因为那时的条件不够成熟。这也可以解释为什么法律人工智能的发展首先需要应用大量
图文识别、语音识别、实体识别
等技术。
第三,“专家+数据+算法”模式在各个领域实现突破。
倘若说无人驾驶离司法太过遥远,那么在教育和医疗领域的应用就具有相似性了。比如英语四六级作文,机器通过学习英语老师批卷,总结英语专家经验,批改准确率已经超过90%,比人准。去年,机器批改高考作文的准确率也超过了人工。又比如在医疗领域,机器医学影像的读图已经超过了人工专家。
人工智能在这些领域的突破性进展,都验证了“专家+数据+算法”这套“打法”的有效性。由专家总结梳理“经验”和“规则”,“解读”人类社会知识,让机器学习,机器通过学习和不断迭代,获得“人工智能”。
机器早已不是我们曾经印象中的电脑,或者某个软件系统,人工智能渐成大势,前景可观。
二、为什么理性?人工智能“成长”需要时间
罗马城并非一天造就。人工智能发展不能一蹴而就,有人说“
坑深路远
”,一点不错。
第一,机器是人的“学生”。
“专家+数据+算法”模式,为何要将行业专家纳入其中?我曾经也认为既然算法很厉害,只要有数据不就行了么?把数据放进去跑,不就能出结果嘛?其实不然,复杂的司法领域并非下围棋,机器根本不认识什么裁定书、判决书,一堆没有经过“解读”的数据扔进去对机器来说等于“看天书”。
首先得由专家教它。怎么教?批注,也就是“
打标签
”,把数据标注得让机器认识。比如作案时间,时间的表述相对比较容易识别,但是什么是作案时间?定位起来却不容易。
在一份讯问笔录当中,犯罪嫌疑人可能说早上6:00吃了早饭,6:30去了银行,7:00才到犯罪现场,8:00和被害人吵架,9:00杀死了被害人。这么多时间,哪个是作案时间?对人来说是常识性判断,而对于机器来说不是简单的定位了,这里没有哪个时间前面专门写了“作案时间”,它得去认知。