↑ ↑ ↑ 点击上方蓝字来关注我们
▎
Global IP Update 文|
静水流深
"
We operate under a jury system in this country, and as much as we complain about it, we have to admit that we know of no better system, except possibly flipping a coin.
”
- Dave Barry
作者按:
以此文献给那杆我们不懈努力坚持守护的天平。
Part One: Justice through a Jury System
参见 [
美国陪审团审判散记:The Beauty is in the Eye of the Beholder (一)
]
Part Two: The Jury Trial
参见[
美国陪审团审判散记:The Beauty is in the Eye of the Beholder (二)
]
Part Three: Modeling the Jury System
天下没有绝对的人治与法治,
有些系统是法律指导下的人治,而有些系统则是人参与下的法治
。美国的Jury系统是
后一种
,算是完美诠释了“公道自在人心”。
然而Justice System系统给出的“公道”并不是“真相”的同义词,诉讼的过程虽然有一定的forensic分析,能一定程度上再现部分的“真相”,它的目的并不是还原“真相”,而只是基于对于“真相”的有限认知,来给出一个孰是孰非的概率,这个概率就是我们所说的“公道”。
专利律师,看什么问题都有不可抑制的理工科情节,所以这一章,我想来用数学物理模型来描述一下这个横在“真相”和“公道”之间Jury System
。
Justice System其实有三个模块组成:取证,把证据传递给陪审员,和陪审员的判断。用系统图总结如下(A和B表示案子的两个Party):
1.取证(Discover Evidence)- 采样模块(Sampling Module)
取证,其实是对于 “真相”相关信息的一个采样,取证得到的叫“证据”,“证据”是“真相”的蛛丝马迹。
每一件事情都有一个绝对的事实,也就是“真相“。然而我们往往无法重建这个绝对的事实。比如一起凶杀案,我们只知道有人遇害了,但是他究竟怎么死的,除了凶手谁都不知道。但是警察会做Crime Scene的调查,得到比如现场指纹啊,DNA,子弹,弹孔等等,遇害者的亲人朋友也会有些相关信息,比如遇害者同谁有过节等等。这些采样点就是证据,单独的采样点无法告诉我们“真相”到底是什么,但是这些采样点加在一起,就能拼接出“真相”的某个有一定可信度的版本。
通过采样来重建“真相”的一个缺点就是信息的失真,失真来自两方面,第一是信息丢失,第二是信息扭曲。
比如美国专利诉讼中经常会要确定发明具体是何时做出的问题,真相是发明人肯定是在某一个时间点前做出的发明,然而我们能得到的采样点通常非常稀疏,我们会找发明人当初的lab note,有的发明人天天记进度,有的则是想起来就记一笔,想不起来一个月也不写东西,有时候明明发明已经完成,但记的内容不够详细,没法显示权力要求的每个元素在当时的设计里都已经存在了,所以可能明明发明日比专利申请日早了半年呢,
因为采样点缺失,证据不足,可能导致无法证明更早的发明日,只能以申请日为准。
美国诉讼中无比宽泛和漫长的discovery(调查取证)就是帮助双方去收集重要的采样点。这里插一句,很多律师喜欢把discovery摊子铺的很大,以求得到最多的证据,如果有无限的预算来做discovery,那么这么做也没什么错,然而事实是discovery的付出通常是边际效用递减的,
每多砸一百万得到的采样点重要性越来越小
。信号处理理论告诉我们,采样点也不是越多就越能重现“真相”的,关键在于采样点的质量,更何况,我们在乎的并不是还原“真相”本身,而是得到有利于自己的判决。
2.把证据传递给陪审团(Presenting Evidence to the Jury)- 传输模块(Transmission Module)
之前介绍的Jury trial的重头戏就是向陪审团传递证据,从opening statement到closing argument,证据以证人证物的形式,在律师的导演下,传输给陪审团。
在这一场传输中,
律师和证人是信息的发射方(transmitter),而陪审团是信息的接收方(receiver)
,发射方对接收方的接受特性所知甚少,而且这场信息传输是完全单向的,接收方只接不发,不给发射方任何确认或反馈。让这个系统变得更复杂的是,发射方还不止一个,而是两个,他们基于同一“真相”的采样点信号,向接收方陈述截然不同的观点,这两个发射方还互相可见,可以根据对方发射的信号,来调整自己的信号发射方式。
在每一个传输通路(transmission channel)上,证据信号还经历着调制,过滤,解调的过程。
调制是律师对于证据所做的加工和包装,
比如专利案里,对于技术相关的证据,通常要进行简化,有时候会用类比来进行解释
,而且律师还会用有利于自己观点的表达方式来对证据进行陈述,introduce evidence in the best possible light。
这里的过滤器呢则是伟大的证据法规,
比如我们专利案都是在联邦法院来审的,遵循的是Federal Rules of Evidence (简称FRE)
,FRE规定了各种可以阻挡evidence的情况,比如证人说我听见A告诉我他看见B抢劫了C,这信息无法传输给陪审团,因为它是典型的hearsay。有的信息在pre-trial阶段就被阻挡了,
双方可以发Motion in Limine(简称MIL)
,来要求exclude某些证据,有的信息是在庭审当场被阻挡的,就是之前提到的由一方提出objection,法官做出evidentiary ruling,如果objection被sustain,就意味着相应的证据被过滤。
解调是指这信息到了陪审团这边,将会被各个陪审员以不同的方式去接收和理解。曾经有jury consultant做过研究,她给支持死刑和反对死刑的两拨人看同一篇讨论死刑利弊的文章,看完后,两拨人都认为文章支持他们的观点,这说明,我们对于信息都是选择性接受的,那些同我们内心观点有共鸣的信息会被放大,也就是说在这个系统里,某些频率的信号会发生共振而被放大。而难的是你不知道每个陪审员的共振频率是什么。
What matters is not the truth, but the perception。证据信号,最终以陪审员接收到的为准。
3.陪审团判决(Jury Decision)- Bayes模块
之前说了陪审团是一个暗箱,暗箱的输入端就是经历了discovery阶段和trial presentation阶段多层加工的证据信息,暗箱的工作是根据这些证据确定出一个条件概率,然后根据这个概率有没有达到相应的burden of proof来决定双方的输赢。
是的,AI界的朋友一定看出来了,这就是Bayes定理
。AI界奉Bayes理论为人工智能的基石(law of intelligence),但其实,Bayes一直以来都是我们律界凭证据断案的基石(law of justice)。
举个例子,比如判断受害者的死亡原因,一方认为受害者死于谋杀(Murder),另一方认为受害者死于自杀(Suicide),那么,
是在现有的证据E(Evidence)下谋杀M(Murder)发生的概率,而
则是同样的证据E下自杀S(Suicide)发生的概率,
陪审团这个暗箱就是在回答这些概率问题。没有陪审员会真正去计算概率,但是他们的判断在潜意识里符合下面的Bayes理论
:
P(M)和P(S)是陪审员没听证据前,凭自己的人生经验,判断的一个人被谋杀的可能性和自杀的可能性,
也就是先验概率
。
和
则是两个理论对于当前证据的支持率,也就是说如果受害者确实是被谋杀的,那么证据中的事件发生的可能性有多大。
这个判断如果交给机器做,那么大数据一训练,系统可以非常robust,你输入一定的证据,它就可以给出一个精确的概率,而机器的可预测性让我们可以根据机器用的model去估计某个机器它会做出什么样的判断。
但是我们的系统把这个重要的任务交给了陪审团,这个大暗箱所用的model是由陪审员的人生经历训练(train)出来的
,每个人的人生经历不同,model就不同,我们不知道陪审员的人生经历,就无法估计这个model的具体算法,也无法根据想要的结果来给输入,所以jury trial才有了那么多不确定性。
比如先验概率,每个人心里的P(M)和P(S)是不一样的。如果一个陪审员的身边有人自杀过,这将很大程度影响他对自杀概率的判断(在Voir Dire阶段这个陪审员可能会因此被strike)。Bayes定理还告诉我们,证据的强度影响着
和
,而这两者的比值可以一定程度地修正陪审员的先验概率的,从而得出符合本案案情的后验概率。那个
和
考验的是陪审员的逻辑思维能力
,比如受害人是自杀那么死前患忧郁症的可能性就很大。但对这两个概率的判断,也是有个体差异的,
比如某个陪审员家里有人是抑郁症,他可能会潜意识里选择相信抑郁症不会导致自杀
。