上周,唐纳德·特朗普总统就下级法院对其主张的国家安全政策做出了回应,并发了一条推特说“最高法院见!”(“See you in the Supreme Court!”)。
但是,将这些案件最终交给最高法院来裁决真的就是一个好主意吗?人工智能可能会很快给出答案。一项新的研究表明,即使在信息较少的情况下,
计算机也能比专业的法律学者做的好。
当然,这并不是第一次利用算法来预测法官的投票结果。例如,在2011年的一个项目中,就曾使用了1953-2004年间任意8位大法官的投票结果来预测该案件中的第九位大法官的投票结果,
准确率达到了83%
。
2004年,一篇论文也通过利用自1994年以来的九位大法官的投票结果,来预测2002年的案件最终结果,
准确率达到了75%
。
这项新研究则利用了更丰富的数据。研究人员使用了最高法院的数据库建立一个能在将来任何时间对大法官的决策做预测的通用算法,该数据库中包含的案件可以追溯到1791年。
研究人员使用了每个案件的16个特征,包括了处理案件的法官、时间、案件类型和案件的初审法庭等。研究人员也添加了其它特征,如案件的口头辩论是否曾被听到。
该团队建立了一个被称为“随机森林”的机器学习统计模型预测1816-2015年间的任何一年的决策结果。
首先,
该模型利用了其以前所有年份的数据,以找到案件特征与决策结果(最高法院是否应该撤销下级法院的裁决(“反对”或“赞成”),以及每个大法官的投票结果)之间的关系。
然后,
该模型根据当年每个案件的特征来预测案件的最终裁决结果。
最后,
再向该算法输入最终的实际裁决结果,使得该模型得以更新,并利用更新的模型进行下一年的预测。
该研究论文发表在《PLOS ONE》上。论文中指出,从1816年到2015年间,该算法在最高法庭的28000次决策中,预测的正确率达到了70.2%;在法官的240000次投票结果中,预测的正确率为71.9%。
该模型的预测结果更倾向的是“反对”
,在最近35起由最高法院裁决的案件中,预测结果为“反对”的占了63%。该方法优于其它一些模型。例如。曾经有一个模型利用过去10年的决策结果来自动给出“反对”或“赞成”的预测结果。
2004年的研究发现,即是是知识渊博的法律专家在预测案件时准确率也仅为66%。这再次说明了
机器学习能够在某些领域战胜人类
。
Roger Guimerà是西班牙Rovira i Virgili大学的物理学家,同时也是上述的2011年研究项目的第一作者,他说这个新算法
“严谨并且表现优异”
。
Andrew Martin,密歇根大学政治学家,是上述的2004年研究论文的作者,他对这个新团队的工作给予了极高的评价,称该算法能够在超过2个世纪的时间里很好地工作。
他说:
“此工作将真正的大数据集与目前最先进的算法相结合,这在科学上是真正重要的。”
该算法可能会有一系列新的实际应用。例如,投资者可能会对那些可能从裁决中获益的公司进行投资;上诉人可能会根据获胜的机率来决定是否向最高法院提起诉讼。
律师也可能会向模型引入不同的变量以找出使最高法院获胜的最优路径,这包括哪些低级巡回法院可能会做出有利于它们自身的裁决,或者确定案件中最好的原告类型。
芝加哥肯特法学院的研究人员、该研究的共同作者Michael Bommarito提供了一个真实的案例——全国独立企业联盟诉西贝利厄斯案。在该案件中,美国平价医疗法案正受到严重威胁。
其中一个真正有趣的问题是:
该算法进一步扩展还可能会有更多的应用
,如预测口头辩论的全文内容。该项研究的第一作者、伊利诺理工学院的法学教授说:
“我们相信专家、群众和算法的共同参与是做到精确预测的秘密武器。”