我 相 信 这 么 优秀 的 你
已 经
置 顶
了 我
翻译|周晓磊
选文|小象
转载请联系后台
◇
◆
◇
◆
◇
事件由来
2017年初,芝加哥市市长Rahm Emanuel 宣布了一个新的关于治理城市暴力犯罪的倡议。对于治理城市暴力犯罪,一般的做法是招募更多的警员或是加强与社(chao)区(yang)人(qun)员(zhong)的合作。但是,Emanuel澄清道,芝加哥警局要加大软件的应用,实施“预测治安”,特别是在城市以南的邻近地区。
芝加哥警局将会利用数据和计算机分析来确定哪些地区更易发生暴力犯罪,进而向这些地区拨派更多警力。此外,这款软件还将识别出那些将要但是还没有成为的暴力犯罪受害者或行凶者。警务人员甚至会提前警告这些人,以防止他们出现暴力犯罪。
诚然,任何对于限制芝加哥杀人案惊人增长速度的尝试都是值得赞扬的。但是,这股城市的新力量看上去忽略了一些证据,其中就包括最近人权数据分析组的一些关于治安的研究。这项研究指出预测治安这一工具,只是强化了现有的警方做法,而不是进行更完善的构想。大范围的应用可能导致定位到一些特殊群体或者有色人群。
◇
◆
◇
◆
◇
在有限的数据集上工作
任何预测模型或者算法都是利用数据和统计对数据中的模式进行识别。这其中包括希望从警方数据中学习犯罪趋势或者累犯。然而,
一个有用的结果并不只依赖高质量的数学分析,同时也依赖高质量的数据
。而有证据表明高质量的数据正是预测治安的短板。
机器学习算法需要从训练集中分析模式,然后在验证集上寻找相类似的模式。如果一开始从数据中学到的信号就是错的,那么后续的分析也可以省略了。
这样的情况就发生在谷歌的“流感趋势”项目上,这个项目是2008启动的,旨在利用人们在线搜索的信息来定位疾病的爆发。谷歌的系统对用户的搜索词进行监控,然后定位那些很多人搜索流感症状的地区。对于这些地区,该项目会向公共卫生部门进行提示,告知这些地区很可能会发生流感。
但是这个项目并没有将谷歌搜索算法的潜在影响以及搜索算法自身周期性迭代考虑进去。2012年初,谷歌对项目进行了升级,谷歌修改了它的搜索工具,对那些搜索“咳嗽”或“发热”的用户,建议去就医诊断。就谷歌本身而言,这一修改增加了流感相关词汇的搜索次数。此举使得谷歌流感趋势对流感爆发的预测量级是联邦公共健康官员们预期的2倍,同时也远远高于实际发生的数量。
◇
◆
◇
◆
◇
刑事司法数据是有偏的