专栏名称: GIJN
全球深度报道网(GIJN)致力于整合并分享深度报道资源,包括报道手册和书籍、国内外公开数据库、数据新闻工具包和深度报道的前沿探索。
目录
相关文章推荐
OSC开源社区  ·  地表最强「开源版PS」——GIMP ... ·  3 天前  
OSC开源社区  ·  华为MateBook D16 ... ·  2 天前  
程序员的那些事  ·  年薪154w!又一新兴岗位崛起!这才是程序员 ... ·  3 天前  
程序员的那些事  ·  65 ... ·  3 天前  
51好读  ›  专栏  ›  GIJN

调查记者罗曼·阿宁:我用什么工具保护隐私和处理数据的?

GIJN  · 公众号  ·  · 2020-12-04 14:22

正文

在这期「工具箱」栏目中,我们采访了俄罗斯非营利调查新闻网站 IStories 的总编辑罗曼·阿宁。2009年,他就加入了「有组织犯罪和腐败报告项目」,多年来参与了多宗腐败案件的调查。在调查过程中,他需要高度保护个人隐私,同时对海量数据进行批处理,哪些工具帮助他实现了这些目标?




在这一期「工具箱」栏目中,我们采访了33岁的俄罗斯非营利调查新闻网站 IStories 的总编辑罗曼·阿宁(Roman Anin)。


Istories 是 Important Stories(重要的报道)的简写,这个网站于今年在莫斯科上线,目前共有13名员工。短短几个月内,它已经调查了各种不同的选题,如反对派政治家阿列克谢·纳瓦利内(Alexei Navalny)遭到的迫害、国家废物管理市场的裙带关系以及可疑的新冠病毒抗体测试。


阿宁在摩尔多瓦出生长大,最初的目标是成为一名职业足球运动员。但在17岁时,他因家人移居俄罗斯而离开了足球青年队。为了保持自己与这项运动的连接,他报考了莫斯科国立大学学习新闻学,希望成为一名体育评论员。2006年,他以体育记者的身份加入了莫斯科著名的报章《新报》(Novaya Gazeta)。


《新报》是一家处于水深火热之中的媒体。长期以来,该报的调查文化非常浓厚,但自2000年以来,已经有6名员工被谋杀。因此,阿宁不是简单地报道体育赛事,而是很快就开始挖掘足球领域的腐败故事,包括操纵比赛等。


2008年8月,当他的大多数同事都在外出度假时,俄罗斯-格鲁吉亚战争爆发了。《新报》派阿宁去前线报道。回来后,他就加入了该报的调查小组,一直到今年年初。在这个职位上,他报道了律师和税务审计师谢尔盖·马格尼茨基(Sergei Magnitsky)揭露的臭名昭著的欺诈案;2014年索契冬奥会的建筑合同腐败丑闻;以及被指控为一个杀手团队的幕后黑手的阿斯兰·加吉耶夫(Aslan Gagiyev)。其中一些调查是他与「有组织犯罪和腐败报告项目」(Organized Crime and Corruption Reporting Project,简称 OCCRP)合作进行的,阿宁自2009年以来一直是该项目的成员。


阿宁获得了许多新闻奖项,其中2013年因对谢尔盖·马格尼茨基的报道而获得奈特国际新闻奖(Knight International Journalism Award),并获得了俄罗斯调查新闻界最负盛名的三个奖项:阿尔特姆·鲍罗维克奖(Artem Borovik award)、尤利安·谢梅诺夫奖(Youlian Semenov award)和安德烈·萨哈罗夫奖(Andrey Sakharov award)。他还因发起了IStories而获得了国际记者中心2020年的奈特开拓者奖(International Center for Journalists’ 2020 Knight Trailblazer Awar)。他对马格尼茨基的报道引发了多个国家的刑事调查,而他对索契运动会的报道让时任总统梅德韦杰夫下令调查。


阿尼宁在斯坦福大学度过了2018-19学年,他是该年度奈特新闻奖学金的获得者。在那里,修读了了编程和心理学课程——他说,这两种技能对新闻业都很有用——也正是在这一年,他产生了创办 Istories 的想法。



VeraCrypt


「VeraCrypt (https://www.veracrypt.fr/en/Home.html) 可以让你创建加密文件夹,在其中你可以安全地保存数据。在使用VeraCrypt之前,我使用了TrueCrypt,这是我从朱利安·阿桑奇那里学到的。」


「我来伦敦是为了在维基解密中检索美国驻俄罗斯大使馆的电报。 为了传输数据,我不能把它直接保存在我的笔记本电脑上或者云端; 我必须妥善保管它。 为此,我将数据放在加密的文件夹中。 如果有人检查了我的笔记本电脑,他们将无法找到相关文件夹。 即使他们找到了,他们也无法进行解密。


「现在我用一个开源的工具VeraCrypt 来做同样的工作。 你可以在电脑上创建加密文件夹,如果需要,也可以上传云端。 它还允许你伪装文件夹,让它们看起来不像数据文件夹,而是像应用程序或电影。


我每天都用VeraCrypt加密我所 有的 调查工作。



LastPass


「LastPass (https://www.lastpass.com/) 可以储存加密过的密码,它还可以在多个设备间同步,透过它可以在你每个设备上的安全储存密码。由于有了主密码,你可以在LastPass上访问你的所有密码。这款工具可以让你使用许多复杂的密码,并频繁地更改它们,而不必记住所有的密码。我每天都在使用它。」


「我知道安全有多重要,因为我曾经被黑客攻击过。黑客的手法非常复杂,我的SIM卡先是被封锁了,他们复制了一张一样的卡;然后他们请求恢复我的Gmail账户密码到我的手机号码上,于是他们在复制的 SIM 卡上收到了密码。我的建议是,在腐败和专制的地方,在两步认证中,除了密码之外,永远不要将电话号码用作恢复密码或进行两步验证的方式(我会用 Google Authenticator (https://play.google.com/store/apps/details?id=com.google.android.apps.authenticator2&hl=en_GB&gl=US) 作为进行两步验证的工具)。」


但像我这样的情况很少出现,大多数人被黑客攻击是因为他们使用弱密码,更糟糕的是,在不同的账户上使用相同的密码。 LastPass 可以帮助你避免这样的情况发生。 你可能会想: 如果LastPass的服务器被黑的话,我所有的密码都会被破解吗? 答案是否定的。 LastPass的服务器确实被黑客攻击过,但没有一个密码被泄露,因为LastPass本身不存储密码,只存储密码的“散列”版本(hash version),无法被破译。



OpenRefine


「OpenRefine (https://openrefine.org/) 可以让你清理混乱的数据。我在大多数情况下使用 Python 来进行这项工作,但是对于不会编程的人来说,OpenRefine 确实是一个很棒的工具。」


「想象一下,你有一个关于国家合同的电子表格,有数百万行。 在如此大量的数据中,肯定会有一些错误,例如供应商的名称,或者日期会混淆,或者一些行会丢失,或者一些价格会以不同的格式书写。 那你要如何进行汇总呢? 如何计算平均值呢? 你必须首先将所有数据放在相同的格式中,我们称之为清理数据。 OpenRefine 让你可以轻松做到这一点。


「我在报道国家废物管理市场的裙带关系的故事中使用了 OpenRefine,因为我有成千上万行关于不同地区不同垃圾填埋场的数据,而我想分析一下最大的垃圾填埋场在哪里。


「首先,我使用了一个名为 Tabula (https://tabula.technology/)







请到「今天看啥」查看全文