专栏名称: GIJN
全球深度报道网(GIJN)致力于整合并分享深度报道资源,包括报道手册和书籍、国内外公开数据库、数据新闻工具包和深度报道的前沿探索。
51好读  ›  专栏  ›  GIJN

报道过程中,人工智能可以如何帮到你?

GIJN  · 公众号  ·  · 2019-10-08 12:00

正文

身为记者,你是否曾因要阅读上千份文件报告而感到心力交瘁?现在,你可以将这些机械的工作慢慢交给人工智能了。对于如何在报道中运用人工智能进行辅助,BBC 数据记者 Paul Bradshaw 在第11届全球深度报道大会上分享了他的心得。


I mage: Pexels


身为记者,你是否曾因要阅读上千份文件报告或是整理数百万条资料而感到心力交瘁? 现在,你可以将这些机械的工作慢慢交给人工智能了,它可以模仿人类进行学习、推理,并进行自我修正。


对于如何在报道中运用人工智能进行辅助,BBC 的数据记者 Paul Bradshaw 在第11届全球深度报道大会上分享了他的心得。


确定范围


在进行调查报道的过程中,有时你的直觉会告诉你,事实真相比你手头收集到的不痛不痒的资料要大得多,但很难确定这个范围究竟有多大,“我们需要知道有多少人受到了此事影响,或者此事已经持续多久了。


经过训练的算法能够透过特定的文字模式分析大量的文件,以圈定哪些属于相关联的内容,Atlanta Journal-Constitution 就成功地训练出了能够处理性骚扰案件文档的算法,这则算法得以快速分析大量的相似文件,为记者们提供更多的调查线索。


确定问题


人工智能可以用来确认问题。 瑞士广播机构 Schweizer Radio und Fernsehen 基于多种要素规则,成功地训练出了能够检测虚假社交媒体账号的算法,他们使用这则算法去分析一名瑞士意见领袖的粉丝,发现高达他三分之一的粉丝全部都是虚假账户。


了解语境


相比于单单分析词汇,自然语言处理算法(Natural Language Processing,NLP)能够将词汇所处的语境、讲话人的意图也纳入分析研究之中。 此前,ProPublica 就分析了竞选活动是如何基于受众的微妙不同,向选民们发送定制化、个性化的宣传电邮的。而这一切都基于算法对于选民的了解。


然而自然语言处理算法也为此受到了批评,因为这种算法是在一个特定的文化语境中被训练出来的,这也意味着它会潜在地带有某种特定的性别和种族偏见。


找到线索


人工智能能够辅助进行语言模式的检测,从而理解文字背后蕴藏的情绪,当然也能够发现改动的痕迹,这在分析上千页的文件时尤其有用。


《华盛顿邮报》曾经取得了美国国际开发署监察办公室的12份审计文件的草案,他们在人工智能的帮助下,将草案与最终版本进行对比,发现任何表达负面情绪、或被理解成为批评的词汇语句,在正式发布版本中都被删去了。


定位机器生成内容


机器生成的内容正在互联网上泛滥,借助人工智能,你可以分辨出哪些是机器生成的内容、哪些是由人类撰写,这会对你的调查报道非常有用。







请到「今天看啥」查看全文