专栏名称: 新京报传媒研究
传媒圈里圈外,新闻台前幕后,这里大概是离新闻一线最近的地方,给你不一样的视角,新闻从未如此有趣。关注我们~~~因为你除了帅,还有脑子。
目录
相关文章推荐
人民网  ·  《哪吒2》,又登顶了! ·  6 小时前  
中国新闻周刊  ·  开工第一天,最意难平的事 ·  2 天前  
广东民生频道  ·  视频曝光!高速几十辆车连环撞,最新情况 ·  3 天前  
51好读  ›  专栏  ›  新京报传媒研究

新闻报道过程中,人工智能可以帮你做些什么?

新京报传媒研究  · 公众号  · 社会  · 2019-10-09 10:38

正文


身为记者,你是否曾因要阅读上千份文件报告而感到心力交瘁? 现在,你可以将这些机械的工作慢慢交给人工智能了。



图片来源: Pexels


身为记者,你是否曾因要阅读上千份文件报告或是整理数百万条资料而感到心力交瘁? 现在,你可以将这些机械的工作慢慢交给人工智能了,它可以模仿人类进行学习、推理,并进行自我修正。

对于如何在报道中运用人工智能进行 辅助工作,BBC的数据新闻记者Paul Bradshaw 在第11届全球深度报道大会上分享了他的心得。


01

确定范围


在进行调查报道的过程中,有时你的直觉会告诉你,事实上真相比你手头收集到的不痛不痒的资料要大得多,但很难确定这个范围究竟有多大,“我们需要知道有多少人受到了此事影响,或者此事已经持续多久了。


经过训练的算法能够透过特定的文字模式分析大量的文件,以圈定哪些属于相关联的内容,Atlanta Journal-Constitution就成功地训练出了能够处理性骚扰案件文档的算法,这则算法能够快速分析大量的相似文件,为记者们提供更多的调查线索。


02

确定问题


人工智能可以用来确认问题。 瑞士广播机构Schweizer Radio und Fernsehen运用多种要素规则,成功地训练出了能够检测虚假社交媒体账号的算法,他们使用这则算法去分析一名瑞士意见领袖的粉丝,发现高达他三分之一的粉丝全部都是虚假账户。


03

了解语境


相比于单单分析词汇,自然语言处理算法 (N atural Language Processing,NLP) 能够将词汇所处的语境、讲话人的意图也纳入分析研究之中。此前,ProPublica就分析了竞选活动是如何根据受众的微妙不同,向选民们发送定制化、个性化的宣传电邮的。而这一切都基于算法对于选民的了解。


然而自然语言处理算法也为此受到了批评,因为这种算法是在一个特定的文化语境中被训练出来的,这也意味着它会潜在地带有某种特定的性别和种族偏见。


04

找到线索


人工智能可以辅助进行语言模式的检测,从而理解文字背后蕴藏的情绪,当然也能够发现改动的痕迹,这在分析上千页的文件时尤其有用。


《华盛顿邮报》曾经取得了美国国际开发署监察办公室的12份审计文件的草案,他们在人工智能的帮助下,将草案与最终版本进行对比,发现任何表达负面情绪、或被理解为批评的词汇语句,在正式发布版本中都被删去了。


05

定位机器生成内容


机器生成的内容正在互联网上泛滥,借助人工智能,你可以分辨出哪些是机器生成的内容、哪些是由人类撰写,这会对你的调查报道非常有用。

06

从大数据中找到头绪


人工智能可以从大型定量数据中挖掘出线索。 举个例子,对于工资的分析可以得出哪间学校的老师拿到了最多的钱,或是不同性别的收入差异。 “这就能为你找到突破口,让你明白需要找哪些对象进行采访。 ”Bradshaw说。


07

解码专业术语


无论是政府、商业公司,还是NGO,甚至是记者自己都很喜欢使用专业术语,但这些语言很难被外人所理解的,分析起来就更难了。 而人工智能可以对语言和行文模式进行处理分析,将那些专业术语进行解码。


08

分析关系网


同一个实体在不同的文件中有时候会用不同文字进行指称,人工智能可以对这些关系网进行集中分析,辨认归纳出那些字面名称不一致、但实际上是同一实体的人或机构。 举个例子,人工智能可以同一实体的财产记录、税收数据以及其他信息进行比对,即便他们被记录在案的名字不同。


09

分析无人机与卫星影像


人工智能同样可以对无人机拍摄的影片、卫星影像进行分析,为你的调查提供线索与目标。 它们同样能够分析处理传感器的资料,这样你就不需要亲自一条条检视大量数据了。


10

归纳总结


ORC技术能够对摄影、手写或印刷的文字进行阅读识别,进而将其转换为可进行检索的文件格式。 人工智能也能用同样的方法处理音像与影像内容,并将完整内容总结成为简明的概要。






请到「今天看啥」查看全文