专栏名称: 中国人工智能学会
关注中国人工智能学会官方公共账号,收取学会的科普信息、新闻动态、活动预告及人工智能领域科技前沿信息。
目录
相关文章推荐
爱可可-爱生活  ·  今日推介(第1712期):端到端训练Agen ... ·  12 小时前  
机器学习研究组订阅  ·  奥特曼自曝全新OpenAI写作模型:第一次被 ... ·  3 天前  
51好读  ›  专栏  ›  中国人工智能学会

观点丨靠AI预测一场“流行病”,不可忽视的歧变节点

中国人工智能学会  · 公众号  · AI  · 2020-03-21 19:16

正文

利用AI模型来预测病毒或谣言的传播走向,已经不再是什么新鲜事物。


要知道,现实情况往往比训练AI的数据集复杂N倍,而研究人员打造的模型,往往只是研究传播对象的前几个步骤,然后将这个速率引入复杂的数学模型之中,来预测传播的广度和速度。


但如果病原体发生变异,或新闻内容被修改,传播速度和方式也将发生变化,这时候,原本的AI模型还能成功应对呢?


这也使我们不得不思考更进一步的问题——将AI看成防范病毒/谣言的利器,但技术本身也必须在复杂环境中持续迭代。



七十二变:比疾病更难预测的“病毒”


疾病变异,可以通过基因比对来追根溯源。那么信息变异呢?


在以T为单位的网络世界,内容信息往往会以闪电般的速度在社交媒体上传播。在这次疫情中大家可能也发现了,谣言往往轻易获得“万转”,而辟谣信息的转发却十分可怜。


这也说明了一个传播学的难题,一条信息是否会传播,取决于原始信息是如何被篡改的。


有些错误是故意的,也就是“造谣”。但有的改变则是出于增加电话、加入交互等成分而自然发展出来的。


比如一则关于2014年俄罗斯战斗机与美国驱逐舰在黑海对峙的旧闻,经过一些八卦网站(Parody website)的篡改,变成了:俄罗斯空军配备一种神秘电磁武器,瞬间弄瘫了整艘美国军舰。


此消息经过社交媒体发酵,最后甚至登上了主流媒体福克斯新闻网站的头条。

那么,一条看似枯燥的信息是否能演变成病毒式传播的博文,能够预测出来吗?


此时,原本用于预测流行病趋势的传染病动力学,就开始与信息传播联系到了一起。


早在上个世纪,科学家们就开始基于传染病动力学模型,研究复杂网络下信息的传播模型了。


经典的谣言传播模型理论研究源于20世纪 60年代 。


1965年,研究者Dalay和Kendall提出了谣言传播的数学模型,后来人们命名该模型为DK模型。它把人群按照谣言传播效果,分成谣言易染类人群、谣言感染类人群及谣言移出类人群,认为其中两类会以随机过程来相互转换。


到了1973年,麦基和汤普森两人对当时主流的谣言传播模型DK模型进行了改进,引入了免疫人群。


2001年,Zanetee则将复杂网络引入到谣言传播模型中,建立了具有网络拓扑结构特征的传播模型。2004年,莫瑞奥等人在小世界网络和无标度网络中研究了谣言传播动力学。


但是,这些模型均未将信息老化理论考虑进去。


到了2011年,中国研究者则将以往机制引入谣言传播类型,认为人们关注谣言的热度会随着时间的推移而下降,尤其是在纷繁复杂的网络世界中,人们的吸引力也容易被其他事物所转移。无知者转化为谣言传播者或真相传播者的概率会下降,并将其慢慢遗忘。



诚然,数学模型严密的逻辑性和抽象性,为舆论管理带来了一定的预测可能性。


但其中有两个问题却始终存在:


一是时间滞后。谣言传播与传染病传播在机理上有很多的相似性,就像病毒存在潜伏期一样,网络谣言从被更改、发布、发酵、传播、消失等一系列过程,个体的时间滞后程度都不一样。有的可能当下非常关心,有的则沉迷学业一个月后才赶来吃瓜……种种不确定性,也给预测网络信息传播带来了一定的难度。


其次,则是变异突发。正如同我们很难追溯病毒是如何在扩散过程中逐渐变异的,对谣言的改造和增删,都有可能改变其传播路径与效果。比如新冠期间,从宠物可能感染新型肺炎,到养宠可以预防,再到有宠物被检测出阳性……反转一波接一波,有的则是披着辟谣皮的新谣言,这些都会让对信息的预测出现误差。


如果不考虑随着时间的推移可能发生的变化,那么在预测生病人数或接触到一条信息的人数时,肯定会出错。



不断趋近真相:让AI模仿现实


怎么办呢?答案是只有让模型与现实之间的差异尽可能地小,从而提高预测的准确率。


前不久《美国国家科学院院刊》(PNAS)上发表的一项新研究,来自卡内基梅隆大学(Carnegie Mellon University)的研究人员就将信息变异这一关键变量引入到了数学模型之中。








请到「今天看啥」查看全文