利用AI模型来预测病毒或谣言的传播走向,已经不再是什么新鲜事物。
要知道,现实情况往往比训练AI的数据集复杂N倍,而研究人员打造的模型,往往只是研究传播对象的前几个步骤,然后将这个速率引入复杂的数学模型之中,来预测传播的广度和速度。
但如果病原体发生变异,或新闻内容被修改,传播速度和方式也将发生变化,这时候,原本的AI模型还能成功应对呢?
这也使我们不得不思考更进一步的问题——将AI看成防范病毒/谣言的利器,但技术本身也必须在复杂环境中持续迭代。
疾病变异,可以通过基因比对来追根溯源。那么信息变异呢?
在以T为单位的网络世界,内容信息往往会以闪电般的速度在社交媒体上传播。在这次疫情中大家可能也发现了,谣言往往轻易获得“万转”,而辟谣信息的转发却十分可怜。
这也说明了一个传播学的难题,一条信息是否会传播,取决于原始信息是如何被篡改的。
有些错误是故意的,也就是“造谣”。但有的改变则是出于增加电话、加入交互等成分而自然发展出来的。
比如一则关于2014年俄罗斯战斗机与美国驱逐舰在黑海对峙的旧闻,经过一些八卦网站(Parody website)的篡改,变成了:俄罗斯空军配备一种神秘电磁武器,瞬间弄瘫了整艘美国军舰。
此消息经过社交媒体发酵,最后甚至登上了主流媒体福克斯新闻网站的头条。
那么,一条看似枯燥的信息是否能演变成病毒式传播的博文,能够预测出来吗?
此时,原本用于预测流行病趋势的传染病动力学,就开始与信息传播联系到了一起。
早在上个世纪,科学家们就开始基于传染病动力学模型,研究复杂网络下信息的传播模型了。
经典的谣言传播模型理论研究源于20世纪 60年代 。
1965年,研究者Dalay和Kendall提出了谣言传播的数学模型,后来人们命名该模型为DK模型。它把人群按照谣言传播效果,分成谣言易染类人群、谣言感染类人群及谣言移出类人群,认为其中两类会以随机过程来相互转换。
到了1973年,麦基和汤普森两人对当时主流的谣言传播模型DK模型进行了改进,引入了免疫人群。
2001年,Zanetee则将复杂网络引入到谣言传播模型中,建立了具有网络拓扑结构特征的传播模型。2004年,莫瑞奥等人在小世界网络和无标度网络中研究了谣言传播动力学。
但是,这些模型均未将信息老化理论考虑进去。
到了2011年,中国研究者则将以往机制引入谣言传播类型,认为人们关注谣言的热度会随着时间的推移而下降,尤其是在纷繁复杂的网络世界中,人们的吸引力也容易被其他事物所转移。无知者转化为谣言传播者或真相传播者的概率会下降,并将其慢慢遗忘。
诚然,数学模型严密的逻辑性和抽象性,为舆论管理带来了一定的预测可能性。
但其中有两个问题却始终存在:
一是时间滞后。谣言传播与传染病传播在机理上有很多的相似性,就像病毒存在潜伏期一样,网络谣言从被更改、发布、发酵、传播、消失等一系列过程,个体的时间滞后程度都不一样。有的可能当下非常关心,有的则沉迷学业一个月后才赶来吃瓜……种种不确定性,也给预测网络信息传播带来了一定的难度。
其次,则是变异突发。正如同我们很难追溯病毒是如何在扩散过程中逐渐变异的,对谣言的改造和增删,都有可能改变其传播路径与效果。比如新冠期间,从宠物可能感染新型肺炎,到养宠可以预防,再到有宠物被检测出阳性……反转一波接一波,有的则是披着辟谣皮的新谣言,这些都会让对信息的预测出现误差。
如果不考虑随着时间的推移可能发生的变化,那么在预测生病人数或接触到一条信息的人数时,肯定会出错。
怎么办呢?答案是只有让模型与现实之间的差异尽可能地小,从而提高预测的准确率。
前不久《美国国家科学院院刊》(PNAS)上发表的一项新研究,来自卡内基梅隆大学(Carnegie Mellon University)的研究人员就将信息变异这一关键变量引入到了数学模型之中。