专栏名称: i小声读书
「电子书支援计划」是一个以电子书为核心的自我学习计划, 以 Telagram 社群为主要载体,致力于促进中文互联网圈内 的知识交流和资源共享,帮助诸位获得更好的阅读资源和阅 读体验,同时鼓励社群内成员输出优质内容。
目录
相关文章推荐
人民日报  ·  别沾边!再萌也不要碰!国家卫健委紧急提醒 ·  12 小时前  
新华社  ·  票房破200亿! ·  昨天  
南都周刊  ·  何小鹏,重磅官宣! ·  昨天  
51好读  ›  专栏  ›  i小声读书

从流行病预测模型窥见认知世界的方法

i小声读书  · 公众号  ·  · 2020-03-06 12:01

正文

用数学丈量世界,多美啊。

全球卫生部门都在致力于提高对传染病暴发流行的早期监控和预测能力,而预测无疑是其中最有趣也也是最有价值的部分,为公卫政策制定提供强有力的理论保证。

运用适合描述疾病动力学的数学模型,对传播过程进行定性、定量分析和计算机模拟,揭示传染病暴发流行的发展过程,预测其流行规律和发展趋势,分析其暴发流行的原因和关键因素,制定最优的疾病防控控制策略和措施。这一逻辑在中国的防疫工作中得到了体现,远比神神叨叨的「制度优势」来的实在。

针对传染病的暴发流行,目前国内外运用于预测预警的模型主要有时间序列模型、线性回归模型、灰色系统理论、人工神经网络模型,Markov 模型、叶贝斯模型。

时间序列模型( ARIMA 模型 )

作为一元时间序列分析中的经典模型,是时间序列分析中较为成熟和应用较为广泛的方法之一。模型由 Box 和 Jenkins 于 1976 年提出,不仅适用于一般时间序列模型要求的平稳时间资料,还适用于经过 d 阶差分后可平稳化的非平稳时间序列。此统计模型优点在于仅以过去观测值进行分析与预测,不需考虑其他外部数据以时间 t 综合替代各种影响因素。


其分析过程简便、短期预测精度较高。缺点在于若数据较复杂,则模型的参数挑选不易,且若数据在某些时间有特定事件发生,模型无法考虑此特定时间的数据,需要对模型参数进行修正,对小样本的预测精度较差,对于小规模暴发的早期预警的难度较大。对于长期的历史数据,其预测的精度也较其他模型差。

线性回归模型

常用的回归模型有直线回归模型、二次曲线模型、三次曲线模型、指数曲线模型等。回归模型中将影响疾病发生的各种影响因素考虑进来,能够对复杂数据进行分析。


国内外学者运用回归模型对出血热、乙型肝炎等疾病进行了成功的预测。

灰色系统理论

灰色系统理论是邓聚龙教授于 20 世纪 80 年代创立的。灰色系统理论建模是对生成数列建模,而一般建模方法则是对原始数据建模。该模型在疾病预测方面的优点为:

  • 少数据性,少到只需 4 个数据就可以建立模型进行预测,并且可允许使用被噪声污染了的数据。

  • 良好的时效性,它将系统看成一个随时间变化而变化的函数.因而可揭示系统随时间发展变化的规律,并且在模型中可不断地引入最新信息,剔除陈旧信息。

  • 较强的系统和关联性,它将研究对象作为一个发展变化的系统,可对事物发展态势进行量化比较分析。其动态过程能反映系统已知信息和未知信息互相影响、互相制约的系统特征,并能揭示系统内涵的本质联系。

  • 建模精度较高,可保持原系统的特征,能较好地反映系统的实际情况,根据不同的预测等级和容许误差值,选用不同的模型,既可做长期趋势预报分析,也可做中、短期预测。


其缺点是当数据序列的波动幅度较大时,模型的精度很难提高,只能用于数据离散较小且发展趋势呈单调序列的情况,无法分析系统的波动规律。经残差修正后模型的精度会有所提高。

Markov 模型

Markov 模型是一种非参数的离散型时间序列分析方法.是通过对随机过程在不同时刻所处状态之间的变化规律,预测这一过程在下一时刻和下几个时间所处状态的方法。从 20 世纪 80 年代起逐渐用来模拟慢性疾病的发展过程。Markov 模型特别适用于有波动性改变的疾病资料。


Markov 模型是探讨慢性病不同发展阶段影响因素的一种有效工具,在慢性病流行病学研究中具有广阔的应用前景。

人工神经网络模型

1943 年,美国心理学家 Warren McCulloch 和数学家 Walter Pitts 合作提出了形式神经元的数学模型 M—P 模型。近年来人工神经网络在传染病分析与预测中的应用越来越广泛,成为传染病研究的热点模型之一。按模型性质神经网络可分为数学模型和认知模型:数学模型是对系统特征的数学抽象描述;认知模型是根据神经系统信息处理过程建立的,可以模拟感知、思维、问题求解等过程。

人工神经网络的最大优点在于能够调整自身结构去适应样本特性。完全克服了传统参数模型让样本来适应自身的固有缺陷.可以不受任何限制自动学习识别变量间的关系,该特性适合于探索性研究。

复杂网络模型

1999 年,Barabasi 和 Albert 等提出了一个「无标度网络」模型,由此揭开了复杂网络研究的新篇章。复杂网络传播理论运用到传染病预测预警中是近年来的研究热点,其研究成果已在很大程度上改变了人们对传染病传播动力学特征的看法。复杂网络理论的研究表明: 人类社会网络是一个复杂网络,而不是一个均匀网络,该网络最重要的统计特征就是小世界效应和无标度特性,研究表明真实网络几乎都具有小世界效应和无标度效应。

现实世界的小世界特性普遍存在,以社交网络为例: 每个人与他周围的人熟悉高度集聚性,每个人又有机会认识远方的人远距离连接的可能性,结实新朋友时谈起大家共同熟悉的朋友会感叹世界真小!

传染病在人群中的流行可以看作是服从某种规律的在复杂网络上的传播行为。研究表明:复杂网络上的传播行为与规则网络上的传播行为有着根本的不同。在具有无标度性质的复杂网络中,无论传播强度多么小,疾病都能够长期存在;个体之间接触的频繁程度对传染病在人群中的传播动力学特征具有明显的影响,从疾病暴发开始,有一段很短的时间,疾病以较慢的速度传播,然后迅速上升到一个较高的峰值,继而以幂函数形式下降;疾病总是优先感染度大的节点(即与他人联系最多的个体)。

此外,基于复杂网络理论的传播动力学研究表明,控制传染病流行的最好方法是对网络中节点度大的个体进行隔离或免疫,而消灭天花过程提出的「环状免疫」、「接触者免疫」均是这种理论的最好体现。复杂网络理论模型中最经典的传染病预测预警模型有 SIR、SIS、SIRS 和 SEIR 模型模型。

SIR 模型用于预测个体感染疾病后可以获得永久性免疫力的疾病。SIS 模型用于个体感染疾病治愈后仍无免疫力的疾病。SIRS 模型用于个体感染疾病后可以获得具有一定期限的免疫力的疾病。目前已有学者将复杂网络模型成功地运用于 SARS、高致病性禽流感和甲型 H1N1 流感疫情的预测。

关于 SEIR 模型 ,2020 年 2 月 28 日,钟南山院士等人在医学期刊 JTD 发表了一篇名为《公共卫生干预下 COVID-19 流行趋势的 SEIR 和 AI 预测修正》(Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions)的论文。如果所研究的传染病有一定的潜伏期,与病人接触过的健康人并不马上患病,而是成为病原体的携带者,归入 E 类。此时有







请到「今天看啥」查看全文