扩散模型(Diffusion model)是一类概率生成模型,其通过在训练样本中注入和去除噪声的双重过程进行优化和生成。
这个过程包括正向阶段(称为扩散Diffusion)和逆向阶段(称为去噪denoising)。模型通过学习在扩散过程中去除噪声,从而在推理阶段生成与训练数据分布高度一致的有效数据。
近年来,扩散模型崭露头角,对多个领域产生了重大影响,包括
计算机视觉(CV)、自然语言处理(NLP)以及通用的多模态学习
,这也挑战了生成对抗网络(GAN)的长期统治地位。在这些领域中,扩散模型在
文生图、实例分割、3D生成、分子设计和音频/语音生成
等应用上展现了卓越的能力。值得注意的是,扩散模型也开始作为一种非自回归的替代方案应用于传统上由自回归方法主导的任务中。最近,OpenAI发布的
Sora
标志着扩散模型开始用于建模嵌入时空连续体中的物理世界,进一步凸显了其重要性。
序列数据,主要包括时间序列和时空数据
(参见图4)
,它们捕捉了绝大多数现实世界系统的动态变化。这些形式的序列数据经过广泛研究,被认为在众多应用中至关重要。然而,在这一领域,从多种数据模式中推导出物理世界中的普遍动态规律仍然是一个重大挑战。近些年来,时间序列和时空数据建模领域正从感知智能逐渐向通用智能发展。
扩散模型在包括图像、语音和视频等多种模式中取得了最先进的成果。受益于这些领域中大量可用的数据,扩散模型通常与大型语言模型(LLM)或其他基础模型一起作为生成式基础模型,推动了这些领域的快速发展。近年来,越来越多的使用扩散模型的研究工作被用于时间序列和时空数据建模
(参见图1)
。我们也注意到,使用扩散模型进行序列建模的尝试越来越多
(参见表1)
。观察到扩散模型的成功后,一个有趣的问题浮现:
时间序列/时空数据分析与扩散模型的交叉会碰撞出什么样的火花?
时间序列和时空数据分析主要依赖于对其内在序列动态地深入理解,主要任务侧重于骨干模型的生成能力,如预测、补全和生成。
这些分析的核心在于以条件或无条件的方式为特定目的生成序列数据样本。最近时间序列和时空基础模型的发展表明,不论是基于大语言模型构建还是从头开始训练,其成功的关键在于能够估计训练样本的分布并获得有效的数据表示。在这方面,
扩散模型作为一种强大的生成框架,具备以下能力:(1)建模序列数据中的复杂模式,以及(2)支持广泛的下游任务(参见图2)。
为了生成符合特定任务的数据样本,时间序列和时空扩散模型通常以无条件的方式运行,无需监督信号。鉴于现实世界应用的部分可观测特性,条件扩散模型应运而生。
它们利用数据标签(如指令、元数据或外部变量)来“引导”生成过程,从而实现更有效的跨模态提示,带来更量身定制和改进的结果(路线图参见图3)
。通过对大规模序列数据的训练,扩散模型有效填补了时间序列/时空数据生成的空白,并在解决下一代、由大语言模型赋能的时间数据中心化代理的难题方面展现出巨大潜力。
尽管扩散模型在处理时间序列和时空数据方面前景广阔并取得了快速进展,但现有文献中明显缺乏对这一模型家族的系统分析。本文旨在填补这一空白,通过提供前瞻性的综述,阐明“
为什么
”和“
如何
”——详细说明扩散模型适用于这些数据模式的原因,并揭示其带来优势的机制。在本次综述中,我们提供了详细的分类、深入的评论,并识别了这一迅速发展的领域中的新兴趋势。
该综述的主要框架思路如下,感兴趣的朋友可阅读论文原文了解更多。
第2章:介绍扩散模型的
背景
,详细阐述了其发展历程、理论基础和各种实现方式。
第3章:对应用于时间序列和时空数据的扩散模型进行
结构化的概述和分类
。
第4章:从
模型视角
出发,深入探讨各种扩散模型的机制、特性和应用,以揭示它们在处理时间
序列和时空数据时的优势和限制。
第5章:从
任务视角
出发,探讨扩散模型在预测、生成、插补、异常检测等任务中的应用。
第6章:从
数据视角
出发,讨论时间序列和时空数据特有的挑战和解决方案。
第7章:探索扩散模型在不同领域的应用,如医疗保健、交通和能源等。通过实际案例和应用场景,展示扩散模型在这些领域中的广泛适用性和实用性。
第8章:总结扩散模型在时间序列和时空数据分析中的优势和挑战,并探讨未来可能的研究方向和发展趋势。