专栏名称: AI TIME 论道

AI TIME是一群关注人工智能发展，并有思想情怀的青年学者创办的圈子，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，链接全球AI学者，以辩论的形式探讨人工智能领域的未来。

近期大火的扩散模型与时间序列/时空数据的交叉能够碰撞出怎样的火花？

AI TIME 论道 · 公众号 · · 2024-05-22 18:23

正文

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

扩散模型在时间序列和时空数据中的理论、进展、应用与展望

作者简介

杨毅远 ，

牛津大学计算机系博士生，牛津克拉伦登学者，师从Andrew Markham教授和Niki Trigoni院士，研究方向数据挖掘、时间序列、生成模型、信号处理等。

概述

A survey on diffusion models for time series and spatio-temporal data

时间序列（Time series） 的研究对于理解趋势、周期和异常具有关键作用，可以在各个领域提供超前的洞察力； 时空数据（Spatio-temporal data） 对于分析空间和时间中的各种特征至关重要，为复杂系统的交互关系提供了动态视角。近年来， 扩散模型（Diffusion model） 在时间序列和时空数据挖掘中得到了广泛应用，不仅增强了对序列和时空数据的生成和推断能力，还扩展到其他下游任务。本综述对扩散模型在时间序列和时空数据中的应用进行了全面而深入的梳理， 并按模型类别（Model）、任务类型（Task）、数据模态（Data）和应用（Application）进行了分类。

具体来说，我们将扩散模型分为无条件模型和条件模型，并分别讨论时间序列和时空数据。无条件模型在无监督的情况下运行，进一步细分为基于概率的模型和基于分数的模型，服务于预测和生成任务，例如预测、异常检测、分类回归、补全和去噪。而条件模型利用额外信息来提升性能，同样被细分为预测和生成任务两种类型。

本综述广泛覆盖了扩散模型及其变种在 医疗保健、推荐系统、气候、能源、音频和交通运输、智能运维、金融 等多个领域的应用，为这些模型在分析和生成数据方面提供了基础性认识。通过结构化的概述，本文希望为研究者和实践者提供关于扩散模型在时间序列和时空数据分析中的全面理解，从而通过解决传统挑战并探索扩散模型框架中的创新解决方案，引导未来的创新和应用。

论文链接：

https://arxiv.org/abs/2404.18886

项目地址：

https://github.com/yyysjz1997/Awesome-TimeSeries-SpatioTemporal-Diffusion-Model

内容介绍

扩散模型（Diffusion model）是一类概率生成模型，其通过在训练样本中注入和去除噪声的双重过程进行优化和生成。 这个过程包括正向阶段（称为扩散Diffusion）和逆向阶段（称为去噪denoising）。模型通过学习在扩散过程中去除噪声，从而在推理阶段生成与训练数据分布高度一致的有效数据。

近年来，扩散模型崭露头角，对多个领域产生了重大影响，包括 计算机视觉（CV）、自然语言处理（NLP）以及通用的多模态学习 ，这也挑战了生成对抗网络（GAN）的长期统治地位。在这些领域中，扩散模型在 文生图、实例分割、3D生成、分子设计和音频/语音生成 等应用上展现了卓越的能力。值得注意的是，扩散模型也开始作为一种非自回归的替代方案应用于传统上由自回归方法主导的任务中。最近，OpenAI发布的 Sora 标志着扩散模型开始用于建模嵌入时空连续体中的物理世界，进一步凸显了其重要性。

序列数据，主要包括时间序列和时空数据 （参见图4） ，它们捕捉了绝大多数现实世界系统的动态变化。这些形式的序列数据经过广泛研究，被认为在众多应用中至关重要。然而，在这一领域，从多种数据模式中推导出物理世界中的普遍动态规律仍然是一个重大挑战。近些年来，时间序列和时空数据建模领域正从感知智能逐渐向通用智能发展。

扩散模型在包括图像、语音和视频等多种模式中取得了最先进的成果。受益于这些领域中大量可用的数据，扩散模型通常与大型语言模型（LLM）或其他基础模型一起作为生成式基础模型，推动了这些领域的快速发展。近年来，越来越多的使用扩散模型的研究工作被用于时间序列和时空数据建模 （参见图1） 。我们也注意到，使用扩散模型进行序列建模的尝试越来越多 （参见表1） 。观察到扩散模型的成功后，一个有趣的问题浮现： 时间序列/时空数据分析与扩散模型的交叉会碰撞出什么样的火花？

时间序列和时空数据分析主要依赖于对其内在序列动态地深入理解，主要任务侧重于骨干模型的生成能力，如预测、补全和生成。 这些分析的核心在于以条件或无条件的方式为特定目的生成序列数据样本。最近时间序列和时空基础模型的发展表明，不论是基于大语言模型构建还是从头开始训练，其成功的关键在于能够估计训练样本的分布并获得有效的数据表示。在这方面， 扩散模型作为一种强大的生成框架，具备以下能力：（1）建模序列数据中的复杂模式，以及（2）支持广泛的下游任务（参见图2）。

为了生成符合特定任务的数据样本，时间序列和时空扩散模型通常以无条件的方式运行，无需监督信号。鉴于现实世界应用的部分可观测特性，条件扩散模型应运而生。它们利用数据标签（如指令、元数据或外部变量）来“引导”生成过程，从而实现更有效的跨模态提示，带来更量身定制和改进的结果（路线图参见图3）。通过对大规模序列数据的训练，扩散模型有效填补了时间序列/时空数据生成的空白，并在解决下一代、由大语言模型赋能的时间数据中心化代理的难题方面展现出巨大潜力。

尽管扩散模型在处理时间序列和时空数据方面前景广阔并取得了快速进展，但现有文献中明显缺乏对这一模型家族的系统分析。本文旨在填补这一空白，通过提供前瞻性的综述，阐明“ 为什么 ”和“ 如何 ”——详细说明扩散模型适用于这些数据模式的原因，并揭示其带来优势的机制。在本次综述中，我们提供了详细的分类、深入的评论，并识别了这一迅速发展的领域中的新兴趋势。

该综述的主要框架思路如下，感兴趣的朋友可阅读论文原文了解更多。

第2章：介绍扩散模型的背景，详细阐述了其发展历程、理论基础和各种实现方式。

第3章：对应用于时间序列和时空数据的扩散模型进行 结构化的概述和分类 。

第4章：从 模型视角 出发，深入探讨各种扩散模型的机制、特性和应用，以揭示它们在处理时间序列和时空数据时的优势和限制。

第5章：从 任务视角 出发，探讨扩散模型在预测、生成、插补、异常检测等任务中的应用。

第6章：从 数据视角 出发，讨论时间序列和时空数据特有的挑战和解决方案。

第7章：探索扩散模型在不同领域的应用，如医疗保健、交通和能源等。通过实际案例和应用场景，展示扩散模型在这些领域中的广泛适用性和实用性。

第8章：总结扩散模型在时间序列和时空数据分析中的优势和挑战，并探讨未来可能的研究方向和发展趋势。

近期大火的扩散模型与时间序列/时空数据的交叉能够碰撞出怎样的火花？

正文

请到「今天看啥」查看全文