Waddington能量景观的概念由英国发育生物学家康拉德·沃丁顿(Conrad Hal Waddington)在1957年提出。这一模型最初是为了描述细胞发育过程的动态演化。沃丁顿将细胞分化比喻为一个小球从山坡上滚落的过程,小球代表细胞,山坡代表细胞的发育潜能构形。在这个比喻中,小球从山顶(代表干细胞的多潜能状态)开始滚落,经过一系列的选择点(代表不同的细胞命运),最终进入某个山谷(代表特定的细胞类型)。
沃丁顿将细胞分化比喻为一个小球从山坡上滚落的过程
沃丁顿对细胞命运抉择过程的这一形象描述后来被广泛应用于表观遗传学和发育生物学,用来解释基因表达调控、细胞命运选择以及发育过程中的稳定性和可塑性。
最近二十年来,从应用数学和物理的角度对Waddington能量景观给予定量刻画,激发了大量的研究兴趣并已取得重要进展。一个颇为流行的方案由石溪大学的汪劲教授给出:即将势能函数描述为相对应的随机动力系统的不变分布的负对数,从而给出对Waddington能量景观的定量描述。
该方案简单有效并取得了巨大的成功,但在计算上
构建高维体系
Waddington
能量景观
仍面临着巨大的挑战。传统的有限元方法无法处理这类高维问题,而平均场近似虽然提供了一种求解途径,却只能提供近似解。
因此,尽管
Waddington
能量景观在理论上具有重要意义,但在高维情况下的精确构建仍然是一个未完满解决的科学问题。
在近期发表于《国家科学评论》(
National Science Review
, NSR)的文章中,
研究人员提出了一种简单且有效的深度学习方法:EPR-Net。它可以有效构建高维复杂生物体系的Waddington能量景观。该方法基于一个基本数学结构:
Waddington能量景观的负梯度
非平衡体系中向量场在以不变分布为权重内积空间下的Helmholtz分解
其与统计物理中熵产生率密切相关,并且可以在一个统一的框架下处理降维、变系数等情形。
北京大学
李铁军
教授、柏林自由大学和柏林Zuse研究所
张伟
研究员是共同通讯作者。北京大学大数据中心博士生
赵悦
为第一作者。
EPR-Net的核心数学基础是基于如上所述在某个特定加权内积空间的Helmholtz分解。事实上,经典的Helmholtz分解(在通常的内积空间
中)也可给出向量场分解的梯度部分,但遗憾的是这一势函数与统计物理缺乏明显的联系,也并非前述能量景观函数。EPR-Net采用加权内积空间
而非
有效解决了这一困难(这里
是系统的不变分布)。该方法被成功应用至具有多个稳定点、极限环或奇异吸引子且带有噪声的大量高维生物动力学模型情形。
该方法有诸多优势:
-
计算优势:
提出的损失函数是凸的,有利于更快优化收敛。
-
边界条件:
变分形式不需要额外约束边界条件。
-
物理解释:
提出的损失函数的最小值恰对应于非平衡定态系统(NESS)理论中的熵产生率(EPR)。
-
统一框架:
该框架还可以处理降维、变扩散系数的情况。
研究人员还根据通过对增强样本优化HJB损失函数对EPR方法进行增强,得到
Enhanced EPR
,从而更好地覆盖了过渡区域。下图展示了Enhanced EPR的主要框架。
Enhanced EPR的主要框架
研究人员首先
在三个二维基准问题(双势阱、极限环、多稳态)上展示了Enhanced EPR的有效性。
下图中从红色到蓝色表示势能从高到低,箭头表示驱动力的分解,白色箭头表示梯度力,灰色箭头表示非梯度力。该方法可以成功地准确构建对应的能量景观,其构建出来的结果与数值求解的结果相对误差极低。研究人员进一步对比了Enhanced EPR、只使用HJB作为损失函数和Normalizing Flow,验证了
Enhanced EPR构建的能量景观更加准确,远优于其他方法
。
Enhanced EPR可以准确求解经典的基准问题
考虑到高维景观不易直观理解
,研究人员也基于EPR-Net设计了降维策略。
下图a、b为对8维极限环体系成功构建的投影能量景观,与SDE模拟出的平稳分布吻合。降维后出现了额外的稳定极限环和稳定点,这是由于势能景观在中心区域相对平坦所导致的特有现象,这一结果与平面动力系统理论中的Poincare-Bendixson定理相呼应。下
图c揭示极限环外的小势阱对应于一稳定螺旋点而非稳定节点,这些精细结构均是
以往平均场方法所得不到的观察
。
8D极限环系统降维后的能量景观
EPR-Net还可在统一的框架下处理变扩散系数问题的能量景观构建,研究人员正在进一步探索EPR-Net的各种扩展及应用。
总而言之,EPR-Net框架基于一个优美的数学结构,其凸性和统一的数学形式使其有望成为一个有效的高维NESS体系能量景观函数的构造策略。
该研究工作得到了国家自然科学基金项目(
11825102, 12288101
)、国家重点研发计划资助(
2021YFA1003300
)
和
德国研究基金会 (390685689,235221301) 的支持
。相关计算在
北京大学高性能计算校级公共平台进行。