专栏名称: 脑人言
一群青年脑科学工作者组成的团队,希望能做一些有趣而严谨的原创性科普,帮助大家更好的了解脑、保护脑;同时也希望能追踪科技前沿,讨论如何模拟脑。关注领域:神经科学、认知科学、脑机接口和人工智能。
51好读  ›  专栏  ›  脑人言

Dynamic Causal Modeling:确定性因果模型(下)

脑人言  · 公众号  · 科学  · 2017-10-27 08:22

正文

再不点蓝字关注,机会就要飞走了哦

撰文 | 呵呵whatever

编辑 | shin


对于(上)的小结:

从心理学刺激输入到bold信号建立起了一套非线性的数学模型,这个数学模型的参数可以分为两类: A,Bj和C是描述神经元活动属性的参数,统称为θc, τi、κi、Υi、α的ρ是描述血管动力学属性的参数,统称为θh。 θc和θh统称为θ。设y为fMRI仪器读取的bold信号,u为刺激输入,那么得到描述刺激输入和bold信号的非线性方程:

上式中,我们已经知道了u和y,需要估计参数θ,即一系列包含大脑连接变化的参数。DCM主要使用贝叶斯参数估计的方法来估计θ。

1

第一部分 贝叶斯参数估计:

频率理论:样本x=(x1,…,xn)的产生只需要一个步骤,即人们从总体中抽取了一系列样本。我们可以直接从这些样本值估计出总体的参数。

贝叶斯理论:样本x=(x1,…,xn)的产生需要两个步骤:

第一步,从总体的参数分布(先验分布)中,由“上天”抽取了一个参数θ’;

第二步,这个参数确定后的总体的分布中,抽取了一系列样本。

因此,我们不但需要从样本值做参数的“无偏估计”,还要根据参数本身的分布规律(先验分布)让无偏估计值“偏”一下(在此不评论,也不做各种解释,形象直观地描述一下)。

普通概率论课本中贝叶斯公式(这个学过概率论的同学都已经熟悉了):

对等式右侧分母(即m(A):A的边缘密度函数)仅仅起到正则化的作用,因此可以得到下面的正比关系,注意到这里面已经将A、B换成了y和θ,即当样本值为y时,参数θ的分布规律可由下式来确定。

在贝叶斯统计理论中,p(θ|y)是已知的样本量(比如说bold信号)决定的参数(比如说大脑连接强度)的分布规律。被称为后验概率。

p(θ)是人们对于参数分布的先验假设。即先验分布。

p(y|θ)是人们对于样本分布的似然函数。概率论通常用这个分布估计参数。而贝叶斯理论认为还要添加先验概率的影响。

上面这个式子可以简单概括为:后验概率就是极大似然(无偏估计)和先验概率的折中方案。

2

第二部分 参数先验分布的确定

DCM模型中,待估参数有8个,其中,血管动力学参数的先验分布已经由Friston等人在2002年的研究中确定,具体值见附录。

而神经活动的参数A(静息态的脑区间连接)、B(刺激引起的脑区间连接变化)、C(输入引起的目标脑区神经活动变化)的先验分布,则要通过构建一个稳定的网络结构来确定。

(1)稳定系统和非稳定系统

稳定性是系统的一种特征。涉及到在时间演化过程中,两个在相平面上相邻无限近的点会不会必然分离。如下图就是一个极端不稳定的系统(混沌系统),系统初始点非常邻近,但随着时间进展出现了分叉和混沌现象。DCM方法通过对系统的稳定性进行先验性假设,来形成对A、B、C三个参数的先验分布。

很明显,神经活动的状态z不会随着时间而指数发散,而是会回到一个稳定的状态,这就意味着固有连接矩阵A的最大实特征根为负值,即矩阵A的主李雅普诺夫指数应为负值(这是非线性动力学判定系统稳定性的方法之一,如有疑问请阅读附录)。

(2)通过相平面认识系统稳定性:

先将下图中x和x’想象成钟摆的重力势能和动能。实际上相平面就是势能和动能的坐标图。随着时间演进,系统中的势能和动能会互相转化。造成了点在相平面上运动。

当x’=0时,系统陷入不动点(奇点,定点),即陷入停滞状态。一般通过李雅普诺夫指数(方法)判定系统解的稳定性 ,在此定义下,李雅普诺夫稳定性指的是系统在想平面上的运动轨迹受到微扰后,是否还会回到原来的轨道上。人们通过李雅普诺夫指数来检验和描述系统的稳定性。(确切定义和扩展阅读看附录) 。

(3)通过系统稳定性假设得到参数先验分布

回到DCM模型中来,我们显然可以假设:人的静息态大脑连接(A)这一个系统不会陷入到剧烈变动状态,刺激输入后,大脑连接的变动(B)也不会无限扩散,外界刺激对于大脑激活(C)也会随着时间进展慢慢恢复到静息态。

如果我们先对A、B、C三个参数进行标准化,那么它们标准化之后的绝对零点,同时也是高维相平面上的绝对零点。因此,只要确保A、B、C三个矩阵的主李雅普诺夫指数最小,就可以保证系统是稳定的。这是我们对于这三个参数的先验假设。

对于连接矩阵A,设一共有l个脑区,从i脑区到j脑区的连接度为aij, ζ为它们的平方和,当它们都相等时,得到主李雅普诺夫λa指数最大,这两个值为:

根据正态分布的特点,可以认为这两个式子(在绝对零点附近)保持局部线性,因为我们要保证λa<0,这样我们就建立起高斯分布重要的参数平方和和系统稳定性之间的关系: ζ

设aij符合一个均值为0,方差为va的正态分布,则aij的平方和符合卡方分布,在这个分布假设下,对于参数进行估计后,就可以得到A矩阵元素分布的超参数——方差:

这样,我们就对于A的分布有了一些先验性的看法,对A标准化后,它是一个均值为0,方差为v的(取0- va的无假设分布)的正态分布。

B矩阵的元素也可以用同样的方法得到先验分布。对于C矩阵,Friston等人假设的是它的元素符合均值为0,标准差为1的正态分布。

3

第三部分 数值求解

现在已经得到了DCM的基本模型,从外界刺激输入u到bold信号,建立起了一套非线性关系。还有了关于所有待估计参数的先验分布。下面将根据它们的先验分布,采用贝叶斯参数估计的方法将这些参数的后验分布求出来。

现在有两个困难:

1、DCM模型中,输入u和bold信号y之间的关系是非线性的,那么比如基于最小二乘回归模型等要求基本线性假设的参数估计方法就不能使用了。

2、如果用直接解极大似然法构造的积分方程来估计这些参数,那么又会遇到最大似然估计容易遇到的问题:很难找到通用法则来计算结果。

Friston等人首先利局部线性近似的方法进行构造参数估计的通用法则。

局部线性近似:指的是稳定系统在某点附近处运动时,运动的速率近似于平衡点的运动速率。也因此,我们可以在参数θ分布的中心(众数、均值)附近以直代曲,认为在这一点附近是线性变化。

根据局部线性近似的思想,Friston认为各个参数都是围绕着均值上下微动,斜率和均值点附近的一致。设在i脑区参数均值为

根据贝叶斯参数估计方法,假设后验分布、似然函数都是正态分布:

Firston在2002年指出,在层级观察模型中(Hierarchical Linear Observational
Model)两个层级(region to region)的压缩到一个非层级方程中时(没有找到专门的汉语翻译,可能我说的不太专业,欢迎有统计背景的同学指出错误),可以得到以下关系:

•将上式代换到前面的先验和最大似然等式中去,又根据贝叶斯参数估计方法,得到:

上述推导中,假设测量误差ε的协方差Cε已知,但其实是未知的,根据Neal和Heaton(1998)的研究,对于协方差C ε的估计,可以找到一个适用于所有样本类型的超参数估计方法,运用样本值估计测量误差的分布:

到目前为止,已经找到了根据刺激输入u、bold信号、第一个脑区的参数θ(1)去估计其它所有脑区的参数θ(i)的方法。

DCM模型假定,第一个脑区的参数就是前面提到的先验分布中确定的参数均值。

4

第四部分 算法和步骤

1、选定ROI脑区,确定连接和连接方向,以及各脑区是否受到外界刺激的直接影响。

2、将模型中第一个脑区的参数值θ和λ设置为先验均值。







请到「今天看啥」查看全文