意识和底层的神经活动之间如何联系起来?试图解释这一问题的意识理论层出不穷。然而,随着实验数据积累,众多的意识理论并没有被逐渐证伪,反而数量持续增加,这种现象促使人们对现有理论进行整合。2022年5月发表于
Nature Reviews Neuroscience
的综述文章,回顾了四类重要的「意识理论」:高阶理论、全局工作空间理论、整合信息论和复馈/预测处理理论。通过经典的实验争论说明这些理论的联系与区别,从而为理解意识科学的研究现状提供了一个视角,以期推动意识理论和实验研究之间的良性循环,使我们更深刻地理解意识这个最深刻的奥妙。
研究领域:意识理论,认知神经科学
Anil K. Seth & Tim Bayne
| 作者
李路凯、陈斯信
|
译者
邓一雪
|
编辑
论文题目:
Theories of consciousness
https://www.nature.com/articles/s41583-022-00587-4
摘要
一、引言
二、预备知识
三、四类意识理论路径
1. 高阶理论
2. 全局工作空间理论
3. 整合信息论
4. 复馈/预测处理理论
四、意识理论的评估标准和发展方向
近年来,有关意识的生物和物质基础的理论层出不穷。好的理论能够指导实证研究,解释实验数据,开发新型实验技术,以及扩展我们控制感兴趣的实验现象的能力。然而,在意识领域,目前的理论如何相互关联或者能否用实验鉴别,尚不清楚。为了阐明这一复杂的领域,我们回顾了四类重要的意识理论
(Theories of Consciousness,TOC)
路径:高阶理论
(higher-order theories,HOT)
、全局工作空间理论
(global workspace theories,GWT)
、整合信息论
(integrated information theory,IIT)
和复馈/预测处理理论
(re-entry and predictive processing theories)
。通过指明它们试图解释的意识问题、它们的神经生物学承诺、以及它们引证的实验证据,刻画了这四类路径的主要特征。我们考虑了一些重要的实验争论如何可能区分不同理论,并列举了三个意识理论需要发展的方向,使它们能够被神经科学实验所检验。有理由相信,意识理论的迭代发展、验证和比较将导向更深刻的理解。
在意识科学复苏的最初几十年,研究者们侧重于寻找“意识的神经相关物”
(neural correlates of consciousness, NCC)
。严格地说,NCC是足以构成某种意识状态的最小神经事件集;在实践中,寻找NCC包括寻找与意识最密切相关的大脑状态和过程[1-3]。专注于寻找NCC的工作是有用的,因为 NCC“理论中立”,为具有不同理论和哲学背景的研究人员提供了共同的语言和方法。然而,NCC框架的局限性变得越来越明显,比如难以将NCC从意识的神经先决条件和附带影响中区分出来[4-7]。为了应对这些限制,人们越来越关注意识理论
(theories of consciousness, ToC)
的发展。在ToC的帮助下,我们能超越基于NCC的方法,转而去探索具有解释性洞见的意识模型。事实上,意识科学的主要目标就是得到被实验验证的ToC[8,9]。
NCC的研究方法强调意识与大脑活动之间的相关性,而ToC则侧重于鉴别意识特征与神经机理之间的解释性联系
[10]。话虽如此,理论家们经常采用不同的话语体系来解释神经活动和意识之间的联系。一部分人认为,令人满意的ToC应该缩小“解释鸿沟”
(方框 1)
,使神经活动和意识之间的关系,像水的化学结构与其总体特性之间的关系一样,清晰明了[11]。另一部分人认为,“解释鸿沟”不一定能完全消除,但仍然希望有一个框架可以解释意识的某些方面,减少或消除有关意识的生理基础的神秘感[12,13]。还有一部分人认为, “解释鸿沟”具有误导性,不应该被意识科学认真对待[14,15]。
20世纪90年代,大卫·查默斯 (David Chalmers) 区分了意识的“困难”和“简单”问题[164]。简单问题涉及与意识相关的功能和行为,而困难问题涉及意识的(现象,主观)体验。使这个难题变得困难的是“解释鸿沟”[165]——这是一种直觉,即似乎不可能用物理或功能术语对主观体验给予完全还原论的解释。
一些意识理论(比如整合信息论和某些版本的高阶理论)直接着手处理困难问题。其它一些理论(比如全局工作空间理论)关注与意识相关的功能和行为特性,尽管可以认为它们也着手处理了困难问题,但这并不是其支持者的主要目标。第三种策略(被一些预测处理理论家采用)旨在提供一个框架,在其中可以解决有关意识现象特征的各种问题,而不试图解释现象本身的存在性[67]——这有时被称为“真正的问题”[13, 166]。
意识领域的一个关键问题是,困难问题应当由科学来解决吗?还是应当被搁置而不是被解决?认为困难问题应当被搁置的人经常争辩说,正是我们用来表达自身意识状态的概念(“现象概念”)的特殊性,导致了这个难题的出现[167,168]。一个相关的观点是幻觉主义,它认为我们实际上并没有现象状态,而只是将自己表示为具有这种状态[14,15]。不管这些假说的优点是什么,随着我们解释、预测和控制意识的现象属性和功能属性的能力增强,困难问题或许会变得没那么棘手[166,169]。
表1列出了现有的众多ToC。值得注意的是,随着实验数据的积累,众多ToC并没有逐渐被证伪从而被放弃,它们的数量不降反增。这种现象促使人们将现有理论相互整合[16],或进行“对抗式合作”。在“对抗式合作”中,对于某个实验的结果是否会支持或破坏某个理论,不同理论的支持者们需要事先达成一致[17]。然而,理论整合和“对抗式合作”都存在重大挑战,我们将讨论这一点。
表格1 | 意识理论选集
|
|
|
|
|
|
|
|
|
|
|
|
|
点火并广播到神经元全局工作空间的信息进入意识,额叶与顶叶承担中心枢纽般的作用
|
|
|
意识就是产生最大不可约整合信息的物质基础的因果结构
|
|
|
意识依赖于对环境的非平凡信息闭合,特别是粗粒度水平
|
|
|
神经活动的功能集群结合了高层次的动态整合与分化,产生意识
|
|
|
自然选择原理塑造的价值依赖型学习的历史信息,反应在复馈行为上,产生意识
|
|
|
|
|
|
感知依赖于对感觉信号的成因的预测推断。它提供了一个框架,有助于系统地将神经机制映射到意识的各个方面
|
|
|
|
|
|
具有不同的观点,比如意识依赖于对自主行为的时序的和反事实的深度推理
|
|
|
|
|
|
|
|
|
意识依赖于内稳态程序和多层次内感受图之间的相互作用,以情感和感觉为核心
|
|
|
|
|
|
意识依赖于多个(可能不一致的)表示,而不是中央系统可用的单一、统一的表示
|
|
|
|
|
|
意识依赖于一种学习形式,使生物体将自身的驱动力与新颖、复合和非反射诱导的刺激或动作联系起来
|
|
|
|
|
|
意识就是编码在大脑电磁场中的物理整合的、因果活跃的信息
|
|
|
|
|
在这篇综述中,我们考虑了ToC之间的关系,以及它们与实验数据的联系。我们指明了几条发展路径,能够让理论发展和实证研究相互支持和促进,从而寻找令人满意的对意识体验的科学解释。我们只考虑那些本身以神经生物学术语表达的理论,或者被合理地认为包含可以用神经生物学术语表达的主张的理论。
(正如我们将看到的,一些“神经生物学”ToC使用信息论或“功能之间的联系”等抽象语言进行表达,仅因为其抽象语言能与特定的神经机制建立联系而被称为“神经生物学”)
。另外,我们只考虑与已知物理理论一致的神经科学理论。我们也不考虑将意识直接与量子力学过程联系起来的理论
(比如[18,19])
。
ToC之间“鸡同鸭讲”的主要原因之一是它们通常具有不同的解释目标。因此,我们首先考虑,一个详尽的ToC需要解释哪些内容。即使这个问题也存在争议,理论家们在ToC应该解释什么样的意识现象上经常无法达成一致。
意识的核心问题是“第一人称体验”或“主观知觉”。虽然,除了循环定义以外,无法对这些术语进行定义,但意识研究的对象可以用一些直观的特征来进行区分和限定。比如使用“有某种感觉”
(something it is like)
来描述某个生物体具有意识[20],使用“感觉起来怎么样”
(what it is like)
来区分两种不同的意识状态。一个详尽的ToC不仅需要解释为什么一些生物体或系统有意识而另一些没有意识,还需要解释为什么不同的过程导致不同的意识状态。
意识状态可以分为两类:全局状态和局部状态
。全局状态描述生物体的整体主观特征,并与觉醒水平的变化、行为反应的变化有关。常见的全局状态包括清醒、做梦、镇静、最低意识状态
(或许还包括迷幻状态)
。这些全局状态有时被称为“意识水平”,但我们更喜欢“全局状态”这个术语,因为它留下了这样一种可能性,即这些状态无法在单一维度上被完整地排序,而最适合在多维空间内被描述[21]。
局部状态——通常被称为“意识的内容”或具有“感质
(qualia)
”的状态——的特征被“这种状态感觉起来怎么样”所刻画。头痛的局部状态与闻咖啡的局部状态不同,因为头痛的感觉与闻咖啡的感觉不同。局部状态的描述可以具有多层级的颗粒度,从低级的感知特征
(例如颜色)
到单个物体,再到完整的多模态场景感知。一些重要的局部状态构成了自我体验的基础,自我体验包括情绪、情感、意志、拥有身体的感觉、明晰的自传体记忆等[13, 22-24]。虽然神经生物学理论倾向于关注具有感觉和感知内容的局部状态,但意识还包括具有认知和命题内容的局部状态,例如解决填字游戏时出现的想法。重要的是,在特定的时刻,一个生物体具有的众多局部状态并非简单而独立地出现,相反,它们作为单一的意识场景的组成部分,被绑定在一起[25, 26]。
第二个区别是意识的现象属性和功能属性之间的区别
。现象属性是指意识的主观体验特征,也就是说“感觉起来怎么样”。功能属性关注的是,对具有意识并因此获得好处的生物体而言,在它的认知经济性方面,心智状态承担了什么角色。
(这里的“功能”包括目的论功能——由进化形成的功能——和部署性功能——一个过程在它所属的更大系统的运作过程中所起的作用;见参考文献 27)
例如,有意识地看到咖啡杯可以实现一系列功能,包括灵活地使用杯子
(可能是从杯子里喝水,或者把它扔到房间的另一头)
,对上述事件进行情景记忆,以及提供有关上述体验的口头报告。虽然我们区分了意识的现象属性和功能属性,但并不是说它们相互独立
(它们很可能不是独立的)
,只因为它们为 ToC 提供了不同的解释目标。正如我们将看到的,一些 ToC 关注意识的现象特征,另一些则关注意识的功能特征,还有一些试图同时解释意识的功能特征和现象特征。
第三个区别是ToC可能试图回答的,有关局部状态(“内容”)的两种问题
。一方面,人们可能会问为什么生物体处于某个局部状态
(而不是另一个局部状态)
。另一方面,人们可能会问,为什么一个特定的局部状态具有它所具有的主观体验特征
(而不是其它类型的特征)
。这种区别可以用双目竞争实验来解释。在双目竞争实验中,被试的每只眼睛都接收到不同的刺激
(例如,右眼呈现房子,左眼呈现人脸)
,被试的视觉体验在左眼刺激和右眼刺激之间交替[28]。在特定时刻,意识内容只包含房子,而不包含人脸,此时,我们可以问,为什么在这一刻对应于“房子”的心理状态是有意识的
(而“人脸”的心理状态无意识)
,我们也可以问为什么房子的视觉体验具有它们所具有的独特的体验特征,而不是具有看到一张脸,听到铃铛响或感到疼痛时的体验特征。值得注意的是,可能有一些内容是不可能有意识的
(例如,初级感知或调节系统中的低级处理过程)
,而其它内容只能是有意识的
(例如,全局整合的感知场景)
。因此,除了解释为什么某些心理内容在某些情景中是有意识的,而在其它情景中不是,另一个挑战是解释,为什么某些内容永远不会是有意识的,而某些内容只能作为有意识的存在。
大多数ToC并没有试图同时解决我们刚刚阐明的所有意识问题,它们试图解释意识的某些方面的问题,它们或许将这种努力看做迈向详尽完整的意识理论的一步。虽然,只研究意识的某一方面,这种局限本身并不构成对某一ToC的批驳和反对,但这确实意味着意识理论之间的相互比较变得没有那么简单而直接了。如果不同理论针对意识的不同方面
(例如,一种理论专注于意识的现象特征,另一种理论关注其功能特征)
,那它们乍一看可能不像“对手”。
本文回顾的ToC分为四类:高阶理论
(HOT)
,全局工作空间理论
(GWT)
,整合信息论
(IIT)
以及复馈/预测处理理论。虽然某些对意识的解释跨越了多个类别,而另一些则无法合理地归入这些类别中的任何一个
(表格 1)
,但这种四分类方法提供了一个视角,有助于理解意识科学的研究现状
(方框2;关于其它对理论进行分组的方式,见[29])
。在下文中,我们将介绍每个类别的关键元素,描述一些值得注意的类别内差异,并指明最密切相关的意识问题。然后,我们根据一些经典的实验争论,来说明这些ToC如何相互关联,并提出了几个建议,我们认为这些建议将有助于推动意识的理论发展和实验研究之间的良性循环。
其他方案:注意、学习和情感
除了本文提及的理论方法(表1)之外,意识理论还包含许多其它方向。一种方法侧重于注意力。例如,Graziano的注意力图式理论(attention schema theory)将有意识的感知与注意力控制模型联系起来[148]。另一种基于注意力的意识理论是被注意的中间表征理论(attended intermediate representational theory)。该理论首先由Jackendoff[141]提出并由Prinz[142]发展,该理论认为,当中级感知表征获得注意力时,意识就会发生。
其它理论方向侧重于学习。比如Jablonka和Ginsburg认为,“无限联想学习”提供最小意识,这种学习机制使生物体将自身的驱动力与新颖、复合和非反射诱导的刺激或动作联系起来[150]。其它基于学习的理论与我们已经描述的一些理论部分重叠,比如Cleeremans版本的高阶理论[34,140]和Lamme的局部循环理论(local recurrency account),后者认为循环信号凭借其在学习中的作用产生意识[65]。基于学习的理论也与“选择主义”密切相关,它们认为意识来源于神经元团簇内部和之间的类似进化的动力学[145,146]。
基于情感的理论强调大脑在生理调节中的作用,作为意识的基础。比如Damasio认为意识依赖于生物体生理状况的分层嵌套表征[147,170],他还将情感与预测处理过程相结合,在控制导向的内感受预测过程中建立意识体验[13,77,90]。一些基于情感的理论否认皮层中的机制是意识所必需的,而将产生意识的机制定位在脑干中[171,172](反对的观点另见参考文献 173)。
所有高阶理论
(HOT)
共有的核心主张是,某种精神状态是有意识的,当且仅当它成为某种元表征状态指向的目标。元表征不仅仅指在层次化处理结构中位于更高层或更深层的表征,而是指以其它表征为指向目标的表征
(图1)
。例如,内容为“我正在经历的视觉体验中包含一个正在移动的点”的表征是一个元表征,因为它的内容涉及自己对世界的表征,而不是世界本身。
不同HOT之间的重要区别之一,是它们对负责意识的元表征的性质和作用的解释不同。某些HOT发现某些元表征对包含思想的意识
(或类似思想的状态)
至关重要[30-32]。另一些HOT则从计算的角度进行说明。在自组织元表征解释中,高阶大脑网络将低阶网络编码的表征重新编码成元表征,这一过程与意识有关[33, 34]。此外,高阶状态空间理论提出,主观报告
(例如,诸如“我感知到了X”之类的陈述)
是关于感知内容的生成模型的元认知
(高阶)
决策[35]。然而,感知现实监测理论
(perceptual reality monitoring)
假设,当高阶网络将某个一阶表征当做外部世界的可靠反映时,意识感知就会产生[36, 37]。
正如前文所述,HOT专注于解释为什么有些内容是有意识的,而另一些则没有。但下述HOT也不局限于解释这一点——它们也能用来解决有关局部状态的体验特征的问题。一个典型的例子考察了这样一种
(有争议的)
直觉,即感知体验的内容通常超过“一阶”感官表征中的有效信息,比如周边视觉体验[38,39]。对此,基于HOT的假说认为,周边视觉体验“膨胀”的现象是由一阶状态的高阶表征错误造成的。HOT方法还能解释为什么某些内容是不可能有意识的
(它们不能成为适当的元表征状态的目标)
,以及为什么某些内容必然是有意识的
(它们必然伴随有适当的元表征状态)
。HOT很少关注意识的全局状态,但他们能够根据
(元)
表征过程的完整性来解释全局状态之间的区别。
一个特别有趣的问题是HOT能否
(如果能,如何)
解释各种体验的独特体验特征。为什么欣赏日落的体验特征与头痛的体验特征如此不同?对于这个问题,HOT的回应大体如下:一个状态的体验特征是由相关的元表征状态赋予它的属性决定的。大多数这类解释都集中在视觉体验上[40],但也有解释情绪状态[41]和元认知状态的工作,例如在感知决策过程中,自信的感觉是什么样的[42, 43]。最后,任何完全还原论版的HOT都必须解释为什么各种属性的表征会产生相应的体验,以及神经活动最初如何使这些属性呈现。
HOT主要解释了心智状态具有意识的原因,因此,该方法不提出任何关于意识功能的特定观点。事实上,一些HOT淡化了意识具有独特功能的观点[44]。另一些版本的HOT,通过与信念判断和错误监测相关的元认知过程,来鉴别意识的功能作用[45]。此外,尽管HOT允许有意识的心智状态伴随有意识的元认知判断——例如显式的行为监测或主观信念的报告——但大多数HOT并不要求有意识的感知必然伴随相应的有意识的元认知状态。相反,若元表征想要被意识到,它必须成为合适的元表征状态的对象。
从意识的神经基础角度考虑,对元表征的着重关注导致HOT研究者们着重强调前部皮层区域,特别是前额叶[30],因为这些区域与复杂的认知功能相关。然而,尽管大多数HOT认为前半部分大脑产生意识,但对于具体哪些区域
(或过程)
是产生意识所必须的,仍有分歧[46]。
图1:高阶理论。意识的高阶理论(HOT)的核心主张是,心智状态有意识的原因是它成为了特定种类的元表征指向的目标。例如,后部皮层中的视觉信号的低阶表征,在被正确类型的高阶元表征所指向时,将提供有意识的视觉感知。认为前部皮层区域,特别是前额叶区域,参与意识内容的产生的实证研究,是HOT的支持性证据,特别是当有意识和无意识状态都与之匹配时[30,100]。将元认知与前额叶区域联系起来的病变证据,也间接地支持HOT[153]。HOT也受到一些实证研究的挑战,比如某些研究认为前部区域与意识无关[108, 154],它可能只是为了实现主观报告和执行控制而存在[6]。
全局工作空间理论
(GWT)
起源于人工智能中的“黑板”架构,黑板是一种中央资源库,各种专用处理器通过它共享和接收信息。第一个GWT[47]是在认知层面上构建的,它提出,有意识的心智状态是那些“全局可用”的状态,能被各种认知过程利用,包括注意力、评估、记忆和口头报告。GWT的核心主张是,信息能够被各式各样的作为信息消费者的认知系统所利用,这种可利用性构成了意识体验
(图 2)
。
这一基本主张后来发展成了神经理论——通常被称为“全局神经元工作空间理论”——根据该理论,当感觉信息在神经元工作空间内“广播”时,感觉信息可以获得意识,该工作空间在解剖学上广泛存在于高级联合皮质内,特别是
(但也不只是)
前额叶[48, 49]。对全局工作空间的访问需要通过非线性网络“点火”实现,其中的循环处理过程放大并维持神经元表征[50]。与元表征相比,对点火和广播的强调是GWT与HOT方法的差异之一。
与HOT类似,GWT关注意识产生的原因,很少关注不同意识体验之间的差异
(除了[51]等)
。回到双目竞争实验,GWT旨在解释为什么在特定时刻,对应于“房子”的心智状态有意识
(而对应于“人脸”的心智状态没有意识)
,但并不直接解释看到房子和看到人脸的主观体验差异。
GWT在意识体验的特征问题上相对沉默,但与此同时更关注意识的功能属性。事实上,GWT经常作为“意识通达”[49]的明确解释;也就是说,它能解释为什么某些表征可以
(而其它表征不能)
被各式各样的作为信息消费者的认知系统灵活使用。GWT赋予意识的核心功能是,意识状态能够以灵活的、语境相关的方式指导认知和行为。GWT还清楚地说明了意识与其它认知过程的关系,例如注意力和工作记忆。注意力对特定信号进行选择和放大,使它们进入工作空间
(因此是有意识的)
;而意识和工作记忆也密切相关,因为被注意到的工作记忆内容是有意识的,它们通过全局工作空间进行广播[49]。
GWT根据工作空间功能完整性的变化来解释意识的全局状态的变化。在神经活动上,意识的全局性丧失有两个方面的反映。一方面是位于额叶与顶叶的,被认为是全局工作空间中的“枢纽”节点的区域,它们的功能连接或动态连接受损[52]。另一方面是功能连接越来越倾向于直接反映潜在的结构连接模式[53-55]。
GWT引出的一个重要问题是,工作空间需要具备哪些条件才能具有“全局”性质[25, 56]。是工作空间所广播的消费者认知系统的数量
(和类型)
更重要?还是工作空间内发生的广播类型更重要?还是这两个因素都与“全局工作空间”有关?如果我们想知道 GWT能对婴儿、脑损伤个体、接受过裂脑手术的人、非人类动物和人工智能系统的意识做出什么预测,就需要回答这些问题。
图2:全局工作空间理论。GWT的核心主张是,心智状态在全局工作空间内广播时具有意识,额叶与顶叶区域的神经网络在全局工作空间中扮演着中心枢纽般的角色。当局域处理系统(例如感觉区域)被点火时,其中的活动会暂时性地具有对工作空间的“可移动性”[155]。对GWT的实验证据支持包括,将意识与点火的神经元特征信号,或长程信息共享的神经元特征信号相关联的研究[48, 49, 53, 101]。在外界刺激发生约200-300ms之后,对应于有意识状态或无意识状态的试次,前部皮层区域的神经活动具有差异,这种差异被认为是“点火”的神经元特征信号。这类实验包括“无报告范式”实验[111] (另见[156])。这种研究最近已推广到解码领域。例如,刺激后约300ms的神经活动模式能被用来预测主观报告,而且这种方法可在不同感知模态间泛化[119]。有意识或无意识的内容的长程信息传递特征已经使用一系列方法进行了鉴定[49, 102]。与高阶理论一样,GWT受到前部区域可能参与行为报告而不是意识本身的证据的挑战。
整合信息论
(IIT)
的出发点与HOT或GWT非常不同——它提出了一种数学方法来描述现象学的特征。该理论先提出了关于意识体验的现象学特征的公理
(即,不证自明的、适用于所有可能形式的意识的属性)
,然后从这些公理推导出任何意识的物理底层所必须满足的属性。接着,IIT提出,将这些属性实例化的物理系统,必然也将意识实例化[57-60]
(见图3)
。具体来说,
IIT提出,应该将意识理解为“因果力量”
(cause-effect power)
,与物理系统产生的整合信息
(integrated information)
的不可化约的最大值相关
。反过来,整合信息与信息理论上的数量Φ有关,它衡量的是——广义上——一个系统作为一个整体
(而不是独立考虑的各部分)
,产生多少信息。在IIT中,意识是一个系统的内在的、基本的属性,它既由组成该系统的因果机制的性质决定,也由这些机制的状态决定[60]。
与HOT和GWT相反,IIT主要将意识和后部皮层区域
(所谓的“后部热区”,包括顶叶、颞叶和枕叶区域)
联系起来。部分原因是,据说,这些区域表现出的神经解剖学特性,很适合产生高层次的整合信息[59]。GWT和HOT
(在功能层面)
将意识与皮层信息处理的各个方面联系起来。与它们不同,IIT并不是指“信息处理”本身,而是将意识与一个系统的内在因果结构
(即一个系统影响自身的因果能力)
的属性联系起来。根据IIT,任何能产生最大值非零的
(不可化约的)
整合信息的系统,至少在某种程度上,都是有意识的。因此,IIT似乎意味着,有意识的非生物系统已经存在[61]。
IIT是相当全面的理论,对意识的全局状态和局部状态都提供了说明 [59]
(见图3)
。全局状态与系统产生的不可化约的整合信息量有关,用Φ来衡量。因此,IIT赞成用单维概念来把握全局状态,因为它把一个有机体的意识水平等同于它的Φ值。而局部状态的体验特征,可以用“概念结构”
(conceptual structures)
来理解,IIT将其视为高维空间中的“形状”,由系统的机械性因果结构所规定。这些形状产生了
(或者说等同于)
特定种类的现象特征。例如,视觉体验的空间性质,与早期视觉皮层中的网状机制所规定的因果结构有关[62]。意识的全局统一性是从整合信息的整合角度来解释的——整体产生的信息超过了各个部分产生的信息。最后,当且仅当内容被纳入一个因果“复合体”中,内容才是有意识的
(否则则是无意识的)
。这儿的复合体是物理系统的一个子集,支撑了最大的不可化约的整合信息。
图3:整合信息论。整合信息论(IIT)的核心主张是,意识与物理系统的因果结构是相同的,规定了不可化约的整合信息的最大值。意识的内容与因果结构的形式有关,而意识的水平则与因果结构的不可化约性有关,可用数字Φ来衡量[59]。在解剖学上,IIT与后部皮层的“热区”有关。要对这一核心主张进行实证评估很有挑战性,主要是因为,对Φ的测量是不可行的(除了对某些简单的模型系统)。目前,人们已经开发了各种Φ的替代指标[157],有的指标看起来很有前景。其中,最令人瞩目的是扰动复杂指数(perturbational complexity index,PCI),它测量的是大脑对经颅磁刺激的反应的算法复杂度(Lempel-Ziv)[158]。重要的是,PCI,在跟踪有神经系统损伤的病人的全局意识状态方面,具有诊断和预后价值[158]。然而,PCI并不等同于Φ,而且PCI值与全局意识状态之间的相关性与其它意识理论并不矛盾。一些心理物理学研究间接支持了IIT,证据表明,视觉皮层内侧向连接强度的局部变化,可以改变视觉空间的结构[116],而全局状态的变化,则与后部皮层区域功能多样性和整合能力的降低有关[159]。不过,有证据表明,前部皮层区域的活动是知觉意识所必须的,这将对IIT构成挑战。
回到双目竞争的例子,IIT解释了为什么受试者报告说看到了一栋房子
(而不是一张脸)
。IIT所主张的假说是,受试者的报告所依据的情结,与对应于内容“房子”
(而不是内容“脸”)
的概念结构有关。而且,IIT用对应概念结构的“形状”,来解释看到房子和看到脸这两种体验的区别。
虽然IIT对意识的各个方面提供了比大多数ToC更全面的处理,但它对意识和心智的其它方面
(如注意力、学习和记忆)
的关系说得比较少,而且也没有关注意识的具身性
(embodiment)
和环境嵌入性
(environmental embeddedness)(后两者也是HOT和GWT的挑战)。
尽管如此,IIT理论家们已经开始解决其中的一些挑战。例如,他们开发了“匹配复杂度”的测量方法,可以跟踪智能体和其环境之间的共享信息;制定了基于智能体的模型,并发现,能够有效地与周围环境接触的智能体,会表现出更多的整合信息[62-64]。
最后,我们考虑两种理解意识的整体路径,它们强调自上而下的信号在塑造和促成意识知觉方面的重要性。第一类——复馈理论
(re-entry theories)
——本身就是一种ToC,将有意识的知觉与自上而下的
(循环的、复馈的)
信号联系起来[65, 66]。第二类——预测处理理论
(predictive processing theories)
——本身不是ToC,但是是对大脑
(和身体)
功能的更一般的描述,可以用来解释和预测意识的属性[67]。
复馈理论的动机是,神经生理学揭示了自上而下信号对有意识的知觉
(通常是视觉)
的重要性
(例子见参考文献68-70)
。在一个著名的复馈理论——局部循环理论
(local recurrency theory)
中,Lamme认为,在知觉皮层内的局部循环或复馈,足以产生意识
(前提是其它有利因素具有完整性,比如脑干的唤醒)
。但可能需要顶叶和额叶区域来对知觉体验的内容进行报告,或利用它们进行推理和决策[65,71]
(图4)
。
图4:复馈/预测处理理论。复馈理论和预测处理的核心主张是,有意识的心理状态,与自上而下的信号传递(复馈;粗箭头)有关;对于预测处理来说,这些信号传递的,是对感觉信号原因的预测(细箭头表示自下而上的预测误差);因此,对预测误差的不断优化,近似于贝叶斯推理。在大多数预测处理理论中,意识的内容是由自上而下的预测内容所指定的。支持这些理论的证据,来自于一些将自上而下的信号与知觉体验联系起来的研究[68-70, 160]。大量的研究进一步支持了预测处理理论,证据表明,预期(expectation)塑造了意识知觉的内容与速度[161-163],其中,有一些研究将其与自上而下的信号传递直接联系起来[160]。不过,如果有证据表明,自上而下的信号传递或预测处理,会在没有意识的情况下发生,或者这些过程的变化不影响意识状态,那么这些理论就会受到挑战。
广义上讲,预测处理理论有两个动机。一个动机是把感知问题看做是对感觉信号的原因的推断问题[72,73]。另一个动机——以自由能原理
(free energy principle)
[74]为例——强调在控制和调节方面的基本约束,这些约束适用于所有随着时间推移,能保持其组织的系统[75-77]
(但也参见文献78)
。两者都导致了这样一个概念:
通过(通常是自上而下的)知觉预测和(通常是自下而上的)预测误差的相互交流
[80]
(不过参见[81])
,
大脑实施了一个近似于贝叶斯推理的“预测误差最小化过程
”
[79]。预测处理的一些表达方式,如主动推理
(active inference)
,增加了一个概念:最小化感官预测误差,不仅可以通过更新预测,还可以通过执行行动,从而控制预测[82,83]。
虽然预测处理理论不是作为ToC产生的,但有人认为,它们可以在神经机制和现象学属性之间,提供系统性的关联[67]。这里的“系统性”指的是在理论的指导下,具有解释力,而不是像经典NCC方法那样,仅仅提供经验性的相关关系。从这个角度看,预测处理理论满足了我们前面概述的ToC的许多要求。不过,最好把它认为是意识科学的理论,而不是意识理论本身,因为就“预测处理和意识到底是什么关系”的问题还有许多争执[84,85]。
预测处理理论,通常以自上而下的知觉预测的内容,来处理局部意识状态[73, 79, 86, 87]。不严格地说,知觉的内容是由大脑对其感官的原因的“最佳猜测”给出的。局部状态的体验特征,是由起作用的知觉预测的性质规定的。例如,视觉中的“客体”现象学,可以由对行动的感觉后果的条件性预测来解释[87,88],而情绪状态的现象学,可以由对内感受的预测在调节有机体的生理状况中的作用来解释[89,90]。情感的例子突出表明,预测处理理论,比起本文讨论的其它理论,更多地涉及了关于有意识自我的问题[13, 77, 91]。
预测处理可以解释有意识和无意识状态之间的区别,取决于在感知推理的过程中,一个心理状态是否是当前“最佳猜测”
(或最佳后验)
的一部分。在双眼竞争的例子中,预测处理设想了两个相互竞争的知觉假设
(最佳猜测)
,其中一个假设“获胜”时,相应的知觉占据主导地位。此时,来自另一个假设的感觉信号作为预测误差不断积累,最终导致知觉的转变。与此同时,以前占优势的最佳猜测所解释的感觉信号,成为了无法解释的错误预测的来源。就这样循环往复……[92, 93]。
(至于房子和脸之间在体验上的差别,如上所述,可以由相应的知觉预测的属性来解释。)
在那些强调主动推理的预测处理理论变体中,只有由行为导致的知觉信念变化,才会引起意识内容的变化[76, 94]。
(行动可以是明显的,比如眼球的扫动,也可以是隐蔽的,比如注意力焦点的转移。)
预测处理理论一般不涉及意识的整体状态,但这些理论要解释整体状态的区别的话,可以很自然地诉诸相关预测过程的完整性[95],就像HOT理论可以诉诸相关元表征机制的完整性。
至于意识的功能层面,复馈/预测处理理论都对意识和注意力之间的关系进行了明确的区分。在局部循环理论中,注意力为感觉信号提供了一个选择性的增强
(正如在GWT中一样)
,从而使它们到达前额叶和顶叶区域,参与意识的访问[71]。在预测处理中,注意力与“精确度加权”
(precision weighting)
的过程有关。这个过程调制了感觉信号的估计精度
(estimated precision)
,直观来说,其方式相当于改变这些信息的信噪比或“增益”[74, 96]。而在主动推理中,如前所述,注意力抽样可能是意识内容变化的必要条件[76, 94]。