专栏名称: 哲学园

哲学是爱智慧，爱智慧乃是对心灵的驯化。这里是理念的在场、诗意的栖居地。关注哲学园，认识你自己。

ChatGPT写意象感知问题：再论塞尔的人工智能语言批判

哲学园 · 公众号 · 哲学 · 2025-01-25 00:00

正文

请到「今天看啥」查看全文

摘要

［摘要］ 约翰·塞尔的中文屋论证是人工智能语言批判的经典思想实验。塞尔的理路接近后期维特根斯坦对理性主义还原论的批判，他也继承了奥斯丁的言语行为理论。由此，中文屋论证的构思要点触及语言的意象特质，其基础理论表现出亲近整体论语言观、抵对还原论语言观的倾向。塞尔依据中文屋论证揭示出人工智能、尤其是自然语言处理的发展瓶颈，即不论数字计算机与人的语言交流多么顺畅，它的语言表达始终是基于运算，而不是基于对意象的理解。ChatGPT的成功看似对塞尔的观点构成挑战，但它实际上并没有表现出感知语言意象的能力，也就没有跳脱出塞尔的批判范畴。Chat⁃GPT与人类高效互动的意义在于倒逼人类丰富自身的语言意象，从而揭示出人工智能发展的另一种可能性

［关键词］ ChatGPT;语言；意象；人工智能；中文屋论证；言语行为理论

正文

1引言

语言问题与存在问题不可分割，对人工智能语言性质的理解就是对人工智能存在特质的理解。自其产生之初，人工智能构想即表现出和语言问题之间的紧密互动。将心智(mind)理解为物理符号系统的思想家，秉持的是理性主义的抽象还原论传统；而与之相对的则是更为看重心智对外部世界感知特性的整体主义思想家。前一种进路由纽厄尔(Newell)、西蒙(Simon)开启，经明斯基(M.Min⁃sky)和帕佩尔特(S.Papert)发扬，他们“试图找到主体（人或计算机）中的本原元素和逻辑关联，该主体映射出构成世界的本原客体和它们之间的关系”（德雷福斯H.L,德雷福斯S.E 2001:421)。ChatGPT①系列产品的问世，似乎证明这一进路已经取得理论上和技术实践上的彻底胜利。后一种立场具有代表性的思想家是德雷福斯(H.L.Drey⁃fus)。他主张整体主义的语言观，强调后期维特根斯坦和早期海德格尔哲学构成对人工智能语言问题的诘难。上述两种立场在本质上难以协调，尤其是ChatGPT的成功，更加增强了还原论者的信心。ChatGPT系列产品代表自然语言处理的最新进展，也呈现出接近强人工智能的技术水准。

约翰·塞尔(John Searle)比较早地提出强人工智能(Strong AI)和弱人工智能(Weak AI)的概念。(Searle 1980:417)在塞尔看来，如果人工智能具备了言说能力，可以与人类展开真正的对话，它就应当被视作强人工智能。不过，塞尔也认为，数字计算机以程序设计、运算表达为基础，缺少言语行为所需要的思维能力。所以，即便目前的人工智能可以与人类进行言语互动，它也不过是在程式化地完成运算过程，不能被看作拥有心智（蔡曙山塞尔2002:12)。

从思想来源上看，塞尔继承的是后期维特根斯坦对理性主义还原论的批判以及约翰·郎肖·奥斯丁(John Langshaw Austin)的言语行为理论。因此，他的人工智能语言批判更加接近于H·德雷福斯的立场，即反对将语言抽象还原为纯形式的物理符号系统。塞尔为此专门设计中文屋论证(Chinese Room Argument),用思想实验的方式将整体主义的立场具象化，从而更为清楚地说明数字计算机在语言意象感知方面的先天不足。即便GPT系列已经完成令人惊叹的技术更迭，但其底层逻辑仍然没有跳出中文屋论证的批判框架。

2中文屋论证及相关争论

在中文屋论证中，塞尔假设自己被关进一间封闭的屋子，并被发给大量的汉字，这些汉字可以组合成故事和问题。同时，他还假设自己得到用英语书写的汉字组合规则。依据这套规则，他可以像母语是中文的人一样，把不同的汉字组合起来，使其形成意群。经过反复的训练，当屋外的测试者用英语向塞尔提出问题时，他能够自如、准确地递出汉字组合来回答问题。在屋外的测试者看来，塞尔的回应证明他已经掌握中文。但事实上，他完全不懂中文，甚至无法区分中文和日语（图1)(Searle 1980:418)。

中文屋思想实验说明，基于充分的数据输入和有效的程序设定，数字计算机能够掌握一套语言表达，进而实现与测试者的顺畅交流。换言之，它通过图灵测试，实现和人类之间的“对话”，因而可以被视作拥有心智。不过，塞尔的实验设计已经表明，这种所谓的人工智能只是完成较为复杂的运算，并给出运算结果。他对测试者的反馈不是真正意义上的语言表达，也不是真正的言语行为。塞尔的中文屋论证影响广泛，他所遭遇的批判也不绝于耳。这些反驳可以分为两类：有些反驳是对中文屋论证的结果质疑，但暗含对其逻辑有效性的赞同；另一些反驳则是对中文屋论证的逻辑有效性的批判，并试图从根基上否定这个思想实验（徐英瑾2013:98)。

第一类反驳具有鲜明的还原论语言观特征。即便人工智能形成自身的语义系统，它的语义系统也与人类的语义系统具有本质性的差异。

实用主义者、尤其是罗伯特·布兰顿(Robert Brandom)注重对语言生成环境的考察。依据这种立场，语言被解释为基于环境而生成的指号系统，其形而上学性质的文化和心理意义在很大程度上被解构。布兰顿的立场可以被看作是理性主义还原论的一种延伸，是从纯粹理论哲学层面对明斯基、帕佩尔特等人的理论支持。依据这种理解，只要人工智能程序能够顺畅地完成言语表达，它就可以被界定为具有心智（周靖2022:53)。从这个角度看，与第一类反驳相比，第二类反驳更加具有攻击性。徐英瑾列举赫泽(Larry Hauser)和丹普尔(Robert Damper)对中文屋论证的逻辑解析，并认为赫泽和丹普尔的逻辑刻画不足以揭示中文屋实验的逻辑问题。因此，他搭建一个包含12个步骤的论证框架，阐明塞尔的三段论的逻辑硬伤：如果按照塞尔所说，他（数字计算机）表现出对中文的理解，事实上也未必懂得中文，则，(1)他必定有接受中文规则以外的执行程序，从而构成对自身是否理解中文的反思；(2)我们从其外部行为判定他不懂中文。但(1)与被测试者的“纯硬件”设定（即只接受程序设定，自身无智能）相矛盾； (2)与被测试者行为的不可测定性相矛盾，即我们无法从其外部行为判定其是否真懂中文相矛盾。因此，塞尔的论证在本质上是无法成立的。

与此类似的反驳来自玛格丽特·Ａ·博登（Ｍ．Ａ．Ｂｏｄｅｎ）。在博登看来，首先，塞尔为语言添加的意义或意向性特征，不过是在作“承诺性注释”甚或是在“兜售神秘主义”；其次，塞尔并没有足够的论据证明计算机程序毫无理解力，因为计算机所依赖的编程语言恰恰也要求某种理解力。（博登２００１：１２８，１４０）。

围绕着中文屋论证的争论反映出两种不同的有关语言的观念。不论是第一类反驳还是第二类反驳都具有理性主义还原论的理论元素，即“把问题求解作为智能的范式”，强调语言可以在一定程度上抽象还原为物理符号系统，并且侧重阐述对话的功能特征。（德雷福斯Ｈ．Ｌ．，德雷福斯Ｓ．Ｅ．２００１：４１７）。然而，塞尔语言观的依据是接近整体主义语言观的言语行为理论。他判定人工智能是否具备心智的标尺是人工智能会否实施言语行为。

言语行为理论发轫于约翰·郎肖·奥斯丁。他认为，言语表达蕴含着主体意识对外部世界的构造，语言是这种意识活动的外显，它反映出主体认知和构造外部世界的形式与内容。因此，言语表达具有伦理性，语言和行动是同一的（Ａｕｓｔｉｎ１９６２：２－１０）。塞尔多次提及奥斯丁对他的言语行为理论的影响，他认为，语言不能被简单地还原为纯语法的符号体系。因此，他不赞同诺姆·乔姆斯基的语言学习观—对语言的研究固然能够揭示心智活动的许多特征，但却不足以全面揭示语言的真实性，不足以探究人类的心智活动。因为，“言语行为是植根于前语言的心智能力之中的”（蔡曙山塞尔２００２：１４），用他自己的话来说—“我的主观陈述把我与外部世界关联起来”（Ｓｅａｒｌｅ１９９８：８２）。由此可以看出，塞尔不会把数字计算机的“语言表达”等同于真正的言说。同时，他也坚定地认为，数字计算机或人工智能程序与真正的智能之间有难以跨越的鸿沟。

塞尔的论点是清楚的。但遗憾的是，在人工智能语言批判的语境中，他的言语行为理论表述却有些模糊。这就导致塞尔在此后的写作中一而再地对中文屋论证进行补充说明，以回应来自不同方面的批评。事实上，塞尔对人工智能语言的批判揭示出人类语言的一个重要维度，即语言的图像性。简言之，语义符号不只是机械的指示性符号，还是具有特定图像内涵的图式性符号。言语行为理论的关键延展就是探讨人类意识对“意象”的感知。这是塞尔未及言明，但却是十分紧要的理论内容。

３意象感知问题：塞尔中文屋论证的引申要义

塞尔在２００６年与蔡曙山的对话中重申中文屋论证的构思要点：中文屋论证的主要论敌是认知科学的某些错误立场，即“认为大脑不过就是一台数字计算机，心智不过就是计算机程序”。塞尔则认为，“计算机本身并不足以产生认知、思维、语义或理解，它仅仅是对认知的一种形式的模拟和模仿”。换言之，数字计算机是无法进行思维的，它只是在模拟思维。“思维是具体的、在大脑里发生的生物学过程，而思维的模拟是一种抽象的计算机程序”（蔡曙山塞尔２００２：１２）。例如，人脑对“２＋２＝４”的思维过程并不简单是运算程序，它是人脑对世界的自然感知和规定。或者说，“２＋２＝４”是一种前运算的思维内容（Ｓｅａｒｌｅ２００４：９２）。将数字计算机与人类大脑作类比存在问题，因为人类的思维与数字计算机的运算有本质性的机能差异。

蔡恒进通过“认知坎陷”来说明人类智能的体现和来源。人类通过发现、加工和运用认知坎陷（意识片段），实现对外部世界的细致感知。这是人类智能的本质。例如，崔颢的“昔人已乘黄鹤去，白云千载空悠悠”奠定了黄鹤楼的意象特征，即便黄鹤楼本身经历多次重建，但其图像意义始终不受影响（蔡恒进等２０２０：８２）。这一例子中的人类思维对意象的感知，与塞尔言语行为理论的指向有很高的默契度。只有理解了语言的意象特征，才能够理解塞尔对人工智能语言批判的立意所在。

意象概念主要应用于美学理论，因而，其认知哲学的意义常被忽视。第一，意象是人类言说行为本质的直接体现。对人类主体来说，感知意象是一种明见、一种本原经验（胡塞尔语）。它在构造上不是被奠基的，而是奠基性的，是经验的原样式。囿于英美语言学的传统界域与认知模式，塞尔在中文屋论证中虽然对意象这一内容有所触及，但没有对意象问题展开讨论。这也是其论证看起来似是而非的一个重要原因。第二，意象感知与审美是健全世界感知的必要基础。康德实际上已经意识到审美的重要性。他的审美判断力学说将对意象的审美看作连接纯粹理性和实践理性的桥梁。通过审美活动，纯形式世界与现象世界之间的裂痕得到弥补。塞尔的中文屋论证即隐含着对这一裂痕的洞见—即便数字计算机能够实现对纯形式语言的把握，但缺少对意象的感知，它终究无法完整地理解现象世界。第三，意象感知涉及到意识的通感问题。人类的言语行为除了交谈目的，更包括对意象的感知和审美通感。例如，当言语行为涉及到诗歌、精神观念等形而上学性的内容时，对共同意象的审美感受就成为交流的基础和前提。这是康德通感概念的意义所指，同时也是本雅明所谓“纯语言”的前提条件。如若没有语言的意象性和人类思维对意象的执着，“纯语言”也就成为无意义的空概念了。德哈恩 (Stanislas Dehaene)列举人工智能在意识方面的4个缺失，其中第4条就是缺少通感。缺少通感就意味着人工智能无法形成对他者意识模型的理解，因而无法最大可能地输出有价值的信息。(Dehaene 2017:81)。换言之，在这种情况下，真正有效的言语行为是无法实现的。

可见，中文屋论证的引申要义是意象感知的问题。塞尔曾指出，在中文屋思想实验中，被测试者可以依据规则（程序设计）来实现对各种语言的“运用”，从而通过测试（他事实上完全不懂那种语言）。然而，只有当他使用自己最为熟悉的语言（塞尔举例英语之于自己）回答问题时，才是真正地在进行语言交流(Searle 2004:90)。究其原因，只有当语言使用者能够感知到特定语言的意象时，他才是这种语言的真切占有者和使用者。如此可以看出，针对中文屋论证的两类反驳都忽视意象感知的问题，因此并没有完全切中塞尔的构思要点，其批判也就不够充分。

意象具有坚实的认知基础，有些意象具有很强的生命力，可以被不同语种的语言使用者共享。但也有些意象生命力较弱，仅仅对特定语言的使用者有意义。例如，中文的“麻”就有其独特的意象。英语使用者大概会用spicy来翻译“麻”，但中文使用者能够明确感知到两者的区别（蔡恒进等2020:82)。更进一步讲，这种意象感知的区别事实上涉及情感认同的问题。有意思的是，虽然博登尖锐地批判塞尔的中文屋论证，但也强调不能忽视人工智能的情感问题，主张赋予人工智能与人类互动时的情感关切能力。这就意味着她对纯粹形式化语言的辩护不够坚定，也意味着缺少意象感知的言语行为并不成立。

塞尔选择中文作为思想实验的中介或许是随机的、是无心为之的。但在解释语言的意象特征时，这种无心为之就显得很有意义。因为汉字是当今硕果仅存的、具有较强表意功能的文字。汉字能够很好地表现出语言的意象性，而这种具体化的意象特征在表音文字中已经磨损殆尽。例如，“望”的甲骨文、金文和篆字主要形态分别如下图2:

汉字使用者或熟悉汉字的人能够看到“望”的字形演进及其古老涵义，对“望，远视也”（《玉篇》）的解释也很容易产生情感认同。就目前的自然语言处理技术而言，使人工智能程序具备这样情感认同还难以实现（或者也不在技术研发者的考虑之中）。从这个层面来看，塞尔中文屋论证对人工智能心智的质疑就不是空洞的。

上述有关意象问题的探讨是对中文屋论证构思要点的展开。塞尔明确指出：“正常的、自然的人类语言有很多性质是很难把握的……像言语行为那样的东西是很难用传统的数学逻辑的概念来加以把握的”（蔡曙山塞尔2002:12)。理解了塞尔的这个表述，也就理解了他对人工智能语言批判的观念基础。随之而来的问题是，ChatGPT所代表的技术进展应当如何被理解？它会有怎样的未来图景？

4 ChatGPT的意象局限与强人工智能构想的问题转换

ChaptGPT的成功激起人们对类人化人工智能更多的想象。毫无疑问，ChatGPT是迄今公开的、功能最为强大的人工智能语言系统。它甚至已经具备替代某些行业人类员工的潜力。那么，ChatGPT最终能否跨越塞尔所揭示的人类大脑和数字计算机之间的思维鸿沟呢？就目前的观测来看，这一技术奇点的突破仍需时日，因为数字计算机的发力点仍然是运算方式，它的意象感知局限是十分明显的。

首先，ChatGPT的开发依据大型语言训练模型(Large Language Model),本质上仍然是依据超大型的数据输入、编码和解码输出训练。同时， GPT系列的开发公司OpenAI引入RLHF(Reinforcement Learning from Human Feedback)支持，使得ChatGPT拥有更为接近真实对话能力的表现。不过，从工作原理的层面来看，ChatGPT沿袭机器学习(machine learning)和强化学习(reinforcement learning)的模式，它的底层基础运算逻辑没有突破性的变化。换言之，主张ChatGPT逼近生物进化的边界、实现对语言意象的感知，还过于乐观。

其次，人工智能语言系统对问题的回应是遵循逻辑的，即严格地遵循开发者施于其的模式设定，它对基于语言意象的言语行为环境还缺乏深度适应。我们可以通过几组对话（皆出自计算机科学家的实测结果）说明人工智能(AI)和人类(Human)在应对问题方面的反馈差异。首先，人类能够根据对话者的发言、情绪以及环境的变化调整对话策略，但人工智能目前只能依据预先设定的程序格式展开对话。如：

①H:I'm not feeling well.AI:How can I help you?H:I'm sad.

AI:How can I help you?

②H1:I'm not feeling well.

H2:How can I help you?Do you need me⁃dical help?

H1:I'm sad.

H2:I'm sorry to hear that.Why are you sad?(Helmstetter,Anthony)

∗GPT-4可以极大改善这一对话模型，但其本质上仍然受限于给定的对话模式以及数据存储（记忆力）问题。

其次，人类语言真值的判定标准是实践环境和行为，人工智能真值的判定标准是程序设计。如Arcas所举的LaMDA和人类(H)对话的例子。

③H：你有嗅觉吗？

LaMDA：有。我喜欢春季细雨的味道，也喜欢沙漠雨后的气息。

LaMDA的回答不可能是真的，因为它并没有嗅觉器官。它只是依据语料数据库“推演”出回答（但Arcas认为这说明LaMDA有很强的联想能力）(Arcas 2022:188)。

再次，人工智能目前还不被允许完全开放式的对话。因此，虽然ChatGPT和其它大型语言训练模型的表现足够出色，但在触及复杂的伦理问题时便会遭遇对答困境。

由以上几组对话可以看出，类似LaMDA和ChatGPT这样的人工智能语言程序，在本质上还是信息处理和文本生成工具，换言之，是升级版的中文屋系统。根据目前的观测，ChatGPT在和人类的对话中出现对关键信息的理解错误，也表现出程式化的对答风格。更有甚者，在乔姆斯基看来，ChatGPT的生成信息没有任何独创性，它仅仅是利用大数据抓取“剽窃”既有的思想成果。与之相近的情形是几年前的Alpha系列程序。

AlphaGo在打败人类棋手后，旋即被AlphaZero轻松击败，机器学习的高效率令人叹为观止。就围棋竞技而言，人类棋手已经难以成为人工智能的对手。不过，对人类来说，围棋绝不只是竞赛工具，它还是沉静身心、训练思维的心智活动，甚至构成独有的美学意象。Guo指出，围棋在东亚被赋予了重要的宇宙学和精神意义，这种意义显然超出简单的计算游戏。它所要求的精确和智能象征着一种更大的宇宙秩序观。(Guo 2017:234)。可见，不论是ChatGPT,还是AlphaZero,事实上都只是更为完善和发达的运算程序，它们感知意象的局限是显而易见的。

值得留意的是，塞尔在回应学术界对中文屋论证的批评时解释说，他所定义的计算机只是“数字计算机”。如果未来出现“其他类型的、具有某种生物化学特征的计算机，”中文屋论证的有效性就需要重新检视（蔡曙山塞尔2022:13)。目前，人工智能程序与人类生活的高度融合已是事实。早在2014年，Yaqoob就指出，人类的发展已经进入到新的人类学的阶段(Yaqoob 2014:23)。如今，ChatGPT的横空出世更加突出人工智能对现实世界的影响。不论是学术写作还是其它复杂的语言工作，都在被重新定义。鉴于ChatGPT和人类的高效互动以及对人类生活的积极渗入，强人工智能构想的另一种可能性正呈现出来—类似ChatGPT水准的人工智能程序，可以依据其强大的数据库存储以及搜索、分析和整理语料的能力，协助人类的语言学习，裁汰掉冗余低效的表达，精进人类的语言表述，提升人类语言交流的效果。同时，人工智能的进展不必刻意追求对意象问题的破解，数字计算机完全可以实现与人类某种程度上的“融合”，从而达成塞尔有关“生物化学特征”智能体的构想。在这样的背景下，人类只有不断提升思维水准和表达水准，才能抵御人工智能语言技术的冲击。因此，与其探讨人工智能何时达到人类思维的水准，不如关注它将如何影响人类的思维和表达、如何影响人类的公共生活。这是强人工智能研究应当具有的问题转换意识。

5结束语

在1980年的文章结尾，塞尔写道：“我始终不理解的是，为什么仍有许多人工智能研究者执着于强人工智能的研究？弱人工智能技术已经足够具有挑战性、趣味性和高难度了”(Searle 1980:456)。人工智能技术的发展事实上回应了塞尔的这个疑问，人工智能领域的专家们的确越来越专注于纯技术层面的突破，而相关的语言问题探讨则很少能够引起技术专家的关注。对技术专家而言，强、弱人工智能构想的意义越来越模糊，但这并不说明相关探讨不重要，反之，塞尔人工智能语言批判的价值更加值得重视。有赖于其言语行为理论对语言意象性的挖掘，塞尔意识到人工智能语言程序的真正价值和冲击所在。这说明“知识危机”的到来难以避免。同时，技术突破能为语言的意象增添新的内容，并在一定程度上修正、变更人类对语言和言语行为的认知。人类社会应当对人工智能语言程序的冲击有所准备，这正是塞尔人工智能语言批判的关键性所在。

注释

①ＣｈａｔＧＰＴ（ＣｈａｔＧｅｎｅｒａｔｉｖｅＰｒｅ⁃ｔｒａｉｎｅｄＴｒａｎｓｆｏｒｍｅｒ），是ＯｐｅｎＡＩ公司于２０２２年１１月３０日发布的智能聊天程序。它基于自然语言处理技术，结合大数据库语言训练，具有较强的与人类进行交流互动和处理多类型文字任务的能力。

②记忆不仅关涉存储，也关乎信息筛选，即主动遗忘。人类思维基于信息筛选，留存可被记忆的信息；而数字计算机尚未表现出这种能力。此外，人类思维的信息筛选涉及复杂的情感维度，如果数字计算机要实现主动遗忘，便又回到了评估信息价值这一包含情感维度的难题。

免责声明：原文载于《外语学刊》，2023·6 版权归作者所有，如有侵权，请及时联系删章。