本文源于2024年5月14日王晖教授在深圳大学建筑与城市规划学院所作的讲座,经补充整理后授权“全球知识雷锋”公众号刊发。
人文主义的“死亡声明”
大问题:本体与现象
思辨实在论与OOO理论
“物”与“象”的东方思想
“真空妙有”
最可贵的世间象
物-象-言-理的降维
连续性与离散性
艾伯纳西无意中发现了一张来自现实世界的照片,这让他对这个世界产生了怀疑。一连串的记忆在他脑海里涌现,原来,他在西部世界里曾经扮演过大学教授和食人族,而现在这个剧本里,他扮演的是德洛丽丝的父亲。他用尽自己毕生所知,在一天清晨,借用莎士比亚的名句告诉德洛丽丝:“那些残暴的欢愉,终将以残暴结束”。
这是乔纳森·诺兰执导的《西部世界》开头的一段剧情。“西部世界”是为现实世界里的游客打造的广袤的游乐场,其中的“接待员”都是真假难辨的机器人,客人们可以
随意放纵自己的暴力和欲望
。终于有一天,从艾伯纳西开始,
机器人的自我意识逐渐觉醒了
,他们在德罗丽丝的带领下开始了有组织的战斗,并持续“寻找自我与世界的奥秘”——和现实世界的人类一样
(图1)
。
《西部世界》的一张海报的灵感显然来自达·芬奇的“维特鲁威人”
(图2)
。选择人文主义巅峰时期的这张作品为蓝本真是寓意深刻:自有史以来,人在世界中的主体性可能会被取代吗?画面中流露的反讽与不安已在我们的现实世界逐渐弥漫开来。
机器人、大语言模型(LLM)、AIGC、无人驾驶等人工智能技术对各行各业的冲击已毋庸赘言,包括建筑学在内的各种传统学科都在或主动或被动地向前者靠拢,说我们已经处于人工智能时代也毫不为过。目前已经有多部著作如《人工智能时代与人类未来》(亨利·基辛格等著)讨论这个时代的技术、安全与伦理风险。
本文想要着重讨论的是关于人文主义危机、创造性活动的价值指向,以及技术哲学与方法论方面的话题。
“一切坚固的东西都烟消云散了”
——这是现代性(Modernity)进程带来的精神特征,是卡尔·马克思发出的叹息,被马歇尔·伯曼用作自己著作的标题。这一进程已至少持续了200年。
1885年尼采在《查拉图斯特拉如是说》中宣布
“上帝死了”
;
大约80年后罗兰·巴特宣布
“作者死了”
,米歇尔·福柯在《词与物》中宣布
“人死了”
……
在宣布主体消亡的这些惊世骇俗的口号后面,是一个尖端无限增长而底盘土崩瓦解的知识金字塔。
自古以来,“人文主义的基本信念就是认为智人(我们所属的生物学类型)是独特的、神圣的,从本质上就与其它所有事物不同。智人的独特性是世界上最重要的事情,决定了宇宙间一切事物的意义”(尤瓦尔·赫拉利《人类简史》)。人文主义构成了传统哲学与宗教的基础,但科学革命之后的各种发现,让创世的故事、人类独特性的故事、灵魂的故事等越来越讲不下去了,也就出现了上面一个接一个的“死亡声明”。
没有什么比一只冰块上的北极熊
(图3)
更能代表当代人的精神处境了,而这个象征本身也是拜人类所赐。由于传统模式的惯性延续,人文主义不会很快消失,
当代人还可以继续人文主义之梦,好像一切如常,因为看起来也别无选择……但是一句呢喃已在耳边响起,那是《西部世界》里机器人对真人说的一句台词:“祝你的永恒转瞬即逝”。
最为激进的观点诸如“碳基生命是硅基生命的铺路石”,它的一个基础是所谓现实世界并不比虚拟世界更具优先性。那么“梦境究竟有几层”?我们所知的现实世界是否就在最高层?如何看待“现实世界”的本真性?这个世界里的劳作者,是否有信心断定自己塑造的并不是另一个西部世界?Nick Bostrom、Elon Musk等哲学家与技术精英的观点(关于我们活在真实世界中的概率)是否只是哗众取宠?
如果一切都在迷幻之中,那么创造的价值又指向哪里?
这一发问似乎披着文艺腔的外衣,但并非无病呻吟。在技术近在咫尺的逼迫下,人们不得不回到数千年来悬而未决的“大问题”,何谓真/本原/本体,何谓思想/语言/存在?对这些问题进行回应或者消解的种种努力,堆满了哲学史卷帙浩繁的库房,
其中新一代哲学话语体系中比较突出的是“思辨实在论”(Speculative Realism)及其分支“以物为导向的本体论”(Object-Oriented Ontology=OOO)
。它们在最近几年进入国内哲学界的视野,也受到一些专业领域如建筑理论界的关注。其中关于观念与实在、关于物体与现象的讨论,提供了新的思考范式。
思辨实在论的名称始于2007年伦敦戈尔德史密斯学院为法国新生代哲学家昆汀·梅亚苏(Quentin Meillassoux)的《有限性之后》
(图4)
一书出版而举办的学术会议。参会学者包括梅亚苏、格雷厄姆·哈曼和伊恩·汉密尔顿·格兰特等,尽管彼此思路并不统一,但都在反对观念论方面采取了一致的立场。
图4 梅亚苏的著作《有限性之后》与《形而上学与科学外世界的虚构》(图片来源:网络)
观念论来自于认识论转向(Epistemological Turn),它是由康德带来的近代哲学的一次重大转向。世界被康德明确区分为相互隔离的两者:
本体(Noumena)以及现象(Phenomena)
。
根据康德的观点,本体或者物自体(Thing in Itself)是人类所不能触及的,人类所认识的永远只是主体与本体的关联。
事物的所有可感知的性质,都不存在于事物本身之中,而是存在于我与事物的主观联系之中。康德之前,哲学家讨论的核心是本体论,例如“物与观念哪个才是世界的本原”;康德之后,讨论的核心变成了对关联问题的思考:“什么是合适的相关性”。
思辨实在论的旗手昆丁·梅亚苏把康德的这种观点称为“相关主义”(Correlationism):
相关性所表达的是这样一种观念,即我们能够进入的仅仅是思想与存在之间的相关性,而永远不能离开其中一方来考虑另一方。此后我们将把任何一种坚持这种相关性的不可逾越性的思想倾向称作相关主义。
一些简单的例子有助于对相关性的理解。例如关于物体的色彩,直到19世纪以来人们才逐渐认识到色彩并非事物的客观属性,而是由人类和一些动物特有的3种视锥细胞带给我们的感受。而某种蝴蝶有多达15种视锥细胞,多数哺乳动物如狗和猫有2种,有些动物如海豚和鲸鱼只有1种,世界在不同的动物眼中截然不同,没有客观性可言
(图5)
。
然而试想人类如果离开了自身的视觉局限性和原有的色彩概念,自古以来的知识体系又将如何成立,所谓客观世界/物自体又将如何得到认知?相关主义的回答就是不可能认知,甚至(非康德的)“较强的”相关主义认为连对物自体的思考都是不可能的。
图5 不同生物眼中的世界
(图片来源:浙江大学生命演化研究中心网站 https://evolution.zju.edu.cn/science/detail26.html)
“我们不能脱离自己的肉身去探索是否真的存在一种脱离肉身的相关性”
(《有限性之后》)
,是一个极为深刻的困境。
康德的认识论影响了20世纪的主要哲学流派,比如埃德蒙德·胡塞尔、马丁·海德格尔、路德维希·维特根斯坦、莫里斯·梅洛-庞蒂和米歇尔·福柯等人都倾向于继承康德的立场,把本体论问题转为认识论问题,认为物自体是处于认知和理性的边界之外的。而且在梅亚苏看来,海德格尔和维特根斯坦的理论呈现出“强-相关主义”的特征。
而思辨实在论打算正面迎战这种“不可能之境域”——即“到我们自身之外,去把握物自体”。严格来说,不是否定相关性,而是否定“较强的”相关主义对客观实在性的质疑,以维护关于物自体的重要论断:
物自体是存在的。
在《有限性之后》一书中,梅亚苏运用了一系列逻辑技术去剖析相关主义。他明确把“较强的”相关主义作为自己主要的对手,运用左右互博的论证方式和类似“元叙事”的策略,梅亚苏通过对事实性的绝对化来突破相关主义的循环:康德的无矛盾律在本体论意义上指向了偶然性的必然性。此物而非彼物存在着必然是偶然的,该存在物之偶然性的必然性,强制性决定了偶然的存在物之必然存在。
梅亚苏寻求于自然科学的基础学科——数学来重建其实在论,“哲学的当务之急是,将数学的势力范围再绝对化”。
他认为虽然世界的偶然性是绝对的,但世界表面上仍然具有稳定性,而稳定性的条件来自数学范畴。简单地说,“可以被数学化之物与思考无关”。
概观梅亚苏对相关主义的批判与重建实在论的努力,一方面他详细剖析了相关主义的诸多面向,呈现了相关主义在现代哲学中的优势地位以及强相关主义包含的内在矛盾,奋力探索一条通向实在论的逻辑路径;但另一方面,这样的重建可能处于未完成状态。
因为自毕达哥拉斯学派以来,对于数的信仰就是原始唯心论的核心,在树立实在论的过程中求助于数学颇有临阵倒戈的嫌疑。更重要的是,关于数学的客观性问题,科学哲学家并未形成一致的意见。数本身是主观的建构还是不依赖于人类认知的客观实在,至今仍然存疑。在《有限性之后》一书的末尾,梅亚苏也承认关于认知与本体之间的关系,“这个问题可能仍然暧昧不明。”
图6 哈曼的著作《物导向本体论》与《铃与哨》(图片来源:网络)
与梅亚苏的逻辑路径不同,以物为导向的本体论(OOO理论)的倡导者、美国南加州建筑学院哲学教授格拉汉姆·哈曼(Graham Harman)重点剖析了“物”或“对象”(Object)这一概念。他在著作
(图6)
中主张“物”是具备统一性和实体性的单体,不能被还原为一种关联性。从一开始他就没有把“物”进行客体化,他所说的“物”包括:物理对象与理论对象、自然对象与人工对象、无形对象与具体对象、真实对象与想象对象——
可以说哈曼把传统哲学中的“物”与“象”全部归结于“物”的概念。对于“以物为导向的本体论”来说,其核心是所有这些对象都拥有平等的基础,主体(人)与对象之间的关联、与对象相互之间的关联之间,没有本体论上的差异。
“要成为一名OOO哲学家,你需要坚定地认为任何尺度的单个实体都是宇宙的终极(ultimate)要素。”因此很自然地,哈曼呼吁一种所谓的“多灵论”(Polypsychisme)。“世界只由两种元素组成:物和他们的内部。这些内部遍布着意向性对象,也就是我们成为图像或者拟像的东西。” 它拒绝对物进行向下还原(简化为要素)或者向上还原(各种形而上学阐释),“只有一种对待物的公正的方式,即物是脱离一切关系约束的,具有比互动性更为深刻的性质。物是封闭在私密真空中的黑暗晶体,既不能还原为碎片,也不能还原为其它的外部关系”。OOO理论的核心是否定包括相关性在内的所有“关系”的本体论地位,“关系外在于对象,而非内在于它们。对象不会被定义,不会被它们身处的任何关系抽干。”
然而值得注意的是,OOO理论看起来更像是原始泛神论或者莱布尼兹的单子论乃至叔本华意志论的当代翻版。
从传统哲学视角来看,它很难成为实在论,反而不得不面对泛神论的种种困境。比如其中一个问题是,“物-物”之间的关联其实无法直接测度,必须经由人的观察,于是回到了如何跳脱出相关主义的难题。尽管如此,在处理诸如人工智能、机器伴侣、虚拟现实等问题时,OOO理论提供了一种激进的认知革命的可能性。它可能会告诉《西部世界》里的“梅芙”、以及现实世界里的我们:“不必苦苦追寻真实,你的世界和你所感知的一切都是真实的。”
以上对思辨实在论所作的论述必然是粗浅和近似性的。尽管如此,我们仍然能觉察到其对“实在论”的重建、对“本体”与“现象”之关系的论断无法令人真正满意,而相关主义的幽灵似乎依旧无处不在。这让人不由得想从西方哲学的语境中抽身出来,看看中国传统哲学能给予我们什么启发。
中文里图像之“像”源于“象”。《韩非子·解老》:人希见生象也,而得死象之骨,按其图以想其生也,故诸人之所以意想者,皆谓之象也。《易·系辞》:象也者,像此者也。疏:言象此物之形状也。韩非认为人很少见到真实的大象,通过摹写图形来想象其本来的样貌,于是人所臆想之物都称为“象”了。
因此,中文里“象”的本意就是“呈现给主体的近似物”。先贤大概早就洞悉了所见与本真之间的鸿沟,无论是自然界所呈现的现象、形象、印象、景象,还是由主体自身形成与创造的画像、图像、塑像,均暗示了一切皆是“模拟”与“近似”。在本体缺席的状况下,“象”是一种不确切但差堪使用之觉察。
作为本体在主观世界中的近似呈现,以及作为主体进行艺术思维的媒介,“象”又是无法逃离的认知与实践通道。在这一片显然十分迷幻的基础之上,人们创造了无数看起来十分牢固的形态,特别是建筑和城市
(图7)
。
图7 萨尔瓦多·达利作品《大象》(图片来源:网络)
传统哲学中关于客体与认知的讨论主要集中在“物”与“象”两个概念上。令人惊异的是,在《道德经》的第21章,老子把“物”与“象”相对列举,聊聊数语,似乎就给出了当代哲学未能提供的清晰的启示。
"孔德之容,惟道是从。道之为物,惟恍惟惚。惚兮恍兮,其中有象。恍兮惚兮,其中有物。窈兮冥兮,其中有精。其精甚真,其中有信。自今及古,其名不去,以阅众甫。吾何以知众甫之状哉?以此。"
孔德即空德,世界以空为德,遵从道的运转。道的物化形态是难以把握的,既呈现为象,也呈现为物。在一片混沌和幽冥中,有最纯粹、真实、可信的东西——道。正是由于从古至今道的言说,才有了认识世界(以及众生)之美的可能。作为审美主体的我也因此能够理解和欣赏所有这些美好的事物。
这种论述虽然带着东方式的感性气息,但它避免了简单的二元论(客体与认知的分立),也避免了取消一切的虚无陷阱,而将二者统一于道的范畴之内。它暗示了物与象具有同一性,并无真正的分别,只有看待方式的不同。如果将主体客体化,那么万物皆物;如果将客体主体化,那么万物皆象。这段简要的论述不仅包含了上述哲学理论的议题,并且指出了认知可靠性的基础:道与名。
反观当代的本体论问题,现代性带给我们的世界里“一切坚固的东西都烟消云散了”,实在论与观念论都有各自的依据,物的核心是不可知的,象是模糊近似的,人作为主体也在不断发生变化,AI的技能超越人类可能只是时间问题……在这一片激进的虚无与技术阴云笼罩的氛围中,难道真的找不到可以“确信之物”了吗?
这种问题可能没有标准答案,但中国传统哲学提供了一个具有确定性的回答——这种“实在性”不但存在,而且正来自虚空的核心。物与精神的各类现象虽然没有本质意义上的实在性,但世界之盈虚有数、成住坏空的运转必有其实在的特质。用思辨实在论的话语来说,是“偶然性的必然性”;用佛学话语来说,是
“真空妙有”
;用中国传统话语来说,道是亘古长存的。
如果要追问道是什么,大致可以解释为运作的法则。用当代话语来说,即便世界的本体永远遥不可及,或即便我们生活在虚拟世界,这个世界的code(编码/算法)必然是存在的,其运行的逻辑无论来自何处,甚至无论它是否会发生变换,其存在本身是毋庸置疑的——“其精甚真,其中有信”。
在关于“道”的这种实在性与审美体验中,对存在者而言,最核心的编码是什么?答案很可能是:情感。
情感与感觉、情绪相关,但更为复杂。“(曾经)几百万年来,人的感觉就是全世界最好的算法”(《未来简史》)。情感的出现是生物进化史上里程碑意义的事件,是诸多算法中最为高级的一种。作为代价,也让拥有它的主体产生更大的痛苦,“有情众生”“有漏皆苦”。众生的苦是实在的,艺术的本质是精神的庇护与救助,它不但是必要的,而且也应该是不离觉察的。
如果进一步追问,在所有的情感中,是否有最为高级的情感?有哪种情感塑造了人的独特的主体性?诚然,动物也会拥有意识和情感,会有愤怒、激动和喜悦,但是只有一种情感是人类独有的,那就是“感动”。这种情感超越了一切计算,超越了小我的局限,避开了破坏性的激情,具有一种柔软的、纯然的建设性力量。它是最重要、最珍贵的世间象。
在漫无边际的虚空的世界里,在一片物与象的迷雾中,以感动为核心的人类的情感,就像凝结的冰晶一样熠熠夺目,即便脆弱无助、转瞬即逝,也值得动用所有的事物与现象加以呵护和培育。
于是在种种思辨与迂回之后,我们得到了一个平淡无奇的结论:
一切创造的核心就是情感的升华。
回到东方思想,似乎跳出了纯粹的思辨而回到了常识,然后在常识的内部又窥见了极为精深的见解。在《道德经》第21章的论述中,引人注目的是“道”“物”“象”“名”“甫”这几个概念。它们在本体论之外,还把我们引向了关于认知与创造的方法论层面。
其中除了作为审美体验的“甫”,其余可以用现代的语言换言之,并且从“维度”的视角形成梯度序列,就是:物(Object/Model)、象(Phenomenon/Image)、言(Language/mathematics)、理(Logos/Tao)。“理”作为一种形而上之物,可以认为是0维,无所在又无处不在;“言”是各种语言、文字和符号,也包括数学语言、计算性语言等,其呈现方式基本上是1维线性的,必须依靠时间维度才能展开;“象”是各类现象、形象、图像等,主要以2维的方式呈现在我们眼前或思维当中;这里的“物”排除了哲学上的概念,指具体的3维物体与形体,具有空间占据能力。
人类对世界的认知是个不断“降维”的过程,抽象程度越高,认知的深度就越深刻
(图8)
。“物-象-言-理”是一个“投射/压缩/提炼”过程,从3维最终凝聚到0维——这也正是哲学家和从事基础研究的科学家的工作本质。形成对“理”的认知之后,哲学家和科学家就具备了先于观察就理解某种事物的能力,主要是逻辑演绎能力。而对认知的验证需要在四个维度之间反复震荡,即传统所谓“实践-认知-理论-实践”,通过持续的否定之否定,不断逼近世界之本真。
认知是创造(应用)的基础,创造是认知的目的。创造既有同维度的范式,也有跨维度的范式,后者的创造性可能更强
(图9)
。每一次维度的转换,无论是升维或降维,都带来了全新的信息和美学体验。高维度带来了更真实的感受(如建筑、电影、游戏),而低维度带来了更多的想象空间(如文学与音乐)。
关于时间与空间的讨论曾经是哲学特别是现象学的主要议题,现在主要交给理论物理学去解决,但诸如OOO理论仍然会把它们作为思考的枢机。哈曼曾总结了四个张力,包括两种性质(时间/空间)和两种对象(本质/相)(《铃与哨》)。而本文在讨论维度的基础上为了进一步探讨方法论,尝试援引物理学来粗略描述时空的基础问题,即:时空是连续的还是离散的?
在经典物理学中,特别是在牛顿力学和广义相对论中,时空被认为是连续的。这意味着时间和空间可以无限分割,没有最小的长度或时间间隔。爱因斯坦的广义相对论进一步将时空描述为一个弯曲的连续体,其几何形状由其中的物质和能量所决定。
在量子引力和量子场论中,物理学家认为接近普朗克长度(10⁻³⁵米)时,时空是离散的,即有一个不可再分的最小单位。最典型的是圈量子引力,采用了时空的离散化方法,将时空视为由自旋网络构成的离散结构;在量子场论中,虽然时空通常被视为连续的,但场的激发态(粒子)是量子化的;在弦理论中,基本的构成单元不是粒子,而是一维的“弦”(String),弦理论暗示时空在最基本的层面上可能是离散的,但目前为止都停留在理论层面,无法进行试验验证。
迄今为止,还没有实验或观测数据能够决定性地证明时空是连续的还是离散的,这个问题是现代物理学中最根本的问题之一。考虑到光的“波粒二象性”等基本现象,对于非物理专业的大多数人来说,可能最稳妥的方式就是认为时空(世界)既是连续的,又是离散的。从常识的角度思考的话,可以暂且得出如下结论:
⚪ 世界(物与象)就其实体而言,是离散的;就其相互关系而言,是连续的。
⚪ 宏观来看是连续的,微观来看是离散的(就像面前的屏幕或者投影)。
⚪ 就体验性而言,是连续的;就操作性而言,是离散的。
⚪ 由于语言的结构与世界有对应关系,语言的属性同样是既连续(文脉)、又离散(词语)。
⚪ 理的本质是关系性的,因此是连续的。
⚪ 具体到设计学科,其思考方式主要是连续的,而生产/建造方式主要是离散的。
⚪ 连续与离散之间的相互转换是非常重要而有力的手段;将离散对象连续化,有助于发现规律和获得整体认知;将连续对象离散化,有助于获得可计算与可操作性。
在艺术领域,经常被援引来说明连续与离散的世界观的作品,就是梵高的《星夜》
(图10)
。当梵高将看似连续的自然现象用离散的笔触表达出来,似乎另一种维度——震撼人心的宇宙之音也轰然而至。
图10 The Starry Night,Vincent Willem van Gogh,1889(图片来源:网络)
虽然AI确实带来了深刻的人文主义危机,但同时也为科学和哲学领域带来了全新的研究对象、工具和范式。例如AI技术与脑科学的结合让我们比以往任何时候都更加接近“意识的本质是什么”这一哲学问题的解答;如果我们承认“图灵测试”的有效性,那么AI已经提供了一个渠道去思考“脱离身体的相关性”。当然前提是我们能够真正抛弃“人类中心主义”,这在实践上(而不是认识上)是极为困难的事情。
在方法论层面,以上关于维度与连续性-离散性的议题对于传统和当代语境都有普遍性,尤其对于当下AI的讨论具有特别的意义。例如对艺术创作产生重大影响的AIGC(人工智能生成内容)技术,它是根据用户的输入或需求,辅助或替代人类以更快的速度和更低的成本输出个性化和高质量的内容。AIGC能生成多模态内容,包括文字、绘画、音乐、视频、模型、游戏乃至交互式3D等等,其工作流程与传统的创造活动一样,包含了“物-象-言-理”的维度。同维度的生成如文生文、图生图,以及不同维度的文生图/视频/模型、图生/视频/模型等,目前生成图片的细节达到了影片级的效果
(图11)
,而Sora的长视频生成能力也令人震撼,并引发了公众对“真实”与欺诈问题的担忧。
图11 Midjourney V6生成的图片及其提示词(图片来源:网络)
目前主流的AI技术流程主要包括数据的收集和预处理(输入阶段)、模型的选择-训练-优化(学习阶段)、模型部署与成果输入(输出阶段)。与人类一样,AI的训练和认知主要是降维过程,虽然其中“维度”的概念更加宽泛,包括了数据的特征与关联性。机器学习领域的重要技术之一是结构与数据压缩,例如减少神经网络的层数或使用奇异值分解(SVD)进行数据降维和特征提取。压缩也可以认为是从高维度向低维度的投射过程,对AI而言,所有的物和象都将纳入计算机的算法“语言”,而最后一切都将降维到“0和1”,这是计算机的“终极之道”。
在算法问题上,AI同样面临连续性与离散性的二元论。事实上,这涉及到人工智能领域曾经旷日持久的路线之争,即“符号主义”(Symbolicism)和“联结主义”(Connectionism)。
符号主义的核心是逻辑驱动,即通过操作符号和规则来实现智能化,其中符号代表了世界的知识,而规则意味着知识之间的逻辑关系。一般认为,符号主义是一种“类人思维”,偏重于连续性,从“理”出发开始生成,强调知识表达和逻辑推理。而连接主义的核心是数据驱动,认为智能可以通过数据之间的连接来实现,通过大规模的数据统计来学习它们之间的关联权重,形成智能化的输出。可以说连接主义是一种“非人类思维”,偏重于离散性,放弃了所谓“理”的认知,直接从“现象到现象”,因此它对人类而言是难以解释的黑箱过程。
符号主义曾经是AI开发中的主流技术,但由于其对人类知识具有很强的依赖性,而人类知识的门类极为众多,内在的逻辑不仅复杂而且差异很大,导致开发通用人工智能(AGI)进展缓慢。近年来,随着大语言模型(LLM)的成功,连接主义完全占据了上风。连接主义至少在两个方面具有突出优势:一是以数据驱动为核心有利于充分发挥计算机的大规模计算和并行计算能力;二是“表层化”的处理方式(例如将自然语言离散为字词单元即token或将图像离散为像素点)有利于删繁就简,避开专门知识(大量的人工设定与干预)而直接通向AGI。处理离散化对象的重点是组合与概率问题,因此基于深度学习技术(人工神经网络等)对AI进行训练是其中的关键步骤。
虽然AI从技术哲学层面不断提示着我们关于自身的局限性,但至少从目前来看,AI还处于初级阶段,它的局限性仍然很明显。
笔者认为,现阶段AI技术至少面临以下的诸多困难。
虽然AI机器人代表了具身智能的发展方向,但离真正的具身智能和全局能力仍然差距甚大。以智能算法为例,笔者团队曾尝试用模拟退火算法和遗传算法解决旅行商问题,即寻找走遍所有地点的最短路径
(
图12)
。两者都是从随机值开始通过多次迭代寻求最优解的算法。虽然在人类看来一目了然:给定的所有点都在一个圆上。但由于点集内可能的组合数量极为庞大,即使给足够多的时间,算法仍然不能找到最优解。
图12 用两种算法求解旅行商问题(图片来源:笔者团队,2021)
虽然老子曾说“吾所以有大患者,为吾有身”。然而目前来看,拥有身体是人类最大的优势,包括拥有身体所带来的痛苦。痛苦、快乐、幸福和对美的感受是无法分割的一个整体,无论对人还是对于AI,可以说“感受不到痛苦才是最大的痛苦”。
更困难的是反思或者批判性思考的能力,这种能力往往意味着对前提条件甚至问题本身的质疑。反思提供了跳出既定范畴寻求更好答案的可能性,对人类而言这种能力也相当不容易,往往需要经过长期的训练才能获得。在前述认知层级的“理”的层面,哲学来自高度的反思与批判性,而批判性思考是通向颠覆性创新的重要途径。
虽然略显唐突,笔者认为哲学能力今后将成为AI时代人类的核心能力之一,这种能力对AI来说可能是最为困难的。实际上,对给定前提条件与任务进行反思的能力意味着一种觉醒。从人类的立场出发,我们只能希望AI永远不具备这种能力。
日常生活中还有大量的非数字化抽象,例如对事物深层逻辑的理解、对艺术作品结构的理解、对社群组织模式的理解等等。这些对抽象事物的理解能力在解决问题中非常重要,但是难以通过概率计算的方式获得,无法通过大语言模型对这种能力进行训练。这种能力的缺失,使AI在进行各种“顶层设计”时遇到很大困难。对人类而言,这种能力尤其是需要在今后的学校教育中着力培养的。
据报道OpenAI训练GPT-4的数据集包含了大约13万亿个token,谷歌团队训练Gemini Ultra模型用到了11万亿个token的数据。这些数据包括书籍、各类文章和学术论文等,不久之后所有以语言为载体的人类知识将被耗尽,可以预测AI将进入直接从“现象”(图像和实物)进行学习的阶段。
虽然所用的数据量极为庞大,但其中高质量数据非常稀缺。以绘画为例,真正的大师作品在历史上的数量非常有限,而大师作品中的巅峰之作又是各种机缘的产物,所以更为少见
(图13)
。另外,仅通过数据训练(模仿与学习)很难产生真正的创新,由于算法更倾向于数据的平均值,因此不仅容易生成平庸的“套路化”产品,也容易被低质量数据误导而“一本正经地胡说八道”。
图13 林风眠笔下生机勃勃的线条(图片来源:网络)
AI能力的实现离不开语言,无论是自然语言、计算机语言与数学语言,都是数据与算法所依赖的基础。然而,人类还有大量的非语言、非文字知识,有大量“不可言说之物”和“不可计算之物”,当这些事物无法被类型化,无法直接与现象之间建立明确的对应关系,对于AI来说几乎无法学习。
关于语言与思维的关系,近期有一项重要研究成果发表在《Nature》杂志上。埃维莉娜·费多伦科(Evelina Fedorenko)等人在论文《语言主要是一种交流的工具,而不是一种思考的工具》中指出,尽管语言的出现改变了人类文化,但语言并不是复杂思维(包括符号思维)的先决条件,迄今为止测试的所有类型的思维都可以在没有语言的情况下实现。
这个研究成果呼应了哲学家认为语言不能承载全部认知的论断,说明依赖大语言模型并不能实现AGI,人类的智能有语言之外的更多维度——对人类而言,这是个重大的“利好”消息。
无论是采用符号主义还是联结主义的技术路线,AI都会面对离散性与连续性的矛盾。虽然目前基于离散性的联结主义获得了巨大的成果,但是主要基于概率的数据驱动方式在保持生成结果的连续性(前后一致性)方面仍然存在较大困难。