来源:刘伟 人机与认知实验室
一、引言
人机融合智能是一种新型智能形式,它不同于人的智能、也不同于人工智能,是一种跨物种越属性结合的下一代智能科学体系。如果说真就是Being,善就是Should,美就是Being+Should的融合;假设机就是Being,人就是Should,那么人机就是Being+Should的融合。同时,人机融合智能也是东西方文明的共同结晶体现。
一般而言,东方文明对于智能的追求永远是“反求诸己”,企图打破人自身思维的界限而达到超越性的智慧;西方则是追求借助外力计算实现超越,计算即要求有穷,或者至少极限存在being,函数收敛。而针对无穷发散式的问题,也就是should的问题,人工智能很难跨出聚合这一步,而人机融合智能则能跨出这一步:人的意向性可以灵活自如地帮助人机协调各种智能问题中的矛盾和悖论。
表面上,人机融合智能问题是一个现代科学技术问题,同时也是一个古老的伦理问题。伦,有四种解释:1辈,类。2人与人之间的关系。3条理,次序。4姓;伦理,就是指的就是人与人以及人与自然的关系和处理这些关系的规则。人们往往把伦理看作是对道德标准的寻求。道德是后天养成的合乎行为规范和准则的东西。它是社会生活环境中的意识形态之一,它是做人做事和成人成事的底线。它要求我们且帮助我们,并在生活中自觉自我地约束着我们。假如没有道德或失去道德,人类就很难是美好的,甚至就是一个动物世界,人们也就无理性无智慧可言。伦理道德的最现实作用就是使人对事物产生价值观,而这价值观恰恰是产生意向(should)和存在(being)的主要源泉,意向性是意识的基础、存在是规律的反映,人类智能的根本就在于此::“德化情,情生意,意恒动。”“意恒动,识中择念,动机出矣。”
传统逻辑学规范的对象是一种可自控的推理活动。作为对于逻辑学奠基于伦理学之上的一个基本论证,皮尔士强调:“就其一般特征来看,推理现象类似于那些道德活动的现象。因为,推理本质上乃处于自控状态下的思想,正如道德活动乃处于自控状态下的活动一样。实际上,推理是受控活动的一种,因此必然带有受控活动的本质特征。虽然由于教士专门负责让你们记住,推理现象并非像道德现象那样为你们所熟知,但是,如果你们关注推理现象,你们可以很容易看到,一个得出理性结论的人不仅认为它是真的,而且认为每一类似情况下的推理同样正确。如果他没有这样认为,他的推断就不能称为推理。它不过是他心中出现的一个想法,他无法抗拒地认为它是真的。而由于没有经受任何检查或控制,它并不是被有意认可的,并不能称为推理。”这里核心的论证结构是:任何可判定好坏的行为都必须是可自控的,逻辑学以区分推理好坏为主要任务,所以作为逻辑规范对象的推理必须是可自控的活动。作为人造的机器、机制而言,其本质必然是可自控的活动结果,而人的则未必完全是逻辑自控的,人机融合智能更不是逻辑的自控推理活动。
二、人机融合智能的思考
人类价值观的起源是伦理学,机器的起源是人类(它们的上帝)。现实中,人类的伦理道德困境就不少,而人类给机器人“装”进去价值,恐怕会有更多的伦理范式之间的对冲矛盾产生吧?!无论如何,从中不难看出,人机融合的未来必将会荆棘密布、困难重重。
伦理可以规范出道理,道理可以演化出物理,物理可以抽象出数理,数理可以泛化于管理、生理、心理……。正如生活中所常见的那样,一个自然数据一接触到一种自然数据或社会数据性质就会发生较大变化,尤其是那些在临界值/区的数据/数值变化,直接导致了价值的出现和信息的产生。(自然、社会、真实、虚拟)隐显混合信息/知识构成的概念“能指、所指”往往呈现出生态多样性,在理论中变得越发生动活泼跳跃。人机之间的理论、概念、知识、信息、数据之间是弥散膨胀关系,反之是聚合压缩关系,但为了不失真,它们相互之间的转换效率都需要某种方法来衡量,这些表征就是我们要寻找的关键和突破口。人机融合后,整个系统的输入、处理、输出会发生不少变化:首先通情达理(这里的“理”包括伦理和道理)就是should到being的信数(人的信息与机的数据可以通过信数这个新中介形式进行融合,这个中介信数是由一个矢量+一个标量或一组矢量+多组标量构成的矢标量(还是矢量)值,通过信数这个矢标量值进行人机融合关系程度优良好坏的初步判定,即输入阶段的评价指标。),即通过人的价值取向有选择地获取数据的过程,在这个输入过程中不但是客观数据与主观信息的融合,还应包括人的先验知识和条件;其次,在人机信息/数据融合处理过程中,人的非结构化信息架构(如自然语言)会渐变为结构化一些,而机的结构化数据据语法就会非结构化一些,在这种半结构化的情境中,不但要使用基于公理的推理,还要兼顾结合非公理性推理,使得整个推理过程更加缜密合理;最后,在决策输出阶段,人常常是由脑中若干记忆碎片,与五感接收到的信息,综合在一起,跳过逻辑层次,直接将这些信息中和的结果,反射到思维之中,形成所谓的“直觉”,其结果的准确程度,在很大方面取决于一个人的综合判断能力,而机器则是通过计算获得的结果--“间觉”进行间接评价,这种把直觉与“间觉”相结合的独特决策过程就是人机融合智能输出的一大特点。概而扩之,人机融合的关键应包括:一多与灵活弥聚的表征、公理与非公理混合推理、直觉与“间觉”交融的决策。
人的感觉常常是嵌套混合贯通联合的,视觉里包含着听觉触觉嗅觉和味觉,机器的信号采集/数据输入则是单纯唯一独立分离的,各种通道模态之间没有融合交叉。人与机的感觉秩序大相径庭,刺激与数据、信息与信号差异太大。对人而言,未感觉到的刺激往往被隐藏在感觉到时刺激里,进而形成无意识感觉或下意识感觉。不难相信,这种联觉或迁移觉在文字、词语中也有着相似的机理。机器的这种能力至今尚未被开发出来,这或许是人机融合智能方面中的一个瓶颈吧!如何打破“人擅计机长算”的基本架构,数据一多分有全息表征的输入至关重要,这里面不仅有显性的个别数值体现,还有默会的众多关系作用。人的看里包含了大量的其他感觉到的东西,如听觉、触觉、嗅觉、味觉,这些联觉都潜在在视觉里,机器的看没有联觉、统觉,机器听觉等莫不如此……另外,情境中每个东西都有众多属性和关系,当前的打标就是九牛一毛,往往打标后挂一漏十白白损失了大量的信息,所以现有的“人工”智能中数据标注工作值得商榷。深入下去,人对这类复合信息的加工也应该是复合并行的处理: 既有逻辑清晰地推理过程,可谓之达理,更有感性丰富地动情发展,可谓之通情;既有基于公理地显性信息的分析,也有基于非公理地隐含信息的综合,慢慢形成显、隐理解的共存,进而演化为显、隐意向性,为下一步的规划决策做好准备。在完成情境任务目标的价值驱动下,显性的意向性可以变成理性决策,隐性的意向性可以演化成直觉决策。
在传统的人工智能研究中,联接主义的代表形式是人工神经网络,主要处理数据;行为主义的代表形式是强化学习方法,主要处理信息(奖惩后有价值的数据);符号主义的代表形式是知识图谱和专家系统,主要处理知识和推理(有限的知识及推理);三者有递进的味道,但距离人擅长的概念产生和理论建立相距甚远,尤其是在情感化表征、非公理性推理和直觉决策等方面机器更是望尘莫及! 另外,机器学习中的反馈、迭代的生硬艰涩滞后与人的相比也是比较低级,这是因为人的态势感知能力不但来自科学技术还源于社会学、史学、哲学、文学、艺术等多方面的素养与思维技能,进而产生价值取向(态势感知的基本预设是: 人可以发现未来的动向并影响它的进程)。机器的态势感知做不到,所以机器暂时还是单一领域的擅长者(如围棋、国际象棋等)。一般而言,机器在定义域(人为规则)里比人存储量大且准确、数据处理快,人在非定义域(自然情境)里比机智灵活且深刻、信息融合好。人的优势是划圈(划分领域/定义域),机的优势是画圆(精确执行),人机融合的优势则是既能划好圈又能画团圆(可跨域实现目标),正可谓:人心所想,机器所为。当前的人机融合产品还是共性的(谁都可以用,如手机、电脑),个性化服务的人机智能融合还未真正出现,但已有原始级别的系统悄悄暂露头角(如个人辅助决策系统等)。
学习,对人而言最重要的是忽略那些非关键的数据、忘记那些不重要的信息,从而在诸多事物及其之间发生的各种关系~事实中游刃有余地特征相关、关联存在、变化应该、统计概念、概率规则、把握因果,可惜的是,目前的机器学习不会忽略不懂忘记,人这种过滤的机理与价值取向判断有关,弱类似于决策机理,机器没有价值体系。从透视主义的角度来看,人的认知存在两类选择性透视,一是生理功能上的,如对可见光的感受;二是观念上的,如情境、理论和价值预设。生理功能上的意思就是说我们选择认识什么不认识什么取决于生理感受与反映乃至内在机制;观念上是指各种预设使人在认识中会放大、虚构和过滤。人的价值取向相应可分为生理性和社会性,两者都包含个性化与共性成分,并在不同的情境组合中转换、释放出来,形成风格各异的认知特点和规律。迄今为止,这些价值体系尚未赋予没有个性的机器们。人类意向性的背后就是价值取向,即价值观伦理性(伦就是类和次序),如何让形式化(数据化)的机器产生价值取向就是让它产生意向性,即形式化的意向性,可以有道德有伦理的机器或许可以由此实现,产生不了有价值取向的机器,这一切都难以起始。事实上如何产生有价值倾向的机器,就是人的伦理道德像理性逻辑一样可描述化程序化问题,即伦理如何变成道理再变成公理原理的进程。此外,人的深度学习也不同于机器的深度学习,人的深度学习是学校教育与社会教育的一致,在于理论与实践的统一,在于矛盾和悖论的协同……是一种内外共鸣同情的学与习;而机器的深度学习源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构,深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。两种学习的机制根本不同:一个经过思考和实践,一个就是仿真和模拟。
为什么人类倾向于用概念、关系和属性做解释?这是因为任何解释都是在认知基本框架(常识)下进行的。人类认识世界理解事物的过程,其实就是在用概念、属性和关系去认知世界的过程。概念、属性、关系是理解和认知的基石,机器不能把不同性质的东西联系起来,人却可以相关表面上无关的事物。为什么“整体不同于其部件的总和”?因为构成整体的部件(属性)们产生了关系,有内在的也有外在的,语义的进化也许就是新关系的形成,知识的产生也是各种各样的新关系被发现的过程,关系有单向性(不是双向的)和依附性,如何建立起人机之间的双向关系至关重要,这也是一个突破口和切入点。其中,构造与功能的关系、特征属性与语义向量关系是当下科研的热点和难点。
为什么知识图谱和专家系统在实际应用中漏洞百出、问题层出不穷?其中最重要的原因是关系的梳理没有到位。其中对于主观参数和客观参数的不匹配不协同就是一个重要问题。正如维纳对智能控制的定义:“设有两个状态变量,其中一个是能由我们进行调节的,而另一个则不能控制。这时我们面临的问题是如何根据那个不可控制变量从过去到现在的信息来适当地确定可以调节的变量的最优值,以实现对于我们最为合适、最有利的状态。”如一个认知模型如何处理突出值、价值观、频率性、可信度等主客观融合特性,也许是评判其好坏的主要依据吧。早年Fechner在创立心理物理学时,提出过外部的心理物理学和内部的心理物理学等概念。外部物理世界各种物理刺激作用于人的感官,引起人的内部物理世界的活动,即脑的活动,从而产生内部心理世界的感觉体验。Fechner认为人的感觉过程既涉及外部物理世界的物理刺激,又涉及内部物理世界的脑活动过程,还有内部心理世界的感觉体验。他认为外部的心理物理学研究外部物理刺激强度和内部心理世界感觉体验强度之间的关系,而内部的心理物理学则研究内部物理世界即脑活动强度和内部心理世界感觉体验强度之间的关系。高级意识是什么呢,有人认为高级意识就是大量的基础意识的集成,把大量不同种类的基础意识有机地集成到一起,这种集成应该具有穿越性,能够把“无关”事物/事实有指向地相关起来,穿越比集成更迅捷。目前看来,单纯人的智慧在单个领域落后于人工智能已成为现实,对跨领域超级智能的期待仍无依无据,但是人机融合智能则可以更快更好更灵活地同化外来信息和顺应外部变化,是有机与无机的跨界混搭,是记忆与存储、算计与计算、直觉与间觉、自主与它主、慧与智的弥聚,也许这中融合智能正是未来的方向。
人机融合智能的一个核心问题是介入问题,这也是一个体验问题,即人与机相互之间何时何处以何种方式(或平滑或迅速)介入的问题,尤其是在歧义点或关键阈期间介入的反应时、准确率。例如,交互中机器出现的变形了的非自主“主观”对人机融合很重要,尤其是在特定定义域(如围棋)中,可以改变人的习惯和偏好,甚至是世界观。再如,在融合时彼此之间的接受、容忍、信任、匹配、调度、切换、说服、熟练程度,以及如何训练出个性化的伙伴关系等都是具体亟待解决的问题。例如未来的人机说服技术,就需要人机之间的通情达理,因势利导。由于人机融合在细节层面和人人之间的合作几乎同样复杂,或者说是有一些另类的复杂问题。因而可以认为,从技术角度讲,人机融合智能绝不仅是一个数学仿真建模问题,还应是一个实验统计体验拟合的问题。
一般来讲,对于一项技术的理解要从抽象的角度着手,抽象的角度越高,适应范围越广,用一层一层的抽象的方法去理解事物的本质,就能从思想上突破技术的局限性。比如一个简单的问题:计算机是什么?计算机的本质就是一个可编程的、用于计算的机器。任何问题只要能转换成计算问题,那计算机就能解决,如果不是计算问题,那计算机就解决不了。人处理的外部客观事物属性/关系本身就包含多重意义,再加上人本身的主观认知也丰富多彩,因而复杂性是不可避免的。相比之下,机器的数据分析倒是相对自然简单一些。信息的输入、处理、输出过程对人而言都是双向的,如“看想看的”、“听想听的”就是眼耳与大脑的双向流动,而弹奏想弹的曲子则是手脑之间的双向作用;数据的处理过程则是机器的单向使然,人为的反馈前馈仍难以掩盖其无机性。罗素认为,我们所说的每个事物都只由我们拥有的直观知识和理解的事物的说法(也许是合成的)构成——知识实质上凭的是感性知觉。例如,机器不会学不会问,所以没学问。你问人: 吃了吗?人理解!你问机: 充(电)了吗?机会理解吗?那种试图以现有形式化方法获取类人智能的思想也许确实是行不通的,因为从本质上讲,所有的仿真和模型都是错误的,只不过有些模型可参考性较大一点罢了。
人与人之间有人道,机与机之间有机道,人与机之间有人机道。数据、信息、知识,三者之间由于主体介入程度上的不同,而性质随之变化。例如:当你面对一堆数据时,数据与主体产生关联,你就发现或得到信息;当信息做为对象被主体思维运算后,形成认识时,信息就变成了知识;当知识从主体传播出来,面对其他接收主体,又转换成了信息;当信息存储在外,无主体对应或介入时,就变成了数据。在语法面,规则性的语法逐渐为概率性的语法所替代,语义/语用方面,则出现了可能(性)的价值是新型决策依据
人机融合智能科学要研究的是一个物理与生物混合的复杂系统。智能作为一种现象,就表现在个体与自然、社会群体的相互作用和行为过程中。基于信息技术的认知延展可以为延展认知的哲学假说进行辩护,而心灵的边界将变得更为模糊,身体、大脑、环境、技术、社会正在形成一种新的相互融合的智能体。这不仅仅会改变人的基本认知结构,也进一步改变了我们对人性以及对自身存在状态的理解。人与不同机融合表现出来的智能是不同的,与手机交互时的智能远远大于与自行车交互时的智能。或许这些行为和现象类似物理学一样必然有统一的力、相互作用、基本元素来描述。例如在图像识别中,真实的识别不是在图像中的位置(图像是一个平面)。而是要识别图像指向的空间中的位置。要建立空间概念,以及物体在空间中相互关系的概念。单纯基于概率统计的方法(先天智能)解决不了看图说话的问题,要建立一种基于当前图像个性反馈(后天智能)。人,有一种随时随地都可以“标注”的能力~“打”标
不管怎么标注都是终止于符号,而不是世界上的物体,应该做个能和环境世界打交道的东西,标注就是物体本身,物体的图像、声音、触觉、气味都可以通过训练映射到物体。不是说符号没用,符号本身也是物体对象,需要通过训练来认识它们。符号到其代表的物体的映射(或指向)关系也是通过训练形成。
对人类而言最最神秘的意识是如何产生的,这个问题一直受到学者们的关注。其中有两个主要问题,一是意识产生的基本结构,二是交互积累的经验。前者可以是生理的也可以是抽象的,是人类和机器的差异,后者对人或机器都是必须的。意识是人机环境系统交互的产物,目前的机器理论上没有人机环境系统的(主动)交互,所以没有你我他这些参照坐标系。有人说“当前的人工智能里面没有智能,时下的知识系统里面没有知识,一切都是人类跟自己玩,努力玩得似乎符合逻辑、自然、方便而且容易记忆和维护”,此话固然有些偏颇,但也反映出了一定的道理,即意识是人机环境系统交互的产物,目前的机器理论上没有人机环境系统的(主动)交互,所以没有你我他这些参照坐标系,从而很难反映出各种隐含着稳定和连续意义的某种秩序。还有,人处理信息的过程是变速的,有时是自动化的下意识习惯释放,有时是半自动化的有意识与无意识平衡,有时则是纯人工的慢条斯理,但是这个过程不是单纯的信息表达传输,还包括如何在知识向量空间中建构组织起相应的语法状态,以及重构出各种语义、语用体系。
而且自由调节的环境系统触发了自主体系的反向运动,由此形成了人机与环境之间的多向运动或多重运动,进而导致了矛盾和冲突。这种不一致甚至相反问题的解决常常不是单纯数学知识力所能及的,一个问题有边界、有条件、有约束的求解时是数学探讨,同一个问题无边界、无条件、无约束求解时往往变成了哲学研究。例如虚构如何修正真实,真实怎样反馈与虚构?这将是一个很有味道的问题!
三、发展与展望
人机融合智能就是由人、机、环境系统相互作用而产生的新型智能系统。之所以说它与人的智慧、人工智能不同,具体表现在三个方面: 首先是在智能输入端,它是把设备传感器客观采集的数据与人主观感知到的信息结合起来,形成一种新的输入方式;其次是在智能的数据/信息中间处理过程,机器数据计算与人的信息认知融合起来,构建起一种独特的理解途径;最后是在智能输出端,它把机器运算结果与人的价值决策相互匹配,形成概率化与规则化有机协调的优化判断。人机融合智能也是一种广义上的“群体”智能形式,这里的人不仅包括个人还包括众人,机不但包括机器装备还涉及机制机理,除此之外,还关联自然和社会环境、真实和虚拟环境等。着重解决上述人机融合过程中产生的智能问题。比如诸多形式的数据/信息表征、各种逻辑/非逻辑推理和混合性的自主优化决策等方面。
总之,人机融合智能研究是智能技术发展到一定程度的产物,它既包括人工智能的技术研究,也包括机器与人、机器与环境及人、机、环境之间关系的探索。与很多新兴学科一致,它的历史不长,但发展速度很快。尤其是近些年,依托着深度学习的兴起,以及一些大事件(AlphaGo系列)的产生,人们对人工智能本身,以及人机融合智能研究的兴趣陡然上升,对其相关研究与著作也相对增多。但是,可以预期到的是,人机融合智能技术本身离我们设想的智能程度还相去甚远,且自发的将人的智能迁移到机器中的想法本身实现难度就极大。这是一个很难回避的问题。这些都需要目前的智能科学家们做进一步的研究。人机融合智能研究不仅仅要考虑机器技术的高速发展,更要考虑交互主体-人类的思维与认知方式,让机器与人类各司其职,互相促进,这才是人机融合智能研究的前景与趋势。
延展阅读:什么是人机功能分配?人机功能匹配?
人机功能分配指根据人和机器各自的长处和局限性,把人机系统中任务分解,合理分配给人和机器去承担,使人与机器能够取长补短,相互匹配和协调,使系统安全、经济、高效地完成人和机器往往不能单独完成的工作任务。
人机功能分配,应全面考虑下列因素:①人和机器的性能、特点、负荷能力、潜在能力以及各种限度;②人适应机器所需的选拔条件和培训时间;③人的个体差异和群体差异;④人和机器对突然事件应激反应能力的差异和对比;⑤用机器代替人的效果,以及可行性、可靠性、经济性等方面的对比分析。上表列出了人与机器在感受能力、控制能力、工作效能、信息处理、作业可靠性和工作持久性等方面的特征比较。
从特征比较可以看出,人机功能分配的一般规律是:凡是快速的、精密的、笨重的、有危险的、单调重复的、长期连续不停的、复杂的、高速运算的、流体的、环境恶劣的工作,适于由机器承担;凡是对机器系统工作程序的指令安排与程序设计、系统运行的监督控制、机器设备的维修与保养、情况多变的非简单重复工作和意外事件的应激处理等,则分配给人去承担较为合适。
人机功能匹配是指混合主动提供知识,即智能的平衡供给......
工业互联网
产业智能官 AI-CPS
加入知识星球“产业智能研究院”:先进产业OT(工艺+自动化+机器人+新能源+精益)技术和新一代信息IT技术(云计算+大数据+物联网+区块链+人工智能)深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的机器智能认知计算系统;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
版权声明:产业智能官(ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:[email protected]。