2017GAITC AI变革时代的智能系统测评分论坛实录丨于剑：真假如何确定

中国人工智能学会 · 公众号 · AI · 2017-06-16 10:35

正文

主题：AI变革时代的智能系统测评分论坛

时间：2017年5月22日上午

地点：国家会议中心402B

本文根据速记进行整理

真假如何确定

于剑

北京交通大学教授

于剑：我要讲的是这么一个题目：如何判断真假。这个题目看着很学术化，其实一点都不学术化，因为我们日常生活中每天都在判断真假。实际上，生活中类似的问题很多。比如：什么是真假？什么是是非？什么是对错？什么是好坏？这些问题，我们每天都在判定。这上面的问题，任何一个犯错了，都会有大大小小的麻烦。我们也知道，无监督学习是深度学习的圣杯问题。最近最火的深度学习无监督学习模型是对抗生成网络。但是实际上对抗生成神经网络还是按照监督学习的思路来做的，并不是真正的无监督学习模型。无监督学习为什么困难，为什么是深度学习的圣杯问题？其中一个重要的原因是无监督学习没有标定，导致无法判断学习的好坏。

在这种情况下怎么判断呢？由于判断真假是图灵测试的基础，如果真假都判断不了，图灵测试根本没法进行。当然真假判定对了，图灵测试也就过了。人类是如何判定真假的？我们举几个生活中的例子。比如：“我爱也只爱那些不爱自己的人”，“我的缺点就是我没有缺点”，“除了诱惑之外，我可以抵挡任何诱惑”等等，这些句子真可以判定真假吗？类似这种话每天听到无数，随便举一句， “人工智能未来无所不能”。这种句子太多了，我们人是如何处理的呢？如果真交给机器来算的话，机器肯定死机。

当然要研究这个真假问题，就会发现实际上以前有很多理论。比如说真理的符合论，从亚里士多德就开始了。在亚里士多德的《形而上学》里对于真假给出了一个定义：说是者为是，说非者为非，为真；说是者为非，或说非者为是，为假。这个定义具有模糊性。什么叫是？以什么为是？什么是非？以什么为非？标准不一。但这个定义的要义是与现实符合。有非常多的天才人物，像罗素、维特根斯坦、奥斯汀等都坚持真理的符合论。符合论碰到的最大难题就是何为原子事实？在现实生活中，每个事实都不简单，没有原子事实。你说一句话这么一个事实，也可以有很多描述，所以什么是原子事实碰到了非常大的难题。而且这个真假定义要求事实的绝对客观性。但是，我们日常生活当中有些不是客观的，比如个人的主观感受。前两天很多人看过一部印度电影《摔跤吧，爸爸》。那里面有一句歌词，只有痛苦从不说谎。显然，某人是否痛苦只依赖于其主观感受。

因此，有些人人坚持真假的其它定义。比如在所谓的融贯论里，什么是真假？就看能不能自相一致，如果是一致就说是真的。也有很多人持这一观点，著名者有布莱尼兹、斯宾若莎、笛卡尔、黑格尔等人。在融贯论里，命题的真不依赖于它与事实、实在的符合或对应，只在于其在其自身的命题系统中是否融贯。除此之外，真假的其它定义还有上个世纪20年代由拉姆塞提出的冗余论。在冗余论里，P是真的，仅仅等同于P。P是真的，只不过是意指P。P是假的，只不过是意指非P。如果P说是假的，就等于非P。冗余论也称紧缩论、消失论、无真理论。

需要指出的是，上述理论有一个共同的假设，根据句子判断真假。前面提到的三个真理理论最后都出了问题。为什么会出问题呢？追踪到最后，发现问题都跟词的表示有关。如果词没有定义好，定义句子就很难。因此，需要首先定义好词。前面提到的三种真假理论里，都使用词的经典表示。下面我们看看什么是词的经典表示？

为此，先回忆一下词的定义：词是最小的能够独立运用的语言单位。这这儿，需要指出，词具有很多别名，比如概念、集合、模式、类、术语等。本次报告里，如果不特别指出，只用词这个名字。在这个词定义里，最小实际上是没有意义的，因为除了词之外还有词素，词素显然比词小。因此，能独立运用是词最重要的特征。词为什么能独立运用呢？显然是因为其具有语义。那什么是语义？语义当然有很多种。在座的如果学过的话就会知道，有太多的语义定义。比如计算机科学中最常用的是逻辑语义，依赖于命题。实际生活中我们很少用逻辑语义，日常生活中常用的语义定义有三种：外延语义、主观语义和符号语义。外延语义是指认知对象在客观世界的真实对应，一般用集合表示。比如说我的名字叫于剑，我这个人是对应于于剑这个名字的外延语义。主观语义是指认知对象在主观世界的对应表示，传统上用命题表示。主观语义怎么定义？在座的很多朋友认识我，比如说陈老师。我跟陈老师已经有小半年没见面了，但是他依然认识我，为什么？他心里有我的一个表示，一看我变化不多，跟他心里的于剑表示很像，他就辨认是我了，他心里对我的这个表示就是主观表示。符号语义，是认知对象在认知世界的对应表示，用词表示，在认知世界里，于剑这两个字就是我的一个符号表示。

有了这三个表示之后，真假如何判断？要想解决这件问题，就需要知道这三个表示如何使用？下面我们将讨论这个事情。要想使用这三个表示，就需要将词与现实中的各种对象联系起来，换句话说如何将对象指称成思维中的词语。当您接触世界时，各种对象将自动呈现为心智中的各种词语，这就是词的指心功能。如何将对象归为概念，用词来表示？我们先回顾一下词的经典表示。在经典理论里，词的指心功能是用词的内涵表示来实现的。所谓词的内涵表示，即命题表示，对应词的心智表示。举一个例子。比如，什么是素数？众所周知，素数的内涵定义是一个命题：只能被一和其自身整除的自然数。但词的心智表示，有时可以外显。比如命题可以外显，但不是都可以外显的。词的外延表示是所谓的集合表示，对应词的指物部分。说明词在现实中到底是什么东西。词的符号表示就是词名，即指名的部分。应该说，词的经典表示要求很高。在现实生活中的词虽然很少满足词的经典表示，但做科学研究的一定要尽力用词的经典表示，一般情况下，总是假设词的表示是经典表示。可惜的是，词的经典表示有很多缺点，下面我们简单分析一下。

词的经典表示的第一个缺点：词用概念名表示时，但是很多东西的概念名我们并不知道，到野外看到很多东西可能并不知其名。而且更重要的是它的内外名不一定一致。有一个非常有名的社会学研究，其表明日常生活中成人日均说谎一次。什么叫说谎，就是外部叫的跟心里想的不一样。词的经典表示并不区分词的内名和外名。

词的经典表示的第二个缺点：词的外延表示是经典集合论，像罗素等很多数理逻辑学家都用的是经典集合。但是，日常生活中，用的很多词其边界是不明晰的，比如好坏等，不能用经典集合表示。另外如果用经典集合，如果不选取合适的特征，就很难区分集合中的元素与集合外的元素。什么是美丑？比如给你一个巩俐，一个汤加族的美人，我们会认为巩俐美，但是汤加族的人会认为她不美。这时候您就需要弄清楚美的分类特征。如果没有选取合适的这个特征，就很难搞清楚这中间的区别。

词的经典表示的第三个缺点：其假设词的内涵表示可以外显的用命题表示。可是，对日常生活中使用的词来说，外显的命题表示不一定存在。维特根斯坦已经论证了同一个概念中的对象不一定具有共同性质，日常生活中的概念大多不能用命题来表示。我们可以举一个简单的例子，到现在为止，我们研究了这么多年人，人的命题定义可以给出吗？实际上，到现在为止，人的命题定义并没有给出。

词的经典表示的第四个缺点：我们原来认为每个词都是有唯一表示的。即，每个人用同一个词时，这个词应该都是一样的，可是实际上并不一样。现代认知科学研究表明，词的表示依赖于每个人的自身感知条件，不可能与他人一致。如果一致的话，就不会发生理解上的问题。对于每个词，我跟你都一样，我能理解错你吗？如果这样，不可能理解错误。现实中显然不是这样。

词的经典表示的第五个缺点：概念经典表示要求内涵表示与其外延表示指称等价。但是，众所周知，知人知面不知心，人心难侧。因此，在现实生活中，词的内涵表示和外延表示常常指称不等价。

综上所述，可以知道为什么词的经典理论会出问题，是因为词的经典表示，跟日常生活中差很远。所以，要想与现实一致，词的表示一定要改。

如何改呢？我们引用一个著名的故事，高山流水遇知音。如果能将这个故事听明白，就可以将词的新表示想清楚。高山流水遇知音讲的是什么故事呢？其实讲的很简单，就词的表示来说，伯牙想表示一个概念，心里想高山就用琴声表示出来，子期知道是高山。子期用语言表示出来。假设子期说英语，那谁理他？子期用的语言肯定是伯牙可以理解的。这个故事告诉我们很多信息，因为伯牙并没有把内部表示告诉子期：“我弹的是高山”，只是用琴声的方式告诉子期。伯牙每次都这么干，他心里想什么都不说，就是弹琴。结果钟子期不管伯牙弹什么，总是说得对，总是能把伯牙心里想的说出来。这个故事给了很多启示。

2017GAITC AI变革时代的智能系统测评分论坛实录丨于剑：真假如何确定

正文

请到「今天看啥」查看全文