专栏名称: 中国人工智能学会
关注中国人工智能学会官方公共账号,收取学会的科普信息、新闻动态、活动预告及人工智能领域科技前沿信息。
目录
相关文章推荐
爱可可-爱生活  ·  【[42星]GIDD:一种新型离散扩散模型框 ... ·  18 小时前  
财经网科技  ·  算力平台纷纷接入通义 ... ·  昨天  
财经网科技  ·  算力平台纷纷接入通义 ... ·  昨天  
爱可可-爱生活  ·  《爱可可微博热门分享(3.10)》 ... ·  2 天前  
爱可可-爱生活  ·  【[197星]Banbot:一款高性能、多策 ... ·  3 天前  
51好读  ›  专栏  ›  中国人工智能学会

2017GAITC AI变革时代的智能系统测评分论坛实录丨于剑:真假如何确定

中国人工智能学会  · 公众号  · AI  · 2017-06-16 10:35

正文

主题:AI变革时代的智能系统测评分论坛

时间:2017年5月22日上午

地点:国家会议中心402B


本文根据速记进行整理


真假如何确定

于剑

北京交通大学教授



于剑:我要讲的是这么一个题目:如何判断真假。这个题目看着很学术化,其实一点都不学术化,因为我们日常生活中每天都在判断真假。实际上,生活中类似的问题很多。 比如: 什么是真假?什么是是非?什么是对错?什么是好坏?这些问题,我们每天都在判定。这上面的问题,任何一个犯错了,都会有大大小小的麻烦。我们也知道,无监督学习是深度学习的圣杯问题。最近最火的深度学习无监督学习模型是对抗生成网络。 但是实际上对抗生成神经网络还是按照监督学习的思路来做的,并不是真正的无监督学习模型。无监督学习为什么困难,为什么是深度学习的圣杯问题?其中一个重要的原因是无监督学习没有标定,导致无法判断学习的好坏。


在这种情况下怎么判断呢?由于判断真假是图灵测试的基础,如果真假都判断不了,图灵测试根本没法进行。当然真假判定对了,图灵测试也就过了。人类是如何判定真假的?我们举几个生活中的例子。比如:“我爱也只爱那些不爱自己的人”,“我的缺点就是我没有缺点”,“除了诱惑之外,我可以抵挡任何诱惑”等等,这些句子真可以判定真假吗?类似这种话每天听到无数,随便举一句, “人工智能未来无所不能”。 这种句子太多了,我们人是如何处理的呢?如果真交给机器来算的话,机器肯定死机。


当然要研究这个真假问题,就会发现实际上以前有很多理论。比如说真理的符合论,从亚里士多德就开始了。在亚里士多德的《形而上学》里对于真假给出了一个定义:说是者为是,说非者为非,为真;说是者为非,或说非者为是,为假。这个定义具有模糊性。什么叫是?以什么为是?什么是非?以什么为非?标准不一。但这个定义的要义是与现实符合。有非常多的天才人物,像罗素、维特根斯坦、奥斯汀等都坚持真理的符合论。符合论碰到的最大难题就是何为原子事实?在现实生活中,每个事实都不简单,没有原子事实。你说一句话这么一个事实,也可以有很多描述,所以什么是原子事实碰到了非常大的难题。而且这个真假定义要求事实的绝对客观性。 但是,我们日常生活当中有些不是客观的,比如个人的主观感受。前两天很多人看过一部印度电影《摔跤吧,爸爸》。那里面有一句歌词,只有痛苦从不说谎。显然,某人是否痛苦只依赖于其主观感受。


因此,有些人人坚持真假的其它定义。 比如在所谓的融贯论里,什么是真假?就看能不能自相一致,如果是一致就说是真的。也有很多人持这一观点,著名者有布莱尼兹、斯宾若莎、笛卡尔、黑格尔等人。在融贯论里,命题的真不依赖于它与事实、实在的符合或对应,只在于其在其自身的命题系统中是否融贯。除此之外,真假的其它定义还有上个世纪20年代由拉姆塞提出的冗余论。 在冗余论里,P是真的,仅仅等同于P。P是真的,只不过是意指P。P是假的,只不过是意指非P。如果P说是假的,就等于非P。冗余论也称紧缩论、消失论、无真理论。


需要指出的是,上述理论有一个共同的假设,根据句子判断真假。前面提到的三个真理理论最后都出了问题。为什么会出问题呢?追踪到最后,发现问题都跟词的表示有关。如果词没有定义好,定义句子就很难。因此,需要首先定义好词。前面提到的三种真假理论里,都使用词的经典表示。下面我们看看什么是词的经典表示?


为此,先回忆一下词的定义:词是最小的能够独立运用的语言单位。这这儿,需要指出,词具有很多别名,比如概念、集合、模式、类、术语等。本次报告里,如果不特别指出,只用词这个名字。在这个词定义里,最小实际上是没有意义的,因为除了词之外还有词素,词素显然比词小。因此,能独立运用是词最重要的特征。 词为什么能独立运用呢?显然是因为其具有语义。那什么是语义?语义当然有很多种。在座的如果学过的话就会知道,有太多的语义定义。比如计算机科学中最常用的是逻辑语义,依赖于命题。实际生活中我们很少用逻辑语义,日常生活中常用的语义定义有三种:外延语义、主观语义和符号语义。外延语义是指认知对象在客观世界的真实对应,一般用集合表示。比如说我的名字叫于剑,我这个人是对应于于剑这个名字的外延语义。主观语义是指认知对象在主观世界的对应表示,传统上用命题表示。主观语义怎么定义?在座的很多朋友认识我,比如说陈老师。我跟陈老师已经有小半年没见面了,但是他依然认识我,为什么?他心里有我的一个表示,一看我变化不多,跟他心里的于剑表示很像,他就辨认是我了,他心里对我的这个表示就是主观表示。符号语义,是认知对象在认知世界的对应表示,用词表示,在认知世界里, 于剑这两个字就是我的一个符号表示。


有了这三个表示之后,真假如何判断?要想解决这件问题,就需要知道这三个表示如何使用?下面我们将讨论这个事情。 要想使用这三个表示,就需要将词与现实中的各种对象联系起来,换句话说如何将对象指称成思维中的词语。当您接触世界时,各种对象将自动呈现为心智中的各种词语,这就是词的指心功能。如何将对象归为概念,用词来表示?我们先回顾一下词的经典表示。 在经典理论里,词的指心功能是用词的内涵表示来实现的。 所谓词的内涵表示,即命题表示,对应词的心智表示。 举一个例子。 比如,什么是素数?众所周知,素数的内涵定义是一个命题:只能被一和其自身整除的自然数。但词的心智表示,有时可以外显。比如命题可以外显,但不是都可以外显的。词的外延表示是所谓的集合表示,对应词的指物部分。说明词在现实中到底是什么东西。词的符号表示就是词名,即指名的部分。应该说,词的经典表示要求很高。在现实生活中的词虽然很少满足词的经典表示,但做科学研究的一定要尽力用词的经典表示,一般情况下,总是假设词的表示是经典表示。可惜的是,词的经典表示有很多缺点,下面我们简单分析一下。


词的经典表示的第一个缺点:词用概念名表示时,但是很多东西的概念名我们并不知道,到野外看到很多东西可能并不知其名。而且更重要的是它的内外名不一定一致。有一个非常有名的社会学研究,其表明日常生活中成人日均说谎一次。 什么叫说谎,就是外部叫的跟心里想的不一样。词的经典表示并不区分词的内名和外名。


词的经典表示的第二个缺点:词的外延表示是经典集合论,像罗素等很多数理逻辑学家都用的是经典集合。但是,日常生活中,用的很多词其边界是不明晰的,比如好坏等,不能用经典集合表示。另外如果用经典集合,如果不选取合适的特征,就很难区分集合中的元素与集合外的元素。什么是美丑?比如给你一个巩俐,一个汤加族的美人,我们会认为巩俐美,但是汤加族的人会认为她不美。 这时候您就需要弄清楚美的分类特征。 如果没有选取合适的这个特征,就很难搞清楚这中间的区别。


词的经典表示的第三个缺点:其假设词的内涵表示可以外显的用命题表示。可是,对日常生活中使用的词来说,外显的命题表示不一定存在。 维特根斯坦已经论证了同一个概念中的对象不一定具有共同性质,日常生活中的概念大多不能用命题来表示。我们可以举一个简单的例子,到现在为止,我们研究了这么多年人,人的命题定义可以给出吗?实际上,到现在为止,人的命题定义并没有给出。


词的经典表示的第四个缺点: 我们原来认为每个词都是有唯一表示的。即,每个人用同一个词时,这个词应该都是一样的,可是实际上并不一样。现代认知科学研究表明,词的表示依赖于每个人的自身感知条件,不可能与他人一致。如果一致的话,就不会发生理解上的问题。对于每个词,我跟你都一样,我能理解错你吗?如果这样,不可能理解错误。 现实中显然不是这样。


词的经典表示的第五个缺点:概念经典表示要求内涵表示与其外延表示指称等价。但是,众所周知,知人知面不知心,人心难侧。因此,在现实生活中,词的内涵表示和外延表示常常指称不等价。


综上所述,可以知道为什么词的经典理论会出问题,是因为词的经典表示,跟日常生活中差很远。所以,要想与现实一致,词的表示一定要改。


如何改呢?我们引用一个著名的故事,高山流水遇知音。 如果能将这个故事听明白,就可以将词的新表示想清楚。高山流水遇知音讲的是什么故事呢?其实讲的很简单,就词的表示来说,伯牙想表示一个概念,心里想高山就用琴声表示出来,子期知道是高山。子期用语言表示出来。假设子期说英语,那谁理他?子期用的语言肯定是伯牙可以理解的。这个故事告诉我们很多信息,因为伯牙并没有把内部表示告诉子期:“我弹的是高山”,只是用琴声的方式告诉子期。伯牙每次都这么干,他心里想什么都不说,就是弹琴。结果钟子期不管伯牙弹什么,总是说得对,总是能把伯牙心里想的说出来。这个故事给了很多启示。







请到「今天看啥」查看全文