专栏名称: 硅谷密探
硅谷第一科技媒体, 为你带来最生动的产品报道和推荐、独家的硅谷创业公司访谈,链接中美创业者与投资人。读硅谷,看硅谷,去硅谷!
目录
相关文章推荐
新浪科技  ·  #ModelY成今年中国乘用车销冠#【#特斯 ... ·  3 天前  
新浪科技  ·  【#千挂科技收缩业务全员降薪#】9 月 ... ·  3 天前  
51好读  ›  专栏  ›  硅谷密探

智能二元论:机器通往人类智能的曲折之路

硅谷密探  · 公众号  · 科技媒体  · 2017-04-25 08:53

正文

导言:在机器上实现人类水平的智能是人类追寻了超过一个世纪的宏愿,大量的科学家将毕生的精力投身于这一使命,取得了显著的成绩,智能技术已经在搜索,推荐,自动化,邮件过滤,科学研究等方面渗入了我们生活的各个角落。特别是2009年以来,机器学习在深度模型的推动下,在语音识别,图像识别和翻译上取得了历史性的突破,超越了人类执行某些任务的能力。但是,“下一个10年将实现人工智能“的誓言却迟迟没有实现,我们目前的技术只能在狭小并具有明确定义的领域发挥功能,这种自动化而非智能化技术的领域扩展性还是一个重大瓶颈,而真正的智能技术还有待我们长期的和深入的探索。


过去几十年我们在人工智能的努力,使我们有理由庆祝在人工智能领域所取得的成就,但是不可避免地出现一个问题 - 我们离人类水平的智能还有多远?未来让人充满期待,但要让机器到达人类智慧的程度是相当不容易的,这是由于智能的“二元论”决定的。2016年初,吴恩达在百度AI大会上表示,深度学习的领域已经被证明是非常有潜力的,它能很好地完成人类在一秒时间内完成的任务,什么是这些任务呢?这些主要是不需要进行逻辑思考的启发式(Heuristic)任务,比如语音识别,图像识别,以及其它各种时间和空间域的分类和关联。


上世纪80年代,Hans Horavec、Rodney Brooks、Marvin Minsky和其他很多人就发现了“莫拉维克悖论”,即“对人类相对较容易的低级感应技能需要大量的计算资源,而对人类难度较大的推力技能通常需要非常少的计算量”。深度学习的突破在一定程度上证明了莫拉维克悖论的正确性,随着计算能力和可用数据的指数增长,“人类容易”的感官任务是目前深入学习的最擅长的。但让机器达到人类智真正让人兴奋的不仅仅是感知能力,更是推理能力、概抽象和常识。正如John McCarthy指出的那样:“AI的认识论部分与启发式部分一样充满潜力”。智能的边界内还有很大一部分仍然没有得到突破,而且有可能很多领域在很大程度上超出了我们目前的解释能力。


感知(Sensation)和知识(Knowledge)的联系和区别


通过计算的方式追求人工智能的历史可以追溯到1950年Alan Turing的论文中提出了的一个著名的问题:机器可以思考吗?而人类对智能的探索则则可以追溯到数千年前,古希腊哲学家柏拉图在《Theaetetus》中通过和其弟子的对话形式来探讨感知(Sensation)和知识(Knowledge)的联系和区别。柏拉图认为感知不能成为我们知识的根源,因为感知是不可靠的,而只有不变的形式才能成为知识的承载。比如,没有两个人会以同样的方式听到或看到同样的事情,因此也不会以同样的方式感知到信息,建立统一的模型,这种差异是没法描述和修正的,因此是不可靠的。柏拉图进一步阐述,感知总会欺骗人们,因为“身体本身需要被滋养,它可以有一千种方式让我们忙起来...感知不会给予我们真实的形式,但认知却可以”。


这个观点是否恰恰说出了深度学习所面临的局限和挑战?使用相同的数据,相同的模型结构,和相同的训练方法,但可能会产生不同的模型和输出。在许多感知领域使用人造神经网络只能理解到启发式层面,我们经验性地判断特定的训练算法和参数能够与特定的数据一起工作。


当然,还有另一方的观点。柏拉图最著名的学生,亚里士多德,则认为经验是所有知识的关键组成部分。换句话说,他认为知识是感知的结果和输出。柏拉图与亚里士多德之间的关键争论是,经验性的观察能否最终产生理性知识,这一争论已经持续了数千年,不过至今仍然没有结论。


在可感知的世界中里的事物很像表格,我们的感官确实有助于我们收集他们,但是我们不能完全相信我们的感官,因为我们经常高估感官的体验,忽视了感知只是在模仿现实。以John Searle的“Chinese Room”的比喻为例,给出一套中文元素与英文元素相转换的手册,任何一个不懂中英文的人都可能成功将中文翻译成英文,反之亦然。但是,核心问题是这个人是否是智能的。在这个例子中,什么是智能的主体?智能的本质存在于手册而不是房间或者代理,即使这些代理表现出智能的水平,并可能被认为是智能的,但实际上它们可能只是代表智能主体的不智能前端。


“智能是获得,代表,存储,转让和利用知识的能力。 要了解智能,我们需要首先了解知识”。那什么是知识? 在 “Theaetetus”中,柏拉图认为“真实知识”是具有三个特征的有界概念:真实信念、复合构成和逻辑结构。在我看来,柏拉图关于智能的定义可能太狭隘,但他是少数早期的哲学家里睿智地指出:看似智能的结果,并不等同有知识,也不一定是智能本体。


描述知识(Knowledge by description)和经验知识(Knowledge by acquaintance)


苏格兰哲学家James Frederick Ferrier在1854年首先提出了Epistemology,在希腊语中的意思是“认识论”。他认为知识有三种: “技能知识”(knowing how),“命题知识”(knowing that)和“经验知识” (knowledge by acquisition),这三种知识在获取方式,表现形式和使用场景上是不同的。 他举例说:骑自行车是“技能知识”,这需要重复练习从而获得技能,但这种技能不会对设计更好的自行车提供帮助。自行车设计的知识是“命题知识”,需要在物理学中通过学习和逻辑思维获得 。20世纪初的英国哲学家罗素(Bertrand Russel)升华了认识论,并将其一分为二,分成了”描述知识”(knowledge by description)和” and “经验知识”(knowledge by acquaintance),我个人认为,这是一个在形式和实质上都更准确的分类。


将“描述知识”与“经验知识”分离的核心是理性化(rationalization) -- 描述知识被认为具有理性,有逻辑,可理解,而经验知识则不具有这些特性。J.F.Ferrier和Bertrand Russell对知识的二元论也是柏拉图关于“感觉与知识”论证的遗产,对许多哲学家来说并不罕见。 罗纳德·德苏萨(Ronald de Sousa)也论述了“双轨”心智,追踪“直观”和“分析”的心理过程,通过大脑和身体的合作创造出全面的思维,即思考和感觉 - “我知道是对的“,”我觉得是对的“有很大的距离。


“描述知识”和“经验知识”的另外一个重要区别是可移植性 -- 经验知识是一种隐形知识,很难描述和总结,因此在一个实体和领域中获得的经验知识很难传递到其它实体或者领域中;而描述知识则是显性的,本身具有很强的传递性,可以被反复地验证和迭代。这种传递性的缺失也是柏拉图不把感知归类于“真实知识”的重要原因之一。


这种“知识”的二元论将过去60年的人工智能研究很自然地一分为二。第一波人工智能的研究浪潮从二十世纪五十年代开始,是由理性主义者所引领的。Simon 和 Newell这两位人工智能的先驱,创建了有界理性(“bounded rationality”)的理论,而这个理论来自于他们发现人类做决策不是基于最优选择,而是选择相对满意的那个。这种机制是建立在以逻辑方式形式化这些问题的基础上的,认为任何不可理解的东西都不能解决,因此在这个时期逻辑是智能的关键,而以机器学习为代表的经验知识则不被看作智能的一部分。


理性主义主导了20世纪50年代到90年代人工智能研究的大趋势,并在20世纪80年代的“专家系统”达到高潮。相对来说,机器学习领导的经验主义直到20世纪90年代才逐渐被人工智能的主流接受。而机器学习早在50年代后期就被罗森布拉特(Rosenblatt)开创,他开发了感知器(Perceptron),证明了通过机器识别手写字母的潜力训练。另一个人工智能先驱汉斯·莫拉维奇(Hans Moravec)也曾在80年代表示“智能不仅是一种符号性的方式”,而且致力于研究机器人领域的启发式方法。随着计算能力和可用数据的指数增长,机器学习最终克服了可扩展性和维度诅咒的障碍,经验主义开始在世纪之交逐渐成为主导;而对于理性主义而言,人的认知的可扩展性约束基本没有变化,从而陷入停滞。人工智能的硬币终于在21世纪初翻转了。


人工智能的二元论:相同硬币的正反两面


在David Gelernter最近的一本书“The Tides of Mind”中,他描述了人类的两种意识 -- down-stream spectrum with story vs. up-stream spectrum with logic。语音识别(音调和音量)、气味、形象、想象力和做梦都是low-stream of the spectrum,这些通常是本能的、条件反射的、情感的和生动的。而语言、推理属于up-stream of the spectrum,这些活动通常是逻辑性的、结构化的,复合的。深度学习的最新成果在很大程度上发生在感知世界, 主要是通过大规模的机器学习以及大量的数据获取“技能性知识”(knowing how),属于down-stream的活动。但是如果我们认为人工智能的目标还包括up-stream spectrum,逻辑和理性的头脑,我们离此目标还有很大的距离。


智能本身是复杂的,存在不同的类型和形式。“描述知识”和“经验知识”是否可能存在共享的架构?换句话说,感官智能是否能最终导致逻辑智能?2500年前柏拉图就问过同样的问题,而到今天,这个问题还没有确定的回答。虽然我们的工作是建立在“智能可以抽象成算法和模型”的基本假设上,但正如John McCarthy曾经说过的那样,其根本问题是在于“我们尚不能总体的描述怎么样的计算程序才能称之为智能?”


我相信James Frederick Ferrier和Betrand Russel在对知识的认识上是比较全面,他们将知识分为两类,一类是”how”,主要是通过经验获得,一类是“that”,主要通过逻辑来获得。“技能性知识”(knowing how)是学会铭记,来自于记忆,有很多的细节和详情。持续的重复这些特定的感知任务必然会加强了完成相应任务的能力,通过重复来了解那些微妙细节的异同,这就是深度学习训练过程中发生的事情;相反,命题性知识(“know that”) 是学习去忘记,通过过滤非关键信息,只关注关键的信息,通过逻辑的思维,细节上的区别变得模糊,共同点开始脱颖而出,从而上升到规则,概念甚至是常识。当我们面临巨大的信息时,我们利用提出一些列假设来加速过滤过程,因此正如Newell的有界理性理论(“bounded rationality theory”)所述,这种以假设为基础的逻辑思维方式收敛于局部最优解。因此,“技能性知识”(knowing how)和命题性知识(“know that”)很可能在架构上是不兼容的。但并不表示他们不能共同工作,恰恰相反,现代脑科学已经证明人类负责感知的右脑和负责逻辑的左脑常常是通过合作完成某项任务。


这种二分法的智能观也有其神经科学的根基。David Marr在1971年提出互补学习系统(CLS)中,为智能的实现提出了一个理论框架:有效的学习需要两个互补系统,海马体(Hippocampus)和大脑皮层,分别负责经验数据分析和理性逻辑。海马体是“快速、偶发、独立、启发式”的,而大脑皮层是“缓慢、泛化、组合式、结构化”的,这两个在特征、功能、表征和组成的不同,暗示了这两种智能在架构和机制上的迥异。


智能是个复杂的现象,本身就是一个需要解决的大问题。这种智能的二元论观点只是提供一个角度来审视其复杂性,并提供潜在的提示。凭借今天的深度学习技术,我们已经征服了智能的部分领域,大部分是感知层面,但还有更多的神秘领域有待我们继续探索。我们现在离理解人类智能的很多方面,比如推理,抽象,泛化,意识,梦想,记忆,想象力,还有很大的距离。另外一些问题我们还甚至无法解释,比如2014年Sr Roger Penrose领导的团队在大脑中发现了量子波的存在,到底智能和量子存在怎么样的联系? 但无论怎么样,我们应该庆祝当前的进步。往前看,智能的二元论告诉我们,在追求实现智能的路上我们需要持续的努力。


作者简介:



Michael Wei(卫岸)是Samsung美国人工智能实验室总监。 他负责人工智能的技术战略,研究路线图和人工智能的重点项目。 在三星之前,Michael Wei在智能领域方面拥有15年的专业经验,曾在朗讯贝尔实验室,IBM沃森,A.T.Kearney和华为任职。 他成功的帮助沃尔玛,华为和三星建立AI的研究团队和实体,在人工智能极人工智能商业化领域有卓越的领导力。


See more at: http://aibusiness.org/dichotomy-of-intelligence-a-thorny-journey-towards-human-level-intelligence/#sthash.JZ3Hq4dq.dpuf


点击“阅读原文”了解更多