专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
爱可可-爱生活  ·  【[168星]DeepMesh:用AI生成高 ... ·  昨天  
爱可可-爱生活  ·  【[37星]DiffMoE:PyTorch实 ... ·  昨天  
爱可可-爱生活  ·  价值观画像:为人类多样性编码的突破 ... ·  昨天  
爱可可-爱生活  ·  [CL]《Inside-Out: ... ·  昨天  
爱可可-爱生活  ·  [LG]《Don't lie to ... ·  2 天前  
51好读  ›  专栏  ›  机器之心

Yoshua Bengio TED演讲谈人工智能的崛起:无监督学习是深度学习突破的关键

机器之心  · 公众号  · AI  · 2017-05-21 14:21

正文

选自TEDx

机器之心编译

参与:李亚洲、吴攀


在 2016 年 9 月 24 日举办的 TEDxMontreal 2016 上,深度学习领域的著名学者 Yoshua Bengio 发表了主题为《使用深度学习的人工智能的崛起(The Rise of Artificial Intelligence through Deep Learning)》的演讲。近日,TEDx Talks 官方在 YouTube 上发布了该演讲的视频。机器之心在本文中对该演讲的主要内容进行了整理介绍。


演讲主题 :在深度学习进步的推动下,人工智能领域正在发生革命。我们离实现人类水平的人工智能还有多远?我们未来还面临着怎样的难题?Yoshua Bengio 相信每个人都应该理解人工智能的基本思想。民主化这些问题是很重要的,这样在面临人工智能将带来的重大变革时,我们的社会才能做出最好的集体决策,以使这些变革能有利于我们所有人。



我们的世界一直在发生变化,其中对未来会有巨大影响的一件事就是人工智能,它将带来另一场工业革命。


之前的工业革命增强了人类使用机械的能力,而此次第二波的机器纪年(Machine Age)将会增强我们的认知能力与心智(mental power)。计算机不只是要替代体力劳动力,还有脑类劳动力。所以,我们今天到了哪一步?


你可能在去年三月份听过,一个名为 AlphaGo 的机器使用深度学习击败了世界围棋冠军。围棋是中国古老的棋类游戏。对计算机而言,围棋要比象棋更难掌握。经过十几年的人工智能研究,我们是如何做到的呢?


首先,通过反复观看强大的人类棋手所下的千万手棋来训练 AlphaGo,然后自我博弈百万局。机器学习使得机器能从样本、数据中进行学习,它是将知识填充到计算机中的关键。这非常的重要,因为有知识才能产生智能。


向计算机填充智能曾是先前人工智能方法的难题。为什么呢?因为大脑中的许多东西都是直觉性的,我们无法用言辞表达它们,对这种直觉性知识没有意识过程。那如何向计算机编程这种知识呢?解决方案又是什么?


解决方案就是让计算机自己去学习这种知识,就像我们人类一样。


我的工作对发现、理解通过学习的智能的原理有所贡献,无论是人类、动物还是机器学习。


我和其他人相信,机器学习像物理学一样,有一些简单的理论能解释智能并帮助我们建立智能机器。例如,空气动力学,它足够综合,能够解释鸟类、飞机的飞行原理。如果能够发现一种简单的理论解释智能,是不是很惊人?现在,我们已经有所进展了。


我和我的合作者在神经网络与深度学习领域的研究对人工智能革命有所贡献,它们是机器学习的一种方法,受启发于大脑。深度学习的崛起开始于 2012 年,手机上的语音识别使用到了神经网络。不久之后计算机视觉也迎来突破,计算机如今在识别图像中内容上已经做的非常好了,甚至过去五年在某些基准上已经达到人类的水平。现在,计算机能够直观的理解一个围棋棋盘视觉外观,这种能力可媲美于最好的棋手。


最近,随着我所在室验室的一些发现,机器翻译也用到了深度学习。这项工作扩展了计算机理解、生成自然语言的能力。但不要被欺骗了,我们离一台全能的机器还非常遥远。例如,计算机还不能像一个 2 岁儿童那样学习,事实上 2 岁的儿童能掌握直观地物理世界,她知道丢球时球会下落,泼水时会一团混乱,但她的父母并为教过她牛顿力学或微分等式。她以无监督的方式自己学习了这些知识。


无监督学习是现在人工智能的一个重大挑战,可能还要花费数十年的时间才能解决。无监督学习尝试找到数据的表征,让我来演示一个例子。



我们眼睛看屏幕上的页面,在计算机看来就是一张图片,一堆的像素。为了回答关于此图像内容的问题,你需要了解它的高层含义,这种高层含义对应大脑中的最高层表征。向下,你了解单个词的含义;更往下是组成单词的字符,这些字符可用不同的笔触、不同的方式进行渲染;而笔触由 edges 构成,edges 由像素构成。所以里面有不同层级的表征。



但像素来表达图像的含义还不够,还不能回答有关图像内容的高级问题。你的大脑其实有这些不同等级的表达。从皮质的首个视觉区域 V1 中的神经元开始,识别 edges。皮质的第二个视觉区域 V2 识别笔触和小形状。更高级别上,你有检测物体部位的神经元,然后是整个物体和全部画面。



使用图像训练神经网络的时候,它们实际上就能够发现这些不同层级的表征,与我们在大脑中观察到的一样。我们大脑中的神经网络与机器中的深度神经网络都能学习不同层级表征间的转换,用更高的层级对应更抽象的概念。例如字母 A 的抽象概念可用低等级的不同方式进行渲染,因为许多像素的构成由位置、旋转、字形等决定。







请到「今天看啥」查看全文