人物 | Yann LeCun：让Facebook学会思考的人

机器之心 · 公众号 · AI · 2017-04-18 14:47

正文

选自BuzzFeed

作者：Alex Kantrowitz

机器之心编译

Yann LeCun 是深度学习研究领域内一个响当当的名字。作为 Facebook 人工智能研究团队（FAIR）的领导者，他正在帮助这家世界上最大的社交网络公司创造能够理解用户发布的文本、照片和视频等内容的人工智能。近日，美国著名网络新闻媒体 BuzzFeed 发布了一篇对 Yann LeCun 的专题特写文章，从人工智能的发展历史以及机器视觉、语音和更深层次的思考等角度对 Yann LeCun 的研究经历进行了描绘，其间也穿插着 LeCun 对相关主题的评论和解释。机器之心对这篇特写进行了编译，希望能够帮助你更好地了解 LeCun 以及他在 Facebook 的研究状况。

距离 Facebook Menlo Park 总部 3000 英里远，曼哈顿市区的一间老旧的米黄色办公建筑中，一组公司职员正在做项目，但这些项目看起来更像是科幻小说类的，而并非适合社交网络的项目。该团队就是 Facebook 人工智能研究室（内部称之为 FAIR），他们只专注于一个目标：创造人类同等水平智力的计算机。虽然离终点线还很遥远，但他们 2010 年前后已经取得了让人难以置信的进展。他们的人工智能程序绘制的画作与人类艺术家相比难以区分；在从 Wikipedia 拣选的主题上做测试；玩《星际争霸》这样的视频游戏。慢慢地，人工智能程序变得越来越聪明。某天，它们可能会把 Facebook 这个社交软件，变成你的朋友。

由于这些或其他原因，FAIR 并非典型的 Facebook 团队。该团队并非直接服务于这家价值 4100 亿美元公司及其超级受欢迎的产品：Instagram、WhatsApp、Messenger 和 Facebook。FAIR 最终的目标可能还有数十年之遥，也可能永远无法达到。而且，该团队不是由典型的那种硅谷成功者领导，而是由 56 岁的学术人士 Yann LeCun 带领，他曾经历过真正的失败并成功归来。他有关人工智能的一度被反对的理论如今被视为世界一流的理论，Facebook 的慷慨解囊证明了他自己。

LeCun 向 BuzzFeed News 表示，「你与数字世界的交互、你的手机、你的计算机，都将被改变。」

FAIR 正在改进计算机听、看和交流的能力，其成果现已渗透进了 Facebook 的产品之中，比如 News Feed 排名、相机、照片滤镜等。Facebook 做了极大的投资，不只是因为人工智能很有趣，还因为很必要。在今天的整个科技领域，公司们都在以人工智能为基础进行竞争。Uber 的人工智能驱动的自动驾驶汽车是其驾乘共享战略的核心。依赖于人工智能的 Google Home 智能音箱能回答用户在搜索栏内输入的问题。亚马逊正在使用人工智能收银员建立便利店，从而瓜分价值 6740 亿美元的食品百货市场。

而在 Facebook，人工智能无处不在。例如人工智能驱动的照片滤镜，正在帮 Facebook 应对 Snapchat 的挑战。人工智能查看图片、发现图片内容、进而决定你的推送内容的能力，使得 Facebook 拥有不可抗拒的用户体验。而且，类似的技术正用于监控骚乱、恐怖和色情内容，将其标记并清除。

Facebook 应用机器学习团队（AML）的负责人 Joaquin Candela 表示，「人们在 Facebook 所有产品上的体验都极大地依赖人工智能。」AML 团队要做的是把研究实践到平台上，「如今 Facebook 的存在不能没有人工智能，确确实实如此。」

随着该领域的进步，Facebook 将依靠 LeCun 和他的团队帮助自己保持竞争优势，因为无论是新的还是旧的竞争对手都很有可能也会拥抱这一技术。

被质疑和排斥多年之后，LeCun 最终还是成功了，现在他有：80 位研究员、Facebook 大量的资金支持、主流大众的信任。他现在所要做的就是拿出实际的东西。

LeCun 在曼哈顿

视觉

从小开始，LeCun 就相信他能让计算机获得视觉。面部识别和图像检测如今可能已经标准化了，但是当 LeCun 在 20 世纪 80 年代早期还是巴黎的一位大学生时，计算机却是「瞎的」，不能理解图像中的任何东西，也不能搞清楚摄像头内发生了什么。在大学的时候，LeCun 无意中发现了一种方法，但这种方法从 60 年代开始就没人研究了，而他认为这种方法有潜力「让机器学习多种任务，包括感知。」

这种方法被称为人工神经网络，它采用具有小型互连传感器的系统，把内容（比如图像）分割成小部分，并基于整体输入识别模式，确定看到了什么。在阅读了关于神经网络的争论之后——它们难以训练、不是特别强大——LeCun 决定继续坚持，尽管有疑问还是读了专注于研究这一领域的博士学位。谈到这些批评他说：「我只是不相信它。」

人工智能领域的艰难时刻出现得如此频繁而猛烈，以至于它们有了自己的专用名称：人工智能冬天（AI Winter）。这些情况发生的原因很大程度上是因为研究者得到的结果比不上他们给出的愿景，这让人们觉得这门科学没有效果，进而导致资金和人们的兴趣枯竭，最终阻碍了其技术进步。

LeCun 也经受过人工智能冬天的考验。当他在 90 年代中期进入贝尔实验室从事人工智能研究时，AT&T 的内部冲突导致了他们团队的破裂，那时候刚推出了可以读取支票的 ATM（这种基于神经网络的技术至今仍在使用），LeCun 相信他们刚要取得明显的进展。「这整个项目基本上就是在这项技术变得真正成功的时候被解散了，」LeCun 说，「这真的让人很沮丧。」

与此同时，其他方法也得到了主流研究者的青睐。也许这些方法不久后就会不再流行，但它们的崛起足以将神经网络推向该领域领先的地位。在 21 世纪初，其他学者甚至不允许他们在学术会议上提交他们的论文。「计算机视觉社区基本上是拒绝他的，」神经网络先驱、多伦多大学教授和谷歌工程师 Geoff Hinton 说：「其他人的观点是他进行的研究在 80 年代时看起来还有点希望，但现在他也该清醒了。」他补充到，「现在这个观点已经不存在了。」

其他神经网络研究者也遇到过类似的问题，蒙特利尔大学教授、蒙特利尔学习算法研究所的主任 Yoshua Bengio 曾经一度很难找到愿意与他合作的研究生。他说：「我不得不帮助我的学生在这个领域工作，因为他们害怕在博士毕业后会找不到工作。」

在 2003 年，LeCun 已经为实践打下了基础。那年，他加入了纽约大学，并与 Hinton 和 Bengio 共同努力复兴神经网络。LeCun 笑着说：「我们开始了我一直说的『深度学习阴谋（Deep Learning Conspiracy）』。」

「深度学习阴谋」在这一领域发挥了关键性作用，其成功基本上是因为坚持相信：不需要为每种你想要检测的对象构建单独的专用神经网络，而是可以使用同一个模板来构建一个能够用于检测图像、视频和语音的神经网络。也就是说，不需要为检测企鹅和猫分别构建神经网络，而是可以构建一个单一的神经网络来同时检测这两者并将两者区分开。这些新的神经网络也可以修改后用于其它任务，例如检查音频声波来检测语音的模式。

这种「阴谋」研究受到了两个重要因素的推动：计算能力的增长（有助于神经网络的处理速度满足实用需求）和可用数据（图像、文本等）的指数级增长（这些数据源自互联网的广泛应用，能够帮助网络变得更加聪明）。最终，这些因素催生了一种灵活、高速、准确的方法，为该领域带来了新的可能性。

在 LeCun 及其伙伴的基础设置之上，计算机视觉在 21 世纪 10 年代早期迎来了爆发。计算机开始可以识别图像中的物体，然后可以识别视频中的物体了，再然后可以直接在相机中实时工作了。现在，你只需要拿摄像头对着一个篮球，人工智能就能识别它看到的是什么。LeCun 很快就从边缘人士转变成了该理论的领头人。「在短短一年之内，就从没人研究它变成了所有人都在研究它，」LeCun 说，「这真的很疯狂——完完全全地疯狂。」

2013 年 12 月，LeCun 加入了 Facebook——对于一个想要将人工智能研究应用于照片的人来说，Facebook 有一个完美的环境。这个世界最大的社交平台上有数以十亿计的图片，为 LeCun 等研究者提供了可以实现新想法的巨大画布。FAIR 也常常和 AML 团队合作，将其研究推广到 Facebook 的实际产品中。这两个团队都构建了能将进展推广到整个公司层面的新系统。AML 正在使用 FAIR 的研究来确定应该在用户的 News Feed 中呈现什么内容以及在 Facebook 内进行内容翻译；他们也将一些研究部署到了 Facebook 的相机中，创建了能对你的表情做出反应的特效。

人物 | Yann LeCun：让Facebook学会思考的人

正文

请到「今天看啥」查看全文