沈向洋：每一个人的人工智能

微软科技 · 公众号 · 科技媒体 · 2017-01-16 19:00

正文

编者按

1月14日，未来论坛2017年会暨首届未来科学颁奖典礼在北京拉开帷幕，微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋受邀在此次论坛上发表了主题演讲。本文包括沈向洋博士此次演讲内容的视频和文字整理，希望与大家分享微软对人工智能的理解和对未来的美好愿景。

人类今天面临的最重要课题之一就是人工智能。纵观人类历史上的诸多创新，像汽车、印刷机、蒸汽机、载人飞机、火箭和人造卫星……它们都不只是孤立的创新，更是推动人类在浩瀚无垠的各领域里迅猛发展的加速器。

人工智能也许是迄今为止最强有力的加速器，因为它不仅使人类的能力得以延展，还让我们的脑力变得更加强大。它不仅仅是数字时代的一个进步，而是包括图灵在内的很多人，在电脑诞生前就梦想到的终极目标。大型机、个人电脑、互联网、移动电话、云……这一切都是人工智能的前奏。

回溯过去几十年，人工智能的发展历经高潮与低谷。现在又有哪些不同？三大创新最终将人工智能带上了快车道。互联网、大数据和传感器随处可见；特别是基于云平台的大规模计算能力；得益于突破性算法的发展，计算机已经可以凭借深度学习独立完成更为复杂的任务。

正因为这些突破，人工智能已经无处不在——它可以为你推荐所选，保护你免受信用卡诈骗，个性化处理你的新闻推送，并让你的家智能互联。微软正在保护你的Outlook邮箱不受垃圾邮件骚扰，并赋予智能聊天机器人小冰以声音与个性。然而即便如此，我们现在不过是触碰到了人工智能潜力的冰山一角。

对于微软而言，人工智能不只是一个关注的焦点，更是我的第一要务。过去25年来，我们一直在通过各种方式为这一轮创新做准备。25年前比尔·盖茨创建微软研究院时，他就曾设想有一天创造出通用人工智能，一个会看、会听、能讲，并且能够理解人类思维的电脑。

多年来，我们吸引了全球的顶尖人才加入我们的研究院，一起迎接这些挑战。我们的国际团队是首屈一指的。锦上添花的是，我们刚刚宣布收购Maluuba，这是一家总部位于加拿大蒙特利尔的公司，拥有全球最领先的人工智能研究和工程团队。

除此之外，作为全球最重要的深度学习研究专家之一、蒙特利尔学习算法研究所所长和Maluuba顾问，Yoshua Bengio也将成为微软顾问，并直接和我互动。

我的团队已经取得了一些激动人心的突破。就计算机视觉而言，我们的视觉算法正接近人类的水平！微软在诸如ImageNet 1K这样的图像识别比赛中屡次斩获大奖。更令人兴奋的是，我们在视觉算法方面的成果已经被用在微软自己的产品上，比如HoloLens；同时也运用在日常应用上，比如为UBER这样的客户验证驾驶员身份。

计算机正在学习像我们人类一样去看，并为它们识别出的东西命名。现在它们也能像我们人类一样倾听和识别语音。三个月前，微软的语音识别技术在行业标准Switchboard测试中首次达到了人类同等水平，而这个目标在几年前还看似遥不可及。

随着我们在语音识别领域能力的提高，我们在面对诸如自然语言等更复杂的挑战上也取得了实质性进展。世界上有6500多种语言。试想如果我们都能相互理解，这将意味着什么！就在上个月，我们的Microsoft Translator取得了巨大的飞跃。Microsoft Translator能实现包括中文普通话在内9种不同语言之间的实时语音翻译，最多允许100人同时进行群组交流。我们采用了一项令人兴奋的深度强化学习技术，并在此基础上运用了对偶学习，来加速提高翻译能力。

我们正在接近目标，让计算机可以做某些人类力所能及的事：看、听，并开始描述它们周围的世界。但人类更了不起的地方在于，我们不会止于感知，我们会继续向认知深入。我们会将想法、概念与世界上的人、地点与事物联系起来……并了解它们彼此的关系。这就是我们所说的“常识”。

这对人类来说再普通不过，但对计算机来说却是一项异常艰巨的任务。多年来，源于在必应搜索（Bing）的研究和实践，我们建立了一个庞大的知识图谱。我们了解数十亿计的实体——人、地点、事物。我们既拥有“关于世界的知识”，也拥有令人叹为观止的 “关于工作的知识。”以Office 365和LinkedIn为例，通过将这些特有的工作数据与视觉、语音以及语言识别能力相结合，微软就可以打造出能将个人生活与职场生活统一相连的人工智能助理。

虽然取得了这些进展，但人工智能还未能实现通用智能。计算机可以顺利完成特定任务，但当面临通用任务时，它还不如一个小孩做得好。我们在人工智能涉及的所有领域里都已取得了巨大的进步，但要实现通用的人工智能，仍有很多工作要做。

首先，我们要让计算机理解我们，而不是强迫人们去理解计算机。实现这一想法的核心在于双向对话：计算机很难像“人类”一样讲话。我们称之为“对话式人工智能”，这也是人机交互下一步要实现的目标。

回溯图形用户界面的诞生，它让每个人都能使用个人电脑。而对话式人工智能更是颠覆性的。我们能在任何地方使用它，不再受屏幕与键盘的束缚。我们也不必再去适应计算机的规则。相反，计算机会来理解我们。当计算机能像“人类”一样说话时，每个人都可以和计算机对话与协作。

沈向洋：每一个人的人工智能

正文

请到「今天看啥」查看全文