专栏名称: 网易科技
网易科技频道,有态度的科技门户。
目录
相关文章推荐
51好读  ›  专栏  ›  网易科技

搜索手机都没抓住,靠人工智能微软能再次领先吗?

网易科技  · 公众号  · 科技媒体  · 2017-06-26 18:55

正文

约书亚·本吉奥与纳格拉杰·卡什亚普


网易科技讯 6月26日消息,《连线》网站撰文深度揭秘微软在人工智能领域卷土重来背后的故事。该科技巨头正在深度学习领域奋力追赶领跑的谷歌和Facebook,它的未来发展很大程度上要看它在人工智能上的作为。


以下是文章主要内容:


约书亚·本吉奥(Yoshua Bengio)从来没有选过边。作为缔造出如今主导人工智能的深度学习技术的三位学者之一,他俨然成为了明星。该领域太新了,全世界能够推动其发展的人少之又少,但每一个人——从科技创业公司到跨国大公司,再到国防部门——都想要获得他们的智慧。


然而,正当他的同行科学家雅恩·乐昆(Yann LeCun)和杰弗里·辛顿(Geoffrey Hinton)已经分别签约加盟Facebook和谷歌之时,现年53岁的本吉奥却选择继续在其位于蒙特利尔大学小山顶校区小小的三楼办公室工作。“我想要保持中立角色。”他一边喝着铁锈色的甘草水一边说道。


跟上一世纪的核科学家一样,本吉奥非常清楚他所发明的工具的威力无可估量,对于它的发展,必须要深谋远虑。“我们不希望一家或者两家公司成为AI领域唯一的大玩家,我不想说出它们的名字。”他说,抬起眉毛示意我们都清楚他说的是哪些公司。一家公司在门洛帕克,另一家在山景城。“一家独大或者两家独大对于整个社区不是好事,对于人类也不是好事。”


正因为此,本吉奥近期选择了加盟微软。


是的,他选择了微软。他认为,昔日的Windows王国有能力成为第三大AI巨头。这家公司拥有所需要的资源、数据、人才以及最重要的愿景和文化,去不仅仅认识到该门科学可带来的成果,还推动该领域的发展。1月,本吉奥同意出任该公司的战略顾问,此举引起了整个业界的关注。这让微软一跃成为AI领域最大的理念、人才和方向指引输出来源之一。同时它也是一个强有力的信号:微软实际上有机会让AI领域的统治从双重奏变成三重奏。


沈向洋的重任


沈向洋


负责签下本吉奥的那个人是位计算机科学家,头发灰白,戴着一副线框眼镜,名字叫沈向洋(Harry Shum)。他曾连续多个月用尽一切招数去招募本吉奥。“他实际上来过这里,就在这个房间里。”沈向洋告诉我,面带微笑,似乎在表示他知道外人可能会觉得自己被一位眉毛夸张,在谷歌学术搜索中被引用过6.9616万次的高个加拿大人迷住很不可思议。


我们坐在34号大楼五楼宽敞的会议室里的灰色沙发上,另一边站着负责看守微软高层办公室的保安人员。沈向洋负责微软所有的AI和研究工作,他刚刚完成了下一周Build开发者大会的最后彩排,想要给我演示一些产品。因此我一下子看到了很多令人印象深刻的东西!在一个实验室,Skype团队的自动翻译应用让我实时通过文字与一个德国音箱进行聊天。在另一个实验室,我看到了一款针对建筑工地的应用,它能够通过计算机视觉检测工地是否存在安全违规行为或者未被授权的来访者。在另外的一个实验室,微软帝国的AI女神Cortana从我的邮箱扫描出我对别人作过的承诺,并提醒我要履行那些承诺。


沈向洋过去几年致力于帮助微软CEO萨蒂亚·纳德拉(Satya Nadella)兑现其围绕人工智能来重塑微软的承诺。2014年3月,即纳德拉被晋升为CEO后的那个月,沈向洋第一次向微软的领导团队发出行动呼吁。从一开始,他就常常与纳德拉和另一位同事陆奇会面,商讨制定最好的策略来将AI技术整合到微软的产品当中。去年9月,沈向洋领导公司的重组工作,整合研究人员和产品团队组成人工智能与研究部门。该部门如今越过微软的三大核心产品团队:Windows、Office和云项目Azure。沈向洋表示,公司希望“我们能够加速从研究到产品推出的周期”,更加快速地给消费者带来AI的好处。


微软迫切需要这么做,毕竟各家大型科技公司都在力图打造更好的AI产品和服务。除了Facebook和谷歌以外,IBM、亚马逊和苹果也都认为它们的未来将取决于其对深度学习技术的掌握程度。在去年秋天据称因为骑车受伤而离开微软后,陆奇近期快速恢复身体健康,加盟中国的AI领跑者百度出任首席运营官。


具有强烈讽刺意味的是,人工智能曾经是微软失败过的领域。1990年代初期,该公司吸引到该领域顶尖的研究者的加盟,致力于研究语音识别和视觉技术。但在此后的十年里,他们的研究停滞不前。一家曾经掌控几乎每一台台式机和笔记本电脑上的软件系统的公司,眼睁睁看着更年轻、更时髦的创业公司统治移动领域,并开发工具带来我们所有人都喜欢的新云端办公方式。微软的研究人员被有意孤立,因此他们可以大胆想象未来,而完全没有市场的压力——但正因为此,他们的发明鲜少能够走出实验室。例如,比尔·盖茨(Bill Gates)曾在1998年展示一项地图技术,但它却从未进入市场;谷歌于2005年推出地图服务。在那个时期的很大一部分时间里,AI研究也停滞不前,因为没有取得实质性突破所需的计算处理能力和海量的数据。


AI走出漫长的寒冬期的时间要比微软早得多。在2013年Facebook和谷歌分别招来乐昆和辛顿这两位业界大腕的时候,微软已经变得没以往那么有影响力了。该公司错过了移动浪潮。它很晚才进去云计算市场。正当竞争对手们加倍投资深度学习之时,微软却深陷过去的泥潭,宣布计划斥资70亿美元收购诺基亚的手机部门。该笔收购的资产价值没多久就被完全减记掉。它的高层仍然脱离外界,他们在旧式的软件基础上打造出更加华丽的版本,但想要购买的人越来越少。该公司也拒绝与创造出新未来的云端创业公司打交道。风险投资公司Andreessen Horowitz分析师本尼迪克特·埃文斯(Benedict Evans)那一年曾撰写一篇题为“跟不上时代的微软”的文章。与此同时,各家硅谷巨头不断地从微软那里抢掠人才资源。看看那些从事机器学习的精英的简历,你会发现他们很多都曾供职于微软。


2014年初,微软提拔了一位几乎整个职业生涯都呆在雷德蒙德(微软总部所在地)的内向型工程师。他就是萨蒂亚·纳德拉,他可谓众人认为微软所需要的掌舵人的一个反面;来自外部、未曾浸染过微软文化的人,似乎更有可能提出展开重大的战略转变。但纳德拉在上台后针对计算的未来明确传达了一个简单的愿景,与从创始人到开发者的所有人建立起了良好的关系,同时给公司重新带来了紧迫感。3年前微软并不在科技巨头行列的讨论范围之内,如今则不一样了,它的名字在这种讨论中从未被遗漏。


然而,微软要取得成功,它必须要做的不仅仅是在云计算市场超过亚马逊,或者说服所有人尝试使用它的HoloLens增强现实设备。正如互联网颠覆了所有的商业模式,迫使行业重新洗牌,人工智能也将需要我们重新想象计算过程会如何展开。这也解释了为什么Facebook CEO马克·扎克伯格(Mark Zuckerberg)去年亲自打造了一个AI系统,以此作为个人挑战。(相比实践行动,他更擅长编程。)同时也解释了谷歌CEO桑达尔·皮查伊(Sundar Pichai)过去两年为什么会借公司的开发者大会来推动“从移动为先转向AI为先”的进程。


在这个以AI为先的世界里,将只有少数的公司才能够获益。沈向洋的职责就是确保微软出现在获益的公司行列当中。“在这个行业,你得认识到错过了上一波浪潮也没事,”他说,“但如果你错过了现在的浪潮,那就不行了。”


Cortana


直到现在,人类都必须要学习如何使用计算机。我们学会了如何下载应用程序,记住了软件应用程序的操控指令。而AI带来的希望在于,计算程序将会反过来学习如何理解我们。我们将不再需要掏出手机里,按照一系列的提示完成任务。在这个新的时代里,计算服务将会无处不在,随处可用,包围在我们的身边。要获得它,我们需要一个向导——一个能够用简单的文字或者语音帮助我们操控这个超强的新存在的智能交谈者。微软将其称为Cortana。


Cortana相比Siri没有那么流行,能见度也明显不如Alexa,但功能上比Siri更加完备,也比Google Assistant更有吸引力。它最初是出现在Windows手机上,等于说没有人会使用它,但在上线一年内,它被整合到了范围更广的Windows生态圈里。去年,微软到处推出Cortana。(是的,它甚至成了一款iPhone应用。)据该公司称,由于Cortana预装在Windows系统中,它的月活跃用户量达到了1.45亿。该数字要明显好于亚马逊的Alexa,毕竟后者只是出现在数量不超过1000万的Echo智能音箱上。但不同于主要响应语音的Alexa,Cortana还会响应文本,而且嵌入很多人都已经拥有的产品当中。在Windows工具栏上方的搜索框进行搜索,就能用上Cortana。


艾玛·威廉姆斯、马库斯·阿什和程丽丽


虽然有的企业将Cortana整合到音箱当中,就像亚马逊和谷歌在智能音箱上做的那样,但微软的女声版本相比之下明显缺乏时代精神。沈向洋对此一点都不担心。“我们的确认为现在还只是这场竞赛的开始阶段。”他说。他援引了一项来源不详的研究称,Alexa有四分之三的时间是回答“我不知道。”“当然,那些东西将会不断改进,但业界的普遍共识是,AI的认知部分还处于初期发展阶段。”他说道。在他看来,微软现在的机会在于,将公司的核心产品和服务变得更加智能,将这种技术整合到即将于12个月到24个月内进入市场的产品。


此外,在Cortana项目经理马库斯·阿什(Marcus Ash)看来,键盘和屏幕将不会完全被声控系统取而代之。阿什负责产品的开发和出货。“我们认为,在一些情况下,语音更加方便——当我的双手腾不出来的时候,或者我想要快速说点什么来获得答案的时候。”他说,“但也将会有许多的计算设备更适合通过文本形式来提问。”


苹果或许已经率先将Siri带到消费者的手中,但Cortana要比它好用。Cortana如此好用,要归功于微软的核心资产。Cortana的驱动技术很多都来自于必应。该搜索引擎已经诞生了大约8年时间,虽然它的品牌并不是最强大的,但它的普及性要超出你的想象。基本上,任何一家与谷歌有竞争关系的大型科技公司都与微软签署了合作协议,用必应来驱动它们的搜索产品。那意味着苹果的Siri和Spotlight都由必应驱动,亚马逊的Kindle设备和雅虎、Verizon和AOL上的搜索功能亦然。美国大约有30%的网络搜索流量来自必应。“这就是Cortana实际上能够如此有用如此强大的原因,因为我们拥有来自如此多设备的数据信号。”Cortana设计经理艾玛·威廉姆斯(Emma Williams)指出,“谷歌是唯一一家能够在真正理解世界上与我们竞争的公司。”


这一点将会日益重要,因为Cortana要力争成为下一个计算模式,取得如今的智能手机一般的地位:处理你所有的计算需要的前台。阿什解释道,在微软看来,它是一个代理人,手握着你所有的个人信息,能够代表你跟其它的代理人进行互动。他说,当他走进会议室时,他的Cortana会去联系其它的机器人和数字助手,处理所有会占用我们的时间的事情。“Cortana可能会说,‘这是马库斯,这是他对这间房间的偏好,这是我需要帮他放到投影仪的东西。’”他说。


聊天机器人


如果说Cortana是向导,那么聊天机器人就是微软的问题解决者。它们是融入AI的软件的小片段,旨在自动化你以往亲自做的一次性任务,比如预订餐桌,或者完成银行交易。又或者,在马库斯所举的例子中,确保投影仪有他用在会议上的幻灯片。“聊天机器人就是你能够与之进行对话的软件。”管理多学科实验室Fuse Labs的研究者程丽丽(Lili Cheng)说。







请到「今天看啥」查看全文


推荐文章
苏米的星座馆  ·  测试,你几岁进入爱情坟墓?
7 年前
人像摄影  ·  新刊概览:《人像摄影》5月刊
7 年前
家教智慧  ·  女人30岁以后,如何做夫妻?
7 年前