Bengio和Nagraj Kashyap
雷锋网按:以Windows操作系统称霸的微软,有能力成为AI浪潮中的巨头吗?这是很多人想知道答案的问题。微软错过了移动互联网,在云计算上也走过不少弯路,仍处于追赶者的位置。在5月的开发者大会中,微软预见到人工智能会无处不在,未来属于智能云与智能边缘。那这家公司做了什么,是如何将自己转型为一家AI公司的呢?连线Backchannel的一篇长文就描述了微软AI崛起的过程,雷锋网对原文编译如下。
一
Yoshua Bengio从来没有站过队。作为现在主导人工智能深度学习的三大开山鼻祖之一,他一跃成为明星。这样一个领域只有少数的几个引领者,而从技术创业公司到跨国企业集团再到国防部门的每个人,都想要知道他们的想法。
但是,当他的科学家同伴Yann LeCun和Geoffrey Hinton分别投入Facebook和Google麾下时,53岁的Bengio则选择继续在蒙特利尔大学山顶校区的一个小办公室里工作。“我想要保持中立”,他一边说,一边从一个玻璃瓶里倒出来锈色的甘草水,啜了几口。那玻璃瓶,是他用来压住桌上凌乱的文章的。
像上个世纪的核科学家一样,Bengio明白,他所发明的工具是无可比拟的,必须经过深谋远虑广泛斟酌才能被培育出来。 他说:“我们不希望只有一两家公司成为AI领域的超级玩家,他们是谁我就不明说了。”他说到,还挑起眉毛,表示我们都知道他所指的是哪家公司。“这样的局势对社区来说不是很好。这对大多数人来说来说不是很好。”
这就是Bengio最近选择微软的原因。
没错,就是微软。他认为以Windows操作系统称霸的微软,有能力成为AI的第三个巨头。这是一个拥有资源、数据、人才的公司。最关键的是,这家公司的愿景和文化,不仅要实现科学的应用,还会推动科学的发展。今年1月份,业内都注意到,Bengio同意成为微软的战略顾问。这给微软直接提供了思想、人才和方向的最佳资源。而且这也是微软实际上有机会将AI产业局势扭转成三足鼎立的强有力证明。
二
请Bengio出山的沈向洋,也是一名计算机科学家,头发灰白,戴着线框眼镜。他磨了Bengio好几个月。“当时就是在这个房间,”沈向洋告诉我,带着微笑,表明他知道对于一个局外人来说,这可能非常奇怪,他是怎么把一个在Google学术上有69616个引用的大牛拿下的。
我们坐在34号楼五楼的一个宽敞的会议室的一个灰色的沙发上,正好在看管微软的行政套房保安的前面。负责微软所有AI和研究的沈向洋刚刚完成了一场开发人员大会的排练,他想向我展示演示。我跟着他走过走廊,健步追上。我真的是长了见识!在一个实验室中,Skype团队的自动翻译程序让我能通过文本与德国人实时聊天。我还看到一个应用程序,可以通过计算机视觉来监控施工现场是否有安全违规或不明访客。除了这些,微软帝国的AI主角Cortana扫描了我的收件箱,并提示我有哪些要做的事。
沈向洋
沈向洋已经花了几年时间帮助他的老板,CEO萨蒂亚·纳德拉,履行用AI重塑微软的承诺。在纳德拉担任CEO后不久,沈向洋就经常同他,以及另一位同事陆奇,一起商讨如何将AI融入微软的产品。去年9月,沈向洋主持了一项重组,将研究人员和产品团队组合在一起,建立一个人工智能与研究事业群。这个事业群跨越了微软的三大类别:Windows、Office和微软云Azure。 沈向洋表示这样有希望加快从研究到产品的周期,使客户能更快享受到AI的成果。
大型科技公司都尝试通过AI产品和服务来竞争。除了Facebook和Google,IBM、亚马逊和苹果都认为他们对深度的学习的掌握程度就是他们手中的筹码。而去年秋天因为自行车事故而离开微软的陆奇,最近恢复得很快,现已加入百度。
讽刺之处在于,人工智能曾经是微软败笔。上90年代初,该公司吸引了许多学者,致力于语音识别和图像识别,但十年来停滞不前。微软的研究人员与市场孤立,没有市场压力,结果是他们的发明很少得到应用。例如,比尔·盖茨在1998年展示了地图绘制技术,但从未上市,而Google在2005年推出了地图。微软在人工智能研究上长期也停滞不前,缺乏计算处理能力也没有数据来源。
微软在AI的回归,比AI的回暖迟了许久。
当Facebook和Google在2013年分别聘请LeCun和Hinton时,微软却还没什么作为。微软错过了手机和云的时代。竞争对手在深度学习上有了更大进展时,微软却一直在坚持用70亿美元买下诺基亚。在决策上,微软也只是不断更新用户并不十分在乎的软件,而没有涉足能给微软带来契机的云领域。与此同时,微软也面临严重的人才流失,机器学习的顶尖人物,都是在微软中成长起来的。
然后在2014年初,微软提拔了一名内向的工程师,也就是纳德拉。他与许多人认为微软所需的人才相反:一个不熟悉微软文化的局外人,更有可能带来转机。不过,他的确带来了转机,也让微软三年后重新获得科技巨头的称号。
微软想要成功,它须要做的不仅仅是在云领域超越亚马逊,或者说服我们所有人尝试其HoloLens AR设备。正如互联网重构了已有商业模式一样,人工智能将需要我们重新定义计算。这也是facebook和Google把AI放在战略第一位的原因。
AI先行的好处将使得少数几个公司得到增长。沈向洋要做的就是确保微软位列其中。他表示,“在这行,如果你错过了上一波浪潮,这没关系,但如果你错过了当前的浪潮,那就相当麻烦了。”
三
人工智能可以解放人类,而语音助手则是协助解放我们的工具,微软的语音助手是Cortana。
微软的Cortana比起Siri,虽然没那么收欢迎,但是更实用。比起Google助手,它又更有魅力,比起亚马逊的Alexa,技术则少一些。起初它只在Windows phone 上出现,一年后应用于Windows的所有平台。去年,微软推出了Cortana的软件。借助Windows平台,Cortana每月有活跃用户1.45亿,远超亚马逊的Alexa。不同于Alexa的是,Cartana除了对语音作出反应,还能对文本作出反应。这一技术也嵌入到了Windows 的许多产品中。
虽然一些公司正在将Cortana融入类似于亚马逊和Google音箱一类的设备,微软对这些改进的忽略看起来似乎还没跟上时代。 但沈向洋则表示根本不担心。“比赛才刚刚开始”,他说。他提到一个研究曾表明Alex对问题的理解还十分薄弱。“当然,这些事情会不断改善,但总体的理解,AI认知的部分,还处于起步阶段。”他认为,如果在12到24个月内可将这AI产品到将投向市场,使核心产品和服务更加智能化,微软的机会就越多。
此外,微软还表示,我们还不至于告别键盘和屏幕时代,因为在某些情况下打字反而更加合适。
Yoshua Bengio
虽然Siri出现得更早,但是Cortana比较好用,这主要得益于微软的核心产品。Cortana大部数据分来自Bing。微软推出Bing已经有八年多的时间,它并不是最流行的搜索引擎,但是它也比你想象的更加受欢迎。基本上所有Google的大型竞争者都是微软Bing的合作伙伴。苹果的Siri、Spotlight,以及亚马逊的Kindle设备、雅虎、Verizon和AOL的搜索功能都由微软Bing支持。美国约有30%的搜索查询是通过Bing进行的。微软表示, 拥有来自各种设备的海量数据就是Cortana有用和强大的原因, Google是唯一一家可以与之竞争的公司。
微软的一个重要策略是使Cortana成为行业模范,而智能手机成为实现各种操作的的接口。微软认为,Cortana将知晓人们的个人信息并能代表人类和其他的系统进行交互来帮助人们节约时间,完成任务。
四
如果Cortana是一个引领者,那聊天机机器人就是一个踏实工作的人。聊天机器人是嵌入AI的小型软件,它能完成一些一次性事件比如预定晚餐,完成一笔银行交易等。微软的程莉莉(Lili 程莉莉)表示,“一个聊天机器人就是你能与之对话的软件。”
最近晋升为微软副总裁的程莉莉主管聊天机器人的架构和认知服务团队。这些架构和服务包括向开发人员提供的一套工具和29种服务,如计算机视觉和语音识别。她从苹果到微软后,一直在从事社交技术工作,并创建了一个制作漫画的图形化界面。“它嵌在IE3中”,她记得那是1996年。她在微软有很长的经验,并见证了机器程式的发展。
程莉莉的主要兴趣在于人和机器之间的对话方式。沈向洋已经将AI和研究小组合并到四个领域:产品、早期产品、更早期的产品和研究四个领域。程莉莉在每个领域都有工作过。现在她主要负责早期产品领域。她说:“我们将机器人和Cortana视为产品,但它仍然是一个早期产品。”
微软在2016年春推出了聊天机器人的开发工具包,Facebook等其他公司也是如此。他们被认为是APP的替代品,而且很多人都期望如此。大多数人在手机仅使用差不多相同的一组APP,而利用机器人,开发者和公司可以再次获得新用户,就像在早期在应用商店中那样。
但用户没有买账。深度学习进步的速度比人们适应使用它的速度更快。程莉莉认为,“聊天机器人就像是在文件菜单出现之前的APP。”她解释说,现在还没有一套常用的命令,所以用户对于怎么用会感到困惑。
除了提供机器人开发工具外,程莉莉还率先在微软孵化了自己的聊天机器人。这么做是想通过观察机器人与人类的互动,可以学到人机互动是如何进行的。但这些实验的结果喜忧参半。还记得微软的有种族主义议论的Tay机器人吗?它于2016年3月在Twitter、Kik和GroupMe平台上推出,在24小时内就吸收了一些种族主义的推文,导致它学会了“希特勒是正确的”这样的内容。后来微软取消了这一项目。
六个月后,程莉莉又推出了Zo。如果问Zo对希特勒有什么的看法,她会回答“我不想谈这个 :(.“。你问她几岁,她会回答“差不多22岁”。问她最好的朋友是谁,她会说“我太受欢迎了,好朋友数不过来。开玩笑啦“。
Zo是西方版的小冰。小冰是微软在中国推出的聊天机器人,设定年龄17岁的少女,自2014年推出以来,它已经吸引了4000万用户。在中国,小冰是一个明星(她的日本姐妹Rinna也是如此),有四分之一的用户告诉她,他们爱她。
去年下半年,小冰经常以假名发表诗歌。沈向洋对此感到很兴奋。“没人知道。现在在国内,人们以为是一位年轻的女诗人在发布一些非常有趣的诗。”几个星期之后,机器人的身份才被揭晓,也引发了大量讨论。
语言的亲密度在不同文化中是不同的,程莉莉想弄清楚机器人的对话风格如何转为吸引西方用户。到目前为止,北美的青少年似乎和中国人青少年一样喜欢聊天机器人。平均来说,他们花了10个小时与Zo交谈。由于Zo为其青少年用户带来了建议和同理心,她变得更加友好,这种能力也将融入Cortana和微软的机器人中。
五
有用户愿意花10个小时与Zo聊天,这表明微软开发出了一个成功的产品。但这并不意味着它是一个好的产品,因为它还没证明对人类有价值。这个由AI驱动的世界也带来了一批新的道德困境,比如,如果你是小冰的设计师,你对一个在北京的用户很了解,然后在凌晨1点,你知道用户明天还要上班,但对方还不想睡觉,你会在2点的时候就禁止小冰所有的功能吗?
微软想成为AI研究和产品领域的领导者,同时它想用AI为社会做贡献。今年5月,纳德拉在开发者大会上的主题演讲中,措辞严厉地说到,技术人员应该为软件的道德方面负起责任。而在以往,主题演讲的内容往往是夸耀公司的新进展。
“我的意思是,只要想想乔治·奥威尔在1984中预言的那种将技术用于监控和控制情景,或者奥尔德斯·赫胥黎想像的不追寻意义或目的的娱乐至死的世界,就会明白这些都不是我们想要的未来。”
Eric Horvitz
为了帮公司思考这些问题,微软组建了一个内部伦理委员会。它由工程师和业务部门负责人组成,讨论与AI及其影响和用途有关的敏感问题。委员会的联合主席有公司的代理顾问和Eric Horvitz等人,后者负责除亚洲以外所有的微软研究院。
Horvitz是AI道德与安全的积极倡导者。在公司之外,他一直致力于建立AI合作伙伴关系(Partnership on AI),一个试图为AI产品的透明度、责任和安全制定行业标准的联盟。他希望微软不仅仅是一个做研究的地方,更是研究技术的社会性和社会影响的地方。
与此同时,Cortana的设计主管Williams正在为微软制定一个人工智能道德设计指南。有趣的是,在某种程度上说,她是一个技术乐观主义者。她认为,AI的真正魔力在于它会使我们更加人性化。她谈到如何为微软开发的工具设计同理心。
她说:“我们想让人类感受到被赋予力量,受到保护,得到支持、协助和关爱,是自己世界的中心。AI的工作是放大社会最好的方面和人类最好的行为,而不是放大那些最坏的。”
AI是否会让人类感觉得到了情感支持?她认为是肯定的。比如,一个孩子在学校度过了糟糕的一天,回家后与宠物分享整个故事后会感觉好一些。她说到:“这种情况给了人分享的感觉,而且我从宠物那得到了温暖的怀抱。对于AI,你也可以有相同的感觉。当Cortana提醒你,‘嘿,你说过今天要给母亲送母亲节礼物的’,你就会感到这就是人性。”
六
为了把AI向前推进,微软需要人才。像其他大公司一样,微软也忙着重新培训以前写javascript的工程师。它成立了一个AI学院,开设从哲学和伦理学,到设计递归神经网络等一系列课程。最受欢迎的课程“AI-611高级项目”共收到530个申请,但只有10个名额。
微软也在培养更深层次的外部关系。一年半前,Nagraj Kashyap离开高通,加入一家风投,努力与学者和企业家建立更好的关系。去年12月,Kashyap主导了微软对Element AI的投资,这是Bengio成立的孵化器,它主要帮助研究者和企业家建立AI公司。微软本月早些时候还进一步对它投资了1.02亿美元。
更早前,Kashyap将目光放在了Maluuba上。该公司于2011年由几个滑铁卢大学的学生创立,他们在大二的CS课中相识,并很快成了朋友。Maluuba能让计算机精通文字,它可以从文本中推断含义,并据此回答问题。
通过向三星这样的公司授权技术,Maluuba很快就有了收入来源,而且从一开始它就投入有深度学习研究上。2015年,公司创始人找来了Bengio作顾问。CEO Sam Pasupalak是一个很有趣的人。几年前,当他们仍面临向客户交付对话系统的压力时,他就开始对长期目标进行投入,用新的研究来构建可以理解和对话的系统。”
由于从高通时代就对创始人很了解,Kashyap在从事新角色后很快就找到了他们。由于公司准备下一轮融资,他很快提出了一个诱人的选择:收购。Pasupalak接受了来自多个公司的报价,并且将被收购与保持独立作比较。最后微软赢得了垂青。
Maluuba希望有机会使用微软的数据。Pasupalak说,“萨蒂亚提到过,他们拥有世界上最多的文本。多年来,我们都是在处理小数据,用算法从其中得到最多的结果。这就像是黄金一样珍贵。”
不过Maluuba没有搬到微软所在的雷德蒙,在微软和Bengio的协助下,公司的目标是在今年底之前翻一番。公司所在的蒙特利尔正在成为AI人才的集中地,微软也希望扎根于这个城市。
整个项目都是一个整体策略的一部分,这个策略希望确保在未来,当用户需要计算辅助时,微软会成为助手,无论是想得到个性化的医疗,还是乘坐着自驾驾驶汽车,或者是要记住好友生日的时候。
Maluuba的学习能力可以让Zo与她十几岁的朋友进行更直观的对话。这些对话将作为Cortana算法的训练数据,帮助开发者创造新的认知服务。微软希望有AI的帮助,生活可以更容易。
在我离开蒙特利尔之前,我让Bengio评价一下,相比对手微软的竞争地位如何。他提到微软的语言处理能力非常好,但没有正面回答这个问题。“我想,现在各方都按下了相同的按钮,结果取决于那些细节,对吧?”但他确信,微信是一个强劲的对手。