来源:英国《金融时报》中文网
此刻,腾讯副总裁姚星承载的使命有些沉。
3月22日傍晚,腾讯发布2016年财报,一并透露2017年的愿景和策略,其中一项清楚写着:“发展在新兴技术领域的能力,如机器学习和云服务。”
这是腾讯第一次在财报提起发展“机器学习”——人工智能(AI)的分支研究。此前,腾讯AI围棋机器人“绝艺”刚在东京计算机围棋UEC比赛露脸,第一次参赛就夺冠,专业棋士认为,腾讯“绝艺”的实力恐怕已超越谷歌(Google) 的Alphago。没隔几天,腾讯也正式对外公布,前百度研究院副院长张潼出任腾讯AI Lab(人工智能实验室)主任。
一系列的新闻曝光,背后说的是同一件事:腾讯准备好要竞逐全球火热的人工智能领域。而负责开展腾讯AI策略的领头军,就是姚星。
2004年加入腾讯的姚星,曾担任架构平台部、基础架构、搜索技术部总经理。2016年4月,腾讯AI Lab正式成立,姚星被任命为负责人。
AI Lab并不是腾讯第一个投入AI的团队。事实上,腾讯各个事业部门下都设有AI团队,腾讯产品也有发展AI的能力,如社交网络事业群旗下的优图、微信事业群的模式识别中心,又或是与香港大学合作的微信—香港科技大学人工智能联合实验室等等。
但从腾讯整体架构来看,AI Lab的角色和使命,却有些不同。
“从腾讯发展史来看,AI Lab是第一个原创科研单位,”姚星一开口,就给了一个很有意思的定位。撇开投入AI发展不谈,去年11月刚过完18岁成年礼的腾讯,终于打造了第一个属于公司层级的研究机构。
在此次专访姚星之前,不论是他本人、或是AI Lab,能打探到的细节并不多。AI Lab的官方网站只简单挂了几篇学术论文,编程网站github上,AI Lab的帐号只对外公开了两个开源项目。典型的腾讯作风。但在采访过程中,姚星意想不到的放松,谈起围棋水平大约二、三段的自己,和腾讯计算机围棋“绝艺”下棋的过往,“绝艺在内部推出来一两个月后,我就不行跟他对战了。”一副惋惜的口气。只不过,想进一步问起业务上的细节,姚星挥挥手,“不介绍了,我们都很低调。”边边角角的谨慎态度,一下子又窜了出来。
腾讯究竟是如何思考原创科学研究?我们在离深圳腾讯大厦不远的AI Lab,专访了姚星,以下是经过编辑的访谈实录:
姚星:公司高层在2015年下半年开始对互联网科技有些想法,特别是希望投入基础研究。当时AI还没像现在那么火,但我们已经看大数据、云计算等行业发展的趋势。
2016年,我们发现人工智能需要去做一些基础研究,可能要通过非常长的时间积累技术,以后才能有更好的产品。所以2016年4月正式成立AI Lab,一直发展到现在。
我所在的事业群是TEG(Technology Engineering Group),本身属性就是在支撑公司的技术。原来我们更多的精力是想办法把科学研究成果转成技术,但现在花更多的时间在纯科研上,未必会那么快的把它转化成产品。
要做基础研究,短期之内可能很难看得到具体成果。内部对AI Lab有预期吗?董事长马化腾有没有给你们具体的目标?
姚星:坦白说Pony(马化腾的英文名字)真的没有给我们目标。我们以前说过,做科研工作是要用一生去奋斗,公司高管的态度已经说明了这个态度。
原来我们自己提出AI Lab的目标是“学术有影响,工业有产出”。行业的人对腾讯的技术认识是不够的,会有这样的定位,也希望腾讯能跟行业有更多的交流。
刚才那句口号:学术有影响。怎么定义影响?论文发刊数吗?
姚星:这是一方面。学术圈里如果公认研究机构有影响力,一方面是看论文被引用数,参与专业会议、还有分享质量,以及研究的东西是否有创造性,能不能引领整个世界、引领科技发展前沿。谷歌为什么会被认为具有原创性,因为他们做了很多高科技的研究,我们AI Lab的定位也是,希望引领整个科技界,不再是简单的跟随别人。
外界对腾讯的技术面认识不够,这曾经带给你们什么样的影响?要改变这样的局势,预期会带来什么样的变化?
姚星:很多人认识腾讯是通过产品,认为腾讯市值很高、利润很高,但背后的技术老百姓不了解。我们希望让更多人认识到腾讯是一家高科技公司,首先得先让行业里的人知道我们的力量,我们能贡献给行业,帮助行业快速发展,再把这些技术转换成实实在在的产品,让老百姓从中受益。
从去年4月成立到现在,AI Lab团队是如何组建起来的?
姚星:AI Lab目前大约有50位科学家和200名工程师。Lab主要从事四个研究方向:计算机视觉、语音识别、自然语言处理(Natural Language Processing)和机器学习(Machine Learning)。大部分的Lab成员都是海外高校的博士,有一定工作经验。我们最近也开始招纳刚毕业的实习生来学习。
姚星:对啊,你都比我了解(笑)。腾讯对AI Lab的定位高,是在全球招募科学家,来源不限于中国,也去美国、欧洲等地,跟一流高校和教授建立合作及联系,人才来源渠道还算广。
但人才竞争还是很激烈的。AI发展太快了,学校发展有些断档,人才供需不太平衡。
目前人才来源的确还是以海归为主,不过坦白讲,中国高校毕业的素质不差于海外名校,只是原来学校没有细分AI专业。但最近,大家都特别关注AI,所以中国高校里慢慢有一些AI的课程。今年开始,我们也招了不少中国一流大学毕业的博士生。
刚才提到的四个AI研究方向,是否暗示了腾讯未来的AI产品发展?
姚星:如果我们把AI分解,可以分成“感知”和“认知”,感知是指看得到的,听得到的,所以有视觉和语音研究。而认知,是对语言的认知。简单的分解AI体系,就正好落在我们的前三个方向(计算机视觉、语音识别、自然语言处理),而机器学习更趋向于研究深度学习,深度学习是目前AI算法的基础。所以我们如此构建AI Lab的研究,不是只从业务层面上去表达,而是想覆盖AI的主要研究方向。
姚星:如果从科研定位和对原创性技术研究的定位来看,我们是腾讯发展史上第一个。
姚星:当然(笑)。
姚星:对。但大家都知道,科学研究花费几十年的努力,也未必会出现惊人的发现。我们心态上做了准备,知道要花长时间研究,不注重最后产品。但从另外一个角度来看,科学研究如果不能结合现实,受众面与感知面小了很多,对社会的帮助也小,所以我们还是有学术和产出“双结合”的想法。
您过去带的是工程团队,现在带的是AI Lab,您觉得带领这两个团队的差别是?
姚星:举例子来讲,原来我带的团队是造房子,用的钢筋水泥,也就是网络、服务器,基础资源跟全世界一流公司相比都差不多。由于原料是一样的,所以以前造房子,更多是在比高度。比高度是什么?怎么去支持海量用户。中国人勤劳吃苦,有很多聪明才智去做这个。等于说,以前我们考量更多的,是怎么把房子造得更高、成本更低,让它不会倒,更多的是看工程人员。
但今天我来带AI Lab研究团队,你会发现我们不仅仅是造房子,因为根本还不知道房子是什么,我们在研究原材料。材料学的突破往往是更难的,它需要革命性的发现。
所以说这是两个完全不同特质的团队,一个像去造房子的过程,像鲁班;另外一个更像是去发明轮子的过程,很难。
最近,腾讯计算机围棋“绝艺”的表现受到各界瞩目。可以谈谈当初怎么会想带绝艺出国参加比赛?
姚星:倒不是说带出国,而是想把我们在AI上的研究和同行交流、分享。
比赛前,我们从来没承认过绝艺是腾讯的一款AI项目。时间回到2016年年初,一些同事平常比较关注研究论文,在一、二月左右在《自然》(Nature)期刊上看到Alphago的研究,在那篇论文出来后一两个礼拜,我们也尝试做了一个很小的版本,大概介于围棋业余几级的水平。当时做出来觉得很有趣,就保持了一个小团队在做。
同一时间,腾讯创始人、当时的CTO 张志东召集了一些人吃饭,他提到,腾讯已经是家市值2000亿美元的公司,应该要肩负更多的科技使命。我还记得他当时给我看了一部谷歌旗下公司Boston Dynamics的机器人影片,认为我们应该成立一个像谷歌的X Lab(指Google X,是谷歌从事前沿科技研究的秘密单位。2015年谷歌公司重整,现隶属于Alphabet公司,更名为X)。张志东本身也会下围棋,聊天当中无意提到,我们是不是也该做一个类似Alphago的东西,让AI团队去练手一下?
当Alphago在去年3月战胜李世石之前,我们其实就已经推出绝艺的前身“Wei Go”。但Go是英文围棋的说法,围棋是中国国粹,和公司高管讨论后,想改成具有中国特色,中间也陆续改了其他名字。大概在2016年下半年吧,名字换成“绝艺”,出处是来自于唐代诗人杜牧送给围棋国手王逢的诗句,“绝艺如君天下少,闲人似我世间无”。事实上绝艺的英文名字“Fine Art”还是DeepMind共同创始人兼首席执行官杰米斯•哈萨比斯(Demis Hassabis)帮我们翻译的,他关注到我们的AI,问我们是不是有个“Fine Art”?用它来作绝艺的英文名字也挺好的。
谈科研少不了谈失败。从2016年成立到现在,AI Lab团队有什么样的体悟或说学习?
姚星:因为成立时间短,目前大体进展还算好,不管是从人员规模的扩张速度、或是从研究成果来看,超出我本人预期。但如果从刚才说的学习经验来看,或说不足的地方,我们还需要进一步探索和发掘原创性。
姚星:比如说,现在AI领域有两个著名机构,一个是谷歌的DeepMind,他们目前在研究强化学习(reinforcement),这个理论是30年前提出的方向,但他们通过深度学习技术去解决强化学习,例如去年Alphago的惊艳之作,此前,大家无法想像计算机围棋会那么快就站在人类颠峰之上。
另一个机构是OpenAI,他们是开放的研究机构,主要研究方向是GAN(Generative Adversarial Networks,生成对抗网络),另一个方向,是研究目前AI的难题——无监督学习,目前的主流研究仍是监督学习。
所以,如果从科技业来看,我们还缺乏原创性研究,应该要去挑战世界上的难题。但我相信一到两年内,我们应该也会有不错的成果,我们目前也在制定前沿研究方向。
从外界的观点来看,腾讯并不是一家以“开放”文化为特色的互联网公司。但刚才讲到腾讯AI不足之处,提到了OpenAI,是指腾讯未来有可能开放AI研究的原代码吗?就像谷歌目前在AI上的作法?
姚星:对一家互联网企业来说,过去的确开放比较少,但对学术界来说,开放是一个传统和习惯,如果不开放,科技的进展一定是非常缓慢。假如我们的定位是从事科学研究,会抱着同样的开放心态。
当然,我们可以发现到,原来保密性做的好的商业公司,最近也加入了开放文化。包括最难看到开放的苹果,开始在AI领域对外发表论文。又比如说谷歌的开源机器学习代码TensorFlow,改变了整个行业的技术平台,提升AI的准入门槛,对行业起了非常大的作用。当然还有Facebook,也开源了非常多的东西。
腾讯之前也开源过,可能局限在工程性的东西,而不是科研上的发现。我相信腾讯今年会有计划开放我们的AI能力,让行业能去使用、降低AI进入门槛。
姚星:还好。在2010年后,我们提出自己的开放平台,接入中小企业的业务,结合到腾讯的生态。从商业性来讲,腾讯这几年都非常open,但从现在开始,我们希望在技术上也能更加开放。
姚星:腾讯内部实际上已经有非常多东西开始在运用AI了。比如微信里的语音识别,就是语音识别的AI技术。还有天天P图的美颜功能,是通过计算机视觉去做的。最近大家看到的滤镜转换功能,也是AI的技术。
目前绝大部分的AI应用都还是在工具层面,所以老百姓感觉到的AI和我们定位的AI还有一段差异。当然AI Lab里还有做游戏类、社交类的AI,像沟通类的chatbot(聊天机器人),随著技术成熟度提升,我们慢慢会包装成产品型态。
您刚才提到老百姓认为的AI和专家定义的不同。两者差别在什么地方?
姚星:我们一般人对AI的认知是来自科幻电影,认为AI有一个很酷的外表,比人还聪明、还强壮,像影集《西部世界》或像电影《机械公敌》所描绘的。但实际上,目前AI技术还有弱点。
和人类相比,目前AI主要有三个缺陷。第一是创造性,AI还是在拟合一个过程,怎么去创造数据?第二是举一反三,怎么通过学习这个、学习到那个?人类在这方面是很强的。再来是归纳总结,前人的定律我们能归纳到一两句话,这是高度抽象能力,但目前AI不完全具备,还是停留在通过一个大数据,去拟合的过程。就像我们说语音识别做的好,人脸识别不见得做的好,方法是类似,但数据和训练要重新进行。
姚星:目前研究方向有四个,绝艺只是游戏AI,我们还有社交、内容、云AI,这是四个产品大方向。先说游戏 AI,绝艺只是很小的片段,未来MMOG(大型多人在线游戏)、手机游戏都会有AI元素。另外,社交方面,从小的语音识别、到未来的对话系统、智能助理等等。而内容AI上,更多的内容会通过AI技术去推荐、去分析用户喜好,原来是从文本,现在能通过视频、图片去推荐。而在云AI领域,我们会把我们AI能力开放,降低小公司使用门槛。
您怎么看同行发展AI的强项和弱项?百度、阿里巴巴在做,远一点的谷歌、Facebook都在做,腾讯的发展优势在哪儿?
姚星:腾讯的产品场景还是非常多的。AI是要有很多小的场景,渗入到各种产品里面。腾讯产品线很广,我们有社交、内容、游戏等等。
再来,我们用户数很大。AI的基础是大数据,只有用户数大,才能有更多的数据进行分析,才能做贴切用户的人工智能。
我们有海量场景、海量数据,还有海量计算资源,相对于整个行业,这是腾讯先天的优势。
AI是目前中国非常火的话题。您认为中国的AI发展目前处于什么样的阶段?
姚星:如果和美国比,中国的科技发展坦白说在基础研究和理论上还是有一定的差距。但为什么AI会成为腾讯、甚至所有中国互联网公司都会竞逐的竞技舞台?我认为有几个原因,和原来的基础科学研究有些不同。
第一是人才,全球AI研究人才里面,华人非常多。我看过一个报道统计,在2006到2016年里,近两万篇最顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%,人才不落后。
第二,AI的能力是拼大数据,如何在海量数据之下,进行深度机器学习。数据怎么产生?靠人口基数,从这点来看,中国有很好的优势,互联网用户数是领先欧洲、甚至是美国。
第三,互联网产品的应用状态,中国是领先的。虽然先进国家发达,但在互联网应用上是普遍落后于中国,包括4G环境、智能手机普及率、App的丰富度,中国也是领先。
但除了以上环境优势,还要考量原创性,我们在这上面要多借鉴发达国家的开创精神,能沈下心、能长期做科技研究。如果两者能结合,在不远的将来,中国在AI应用上有机会引领世界。