专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
哎咆科技  ·  Mate XT 金龙版,仅需 13 万元? ·  10 小时前  
EETOP  ·  里程碑!国产自主CPU销量突破千万颗! ·  19 小时前  
新浪科技  ·  【#全国首个无人机4S店开业# ... ·  2 天前  
哎咆科技  ·  金针菇的花语是? ·  4 天前  
51好读  ›  专栏  ›  雷峰网

专访前Google科学家林德康,为手机添一只无形的手

雷峰网  · 公众号  · 科技媒体 硬件  · 2016-08-13 09:45

正文



林德康在美国 Google 工作了超过 10 年,做自然语言处理方面的研究工作。大约 10 年前,2007 年的时候,时任 Google 中国负责人的李开复在一次活动上被问到,用户在搜索引擎里提问时,Google 能不能直接给一个正确答案,而不是10个搜索结果的网页链接。李开复答到,问答会成为搜索的一部分,尤其是当用户提出一个精准的问题的时候,Google 美国有个团队在做这方面的事情,项目领导者是位中国教授,叫林德康。李开复补充到,虽然不确定林德康能不能在短期内取得突破,但这个项目绝对是值得研究的。


8月12日下午,林德康在 CCF-GAIR 大会上发表主题演讲《从搜索引擎到问答引擎,再到行动引擎》,介绍了自己在 Google 做的主要工作成果,以及今年回国后参与到一家创业公司“奇点机智”所做的语音助手项目——小不点。


林德康做的语音助手并不是用来回答问题的,它是为手机添加了一只无形的手,通过语音来指挥这只手代替人的手指,完成一些基本的点击和输入操作。比如,对语音助手说,买一张后天上午北京到上海的飞机票,语音助手就会帮忙打开携程应用(仅举例用),然后自动输入北京到上海的飞机票以及时间。同一件事,其他语音助手也可以做,但他们需要跟携程合作拿到相关软件接口。林德康的语音助手是不需要的,它走的是人正常操作手机的流程,只是代替人操作,实现了自动化。


这件事有两个难点。一是听懂用户想做什么事情,他说“皇马”的时候,知道他说的是体育、是足球、是西甲,然后才能通过无形的手替人操作;二是知道第三方app都可以完成哪些任务,需要点击哪里,然后才能与用户想做的事(语义理解)进行对接。



对于奇点机智这家公司而言,“知道第三方app的都可以完成哪些任务”是他们的强项,因为这家公司最早做的就是“应用内搜索”的核心技术——深度链接(简单理解就是让app之间,可以像网页那样通过链接跳转),他们需要了解各种app的内部架构和功能。“听懂用户想做的事”是新加入公司的林德康最擅长的事,他在 Google 做的事情就是理解用户的意图,然后在合适的情况下直接给出答案(不是从数据库、知识图谱里找到答案,而是从网页文本中分析、抽取出答案)。


但林康德觉得这两点并不是真正最大的难点。他告诉雷锋网(搜索“雷锋网”公众号关注),“It’s much easier to be the best than to be good enough”,他从 Google 出来的时候想过这个项目可能会面临哪些 risk(风险),技术和大公司的竞争对他而言都不算 risk,真正的risk 是用户能不能接受这件事。一旦用户把这个产品用起来,他的语义理解系统就能获得正向反馈,“下面的路就可以越走越快”。


林德康说,自然语言处理是一项全世界研究了几十年的领域,现在因为数据和计算力的够大,所以现在的产品在技术上可以跨过一道门槛。至于用户能不能接受,现在的形势,行业大潮对他们来说是非常有利的。Google、微软、苹果、亚马逊都在推语音助手方面的产品,用户对于语音输入以及通过语音设置提醒事项的使用,越来越频繁。


懂些技术的用户,可能会对这个语音助手的运行原理有一些疑问。它代替人的手指来操作的话,iPhone 显然是不允许的,Android 上也需要给予该软件特殊的权限。林德康很清楚存在这样的问题,他的观点是,正因为有一定的使用成本,所以产品本身必须可以为用户创造出价值,才能吸引到用户。他对自己的产品,所带来的效率提升,非常有信心。


这个语音助手,相当于为手机叠加了一层语音操作的交互层。这个交互层不会影响到正常的触摸操作,也就是说用户可以随时把操作接管过来。林德康说他们的目标是覆盖绝大部分app,但早期会先覆盖中国用户最常使用的几十个app,希望做好这些app之后,后续可以吸引到开发者主动为“小不点”语音助手进行适配工作。这里的适配,指的是找出语音真正可以提升操作效率的地方。


林德康分享,目前语音在工具型、任务型app上可以看到明显的效率提升,因为这些产品的“功能”是明确的。比如,微信可以执行的功能也就“几十项”,是可以总结出来的。但是在内容型的app上怎么为用户带来价值,他们还在探讨。演讲中,林德康展示了语音说想看甄嬛传第5集,然后直接跳转到乐视app,进入到相关页面的操作。他说,现在看起来语音在服务内容型app也是非常有潜力的,问题在于用户还不习惯用语音来表达,他想看的内容。 


看起来,林德康只是做了一个小软件。实际上,在这个小软件背后,他们想探索的是手机交互上的一次变革。它的切入点是语音,核心则是从把用户语义转换成app间操作的能力。


对于在学术界备受尊重的林德康而言,这是又一次将研究成果转换成实际产品的尝试,“为手机添一只无形的手”,也为自己的研究找到一条实践路径。 


参考阅读:《前Google高级管理科学家林德康回国创业,做了一款你没见过的语音助手