专栏名称: Xtecher
Xtecher,囊括网站、App和遍及世界名校校友与科技企业的科技创业精英圈子,致力于发现、报道最有潜力的早期科技项目和人才,打造全球最有品质的科技创业媒体。
目录
相关文章推荐
阿尔法工场研究院  ·  起底月之暗面资本旋涡:清华学姐忤逆朱啸虎? ·  2 天前  
饕餮海投资  ·  造物弄人 ·  3 天前  
51好读  ›  专栏  ›  Xtecher

我们不想被Facebook收购,我们有更大的目标|Xtecher观察

Xtecher  · 公众号  ·  · 2017-07-06 11:28

正文

姚旭晨博士(左)与陈果果博士(右)

昨日被百度高调宣布收购的KITT.ai,在科技创投圈引起了轩然大波。究竟姚旭晨和陈果果二位博士创立的公司有革命性的进展?又是什么能让不想被Facebook收购的KITT投奔百度?或许这篇2016年由Blue Net China进行的采访稿可以让Xtecher的读者们略知一二。


来源|Blue Net China

编辑|陈光

网址|www.xtecher.com

微信公众号ID|Xtecher


在各大机构的排名上,JHU总是因为生物医学闻名。然而很多人所不知的是,在JHU的计算机系下,还藏着一个世界领先的实验室。约翰霍普金斯语言与语音处理中心--CLSP(The Johns Hopkins Center for Language and Speech Processing),致力于计算机语言处理方向的教育与研究。  读过吴军博士所著的数学之光的读者应该听说过贾利尼克(Frederick Jelinek)的名字。作为计算机语言处理技术的创始人,贾利尼克曾担任CLSP的主任,对人工智能和计算机语言处理技术做出了巨大的贡献。





值得一提的是,CLSP培养了多位优秀的华人校友,包括前腾讯副总裁吴军博士,出门问问创始人李志飞博士等。今天要介绍的是两位自然语言处理和语音识别领域的新星,姚旭晨博士,陈果果博士。

姚旭晨,陈果果KITT.AI公司获奖照片


Q:什么是自然语言处理?


自然语言处理和语音识别简单来说就是让计算机能够理解人的语言,以便进行人机交互。这个听起来非常高大上的技术词汇其实早已经在不知不觉中渗透到了我们的生活中。比方说,每天晚上我们都会习惯和Siri说 “Hey Siri, wake me up at 6am tomorrow。(Siri,明天早上六点叫醒我)” 这个看起来非常简单的命令其实会经过一系列的处理。首先,当你在说“Hey Siri”的时候,Siri意识到了你要和她进行对话,就会把她的工作重心转移到对话上。其次,当你说“wake me up at 6am tomorrow”的时候,Siri需要把她听到的语音转换成文字,以方便后续的语义理解。接下去,Siri需要通过转换的文字去理解原来用户想要Siri在明天早上6点叫醒的服务,最后相应地设定第二天早上6点的闹钟。


类似的服务其实在生活中已经举不胜举了。比方说,你可以能对着你的安卓手机说“Okay Google, when is my flight,(谷娘,我的航班是几点)” 你的手机就会回复你相应的飞机行程。或者”Okay Google, directions home(谷娘,带我回家),” 手机就会启动谷歌地图进行相应的导航。这些应用都已经相对比较成熟,但大多都局限在一问一答的范畴。也就是说,用户提出一个问题或者命令,计算机做出一个相应回答或者执行。


但其实更加自然的人机交互形式是基于对话的。很多看过《钢铁侠》的读者可能都对它的Jarvis系统印象很深,在《钢铁侠》里面,托尼·斯塔克是可以和Jarvis进行自由对话的,而不仅仅是局限于简单的一问一答。这种和计算机的交互方式在现实生活中也有很多应用。比方说,当我们想要通过计算机订一张电影票的时候,我们很多情况下需要通过对话来实现。我们不太可能和计算机说“请帮我订一张周六上午十点在约翰霍普金斯大学主校区附近现在在映的IMDB评分不低于9的动作电影;如果没有的话请定一个爱情电影。” 更可能的情况是,我们一开始和计算机说“我想看个电影,” 然后计算机可能会问“你想看什么电影,具体地点在哪里,” 通过对话完成定电影票的这个过程。用对话进行人机交互的方式今年刚刚兴起,人们叫2016年"the Year of Conversational Commerce。"


对旭晨和果果来说,他们想做的事情就是做一套与自然语言处理和语音识别相关的工具。这样对一般的手机app开发者或者网站开发者来说,哪怕他们不理解自然语言处理和语音识别底层的技术,他们也可以把自然语言处理和语音识别的相关技术应用到他们的app或者网站上,使他们的产品更加智能化。


Q:可以简单介绍一下你们的产品吗?


旭晨,果果:我们现在的产品主要有三个。


第一个产品叫做Snowboy,是一个热词检测系统。回到“Hey Siri, wake me up at 6am tomorrow”这个例子,我们首先用一个词“Hey Siri”来唤醒Siri,然后我们可以和Siri进行进一步的互动。“Hey Siri”这个词一般叫做热词或者唤醒词。相应的,Google有“Ok-ay Google”,Amazon有“Alexa”。热词检测系统一般不需要网络连接。只有当相应的词被说出来以后,计算机才会被唤醒进行接下来有可能需要在服务器端完成的操作(语音识别,语义理解,信息搜索等等),所以热词检测系统保证了用户的隐私。同时,热词检测系统需要足够准确。Snowboy是一个可以让用户自定义的热词检测系统,用户可以定义除了“Hey Siri”, “Okay Google”, “Alexa”以外的词汇。



我们的第二个产品叫做NLU,是自然语言理解(Natural Language Understanding)的缩写。顾名思义,这个产品就是让计算机理解用户说的话是什么意思。比如说,在“wake me up at 6am tomorrow”这个例子里面,计算机就需要理解到用户的意图是使用闹钟(因为用户需要被叫醒)。计算机需要进一步理解到闹钟的时间是“6am tomorrow”而不是其他时间。总体上来说我们的NLU和wit.ai或者api.ai两个初创公司的技术是比较像的,都是让计算机理解单个句子。



我们的第三个产品叫做ChatFlow。ChatFlow是一款给开发者用来开发对话系统的工具,实现人机对话。ChatFlow有非常简洁的图形界面,开发者的编程造诣哪怕不是特别深,也可以用ChatFlow来开发和计算机的对话系统。比如我们曾经听到过一个开发者的反馈:他的八岁的儿子,按照我们的教程,用ChatFlow在两个半小时内就做了一个可以在Amazon Echo上跑的Knock-knock Joke (敲门笑话)的程序。这对一个八岁的孩子来说,用传统的编程基本上是不太可能实现的。



Q:你们的技术专攻各在什么方向?


果果:我博士阶段主要做关键字检索这一块。比如说用户在Youtube搜索视频,我的工作就是在视频里的音频中找到相对应的搜索词。“Ok, Google”这个技术就是我当时在谷歌实习时研发的。


旭晨:我博士阶段做的是问答系统。比如说2011年时IBM的Waston智能系统在Jeopard-y(危险边缘,美国电视智力问答比赛)中击败了两位之前的冠军。计算机需要理解人类编写的问题,然后再在知识库中寻找相应的字条,最后回答问题。还有当时我和果果都在谷歌实习。我做了谷歌搜索I’m Feeling Lucky的技术,用户输入关键词,系统会猜出用户最想看到的网页。


果果:现在创业阶段我们俩就每个产品都得做,比较杂。


Q:聊聊创业吧,为什么当时选择了在美国创业而不是回国?


旭晨,果果:主要是因为在美国科技公司的竞争比较良性。国内一个小公司做出一个东西,很快大公司就会做出一个类似的东西把你竞争掉,所以小公司想存活下来挺困难的。


我们不是没有考虑过国内的市场。但目前只是想在美国市场做好,成熟之后再去考虑国内。


Q:创业的过程中获得了什么帮助吗?


旭晨,果果:应该是感谢AI2吧。


AI2,Allen Institute for Artificial Intelligence,是微软创始人保罗艾伦创建的一个人工智能研究中心。当时旭晨来到西雅图,找工作到那边面试了,但是还是想自己创业。正好研究中心也算是一个创业公司孵化器,可以给我们提供资金,以及不少创业上的经验。我们就决定留在西雅图创业了。


其次的话,我们觉得JHU给我们的帮助很大。毕竟我们CLSP在业界名气很大,大家都认这个招牌,出去开会总会有人主动找过来和我们聊。如果现在有技术上的问题,我们也可以和之前的教授讨论。


一路过来肯定不是一帆风顺。毕竟我们俩只是计算机系的博士生,一开始做商业就是两手抓瞎。两年多,我们在商业发展模式上学了很多。一是投资人给我们出谋划策,二是自己经常学习,看一些相关的书。


最大的困难应该是你无法察觉的困难。如果你知道有这么一个困难,然后努力去克服,其实也算不上多难。


自然语言处理与人机交互这个领域,现在竞争怎么样?


旭晨,果果:人工智能确实是越来越火,尤其今年我们这个领域的参与者越来越多。不过我们还是很有信心的。这个领域主要有三大块,NLU(理解),Dialogue (对话)和 Usability (可用性)。你可以看到苹果的Siri更多地局限在NLU这一块,亚马逊的Echo偏向NLU和Dialogue。三大块能做到两块的公司很多,但是我们在有NLU和Dialogue的同时,也有Usability这个非常吸引开发者的地方。



我们开始得比较早,另外我们俩在这个方向上做了这么多年也是很有经验了。wit.ai,在去年年初被Facebook收购了。还有另外一个公司,api.ai,最近也刚刚被Google收购。我们现在完全可以实现他们做的功能。当然我们不想被很快收购,我们有着更大的目标。我们希望未来能成为一家成功的SaaS (Software as a Service,软件即服务,如iCloud, Office 365)公司,做好自己的品牌。



本文为Xtecher转载自“Blue Net China(微信公众号ID:bluenetchina)”

Blue Net China(ID:bluenetchina),链接全球创新医疗跟着Blue Net China的小编们,打开Blue Jay电台,听Hopkins人的故事。


X 公告



━━━━━

封面来源:Blue Net China  排版:陈光  校对:米琪

━━━━━

Xtecher官网平台现开通认证作者,

有发稿意向的个人或媒体,可联系微信:jueshao121

(添加好友请注明公司、职位、事由)

点击 | 关键词 | 查看对应内容

Xtecher 精品文章


 人 物 

大健康

人本健康 陈恂 | Haplox 许明炎

奇云诺德 罗奇斌 | 基准医疗 范建兵

哈佛医学院 George Church

推想科技 陈宽

智能出行

小鹏汽车 夏珩 | 奇点汽车 沈海寅

禾赛科技 李一帆 | PulsAI 刘万千


人工智能

快乐智慧 雷鸣 | 出门问问 李志飞

达闼科技 黄晓庆(上\) | Rokid 黄伽卫

驭势科技 吴甘沙 | 格灵深瞳 赵勇 

地平线 方懿 | 彩云天气 袁行远

车和家 李想51猎头 刘维

Face Think 杨松帆 | 中科视拓 山世光

深鉴科技 汪玉 | 越疆科技 刘培超

Kneron Inc 刘峻诚 | MINIEYE 刘国清

地平线 黄畅 | 三角兽 亓超

极限元 马骥 | NXROBO 林天麟

灵喵 韩龙 | 云脑科技 张本宇

创来科技 陈茂 | 轻客智能 庞琳

iPIN CEO杨洋 阅面科技 赵京蕾

蓦然认知 戴帅湘 | 地平线 周峰

Perceptln 刘少山 | Vinci 朱大卫

码隆科技 黄鼎隆 | 知觉科技 邹琪琳

钢铁侠科技 张锐 | 速感科技 陈震

梅卡曼德 邵天兰 | 艾米机器人 李友芳Novumind CEO吴韧 | 爱因互动 王守崑

Vizum 董霄剑 | 小鹏汽车 夏珩


虚拟现实

诺亦腾 戴若犁 | 大朋VR 陈朝阳

Ximmerse 贺杰 | Pico 周宏伟
焰火工坊 娄池 | HTCVR 汪丛青 

七鑫易维 彭凡 | 影创科技 孙立

所思科技 罗子雄 | 凌宇智控 张道宁

Dexmo 谷逍驰


大数据

中网数据 孙远根 | 昆仑数据 陆薇

永洪科技 何春涛 | 华农天时 温晗秋子

GrowingIO 张溪梦 | ThinkingData 吕承通
神策数据 桑文锋 | 海云数据 冯一村

佳格数据 张弓 | 普林科技 王储

Datatist 宋碧莲 | 职品汇 龚才春

星环科技 孙元浩 | 人才易 葛昊

科技谷 陈思恩 | 驿氪 闵捷


航空航天

零壹空间 舒畅 | 天仪研究院 杨峰


Fintech

数库科技 刘彦 | Ping++ 金亦冶

abc Fintech 杨永智 | 奇点机智 宋嘉伟

芥末金融 彭晨 | 蓝海智投 刘震

海鲸金融 丁华昆 | 资易通 盛洁俪

点融网 郭宇航


其他科技创业者
科幻作家 郝景芳 | Vinci 宋斯纯

禾赛科技 李一帆 | 诸葛io 孔淼

奥图科技 叶晨光 | 瀚诺半导体 张诚

51猎头 刘维 | 腾展科技 魏松祥

墨刀 张元一 | Phresh Amit

品类 唐十三 | 布比 蒋海

Plug and Play Saeed Amidim

集智俱乐部 张江 | NVIDIA 黄仁勋

NewGen Capital 张璐 | 纵目科技 唐锐Insta360刘靖康 | MORE Health甘伟杰



 特 写 


人工智能

禾赛科技,加入无人车大战

如果太太说“今晚请使用机器人吧”

奇点汽车强势启动智能驾驶布局

透视Rokid:两度斩获CES大奖背后

语音助手“小不点”可行吗?

人工智能:付不起的工资,抢不到的人巨头之争,无人驾驶尖峰对决

唇亡齿寒,人工智能一场艰难“拔河”

2016中国最具投资价值人工智能项目Top 100 

直播鉴黄:堵塞出口还是守护高贵

国内智能驾驶Top20

无人驾驶若干问题

渡鸦科技被百度收购的过程

NVIDIA向AI边界进军

阿里大帝国启动“NASA”计划

人工智能究竟怎么长“记性”

阿里云的“硬骨头”

吴恩达终于离开,没人感到意外

腾讯优图,AI隐形战队

国产阿尔法狗战胜日本高手

BAT齐谈人工智能

阿里云,打响智能医疗第一枪

冷扑大师,从博弈算法到人类未来

28岁的《攻壳特工队》描述的未来

专访CMU计算机学院院长Andrew Moore

阿里云,用AI让中国“制造”变“智造”

CMU走出的智慧建筑新模式

AI时代,色情江湖攻防战


创业群像

“买买买”狂潮下物流巨链的前生今世

类定律:1年成为1亿美元公司的背后

华强北困局:离席的人,守望的人

区块链创业者们:黎明之前的那一刻

不开源的区块链都是“耍流氓”

华人对冲基金鼎新资本

一下科技通往纳斯达克之路

Uber无人车发生严重事故被叫停

神测数据,帮企业“打好数据底子”

布本智能,做有价值的云头条

个推,第三方推送里的“丐帮”

李志飞:并非上岸,只是出海

个性化时代的阅读之殇

个性化定制,空气从此不再共享

鳍源科技水下无人机:探索海底新纪元

FaceThink推出AI测评系统

30+汽车大佬:究竟需要哪种自动驾驶

比亚迪:从603.62%到-28.79%,只是一步之遥

航空航天

“潇湘一号”科学实验卫星升空

融资逾亿,零壹空间与它的火箭长征


Fintech

智能投顾:理性更多,还是赌性更硅谷投资人:真正的AI还得再等等

toC or toB谁的终结,谁的胜利

安防专家总论勒索病毒


虚拟现实

Magic Leap:给科技创业公司耐心

IVLab用工业VR降低行业风险

AR/VR还会继续受投资人待见吗


如果你拥有高精尖科技创业项目,Xtecher将为你提供:

1.专业的科技人物特稿和视频拍摄

2.在Xtecher官网、APP、微信的全方位展示

3.最专业的科技圈投资人、政府资源、产业资源

4.创业企业品牌管家与PR服务

即刻扫码,联系我们。

微信号:Xtecher

关注未来的人

都关注了Xtecher


   栏目推荐   


 
 
 

Xtecher联合喜马拉雅,推出科技音频脱口秀《甲小姐说》。在本专辑中,甲小姐将不断给你们讲讲科技创业圈里面,有趣、有料、有干货的内容,满足你的小好奇。 

甲小姐第二十三期新鲜出炉:《一个AI公司的估值是怎么“估”出来的?

▼  ▼  ▼