语音识别是人工智能的核心应用之一。众多巨头也对此虎视眈眈,包括谷歌、苹果、微软、亚马逊、百度、科大讯飞等公司纷纷进军该领域。而亚马逊ecoh音响更是成为语音AI硬件的标杆产品,截止2017年6月,亚马逊Echo系列(包括Echo、EchoDot和Tap)用户已超过1000万,其优秀的语音交互体验让众多用户赞不绝口。
除了智能音箱本身,业界更是注意到了其背后 Alexa 智能语音助手的生态价值。亚马逊对Alexa的期待可不只局限于Echo,事实上,Alexa对亚马逊而言就像安卓对于谷歌一样,承载着亚马逊在全新语音交互入口上OS系统的作用。
在亚马逊2015年开放语音技术和平台后,Alexa 的实力更是得到了进一步的增强,到目前为止,Alexa 已接入手机、音箱、电视、冰箱、耳机、汽车等智能家居、移动硬件设备中。可以说,凭借Echo及Alexa,亚马逊已经走出一条从技术、硬件应用、数据积累再到平台开放的道路,在语音AI领域确立了战略优势。
而国内的智能语音企业也开始跟进,2017年7 月7 日,国内人工智能语音企业思必驰举行了DUI 开放平台(AISpeech Dialogue User Interface)首秀。DUI是思必驰为企业/个人用户等开发者们打造的平台,可一站式打造专业技能商店,提供“云+端”混合方案,也是国内第一个真正意义上的“超高度定制语音AI平台”。
在语音识别领域,相比于声名显赫的科大讯飞,一直在B端默默耕耘的思必驰的名气则要小上许多。实际上 ,思必驰在语音识别领域有着十多年研发积累,在技术领域内,思必驰在全球也是领先的。
它是世界人机对话挑战赛的冠军;而在国际评测中,思必驰的错误率是7.09%,超越了10%的国际水平;另外,在高盛“全球人工智能生态报告”中,国内只有两家公司入围高盛名单“全球最具竞争力的人工智能公司”,其中之一就是思必驰。
在语音识别这片红海里厮杀,正确的战略定位及布局至关重要。对思必驰而言,做语音技术开放平台并不是偶然拍板子决定的事情。
“早在2014 年7 月5 日的,思必驰就发布了国内的第一个口语对话系统平台——「思必驰对话工场」,开放底层的ASR、TTS、NLU 等SDK 接口,这是思必驰迈出了平台第一步。”思必驰CMO龙梦竹介绍道。
随着公司业务的拓展,客户群体越来越广泛,思必驰也在与硬件厂商打磨产品的过程中发现,很多厂商往往面临自定义产品功能、系统迭代、内容升级等方面的开发难题。为追求体验升级,打造高可用定制的对话平台,思必驰自2016年开始策划DUI开放平台并列为公司重大战略方向之一。最后,由思必驰VP赵恒艺带队、集合近百人的专业团队的长期攻坚,推出DUI开放平台。
DUI作为专门为企业/个人用户等开发者们打造的平台,内置国内最专业的语音技能库,具备深度数据可视化、个性化自定义、零门槛操作等优点,可为开发者提供单点技术服务和完整的人机交互方案,缩短厂商开发过程,更好地将智能语音赋能给开发者和企业。
赵恒艺表示,思必驰DUI开放平台是国内第一个真正意义上的“超高度定制平台,每个模块均可自定义,例如,GUI自定义,唤醒词定制,技能深度定制;既提供通用的场景对话和内容技能,也支持开发者完整自定义对话逻辑和内容,接入第三方服务。
图:活动现场征集了二十位开发者进行实操演练,利用DUI平台,开发者在短短30分钟内,迅速完成了对话技能定制和体验。
同时作为一站式的对话系统定制开发平台,DUI平台内置深度定制技能,集合广泛的聚合类 API,这令开发者在短短 7 分钟内就能定制一个语音技能。
此外,思必驰还推出了“技能商店”来覆盖不同场景的多样需求,既支持拨打电话、闹铃设置等本地技能,也支持第三方服务资源接入,并进行不断的丰富与完善。
对于当前的智能语音系统而言,有三大不可忽视的要素:语音、语义和技能,分别对应听清、听懂和服务需求的问题。目前智能语音技术已经比较成熟,通用识别准确率已经能达到97%,加上深度学习技术在自然语言交互领域应用,“听清”和“听懂”将开始成为语音生态的一个基本能力,不再是企业差异化竞争力所在。这也就意味着,能满足用户的需求的“技能”将会成为语音AI平台差异化竞争关键,也是生态化和商业化的核心。
这也是为何处于技术优势的亚马逊会主动开放自家Alexa平台的原因所在。随着第三方开发者不断加入,Alexa本领技能越来越广泛,其生态也会越加完善。这一点随着时间推移而愈发明显:在7月5日亚马逊宣布,Alexa平台上的功能(Skill)数量再创新高,已经超过了1.5万个,远远超过了Google Home拥有的378个技能和微软小娜的65个。
而思必驰将推出DUI开放平台也是出于同样的考虑。通过核心技术能力开放给开发者们,让开发者能够依据需要大规模定制专业的Skills,覆盖智能车载、智能家居、智能机器人、故事机、手机助手等场景并与这些领域的玩家达成合作,从而构建基于语音自然交互的开放AI生态。从这个角度来看,DUI开放平台有其前瞻性和领先性。另外,为了加速其语音AI平台生态的发展,思必驰还专门设立了 2 亿元的基金,用于鼓励个人开发者,以及平台线上、线下运营的支持。
不过,除了思必驰,国内其他语音企业也在这块发力,百度在首届AI开发者大会上发布DuerOS开放平台,腾讯云小微智能语音解决方案正式发布,而科大讯飞、云知声等智能语音企业也是动作频频。由此可见,各大巨头均在紧锣密鼓地布局语音AI开放平台,在未来几年内
他们必然将
展开正面较量,届时究竟谁能笑到最后,仍有待观察。
©本文为智慧产品圈原创,转载请联系本公众号获得授权。
作者:黄韶龙
微信号:shaolong233
✄
-----------------------------------
投稿或寻求报道:[email protected]
广告&商务合作:[email protected]
✄
-----------------------------------
《中国智慧家庭产业创新成长启示录》
现已公开预售,点击“
阅读原文
”获取订购入口,也可关注“智慧产品圈”微信公众号-->菜单栏-->新书预售-->新书试读,免费阅览部分精彩内容哦。