专栏名称: 界面新闻
界面是中国最大的商业新闻和社交平台,只服务于独立思考的人群。
目录
相关文章推荐
51好读  ›  专栏  ›  界面新闻

阿里为什么要做一款语音交互的人工智能音箱?

界面新闻  · 公众号  · 热门自媒体  · 2017-07-07 09:20

正文


“我们不想把它停留在实验室。AI应该是具体的产品和服务。”


作者 | 王付娇


7月5日,阿里巴巴第一款人工智能音箱:天猫精灵X1正式落地。

此前界面新闻报道过这款人工智能音箱的定价、基本硬件参数。阿里人工智能实验室负责人陈丽娟告诉界面新闻记者,这款音箱除了市场上常见的内容播出、提醒设置、闹钟天气等,它在购物场景上更会领先行业均值。比如,179.99美元的亚马逊Echo在购物上还是停留在以加入购物车为主,而阿里的这款“天猫精灵X1”音箱已经能够完成从回溯购买记录、挑选下单到最后支付的整个过程。这主要得益于其搭载了内置第一代中文人机交流系统AliGenie。这是阿里第一次正式发布智能音箱产品和中文人机交流系统。这款音箱的诞生也代表阿里对语音交互的重视,体现了其试图抢占物联网入口的企图。

淘宝上的商品成千上万,一款语音交互产品如何能挑选出消费者想要的商品?陈丽娟表示,该款产品拥有“决策力”,它会学习消费者的购物习惯、了解用户画像,然后再进行兴趣推荐。阿里在电商领域长期积累起来的技术优势可以直接用在语音交互场景下。

中美的居家环境有很大差异,所以直接将亚马逊的Echo、苹果的HomePod搬到中国市场来可能并不是很接地气。美国人使用智能音箱频率最高的场景是在厨房,做菜时需要订一个倒计时等。到了国内市场,智能硬件设备千差万别、中国用户更需要一个助手级的、对中文语音交互友好的“全能产品”。

语音交互拆解来看,可以分成语音识别、语音合成和自然语言处理等,每一个大块又可以分成更细节的处理步骤。而国内做语音行业的公司,多半停留在语音输入法(如科大讯飞),或语音搜索。真正能将语音交互商用的仍十分有限。除了产品层面,自然语音处理技术(NLP)仍是人工智能行业最有挑战的部分。

阿里正是看中了这样的市场机会和行业风口。

阿里人工智能实验室负责人陈丽娟是淘宝最早的一批产品经理。按照阿里惯常的方法,这款人工智能音箱也是采用了“淘宝模式”,即对开发者足够友好,开放API接口,接入各种智能设备和软件App。这与苹果的HomePod完全不同,苹果公司为了安全考虑,要求所有接入Homekit平台的设备都要装入特殊的MFi芯片,这无意间抬高了硬件创业公司接入苹果设备的成本。

据界面新闻记者了解,阿里大生态环境的支持将成为这款音箱最核心的优势。在软件层面,阿里音箱有阿里文娱体系下内容的支持,比如优酷的视频内容转录;目前第三方App在陆续适配,例如健身软件Keep和喜马拉雅FM等。在硬件上,有阿里智能IoE的接入,目前正在谈得包括古北科技、涂鸦科技等;品类总量在100家以上。阿里大生态环境的支持将成为这款音箱最核心的优势。

阿里鼓励用户建立自己的“语音公众号”,这部分更针对个人。在辅助的App里,用户可以录入自己的音频文件,直接在后台播放,未来还可能尝试付费模式。鼓励用户充分建立自己的语音信息,运用到具体的场景里。

虽然这款产品的名字是挂在“天猫”下面的,但足够可以看出阿里对于语音交互的重视。在这场几乎所有互联网公司都已经入场的技术大战中,阿里不希望落后。

在阿里巴巴技术团队中,流传着这样一句话:“阿里巴巴的商业掩盖了技术光芒。”不论正确与否,至少这代表了阿里的技术自信。

阿里巴巴的语音识别技术早就存在,只是一直没有对外公布。最早的应用在客服体系中,因为客服是接触语音最多的部门,客户每天会打电话进来,在客服的质检抽查中,人工质检效率低下,就需要语音技术识别、转化成文字版本,这是语音技术的第一个应用场景。

在天猫淘宝App中,都已经嵌入了语音搜索功能,神马搜索中也使用到了语音搜索技术。虽然识别的准确率有待提高,但这些都表明,阿里的语音交互产品是多年积累下来的技术,可以用在各个产品和场景中。







请到「今天看啥」查看全文