专栏名称: 雷峰网
中国智能硬件第一媒体
51好读  ›  专栏  ›  雷峰网

Siri 将会说上海话,但你知道苹果是怎么教会它的吗?

雷峰网  · 公众号  · 科技媒体  · 2017-03-10 22:41

正文



上周,谷歌将 Google Assistant 下放到 Android 6.0,而苹果的 Siri 、微软的 Cortana、亚马逊的 Alexa 最近也动作频频,一场围绕下 智能 语音助手的大战正在全面展开。

西雅图艾伦 人工智能 研究所 CEO Oren Etzioni 表示,Siri 作为最早入场的选手,其语音理解和回答问题的能力并不突出,白白浪费了先发优势。

但 Siri 并不是一无是处,它仍然有其他语音助手目前无法匹敌的优势:支持 36 个国家的 21 种本地语言。由于大多数的 智能手机 都是在非英语国家销售,对本地语言的支持将是非常重要的一个能力。

相比之下,微软的 Cortana 能够识别 13 个国家的 8 种语言,Google Aissitant 则支持 4 种语言,而亚马逊的 Alexa 目前只支持英语和德语。

但是 Siri 并没有停下,据外媒报道,iOS 10.3 即将支持上海话。

如果语音助手想要成为智能手机和其他智能设备标配的工具,那么语言问题将是其必须克服的障碍。但是语言本身对任何助手来说都是复杂的。比如在英国,当谈论足球比分时,“2:0” 要说成 “two-nil”,而不是 “two-nothing”。

苹果语音团队负责人 Alex Acero 在接受路透社采访时解释了如何教 Siri 学习一门全新的语言。

Alex Acero 说,在苹果公司,当研究人员开始教 Siri 一门新的语言时,会让真人用各种方言和口音来阅读文本段落,然后由听译人员用手转录成文本,这样计算机就可以拥有准确的样本用来练习。此外,苹果还会从不同的声音中捕捉各种语音。然后,苹果会建立起一个声学模型,并通过这个模型开始尝试预测字符序列。

Acero 称,苹果随后会在新语言中部署 “听写模式”,这是一种文本和语音之间的翻译器。当用户使用听写模式时,苹果会捕获音频录音中的一小部分,然后对其匿名处理。由于这些录音有背景噪音以及模糊不清的词语,将会由专人转录,这一过程可以将语音识别的错误率降低一半。

在收集了足够的数据,并让配音演员为新语言录制了声音之后,苹果就会向公众开放这一语言版本的 Siri。不过,发布之初 Siri 只能回答苹果认为最常见的问题。发布之后,Siri 将会从用户的实际问题中学习,并且会每两周更新一次,作出一些调整。

不过,智能助理 Ozlo 的创始人 Chales Jolley 表示,为语音助手撰写脚本无法做到规模化,“你不可能聘请足够多的作者为每一种语言撰写需要的脚本,你必须将答案综合起来。“他认为,这还需要多年的时间。

三星去年收购了 “Siri 之父” 创建的人工智能公司 Viv Labs,这家初创公司就正在着手解决这个问题。Viv 的联合创始人兼 CEO Dag Kittlaus 说:“Viv 旨在专门解决智能助理的规模化问题,要想跨过目前版本的功能局限,唯一的方法就是开放系统,让世界来教它们。“

via Reuters ,雷锋网编译


点击关键词可查看相关历史文章


近期热门


上线两个月,微信小程序给人们带来了什么?

谷歌收购 Kaggle 为什么会震动三界?

人工智能被写进政府工作报告意味着什么?

多达 20 位核心人才出走,特斯拉紧绷的神经要断了?







请到「今天看啥」查看全文