专栏名称: Cocoa开发者社区
CocoaChina苹果开发中文社区官方微信,提供教程资源、app推广营销、招聘、外包及培训信息、各类沙龙交流活动以及更多开发者服务。
目录
相关文章推荐
51好读  ›  专栏  ›  Cocoa开发者社区

​不要再让我和语音助手说话了!

Cocoa开发者社区  · 公众号  · ios  · 2017-06-07 11:13

正文

翻译:枣泥布丁



苹果在本周的WWDC上最隆重的发布就是搭载了siri的HomePod,HomePod也将成为Amazon’s Echo的强大竞争对手。大会还发布了苹果语音助手的更新,在这个充满了Amazon ,Google以及其他科技巨头的语音助手市场,苹果语音助手也将变得更加实用和强大。


但是即便是在强大的自然语言处理系统和附加的功能也没办法解决我和Siri以及其他语音助手的核心问题,那就是:我就是不想和它们说话……


我非常讨厌不小心触发Siri


我的其中几位同事非常喜欢它们,但对我来说,它是非常扰人,不受欢迎,非常令人尴尬的。在我使用iPhone的5年间,我非常谨慎地使用Siri的次数用一只手就数得过来,而我使用它仅仅是因为我想向一些老年朋友和小朋友证明它确实是有用的。最近唯一一次我唤醒Siri是把手机掏出口袋的时候不经意间触发的,我的第一反应就是保持安静,即使是我在说话我都会停下来,只是为了防止她对我的话产生回应。


更糟糕的是当它确实捕捉到你的只言片语的时候,它就开始发出尖锐的声音盖过你。我的手机默认是英式英语,而且英国版本的Siri用的是一种上流社会腔调,稍稍苛刻的男性声音,听起来就像一位可怕的老师。“不好意思,我不明白你的意思。”他会这么说,但是听起来却像是我犯了错一样。就像我没有完成我的家庭作业,不过相较于家庭作业,我倒觉得这充分解释了我口袋里的机器人检索词。


我想为我对Siri的恐惧进行辩解,然后想象这其实是因为我对隐私的担忧。不过我还是有个观点的,现在是个通过浏览记录就能非常可怕地对你的个性进行判断和行动进行预测的互联网时代,因为热的要命的夏天就要来了,有天我就随手在亚马逊上搜除湿器,只是想看看价格什么的。现在我浏览的每个网站都试图向我推销加湿器,他们的花絮报道铺满了一排一排的蹲式的白色除湿器。


在现在这个世界,我不希望Siri能通过我的搜索主题,唤醒它的时间,甚至是我的口音就能描绘出我的画像(或者展示苹果早就已经保存的画像)。


和陌生人交流已经够糟糕了


但是我其实意识到了我对语音助手的恐惧其实来自一个更次要的地方。我是一个英国人,所以和一个陌生人交流,已经够尴尬了。而和一个藏在我家里并且在我说话太大声就冒出来指责我的机器陌生人交流我就更承受不起了,尤其是在所有人都能听见我的公众场合被这么对待的时候。


在我现在所住的乡村的时候,这种恐慌会进一步加剧。日本的公共空间一般是非常安静的,并且社交压力也使得他们不得不如此。我简直不敢想象我在安静地驶向忙碌的京都的路上,我掏出我的iPhone,然后用我人类的声音向Siri询问酒店预订的事。而且我也不认为这符合当地的习惯,我始终还是没有办法在公共场合使用语音助手进行某些方面的行为表述,除非我真的想要一堆不知道什么鬼东西知道我那天在哪儿吃完饭。我想游戏设计师Tak Fujii(藤井隆之)会理解我的想法的。


很多小工具都想让你说Hey Siri或者Alexa,OK Google, Xbox还有其他一些什么玩意儿。你觉得这对吗?我反正不觉得,因为我是个害羞的男孩儿~

— Tak Fujii 藤井隆之 (@Tak_Fujii) January 20, 2017


我的意思并不是说Siri(以及它的小伙伴Alexa,Bixby还有其他朋友)不是强大的工具,但是它们一旦出了自己的母语国家,作用就会大大减弱。我的在日本居住的朋友Sam Byford之前就写到过跨语言使用Amazon’s Echo的困难,而且它们甚至有时对母语的一些改变都难以理解。


这些语音助手基本上都是为美国的英语使用者设计的,但是我说的是带英国口音的英式英语。它依然是英语,只不过我的语速更快,音调更低,发音比较含糊,和大西洋彼岸的朋友们还是有细微的差别。比如Aluminium(铅),router(路由器)或者Featherstonehaugh这些词。


有时候我发现美国人类朋友没办法理解我,我看到他们把头侧到一边,我知道到我们必须要使用同一种通用语。而机器人就更没有机会理解我了,因为他们没办法读取我们的面部表情和获得语境的相关线索。而且它也没办法做我认为我朋友经常做的事:简单地点个头,微笑,事后询问另一个人我到底在说了些什么鬼。


不过我常常能在第二或者第三次使我的语音助手明白我的意图,但是对于那些口音更重的朋友们就会更困难些了。我在买PS4的时候一起买了一个PlayStation Camera,(无比愚蠢地)认为这将会成为新一代游戏操作过程的不可或缺的一部分。当我第一次用它的时候,我叫来我的老婆看我只是用我声音的力量开启一场游戏……“酷~,”她说,“我试试”。


我的PLAYSTATION也并不能理解我……


为了准确起见,我老婆是来自英国东北部,她的口音在我们国家被称为Geordie(泰恩赛德口音)。她的口音这些年已经轻了很多,但是当她发“book”的音的时候,会把元音“oo”拉得很长,把“PlayStation”发成“PleeSteetian”。这对我的游戏操作键盘来说已经相当令人疑惑了,它非常不屈地要搞懂我老婆到底在说啥,但是始终没搞明白。当然,如果我们使用加州冲浪好手的口音,它一次就成功搞明白了,但是它对我的伤害已经造成。于是我把它包好放在纸盒里收起来再没让它见天日。


我也亲眼所见一些口音非常重的朋友在使用Siri的过程中遇到同样的问题,他们的scouse(利物浦口音), manc(曼彻斯特口音), or brummie(伯明翰口音)和brogue(爱尔兰人或苏格兰人的土腔)都在我放手机的衣袋中遗失了。等他们第三次重复他们的指令,还不如直接抓起手机打字输入他们要找的东西来得快。


不过说真的,难道真的有那么糟糕吗?声控作为辅助科技操作起来还是很爽的,但是每个公司好像都试图用他们的会说话的机器人侵犯公共空间,你的家,甚至是你的口袋。这个世界已经够吵了,难道就不能让我安静一会儿吗?