2018年全球语音设备将超5000万台,声音正成为内容的巨大入口,
各大媒体也
开始
纷纷试水。
他们如何利用语音助手升级新闻产品形态?从文字转向语音的正确步骤是什么?智能语音技术浪潮下,媒体又面临哪些挑战?
出品| 外言社
翻译| kewell
编辑| 王茸
如今,全世界已经有4亿人在使用谷歌语音助手,亚马逊也声称,其语音助手Alexa仅在一次黑五促销中就卖出了几百万台。涵盖了语音识别、语音交互等功能的智能语音助手正成为内容的巨大入口。
十年后,这样的语音助手将会有多少?这会给新闻业带来怎样的改变?现在新闻媒体已经会利用语音助手来完成播客、简报和测试,但这项技术是否还有更广阔的使用空间?
(2018年智能语音助手预测销售量为5630万台)
BBC、《
金融时报》等媒体如何掀起语音革命?
1. 播客和
新闻简报
BBC的音频编辑Mukul Devichand表示:“跟其他媒体一样,我们也在试验语音交互项目的各种创意。”2017年底,BBC已经在各大主流平台上架了音频新闻简报,也利用Alexa向英国受众推送音频直播和播客内容。现在他们也在研究Google Voice设备的功能。
(BBC新闻简报)
“我们的受众增长非常快,今年1月的UV已经超过百万。受众希望听到有趣的音频新闻、音乐等内容,接下来我们会看看有没有可能把音频内容应用到到音频互动模型上。”
2. 新闻对话
德国巴伐利亚广播则着重把已有的音频、电视内容转移到语音助手上,接下来他们打算用AI模仿记者与用户对话。
让用户可以随时打断新闻播报,进而寻找更多细节,这将让他们不再只是被动的接受者,而成为主动的探寻者。而且,口述指令比用手指在屏幕上打字更轻松省时。
3. 新闻测试和“脏话罐”
《金融时报》
FT Labs团队为Google Home打造了一个新闻小游戏,利用自身丰富的数据库,让人们判断一些有关公众人物的信息是否正确,如果用户对此感兴趣再进一步给出详细报道。
(《金融时报》的新闻测试)
此外,他们还做了一个“脏话罐”试验,模拟可能在网络中出现的语音评论,旨在提升评论质量,同时惩罚那些拒绝删除恶意评论的用户。这项功能通过用户语音交互页面录下声音,经过情感分析和“脏话罐”检测来进行判断。
FTLabs的项目总监Chris Gathercole
表示:“脏话罐项目是在为期两天的编程马拉松中完成的,因此,比起实用度它更代表了一种理念。但这个初步尝试是比较成功的,说不定就能应用到现有的语音助手上,相信这会为管控评论的同事们带来很大便利”。
4. 娱乐和儿童类产品
去年,BBC推出了基于 Alexa 的互动广播剧“检查室”(The Inspection Chamber)”。这是一个科幻喜剧,用户可以通过与智能音箱互动在故事中进行角色扮演,通过自己的选择推动剧情发展,不同的选择还将导致不同的故事结局。
(
BBC互动广播剧“检查室”
)
2018年,BBC还打算推出以儿童为目标受众的内容,这体现了BBC立志做好公众服务的核心宗旨。不过,语音服务会如何影响儿童?作家Stuart Heritage曾在《卫报》上探讨过Alexa对他两岁儿子的影响:“我们一直很注意教导他要有礼貌,但当他发现角落里的小圆筒可以满足他任何语气的任何指令,这会带来什么影响?我不确定”
。
想从文字进军语音?先做到这四点
1. 好音频基于好内容
《金融时报》认为,在使用智能语音之前,媒体应该先做好文本转语音(TTS)的处理。这项工作并不容易,因为在现有技术下,TTS可以生成句子,但生成整篇文章却很难。比如,一些幽默讽刺的精妙表达,或者长长的清单列表就难以被语音呈现。
而且,受众是否真的愿意听完一整篇新闻报道呢?
FTLabs的项目总监
Gathercole建议,先从短小精悍的内容做起,并且先专攻一类。
2. 人机交互
《金融时报》的文本转语音工具是亚马逊的Amazon Polly,一次转换只需要1到3秒时间,阅读机器人是Artificial Amy。这是否意味着AI可能取代人类主播的工作?
Gathercole讲了这样一件事:《金融时报》的一位专栏作家在听到机器人朗读自己的文章之后非常生气,并要求撤下音频。“听AI朗诵,比听英语不好的外国人讲话还别扭。它的表现能力太弱,连我都听不懂自己写的是什么了。”
阅读机器人Artificial Amy
的音色其实很棒,学习成本也不高,但要让她做到像人类一样朗诵,确实还得费一番功夫。Gathercole因此也推荐人机合作的模式:让人类阅读一部分,AI作为辅助进行补充,而把语音和视频结合也不错。
3. 创造个性
谷歌工程师
Hodgson曾表示
,不要指望语音助手面面俱到、平衡中庸,赋予它个性化的人设效果可能更好。
比如,苹果刚推出Siri的时候,追求的是“中性化”,但这一策略很失败,很多用户都觉得Siri有些尖酸刻薄。相比之下,亚马逊的Alexa就多了自己的个性,还是个明确的女权主义者。“如果你询问Alexa是否支持女权,她会给出肯定的答复,还会说'我跟所有致力于抹平男女地位不平等的人一样'。她也支持多元化和进步派,相信科技。”
所以,应该给语音助手设定好自己的背景和立场,恰到好处的个性才有助于推广品牌。
还有一个正面例子是Quartz在Alexa上的新闻节目Newcast,它应用了AI主持人,用幽默诙谐的语调阅读新闻标题和内容,还能和听众进行对话。此前Quartz就用Alexa阅读过每日新闻简报,后来他们发现,加入更多对话型内容、多元化声音效果会更好。
FT Labs团队也在考虑给AI语音加入品牌个性,现在他们推出的语音助手是一名青年小伙子的人设。“他不是用来聊天的,他很安静但是会把值得关注的内容全都提炼给你。”FT Labs希望他们的智能语音助手是工具而不是聊天伴侣,以防止电影《
她
》中
“人机恋”的剧情上演。
4. 编写对话与自我修复
“对话就是一切”,
谷歌工程师
Hodgson
指出,“(媒体)需要创作对话样本,再逐一尝试。”
写对话和说话往往是两码事,所以在编写对话之后最好大声朗诵一遍,想想可能会有什么不对的地方。Hodgson说,这也是AI语音助手开发过程中需要借鉴编剧经验的原因。
写好对话的下一步就是建立自我修复机制。Hodgson表示,有些人不喜欢语音助手的原因就是人机互动经常失败。当用户感到不爽、尴尬、疑惑,62%的人会重启再试,其余则会放弃。所以,开发语音助手需要建立有效的自我修复机制,让人们愿意继续使用。
语音时代,媒体面临哪些挑战?
1. 用户需求不明确
Gathercole指出,很多用户清楚自己需要什么播客内容,也能把节目很好地嵌入自己的日常生活。但对于语音助手,他们还能做到这点吗?他们又清楚自己想要什么吗?