专栏名称: 腾讯
腾讯公司唯一官方帐号。
目录
相关文章推荐
阿里开发者  ·  select `*` from table ... ·  15 小时前  
阿里开发者  ·  LLM 联网搜索,到底是咋回事? ·  2 天前  
腾讯  ·  腾讯元宝「日更」: ... ·  4 天前  
百度智能云  ·  百度智能云xDeepSeek,最具性价比的D ... ·  4 天前  
51好读  ›  专栏  ›  腾讯

这个AI,居然能翻译王者台词,能玩同声传译,还能——

腾讯  · 公众号  · 科技公司  · 2017-11-21 13:06

正文

请听题:“请尽情吩咐妲己”用英文怎么说?


一秒思考时间结束,换下一位选手作答——




这位秒答满分的选手,就是 腾讯AI Lab正在开发中的翻译机器人


那么它目前最大的应用是什么? 同声传译。 比如像下面这样——




是不是相当的厉害?


毕竟,同声传译,对人类来说都不是件容易的事。 在每场几十分钟的会议翻译背后,是几十个小时的准备,几百个小时的积累,和几万个牺牲的脑细胞。


这也直接造成了“优质的同传不好找”的问题。于是人们想,能不能让机器学会翻译,进而做到“同声传译”呢?


但机器翻译 的实现比想象的难得多。 90年代的机翻 (也就是我们00后还没出生的时候) ,还经常出现这种不靠谱错误——



而经过几十年的研究,几代算法的更迭,机器翻译的错误率大幅下降,终于让更多尝试成为可能,包括同声传译。



前不久的腾讯全球合作伙伴大会上,AI Lab就现场展示了机器同声传译功 能。




那么,这是怎么做到的呢?


1、机器要先“听”明白你在说什么,才能翻译出来。


越是人多的场合,这一步越是关键。机器会将麦克风收录的声音进行检测、降噪等处理,再输入语音识别系统。


2、每个人讲话都自带语气,怎么办?


系统会对识别出的文本进行标点和口语化文字等处理,什么说话大喘气、句末加语气“ho”,通通打回原型,再输入到翻译系统。最后,翻译过的文本才会被投影到屏幕上。


3、怎样让译文更加忠实?


AI Lab 的科学家们使用了多种模型加强机器翻译学习,提升低频困难词的精准度,并加入了深层网络、残差网络和模型融合等技术,选取更优的译文。 (小编需要机器把这段中文翻译一下)


这一切,都必须在短短一两秒内发生 ,不然屏幕显示就会出现明显的滞后,极大影响使用体验。


为了提升解码速度,AI Lab采取了包括在GPU上解码、并行解码、选取优 先队列等多种方法 (机器,请把这段中文也翻一下) ,最终做到像视频里那样,译文和讲话者说的内容同步出现在屏幕上。




目前这些能力我们都已经在腾讯开放平台(AI.QQ.COM)上推出 。而未来,在出境游、商务会议、跨国交流等场景上我们都期待能有更广泛应用。


比如,和OCR字符识别技术结合后,就能做到拍照翻译。 以后在国外点餐、买东西都是小case!目前,手机QQ里上线了该功能。在手Q里打开“扫一扫”,再对准你面前需要翻译的文本拍照提取,就像这样——








请到「今天看啥」查看全文