专栏名称: 36氪
36氪(36Kr.com)是中国领先的科技新媒体,我们报道最新的互联网科技新闻以及最有潜力的互联网创业企业。
目录
相关文章推荐
新浪科技  ·  #网友呼唤雷军做卫生巾# ... ·  昨天  
新浪科技  ·  【#车主吐槽修电池要拖到200公里外#!#新 ... ·  2 天前  
创业邦  ·  日本TV,被中国打得一败涂地 ·  3 天前  
51好读  ›  专栏  ›  36氪

为什么巨头扎堆做机器翻译?网易有道用AI替代了50%人工译员

36氪  · 公众号  · 科技媒体  · 2017-05-30 22:45

正文


在机器替代人类劳动力的征途里,翻译是最先感受到冲击的前哨阵地。 因为在既有的AI技术中,机器翻译是成熟度相对高的领域。即便出于炫技,翻译也是必争之地。




文 | 孙然



10年前,网易有道翻译产品上线,接替了传统电子翻译机“文曲星”的班,是国内最早涉足翻译领域的互联网公司。此后数年间,类似的翻译产品贯 穿了很多中国人学英语的记忆。

但由于时常出现形态尴尬的整句翻译,没人指望机器翻译能大规模替代严谨的人工译员。每逢正式的用途,人们仍愿意出高价雇个英语专八的学生,甚至专业同传来确保准确度。

一直以来,翻译是很多外文系学生赚外快甚至谋生的渠道。这门生意 规模不大,但需求稳定。网易有道CEO周枫估算过人工翻 译市场的盘子,400亿元左右。目前有道的纯人工翻译业务,一年的营收规模数千万元。2011年上线五年的订单总量在一百万单以上。

不过去年事情有了变化。原因是谷歌在2016年9月27日宣布推出谷歌神经网络机器翻译系统,《麻省理工学院技术评论》杂志评价,采用神经网络技术的Google翻译准确率几乎与人类无异。

神经网络翻译之所以准确性高,是因为“说人话”。它在翻译逻辑模 仿了人脑的表达模式,通俗地讲,能把一句话中所有词汇的语意融合在一起分析理解。而统计翻译是挨个识别和理解词汇,却难 以理解不同词汇融合后产生的含义。经常生硬地蹦关键词,串起来就不知所云。

这项技术变革对于翻译行业有多大意义? 周枫的评价是,从传统机器翻译到神经网络机器翻译的变革,可以比喻成从“手工针线活儿”到“缝纫机”的变革,神经网络翻译带来的翻译质量的提升, 是过去十年的总和。

网易有道开始关注神经网络翻译技术,是2014年。这个举动源自行业中一项节点性事件——在国际赛事ACL WMT 2014中,神经网络翻译技术的准确率首次超过传统的统计机器翻译技术,这意味着神经网络翻译初步具备了商业化的可能性。

这个突破对于做翻译产品的公司而言,出现得恰逢其时。 “2014年,统计机器翻译技术的商业化已经发展了近十年,我们发现再投入人力资金去寻求技术提升,回报率很低。而NMT这种基于深度学习 的技术,每个月翻译质量的进步都是惊人的。”周枫说。

在那之后的两年间,关于神经网络翻译的研发战争就开始了。根据新智元统计,在arXiv.org 存储库中,涉及NMT (神经网络翻译) 的论文从2014年的7篇,2015年的11篇,上涨2016年的67篇。

而大规模的产品化,发生在谷歌发布翻译产品之后的半年中,谷歌、百度、科大讯飞、搜狗、微软、有道,均上线或更新了翻译产品。

你可能会奇怪,为什么大型技术公司都扎堆做翻译? 事实上,无论对于上述哪家公司,翻译都不是块有极大商业空间的业务。但在机器替代人类劳动力的征途里,这是最先感受到冲击的前哨阵地。 因为在既有的AI技术中,机器翻译是成熟度相对高的领域。即便出于炫技,翻译也是必争之地。







请到「今天看啥」查看全文