作为一个移动跨境产品的PM,我深感科技有“毒”。
今年AI的火爆,已经超出我的想象,很希望搭上AI的这趟船,利用AI技术为我司产品解决些实际问题,提升用户量级与活跃度,这也算是一种救赎吧(希望我司大大能看到我这么用心)。
言归正传,跨境移动APP最大的一个问题就是语言不通。所以,找到一个合适我们产品场景的语言翻译工具很重要,而能找到一个适合我们产品场景需求的却不多。
最近发现神经网络翻译(Neural MachineTranslation)简称NMT,是全新的翻译引擎,通过人工智能+翻译的应用,可以不断学习用户的使用习惯,优化翻译结果。体验了NMT的翻译结果,效果很理想。所以找到一家有这样的技术的服务公司,应该能解决我们的问题。
(一)
长久以来的PM的惯性思维习惯告诉我,凡是研究科技,首先要去了解谷歌做了些什么?看看能不能将谷歌新的技术引用到自家产品上,这次同样先去观摩下。
果不出所料,谷歌在这一领域已推出了谷歌神经机器翻译GNMT(GoogleNeural Machine Translation)系统,实现了机器翻译质量的大幅度提升。
高兴之余,我也在同类搜索新闻中,看到一家企业也在做NMT技术——网易有道。这家公司在人工智能翻译技术方面走得也很快,在翻译领域也有十年的积累了,做到好的产品像有道词典,大家已经都知道了。
随后我又度娘了下这家国内互联网公司更多的新闻,一发不可收拾,前后花了几个小时进行产品技术、价格、应用场景等多维度进行对比后,发现这家公司做得很6,其实外国的月亮不一定比国内的圆嘛!
首先了解了下翻译质量~网上有很多对比的翻译效果:
在长句上,有道NMT效果比其他NMT效果还是好一点。(还好英语不是体育老师教的,凑合看懂)
我亲测了下:
一个简单的游戏术语,有道和谷歌翻译结果都不太理想。专业术语翻译都还需要加强。
文言文翻译,有道的结果明显更准确。句子比较完整,对文言文的理解比谷歌厉害~
(二)
进一步了解到,网易有道最近推出了AI商业化的产品——有道智云,看上去适合我们这种需要技术接口服务的。后来看到有道智云上上线了有道NMT和OCR技术。扒到一些数据:
从整个翻译行业角度来看,衡量技术水准最直观的标准,是翻译产品能不能为用户带来便捷和准确的内容释义。通过BLEU(双语评估研究-BilingualEvaluationUnderstudy),一项国际最受欢迎的评估指标,可以评测出内容翻译的准确率。以有道和国际同类产品的中英互译为例,并进行了对比,结果显示,在新闻和英语学习类语料中,有道神经网络翻译的翻译准确度都高于国际同类产品,并且BLEU值最高超出对手近10个百分点:
有道最近又上线了日韩语神经网络翻译,效果好像也很突出。
同样从BLEU数值上来看,有道神经网络翻译的中日、中韩翻译准确度都高于国内和国际同类产品。甚至在中韩翻译上,有道神经网络翻译高出国际同类产品20多个百分点:
另外,在有道7月4号的开放日活动上,又看到了有道自己研发的OCR(OpticalCharacter Recognition),光学字符识别,也就是通常我们说的图片文字识别,可以直接识别图片上的文字,体验效果还不错。
据说,他们的图片标准文字寻找和识别率达97%以上,对于图片中特殊文字寻找和识别率也可达90%以上。
有道首席科学家段亦涛在活动上介绍,OCR识别准确度超过了业内同类的产品,尤其是在英文识别准确度上,高出国内同类产品近10个百分点(不明觉厉~):
(三)
相信很多人跟我们一样,在自己产品环境中,经常会遇到一些语言场景需求。而我们自己有解决不了,有道智云提供的包含NMT、OCR这些机器翻译技术API和SDK比较应景。另外,本地化服务,像系统升级、保密服务和语料库搭建,这些正好是我司也需要的~
费用方面,在有道开放日的活动上了解到,目前,神经网络翻译提供的接口传统API方式,定价为48元/百万字。另外,还提供IOS和安卓两个版本的SDK,定价为1元月/激活。价格比其他同类型的服务厂商便宜很多~
目前已经有支付宝、微信、360、掌阅、网易邮箱、华为荣耀Magic手机......这些应用接入了智云的服务。
所以,了解完后,我已经忍不住注册了一个账号,开始使用智云提供的这套技术(虽然长期的效果还有待继续观察和使用)。大家有兴趣,可以去尝试下。有问题也可以留言探讨下。
点击“阅读原文”可以快速体验有道智云免费服务!