对于不是英语或特定语种专业出生的普通大众而言,一篇无一丁点母语的长篇大论甩你面前时,首先想到的是谷歌翻译,百度翻译,然后翻出的句子
连不起来
啊,还是不懂,接着瞬间
满脸蒙哔
了是不是?
如今得益于
人工智能
、
深度神经网络学习
、
大数据
等的快速发展,翻译已逐渐被颠覆。
机器翻译
能模仿人脑“理解语言,生成译文”。
其
准确度、流畅度
都得到大幅提高,甚至达到“
译文流畅,符合语法规范,易于理解
”的状态。再拿到一篇陌生语种的文章时,不会出现看不懂的情形。
所以,“未来
人工智能
解决
语言障碍
就像水电一样去融入人们的生活,成为生活的一部分,甚至感觉不到它的存在”,
Atman
的创始人兼CEO马磊这样对邦哥说。
Atman是国内少有关注
机器翻译并追求自动化
的一家创业公司,2016年6月18日正式运营,目前已获得北极光
天使轮
投资。
十年机器学习经验,两进两出微软,后创办Atman
在互联网圈做算法的
“攻城狮”
们是令人佩服的,他们身上也拥有了典型的理科男特质:
简单、淳朴
。初次见到马磊就是这样,谈话间不会用过多华丽的辞藻形容自己的公司,自己的团队。一个多小时的采访基本被十年多的
工作内容和对行业激情
占满。
马磊,清华大学计算机系毕业,曾在
微软研究院和微软搜索中心
供职过,在后者担任Cortana及相关产品构架师,
专长是机器学习
。曾完整撰写过
语音识别、统计机器翻译(
SMT
)的解码器(
Decoder
)代码
。有丰富的
Bing
搜索的海量数据做传统和深度机器学习的经验。
第一次
离开微软是为了
创业
,也就是
10年前
出来做基于内容搜索的在线教育,当时的他想,一个工程背景很强、对算法清楚的人,不会跨越不了
研究、产品运营推广
等这些阶段,但事实证明,还真没跨越过去。
再次
回到微软后,马磊吸取创业教训,来到工程院搜索技术中心,在产品部门待了三年多,潜心学习。也是在这期间,认识了如今一起创业的团队成员,他们之间对彼此的品质了如指掌。
这其中就有Atman的CTO刘炜,毕业于北大电子系,擅长
工程实作和团队管理
,思维稳定细致。马磊告诉邦哥,“其实一开始刘炜是不愿意创业的,被我天天浇水,有天开花了就出来一起干了”。
第二次
离开微软后,马磊创办了Atman,已经有着
10多年的机器学习经验
,带着微软的
文化基因
,对二次创业可以说做了充分的准备。
Atman的核心:解决翻译的流畅度
生活中我们所熟知的好点的翻译工具无非是谷歌翻译、百度翻译,但当你使用的时候,会发现一个
问题
:即便你有一定的语言知识,这类工具翻译出的句子依然是晦涩难懂的。它需要我们对句子重新进行组合,以便符合人类的感知行为。这其实超过
50%
的工作需要我们自己完成。
更别说一些
专业领域
,比如医药、法律等,都是人工在翻译,因为目前
不存在
机器翻译可以胜任这样一份工作。
所以,
不同于
这些做广谱翻译的大公司,
Atman
的翻译平台目的
在于打通翻译的障碍
,平台不分语言,只要有数据,机器就能自己学习。机器从
0
开始进入一个领域(
零成本进入
)也只需要2周时间。所以,进入哪个领域都能
高度垂直
的做下去。
比如,
财经类文章翻译,世界好的财经网站的文章总和
不超过
1000
万篇
,让机器学习一遍这些文章,就可以保证财经类文章的翻译有
95%
的流畅度,而且能做到
实时同步
。而这一过程,机器模型自身也会变得越来越好。
马磊很开心地表示,你以前用谷歌的翻译,能把人工降到
50%
(
可能还没一半
),加入我们平台后降到
10%
,不用再疲惫地去看网页翻译,阅读的心情都不是一个量级的。
当然,他也坦言,
“我们期望人尽量少去对翻译出的文章进行编辑,但现在完全取代人还不可能,毕竟人类的
感情、情绪、隐喻的东西
对机器而言还是有难度的,但未来应该可以解决”。
所以,在马磊眼里人工智能时代,商业模式是会被颠覆的。
目前,Atman针对
C端
用户有一个“量子镜”项目计划。
目标
是精选国内用户会感兴趣的国外高质量内容网站,通过机器翻译技术,提供翻译后的中文内容给国内用户阅读(
按照目前单机的翻译速度,镜像一个百万文章级别的内容网站,需要一个月左右时间
)。
而对于
B端
用户:机器翻译主要对某个
垂直领域
进行翻译。另外,接下来几个月计划开发智能的CAT软件,以辅助B端客户做最终的人工校对。
为什么是Atman而不是巨头在做这件事
世界上能写成文字的语言大概有
300多种
,它们就像互联网里面的一个大群,这些群目前还没有沟通,相当于
信息孤岛
(
语言障碍
)。而
机器翻译
能把信息孤岛连接起来,之后整个世界就可以像微信朋友圈那样了。
而
10
年
前,一家公司流畅性地翻译全世界的语言,有人感想但做不到。因为根本
没有
技术基础可以进行突破。
如今,
人工智能
的快速发展让这一想法得以实现,但世界的公司都处于这样优越的条件,包括很多世界级的巨头,
为什么
偏偏是Atman这样的
创业公司
先发制人?
首先:
团队,
人才没有区别
,但从项目投入的人力资源上反而比大公司好,因为大公司审批机制比较落后。
第二:项目进度
,立完项目,创业团队所有人精力都会搭在这个项目上,单点项目上绝对人数比大公司多。
第三:
马磊认为创业公司
狼性文化
更强,这点很重要
第四
:
资金投入
,大公司关注所有项目,单点的投资就不如创业公司。
但马坦言,像Atman这样的创业公司在
方向性
上的风险更大,对于大公司而言,无非白投了。而对于创业公司,可能意味着人员重组或者更严格的变动等。
但不管怎样,马磊告诉邦哥,“至少从
技术角
度,在垂直领域翻译这块Atman是
第一梯队
的”。
BLEU评分也
证明
了这一点:
(政治领域的机器翻译和主要翻译服务提供商的评分)
注:
BLEU评分是国际上通用的客观评测机器翻译质量的指标。
-
END -
邦哥的好朋友:毒舌科技
l
ID:dushekeji
长 按 二 维 码 , 一 键 关 注