专栏名称: 创业邦
创业邦唯一官方微信,中国最权威的创业服务平台。旗下有创业邦杂志、创业邦网站、孵化器等服务。我们是中国最有影响力的创新创业产品展示活动 DEMO CHINA「创新中国」主办方。创业邦官网:www.cyzone.cn
目录
相关文章推荐
新浪科技  ·  【#微信PC版内测收好友红包##微信PC版内 ... ·  13 小时前  
科技每日推送  ·  突发!特斯拉在华发布FSD功能,但老车主无缘 ·  14 小时前  
亿欧网  ·  闭源大模型又行了?Anthropic瞄着De ... ·  16 小时前  
爱范儿  ·  苹果AI官宣!4 ... ·  3 天前  
51好读  ›  专栏  ›  创业邦

首发 | 为创业2次抛弃微软,10年机器学习经验,Atman上线3月碾压谷歌、百度翻译,他说要把全世界变成朋友圈

创业邦  · 公众号  · 科技媒体  · 2016-09-12 19:54

正文


对于不是英语或特定语种专业出生的普通大众而言,一篇无一丁点母语的长篇大论甩你面前时,首先想到的是谷歌翻译,百度翻译,然后翻出的句子 连不起来 啊,还是不懂,接着瞬间 满脸蒙哔 了是不是?

如今得益于 人工智能 深度神经网络学习 大数据 等的快速发展,翻译已逐渐被颠覆。 机器翻译 能模仿人脑“理解语言,生成译文”。

准确度、流畅度 都得到大幅提高,甚至达到“ 译文流畅,符合语法规范,易于理解 ”的状态。再拿到一篇陌生语种的文章时,不会出现看不懂的情形。

所以,“未来 人工智能 解决 语言障碍 就像水电一样去融入人们的生活,成为生活的一部分,甚至感觉不到它的存在”, Atman 的创始人兼CEO马磊这样对邦哥说。

Atman是国内少有关注 机器翻译并追求自动化 的一家创业公司,2016年6月18日正式运营,目前已获得北极光 天使轮 投资。

十年机器学习经验,两进两出微软,后创办Atman

在互联网圈做算法的 “攻城狮” 们是令人佩服的,他们身上也拥有了典型的理科男特质: 简单、淳朴 。初次见到马磊就是这样,谈话间不会用过多华丽的辞藻形容自己的公司,自己的团队。一个多小时的采访基本被十年多的 工作内容和对行业激情 占满。

马磊,清华大学计算机系毕业,曾在 微软研究院和微软搜索中心 供职过,在后者担任Cortana及相关产品构架师, 专长是机器学习 。曾完整撰写过 语音识别、统计机器翻译( SMT )的解码器( Decoder )代码 。有丰富的 Bing 搜索的海量数据做传统和深度机器学习的经验。

第一次 离开微软是为了 创业 ,也就是 10年前 出来做基于内容搜索的在线教育,当时的他想,一个工程背景很强、对算法清楚的人,不会跨越不了 研究、产品运营推广 等这些阶段,但事实证明,还真没跨越过去。

再次 回到微软后,马磊吸取创业教训,来到工程院搜索技术中心,在产品部门待了三年多,潜心学习。也是在这期间,认识了如今一起创业的团队成员,他们之间对彼此的品质了如指掌。

这其中就有Atman的CTO刘炜,毕业于北大电子系,擅长 工程实作和团队管理 ,思维稳定细致。马磊告诉邦哥,“其实一开始刘炜是不愿意创业的,被我天天浇水,有天开花了就出来一起干了”。

第二次 离开微软后,马磊创办了Atman,已经有着 10多年的机器学习经验 ,带着微软的 文化基因 ,对二次创业可以说做了充分的准备。

Atman的核心:解决翻译的流畅度

生活中我们所熟知的好点的翻译工具无非是谷歌翻译、百度翻译,但当你使用的时候,会发现一个 问题 :即便你有一定的语言知识,这类工具翻译出的句子依然是晦涩难懂的。它需要我们对句子重新进行组合,以便符合人类的感知行为。这其实超过 50% 的工作需要我们自己完成。

更别说一些 专业领域 ,比如医药、法律等,都是人工在翻译,因为目前 不存在 机器翻译可以胜任这样一份工作。

所以, 不同于 这些做广谱翻译的大公司, Atman 的翻译平台目的 在于打通翻译的障碍 ,平台不分语言,只要有数据,机器就能自己学习。机器从 0 开始进入一个领域( 零成本进入 )也只需要2周时间。所以,进入哪个领域都能 高度垂直 的做下去。

比如, 财经类文章翻译,世界好的财经网站的文章总和 不超过 1000 万篇 ,让机器学习一遍这些文章,就可以保证财经类文章的翻译有 95% 的流畅度,而且能做到 实时同步 。而这一过程,机器模型自身也会变得越来越好。

马磊很开心地表示,你以前用谷歌的翻译,能把人工降到 50% 可能还没一半 ),加入我们平台后降到 10% ,不用再疲惫地去看网页翻译,阅读的心情都不是一个量级的。

当然,他也坦言, “我们期望人尽量少去对翻译出的文章进行编辑,但现在完全取代人还不可能,毕竟人类的 感情、情绪、隐喻的东西 对机器而言还是有难度的,但未来应该可以解决”。

所以,在马磊眼里人工智能时代,商业模式是会被颠覆的。

目前,Atman针对 C端 用户有一个“量子镜”项目计划。 目标 是精选国内用户会感兴趣的国外高质量内容网站,通过机器翻译技术,提供翻译后的中文内容给国内用户阅读( 按照目前单机的翻译速度,镜像一个百万文章级别的内容网站,需要一个月左右时间 )。

而对于 B端 用户:机器翻译主要对某个 垂直领域 进行翻译。另外,接下来几个月计划开发智能的CAT软件,以辅助B端客户做最终的人工校对。

为什么是Atman而不是巨头在做这件事

世界上能写成文字的语言大概有 300多种 ,它们就像互联网里面的一个大群,这些群目前还没有沟通,相当于 信息孤岛 语言障碍 )。而 机器翻译 能把信息孤岛连接起来,之后整个世界就可以像微信朋友圈那样了。

10 前,一家公司流畅性地翻译全世界的语言,有人感想但做不到。因为根本 没有 技术基础可以进行突破。

如今, 人工智能 的快速发展让这一想法得以实现,但世界的公司都处于这样优越的条件,包括很多世界级的巨头, 为什么 偏偏是Atman这样的 创业公司 先发制人?

首先: 团队, 人才没有区别 ,但从项目投入的人力资源上反而比大公司好,因为大公司审批机制比较落后。

第二:项目进度 ,立完项目,创业团队所有人精力都会搭在这个项目上,单点项目上绝对人数比大公司多。

第三: 马磊认为创业公司 狼性文化 更强,这点很重要

第四 资金投入 ,大公司关注所有项目,单点的投资就不如创业公司。

但马坦言,像Atman这样的创业公司在 方向性 上的风险更大,对于大公司而言,无非白投了。而对于创业公司,可能意味着人员重组或者更严格的变动等。

但不管怎样,马磊告诉邦哥,“至少从 技术角 度,在垂直领域翻译这块Atman是 第一梯队 的”。

BLEU评分也 证明 了这一点:


(政治领域的机器翻译和主要翻译服务提供商的评分)

注: BLEU评分是国际上通用的客观评测机器翻译质量的指标。


- END -

邦哥的好朋友:毒舌科技 l ID:dushekeji

长  按  二  维  码 , 一  键  关  注







请到「今天看啥」查看全文