专栏名称: 虎嗅APP
有视角的商业资讯交流平台
目录
相关文章推荐
微软科技  ·  AI应用落地的11个真相,每一个都反常识 ·  15 小时前  
新浪科技  ·  #屈臣氏中国利润6连跌# ... ·  15 小时前  
新浪科技  ·  【#苹果AR眼镜专利曝光#:侧臂多功能化,解 ... ·  17 小时前  
51好读  ›  专栏  ›  虎嗅APP

罗永浩、余承东来捧场,科大讯飞炖了一锅怎样的人工智能鸡汤

虎嗅APP  · 公众号  · 科技媒体  · 2016-11-25 08:12

正文


科大讯飞用一场4个小时的发布会,考验着人们对这场人工智能技术秀的耐心和对困意的抗争。

11月23日,科大讯飞踩着2016年的尾巴在北京国家会议中心举行了一场年度发布会。因为听说罗永浩也会来,所以导致原本预定2000人的规模被迫增加到3000人。

在发布会开场时,主持人介绍了一圈到场嘉宾的名字,喊到周鸿祎、余承东时,现场依然表示情绪稳定,但当喊到罗永浩时,现场的掌声顿时热烈起来,并伴有欢呼声。

这场年度发布会更像是科大讯飞的技术博览会,展示的大多数技术或多或少地在此之前被媒体报道过。当发布会进行到2个小时的时候,厌倦、疲惫、抱怨和瞌睡夹杂其中。如果不是因为人们期待罗永浩上台讲10分钟的信念支撑,相信很多人可能无法等到最后。

但遗憾的是,虽然很多人冲着罗永浩而来,但是到最后一刻,他也没有上台讲两段,并且在展示了迷人的微笑之后,估计就悄悄撤了。

技术公司少说废话

在我们的印象中,科大讯飞以出奇的低调著称,相比BAT们三天一大会两天一小会地刷存在感,这家总部在安徽合肥的科技公司一年也搞不了几次会。

发布会结束后,我跟科大讯飞的工作人员闲聊,她告诉我,科大讯飞坚持一年只搞一次发布会的节奏,所以这次发布会的时间格外长。

但通过这场发布会你会发现,尽管以低调著称,但它的董事长刘庆峰一点儿也不低调。在开场的前40分钟,刘庆峰口中频繁出现了科大讯飞获得的十几个“第一”,言辞铿锵,气吞山河,在一个又一个“第一”被他如数家珍般的从嘴里蹦出来的过程中,让我对讯飞低调的体质产生了怀疑。

这场漫长的发布会并非没有亮点,当科大讯飞的产品经理们现场演示自家的技术在智能家居、汽车、电视、机器人等不同领域的应用时,那种强烈的现场代入感,夹裹着人们对技术的信仰和对美好未来的迫切愿景,人们毫不吝啬地给出了掌声。

但亮点太多也并不完全是好事儿,全是亮点就意味着没有亮点,因为失去了焦点。

多语种实时翻译技术


讯飞全球首发了多语种实时翻译技术,能够实时将中文翻译成英语、日语、韩语、维吾尔语、藏语等。

在两侧的屏幕上,讯飞听见能够将演讲者的话实时转录成文字,这种场景我们已非常熟悉,我此前也曾专门对它进行过报道。但这次,讯飞首次亮相了多语种实时翻译,即除了把演讲者的话实时转写成汉语外,它还能同时转写成英语、韩语、日语、维语、藏语。



所以,我很长一段时间都是盯着左侧屏幕,看它是如何工作的。

根据现场演示的,操作者会调出一个带有语言标识的菜单,旋转菜单即可选择你想展现的语种,比如选择中英文,则在屏幕的上半截显示中文,下半截显示英文;比如选择中、英、韩语,则屏幕上半截显示中文,下半截并列显示英文和韩语。

但它依然没有解决的问题是,它依然只能做到中文是中文,英文是英文。演讲者在演讲中会夹杂很多英语,但讯飞听见的转写系统会将英语按照发音转写成一串错误的中文,而不是英语单词。

科大讯飞轮值总裁、科大讯飞研究院院长胡郁就这个问题回应虎嗅称,目前中英文混翻不仅是科大讯飞遇到的问题,也是谷歌极力想解决的问题,目前在技术不成熟的情况下,科大讯飞宁愿先忽视这个问题,直到技术成熟后再上线,给到用户一个满意的体验效果。他还表示,这个问题迟早会得到解决。

就在昨天,谷歌神经机器翻译系统进行了重大更新,实现了用单一模型对多语种通用表征。其最大的突破是实现了“零数据翻译”,也即能够在从来没有见过的语言之间进行翻译。

当我让胡郁比较一下谷歌神经机器翻译系统和讯飞孰优孰劣时,胡郁说,谷歌一直在引领人工智能的技术方向,值得科大讯飞学习。但他同时也说,谷歌也有追着科大讯飞跑的时候。它认为科大讯飞的准确率是一个优势。

讯飞输入法:可直接将纸上的文字转录,并支持手势修改

第一位上台演示的产品经理叫翟吉博,他主要演示讯飞在输入法上的一些技术应用。他先是在一张白纸上手写了一段“我现在有点紧张,发布会结束后,我晚上请大家吃饭”的文字,然后他举着这张纸正对着机器人说“启动拍摄”,机器在进行扫描后迅速将纸上的文字录入了进去。此时响起了第一次由衷的掌声。

他接下来演示如何在这段文字里添加文字。他用手势的体感交互在这段文字上进行光标定位,嵌入了“六点”俩字。此时响起了更热烈的掌声。

然后他手轻轻一划,屏幕上的文字就被清理干净。

然后他用语音输入了一长段文字,先是发出口令“开始听写”,然后输入:““各位小伙伴们大家好,关于公司23号发布会的准备工作,我再跟大家同步确认一下。庆袁章尽快完成演示手册。这次发布会我需要到现场,请庆峰帮我订好火车票(场下很配合的笑了,因为科大讯飞董事长叫刘庆峰,但后来小伙儿说了,其实这是他的另一个同事),我21号下午到北京,可能会在北京待到周四,大家有事可以直接电话或者短信与我联系。请庆峰帮我带一本创新者的窘境。其实,我刚才要说的并不是我们董事长这个庆峰,是我们团队的一个小伙伴叫庆峰。”

接下来继续开始听写:“请庆峰帮我订好火车票,把庆峰修改成庆丰包子铺的庆丰,另外请庆峰帮我带一本创新者的窘境,把创新者的窘境翻译成英文,并加上书名号。”此时,屏幕上根据口令,将“创新者的窘境”瞬间改成了《The.Innovator's.Dilemma》,场下顿时响起如雷掌声。虎嗅现场录的短视频更加直观一些,不过限于现场环境嘈杂,大家将就着看吧。







请到「今天看啥」查看全文