专栏名称: CV智识
欢迎关注
51好读  ›  专栏  ›  CV智识

造芯火热、场景突围、转向C端……变局中的AI语音

CV智识  · 公众号  ·  · 2019-07-30 18:00

正文

距离喧嚣已经过去三年,与泡沫共舞的 AI 语音又有哪些新的变化?这些变化究竟是泡沫的助推力还是行业趋于冷静的表现?



作者:韩敬娴

编辑:张丽娟


2007 年,剑桥大学商学院的高始兴与工程系的俞凯一见如故, 2008 年,两人归国创立了思必驰,主攻口语教育。

那时正是互联网和移动互联网的天下,因此对于思必驰来说,前几年的探索更像是蒙眼打仗,找不准方向,发展缓慢。此后,思必驰真正快速发展是在这三四年: 2016 年,获得来自阿里的近 2 亿元投资; 2018 6 月,再次获得 D 5 亿元人民币融资。

这是一个 AI 语音独角兽典型的养成故事: 强技术背景的创始团队,成立时间较早,直到 AI 风口引来资本的追捧,估值在短时间内快速攀升。

AI 语音作为人机交互的新希望,造成了行业的激荡,并带动了新的竞合关系,有早早卡位如科大讯飞、思必驰、云知声者,有随风口起舞者,也能看到不少巨头的身影。

中国报告网显示, 2017 年国内视觉、语音、自然语言处理成为 AI 融资前三甲,语音占比为 24.8% ,排名第二。

有业内人士甚至向 CV 智识形容, 2016 2017 年左右如果你的项目融资计划书中没有 NLP CNN 这些 AI 元素都不好意思跟投资人打招呼。

但这种热闹在很多业内人士眼里就意味着泡沫, 回想一下, 2016 年很多人工智能公司在做什么? 刷榜。刷榜本身是个开卷考试,但开卷考试考得好就代表你真正有这个能力吗?不见得。 2017 年大家更多是在描绘一些愿景,就是讲故事, 2016 2017 年的人工智能论坛大妈都来听,在我个人看来这都是泡沫的体现。 云知声创始人黄伟表示。

距离喧嚣已经过去三年,与泡沫共舞的 AI 语音又有哪些新的变化?这些变化究竟是泡沫的助推力还是行业趋于冷静的表现? CV 智识带着好奇与行业内多位从业者聊了聊。

造芯运动,虚火还是实热?


“对云知声来说,不做芯片就意味着死的很快吗?

“是的”,云知声创始人黄伟斩钉截铁地回答。

2018 年开始, AI 语音公司不约而同地开始了一波新造芯运动。云知声发布了面向AIoT市场的UniOne芯片,出门问问发布了AI语音芯片模组“问芯”Mobvoi A1,Rokid发布了AI语音芯片KAMINO18。

2019年1月2日,云知声再次发布正在研发中的三款定位不同场景的AI芯片。两天后,思必驰也推出了AI语音芯片深聪TAIHANG芯片。

这些擅长做软件算法部分的语音公司们为何会纷纷打破“术业有专攻”的边界,涌入造芯阵营呢?

Rokid联合创始人王舜德曾提到,成本居高不下、非常耗电、集成度低让产品做起来十分痛苦,也正是基于这些痛点,才想要研发AI芯片。

云知声创始人兼CEO黄伟表示,现有的芯片架构并非为AI专门设计,不能满足物联网AI算力需求。

但缺少半导体硬件基因的语音公司们如何做到“从软到硬”的呢?

从目前头部几家公司来看,做AI语音芯片的思路还是选择和有经验的芯片公司深度合作。 比如思必驰选择中芯国际,共同注资成立上海深聪半导体有限责任公司;Rokid宣布自己的芯片是基于杭州国芯科技的芯片深度定制;猎豹移动旗下猎户星空选择和瑞芯微电子合作。

从开发周期和成本的角度来看,比较成熟的芯片公司已经有积累,很多东西不需要重新去设计,因此联合研发能够缩短开发周期。

AI芯片的确为语音公司带来了新一波的热度,但真实的市场如何呢?

一般来说,语音公司做AI芯片的思路无外乎两种: 一种是和自己的解决方案搭配出售,另外一种则是直接对外卖硬件。

观察目前几家语音公司的芯片产品进展,思必驰今年7月8日量产版芯片刚刚点亮,其它的AI语音芯片大多是采用第一种方式,云知声的芯片目前已经通过自 己的解决方案落地到终端产品上,截止到3月份,云知声有5-6家客户围绕雨燕芯片落地方案。Rokid发布的KAMINO18也已经搭载到今年3月360刚推出的智能音箱上。

但在深圳鲲云信息科技有限公司创始人兼CEO牛昕宇看来, 第一种方式虽然不需要承担外界竞争压力,压力较小,只要保证芯片够自己用就可以了,但对于算法公司来说,动辄几亿美金投入的芯片成本如何去和自己的业务收入平衡?

芯片的运作至少需要3年,2年时间做出芯片,1年时间合作方做出产品,之后才能推向市场。

除了时间成本之外,AI芯片研发还需要巨额的资金成本,黄伟表示第二代芯片的投入要以亿为单位,而云知声的营收也不过是去年才刚刚官宣达到9位数而已。

自研AI芯片的成本既然如此之大,有些语音公司为了更高效也更市场化,就会选择模组的形式,比如出门问问就与杭州国芯科技的芯片合作,发布了模组产品“问芯”。

据业内人士透露,普通单个模组的价格大概在1-2美元,而AI芯片的价格虽然随着产业链的成熟有所下降,但价格差距依旧很大,据了解,搭载了云知声自研AI芯片的语音模组目前的价格在50元人民币以内,即使搭载了更加轻巧的“蜂鸟”芯片的语音模组也在20-30元人民币之间。

即便如此,模组的销量也并不好,去年底李志飞曾向新浪科技这样说道,装有这一模组的产品至少要一年时间才能到用户手上。如此长的周期,远没有想象中那么容易快速起量。

虽然AI语音芯片也被认为是AI语音技术落地的一种方式,一定程度上缓解了落地焦虑,但对于AI语音公司们来说, AI芯片所考验的不仅仅是技术能力,还有商业化落地能力以及风险承担能力。

正如黄伟所说,造芯不是目的,只是起点。


外包模式变了吗?


除了上述的芯片,对于AI公司的商业化落地,无论是语音交互,还是图像识别,众多AI公司一直被诟病的便是:商业模式本质是“外包”。

最直接的体现就是AI领域几乎没有公司能将技术以规模化、产品化的方式输出,不同的领域不同的项目都需要定制化方案, 这就导致了如果想接更多的项目就必须招更多的人,技术密集型变成人力密集型,直接导致摊子越铺越大,客单利润却越来越低的后果。







请到「今天看啥」查看全文