距离喧嚣已经过去三年,与泡沫共舞的
AI
语音又有哪些新的变化?这些变化究竟是泡沫的助推力还是行业趋于冷静的表现?
作者:韩敬娴
编辑:张丽娟
2007
年,剑桥大学商学院的高始兴与工程系的俞凯一见如故,
2008
年,两人归国创立了思必驰,主攻口语教育。
那时正是互联网和移动互联网的天下,因此对于思必驰来说,前几年的探索更像是蒙眼打仗,找不准方向,发展缓慢。此后,思必驰真正快速发展是在这三四年:
2016
年,获得来自阿里的近
2
亿元投资;
2018
年
6
月,再次获得
D
轮
5
亿元人民币融资。
这是一个
AI
语音独角兽典型的养成故事:
强技术背景的创始团队,成立时间较早,直到
AI
风口引来资本的追捧,估值在短时间内快速攀升。
AI
语音作为人机交互的新希望,造成了行业的激荡,并带动了新的竞合关系,有早早卡位如科大讯飞、思必驰、云知声者,有随风口起舞者,也能看到不少巨头的身影。
中国报告网显示,
2017
年国内视觉、语音、自然语言处理成为
AI
融资前三甲,语音占比为
24.8%
,排名第二。
有业内人士甚至向
CV
智识形容,
2016
、
2017
年左右如果你的项目融资计划书中没有
NLP
、
CNN
这些
AI
元素都不好意思跟投资人打招呼。
但这种热闹在很多业内人士眼里就意味着泡沫,
“
回想一下,
2016
年很多人工智能公司在做什么?
刷榜。刷榜本身是个开卷考试,但开卷考试考得好就代表你真正有这个能力吗?不见得。
2017
年大家更多是在描绘一些愿景,就是讲故事,
2016
、
2017
年的人工智能论坛大妈都来听,在我个人看来这都是泡沫的体现。
”
云知声创始人黄伟表示。
距离喧嚣已经过去三年,与泡沫共舞的
AI
语音又有哪些新的变化?这些变化究竟是泡沫的助推力还是行业趋于冷静的表现?
CV
智识带着好奇与行业内多位从业者聊了聊。
造芯运动,虚火还是实热?
一
“对云知声来说,不做芯片就意味着死的很快吗?
”
“是的”,云知声创始人黄伟斩钉截铁地回答。
从
2018
年开始,
AI
语音公司不约而同地开始了一波新造芯运动。云知声发布了面向AIoT市场的UniOne芯片,出门问问发布了AI语音芯片模组“问芯”Mobvoi A1,Rokid发布了AI语音芯片KAMINO18。
2019年1月2日,云知声再次发布正在研发中的三款定位不同场景的AI芯片。两天后,思必驰也推出了AI语音芯片深聪TAIHANG芯片。
这些擅长做软件算法部分的语音公司们为何会纷纷打破“术业有专攻”的边界,涌入造芯阵营呢?
Rokid联合创始人王舜德曾提到,成本居高不下、非常耗电、集成度低让产品做起来十分痛苦,也正是基于这些痛点,才想要研发AI芯片。
云知声创始人兼CEO黄伟表示,现有的芯片架构并非为AI专门设计,不能满足物联网AI算力需求。
但缺少半导体硬件基因的语音公司们如何做到“从软到硬”的呢?
从目前头部几家公司来看,做AI语音芯片的思路还是选择和有经验的芯片公司深度合作。
比如思必驰选择中芯国际,共同注资成立上海深聪半导体有限责任公司;Rokid宣布自己的芯片是基于杭州国芯科技的芯片深度定制;猎豹移动旗下猎户星空选择和瑞芯微电子合作。
从开发周期和成本的角度来看,比较成熟的芯片公司已经有积累,很多东西不需要重新去设计,因此联合研发能够缩短开发周期。
AI芯片的确为语音公司带来了新一波的热度,但真实的市场如何呢?
一般来说,语音公司做AI芯片的思路无外乎两种:
一种是和自己的解决方案搭配出售,另外一种则是直接对外卖硬件。
观察目前几家语音公司的芯片产品进展,思必驰今年7月8日量产版芯片刚刚点亮,其它的AI语音芯片大多是采用第一种方式,云知声的芯片目前已经通过自
己的解决方案落地到终端产品上,截止到3月份,云知声有5-6家客户围绕雨燕芯片落地方案。Rokid发布的KAMINO18也已经搭载到今年3月360刚推出的智能音箱上。
但在深圳鲲云信息科技有限公司创始人兼CEO牛昕宇看来,
第一种方式虽然不需要承担外界竞争压力,压力较小,只要保证芯片够自己用就可以了,但对于算法公司来说,动辄几亿美金投入的芯片成本如何去和自己的业务收入平衡?
芯片的运作至少需要3年,2年时间做出芯片,1年时间合作方做出产品,之后才能推向市场。
除了时间成本之外,AI芯片研发还需要巨额的资金成本,黄伟表示第二代芯片的投入要以亿为单位,而云知声的营收也不过是去年才刚刚官宣达到9位数而已。
自研AI芯片的成本既然如此之大,有些语音公司为了更高效也更市场化,就会选择模组的形式,比如出门问问就与杭州国芯科技的芯片合作,发布了模组产品“问芯”。
据业内人士透露,普通单个模组的价格大概在1-2美元,而AI芯片的价格虽然随着产业链的成熟有所下降,但价格差距依旧很大,据了解,搭载了云知声自研AI芯片的语音模组目前的价格在50元人民币以内,即使搭载了更加轻巧的“蜂鸟”芯片的语音模组也在20-30元人民币之间。
即便如此,模组的销量也并不好,去年底李志飞曾向新浪科技这样说道,装有这一模组的产品至少要一年时间才能到用户手上。如此长的周期,远没有想象中那么容易快速起量。
虽然AI语音芯片也被认为是AI语音技术落地的一种方式,一定程度上缓解了落地焦虑,但对于AI语音公司们来说,
AI芯片所考验的不仅仅是技术能力,还有商业化落地能力以及风险承担能力。
正如黄伟所说,造芯不是目的,只是起点。
外包模式变了吗?
一
除了上述的芯片,对于AI公司的商业化落地,无论是语音交互,还是图像识别,众多AI公司一直被诟病的便是:商业模式本质是“外包”。
最直接的体现就是AI领域几乎没有公司能将技术以规模化、产品化的方式输出,不同的领域不同的项目都需要定制化方案,
这就导致了如果想接更多的项目就必须招更多的人,技术密集型变成人力密集型,直接导致摊子越铺越大,客单利润却越来越低的后果。