Misa不满足Rokid被称作中国版Echo——“不客气地说,我们现在更像是Google加Apple。”
10月12日,阔别阿里三年之久的Rokid创始人兼CEO祝铭明(Misa)作为云栖大会演讲嘉宾再次现身,这个几乎不参加公开场合的低调CEO在现场宣布了行业重磅消息:Rokid(若琪)将与阿里云携手合作,共同推出全栈语音开放平台(turn key solution),为业界提供一站式语音解决方案。
全栈语音开放平台(turn key solution)由Rokid提供端到端的全栈技术方案,由阿里云提供云端支持,现在正通过这种合作的方式向业内开放。也就是说,音箱提供商、甚至是个人开发者使用这个全栈开放平台可以快速的复制Rokid智能音箱的全部语音能力。
Misa这个人很Geek,又特别容易打开话匣子,是很典型的加州人风格;多数人的眼中,他对产品细节考究,对团队要求苛刻,但又在一些无关紧要的小事儿上,他不拘小节,保持了一种独立个性的风格。多数见过他本人的人,都或多或少会被他的这种个人魅力吸引。
多数有理想的创业公司的目标都是打造一台“iPhone”,意思是说在产品设计、研究、制作方向上保持极其前沿先进的思维,甚至执拗。在Misa眼中,Rokid Alien、Pebble都是这样的产品。然而,正式在研发三年、推出两代“iPhone”产品后,今天它又把Rokid的技术开放的像一个Google Android的一样。
很多疑问。在这个时间点,为什么一家创业公司也选择做开放和平台?这个全栈语音技术平台的开放和阿里巴巴本身天猫精灵之间有什么样的关系?这种模式和百度DuerOS开放的模式又有怎样的区别?
开源开放,是投下一个炸弹,也是新兴领域的第一时期
不过,先说道开源开放,扔炸弹真是听了太多次了。
当年我们还玩不起智能手机的时候,MTK的开放造就了时下最火热的山寨机概念,也是通过这样的方式,MTK几乎在杂乱无序的手机时代里铺满了市场;后来来到了Android时代,它也因为开放成了如今唯一可以和iOS较量的手机平台,现在是我们谈论任何新兴市场的标杆性生态。
去年我们讲VR的时候,我也看到了不少公司再讲开源开放,比如HTC Vive和Vavle共同开放Lighthouse的定位技术,来助推6DOF VR头盔的发展,当时也有不少媒体就说Vavle扔出了重磅炸弹;今年年初,百度陆奇也开放了阿波罗自动驾驶计划,一些媒体也说陆奇扔下了自动驾驶领域的一颗炸弹。
先把炸弹放一边,开源开放其实从来就是一件大好事。但侧面的理解,开源和开放,其实都只能算是一个领域的不成熟期。
这个时期大家摸着石头过河,有人喜欢做封闭,有人喜欢做开放,因此这个时期会产生无数的标准和协议制定者;不过,正是在接下来的这场战争中,会留下最后几个标准开放者。而后,才会产生iOS这种封闭标准定义者以及生态内的跟随者。
对于智能音箱,我一直认为——何时出现封闭标准定义者和跟随者,这个时间点非常重要。
所以在不成熟期,开源几乎是培养这个市场持续下去的唯一条件。
我或多或少的在Misa的谈话里也提炼出了类似的观点。他认为一个新形态的产品,第一时期只能在自己的产品上做功夫,持续打磨体验,小切口切入;然后第二时期,有可能进一步的形成平台和入口通路;至于,大家特别爱谈论的和其他产品进行交互,产生生态,如何炫酷地和生态交互起来,其实是最后产业成熟期的事儿了。对于智能音箱来说,确实还有一段时日。
而在这个不成熟期,Rokid选择用已经被打磨好、成熟的技术推动市场前进。Rokid和阿里云的开放战略是——提供了一个完整直接可用的硬件开发板,开源了他们全部的语音技术,部分已经写好的系统代码。
先来看看这个开发板。在这个黑色的圆形开发板上,集成了CPU、GPU、蓝牙、麦克风阵列等所有涉及到语音开发的需求,甚至还设置好了音频、电源、HDMI视频接口,它其实就可以理解为Amazon Alexa的Echo Dot,到手插上即用。
而使用这个开发板,就可以结合已有的两套分别搭载Linux和Android操作系统的开发套件,根据需要选择阿里云或Rokid的语音服务,双方共享海量语音技能,完全开放给开发者及合作伙伴使用。
在Misa这里,他愿意给这些事儿加一个前提或者划个重点——“全栈真开源、真开放。”
真开源是优势,其实就是你到底要共享多少的态度问题。在Rokid这里,除了共享了70%的系统框架代码,连这个小小开发板的设计图纸甚至也已经给开发者准备好,另外——
Rokid开放的语音技术包括语音识别、信号分析处理、语音合成、语义理解、自定义唤醒词、声纹识别、个性化语音合成、语种识别、自定义对话引擎等等。总之,在整个链条上的语音技术会全部开放。