文 / 张文政 编辑 / 刘洋
2013年,刚刚诞生一年的云知声收到了一份相当有诱惑力的收购邀约。如果那时卖掉公司,我们几个创始人就能实现财务自由。但我还是选择了拒绝,因为我们选择创业的最终目的并不只是赚钱,我看好智能语音识别,打心眼儿里希望把云知声做成一家伟大的公司。
云知声成立于2012年6月。之前1年,Siri的发布再度唤醒了大家对语音识别的关注。经过四年多的积累,我们的合作伙伴数量超过2万家,覆盖用户超过1.8亿,其中语音云平台覆盖城市超过470个,覆盖设备超过9000万台。
▵云知声CEO黄伟
但所有熟悉语音识别的人都知道,云知声出现在一个并不那么讨巧的时间点上。早在2003年,实验室里的语音识别成功率就已经超过了90%;到2005年,全球领先的语音识别公司Nuance成功上市,市值最高达到了90亿美元;到2008年,国内著名的科大讯飞也完成了上市,而且市场占有率一度超过了三分之二,BAT等互联网巨头也都组建了智能语音团队。这么多年下来,该踩的坑他们都踩过,能挣钱的领域基本上也都被占了。留给云知声这类后发公司的空间非常小,我们做的事情跟赌博差不多。
在语音识别领域,实现弯道超车的原理非常简单:要么大规模改进算法,要么迅速积累数据。当绝大多数小公司都在改进算法上投入精力时,我们决定从B端切入,集中全部资源做一个技术平台。2012年9月,公司成立仅仅3个月后,就发布了国内首个永久免费的语音云平台。开发者无需学习具体的语音技术,只要调用我们的服务就能进行应用开发。
促使我们免费的原因有两个:我们是小公司,一定要用更低的成本争取用户;当时的中文语音识别率只有80%左右,这意味着语音识别100个字就有20个是错的,这么差的体验是不可能让用户付费的。
这背后仍是技术的思维,只依靠算法提高语音识别准确率是很有限的。没有实际产品经验的人往往陶醉于算法,觉得在测试机上玩一个小把戏,把准确率提高0.2个百分点就很厉害,但这在改善用户体验上毫无益处。只有把数据、算法以及环境信息结合起来,才能真正优化语音识别,有效应对不同情境的需要。作为一家初创公司,我们改进算法的空间很有限,尽快积累数据就成了公司发展的当务之急。
在某些阶段,免费的确是王道,因为只有免费才能获得速度。而从整个企业的发展过程来看,更快意味着更低的时间成本,哪怕犯错,也能在更短时间内发现问题,这样一来,成本就更低。
2012年9月,我们刚刚发布语音平台时,语音识别的精确度只有85%,实际应用时甚至会降到60%。到10月,我们开始研发深度学习系统,并把技术引擎的模型从统计模型换成深度学习模型,云知声的语音识别准确率一下子上升了十多个百分点。到2013年底,随着语音数据从800小时积累到3000小时,语音识别的精确度就提高到了90%,用户满意度一下就上去了。
这中间的2013年初,我们还进行了一次产品化尝试。我们发布的首个基于深度学习的微信语音输入插件,上线仅一周,日下载用户量就超过了5万,一度位居苹果应用商店排行榜的首位。我们没在推广上花一分钱,却实现了非常好的宣传效果。
平台带来的另一个收获是,我们发现了潜在的需求。通过不同行业用户在平台上的使用频度,我们确定将车载、家居、医疗和教育作为未来重点发展的四大领域。这帮助我们解决了一个很大的困惑:中国人不愿意为单纯的技术买单,技术公司因此不能从技术上直接赚钱,只有用新的技术、新的产品和新的模式创造一个新的市场,技术公司才能发展起来,但这个市场在哪里,我们之前并不知道。
不过,开发这些市场非常不容易。在车载领域,前装市场规模大,但产品周期长且巨头环伺,后装市场门槛较低但市场规模又很小;家装领域市场规模巨大且方兴未艾,但电器厂商要求的远距离语音操控且不受噪音影响,在成本有限的条件下同样很难实现;最难的还是医疗领域,大量术语严重影响了语音识别的准确度,我们线上测试的精准度已经达到96%,但和医院合作时的精确度竟然急剧降到了60%。
我们就反复和合作对象沟通,不断寻找最合适的解决方案,逐一解决能耗、安装等问题,我们在上面这几个市场也逐步站稳了脚。这段时间与市场频繁接触的另外一个好处就是,我们对于未来的发展路径终于有了一个清晰的思路。
2014年初,我们理清了发展思路,即“云端芯”产品战略:云是线上平台,那里沉淀了大量基础数据;端最开始是智能手机,现在已全面向物联网迁移,因为智能手机的增长几近结束,根据Strategy Analytics数据,2016年全球智能手机的出货量只比2015年增长1%,与之相比,物联网的发展则是方兴未艾;芯片则是云知声所有技术和服务的载体,是我们最核心的技术优势所在。
这个战略的确定缘于我自己对行业的观察和感悟。以前,我的想法是把麦克风和传感器放在终端,把整个技术架构放在云端,用户上传数据到云端进行识别。但后来我发现,并不是所有应用场景都联网,而且软件可以实现的功能非常有限,硬件、甚至是芯片级的硬件非常有发展的前景。想清楚了这些,我们就在2014年12月完成了B轮5000万美金的融资,也借此和投资方高通建立了合作关系。
到了2015年,随着亚马逊推出家用智能音响Echo,微软推出小冰,百度语音团队独立,阿里巴巴将语音识别技术全面应用在阿里云系统上,腾讯智能语音服务系统也上线,语音识别一下子成了科技产业中最热门的领域。所有科技公司都意识到,在未来的物联网领域,语音识别将有非常大的用武之地。
尤其是在2016年10月份,谷歌公司发布了智能家居中枢产品Google Home,这与我们两年前设计的产品形态如出一辙。现在回头看,选择切入家居、车载、医疗和教育市场、将“云端芯”一体化解决方案作为突破口,凭借先发优势抢占市场的策略基本上还是正确的。
不过,商业世界总是波谲云诡,策略正确未必就能成功。我们将全部资源调用起来押宝人工智能,提早布局也确实让我们获得了起跑优势。在完成技术能力和产品能力的积累之后,云知声要在2017年努力突破产能瓶颈,尽快扩大份额。要做到这一点,我们就必须迅速扩大团队规模,领导能力和组织能力就成了我们新的瓶颈。
我们的核心团队虽然人数不多,但年纪相对都比较大,心智也更成熟,这是云知声的核心竞争力。我们很珍惜这支队伍。因为我们知道,在这个时代更迭的节点,一定会有伟大公司应运而生,而伟大公司的关键就是一群志同道合的人,我们很幸运地找到了这群朋友。如果未来世界真如我们展望的那样实现了万物互联,我们希望自己就是万物联接的纽带。
点击以下关键词查看相应内容:
朴槿惠 | 范爷 | 科林·费斯 | 刘震云
陈冠希 | 谭维维 | 年薪12万 | 甘道夫
520 | 六神磊磊 | 伍迪艾伦 | 老狼
后台回复以下关键词查看更多往期内容:
冯小刚 | 王菲 | 屌丝男士 | 苍井空 | 邓紫棋
王健林 | 姚晨 | 武林外传 | 入殓师 | 卡戴珊
宋美龄 | 李克强 | 宋教仁 | 孙中山 | 习仲勋
刘晓庆 | 故宫 | 加藤鹰 | 李志 | 许晴 | 葛优
琅琊榜 | 崔健 | 潘石屹 | 汤唯 | 李健 | 大鹏
霍建华 | 胡歌 | 宁泽涛 | 汪峰 | 鹿晗 | 维密
张曼玉 | 大鹏 | 高晓松 | 舒淇 | 闫妮 | 秦昊
吴秀波 | 魔兽 | 吴亦凡 | 姜文 | 黄宏 | 路遥
●●●
文章首发于《博客天下》第231期
未经授权不得转载