这篇本应在一周前产出的年底总结被拖延症拖到了现在,上午和同事去深大校园里逛了两个小时,看着学生们悠闲地背着书包走在去往自习室、图书馆的路上,不禁感叹原来自己已经毕业了六年时间。六年来,我从最初的
Web
开发人员接触到一些服务端开发,然后莫名其妙成为了业界最火热的大数据工程师、数据科学家。在职责上,从单枪匹马搞定所有事儿,到带领十几人的数据团队去做一个领域的探索,再到带领几十人的部门去做实验产品尝试,再到现在作为
CTO
跟着百人的产品研发团队高速奔跑,看着公司一年时间完成近十倍的增长。回忆种种,恍若云烟。
回头看过去的
2015
,也许是入职了一个和之前不一样的企业,也许是接触到了与之前不同的人,也许是背负了无法与往日相比的压力。所以我尝试着将一些想法写出来,没有主题,没有主次,想到哪儿写到哪儿。
1.
企业级服务公司的思考
今年最大的变化,是我第一次从一个互联网行业进入了一个企业级服务市场,经过一年的适应和思考,让我对企业级服务市场有了更多新的看法。那我就先来说下我眼中的企业级服务吧。众所周知,企业级市场与互联网公司的发展不同,他与当前创业环境、公司资金等息息相关,我们回忆一下《创业维艰》就知道在差的资本环境下,一个企业级服务公司有多难生存下去。
企业级服务的公司到底如何做利润,如何做大是我最近一年一直思考的问题。先从最基本说起,企业从最基本的诉求来说为什么使用云服务,例如企业为什么要使用阿里云、七牛等等,根源无外乎:
1.
动态扩展能力
2.
低人员技术成本
3.
不需要去做脏活累活。归根结底的说就是企业认为做这些事情的
ROI
不如交给云服务公司的
ROI
高,例如把图片存储在我自己这儿每年需要耗费
100W
的机器成本
+20W
的人员维护成本,稳定性可以达到
99.9%
,那作为一个理智的技术决策者,一定会要求厂商用
100W
的计算解决问题,并且稳定性不可以低于
99.9%
。那我们这个时候把视角从客户视角切回到云服务厂商视角,那我们要如何才能赚钱呢?
A.
寄望于客户的水平在平均线以下,例如改造
XMPP
,业界的平均水平是
2
个人月的水平,但是很多客户需要
10
个人月,这样相当于赚了
8
个人月的钱。但是这其实是一种极烂的做法。具体会在下文中有所表述。
B.
动态扩展能力。这一点是客户使用很多云服务的理由,那么如何通过资源的合理规划在这方面去赚钱呢?我倒是有些思路,但是从目前来看还需要较长的路要去走。举个简单的例子,假设说每次某电商网站双
11
抢购时都需要
1000
台服务器才能满足需求,也就是说不采用云服务至少需要
1
亿左右的预算,但是其实大部分时间其实只需要
10
台服务器就足够了,于是想办法降低服务器闲置率就是我们可以赚的钱。但是目前的云服务厂商
(
我视野范围内的
)
还无法做到这一点。假设说淘宝、京东、唯品会同时使用了我的云服务,也就意味着我需要准备
淘宝
+
京东
+
唯品会三家的机器总和,如果他们每一家的机器闲置率是
90%
,那我也同样是
90%
。所以真正想做到这一点需要的是对客户进行明确的划分,通过不同的客户策略组合从而提高机器闲置率,例如构建淘宝
(
双
11)+
亚马逊
(
黑色星期五
)
这样的组合,把机器的闲置率从
90%
降低到
70%
。这是一个很理想的情况,在实操中会遇到很多的困难,在下文中我会再次提及。
C.
承包脏活累活。这一点其实是国内大部分云服务厂商赚钱的主要途径,帮你把麻烦的事儿给做了,比如你懒着去做个统计后台,我帮你搞了;你懒着去搭个
Docker
服务,我帮你搭好;你懒着去做安全策略,我帮你做了。但是回归到我们上面说的
ROI
的问题,这必然会导致利润率极低,这并不符合互联网企业高利润率的模式,而基本纯粹属于外包公司了。这并不应该成本云服务厂商的立足之本。
D.
通用方案的快速复制。这个和过去的
ERP
公司很类似,做出标准产品,然后去兜售给各个客户。和上面的点一样,这也是现在云服务厂商的立足之本。可是当我们回忆一下
ERP
时代的企业的赚钱方式,我没太听说哪一家是通过把一个通用性软件卖给客户然后就能赚到大钱的,基本赚钱的费用都是在定制化、后续维护费用。但是定制化的成本其实又回到了上文的
ROI
上,不再赘述。此外,还有一点
ERP
软件的赚钱方式,就是扎根于某一特定领域,例如用友金蝶的财务软件等,这似乎又与如今的云服务厂商发展路线相悖。所以这听上去很美,却依然是一个低利润的事情。
从上面四点来看,只有第二点才是值得去发展的路,先记在这里。
2.
云服务和大数据
在过去一年无数次的采访和演讲中,我都努力在讲一个概念,就是云服务和大数据的结合。只有平台级产品才有大数据的理论,我也不厌其烦的反复提及。那么相比于传统“云平台”的低利润外,大数据所产生的高利润率似乎更让人幻想。相比于机器学习,数据挖掘这些技术而言,更困难的还是数据如何才能产生商业价值。在过去的一年里,我们做了各种各样的尝试,取得了一些小的成果,也对未来的方向有了一些更清晰的认识。
谈到数据变现时,我们需要做更多的产品和商业层面的思考,在这些上面,我走了太多的弯路:
A.
我们更应该清晰地识别出哪些业务是需要数据的?我们到底是在拿着数据去找业务,还是在用业务来倒推数据的价值。如何识别是否在拿着锤子找钉子,我有一个特别简单的方法供参考,一个方案需要
Rule-based
来解决问题,还是需要通过
Machine Learning
来解决问题。我们想下什么样的方案是没办法通过
Rule-based
无法解决的问题。例如
U
ber
希望通过大量的数据行为来缓解交通堵塞,这不是rule-based可以解决的问题。抽象来说,大数据的真正价值是通过海量实时多样的数据,通过机器学习训练出最适合的模型,这个模型抽象了人类几乎不可能完成的复杂规则引擎,而深度学习在大数据时代的流行很大程度上也是因为其对大量特征的组合再加工,这也可以看做是数据多样化的必然产物。
B.
这些数据引入前和引入后到底能产生多少额外价值?因为这个取决于企业到底愿意为数据服务买多少的单。例如互联网金融公司希望利用大量的数据去做征信模型,但是当引入新的因素变量时,哪怕让准确率有
1%
的提升,都会产生极大的经济价值。
C.
实时数据能产生多少的价值?实时数据意味着合作的长久性,例如对于音乐推荐产品来说,如果提供的数据只是三年前的数据,那么数据效果会极差,所以这样就保证了公司必须不断使用实时的数据方案来满足需求。
以上几点其实决定了你要为哪些行业提供数据解决方案,最初的时候我的想法依然是停留在互联网公司上,希望能够利用平台上多样化的大数据去帮助互联网公司精细化运营,例如优化推送方案,优化推荐内容,但是现实告诉我这条路还走不通,问题就在于