专栏名称: 数据分析

专注大数据，移动/互联网，IT科技，电子商务，数据分析/挖掘等领域的综合信息服务与分享平台。合作｜约稿请加qq：365242293

如何掌握数据化运营的思维方式，看这一文章就够了

数据分析 · 公众号 · 大数据 · 2017-06-26 09:04

正文

“数据驱动决策”，为了不让这句话成为空话，在本章的最后，作者将自己的经验提炼为以下15种思想武器，不求你当下就能掌握，但希望你能不断参悟并修正。

1．信度与效度思维

在指标构建的内容中已经对指标的信度和效度做了阐述。这部分也许是最难理解的，但也最重要。没有这个思维，决策者很有可能在数据中迷失，如图4-57所示。

度与效度思维

信度与效度的概念最早来源于调查分析，但现在可以引申到数据分析工作的各个方面。

所谓信度，是指一个数据或指标自身的可靠程度，包括准确性和稳定性。取数逻辑是否正确？有没有计算错误？这属于准确性；每次计算的算法是否稳定？口径是否一致？以相同的方法计算不同的对象时，准确性是否有波动？这是稳定性。做到以上两个方面，就是一个好的数据或指标了吗？其实还不够，还有一个更重要的因素，就是效度！

所谓效度，是指一个数据或指标的生成，需贴合它所要衡量的事物，即指标的变化能够代表该事物的变化。

只有在信度和效度上都达标，才是一个有价值的数据指标。举个例子：要衡量身体的肥胖情况，选择穿衣的号码作为指标，一方面，相同的衣服尺码对应的实际衣服大小是不同的，会有美版、韩版等因素，使得准确性很差；另一方面，一会儿穿这个牌子的衣服，一会儿穿那个牌子的衣服，使得该衡量方式形成的结果很不稳定。所以，衣服尺码这个指标的信度不够。尺码大小并不能准确反映肥胖情况，因此效度也不足。体脂率才是信度和效度都比较达标的肥胖衡量指标。

在我们的现实工作中，许多人会想当然地拿了指标就用，这是非常值得警惕的。你要剁骨头却拿了把手术刀，是不是很可悲？信度和效度的本质，其实属于数据质量的问题，这是一切分析的基石，再怎么重视都不过分！

2．平衡思维

说到天平读者都不陌生，平衡的思维相信也都能很快理解。简单来说，在数据分析的过程中，需要经常寻找事情间的平衡关系，且平衡关系往往是关乎企业运转的大问题，如市场的供需关系，薪资与效率关系，工作时长与错误率的关系等。

平衡思维的关键点在于寻找能展示出平衡状态的指标。也就是图4-58所示的框，要通过这个准确的量化指标观察天平的倾斜程度。怎么找这个指标呢？一般先找双向型的问题，即“高也不是低也不是”的问题，然后量化为指标，最后计算成某个比率，长期跟踪后观察它的信度和效度。

平衡思维

举个电商的例子，在电商的用户行为分析中，用户每次访问的深度就是一个“高不成低不就”的问题。若用户访问深度过深，每次都要浏览很多个页面，说明他在这里没有遇到想要的产品，或者页面没有促使他快速购买，这不是一家电商公司想看到的情况；若用户每次访问都很浅，看一两个页面就走掉了，说明你的产品展示、内容引导很有问题。那么，访问深度多少是合适的呢？这就是数据分析人员需要研究的问题——在多深的访问深度时，用户形成购买的概率最大。

3．分类思维

客户分群、产品归类、市场分级、绩效评价等许多事情都需要有分类的思维。主管拍脑袋也可以分类，通过机器学习算法也可以分类，到底分类思维怎么应用呢？

关键点在于，分类后的事物需要在核心关键指标上能拉开距离！也就是说，分类后的结果必须是显著的。如图4-59所示，横轴和纵轴往往是你运营中关注的核心指标（当然不限于二维），而你能看到分类后的对象分布不是随机的，而是有显著的集群的倾向。

分类思维

举个例子，假设图4-59所示反映了某个消费者分群的结果，横轴代表购买频率，纵轴代表客单价，那么图中右上角的这群人，就是明显的“金牌客户”。右下角这个象限的人群，就是“屌丝”群体，他们“频繁地买便宜货”。左上角的人群是精英阶层，他们“选购好商品”。左下角的人群可以归结为长尾客户，不需要我们花精力去维护，让他们自然生长，转变为其他三个象限的人群后，我们再施以针对性的策略。

4．矩阵思维

如图4-60所示，矩阵思维是分类思维的延伸，它不再局限于用量化指标进行分类。许多时候，我们没有数据作支持，只能通过经验做主观的推断，可以把某些重要因素组合成矩阵，大致定义出好坏的方向，然后进行分析。

矩阵思维

我们在上文中提到的“重要—紧急矩阵”，就是矩阵思维的一个例子。

5．管道/漏斗思维

这种思维方式已经比较普及了，注册转化、购买流程、销售管道、浏览路径等，很多分析场景中都能找到这种思维的影子，如图4-61所示。

漏斗思维

作者认为看上去越是普世、越是容易理解的模型，它的应用越得谨慎和小心。在漏斗思维中，我们尤其要注意漏斗的长度。

漏斗从哪里开始到哪里结束？以作者的经验，漏斗的环节不该超过5个，且漏斗中各环节的百分比数值、量级不要超过100倍（漏斗第一个环节从100%开始，到最后一个环节的转化率数值不要低于1%）。若超过了这两个数值标准，建议分为多个漏斗进行观察。当然，这两个是经验数值，仅为读者提供一个参考。

理由是什么呢？超过5个环节，往往会出现多个重点环节，那么在一个漏斗模型中分析多个重要问题容易产生混乱。数值量级差距过大，数值间变化的实际意义很难被察觉，容易遗漏信息。例如，漏斗的第一个环节到第二个环节的转化率从60%变到50%，让你感觉是天大的事情，而漏斗最后环节的转化率发生0.1%的变动，你却不以为然，其实往往是漏斗最后这0.1％的变动非常致命。

6．相关思维

如图4-62所示，我们观察指标，不仅要看单个指标的变化，还需要观察指标间的相互关系。有正相关关系（实线）和负相关关系（虚线）。最好能时常计算指标间的相关系数，定期观察变化。

相关思维

现在很多企业管理层，面对的问题并不是没有数据，而是数据太多，有用的数据太少。相关思维的一个应用，就是帮助我们找到最重要的数据，排除过多杂乱数据的干扰。

如何执行呢？可以计算能收集到的多个指标间的相互关系，挑出与其他指标相关系数都相对较高的数据指标，分析它的产生逻辑、对应的问题，并评估信度和效度，若都满足标准，这个指标就能定位为核心指标。

建议读者养成一个习惯，经常计算指标间的相关系数，仔细思考相关系数背后的逻辑，或许能给你带来惊喜！另外，“没有相关关系”，也会成为惊喜的来源。在第5章中，我们会针对相关系数模型做详细的讨论，你会更多地体会相关思维的好处。

7．远近度思维

在与许多处在管理层的朋友交流后，发现他们往往手握众多数据和报表，注意力却非常跳跃和分散。这当然不是好现象，但如何避免呢？一是通过相关思维，找到最核心的问题和指标；二是建立远进度的思维方式，如图4-63所示。

远近度思维

确定好核心问题后，分析其他业务问题与该核心问题的远近程度，由近及远，有计划地分配自己的精力。例如，近期你的核心任务是提高客服人员的服务质量，那么客服人员的话术、客户评价通道、客服系统的响应速度等就是靠得最近的子问题，需要重点关注，而客户的问询习惯、客户的购买周期等就是相对远的问题，暂时先放一放。

除了事务的远近度，还需要思考人事的远近度。与核心业务指标关系近的人，需要重点关注，多检查他们的工作方式和工作效率，多与他们沟通，保持信息的同步。

8．逻辑树思维

如图4-64所示，树状图相信大家见过许多回了。一般说明逻辑树的分叉时，都会提到“分解”和“汇总”的概念。这里把它变一变，使其更贴近数据分析，称为“下钻”和“上卷”。当然，这两个词不是作者发明的，早已有之。

逻辑树思维

下钻和上卷并不是局限于一个维度的，往往是多维组合的节点进行分叉。逻辑树引申到算法领域就是决策树。有个关键点是何时做出决策（判断）。当进行分叉时，往往会选择差别最大的一个维度进行拆分，若差别不够大，则这个枝芽就不再细分。能够产生显著差别的节点会被保留，并继续细分，直到分不出差别为止。经过这个过程，我们就能找出影响指标变化的因素。

举个川术公司的例子：作为川术公司的CEO，你发现全国客户数量下降了，你从地区和客户年龄层级两个维度先进行观察，发现各个年龄段的客户都在下降，而地区间有的下降有的升高，说明按地区进行分支能够获得更多信息，我们就按地区来拆分第一个逻辑树节点。拆分到大区后，发现各省间的差别是显著的，那就继续拆分到城市，最终发现是浙江省杭州市的大量客户（涵盖各个年龄段），被竞争对手的一波推广活动转化走了。就此，通过三个层级的逻辑树找到了问题所在。

9．时间序列思维

很多问题，我们找不到横向对比的方法和对象，那么，和历史上的状况比，就将变得非常重要。其实很多时候，作者更愿意用时间维度的对比来分析问题。这种方式容易排除一些外在干扰，尤其适合创新型的分析对象（没有参照物），比如一个新行业的公司，或者一款全新的产品。

时间序列的思维有三个关键点：一是距今越近的时间点，越要重视（在图4-65中用颜色的深浅度表示，越近期发生的事，越有可能再次发生）；二是要做同比（用箭头指示，指标往往存在某些周期性，需要在周期中的同一阶段进行对比才有意义）；三是异常值出现时，必须重视（比如出现了历史最低值或历史最高值，建议在时间序列作图时，添加平均值线和平均值加减一倍或两倍标准差线，便于观察异常值）。

时间序列思维

时间序列思维有一个子概念不得不提，就是“生命周期”的概念。用户、产品、人事等无不有生命周期存在。衡量清楚生命周期，就能方便地确定一些“阈值”问题，使产品和运营的节奏更明确。

10．队列分析思维

随着数据运算能力的提高，队列分析（Cohort Analysis）的方式逐渐崭露头脚，如图4-66所示。作者的理解是按一定的规则，在某些维度上将观察对象切片，组成一个观察样本，然后观察这个样本的某些指标随着时间的演进而产生的变化。目前使用得最多的场景就是留存分析。

队列分析思维

举个川术公司的例子：该公司在5月17日举办了一次促销活动，将这一天来的新用户作为一个观察样本，观察他们之后每天的活跃情况。可以想象，若在5月17日、6月17日、7月17日都举办了活动，那么这三天来的新用户，在注册后一段时间的使用情况就像3条队伍一样向后延伸。

11．循环／闭环思维

如图4-67所示，循环／闭环的概念可以引申到很多场景中，例如业务流程的闭环、用户生命周期闭环、产品功能使用闭环、市场推广策略闭环等。许多时候你会觉得这是一个不落地的概念，因为提的人很多，干出事情的很少。

闭环思维

业务流程的闭环是管理者比较容易定义出来的，列出公司所有业务环节，梳理出业务流程，然后定义各个环节之间相互影响的指标，跟踪这些指标的变化，能从全局上把握公司的运行状况。

例如，川术软件公司的典型业务流：推广行为（市场部）→流量进入主站（市场＋产研）→注册流程（产研）→试用体验（产研＋销售）→进入采购流程（销售部）→交易并部署（售后＋产研）→使用、续约、推荐（售后＋市场）→推广行为，一个闭环下来，各个衔接环节的指标，就值得关注了：广告点击率→注册流程进入率→注册转化率→试用率→销售管道各环节转化率→付款率→推荐率／续约率……这里会涉及漏斗思维，但千万不要用一个漏斗来衡量一个循环。

不知你有没有发现，闭环思维，实际上提供了一种设计指标体系的方式。有了循环思维，你能比较快地建立有逻辑关系的指标体系。

12．测试／对比思维

如图4-68所示，A/B测试大家肯定不陌生。一是在条件允许的情况下，决策前尽量做对比测试；二是测试时，一定要注意参照组的选择，建议任何实验中都留有不进行任何变化的一组样本，作为最基本的参照。

测试思维

现在很多公司都能支持灰度发布，数据获取也越来越方便。因此，在保证数据质量的前提下，希望大家多做实验，多去发现规律。在使用A/B测试方法时，在进行数据分析时千万不要忘记上文中所介绍的DID方法。

13．指数化思维

如图4-69所示，指数化思维是指将衡量一个问题的多个因素分别量化后，组合成一个综合指数（降维）来持续追踪。前文已经说过，许多管理者面临的问题是“数据太多，可用的太少”，这就需要“降维”，即把多个指标压缩为单个指标。

指数化思维

指数化的好处非常明显，一是减少了指标，使得管理者精力更集中；二是指数化的指标往往提高了数据的信度和效度；三是指数能长期使用且便于理解。

指数的设计是门大学问，这里简单提三个关键点：一是要遵循独立和穷尽（MECE）的原则；二是要注意各指标的单位，尽量做标准化来消除单位的影响；三是权重和要等于1。

举个例子：在设计川术公司销售部门的指标体系时，目的是衡量销售部的绩效，确定了核心指标是销售额后，你将绩效拆分为订单数、客单价、线索转化率、成单周期、续约率5个相互独立的指标，且这5个指标涵盖了销售绩效的各个方面（穷尽）。你设计的销售绩效综合指数＝0.4×订单数＋0.2×客单价＋0.2×线索转化率＋0.1×成单周期＋0.1×续约率，各指标都采用max-min的方法进行标准化。这样，作为销售总监，在时间仓促时，只需要盯住销售绩效综合指数这一个数字，就能知道各个销售团队或者销售员的表现，而不需要从多维度进行对比。

14．极端化思维

许多时候，我们总觉得想解答的问题受到各种因素的干扰，有正向的也有反向的，如图4-70所示。这时，建议大家启用极端化思维。一是把众多因素极端地缩减到1个或者2个；二是把这一两个因素的影响放到最大。例如，在思考竞争格局时，不妨将思考因素锁定为一个，并将它的影响设定为最大（如潜在进入者只有一家，它是全球最有钱的公司），然后想想我们自身的机会在哪里，该怎么做。