接上一篇:
算法/策略产品的数据产品经理的成长之路(一)
上述方式的好处是,可以快速的得到结论,但是会损失一些精度和质量,因为用户行为太多,看不过来,那么,怎么样在快速的同时满足质量更高的要求呢,就是,先抽样,有针对性的抽样。抽样的步骤,对用户行为的分类,是这个过程比较重要的。最开始的时候,会从各种维度,因为产品经理随便想就是很多维度嘛,但是当做了一段时间后,就把抽样的过程给固化了。
注:抽样这个过程中最重要的是,把抽样维度逐渐固化。这样可以用20%的时间获取80%的信息。
我们的抽样步骤如下:
首先按用户行为的次数来分,将搜索词分为高频和低频,高频词能贡献绝大部分最优结果和最高点击率,新词是高频词里需要特别注意的,因为新词往往代表的是飙升词,也就是新的用户需求。
而低频词是非常需要注意的,最能衡量搜索引擎好坏的,因为量大,以酒仙网为例,2%和98%的原则,即2%的搜索词,占了98%的pv和点击,98%的词可以归为低频词,背后就是大量的用户,需求没有被满足的用户。badcase基本上都是在这里产生。低频词包括了大部分长尾词、同义词、问答词,未召回词,无结果词,没有点击的词,没有成交的词。
低频词的召回是件十分头痛的事情,算法很难取舍,因为这些都是非常长尾的需求,并没有足够多的用户行为可以学习,所以如何给予相应的匹配,需要非常深入的学习和分析。
接下来一个维度,就是有无结果。无结果的,要挨个分析,有结果的,要按数据分析。所以下一步就是看数据,点击率。
另外在分析的时候,我们还采用过其他维度,比如把点击率为0 的搜索词挨个看,又把点击率从高到低的挨个看,按转化率、结果数等等,正序、倒序看了很多遍。
这是很有用的一个分析方式,我们曾经用于供应链分析,后来被我拿过来做搜索的分析:完全模拟用户行为,把整个流程走一遍,所有的节点都走一遍,然后
按用户行为来,把每一个步骤,详细的列出来
用户如何来到这个页面/这个流程?
他都进行了哪些操作
都经过了哪些步骤
从哪个环节流失?
整体流程上,用户最关心什么?他的时间?更好的服务?更多的选择?
可以看到在每个流程中,都可以拆分出无数细分的流程,那么,每个节点,是否流失严重,需要先解决哪个的问题?
这个方法对于产品经理来说,是确定需求优先级的方式之一,一般来说,在比较靠前的流程的,要先改,因为可以扩大进入产品的流量。
数据驱动业务增长。在数据层面发现问题,并推动策略/产品的迭代,一个产品经理连这点能力都没有,那还混什么。