专栏名称: 爱数据原统计网
中国统计网(www.itongji.cn),国内最大的数据分析门户网站。提供数据分析行业资讯,统计百科知识、数据分析、商业智能(BI)、数据挖掘技术,Excel、SPSS、SAS、R等数据分析软件等在线学习平台。
目录
相关文章推荐
51好读  ›  专栏  ›  爱数据原统计网

数匠专访|第7期 黑子:如何进行用户分析——实战案例分享

爱数据原统计网  · 公众号  · BI  · 2017-07-12 17:00

正文


黑子 大麦网高级分析师

2011年大学数学系本科毕业,先后在旅游、搜索、电信、娱乐演出等行业担任BI工程师、风控分析师、高级数据挖掘工程师、分析及挖掘团队leader等职务,多年数据相关工作经验,多年数据团队管理经验。    



出品|中国统计网(ID:cntongji)

嘉宾|黑子

采访|赵良

审核|赵良

编辑|惊渡


赵良:请您描述一下用户研究在互联网公司或一家企业的数据工作中的重要性?


黑子:由于公司组织架构及部门职责分工的原因,我们平时很少单独做用户研究,一般做用户研究或用户分析都是基于具体场景从整体的解决方案来思考的。


对于单独的用户研究,我个人认为,一般企业都是以盈利为目的的,那么能给企业带来销售额增长的这一端实体,我定义为用户也就是说,用户研究是可以提升企业销售额的,因此,用户研究在互联网工作中的重要性就不言而喻了。



赵良:一般在数据分析或数据挖掘工作中会用到用户研究或用户分析有哪些?                                                                                                                                        


黑子:以我现在的公司(演出行业票务销售平台)举例:


一、我们是B2C的平台。


对于演出票务行业来说,B端定义为主办方或者经纪公司等,C端是用户。


二、从票的角度来看,每一张票都是归属到某一个项目。


项目本身又有演出场地(场馆)、演出主体(歌手、演员等)、演出时间、售卖平台等。


三、用户在票务平台购买票。


对于整体分析,要知道用户通过什么渠道了解到某个演出团体在某个时间地点在某个平台售卖。举个例子,用户和渠道挂上钩之后,可以进行来源渠道分析,比如哪些渠道过来的用户多,哪些渠道的订单转化率高,这两个指标综合就可以评价渠道质量的好坏。


所以,从用户角度来看,我们关心的是用户从哪些地方来、在我们平台做了什么事、流向什么地方, 相对应的是三个用户分析模块:来源渠道分析、 用户行为分析、 用户流到竞争对手后的竞争对手分析



赵良:从业务角度来看,您认为用户研究的痛点在哪里?


黑子:痛点:拉新、促活、维系、召回


当然,痛点的来源一定是在和业务方沟通之后才能确认。


以拉新为例,我们的运营部门有很多做SEO或者做竞价排名的相关部门或同事,在投放资源的时候,如果他们没有对于用户来源渠道的分析,是不知道每年有限的经费该重点投放哪些渠道,该果断放弃哪些渠道的。所以用户来源渠道的分析是非常必要的。


拉新之后,用户会不会买,买什么,可能会买什么,项目本身是不是用户喜欢的。这些都是用户研究的范畴。以长尾项目的精准营销为例,我们通过对用户行为特征的研究可以知道用户的偏好,结合产品的特征标签,我们就可以实现既增加产品的曝光和销售,又可以促进用户的活跃度、黏性、流失用户的召回等效果。另外一个例子就是,我们还会从用户研究的角度来预测一个项目潜在目标用户群有多大,即一个项目的票房能达到多少,最终反馈给投资部门,来指导他们在市场上的投资行为。



赵良:数据分析师会不会参与数据平台建设,特别是埋点,以及最终的数据采集、数据清洗、入库数据分析?


黑子:要回答这个问题,首先要了解两点:


①数据平台建设的需要包含哪些模块、哪些功能点?

②数据分析师平时的工作内容包含哪些?


了解了上面两点后,我们才能思考分析师在数据平台建设中要担任的角色。


以我的经验及理解出发,数据平台至少要包含数据抽取、数据清洗、数据汇总、数据服务几个功能模块;而数据分析人员平时的工作包括临时性数据需求支持、数据报表的指标体系建立、专题性分析、数据产品的数据逻辑及建模支持等。


因此:


一、数据埋点:


埋点的深度和广度需要考虑平时的临时性需求是否能满足、产品分析&专题分析需要的埋点数据是否能提取等;


二、数据采集及抽取:


业务库需要抽取哪些数据、外部数据需要爬取哪些数据,这些都是要结合具体应用场景才能确认的,而这些场景大部分来源于分析人员在平时对接业务方时的需求沉淀;


三、数据汇总:
哪些数据需要汇总、汇总的颗粒度要多细,大部分的决定仍然来源于分析人员平时的需求沉淀;


四、数据服务:


数据服务主要是基于具体的分析场景and数据产品来确定的,产品里的关键指标定义、提取逻辑、分析点都是需要产品经理、需求方、分析师共同讨论确认的。


因此数据平台建设整个过程都是需要分析师这样一个角色来协同的。



赵良:能否举个通过用户研究,最终落实到业务的案例?数据分析的链条是怎样的?比如演唱会票的营销设计,数据分析师会涉及到哪些环节?


黑子:以长尾项目精准营销为例,我大致说明这个流程。这个流程其实和常规的数据挖掘流程是一致的。包括对前期的业务需求痛点的调研,之后会做一些业务理解、数据理解、数据处理,接下来进行模型搭建、测试,部署上线等。


对于一个数据产品来说,首先要进行需求调研,研究当前需求本身的来源、目的、方式、渠道、转化情况等。这一步的主要目的就是发现当前营销的痛点。


一、我们每年有好几万的项目会上架售卖,如果按人工的方式来营销的话,覆盖面可能只有几百,加上长尾项目比较多,能曝光的项目又不多,这个问题就非常大。


二、营销需求都是被动接受的,由于项目太多,很难去发现项目哪里不好。


三、营销渠道,我们之前多以短信形式去营销,渠道比较单一,且营销流程特别复杂。比如由某大区提出一个营销需求,并给到运营部门,运营部门找到我们获取数据,再进行文案编辑,之后将文案给到短信中心发出给用户,并再次找到我们对此进行跟踪。整个流程复杂且没有进行系统化。


四、业务和运营人员在营销时的用户筛选这块多是靠经验,可能会导致一个不太理想的结果。


总结,我们在需求调研时发现的问题是,单纯的营销覆盖项目少,接需求比较被动,渠道单一,营销流程较复杂,没有系统化的跟踪,转化效果比较差。


了解完过后,我们就可以开始设计产品了。产品原型由数据产品经理来设计,数据分析师主要是从功能上来给产品定位,这就从以下几点来考虑


一、主动营销,而不是被动接受营销需求;

二、覆盖全量的长尾项目;

三、支持多种营销方式;

四、营销流程简单化;

五、实时跟踪、统计;


接下来,数据分析师就要考虑底层模型,从这么几点出发:


首先,建模型对长尾、高价值项目进行筛选。一旦确定下来之后,就需要建立一个用户匹配模型,接着就要考虑营销,在营销之前我们也要考虑用户体验的问题。如果同一位用户在一周内已经多次收到公司的推送,再次接收是否就会引起退订或者投诉?再往后就涉及到营销的文案,要简单,包含重要信息,生成一个完整的营销文案,形成一个营销短文案的自动模型,就可以给到短信中心,由他们进行发送,数据分析师再进行跟踪,做一个跟踪转化规则的设置。基本底层模型都由分析师来做了,但这可能不是初级数据分析师的角色。从工作上来说,设计模型和业务逻辑的一些东西,这个时候通常需要我们去挖掘,或者需要具备这些能力的高级数据分析师。由数据分析师和挖掘、算法人员共同参与,做出这几类模型。


①长尾高价值项目筛选模型
②匹配模型
③高用户体验的逻辑设置
④渠道营销短文案的生成模型
⑤跟踪转化率统计规则模型。


模型搭建完成后,就涉及到数据采集。怎么采集,怎么处理,数据模型怎么落地的这样一个阶段。首先,业务方的数据直接抽取到数据中心,用户行为的埋点数据抽取到数据中心,在数据中心进行中间表的处理,中间表有一大部分是画像体系相关的,它包括用户画像、项目画像、场馆画像,还有一些演出团队的画像等。画像的中间表完成后,将进行模型的思考。


第一,什么样的项目才是高价值、长尾的项目;


第二,一旦用户筛选出来,怎么设置用户匹配模型。


在这个过程中还需要不断的调试,来逐步建立。这一步完成后,再嵌入到原型的功能点上,在开发的时候,直接进行接口封装,把数据和模型结果传上去,这个时候分析师的重点工作基本就完成了。大概的流程就是这样。



赵良:从数据分析师的角度来看,怎样筛选出有价值的用户很关键,您是怎么操作的?


黑子:其实总结起来比较简单,因为我们毕竟筛选用户的一个目标是让用户去进行购买,所以我们会重点分析历史购买用户的购买特征,建立相应的用户画像体系,同时抽取购买项目的特征,建立项目的特征体系,将用户画像与项目特征通过行为(浏览、点击、下单等)关联起来,再进行数据挖掘,最终不断去营销测试、细化&丰富整个画像&特征体系,逐步提升不同场景下圈定价值用户的准确性。



赵良:在跟踪整合用户的分析中,如何去分析?


黑子:分析的目的主要是关注转化用户的特征,用来调整、优化用户筛选模型的,而实现这一步的前提,就是要准确识别转化的用户:


以短信营销为例,一般我们只需要关注发送短信的手机号中有多少手机号在下单时被使用就可以了,但这里会有一些细节问题,比如一个用户有多个手机号,在购买某一项目的时候可能都输入了身份证,这时可以通过身份证间接的将这多个手机号绑在一起来上升提出客户的这么一个概念,那这时我一旦营销了某个手机号之后,这个手机号对应的上层身份证挂了多个手机号,另外的手机号如果也下单了,对我们来说也算是我们转化的;再比如一个用户用其它人的账户在其手机上登录下单,这个时候你就需要一种设备和你的手机号建立一个映射关系,所以如果想分析一个用户的一些行为特征的话,需要通过这些不同的映射方式来精准识别购买用户



赵良:我们提到了很多的模型,对于一些刚毕业的学生来说,和一些人为的统计模型有差异吗?


黑子:差异还是蛮大,比如一般大家定义模型可能会是一个数学概念上的模型or函数,而在实际应用中,只要能解决具体问题,哪怕仅仅是一个简单的业务逻辑,也可以称为模型。当然某些大公司,数据量比较大,或者可能说它的自身要求比较高,这个时候,可能会用到很多我们所谓的机器学习模型、深度学习模型等,但那些都不是问题,对于一些刚毕业的学生来说,只要你有一些数学和统计学的基础知识,有一定的编程基础,分析入门就不会困难,当然随着业务逻辑变的复杂、数据量的增大、数据维度的增多,我们在学生时期的学习应用的知识会不断深入,那个时候,就要不断深入理解学习新的专业知识了。



赵良:在以往的工作经验中,对于用户画像的设计是如何处理的呢?


黑子:首先我们的用户画像,是很多画像体系中非常重要的模块,因为毕竟对于企业来说,贡献钱的就是用户,所以如果能很好的刻画用户的一个特征,是非常有必要的。对于用户画像来说,分为两大块,第一块是你如果有一定的经验,哪怕是从网上多看一些相关的案例或者资料,也能搭建起一个相对基础的用户画像体系,比如说用户的一些唯一性标识,你在PC端是什么,在app端是什么,然后这些用户的访问的一些时间规律,或者说用户的一些偏好可能是从访问、点击,或者说下单的这些维度都可以去做,那这样的话,你把整个用户画像进行分门别类,基本上基于数据源来进行分门别类的来设计,来形成一张相对来说比较大的宽表,用户画像的一些基础标签都具备了。


第二块是对于一些在工作当中可能比较复杂,或者说可用性、针对性比较强的这种标签,你在没有真正深入工作之前,很难去想得到,即使你想到了,也不知道该怎么去用,所以这时候,对于我们在建立用户画像时,一般都是结合具体场景的。你在这个场景用到了某个用户的特征,这个特征可能会平推用到其他的相似场景的时候,那我们就会把这个特征抽出来,放到用户画像体系中,作为一个新的标签。


所以有两部分,一部分是常规的基础标签,一部分基于业务场景和具体的业务工作中抽象出来的,在以后具有可复用性的其它标签,来最终构成整个用户画像体系。



赵良:今天聊了这么多,您觉得在用户研究这一块有什么话题被忽略的?


黑子:若没有专门做过用户研究,那么在即将要做这块工作时,建议不要割裂的去看待。如果说有什么话题被忽略的话,个人感觉,我们没有提到会员这个概念,比如会员等级体系的建立,其实也是可以从用户研究场景出发提出来的。


结束语:感谢黑子今天在用户研究方面非常具体、优质的分享,下次如果有机会再次请教。



大家有什么疑问可以下方留言区留言~尽量解答!


End.

本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:ishujiang),转载时请注明作者及出处,并保留本文链接。




数匠往期专访回顾

LoveData大数据100+系列访谈第001期——专访 | 阿里巴巴资深数据分析师的成长之路

LoveData大数据100+系列访谈第002期——专访 | 北京大学高材生的数据分析学习历程

LoveData大数据100+系列访谈第003期——专访 | 高级BI经理:流量分析之实际操作分享

LoveData大数据100+系列访谈第004期——专访 | 高级BI负责人:初创型企业如何搭建数据体系

LoveData大数据100+系列访谈第005期——专访 | 涨姿势了!数据分析在航空业可以这么玩

LoveData大数据100+系列访谈第006期——专访|郜耿威:一款成功的数据产品在于能够帮用户解决问题