一直以来主做数据存储与计算的,数据分析是兼职搞,所以请大家轻拍砖^_^。
某天晚饭时老大问:
你们觉得下次XX2发售,哪些用户最有可能来购买?应该给哪些用户Push Message?让尝试来分析一下。
按照如上的分析步骤:
首先
是提出了问题,有了需求。
第二步
分析问题,提出方案,个人觉得这一步非常重要,数据分析本身就是一个假设检验的过程,如果这一步不能很好的假设,后续的检验也就无从谈起。主要需要思考下从哪些方面来分析这个问题。
想到的主要从三个方面:
(PS:这里对于一些常规的属性比如:性别、年龄、地区分布了这些基本,老大早已心中有数,就不再看了)
1.用户的关注度(是否预约,是否浏览过产品站) 。
2.用户的消费能力(历史消费金额、历史购机数量、本年度购机金额、本年度购机数量、最近一次购机时间及金额等)。
3.当前使用机型(购买时间、存储容量、颜色、尺寸等等主要看换机的迫切程度)。
第三步
准备数据:
创建分析表,搜集数据 这一步基本是最花时间的,这时候就是考量你的数据平台、数据仓库的时候了,仓库集成的好,平台易用的话时间应该不用太长。
CREATE TABLE xx_user_analyze (
user_id BIGINT (20) DEFAULT NULL,
is_reserve SMALLINT (6) NOT NULL DEFAULT '0',
is_view SMALLINT (6) NOT NULL DEFAULT '0',