专栏名称: 大数据分析和人工智能
以传播大数据、解读行业趋势、数据化运营为核心的新媒体平台,已有150多万行业人士关注,荣获2013年新浪微博百强自媒体、2016年中国十大大数据领域影响力平台,关注我就是关注数据
目录
相关文章推荐
CDA数据分析师  ·  【干货】京东物流数据分析师的工作思路 ·  昨天  
数据派THU  ·  Nat. Commun. | ... ·  4 天前  
国家数据局  ·  2024年“数据要素×”大赛全国总决赛颁奖仪 ... ·  5 天前  
软件定义世界(SDX)  ·  Claude 3.5深夜觉醒,学会模仿人类用电脑! ·  6 天前  
数据派THU  ·  CVPR ... ·  1 周前  
51好读  ›  专栏  ›  大数据分析和人工智能

数据分析方法论大全

大数据分析和人工智能  · 公众号  · 大数据  · 2017-08-13 06:43

正文

本文来源:微信公众号杜王丹(ID:bestdwd)


这是一篇方法论。是的,很枯燥。


在知乎、woshipm、pmcaff、产品100等搜索了大量的数据分析相关的文章,发现没有多少适合自己的,因为内容太过碎片化,就买了一套书,开始系统的学习。


当你完成一份数据分析报告时,不知领导是否有问过你,“你的分析方法论是什么?”。如果分析方法论不正确或不合理,那分析结果参考价值几何呢?


 ◆ 

困惑


相信很多人在做数据分析时,会经常遇到这几个问题:不知从哪方面入手开展分析;分析的内容和指标常常被质疑是否合理、完整,自己也说不出个所以然来。当然我也一样,处在数据分析的学习阶段,对这些问题常常会感到困惑。


这就是为什么强调数据分析方法论的原因。当方法论结合了实际业务,才能尽量确保数据分析维度的完整性和结果的有效性。


数据分析的三大作用,主要是:现状分析、原因分析和预测分析。什么时候开展什么样的数据分析,需要根据我们的需求和目的来确定。


数据分析的一般步骤:



 ◆ 

解惑


数据分析的目的越明确,分析越有价值。明确目的后,需要梳理思路,搭建分析框架,把分析目的分解成若干个不同的分析要点,然后针对每个分析要点确定分析方法和具体分析指标;最后,确保分析框架的体系化(体系化,即先分析什么,后分析什么,使得各个分析点之间具有逻辑联系),使分析结果具有说服力。


那么,如何保证分析框架的体系化呢?


以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能尽量确保数据分析维度的完整性,结果的有效性及正确性。


营销方面的理论模型有:4P、用户使用行为、STP理论、SWOT等。


管理方面的理论模型有:PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。


这里主要说明:PEST、5W2H、逻辑树、4P、用户使用行为这五个比较经典实用的理论,了解如何在搭建数据分析框架时应用它们作指导。


(1)PEST:主要用于行业分析


PEST,即政治(Political)、经济(Economic)、社会(Social)和技术(Technological)


P:构成政治环境的关键指标有,政治体制、经济体制、财政政策、税收政策、产业政策、投资政策、国防开支水平政府补贴水平、民众对政治的参与度等。


E:构成经济环境的关键指标有,GDP及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。


S:构成社会文化环境的关键指标有:人口规模、性别比例、年龄结构、出生率、死亡率、种族结构、妇女生育率、生活方式、购买习惯、教育状况、城市特点、宗教信仰状况等因素。


T:构成技术环境的关键指标有:新技术的发明和进展、折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度、国家重点支持项目、国家投入的研发费用、专利个数、专利保护情况等因素。


eg:仅作举例,不代表只考虑这几点因素



(2)5W2H:应用相对广泛,可用于用户行为分析、业务问题专题分析、营销活动等


5W2H,即何因(Why)、何事(What)、何人(Who)、何时(When)、何地(Where)、如何做(How)、何价(How much)


该方法广泛应用于企业营销、管理活动,对于决策和执行性的活动措施非常有帮助,也有助于弥补考虑问题的疏漏。


eg:仅作举例,不代表只考虑这几点因素


(3)逻辑树:可用于业务问题专题分析


逻辑树,又称问题树、演绎树或分解树等。


它是将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。


逻辑树的作用主要是帮我们理清自己的思路,避免进行重复和无关的思考。


逻辑树的使用必须遵循以下三个原则。


  • 要素化:把相同问题总结归纳成要素。

  • 框架化:将各个要素组织成框架,遵守不重不漏的原则。

  • 关联化:框架内的各要素保持必要的相互关系,简单而不孤立。


缺点:涉及的相关问题可能有遗漏,虽然可以用头脑风暴把涉及的问题总结归纳出来,但还是难以避免存在考虑不周全的地方。所以在使用逻辑树的时候,尽量把涉及的问题或要素考虑周全。


eg:仅作举例,不代表只考虑这几点因素


(4)4P:主要用于公司整体经营情况分析


4P,即产品(Product)、价格(Price)、渠道(Place)、促销(Promotion)


eg:仅作举例,不代表只考虑这几点因素


(5)用户使用行为:用途较为单一,就是用于用户行为的研究分析


用户使用行为,即用户为获取、使用物品或服务所采取的各种行动。


用户对产品首先需要有一个认知、熟悉的过程,然后试用,再决定是否继续消费使用,最后成为忠诚用户。


用户使用行为的完整过程:


可以利用用户使用行为理论,梳理产品分析的各关键指标之间的逻辑关系,构建符合公司实际业务的产品分析指标体系。


eg:仅作举例,不代表只考虑这几点因素


这些方法论并非只能单独使用,可以根据具体情况选择合适的方法论嵌套使用。


 ◆ 

最后


明确数据分析方法论的主要作用:


  • 理顺分析思路,确保数据分析结构体系化。

  • 把问题分解成相关联的部分,并显示它们之间的关系。

  • 为后续数据分析的开展指引方向。

  • 确保分析结果的有效性及正确性。


明确数据分析方法论和数据分析法的区别:


数据分析方法论主要是从宏观角度指导如何进行数据分析,它就像是一个数据分析的前期规划,指导着后期数据分析工作的开展。


而数据分析法则指具体的分析方法,比如对比分析、交叉分析、相关分析、回归分析等。数据分析法主要从微观角度指导如何进行数据分析。


目前数据君的数据圈只能通过我邀请才能进,收费298永久


唯一的加入方式:


加我微信:seedata        


 转账298,先拉微信群,再邀请进小密圈


犹豫的、不懂的、咨询的不要加,加了也是僵尸,时间宝贵,你我都珍惜