专栏名称: 大数据挖掘DT数据分析
实战数据资源提供。数据实力派社区,手把手带你玩各种数据分析,涵盖数据分析工具使用,数据挖掘算法原理与案例,机器学习,R语言,Python编程,爬虫。如需发布广告请联系: hai299014
目录
相关文章推荐
数据派THU  ·  【CELL】用AI智能体推动生物医学发现 ·  2 天前  
数据派THU  ·  【NUS博士论文】视频语义理解中的因果模型 ·  5 天前  
软件定义世界(SDX)  ·  中小企业数字化体系设计 ·  6 天前  
51好读  ›  专栏  ›  大数据挖掘DT数据分析

想从事数据分析该如何学习入门?

大数据挖掘DT数据分析  · 公众号  · 大数据  · 2017-02-21 20:18

正文



数据挖掘入门与实战  公众号: datadw



 数据分析师的能力体系


一图说明:


数学知识


数学知识是数据分析师的基础知识。


  • 对于初级数据分析师,了解一些描述统计相关的基础内容,有一定的公式计算能力即可,了解常用统计模型算法则是加分。


  • 对于高级数据分析师,统计模型相关知识是必备能力,线性代数(主要是矩阵计算相关知识)最好也有一定的了解。


  • 而对于数据挖掘工程师,除了统计学以外,各类算法也需要熟练使用,对数学的要求是最高的。


 

分析工具


  • 对于初级数据分析师,玩转Excel是必须的,数据透视表和公式使用必须熟练,SQL 、VBA是加分。另外,还要学会一个统计分析工具,SPSS作为入门是比较好的。


  • 对于高级数据分析师,使用分析工具是核心能力,SQL、VBA基本必备,SPSS/SAS/R/python至少要熟练使用其中之一,其他分析工具(如Matlab)视情况而定。


  • 对于数据挖掘工程师……嗯,会用用Excel就行了,主要工作要靠写代码来解决呢。


 

编程语言


  • 对于初级数据分析师,会写SQL查询,有需要的话写写Hadoop和Hive查询,基本就OK了。


  • 对于高级数据分析师,除了SQL以外,学习Python是很有必要的,用来获取和处理数据都是事半功倍。当然其他编程语言也是可以的。


  • 对于数据挖掘工程师,Hadoop得熟悉,Python/Java/C++至少得熟悉一门,Shell得会用……总之编程语言绝对是数据挖掘工程师的最核心能力了。


 

业务理解


业务理解说是数据分析师所有工作的基础也不为过,数据的获取方案、指标的选取、乃至最终结论的洞察,都依赖于数据分析师对业务本身的理解。


  • 对于初级数据分析师,主要工作是提取数据和做一些简单图表,以及少量的洞察结论,拥有对业务的基本了解就可以。


  • 对于高级数据分析师,需要对业务有较为深入的了解,能够基于数据,提炼出有效观点,对实际业务能有所帮助。


  • 对于数据挖掘工程师,对业务有基本了解就可以,重点还是需要放在发挥自己的技术能力上。


 

逻辑思维



  • 对于初级数据分析师,逻辑思维主要体现在数据分析过程中每一步都有目的性,知道自己需要用什么样的手段,达到什么样的目标。


  • 对于高级数据分析师,逻辑思维主要体现在搭建完整有效的分析框架,了解分析对象之间的关联关系,清楚每一个指标变化的前因后果,会给业务带来的影响。


  • 对于数据挖掘工程师,逻辑思维除了体现在和业务相关的分析工作上,还包括算法逻辑,程序逻辑等,所以对逻辑思维的要求也是最高的。


 

数据可视化


数据可视化说起来很高大上,其实包括的范围很广,做个PPT里边放上数据图表也可以算是数据可视化,所以我认为这是一项普遍需要的能力。


  • 对于初级数据分析师,能用Excel和PPT做出基本的图表和报告,能清楚的展示数据,就达到目标了。


  • 对于高级数据分析师,需要探寻更好的数据可视化方法,使用更有效的数据可视化工具,根据实际需求做出或简单或复杂,但适合受众观看的数据可视化内容。


  • 对于数据挖掘工程师,了解一些数据可视化工具是有必要的,也要根据需求做一些复杂的可视化图表,但通常不需要考虑太多美化的问题。


 

协调沟通


  • 对于初级数据分析师,了解业务、寻找数据、讲解报告,都需要和不同部门的人打交道,因此沟通能力很重要。


  • 对于高级数据分析师,需要开始独立带项目,或者和产品做一些合作,因此除了沟通能力以外,还需要一些项目协调能力。


  • 对于数据挖掘工程师,和人沟通技术方面内容偏多,业务方面相对少一些,对沟通协调的要求也相对低一些。


 

快速学习


无论做数据分析的哪个方向,初级还是高级,都需要有快速学习的能力,学业务逻辑、学行业知识、学技术工具、学分析框架……数据分析领域中有学不完的内容,需要大家有一颗时刻不忘学习的心。


数据分析师的工具体系


一图说明:



入门读物:

《谁说菜鸟不会数据分析》

《深入浅出数据分析》

《精益数据分析》


统计学/概率参考书


(1)统计学 
作者William Mendenhall / Terry Sincich 



(2)统计学  豆瓣评分7.3
作者:贾俊平,何晓群,金勇进



(3)统计推断 
作者:William Mendenhall / Terry Sincich



机器学习课程

强烈推荐Andrew NG吴恩达的斯坦福机器学习课程,英文授课,但是已有完善的中文字幕,内容非常丰富且充实(20节),并且讲解得非常的好,如果你想学习机器学习,一定不能错过!


Coursera地址:

https://www.coursera.org/learn/machine-learning#

网易公开课地址:

http://open.163.com/special/opencourse/machinelearning.html

同时该课程配有课件讲义,同样建议大家在学习视频课程之余多看讲义和习题,虽然是英文,但是阅读上基本没有什么问题,就讲义本身也是非常的棒。

 

如果大家学习完Andrew NG的机器学习,还想通过其他课程触类旁通,相互借鉴的话,可以上Coursera上门搜索还有其他选择,例如台大的机器学习基础等等,但毫无疑问首推Andrew NG的课程;

另外现在国内也有越来越多的培训网站推出相关课程,大家有兴趣的可以自己搜搜,这里就不做推荐了;

 

机器学习教材

(1)数据挖掘导论 

作者: Pang-Ning Tan、Michael Steinbach、Vipin Kumar


 

(2)统计学习方法 

作者:李航


 

(3)The Elements of Statistical Learning(统计学习基础)

豆瓣英本原版评分9.4 中文评分7.4

作者:Trevor Hastie

这本书被广大人民喜称为ESL,虽然书名是统计学习基础,但是此书一点都不基础,一点都不~另外此书还有一本专门的入门版本ISL(后面会介绍)

这本书涵盖了非常多的内容,讲解深入,有人评价说,“有了这本书就不需要其他机器学习教材”,虽然有点夸张,但是此书实际是机器学习的经典巨作,如果你真的希望好好研究机器学习,此书非常值得仔细研读,另外此书要求不低的统计理论和数学基础。

此外,这本书还有一个牛逼的地方在于,作者把书放在网上免费下载:

http://statweb.stanford.edu/~tibs/ElemStatLearn/




数据挖掘入门与实战

搜索添加微信公众号:datadw


教你机器学习,教你数据挖掘


长按图片,识别二维码,点关注



  公众号: weic2c   
据分析入门与实战

长按图片,识别二维码,点关注