专栏名称: 爱数据原统计网
中国统计网(www.itongji.cn),国内最大的数据分析门户网站。提供数据分析行业资讯,统计百科知识、数据分析、商业智能(BI)、数据挖掘技术,Excel、SPSS、SAS、R等数据分析软件等在线学习平台。
目录
相关文章推荐
51好读  ›  专栏  ›  爱数据原统计网

0岁数据分析师的入门指南

爱数据原统计网  · 公众号  · BI  · 2017-01-11 17:20

正文


初入数据分析行业的同学或还在门口徘徊想要从事数据分析职业的同学常常会比较困惑,非常迫切地想要知道作为一个数据分析师,到底需要掌握那些技能,这里笔者作为过来人给到大家一点建议。(注意这里适用的是互联网行业的数据分析师,不一定适合传统行业。)


一    数据分析师是做什么的


首先,你需要了解,数据分析师到底是干什么的,该职位在企业中在扮演一个什么样的角色,为了能结合实际情况进行阐述,这里先给大家看一下某公司招聘数据分析师的JD。


工作职责


1、支持各种常规或临时数据分析需求;


2、提供各类业务相关的分析及建议;


3、通过建模深入挖掘用户或产品方面的有价值的信息;


4、和各部门沟通协调需求并提出各种新的数据分析项目或方案;


5、持续地改进数据采集、处理、分析、报告等各个流程上的工作。




这里有一些关键词,“支持”、“分析”、“建议”、“有价值的信息”、“沟通”、“项目”、“方案”,通过这些关键词可以一窥数据分析师的功能所在。一般来讲数据分析师的日常工作主要分为3部分内容,


(1)支持各业务部门或者领导的日常的数据需求。


(2)针对主题或研究专项进行深入的数据分析,形成有结论和建议的分析报告,甚至是解决方案。


(3)持续的跟进一个项目,和业务人员一样为该项目的KPI负责,同时具有项目推动能力和主人翁精神,“不计一切手段”地想办法达到目标,经常需要从数据上给项目组成员们提供insights。


这里每一部分的内容对分析师的能力要求有所不同,能做好第一部分的人是一个合格数据分析师助理(或者说叫数据专员),能做好第二部分的人是一个不错的初级数据分析师,能做好第三部分的人才是一个真正优秀且对企业有极高价值的数据分析师。


在我的职业生涯中,不止一次的被前辈们教导,一个优秀的数据分析师,一定不能是一个“取数机器”,他要是有头脑,有想法,有能力发现问题并且解决问题的,当然我相信在这个行业能做到这一点的人是凤毛麟角的。如果你已经是一枚数据分析师了,不妨按照上面的几点对号入座,看看自己已经进阶到哪一步了,又有哪些地方还尚需努力。


二    数据分析师必备技能工具篇


在身边偶尔会听到别人说做数据分析师,工具不是很重要,重要的是那些软实力,其实这一点我并不敢苟同。俗话说工欲善其事必先利其器,所以工具用的好,其实是可以极大的提升工作效率的。那么作为一名数据分析师,都需要掌握哪些工具呢,这里先列出使用频率最高的3个工具。


(1)sql


学习写sql是做数据分析师的第一步,对于没有数据库和编程语言基础的人来讲,也并不是一件十分困难的事儿,关键在于你是否能找到一个“好师傅”带你飞,这里的“好师傅”一是指教你写sql的入门书籍,上面会系统的讲解sql的相关知识并且最好有实例教学;二是指在工作中会有前辈教你一些书写sql的良好习惯以及优化代码的方法等等(要知道把功能实现是一码事儿,高效的把功能实现是另一码事儿)。这里附上一本我学习sql的书,需要的人自行认领——《SQL基础教程》MICK 著(人民邮电出版社)。优化sql的方法如有需要,我会再开一篇文章给大家分享。




(2)excel


我认为第二重要的工具是excel,而非R,SAS, SPSS, 作为数据分析师,其实和建模师不同的是,分析师更多的时候是在分析数据,而不是建模,分析数据的时候你总得把数据放到一个文件里边是吧,这个文件就是excel。excel的功能远比我们想象的要强大许多,我见过每天用excel做报表的(还是在大型互联网公司),见过每天写vba处理上百封数据的,见过用excel画出十分精美的图表的,毫不夸张的说,做为一个数据分析师基本每天都要打开关闭几十个excel。那么,怎么把excel用的好呢?我觉得有一下几个模块要学会



第一个是公式,excel常用公式要熟练,网上很多教程,很容易找到。


第二个是数据透视表,因为分析数据的时候经常需要拆分到更细的粒度,所以数据透视表不可或缺。


第三个是图表,excel的图表功能基本已经可以满足一个数据分析师的日常需要了,但是什么数据画什么图,这也是一门学问,比如说想要表达趋势,那最好画线图,如果是想表示各个部分的占比,无需纵向对比,那最好画饼图。(这里如有需要我会再开一篇文章写图表的使用方法)。


(3)统计工具(R or SPSS)


一般情况下数据分析师极少会用到统计软件,但是在一些特殊情况下会有用到。比如有的公司也会要求数据分析师做建模一类的工作(一般这类公司缺少数据挖掘的专业人才),这个时候数据分析师可能首先需要了解一些经典的统计模型(最最常用的是逻辑回归模型),为了快速掌握,其实你大可不必去找一本《机器学习》去死磕书本,而是只要了解这个模型的使用场景、数据处理的方法、使用何种软件实现就可以了,这里可能会要求你有一定的概率统计基础,但就算是没有,你也不必要特别担心,搞清楚模型的输入和输出,最后证明模型真的是有用的,这才是王道。(更加专业的数据挖掘我也较少涉猎,感兴趣的同学可以自行想办法学习)。



如果一个人会写sql,精通excel,可以绘制精美的图表,并且懂得一些常用的统计模型,基本上在面试数据分析师职位的时候工具关就可以过了。当然这里还有一些其他的工具,在工作中也起到很大的帮助,比如画结构图的mindmanager,帮助你收藏处理工作文件的有道云笔记,以及做报告时常常用到的ppt。


三    数据分析师必备技能思维篇


上面也提到了,数据分析师的主要职责是发现问题,分析问题,解决问题,所以数据分析师主要是靠脑子吃饭,思路决定出路。一般招聘人会在JD中描述要求分析师有“数据敏感度”以及“严谨的逻辑思维能力”等,但是这些到底是什么?这里就给大家讲讲我个人的一些理解。



举个例子,小王做数据的时候发现公司9月份的收入相比去年9月增长了30%,十分高兴的在10月初的月度会议上跟领导汇报了这一好消息,领导却并没有开心,因为公司的主要收入来自软件销售费用,9月份是公司的淡季,软件销售量并没有增长,而且相比去年的时候单价还下降了,收入怎么可能会有增长?领导要求小王对这个数据进行核查,后来经过排查才发现原来是财务部的人将公司历史上的“僵尸账户”(指的是账户里面有钱但是一直没有用)统一放到9月份进行核销了,导致收入大涨。


看完这个例子请你思考一下,什么是数据敏感度,数据敏感度就是当数据变化的时候,你是否能够快速找到跟这个数据联动变化的指标,这个技能非常重要,一是可以帮助你核实数据的准确性,二是能帮你快速发现问题。什么是逻辑思维能力,逻辑思维能力就是在面对一件事情的时候,你往往要在脑海中打无数个问号,比如为什么收入会上涨,是什么原因造成的,要去搞清楚事件背后的真正的逻辑是什么,层层拆解,层层深入,而不是仅仅停留在表面,不爱思考的人是不会有严谨的逻辑思维能力的。



四    数据分析师必备技能沟通篇


沟通是一项软技能,也是不分职业的,沟通能力放之四海皆准。这里我仅仅针对数据分析师的沟通技能给到大家一些建议。


数据分析师常常需要和业务方沟通数据需求,举个例子,小李来找小王要收入的数据,小王这个时候不是一声不吭的就打开电脑开始写sql提数,而是问小李,“这个数据是用来做什么的?”小李回答说,“这不马上就要年底了嘛,我们要给销售部分制定KPI!”这个时候小王明白了小李需要数据的目的是给销售团队制定明年的收入目标。小王又问,“明年的销售计划有了吗?”小李想了想回答说,“可能预计会3月份销售旺季提价一次,并且维持现有的销售团队不做新增”。小王又知道了,可能需要将收入拆分成单价*销量,再根据预测的销量去算出总收入,并且预测销量的时候需要剔除9月份的异常值。所以你看,如果小王没有问这2个问题,小李拿着今年的收入数据真的能做出一个合理的目标值吗?




我了解到在一些互联网公司,业务人员往往并不喜欢主动和分析师沟通,他们把分析师当做“取数机器”,只是单纯的认为我要这个数据,你就给我这个数据就可以了,但是事实是,有很多人,他们自己的数据分析能力有限,对问题的理解能力也有限,往往心里期望拿到A数据,表达出来确是B数据,所以这个时候,数据分析师一定要耐心的和业务人员多多沟通,一来可以提高你的工作效率,以免重新返工,二来就是借此机会和业务员人员聊聊天,了解业务,彼此建立信任的关系。毕竟数据分析师是为了业务服务的,离业务太远的数据分析就是空中阁楼,是不接地气的。


End.


作者:大飞(中国统计网特邀认证作者)


本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明作者及出处,并保留本文链接。