今年的夏季,全国绝大部分地区都被持续高温笼罩,炎热的天气往往让人不能静下心来做需要积淀的事情,这与目前略显“浮躁”的社会风气有些相似。近十年来,人类社会从互联网时代大踏步的进入到移动互联网时代,使得信息的传播速度和传播量都以几何级数增长,面对获取成本越来越低的知识信息,“拿来主义”和“实用主义”逐渐成为主流思想。任何事情都有两面性,知识信息带上互联网属性以后,增加了使用便捷性,但是知识应用背后的理论基础和分析逻辑不出意外的被人们忽视。今天聊聊学习数据分析的一个大误区。
只重视统计分析软件的操作学习,忽视数据分析理论基础学习和数据分析逻辑能力培养。很多朋友将数据分析当作分析软件的操作技术来学习,其中一个主要原因是很多数据分析师的岗位描述中明确要求应聘者熟练掌握某几款分析软件的操作使用,以R和Python为多。分析软件对于数据分析的重要性不需要过多描述,它们能够在瞬间完成数据分析过程并输出漂亮的分析结果,但是数据分析的统计理论基础才是数据分析的核心。
数据分析过程主要包括以下几个步骤:确定目标数据、数据采集、数据清洗、数据存储、数据分析、结果可视化及结果支持的决策。
这些步骤看似独立存在,可以像工厂流水线一样,分别由不同的人负责完成,实际上在这六个步骤建立在一个整体分析逻辑思想之上,是整体分析逻辑思想的实现过程。公司招聘的数据分析师大部分只需要他们能够承担某一个或某几个步骤的工作任务,并不需要他们了解整个数据分析的逻辑思想。这就和打仗一样,高级作战指挥员负责整个战略思想制定,而低级指挥员和战士负责实施和实现战略思想。不想当将军的士兵不是好士兵,大部分有志于学习数据分析,并成为数据分析师的人都不愿意自己只负责数据分析逻辑思想实现,而低级数据分析师和高级数据分析师的重大区别就在于数据统计分析理论基础知识的掌握。低级数据分析师和高级数据分析师的区别存在,在互联网时代并不是第一次出现,程序员就是一个很好的例子。低级别的程序员被称为码农,只需要负责整个软件代码框架的一部分,每天的工作就是夜以继日的写代码,实现领导者的意图,现在还面临着人工智能机器人对他们饭碗的威胁。
任何只需要重复操作而不需要过多思考的工作都不会长久,无论是在传统行业还是互联网行业。媒体大肆鼓吹的“大数据”时代来临,催生了数据分析师岗位的火热,很多在校大学生、其它行业的从业者,甚至程序员都想成为数据分析师,而他们行动的第一步就是学习数据统计分析软件的操作,然后再零敲碎打的学习一些数据分析方法理论就上岗了。草堂君在与一些数据分析师的交流过程中发现,他们普遍醉心于软件操作技术和可视化技术的学习,而对于统计理论基础知识的系统学习却没有什么热情。面对简单的数据分析情况,他们游刃有余,但是一旦数据分析局面复杂,需要更高层次的分析逻辑思想和视野格局时,就会手足无措,胡乱使用数据分析方法,无法解释分析结果的情况经常出现。
草堂君一直认为,统计理论基础是数据分析的基础,各种分析软件的操作应用是重要的实现手段,它们是内功和武功招式的关系,相辅相成。最佳的学习方式,应该是在学习数据分析统计理论基础的同时,掌握几种重要的数据分析软件,这样才能形成自己的数据分析逻辑能力和格局视野,并借助分析软件的强大功能实现分析意图。
SPSS生活统计学的寓意就是统计理论基础+分析软件。选择SPSS是因为它可以菜单式操作,上手容易,在学习统计理论的同时,辅以SPSS软件,能够帮助初学者比较快速的建立数据分析逻辑框架并应用于生活和各个行业的工作中,提高思维逻辑能力和生活工作质量。对于专业的数据分析师,Python和R是更加合适的软件,能够用于海量数据的处理并输出漂亮的可视化分析结果,但同样需要建立在统计理论基础之上,这样才能有更好的发展。鉴于上面提到的学习误区,“SPSS生活统计学”的公众号导航栏设置以下内容,包括理论基础、分析软件和咨询服务三部分:
导航页内的文章都是过去推送过的历史文章,文章顺序按照知识的前后承接关系安排,设置了超链接,直接点击文章名称即可阅读,初学者和知识遗忘严重的朋友可以按照导航页里的文章逐篇学习,形成自己的数据分析知识框架。导航页内容会不断更新新推送的文章,大家可以重复获取新的导航页(注意版本号)!初学者可以结合统计基础和SPSS导航页的内容开始学习:
在学习的过程中,遇到学习困难,可以直接在文章下方留言,也可以添加草堂君的联系方式咨询(微信号:possitive),草堂君会及时回复。作为一名统计教育工作者,乐于见到青出于蓝而胜于蓝。如果你需要,可以找我为你量身定制数据分析课程,并进行一对一的课程辅导学习。
最后,寄语学习中的人们:生活就是数据源,人人都应该成为数据分析师,但请不要成为码农式的数据分析师。独立之人格,自由之思想,要敢于怀疑权威,要有自己的思想。