很多人入门的童鞋会问:“我想学数据分析,应该选择什么来进行入门呢?”
对于这个问题,从业数据10多年的我,一般都直接建议入门的童鞋选用Python来作为数据分析入门的工具。为什么呢?
目前主流的非编程类平台主要有:stats、SPSS、SAS等,这些工具都已经把相应的分析模块固定在相应的界面,只需要操作鼠标,就可以进行干活了。
而编程类分析平台呢?
目前主要是:Python 和R语言,虽然matlab和SAS也经常需要使用编程来进行分析。但是Python个人觉得比较好,因为它们语言很简单,英文就可以直接读懂,其次它写代码自由性很高,可以自己组装自己的模块。
对于数据分析师而言,经常需要从事:数据库操作、报告撰写、数据可视化、数据挖掘的工作。这些工作不写代码也可以操作,利用Excel进行数据可视化、使用SPSS modeler进行数据挖掘,但如果会写代码,操作的自由度更高,发展的潜力更大。
-
使用Python的话,Python这个生态是很完善的,且开源的软件包也很多,可以通过调用不同的包来完成相应的数据分析工作。
-
使用Python的话,你的分析发展的方向更广、更大,也可以往机器学习和深度学习发展,慢慢成一个数据工程师或者一个数据科学家。
-
使用Python的话,能够将分析过程保存下来,可以追溯分析前前后后的过程,中间过程可追溯。
-
使用Python的话,可以将分析脚本完善,同步给开发,进行流程固化。
-
所以说,为什么要做一个会写代码的数据分析师,主要是行业的延展性及不断深入学习新技术,关键是
能够赚更多的money
。
1、
强逻辑、数理思维
:非常有逻辑性的进行数据分析,例如加载数据>把数据进行处理转化>定位因变量和自变量等,具有非常强的数理思维。
2、
分析自由灵活
:你可以分析过程和结果封装自己弄好的函数,以后分析需要的话,直接调用该函数就可以了,十分灵活。
3、
码农化趋势
:这个是未来的趋势,让自己的分析思路使用计算机进行实现出来,以后写代码来实现就好。
对于Python这个语言,是在1989年圣诞节在阿姆斯特丹诞生的。它的设计哲学是:优雅、明确、简单。也就是坚持一种理念:“用一种方法,最好是只有一种方法来做一件事情。”
Python提供了交互式编程的方式,在进行数据分析时候十分简单。
3、提供大量的开源程序包:各种各样的高手开发大量的好用的包,生态环境比较完善,免费的。
4、容错率高:有一行代码错了,直接修改那行就可以,不需要封装,直接运行就好了。
-
-
-
-
-