专栏名称: 经管之家
经管之家官微,每个经济、管理、金融、统计的学习和从业者,都应该有的帐号。经管之家(论坛),是国内成立十年的大型经济、金融、管理、计量统计社区,十年磨一剑,我们共同的家园!我们提供“经管爱问”答疑微服务,以及相关数据分析及金融培训课程。
目录
相关文章推荐
数据宝  ·  重组预案公布,股价一字涨停 ·  昨天  
经济观察报  ·  A股开盘:三大指数低开,沪指跌0.16%,网 ... ·  昨天  
郎club  ·  一线房价,开始涨了! ·  3 天前  
华尔街见闻  ·  豪车市场剧变,林肯凭什么领航时代? ·  4 天前  
功夫财经  ·  年轻人抢老破小,中年人买法拍房 ·  4 天前  
51好读  ›  专栏  ›  经管之家

【JG系列•NO.006】写给统计学初学者的心得体会|胖胖小龟宝版主

经管之家  · 公众号  · 财经  · 2016-12-23 08:00

正文


统计学有什么用 ?有人给出了一种颇有哲学味道的解释,统计学的作用是“用数据告知什么是最可能的”。事实上也是如此,统计学不仅告诉我们各类分析方法,还改变了我们对这个世界的看法。


本期我们邀请了经管之家论坛「计量经济学与统计软件」版面版主、《从零开始学统计》一书作者胖胖小龟宝为我们分享她学统计学的那些体会、初学者如何学习统计学等话题。本文虽然不长,但看完之后,论坛君觉得困扰多年的疑惑一扫而清,推荐初学者认真阅读。



不知道什么时候,自己已经身处于一个浮躁而又功利的时代。我赞同一句话:“这世界里没有绝对的对与错,只有立场不同”。你尽可拍砖吐槽,但我依旧坚定的赞同这句话——如果你真的学过统计,你会理解!


如果问我:学统计到底对我有何帮助?我想应该是看待这个世界更包容了,置信度的调整也更灵活了。


好了,回到主题,我们还是聊聊统计学那些事。我们从三个疑问词开始:what why how!


WHAT

——什么是统计?


“统计”一词起源于国情调查,最早意为国情学。但随着经济发展,这个词语更多的用来表示对总体的核算和对事物连续关系的计量。比如日常生活中一些工作偏向于总体的核算——对宏观经济数据的披露;而现如今一些职业如Data Scientist则需要统计学的专业背景,且更倾向于事物连续关系的挖掘。两者有一定的共性,归结起来就是统计的定义:对数据进行收集和整理,并在此基础上加以分析和科学决策。


这是文绉绉的字面解释,说说我自己的理解——什么是统计?它不能告诉你真相是什么,但却给你指明一条接近真相的道路!


这条道路走对了,你离真相就越近,但真相到底是什么?这还是留给哲学家思考吧。




你当然可以说我并不想知道真相,所以你也不是必须学统计学;但若是你依旧想要做一回“柯南”,那我想你没有理由不学学统计——这也就引出了第二个词:


WHY

——我们为什么要学统计?


它充斥了你几乎生活中的所有领域?你难道还想拒绝了解它?


刚过的双12,你有没有想过,“万能”的淘宝为何总能在你搜索宝贝的时候顺便推送一些名为“猜你喜欢”的产品,而且这些推送有时还能被你成功加入购物车?


如果你从事的是销售、财务工作,或者你是某项目的策划者,当领导询问你对即将上架的产品,或者要削减某项开支,或者某项目的推广方案的看法时,你该如何回答?


就这两天的雾霾也和统计有关,不信?“雾霾致癌吗?”与此雷同的还有“吸烟是否是引起肺癌的原因?”等各类医学问题。据说当时,费希尔(统计学界的泰斗级人物)极力反对这个观点哟(我当然不会告诉你费希尔最爱抽烟了)!


总而言之,有太多的例子可以说明统计渗透入我们生活的方方面面,但我知道,纵使有千般理由劝说你去掀开它的面纱,但总有一个理由会让你拒绝学习,那就是数学!你不热爱数学,甚至惧怕数学,所以拒绝学习和数字有关的学科。但是,我认为,统计学就是“高冷”数学和深奥哲学的平衡点,如何掌握好这个平衡点,关键在于——


HOW

——如何学习统计学?哦不,应该是说如何巧妙的避开数学这个大怪学好统计学?


客观地说,数学功底好对于学习统计学大有益处,但这并不能保证你一定能够学好统计学。以我个人的经验来看,统计学真正迷人的地方在于统计方法和统计思想。在很多优秀的统计学著作里,通常看不到长篇大论的数学证明,有些甚至放在附录中,正文则更多地阐述数据处理方法的创新,以及建模和算法的创新。


为什么说数学好未必能学好统计学呢?


首先,数学讲究严密的逻辑演绎,而统计学则更多的是归纳推理。比如,通常人们认为,统计结论都应该建立在数据服从正态分布的基础之上,但很多数据仅仅是近似服从。这么宽泛的条件,怎么能得到让人信服的结论?在实际应用中,数据是无法达到完美的理论要求的,适当地放宽和采用近似方法反而更能够接近真相。


其次,市面上种类繁多的统计软件,让那些不擅长数学的人也可以掌握统计学的知识。常用的统计软件有:龙头老大——SAS;后起之秀——R;新手福音——SPSS;擅长面板数据计量分析的Stata/MATLAB;计量入门小能手Eviews;数据挖掘方面也有Clementine、Python等。


如果你不想深入研究,只想利用统计学来解决一些非统计专业领域的难题,那么,大可不必选择高深的软件,拥有菜单操作的SPSS甚至Excel都可以满足你的统计需求。是的,只需轻轻地单击一下,结果自然呈现。但前提是你必须知道结果的含义,也知道如何选择正确的统计方法。


但如果你想要专业一些,那么还是需要学习R、SAS和Python的。R、SAS、Python是目前比较热门的软件,通常金融类企业需要处理海量数据,SAS使用频繁,而且较为权威;R是免费开源的,包含各类程序包,所以现在很多分析公司也会采用R作为主要软件,也有很多编程爱好者喜欢研究R,如果你的工作偏向于数据分析类,那么SAS和R可以任取其一;如果你的工作偏向于数据挖掘方向,那么可以考虑选择Python,它的应用面非常广。


学习统计软件的过程不仅仅是为了简化运算,也不单单是为了建模。而在于在学习这些软件的同时加深了对统计思想的理解。如果有时间,我们可以把数据在各类统计软件里执行一遍,看结果会有何不同;也可以试着用不同的检验方法检验同样的数据,如使用参数检验和非参数检验,再来对比一下结果有何不同。尤其是在进行多元统计分析的时候,如进行聚类分析,不同的数据处理方法会带来完全不同的结果。这类小实验会给统计学习带来很大的乐趣。


聊完工具,我们再看看有什么好的入门书籍可以推荐的——


闲来无事可以看:


1、《从零开始学统计》

2、《女士品茶》

3、《统计陷阱》

4、《漫画统计学入门》

5、《爱上统计学》


正儿八经可以看:


1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社 


据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 


2、《探索性数据分析》中国统计出版社


大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 


3、《应用线性回归》 中国统计出版社 


还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书。


4、《Logistics回归模型——方法与应用》 王济川 郭志刚 高等教育出版社


不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格。


5、《应用多元分析(第二版)》 王学民 上海财经大学出版社 


统计学是一门探索的学科,一百个人做同一个统计研究可能得出一百个结论。但同样的,统计学也带给你更多的提问机会。学好统计学并不难,只要你喜欢问为什么,也喜欢去回答为什么就可以了。