专栏名称: 量化研究方法
以量化之思想认识世界,体会量化之美。
目录
51好读  ›  专栏  ›  量化研究方法

统计也敢戏说?扎心了,老铁!

量化研究方法  · 公众号  ·  · 2017-05-03 22:50

正文

【小编导语】香港中文大学的李连江教授,讲授统计学有十几年历史了。小编曾当面聆听他有关统计学概念的生动比喻和讲解,比如把回归分析比作迷宫开灯,很多困扰多年的统计学疑问一下子就明白了。统计不好学,甚至很枯燥,我想很多人可能和小编有一样的感觉。但是李连江老师有深厚的哲学功底,以哲学的视角切入对统计的理解,做到“知其然,知其所以然”,内化为自身的功力,并通过幽默风趣的方式再讲述出来。这一进一出之间,体现的是不为人知的、日积月累的冥思苦想。当然,李老师自嘲为“戏说统计”,这里的戏,是一种幽默风趣平易近人的风格,是一种“是真佛只说家常话”的修为。据悉,李老师的新书《戏说统计》下半年将在国内出版,小编将逐步介绍这本书的有关内容,以飨诸君。今天推送该书的引言部分。


三十多年前,我在南开读哲学,车铭洲老师在课堂上说,语言哲学的要点,就是无论听到别人说什么,都问一问:你是什么意思?What do you mean? 车老师一贯身体力行,让学生体会到,智慧就是不人云亦云。我发挥一下车老师的思想,提出一个说法:学者当有三问。听讲或读书,当谦虚谨慎地问讲者或作者:你是什么意思?研究问题,当刨根问底问他人和自己:这是怎么回事?写文章,当严肃认真地问自己:我是什么意思?


当老师的,无论是课上还是课上,都应该欢迎学生问:你是什么意思?你究竟是什么意思?不过,我国的学生往往没有这个勇气。结果,有些当老师的就失去了求甚解的刺激,鹦鹉学舌,人云亦云,只要不太离谱,就能安然当南郭先生。前几年,我曾有感而发,写了一篇得罪人的文章,标题是“看不懂,就是译错了”。其实,课堂何尝不是如此?学生听不懂,十有八九是教师没说明白;教师没说明白,十有八九是说不明白;说不明白,十有八九是没想清楚,不真懂,甚至是不懂装懂。我教统计分析十几年了,虽然从来没有不懂装懂,但亲身经历了半懂不懂,似懂非懂。最近几年,有较多的空闲从事“方法论思考”,就是琢磨定量方法究竟是什么样的思维方式,觉得头脑清楚了很多,想通了一些原来半通不通的道理。人老了,难免好为人师。有些道理,专家们出于各种原因不明说,自己耗费心神终于想明白,敝帚自珍之余,也有倾囊相授的热情。大体而言,这就是我戏说统计的缘由。


什么是戏说?我把这束札记统称为“戏说统计”,有两层意思。首先,戏说不是正说,我用尽量轻松的说法解释统计术语,用智力游戏场景介绍计量分析彰显的概率思维逻辑。其次,戏说不是儿戏,我只是强调要以游戏(game)的态度琢磨统计分析,把它当成智力体操,把统计软件和数据库当成电脑游戏。所以,戏说的戏,是类似围棋、桥牌的游戏,不是粉墨登场拿无聊当有趣的戏,更不是以脑残为荣的“抗日神剧”那类戏。


为什么戏说?第一,我不会正说。我是理科生们鄙视的“文科生”,数学不好。在美国读书时,曾选修过一门高等统计课,上了一次课就赶紧撤退,因为根本听不懂教授的公式推导。第二,我好像会戏说。在香港工作期间,我费尽周折,不靠数学也仿佛弄懂了计量分析方法,从敬而远之,到敢用,再到敢教,自己觉得有些旁门左道的心得。第三,有人喜欢我的戏说。近几年,我讲计量分析课,得到不少朋友认可,特别是自认为数学不好的年轻朋友认可。不言而喻,做计量分析,最好是数学好。数学好,相当于腿长千米,翻山越岭如闲庭信步。数学不好,相当于腿长一米,遇到无法一步跨越的沟壑,只能爬下攀上。这些札记,是我在应付泥泞滑坡和陡峭山路时折取的几根木棍。我把它们整理出来,是希望它们对跟我一样力单腿短的人有点用。最后,我觉得有必要戏说。定量方法非常庞杂,贸然闯入,就像没有罗盘走进了原始森林,很容易迷路。统计学、计量方法的书成百上千,但作者几乎都是西装革履,正襟危坐,动辄列出一堆数学公式。对数学不好的读者,这些专家作者最多是表示同情,摊开双手,耸耸肩。最近,终于有了一些用日常语言讲解定量分析的书。不过,在我看来,还是有些“高大上”,有些晦涩。


凭什么戏说?只有专家才有资格戏说自己完全吃透的学问。我不是专家,敢戏说统计,自信心来自作为用户的经验,更来自对专家的信心。关于统计分析的问题,专家提供的答案总是数学公式,跟天书差不多,我看得很吃力。但是,从用户角度看,懂统计分析无非就是理解它背后的思维方式,知道用什么技术分析什么问题,知道怎样正确解释分析结果。在这个意义上,不妨说,能正确应用,就是真懂。譬如,绝大多数人不懂造汽车的技术与原理,但这不妨碍他们是合格的汽车用户。统计分析是高深的学问,只有专家才能追求专家意义上的真懂。统计学家是极其聪明的人,我们需要做的,无非是知道他们为什么要如此这般地分析。我不奢望发现他们的问题,也不指望改进他们的工具。我能做的,就是老老实实地学,谨谨慎慎地用,诚心诚意地讲。一句话,我完全相信专家,他们对,我借光;他们错,我跟着错;他们比我聪明得多,我跟着错并不丢脸。如果我不承认自己仅仅是用户,就得冒充内行,就会罹患假冒者综合症(imposter’s syndrome)。在这个意义上,用户视角是实用主义视角,也是个谦卑的视角。只要承认专家的懂不同于用户的懂,坦承自己是用户,数学背景不够强的人就可以学会统计分析,敢用,甚至敢教。


专家为什么不戏说?我不是专家,但我猜测,他们不戏说,无非两种可能。一,是不为也,非不能也;二,非不为也,是不能也。前者是不屑戏说,后者是不会戏说。不会戏说,只因为他们太聪明,无法体谅普通人的苦衷。有些讲统计的老师,面对学生的提问,不一定是有意的,但偶尔会流露出一个意思:你这么这么笨啊!我很幸运,在求学过程中遇到困难,我的老师总是说,你觉得难,我当时学的时候也觉得难。我觉得,学者要尽到承传的天职,对学生坦诚自己求学的辛苦是本分。此外,琢磨怎样化繁为简,化平淡为有趣,化有趣为智慧,也是教书的乐趣。专家们是天才,体会不到中人之材的苦恼。我是中人之材,戏说是为了帮助比我年轻的中人之材,也是乐趣。


怎样戏说?戏说应该是说戏。演戏难,说戏也不易,也许更难。京剧演员带徒弟,就是说戏,详解一颦一笑,一招一式。围棋高手说戏就是复盘。我不是专家,不能一本正经地说戏,只能用两个替代方法。第一,遇到难懂的术语,我就挖挖翻译的根。我知道问题十有八九是出在翻译上。孔夫子说的好:名不正,言不顺。我先努力正正名。第二,除了正名,我尽量用比喻解说统计概念和技术。举几个例子。讲正态分布,我把它引申为一条人生哲理:平均值与标准差是悬在我们头上的两根鞭子。描绘用统计方法检验假设的思路,解释堂而皇之的“显著”,我用12字概括计量思维方式:大胆假设、小心求证、良心决断。研究者围绕零假设的心路历程,我也用12字概括:欲擒故纵,近似归谬,倒打一耙。讲统计分析中的控制,我强调控制就是排除干扰,苹果与苹果比,桔子跟桔子比。讨论旋转因子,我把它比作让世界三大男高音唱对台戏,各自“吸粉”。比较回归分析,我把最小二乘回归比作量体裁衣,把最大似然估计比作扮演事后诸葛亮。毫无疑问,我这样戏说有庸俗化的嫌疑,好在我已经声明了是戏说,顶多算是科普,不是正说。


学艺靠实践。说戏也好,戏说也罢,只能指出要点,指出难点,领悟在个人,学会靠实践。旅游探险,只听导游的话没用,还是要自己体验。看札记能破除迷信,但学习靠练习,最好的练习就是找个真实可靠的数据库,用做游戏的态度分析它,一方面争取做出自己期待的结果,另一方面努力把结果背后的道理想明白,说清楚。


总而言之,懂统计有两个境界,一是专家的懂;二是用户的懂。从专家角度看,真懂统计的极少;从用户角度看,不需要在专家意义上真懂。不怕了,就是学会了;敢用了,就是学通了;用对了,就是学精了。


差点忘了,李连江老师将在5月13到15日举办的“首届社会科学研究方法高峰论坛”上进行一场题为“用日常语言也能学会统计分析”的主题演讲。有关这次论坛的详情,请点击下方的“阅读原文”。