专栏名称: 量化研究方法
以量化之思想认识世界,体会量化之美。
目录
相关文章推荐
一叶目开  ·  怎么判断你家的孩子有数学天赋? ·  3 天前  
曾奇峰心理工作室  ·  对不起,妈妈帮不上你了 ·  4 天前  
曾奇峰心理工作室  ·  对不起,妈妈帮不上你了 ·  4 天前  
四川大学e教务  ·  关于2024-2025学年秋季学期成绩登录的通知 ·  5 天前  
51好读  ›  专栏  ›  量化研究方法

统计学里的两种“变”:因人而异和日新月异

量化研究方法  · 公众号  ·  · 2017-05-28 23:56

正文

变项,就是专家们不假思索说的“变量”。这里的“变”,英语动词是vary,意思比change宽泛;作为名词的variable,意思是“可变者”、“可变之物”、“可变的东西”、“可变的属性”。汉语的“变量”,若按字面意义译成英语,大致相当于“changeable quantity”甚至“changeable number”。变项,经过量化,记录到数据库中,化身为数字,才适合称为“变量”,即使如此,还是弊大于利。因为“变量”一词容易制造无谓的歧义,本书谈到variable,一律用“变项”。胶柱鼓瑟,大师不屑为之,但咬文嚼字,对初学者最有价值。 


为了说“变”,先说“常”。常项之“常”,英语词是constant,有两种含义,可以指某个人的某个属性恒常不变,比如“江山易改,本性难移”,难移就是不随着时间而变异。这是一种常。“常”还可以指彼此相同,某个属性,人人相同,不因人而异,这也是一种常。比如,研究中国公民对政府的信任,研究对象是中国人,国籍是常项,不因人而异。


“常”有两个意思,变项之“变”,也有两个意思。第一,某个个体的某个属性变动不居、日新月异。古希腊哲学家赫拉克利特说:人不能两次踏入同一条河流。大学二年级,我看到这句话,不懂,心中想,老家的运河,上高中时天天经过,不是一直是同一条河流吗?有位室友比我年长十多岁,他说,哲学家的意思是,你第一次踏进一条河,它是一条河流,等你出来,第二次再踏进去,这个河流已经变了,不是刚才那条河了,所以人不能有两次进入同一条河流。我那时不懂,其实不全怪我。哲学家以河为例,河变化慢,所以他的说法费解。如果他说“人不能两次庆祝十五岁生日”,也许我就懂了。年龄,是日新月异的好例子。每个人,年龄每一秒都在增大。这个大,英语是一个中性词,old,中文分得细,growingold,少年称“长大”,中年称“变老”。极端意义上的日新月异,我们只在极端情况下会关注,比如,发射火箭,体育比赛,计算时间精确到毫秒。在社会科学研究中,测量年龄一般以年为单位。当然,也有例外,比如,我这代人大多能记得一个特殊时间:1976年9月9日0时10分,记录如此精确,含义不言自明。


除了日新月异,变项之“变”还有第二种意义,就是某个属性在不同个体之间因个体而异、因人而异。仍以年龄这个属性为例,社会科学研究,一般是关注年龄不同的人,年龄因人而异,有人50岁,有人20岁。


细分变项之“变”的两种意思,不是咬文嚼字玩游戏,是因为有两类变项。一类变项,既有日新月异之变,也有因人而异之变,例如年龄。另一类变项,只有因人而异之变,至少在日常意义上没有日新月异之变,比如性别。世界上有男有女,男女有别,只是因人而异之变。一个人,此时为男,彼时为女,是异常状况,可以忽略不计。混淆变项之“变”的两种意义,往往制造不小的理解障碍。


变项之“变”有两层意思,变项有两类,这已经够复杂。让“变项”一词的含义更复杂的,是记录变项之变的数据有两种。一种是常见的截面数据或剖面数据,cross-sectionaldata。计量研究的论文,通常用这种数据。所谓截面,就是某个固定时刻,研究者假设能抽刀断水,让永不止息的时间河流在某一刻冻结,截面数据记录的就是诸个体在那一刻的情形。不言而喻,截面数据记录的都是因人而异的变,不是日新月异的变。除了截面数据,还有一种数据,是历时数据或跨时间数据(longitudinaldata)。顾名思义,历时数据,就是在连续几个时间点上采集的截面数据。这样的数据,既记录某个时刻因人而异的变,还记录同一个人的某些属性(例如年龄)因时而异的变。不知道什么原因,很多学者把历时数据称为“面板数据”(paneldata),这不是直译,也不是意译,是典型的怪译。这里的panel,指的是一组受关注的个体或个人。研究者在一段时间中,跟踪他(它)们的情况,了解他(它)们在不同时间段的具体情况。panel跟“面板”,风马牛不相及。有人把paneldata译成“平行数据”,更容易误导。或许还是译为“同组个体的跨时段数据”或“同组个体的历时数据”比较清楚明白。


细究变项之“变”,是为了说明一个道理。这个道理不复杂,但很重要,奇怪的是说的人不多。在截面数据中,变项的“变”指个体之间在一个属性上因人而异,不是个体自身的该属性日新月异。不过,我们分析因人而异的变,目的是理解日新月异的变。量化研究是由此及彼,此是因人而异的变,彼是日新月异的变。换言之,研究手段是分析因人而异的变,目的是面对日新月异之变的时候有个参考,甚至是影响有关日新月异情形的决策。分析一个截面,目的是为了理解连续。分析时间的片段,目的是理解时间的连续过程。再换个说法,我们分析的变异是诸多个体的某些属性“因人而异”(varying acrosscases),这变异能直接观察;我们关心的,是某个特定个体的“日新月异”,这个变异,往往无法直接观察。在第五章,我们会看到,这个变异,是过去的可能性,即个体的某个属性“现在本可不如此”(it couldbe different)、“过去本可不如彼”(it could have been different),“假如彼时不如此,那么此时不如此”(shouldit be different, then it would be different)。量化研究或统计分析,世界观与认识论的基础是:“已经发生的,并非必然发生”;“没有发生的,并非不可能发生”。量化研究或统计分析的实践意义是:“未来发生什么,可能在多大程度上取决于下面哪些要素的哪些变异”。“少壮多努力,老大少伤悲”,可能是我们分析截面数据得出的结论,是既成事实的经验发现。但我们分析截面数据,并不到此终止,因为这个经验发现同时也是人生指南。顺便发挥一句,跨国跨区的比较研究与跨越时间的历史研究,与截面数据与历时数据也相同。跨国比较的世界观与认识论基础和实践目的,都是“他山之石,可以攻玉”;历史研究的世界观与认识论基础和实践目的,都是“通古今之变”。


空谈不如举例。在第五章,我们分析教育程度的因人而异如何影响年薪的因人而异,用的是截面数据,分析的是因人而异的变。我们看到的是不同雇员的教育程度,不同雇员的年薪,看到的是教育程度增加一年,年薪增加3909美元。但是,我们分析的目的,是为了理解在日新月异的意义上教育程度的变化会如何影响年薪的变化。教育程度越高,年薪越高,这个发现对我们的意义是,如果有个年轻人,念到初中毕业想辍学,又想以后挣大钱,又不想自己创业。我们把这个分析结果告诉他,就是个有用的提醒。所以说,分析因人而异的变,落脚点是理解一个人日新月异的变,帮助人看长远,不要只顾眼前。提醒不一定有用,但老年人有提醒年轻人的义务。


人生的重要任务,是通过观察因人而异之变,决定如何面对日新月异之变。这个任务很艰巨。要考虑各方面的条件,否则就很可能犯邯郸学步的错误。比如,姚明到了NBA,成就很大,成了有国际影响的篮球巨星,但他也付出了很大的代价,因为伤病提前退休,而伤病的重要原因是教练要求他增加体重。教练的决定有截面数据作基础,就是NBA中锋的体重与篮下控制力成正比。身高相同,体重200斤肯定挤不动300斤的。但是,姚明是华裔,骨架不如黑人运动员结实,增重后容易受伤。他的伤退,是依据截面数据指导日新月异失败的例子。


当然,老年人的提醒,研究的发现,虽然有用,但多数情况下不会发挥作用。听者要么不信,要么不服,要么虽信服但行不出。这其中的原因很复杂,时间的单向性是主要原因。对人生来说,日新月异之变是唯一能直接体会的变,时间是单向的,一去不复返;因人而异之变是唯一能直接观察之变。人生之所以难,之所以有趣,归根结蒂是因为人能意识到这两种变异,还试图打通这两种变异。我们看到种种因人而异的变,自然会想到自己日新月异的变。问题在于,这两者之间,只在很有限的程度上是相通的,而且我们很难准确知道到底在什么程度上、在哪个方面相通。一般来说,越年轻,越容易认为二者完全相通。比如,在司马迁笔下,刘邦和项羽见到秦始皇出游,都从因人而异之变想到了日新月异之变。刘邦说:嗟乎,大丈夫当如是也。项羽说:彼可取而代也。年龄越大,越明白,更准确点说,越相信,因人而异之变与日新月异之变往往极难沟通。所以,随着年龄增长,一个人的价值观可能从“人定胜天”逐渐转移到“听天由命”,从“王侯将相宁有种乎”,逐渐转移到“货比货得扔,人比人得死”。这两套价值观念,貌似水火不容,其实都成立,无所谓对错高低。人生智慧与艺术,就在于在正确时候采纳应用适当的价值观。人生不能没有希望,希望来自相信因人而异与日新月异相通,然而有希望必然有失望,失望来自二者经常并不相通。悔不当初,则悔之晚矣,原因是时间是单向的。所以,叔本华在《哲学小品》中有句无可奈何的感慨:“心愿未了是小恨,悔之莫及乃大苦:前者面对永远开放、不可预见的未来;后者面对业已封闭、永不回头的过去。”


司马迁给自己设的人生目标是:“究天人之际,通古今之变,成一家之言。”高远之极。不过,太史公心中只有大汉,没有外邦,所以他只想通古今之变,无意辨东西之别。变项之“变”,兼具时空两个向度,我们可以对统计分析有更高的期许,就是助我们“通时空之变”,“通纵横之变”,对太史公这样的大历史家而言,就是“通古今中外之变”。


本文部分内容来自李连江老师即将出版的专著《戏说统计》(暂定书名),也来自知深即将上线的订阅课程“戏说统计:用日常语言也能学会量化研究方法”。


小编同时也打听到,今年暑期在青岛有统计建模常用软件Mplus研习营,想了解的小伙伴可以点击“阅读原文”了解详情。