中心极限定理(Central limit theorems, CLT)是概率论和统计学中的一个核心定理。在统计学的实践中,中心极限定理无处不在。中心极限定理表明,在一定条件下,若干随机变量的算术平均值的分布可以用正态分布近似。中心极限定理简洁优美且有普遍适用性。它并不需要明确知道参与求和的随机变量的精确分布,而只要满足一些较弱的条件即可。然而和大数定律(Law of large numbers)不同,中心极限定理并不是那么自然。我们很容易理解硬币正面朝上的频率应该逐渐接近于朝上的概率,而不太容易理解为什么即使每个变量是从偏态分布比如指数分布、卡方分布中抽取的,它们的样本均值都会近似服从正态分布。从1733年棣莫弗首次得出了一个特殊版本的中心极限定理到1935年费勒和莱维给出中心极限定理的充要条件,无数伟大的数学家和统计学家做出了巨大的贡献,共同谱写了一场跨越两百年的传奇。
1. 法国数学家的贡献
亚伯拉罕·棣莫弗(Abraham De Moivre,1667—1754)在1733年给出了中心极限定理的雏形。这也是正态分布的第一次出现。他利用由他和詹姆斯·斯特林(James Stirling, 1692-1770)共同发展的现今被称为斯特林公式给出了二项分布的正态近似。他的工作是雅各布·伯努利 (Jacob Bernoulli, 1655-1705)大数定律的进一步发展。尽管大数定律表明频率和概率很接近,但却无法给出均匀硬币在
次抛掷中
次正面朝上的概率的更加精细的刻画。然而棣莫弗仅仅将这一超越时代的成果看作是二项分布的近似,而并没有意识到中心极限定理的普遍存在。
下一个重大的突破是由皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace, 1749-1827)给出的。1812年他发表了重要的《概率分析论》(Théorie Analytique des Probabilités, TAP)一书。他使用由他在1785年引入的特征函数进行了论证。这一证明思路甚至影响到了100年之后的亚历山大·李亚普诺夫(Aleksandr Mikhailovich Lyapunov, 1857-1918)。尽管在1785年拉普拉斯已得出了一些初步的结果,但非常奇怪的是直到近40年后他才得到一个较一般化的中心极限定理。拉普拉斯所得出的中心极限定理是第一个一般化的结果。他的结果可应用于有界的随机变量。
这一时期的研究主要将中心极限定理看作是个工具而不是数学对象本身。在早期,概率论并不被看作是严格的数学理论而更多的是一种常识。到了19世纪后期,很多数学家希望给出中心极限定理更加严格的证明。这其中包括德国数学家约翰·彼得·古斯塔夫·勒热纳·狄利克雷(Johann Peter Gustav Lejeune Dirichlet, 1805-1859), 弗里德里希·威廉·贝塞尔(Friedrich Wilhelm Bessel, 1784-1846)和法国数学家奥古斯丁·路易斯·柯西(Augustin Louis Cauchy, 1789-1857)等。
作为切比雪夫的另一个学生,李亚普诺夫并没有延续切比雪夫和马尔可夫的矩方法,而是回到1810年拉普拉斯所引入的特征函数方法。尽管拉普拉斯给出的证明不够完善,但对于他所考虑的情形,给出完整的证明并不非常困难。因而直到接近100年之后才由李亚普诺夫给出严格的论证显得非常地奇特。而法国的大数学家柯西,约瑟夫·伯特兰德(Joseph Bertrand,1822-1900)和儒勒·昂利·庞加莱(Jules Henri Poincaré,1854—1912)却没能完成这一壮举。在李亚普诺夫条件下,李亚普诺夫论证规范化后的和式的特征函数收敛到标准正态分布的特征函数。和拉普拉斯不同的是,他意识到特征函数和分布函数之间的关联。实际上莱维连续性定理已暗含在他的证明中。由于李亚普诺夫所得中心极限定理结果非常重要,现将其陈述如下: