“实验者无法控制的诸多变动往往遮蔽了所观测到的效应,而本书正是关于如何在这种情况下设计试验的。”您正在阅读的这本书就从这句话开始了。
为什么要设计试验?
因为在这本书出版之前的30年里,统计学家创造了一系列经验、方法和理论,表明通过良好的设计,实验者可以应对这些波动。换句话说,通过良好的规划和适当的分析,实验者可以揭示他们正在研究的效应。这曾经是,现在仍然是,统计学的一个杰出的成功故事,需要告诉每一代实验者和统计学家。
为什么是 D. R. Cox 的书?
首先, Cox 是一位出色的“解经家”。证据存在于他撰写、合著抑或编辑的20多本书及他的许多论文中。此书是他的第一本著作。其次,尽管自1958年以来试验设计取得了许多有价值的发展,但自他写书以来,该领域的关键思想并没有改变。第三, Cox 确实专注于试验的设计规划,而在他之前及之后的大多数其他书籍都更加强调设计的构建以及对设计过的试验的分析。第四,在此类书中,为了让主要读者(即实验者)能够理解书籍内容而很大程度上避免统计和数学技术细节的做法,在过去和现在都很少见。尽管统计学家和数据科学家(见下文)很可能拥有用于设计和分析对比试验的数学和统计知识,但他们越了解并重视实验者所面临的具体问题,就越能更好地履行自己的职责。这是为什么这本书也适合他们的原因。
为什么现在要读一本1958年的书?
了解您所研究的思想及所使用的方法的历史总是有好处的。Cox 的书的写作时间与试验设计的基础性工作的形成时期非常接近,并且它引用了开创性的早期工作,因此您可以体验历史。自 Cox 的书出版以来的近70年里,统计学领域发生了巨大的变化。事实上,在世界上许多地方,统计学基本上已经被数据科学所取代,本书中的大部分内容在本科生和研究生课程中都没有提及。尽管如此,本书讨论的问题对于农业、工业和心理实验以及许多其他领域的实验仍然至关重要。在规划设计阶段进行设计以减少误差( Cox ,第3章),在分析阶段使用补充观测来减少误差( Cox ,第4章),随机化( Cox ,第5章)和析因试验( Cox ,第6章)是长期存在的、却并非显而易见的主题。无论这些素材本身多么光芒万丈,现代数据科学家们都不会轻易重新发现它们。学习现代统计学或数据科学的学生需要了解它们。此书篇幅适中,但内容丰富,需要仔细阅读。这样做将会获益良多。
为什么现在要翻译成中文呢?
首先,我们都应该感谢周教授完成了这本译作。毫无疑问,中国在数据科学,包括大数据和人工智能方面走在最前沿。我不太相信中国的统计学教学通常会涵盖 Cox 的书(例如)前半部分的内容。如上所述,可以清楚地看出,我认为教学内容包含它们是非常可取的。60年前,许宝騄(XuBao-Lu),中国第一位开设概率和统计课程的学者,于1970年去世之前的几年中,在家里举办了关于试验设计的非正式研讨会。他在该领域发表论文时使用笔名“班成”,以包括他自己和他的合作学生。那篇论文(虽然并非特殊的工作)的主题在 Cox 的书的11.4节中进行了讨论。我毫不怀疑许先生会和我一起敦促所有中国统计学家和实验者阅读这份中文译本。
以这本书出版后不久所发表的一条重要的推荐作为收尾。
总而言之,英裔美国统计学家 ColinL. Mallows 1959年在 Biometrika 上对 Cox 这本书的评论中写到,
这是一本关于真实统计学的书……它应该成为所有统计学学生的必读读物。
Terence P. Speed
2024年7月