本文提供了阅读和理解计量经济学论文的技巧和心得,涵盖了有效阅读、理解论文内容、区分核心内容与技术细节、对渐近性保持适度的怀疑等方面。同时,文章还介绍了计量经济圈的特征,鼓励积极进取的中青年学者到社群交流探讨。
包括读点别的东西、不要认为必须理解全部内容、不要因为困惑而自责、分散阅读以拓宽视野、直接深入模拟或实证案例、简化问题以清晰理解、不必过分纠结技术细节和对渐近性保持适度的怀疑等。
在阅读论文时,要区分论文的核心内容和技术细节,关注论文的主要贡献,不必强求自己完全理解每一个细节。
计量经济圈是一个热情互助、前沿趋势领先、拥有丰富社科资料和数据的社群,聚集了众多科研牛人和海外名校学者。文章鼓励积极进取的中青年学者到社群交流探讨。
所有计量经济圈方法论
丛的code程序
, 宏微观
数据库和各种软
件都放在社群里.欢迎到计量经济圈社群交流访问
.
How to Read an Econometrics Paper
阅读和理解计量经济学论文无疑是一项颇具挑战性的任务。
许多发表了的论文,包括综述性文章,往往是专业人士为经济学同行所写。对于不熟悉该领域文献的读者来说,要完全理解一篇最新的学术论文,确实需要付出巨大的努力。回想起研究生时期,教授们总是不厌其烦地告诫我们:“一定要多读论文!”然而,当我们尽力遵循这一建议时,常常感到自己像是在面对一堵坚硬的墙。
有效的阅读是一种可以通过实践而习得的技能。学习阅读的途径有两种:一种是不断尝试,期待最佳结果的出现;另一种则是借鉴他人的经验,调整自己的阅读策略。基于此,本文汇集了牛津大学经济系Francis Ditraglia教授多年来积累的高效阅读计量经济学论文的技巧和心得。
在开始阅读之前,我们不妨先自问:这篇论文真的适合我现在阅读吗?尽管White(1980)关于异方差稳健标准误的研究在计量经济学界堪称经典,但并不代表每位学者都必须立刻深入研读。实际上,对于初入学术殿堂的研究生而言,或许暂时跳过这篇论文才是明智之选。那些首次提出新观点或新方法的论文,往往并非是最易于理解的。相比之下,通过一本优秀的教科书来学习新概念,往往更为高效。例如,你可以尝试翻阅White所著的《Asymptotic Theory for Econometricians 》中相关章节,以获得更清晰的理解。
然而,有时出于研究需要或任务要求,我们必须阅读某篇特定的论文。可能是你在博导师门小组中被指派要介绍的论文,或者它与你的研究紧密相关。在这种情况下,我建议你在阅读原文之前,先浏览一些其他资料。或许有一篇较新的研究或综述,已经对相关的概念或方法做了详尽的总结。通过先阅读这些资料,可以为你理解原文打下坚实的基础。
因此,对于那些经常提醒学生“多读论文”的教授们,我想说的是:“读论文固然重要,但在此之前,不妨先读一些相关的辅助材料。”这样,你将能更加深入和高效地吸收论文中的精华。
在阅读学术论文时,我们不必强求自己完全理解每一个细节。初次阅读时,能够把握文章的核心思想和主要贡献就已经足够了。事实上,即便是自己撰写的论文,我也不会逐字逐句地细读每一篇文献。如果你被导师指派去介绍一篇论文,也并不意味着你必须深入研究其在线技术附录中的每一个引理。
重要的是,我们要学会抓住论文的精髓。阅读论文的过程,其实就像生活中的其他事情一样,存在着投入与收益的递减规律。当你在为自己的研究寻找支持时,更应注重选择性阅读。关键的问题应该是:“这篇论文与我的研究有何关联?”可能你只需要理解论文的一小部分,就能够获取你所需的信息。
当你在阅读论文时遇到困惑,不必自责或怀疑自己的理解能力。正视这种困惑,并尝试在不预设立场或自我贬低的情况下探究其原因。要记住,学习的过程往往是从困惑开始的,而通过解决这些困惑,我们才能实现知识的增长和个人的成长。
你的疑惑可能来自于作者对某些基础知识的默认假设,而这些知识对你来说可能还比较生疏。作为该领域的资深专家,作者可能已经在某个特定问题上进行了多年的深入研究,而你可能才刚刚开始接触这个领域。随着你逐步积累相关的背景知识,许多原本模糊的问题会逐渐变得清晰起来(关于如何积累这些知识,下文会有更详细的建议)。
此外,论文的写作质量本身也可能是造成你困惑的一个原因。技术性写作本身就是一项充满挑战的任务,而学术论文的撰写更是复杂重重。审稿过程有时可能会使论文的表述变得更加难懂,因为在现行的研究评估体系中,涉及多轮的修订revise,作者往往需要在满足不同审稿人的意见之间找到平衡点。这可能导致最终发表的论文中掺杂了许多偏离主要信息的"杂质"。
此外,我们也不能排除论文本身存在错误的可能性。作为一个理性的学者,我们不应该急于下结论,认为自己作为该领域的新人就能轻易发现别人忽略的关键性错误。但同时,我们也不能盲目地相信所有那些论文上印刷出来的文字。事实上,所有的论文都可能在不同程度上存在错误,而有些错误可能非常严重,甚至影响到论文的核心结论。如果你在阅读中感到困惑,不妨深思一下,是否作者在撰写过程中也遇到了同样的困惑。
假如确实需要深入理解关于主题Y的论文X,而你已经读过相关的教科书和综述文章,却仍然觉得难以把握。这时,一个看似奇怪但有效的方法是,
以一种非常浅显的方式去阅读更多关于主题Y的论文
。快速浏览摘要、引言和结论,留意那些反复出现的术语或概念,尤其是那些你尚不熟悉的。
我经历过多次这样的情境:在浏览了九篇论文后,我似乎一无所获,但在第十篇论文中,一切突然变得清晰起来。这其中的秘诀在于积累的上下文知识。作为主题Y的初学者,你可能会遇到许多之前未曾注意到的小细节,而这些细节在文献中往往被视为理所当然。大多数论文都是专家为专家所写,关键的细节常常被省略或轻描淡写,仿佛它们是不言自明的。就像鱼儿在水中游弋而不自知,专家们也常常没有意识到他们所认为的常识。阅读多篇论文的意义在于,不同的专家可能会忽略不同的细节。而理解论文X所需的关键点,可能恰恰出现在论文Z中,那一句看似不起眼的话!
理解某个概念的最佳途径之一是尝试将其解释给他人听,哪怕这个“他人”只是你想象中的听众。在阅读论文时,试着用自己的语言复述文章的核心观点。我发现,将关键思想以摘要的形式写在论文的空白处,使用较少的专业术语和更简洁的符号,对我自己非常有帮助。当你遇到难以理解的地方时,试着将你的困惑用语言表达出来,并将其具体化、记录下来。
与真实的人进行交流可以带来更大的帮助。如果你身处一个师门阅读小组,试着与那些也阅读过同一篇论文的伙伴进行非正式的讨论。你可能会惊讶地发现,即使双方都不完全理解论文,也能从彼此那里学到很多。在这个由大型语言模型(LLM)如Claude和GPT主导的新时代,你甚至可以尝试上传论文并与其进行讨论。虽然我们不能期待AI总能提供关于论文的准确信息,但它可以像一个理解部分内容的同伴一样,成为你想法和困惑的有效反馈工具。注意AI在理解过程中可能出现的错误,指出这些错误并继续对话,这也是一种澄清你自己思路的好方法。
理想情况下,每篇论文都应以一篇引人入胜的引言开篇,明确地介绍论文的研究主题及其重要性。然而,在现实中,引言部分的质量参差不齐,有时可能并不总能提供清晰的指导。因此,在阅读完引言之后,你不妨直接跳转到论文的模拟研究或实证示例部分。这些部分通常会展示计量经济学论文中提出的解决特定问题的方法。
首先,识别论文试图解决的问题是什么。在模拟研究中,数据生成过程(DGP)是如何构建的,它又是如何反映这个问题的?在实证示例中,使用的真实数据又是如何揭示这个问题的?进一步地,哪些参数在模拟DGP中起到了关键作用,它们是如何影响问题严重程度的?接下来,了解论文中提出的新方法相较于“旧”方法——那些你可能在教科书中已经熟悉的方法——做出了哪些改进。新方法的具体实施步骤是什么?它是如何应用于真实或模拟数据,并从中得出结果的?尝试详细记录下这些步骤,直到你能够理解并可能自己编写代码来实现这一方法。
当这些问题得到解答后,你对论文的理解将更加深刻,进而能够更透彻地领会论文的其他部分。在阅读论文中的假设和定理时,不妨再次回顾模拟研究的相关内容。思考一下,为什么数据生成过程(DGP)需要满足这些假设?你是否能够设想一个不同的DGP场景,其中这些假设不再成立?在模拟示例中,是否存在某些令人质疑的地方?作者是否可能在某些方面进行了简化处理,例如引入了一个特别“温和”的问题版本,或是一些在现实世界中不太实际的因素?提出并回答这些问题,将有助于你评估论文的有效性,理解其潜在的局限性,并激发你对如何改进这些研究的思考。
许多计量经济学论文倾向于以极高的普遍性来展示其研究成果。这种普遍性确实有其优势所在,因为数学之美很大程度上在于其抽象能力,而抽象得出的普遍性结果可以广泛应用于多种场景。然而,在表达上,过度追求普遍性有时会让读者感到难以理解。毕竟,数学的发展史本质上是解决一系列具体问题的历史,这些问题在解决后逐渐被抽象化和推广。这种从具体到抽象的过程,反映了大多数人最为自然和有效的学习路径。我们通常先从具体的实例入手,逐步理解其背后的原理,然后再将这些原理应用到更广泛的情境中。
基于这一点,
我们可以尝试将论文中的定理和例子简化。
去除一些协变量通常可以降低代数表达和符号的复杂度,这可以作为简化的起点。试着用这种简化后的符号重新表述假设和定理。如果某些假设让你感到困惑,不妨尝试强化它们,或者寻找一个能够满足这些假设的具体例子,这个例子可能来源于模拟的数据生成过程(DGP)。
在阅读论文时,区分“核心内容”与“技术细节”是理解文章的关键。在心中明确这两者的界限,有助于我们更高效地把握论文的主旨。一种有效的方法是,在深入理解假设、引理和定理之前,先构建一个依赖关系图。通过这种方式,你可能会意识到,例如,命题3仅仅是为了建立一个合适的中心极限定理,而假设2至6的存在仅仅是为了证明命题3。在这种情况下,你可以直接接受命题3的结论,然后继续关注那些在核心结果中依赖于它的部分。即使在阅读假设、引理、命题、定理及其证明时,也应该以把握“大局”为目标,而不是试图吸收每一个细节。
渐近性在计量经济学中扮演着重要的角色,但我们应始终牢记,真正关注的是有限样本下的性质。所谓的“渐近分布”仅是一个理论上的构想,并非可以直接应用于实际的解决方案。渐近性的论证本质上是一种近似手段,它通常假设某些因素可以被忽略不计。这种近似有时可能非常精准,有时却可能相当粗糙。只有通过模拟研究,我们才能真正评估这种近似的有效性。正如van der Vaart(1998)所指出的:
"严格来说,目前大多数渐近结果在逻辑上是无用的。这是因为它们大多是极限结果,而非由近似公式和精确误差界限组成的近似结果……这就是为什么存在好的渐近性和坏的渐近性,以及为什么两者有时会导致相互矛盾的结论……由于在理论上很难确定近似误差的大小,人们经常依赖于模拟研究来评估这一点。"
Source:
https://www.econometrics.blog/post/how-to-read-an-econometrics-paper/
*可以进一步到社群交流讨论。
DID新进展,参考1.
连续型DID也要被改造! 现成的平行趋势PT和TWFE估计都有问题, 时隔3年再次出发!
2.
审稿人: 就这么点样本做DID, 还异质性稳健DID呢, 麻烦看最新文献再说吧!!
3.
不炒冷饭! 2024年最新“2”份DID使用检查清单, 前沿DID使用基本规范指南
!
4.
7种! 一张图里画出7种异质性稳健DID的平行趋势与动态效应的完整code和示例
,5.
最新: 2024版异质性稳健DID最全指南! 更新太快脑袋跟不上看这里!
6.
只有4期数据, 为啥平行趋势检验时有6期呢? DID与连续变量交互系数如何解释?
7.
各种异质性稳健DID方法的特点和优点分别是什么? 为你选择某种估计方法提供客观依据!
关于多期DID或交叠DID: 1.
DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides
,2.
交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误
,3.
典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了!
4.
最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!
5.
多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习
,6.
多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等
,7.
交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南!
8.
系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码!
9.
标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程
,10.
DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题
,
Econometrics Circle