专栏名称: 计量经济圈
记录一个我们生活在其中的时代社会,囊括的主题如下:经济、社会、世界和计量工具。
目录
相关文章推荐
政信三公子  ·  东升西落,政策真牛! ·  2 天前  
政信三公子  ·  东升西落,政策真牛! ·  2 天前  
凤凰网财经  ·  浙江前首富,出山救女 ·  4 天前  
51好读  ›  专栏  ›  计量经济圈

TOP刊: 这工具变量让人**一紧, 竟然用了男性中的职场诱惑婚外情, 关键还证明了其IV的无比合理性!

计量经济圈  · 公众号  · 财经  · 2024-10-02 10:06

正文

凡是搞计量经济的,都关注这个号了
邮箱:[email protected]
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

为了探究父母离婚对孩子长期成长可能带来的影响,本研究(文后有原文出处)选取了父亲工作场所的性别平衡变化作为工具变量,以此作为分析的关键点。具体来说,本研究的工具变量依据的是父亲工作场所中女性员工的比例,尤其是那些年龄与父亲相近的女性,年龄差异控制在8岁以内,这与现实中夫妻之间(包括可能的婚外情夫妇)的普遍年龄差异相吻合。
在本研究中,作者构建了一个与职业和年龄相关的性别平衡指标,用以评估父亲工作场所中与他年龄和职业相近的女性的人数。这个工具变量的选取是恰当的,因为它与父亲离婚的可能性有直接的联系,而从理论上讲,它不会直接影响孩子的其他成长轨迹。研究结果表明,那些在工作中接触到较多女性的父亲的离婚概率更高。这一现象与公司内女性员工的比例及其所在行业的特定特征有着密切的联系。
父母离婚对孩子的长期影响既深远又大多偏向负面,而且这种影响在男孩和女孩身上表现出显著的差异。那些经历了父母离婚的男孩,他们的教育成就往往较低,劳动市场的前景也不乐观,早逝的风险同样较高。而对于那些经历了父母离婚的女孩来说,她们的教育水平同样会受到影响,但更为明显的是,她们在较年轻的时候,尤其是在青少年时期,生育的可能性会有所增加。然而,值得注意的是,这些女孩在就业方面的损失相对较小,这可能是因为她们早早成为母亲,这一身份转变促使她们更早地加入了劳动市场。
简要介绍内容及实证设计,尤其关注工具变量IV构建以及对IV合理性的各种论证逻辑:
父母离婚与孩子多方面的发展结果之间存在着紧密且负面的联系。这种联系具有长期性,表明来自离异家庭的孩子即使在成年之后,也可能持续处于不利地位。与父母未离婚的家庭的孩子相比,这些孩子往往拥有较少的人力资本,并且在生产力方面的表现也不够理想。尽管如此,许多学者也意识到,这种联系背后的因果关系尚未明确,导致父母离婚的某些复杂因素,同样可能对孩子的成长造成不利影响。
为了确定儿童是否因为父母离婚而遭受负面的因果影响,我们必须分析离婚可能性的外生性变化。此外,构建一个有效的经验对照组对于识别儿童受影响的具体路径至关重要。如果将来自稳定健康家庭的儿童发展结果作为参照标准,我们可以合理预期离婚可能会对儿童产生负面影响。然而,一个更具可比性的对照组可能是那些父母关系紧张的家庭。在这种情况下,如果离婚后的家庭环境明显优于在持续冲突的双亲家庭中的成长环境,儿童甚至可能从离婚中获益。
工作场所的性别平衡与离婚可能性之间的关系,与家庭形成和解散的经济模型是一致的。该模型指出,在婚姻成立时,双方存在信息不完全的情况,而在婚姻过程中获取的新信息是决定离婚的重要因素。特别是关于外部选择的新信息,比如婚外情,对离婚决策有着重大影响。性别平衡的工作场所降低了寻找婚外伴侣的难度,为已婚人士提供了接触其他潜在伴侣的机会,从而可能增加了离婚的风险。因此,本研究旨在识别那些因父亲在工作场所遇到新的伴侣而导致家庭破裂的儿童,他们所经历的离婚的因果效应。本文认为,这种研究设计能够评估一个现实且普遍存在的离婚情境,并在研究的内部一致性和外部适用性之间实现了良好的平衡。
现有的研究证据由于缺乏明确的对照情境定义和可信的研究设计,使得其解释力受到限制。
在学术文献的研究中,一些学者尝试着利用家庭成员中兄弟姐妹的离婚年龄差异来开展研究。然而,这种基于兄弟姐妹的固定效应模型估计通常对计量经济学中的模型设计问题,如出生顺序或同代效应,非常敏感。为了应对这一挑战,Bedard和Deschenes在2005年提出了一种创新性的方法,他们选择第一个孩子的性别作为婚姻解体的工具变量。这种方法的创新之处在于,它为研究提供了一个新的视角。而Gonzalez和Viitanen在2018年则采取了另一种策略,他们利用地中海国家离婚法律的变革,研究了在离婚法律实施前后,不同成长背景下的同代人的差异。这种方法通过比较法律变化前后的情况,为理解离婚对儿童影响提供了有力的证据。
本文的识别假设立足于这样一个核心观点:父亲工作场所的性别平衡主要通过影响离婚的可能性来间接影响其子女。虽然这一假设不容易直接验证,但我们通过利用详尽的数据资源,能够在很大程度上缓解相关的顾虑。与McKinnish在2004年和2007年的研究相比,本文的优势在于,不仅能在行业和职业层面上衡量性别平衡,还能进行更为细致的分析。本文通过计算特定年龄和职业群体内企业中女性同事的比例来定义性别平衡的程度。这种特定于工厂、年龄和职业的度量方式(plant-age-occupation specific measure)具有两大优势:一方面,它能反映出与异性同事实际接触的机会;另一方面,它允许我们在分析中控制企业特征,比如利用企业的NACE三位数字代码来包含行业固定效应。这样,就不必假设父亲选择行业归属是完全随机的。
此外,本研究还能够控制企业内女性同事的年龄特定比例(age-specific share of female coworkers within a firm)。这意味着,即便那些选择进入女性主导行业或企业的父亲可能具有一些未被观察到的父母特征,这些特征可能会影响孩子的成长结果,本文的估计结果依然有效。例如,可以推测,那些选择进入女性主导行业或企业的父亲可能会采取不同的育儿方式,这也可能对孩子的成长产生影响。或者,那些有意选择女性主导行业或企业以结识更多潜在伴侣的父亲可能会较少关注家庭,从而在孩子身上的投入也较少。本研究在进行分析时,允许对某些特定行业或企业进行选择,其前提是假设在特定行业内,企业的年龄-职业性别比例是随机分布的。这个假设比较合理:尽管求职者可能对某个企业是否以男性或女性为主有一定的了解,但要提前知道具体的年龄-职业性别比例则可能相当困难。这种假设有助于我们确保研究结果的准确性,因为它排除了求职者个人选择可能带来的偏差。本研究的发现表明,父亲在其年龄和职业群体中的性别比例与一些前定pre-determined的变量(例如母亲的教育水平)以及孩子出生时的健康状况并无关联。此外,由于工具变量的测量是在孩子出生时进行的,因此通常情况下,在父亲加入企业后,会有相当一部分潜在的女性同事随之加入。这一结果进一步证实了我们研究结果的稳健性。
尽管评估模型估计的外部效度通常存在困难,但本文所采用的方法为我们提供了一个广泛适用的边际处理效应视角。本文的估计结果揭示了一种特定情境下离婚的后果:即当父亲在工作中遇到新的伴侣,从而触发离婚的可能性时。本文认为,这种类型的离婚是一种现实存在的情景,并且从理论上讲是可以预防的。这种离婚对孩子的影响可能与其他类型的离婚——比如父母认为彼此不再合适,或家庭中发生暴力行为导致的离婚——有所不同。
本研究的结果显示,由于父亲工作场所中潜在女性伴侣数量较多而导致的父母离婚,对孩子的长期发展产生了负面影响。本文发现,无论男孩还是女孩,在教育成就方面都有明显的下降。离婚对家庭形成行为、劳动力市场和健康结果的影响因性别而异。对于男孩来说,本文发现父母离婚对他们的生育或婚姻行为影响不大,但他们早亡的风险和劳动力市场结果不佳的可能性较高。对于女孩而言,父母离婚显著增加了她们在青少年时期和二十岁出头时怀孕的可能性。在劳动力市场结果方面,本文发现女孩的失业率有所上升。这些发现为我们理解离婚对不同性别儿童影响的差异提供了新的视角。

估计策略

为了深入探讨父母离婚对子女长期发展的影响,本研究将对多个二元结果变量进行评估,并构建以下模型进行估计:
在这个模型中,结果变量覆盖了儿童的教育成就、劳动市场成功、育儿行为、婚姻行为以及25岁之前的死亡率等关键指标。选择25岁作为研究的截止年龄,主要是考虑到数据的可获得性。处理变量是一个二元指示变量,如果父母在孩子未满18岁之前离婚,则该变量的值为1。模型中包括了一系列全面的协变量,涵盖了孩子的个人特征(X_c)、父母的特征(X_p)以及父亲的职业和企业特征(X_f)。
在本研究中,孩子的个人特征是在出生时进行测量的,包括了他们的出生顺序、是否为多胞胎、以及出生时的体重等信息。而父母的特征则涵盖了他们在结婚时的多个匹配维度,这些维度被认为对奥地利的离婚风险有显著影响。在模型中,本文对父亲的年龄、与母亲之间的年龄差距、宗教信仰以及国籍等因素进行了控制。此外,还特别加入了一个二元变量,以识别那些在孩子出生前父母双方在同一企业工作的情况,尽管这种情况在样本中所占比例不大,大约为5%。父亲的就业特征,如职业分类、日薪和工作年限,同样是在孩子出生时进行测量的。而企业的特征,包括企业规模、蓝领工人的比例、特定年龄段的女性员工比例、行业归属(依据215个NACE三位数字代码进行分类)以及地区固定效应,则是在尽可能接近企业成立日期的时间点进行测量的。为了考量长期趋势对研究结果的影响,本文在模型中加入了孩子出生时期的同代趋势(child birth cohort trend)和父母结婚时期的同代趋势(parental marriage cohort trend)。最后,还对孩子们的出生季度进行了控制,以确保季节性因素不会对分析结果产生影响。

4.1 工具变量方法

为了精确地揭示父母离婚与子女长期结果之间的因果联系,本研究以父亲工作场所的性别平衡差异作为工具变量,尤其是在孩子出生时的情况。我们的核心假设是,工作场所潜在伴侣的多寡可能会增加父亲与她们之间互动的机会。鉴于工作场所的实际互动难以直接观察,我们构建了一个量化的性别平衡指标,细化到具体的企业层面。本文提出使用与职业和年龄相关的变量来衡量性别平衡。
在职业分类上,本文区分了蓝领和白领工人。这两类工人因为工作性质的不同——例如体力劳动与办公室工作——通常在各自群体内部互动较为频繁,而较少跨群体互动。此外,由于白领工人普遍教育水平较高,现有的配偶选择模式使得他们与另一类工人成为伴侣的可能性相对较小。年龄也是一个不容忽视的因素,本文定义潜在女性伴侣的年龄范围为父亲年龄上下8岁以内,这一标准与现实中婚姻中常见的年龄差异相一致。
本文的工具变量定义为:在父亲职业组o和年龄范围a内,女性员工人数与该职业和年龄范围内所有员工人数的比例,即:
高的值与更大的性别平衡程度相关联。这一比例不仅反映了与女性劳动力整体规模的对照,也揭示了在这一潜在的匹配市场中,其他男性工人可能作为竞争对手的情况。图1展示了基于孩子性别划分的分布。从图中可以明显看出两个重要的点:首先,女孩和男孩的父亲在分布上没有差异;其次,奥地利的工作场所存在明显的性别隔离现象。换言之,许多父亲在他们所在的年龄-职业单元中几乎没有女性同事这种分布的偏斜部分可以由奥地利众多的小企业来解释,在这些企业中,特定年龄-职业组别拥有女性同事的概率非常小。然而,性别平衡程度的变化依然显著,可以在工具变量第一阶段的估计中得到应用:

我们特别关注参数κ,它显示了如果父亲工作场所的性别平衡程度增加一个单位(即从样本中的最小值0增加到最大值1),父母离婚概率的变化情况。

图1

识别假设

本研究的识别假设基于一个核心观点:父亲工作场所的性别平衡仅通过父母离婚这一途径影响其子女,而与其他潜在的混杂因素无关。然而,存在两个主要的潜在顾虑。首先,有人可能担心某些男性可能会选择那些女性工人比例较高的职业或行业。例如,那些选择在女性主导的工作环境中工作的男性,可能采取不同的育儿方式。或者,那些为了寻找婚外情而策略性选择工作场所的男性,可能会在子女身上的投入较少。第二个顾虑涉及到父亲工作场所性别平衡可能对家庭内部资源分配产生的影响。所谓的“外部威胁点模型”认为,婚姻中的谈判是在离婚可能性的背景下进行的。如果丈夫工作场所的性别平衡程度较高,增加了他们在婚外的预期幸福感,那么在婚姻内的资源分配可能会在丈夫所在年龄-职业单元中女性同事较多时,更加强烈地反映男性的偏好。如果父亲的谈判地位得到加强,导致对子女的投资减少,这可能会对本文的识别策略构成挑战。
为了有效缓解这些担忧,我们在模型中纳入了全面的行业固定效应(涵盖215个不同的类别)以及企业内部按年龄划分的女性同事比例。这样的设计意味着,本文的研究不仅允许对特定行业进行选择,也允许对那些女性员工较多的企业进行选择。此外,本文假设在特定的年龄和职业单元中,女性员工的比例是不受个体选择影响的外生变量。虽然在小企业中这一假设可能不太稳固,但对于外部观察者来说,评估特定年龄和职业单元内的性别平衡是可行的,而在大型企业中则更加难以预测。这一点对于正在考虑在企业内部寻找工作机会的男性以及他们已经就业的配偶同样适用。
为了验证企业规模对工具变量方法可能产生的影响,对样本进行了划分,并重复进行了分析(具体结果参见附录图B.5)。我们发现,丈夫在小企业(员工人数少于100人)和大企业中工作时,家庭所受到的影响是非常相似的。这一发现进一步巩固了本文识别策略的可靠性。

可信性检验plausibility checks

虽然本文的基本识别假设本身无法直接验证,但我们实施了两类可信性检验来支持研究结果。首先,本文检验了工具变量是否与儿童人力资本形成的投入和婚姻特征等关键前置变量相关。我们认为,母亲的教育水平和劳动参与率是预测儿童结果的重要因素。这些变量可能也与许多其他(未观察到的)长期影响儿童结果的因素相关。因此,如果工具变量与这些母亲特征(在孩子出生前测量)相关,我们可能会担心它也与其他潜在的混杂因素相关。本文的数据包括了自1984年以来母亲的教育成就记录,使我们能够检验工具变量与母亲教育之间的关系,这部分样本大约占总数的39%。而关于母亲劳动参与的信息则来源于ASSD,且是在孩子出生的前一年进行测量的。在分析后者结果时,我们使用的是与母亲教育相同的子样本。

表1的A部分展示了本次可信性检验的结果。我们对不同母亲的教育水平进行了性别特定的回归分析,分析中包括了工具变量以及一组基本的协变量。在列(I)和(II)中,因变量是一个有序变量,它代表了五个不同的教育层次。在列(III)和(IV)中,因变量是一个二元变量,用于指示母亲是否拥有大学学位。在所有模型的分析中,本文并未发现母亲的教育水平与工具变量之间有统计学上显著的相关性。这些估计的系数在数值上也微乎其微。在列(V)和(VI)中,因变量是一个二元变量,它表明了母亲在孩子出生前一年是否参与了劳动市场的工作。在列(VII)和(VIII)中,因变量是已就业母亲的日薪水平。本文同样没有发现母亲的劳动市场结果与工具变量之间有任何显著的联系。这些结果进一步增强了对工具变量有效性的信心。

在表1的B部分,本文对各种婚姻特征进行了全面的分析,包括了估计样本中的每一个家庭。本文探究了工具变量是否与父母的结婚年龄相关(参见列I和II)或与父母首次生育的年龄有关(参见列III和IV)。在这两个方面,我们均未发现存在统计学上显著的联系。此外,本文还检验了工具变量与婚后生育子女数量之间的关系(参见列V和VI)。虽然婚后生育子女数量不是婚前就能确定的因素,但符合预期地是,我们同样没有发现任何在经济学或统计学上显著的相关性。最后,在列(VII)和(VIII)中,本文展示了工具变量与婚后首次生育的时间(相对于结婚纪念日的时间)之间也缺乏关联。这些结果进一步证实了工具变量的稳健性。

此外,本研究还考察了工具变量是否与儿童早期的结果相关,这些结果在离婚发生很久之前就已经被测量。我们利用儿童出生时的健康数据,对他们的出生体重和妊娠时长进行了检查。如果儿童出生时的健康状况与本文的工具变量存在相关性,那么这可能会对识别假设的有效性构成疑虑。本研究的数据自1984年起就包括了妊娠时长信息。虽然出生体重的数据可以追溯到更早的时期,但为了确保比较的一致性,我们选择关注所有结果中统一的儿童样本。表1的C部分汇总了关于出生时健康的四个测量指标的性别特定的回归分析。我们并未发现工具变量与儿童出生时的健康状态存在相关性。

Reference: Wolfgang Frimmel, Martin Hallal, Rudolf Winter-Ebmer, 2024. “How does parental divorce affect children’s long-term outcomes?” Journal of Public Economics.
*社群群友可直接前往社群下载全文PDF.
工具变量,参看1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差41.内生性处理的秘密武器-工具变量估计42.工具变量IV必读文章20篇, 因果识别就靠他了43.看完顶级期刊文章后, 整理了内生性处理小册子44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题47.非线性面板模型中内生性解决方案48.内生性处理方法与进展,49.万能cmp程序, 有了他, 建议把其他程序全删掉!50.你的内生性解决方式out, ERM独领风骚51.面板数据是怎样处理内生性的52.计量分析中的内生性问题综述53.一份改变实证研究的内生性处理思维导图54.Top期刊里不同来源内生性处理方法55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法57.二值选择模型内生性检验方法58.2SRI还是2SPS, 内生性问题的二阶段CF法实现59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!66.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!67.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?68.引力模型基础上的工具变量如何构建?69.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!70.JPE上利用地理断点RDD和IV研究中国环境议题的do文件release!71.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!72.天下回归, 无内生性不破, 唯此神文不破, 练就内生性处理的终极大法!73.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!74.2020年博导圈流传最广的一份“几十种内生性处理方法及其要求和局限”的宝典, 并附上代表性重要文献!75.因变量和内生变量是连续,有序和无序多元变量时, 该如何做工具变量估计?76.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!77.华人金融学术女神为运用工具变量估计方法做因果推断的学者提供了如下宝贵建议!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。