专栏名称: YND科研绘图
用自己的实践积累打造纯原创3Dmax教程,提供max及渲染器各种版本的下载,从初级教程到高级教程应有尽有,更有细心及专业的问题解答,帮你完成从小白到大神的蜕变!
目录
相关文章推荐
经济参考报  ·  “国君+海通”并购完成进入倒计时;七部门加强 ... ·  23 小时前  
券商中国  ·  利好来袭!外资,突然大举押注! ·  昨天  
参考消息  ·  特朗普预测乌克兰危机结束时间 ·  昨天  
参考消息  ·  自卫队赴乌?日本“透露信号” ·  2 天前  
51好读  ›  专栏  ›  YND科研绘图

Heckman两阶段法深入学习及其操作细节

YND科研绘图  · 公众号  ·  · 2021-01-11 15:18

正文




相信一开始就关注咱们「学术与青椒」的粉丝朋友都了解到,本公号在早期推送中有一篇详细解读如何开展Heckman两阶段法的基本操作和运用的思路推文,这篇推文值得大家去阅读一下(推文导读: 您真的懂得如何运用Heckman模型检验吗? )。因为在日常的实证研究中,该方法得到广泛运用,由此该方法的正确运用也就显得十分重要。今天,我们将在以前推文基础上进一步来拓展Heckman两阶段法的相关运用说明,以进一步阐述Heckman两阶段法在运用过程中所注意的一些问题。

一、实现步骤
实现方法有两种途径:
方法一:操作命令: Heckman 因变量 (dependent variable) 控制变量 (control variables), select (independent variable (即自变量 ,哑变量 0、1) =Z(工具变量其他影响因素)  X(控制变量))  twostep 这种方法成为最大似然估计 (Maxlikelihood Estimation, MLE)。
方法二:先在第一阶段中计算出除逆米尔斯比率IMR,再在第二阶段中将逆米尔斯比率imr作为控制变量,予以考察。基本步骤如下:
步骤1: 通过运用probit模型计算影响所考察变量的哑变量(0-1)的影响因素,
步骤 2: 在上述一步基础上,计算预测:predict w,xb
步骤 3: 再次,计算生成:gen imr=normalden(w)/normal(w)
步骤4: 最后,将所生成的逆米尔斯比率imr引入主要考察模型,并予以控制。
具体案例如下图所示:

二、 Heckman两阶段法 运用中的常用疑问有哪些?

1、 是否需要工具变量呢? 虽然有人在运用该方法时,在第一步没有选择排他性变量,但一般模型的运用是需要一个工具变量问题。因为在前面我们也讲过,如果不加入会存在共线性问题,估计也存在偏误。
2、 怎么去选取第一阶段检验中合适的工具变量呢? 在引入工具变量之前,文章中需要清晰交代工具变量具备的外生属性要求,并阐述工具变量与自变量之间的逻辑关系(预期相关性),为此在工具变量的选择过程中我们需要系统性思维,以契合本文的研究需要。在工具变量选取方法方面,最好以现有文献为主,譬如之前文献常用某变量的行业或者区域均值作为工具变量。最令人信服的表达方式是,在文章选择工具变量的时候,很有必要交代一下选取工具变量的基本逻辑或者所借鉴文献资料。
3、 被第二阶段控制的逆米尔斯比率( IMR )如何通过显著性检验,这是什么意思?我们该如何表述这种统计结论的基本含义? 言外之意,我们有必要阐述其中的统计涵义。在第二阶段分析中, IMR 作为一个控制变量予以控制,如果选择偏误调整项 IMR系数通过显著性检验,这 意味着本模型存在一定的样本自选择问题,这表明本文在考察变量之间因果关系时有必要考虑样本自选择问题,这将进一步提升文章研究结论的稳健性。
4、Heckman二阶段 模型对变量的统计分布有什么特有的要求,尤其是因变量? 毕竟自变量一定得是虚拟变量( 0-1)。 需要注意的是,本疑问主要特指方法一的运用。在方法一中的 Heckman直接命令代码的运用具有明显的局限性,这里的因变量一般要求为“连续性变量”,而当因变量为哑变量(0-1)或其他非连续性变量时,上述方法一的直接运用将存在明显的统计偏误。为此,当在实证研究过程中,遇到因变量为非连续性变量时,方法一不再适用,可借鉴方法二,将Heckman二阶段分析进行拆分。
5、 在第二阶段中,新增加的控制变量逆米尔斯比率( IMR )是否与其他变量存在多重共线性问题呢? 为此,需要注意的是,在第二阶段中,将 IMR放入第二阶段可能会造成多重共线问题,因此需要在回归结果中报告VIFs(Variance Inflaction Factors)。通常认为VIFs值超过10,即存在多重共线问题 (需要说明的是,一般不需要直接披露相关结果,只需要做一个简单的参考,做到自己心中有数就可以了)。
6 、第一阶段的统计结果需要披露吗? 通过阅读现有文献可知,很多文献都基本披露了第一阶段(尤其工具变量检验结果)的分析结果,但是也同时发现也有不少文献并没有披露第一阶段的实证分析结果。但笔者建议,为了提高本文实证研究的严谨性,在正规的实证分析中有必要明确报告第一阶段模型使用了哪些变量,以便清楚地识别排除性约束变量。第二阶段的回归模型中,除排除性约束变量外,需加入第一阶段模型的所有控制变量。
三、样板文献导读

在使用过程中,可以综合借鉴和学习如下文章:

罗党论, 应千伟. 政企关系、官员视察与企业绩效——来自中国制造业上市企业的经验证据[J]. 南开管理评论, 2012, 15(5):74-83.

刘鑫, 薛有志. CEO继任、业绩偏离度和公司研发投入——基于战略变革方向的视角[J]. 南开管理评论, 2015(03):36-49.

沈红波,杨玉龙,潘飞. 民营上市公司的政治关联、证券违规与盈余质量[J]. 金融研究(1):194-206.



(1)文案导读: 您真的懂得如何运用Heckman模型检验吗?



本文为「学术与青椒」的原创文案, 若需要转载,请联系后台。





本公号“ 数据共享 ”栏目中的其他共享数据( 红色为热门数据 ):


(1) 中国科技统计年鉴(1995-)


(2) 中国市级城市地区土地出让面板数据(2005-)


(3) 中国地区工业环境污染面板数据(1989-)


(4) 中国地区绿色金融发展环境指数


(5) 中国各省份地区经济增长目标数据(2000-2018)


(6) 最新的各地区制度环境数据(包括市场化指数、政商关系指数、劳动力市场化指数)


(7) 中国各地区基金会发展指数数据(2013-2019)


(8) 宗教传统文化数据及其度量方法


(9) 上市公司经纬度数据、各地区环境统计年报


(10) 中国地区方言数据


(11) 中国地级市行政审批中心数据


(12) 中国地级市城市年鉴数据(1995-2016)


(13) 中国城市发展环境数据


(14) 央行沟通指数数据


(15) 中国金融统计年鉴数据(1986-2019)


(16) 中国地区绿色金融发展环境指数


(17) 中国地区工业环境污染面板数据


(18) 中国市级地区土地出让面板数据


(19) 中国科技统计年鉴数据








请到「今天看啥」查看全文