第四,在实现对三个数据库横向衔接匹配的基础上,我们继续对该数据集进行纵向压缩合并,从而最终形成一个符合本文研究需要的企业-国家-年份维度的数据集。一方面,本文根据企业发明专利的跨国引用(后向引用)信息,追溯了其所引用的专利的来源国,从而计算了企业在各年份申请的发明专利中引用各国专利的次数
①
为了尽可能准确地度量与企业创新相关的技术流动和溢出,本文仅使用发明专利的后向引用信息。中国的专利包括发明、实用新型和外观设计三类,其中发明专利的申请门槛和技术含量明显高于后两者(Xie 和Zhang,2015)。
;另一方面,本文根据进口额、进口来源国以及出口额、出口目的国的信息,分别计算了企业在各年份与各进口来源国的进口总额以及与各出口目的国的出口总额
②
当然,为了与专利后向引用的来源国相对应,每个企业的进口来源国和出口目的国仅考虑其所涉及的专利后向引用的来源国,即本文仅关注每个企业与其所涉及的专利后向引用来源国之间的进出口贸易,其中没有进口或出口记录的情形,赋值为0。
。通过这样的纵向压缩合并,我们最终获得了一个包含专利跨国(后向)引用和进出口贸易规模信息的企业-国家-年份维度的数据集。
(二)特征事实
这里,我们基于上一节构建的数据集,做一些基本的统计描述,从而直观呈现企业进出口贸易与专利跨国引用的相关特征。由上所述可知,在我们所构建的数据集中,所有企业都至少拥有一个发明专利。我们根据其进出口行为,将这些企业划分为以下四类。第一类是没有进出口记录的企业,第二类是仅有出口记录的企业,第三类是仅有进口记录的企业,第四类是既进口又出口的企业。表1 列示了这四类企业在样本期内各年份申请的发明专利中引用国外专利的平均次数。如表1 所示,从时间趋势上看,在2000—2013 年,四种类型企业的发明专利中引用国外专利的平均次数都经历了明显增加,这反映出中国企业的发明专利与国外技术的联系越来越密切,研发创新过程中越来越注重追踪和吸收国外相关技术,使得创新质量逐步提高。当然,更重要的是,这四种类型企业之间的表现存在明显差异。我们看到,与国际市场联系最弱的“无贸易”企业的发明专利中引用国外专利的平均次数最少;既进口又出口的企业,参与国际市场的程度最高,其发明专利中引用国外专利的平均次数也是最多的;单向的出口企业和进口企业则居于二者之间,并且进口企业发明专利中引用国外专利的平均次数多于出口企业的该平均次数,这表明进口的学习效应和技术溢出效应比出口更加突出(MacGarvie,2006;Keller,2004,2010)。由此可见,企业进出口行为和参与国际市场的深入程度,与企业研发过程中对国外技术的追踪、学习和吸收密切相关,这直观反映了国际贸易对企业研发创新的技术流动和溢出效应
③
本文还在附录部分报告了企业进出口贸易与专利跨国引用的相关特征在多个维度的企业异质性,以呼应本文后面“进一步讨论”部分关于企业异质性特征的分析。读者可扫描本文首页二维码,获取电子版附录。
。
其中,下标
i
、
c
和
t
分别表示企业、国家和年份。ln
Citations
是本文的被解释变量,表示企业
i
的发明专利中引用
c
国专利的次数(取对数)。ln
Import
和ln
Export
是本文的核心解释变量,分别表示企业
i
对
c
国的进口额和出口额(取对数)。在时间维度上,被解释变量比解释变量滞后两年,即本文考察的是企业
i
在
t
年对
c
国的出口和进口规模对企业
i
在
t
+2 年申请的发明专利中引用
c
国专利的次数。这样的设定考虑了企业进出口行为与技术学习和吸收以及研发创新之间可能存在的现实时滞(Aghion 等,2021)。
λ
i
是企业固定效应,用于吸收和控制不随时间变化的企业特征因素的影响和干扰;
λ
ct
是国家-年份固定效应,用于吸收和控制国家特征差异及其随时间变化的影响;
ε
ict
是随机误差项。
Control
是控制变量。其控制变量包括两类:一类是与被解释变量和核心解释变量同属企业-国家-年份维度的随时间变化的双边变量,另一类是随时间变化的企业特征变量。
其中,
p
ikt
表示企业
i
在
t
年在技术领域
k
的专利申请数量,
p
ckt
表示国家
c
在
t
年在技术领域
k
的专利申请量,
k
是技术领域的数目
①
技术领域
k
按照IPC(International Patent Classification)1 位编码确定,后同。
。
Prox
ict
度量的是企业
i
和国家
c
在专利的技术领域分布上的重叠程度,当企业
i
在各技术领域的专利份额均与
c
国相同时,该指标等于1;当企业
i
的专利所属技术领域与
c
国专利所属技术领域完全不同时,该指标等于0。因此,
Prox
从企业与目标国家在专利技术领域分布的重叠程度方面刻画了二者的技术相似度。
其第一类变量的第二个技术相似度变量为企业所属行业在本国相对于目标国在技术水平上的差异:
其中,
j
表示企业
i
所属的行业,
K
是行业
j
所涵盖的技术领域
k
的数目,
p
ckt
表示国家
c
在
t
年在技术领域
k
的专利申请量,
p
kt
,
CHN
表示本国(即中国)在
t
年在技术领域
k
的专利申请量
①
我们首先计算本国(中国)与目标国
c
在技术领域
k
的技术水平差距(在
t
年):
p
ckt
/
p
kt
,
CHN
;其次,我们计算每个工业行业(4 位分类)
j
中所有企业的发明专利所涉及的全部技术领域的个数,从而得到行业
j
所涵盖的技术领域的数目
K
(因此行业与技术领域的对应关系取决于行业内企业的发明专利所涉及的技术领域);最后,我们计算得到
Tech
i
ct
=
K
p
ckt
p
kt
,
CHN
。
。
Tech
的值越大,表明企业
i
所属的行业
j
在中国的技术水平相对于国家
c
的差距越大。
其第二类控制变量是随时间变化的企业特征变量,具体包括:①企业的技术水平。一方面,本文控制了企业发明专利申请量的对数值(ln
Patent
);另一方面,本文还基于专利被引用(前向引用)次数构建了企业的相对技术水平表达式:
其中
是技术领域
k
在
t
年全部专利的平均被引用次数,
K
是企业
i
的专利申请所涉及的技术领域的数目。由于专利的被引用次数反映的是专利的技术影响力和质量,所以
tech
度量的是企业各领域专利质量相对水平的平均值,刻画了企业的相对技术水平。②企业生产率(ln
Produc
),即企业人(劳)均产出的对数值;③企业规模(ln
Size
),即企业员工人数的对数值;④企业资本密集度(ln
KL
),即企业人(劳)均固定资本的对数值;⑤企业年龄(ln
Age
),样本观测年份与企业成立年份之差的对数值;⑥企业利润(ln
Profit
),企业总利润的对数值。
对此,我们首先计算了
c
国
j
行业在
t
年向除中国以外的所有其他国家和地区的出口额占当年
j
行业全球出口总额的比重,其中行业
j
为中国企业
i
所属的中国工业行业(4 位编码)
②
我们首先利用BACI 数据库计算了国家-产品(HS6 位)-年份维度的出口额(不含来自中国的进口),然后根据Brandt 等(2017)提供的HS 产品编码与中国工业行业编码的转换方法,将国家-产品(HS6 位)-年份维度的出口额转换为国家-行业(中国工业行业4 位分类)-年份维度的出口额。由于中国工业企业数据库中每个企业都有自己所属的行业,这样通过企业所属的行业就可以将行业层面的工具变量与企业层面的核心解释变量衔接起来,实现数据维度上的对应。
。这一指标反映了剔除来自中国需求之后
c
国
j
行业在
t
年的出口供给
是企业
i
在
t
年在技术领域
k
所申请专利的平均被引用次数,潜力;作为对行业层面的外部供给的度量,其一方面外生于中国企业的进口需求,另一方面又必然与中国企业的实际进口行为密切相关,且仅通过影响中国企业的实际进口行为进而影响企业其他方面的表现。因此,贸易伙伴国的出口供给潜力能够较好地满足外生性(exogeneity)、第一阶段相关性(first stage)和排他性(exclusion restriction)三个条件。在此基础上,考虑到解释变量为企业层面,为了使工具变量与解释变量在维度上相一致,以增强工具变量的解释力,我们在上述行业指标的基础上乘以行业内企业在样本期初的进口份额,以进一步刻画行业内部企业之间的差异,从而得到企业层面进口(中国企业
i
从
c
国的进口)的工具变量:
其中,上标-
CHN
是指对除中国以外所有其他国家和地区的出口/进口,
t
0
表示样本期初。这一工具变量与核心解释变量的关联体现在两个递进的层次:首先,处于行业
j
的中国企业
i
从
c
国的进口受到
c
国在
j
行业出口供给潜力的影响;进一步,同一行业
j
内不同企业受影响程度的差异取决于企业进口需求/倾向(占行业进口的份额)的差异,即企业进口倾向/需求越强(占行业进口份额越大),受影响程度越大(工具变量
IV_Import
cit
值越大)。
与之类似,我们计算了
c
国
j
行业在
t
年从除中国以外的所有其他国家和地区的进口额占当年
j
行业全球进口总额的比重,度量
c
国
j
行业在
t
年的进口需求潜力,在此基础上乘以行业内企业在样本期初的出口份额,作为中国企业出口(中国企业
i
对
c
国的出口)的工具变量
①
篇幅所限,本文所涉及变量的描述性统计未在正文中报告,请参见附录。读者可扫描本文首页二维码,获取电子版附录。
:
四、估计结果及分析
(一)基本估计结果
表3 报告了式(1)的基本估计结果。在表3 第(1)列和第(2)列的估计中,我们首先考察了进口对企业专利后向引用的影响,其中第(1)列仅加入进口额变量并控制了企业固定效应和国家×年份固定效应,第(2)列又进一步加入双边控制变量和企业特征变量
②
篇幅所限,控制变量估计结果未报告。
。我们看到,进口对企业专利的后向引用具有显著的正向影响,即在其他条件一定的情况下,企业从一国的进口额越大,其发明专利中引用该国专利的次数也越多。从前两列估计结果的比较来看,控制变量的加入对核心解释变量估计系数的影响不大,这表明进口对企业专利后向引用的影响具有良好的稳健性。在表3 第(3)列和第(4)列中,我们考察了出口对企业专利后向引用的影响。从其估计系数的统计显著性来看,出口对企业专利的后向引用也具有显著的正向影响;然而,从其估计系数的绝对值大小来看,与表3 第(1)列和第(2)列的估计结果相比,出口的正向影响则要明显小于进口的正向影响,前者大约仅为后者的30%。考虑到进口额和出口额两个变量具有较强的可比性,两组估计结果的比较在一定程度上表明,在国际贸易中,进口对企业研发创新的技术流动与溢出效应要显著强于出口对企业研发创新的技术流动与溢出效应。由于进口和出口贸易通常具有较强的相关性,为了进一步清晰准确地识别二者的真实影响,我们在表3 第(5)列和第(6)列的估计中同时加入进口额和出口额变量。我们看到,即便控制了出口的影响,与表3 第(1)列和第(2)列的估计结果相比,进口额的估计结果变化不大,仍然对企业专利的后向引用具有显著的正向影响,并且估计系数的绝对值大小没有发生明显改变。然而,其与第(3)列和第(4)列的估计结果相比,在控制了进口的影响后,出口对企业专利后向引用影响的统计显著性水平降至10%附近,且估计系数的绝对值进一步降至进口影响估计系数的10%。这表明,由于进口和出口两个变量的相关性较强,出口单独加入时表现出的显著影响中实际上混杂了一部分进口的影响。
表3 基本估计结果
注:
***
、
**
、
*
分别表示1%、5%、10%的统计显著性水平,括号内数值为根据企业层面聚类稳健标准误差计算的
P
值(后表同)。
由此可见,表3 第(5)列和第(6)列的估计结果进一步验证了前四列表明的国际贸易对企业研发创新的技术流动与溢出效应主要体现在进口贸易方面,出口的影响相对较弱,这与现有相关文献的实证研究发现是一致的(MacGarvie,2006;Keller,2010)。实际上,这种差异也并不难理解。一方面,从现实情况来看,进口是企业买进其他国家的产品,出口是企业将自己生产的产品销售到国外;相比出口,进口使得企业能够有机会接触和了解国外的产品,因此也就比出口更有机会通过国际贸易了解、学习和吸收贸易伙伴国的知识和技术。实际上,这也是Aghion 等(2021)的研究选择考察企业出口对其专利被当地(出口目的国)引用的次数的影响(而不是反过来考察对出口企业自身主动引用出口目的国专利次数的影响)的原因——伴随国际贸易流动的知识和技术对进口一方的“可见性”(visibility)是更强的,这是非常直观的。另一方面,MacGarvie(2006)基于法国企业发明专利跨国(后向)引用数据的实证研究表明,进口对企业专利的跨国(后向)引用具有显著的正向影响,而出口与企业专利的跨国(后向)引用并未呈现出显著关联。MacGarvie(2006)分析认为,企业在出口中接触外国技术、获取技术溢出的方式,比如研究国际市场竞争对手的产品、与国外客户交流等,可能无法在基于专利跨国(后向)引用的度量中充分体现,这也是出口的影响在计量分析结果上表现得较弱、不够稳健的原因
①
此外,Keller(2010)基于对相关文献的全面综述指出,现有实证研究提供的证据表明进口是技术跨国流动与溢出的一个显著途径,而出口的作用则比较弱。
。