注:本文所有讨论均基于美股。
本文内容来自于:
Soto, Paul E. (2025). “Research in Commotion: Measuring AI Research and Development through Conference Call Transcripts,” Finance and Economics Discussion Series 2025-011. Washington: Board of Governors of the Federal Reserve System, https://doi.org/10.17016/FEDS.2025.011 .
文章的核心思路是,通过提取和分析美股的电话会议记录的内容,并将其与
AI
学术研究语料库来计算相关性,构建
AIR
(
AI R&D
)指数,从而更高频的量化上市公司在人工智能上的研发支出。然后评估公司与
AI
相关的讨论如何与关键公司特征(如市场估值、生产率和资本开支)保持一致。
文章发现,
AIR
指数较高的公司在
Tobin's Q
(无形资产市场估值的代表)中显著增加,但是对
Tobin's Q
的影响是短暂的
—
持续不超过两年,凸显了市场对
AI
相关讨论的即时但短暂的反应。
另外,文章也在电话会议后立即评估了
AIR
指数对累积异常回报
(
CAR
)
的影响。使用五因素
Fama-French
模型(
Fama and French, 2015
),文章发现
AIR
指数增加一个标准差会导致
1
天
CAR
上涨
24
个基点。这种影响会持续较短的时间(
3
天和
30
天),但在接近
60
天和
90
天后会消散,这与托宾
Q
的影响一致,即投资者对人工智能研发讨论的反应是短期的。
另外,文章发现,
AIR
指数与资本开支的较高增长有关
—
持续大约一年,然后逐渐减少。然而,估值的提高和更大的人工智能驱动的投资并没有转化为劳动生产率(文中的劳动生产率是指员工的人均销售额)的显著提高,也没有观察到企业劳动力的变化。这种滞后与
J
曲线效应一致(
Brynjolffson et al 2021; Brynjolffson and McElheran 2016
),即技术投资的好处只有在组织适应和整合一段时间后才会显现出来。
分行业看,计算机和电子制造以及教育服务等高科技行业的
AIR
指数显著上升。
具体而言:
首先,文章记录了计算机科学和人工智能研究中的动态主题。图
1
展示了一系列单词云,这些单词云可视化了人工智能研究摘要中不断变化的焦点。像“参数”、“效率”和“测量”这样的词在
2010
年代初很突出,反映了研究主要集中在优化传统机器学习模型上的时期。
然而,在
2014
年,
“
架构
”
这个词开始浮出水面,标志着向神经网络等更复杂模型转变的开始。到
2017
年,
“
深度学习
”
主导了该领域的摘要,标志着研究兴趣决定性地转向可扩展的数据密集型模型的时期。这一变化中一个特别值得注意的里程碑是
2017
年出版的《注意力就是你需要的一切》,介绍了转换器架构。这项工作现在被认为是大型语言模型(
LLM
)的关键先驱,重新定义了模型处理庞大而复杂数据集的方式,为当今最先进的人工智能工具铺平了道路。
随着
“
转换器
”
、
“
基准
”
、
“
扩散
”
和
“
生成
”
等术语成为人工智能论文的焦点,这种演变在
2022
年进一步加速。这种词汇的转变反映了生成人工智能的重要性日益上升,以及使用标准化基准来评估大型模型。在
ChatGPT
发布的第二年,
2023
年,
“LLM”
和
“ChatGPT”
成为最常见的术语,说明了对话式人工智能和大型语言模型对研究领域的重大影响。
图
4
显示了
AIR
指数对
Tobin's Q
影响的时间变化,横轴代表时间范围
H
,每个点对应于估计系数,该系数来自于
y
年
AIR
指数
y+H
处
Tobin's Q
同比增长的回归,控制了公司规模、
AI
流行语频率、公司固定效应和
4
位
NAICS
行业年度固定效应。在
AI R&D
讨论开始的财政年度之前,
AIR
指数和
Tobin's Q
之间没有显著关系,这反映在
H
的系数等于
-3
、
-2
和
-1
的不重要性上。
这一发现表明,
AI
相关的市场反应不是由讨论之前预先存在的公司趋势或市场预期驱动的。空气指数的影响在首次引入人工智能
R&D
讨论的财政年度(即
(H=0)
)开始显现,对托宾的
Q
产生了积极和统计上显著的影响。这种影响在
(H=1)
仍然是积极和显著的,尽管幅度略有下降,这表明最初的市场热情延续到次年,但开始下降。
在这个短期范围之外,人工智能
R&D
讨论对托宾
Q
的影响会减弱,在未来时间范围内变得统计上微不足道。这张图表暗示了市场反应的暂时性,强调尽管人工智能
R&D
可能会立即产生积极的预期,但这些影响是短暂的。
研究
AI
研发讨论是否以更高的频率影响估值。虽然托宾的
Q
捕捉了长期估值变化,但累积异常回报(
CAR
)显示了市场在财报电话会议后立即做出的反应。文章使用五因素
Fama-French
模型来估计预测回报,在
1
天、
3
天、
30
天、
60
天和
90
天的范围内计算
CAR
。表
4
显示,
AIR
指数的均方差增长导致
1
天
CAR
增长
24
个基点(第
1
栏),表明立即出现积极的市场反应。
从长远来看,
AIR
指数的影响会减弱。虽然在
3
天和
30
天的资本回报率窗口上意义重大,但这种关联会消失,在
60
天和
90
天(第
4-7
栏)变得微不足道。这表明,市场对人工智能
R&D
讨论的反应是暂时的,集中在短期内。这些发现与托宾
Q
的增加一致。总的来说,结果突出了人工智能
R&D
讨论在塑造投资者预期方面的作用,对异常回报产生了有意义但有时间限制的影响。
鉴于研发通常与大量投资相关联,在图
5
中,文章分析了季度数据,以评估人工智能研发的增长转化为资本投资的速度。结果显示,在
AIR
指数增长的前六个季度,资本支出没有显著影响。然而,在人工智能研发讨论急剧上升后仅一个季度开始,资本支出同比增长就跳升了
1%
,这一趋势持续了大约四个季度,然后在第五季度减弱并变得微不足道。这一模式与重大技术进步后观察到的资本深化一致,因为企业增加了固定投资支出以利用新技术的潜力。它还强调了人工智能驱动的投资的周期性,记录了公司投资增长持续大约一年,因为它们将新兴的人工智能应用程序投入运营并将其整合到公司运营中。