基本面量化系列之二:挖掘分析师数据中的alpha
证券分析师是资本市场的重要参与者,能够帮助投资者更深入地理解公司价值,提升市场效率。同时,分析师数据中也包含非理性的噪声。如何发现并剥离分析师的理性与非理性,或许是挖掘alpha因子的关键。本文基于分析师一致预期数据,构造了分析师异常覆盖、评级和盈利修正三个因子,合成得到的分析师综合因子具有较好的选股效果。
点击小程序查看研报原文
分析师异常覆盖度越高,股票预期收益越高
分析师覆盖股票的决策,一方面预示着股票投资价值较高,另一方面可能受市值、近期收益、换手率、机构持仓等其他因素干扰。剔除这些干扰因素后,仍受到分析师较高关注度的股票,未来超额收益或更高。本文以研报、作者和机构数量作为分析师关注度的代理变量,通过回归取残差构造分析师异常覆盖因子。在2011/1/31~2024/11/29的回测期内,分析师异常覆盖因子月度RankIC均值为2.34%,分10层TOP组合年化超额收益率为6.59%。
分析师捕捉市场异象能力越强,评级信息越有效
Jegadeesh等人(2002)研究发现,大部分分析师倾向于推荐近期上涨和估值较高的股票,而无法充分运用市场异象的信号。根据过往推荐数据,筛选出具有异象捕捉能力的分析师,这些分析师的推荐评级信息或许会更有效。本文以小市值、反转、低估值、高ROE作为异象代理指标,基于分析师评级分数与异象信号的相关性,筛选出排名靠前的分析师,并构建改进的评级因子。相比于普通评级因子,改进评级因子在回测期内月度RankIC均值从1.85%提高到2.26%,分10层TOP组合年化超额收益率从3.60%提升至5.17%。
高创新性并剔除动量的盈利修正,股价漂移现象更显著
由于信息不确定性、盈利自相关性、投资者行为偏差等原因,分析师盈利修正后会出现股价漂移效应。市场对盈利修正创新性的反应不足,因此高创新性盈利修正后的股价漂移现象可能更加显著。而前期上涨过多的股票,盈利修正后的价格漂移可能变弱。本文根据分析师盈利修正数据,先构建修正幅度和上调占比两个原始因子,接着通过寻找创新性修正、剔除动量两种方式,对因子加以改进。改进并合成后的分析师盈利修正因子月度RankIC均值为3.99%,分10层TOP组合年化超额收益率为9.55%。
分析师综合因子选股效果较好,与AI量价因子相关性低
将异常覆盖、改进评级和盈利修正因子等权合成,得到分析师综合因子。分析师综合因子月度RankIC均值为4.27%,分10层TOP组合年化超额收益率为10.55%,相比单因子有所提升。分析师综合因子与AI量价因子相关性仅为0.03,增量信息丰富。根据AI量价-分析师复合因子构建沪深300、中证500和中证1000增强组合,在2017年初至2024年11月底的回测期内年化超额收益分别为10.64%、15.48%和24.73%,信息比率分别为2.02、2.93和4.44,Calmar比率分别为2.17、2.40和4.87。利用分析师、基本面和AI量价因子,通过层次筛选法构建等权和不等权的主动量化策略,收益弹性更大,相对中证500年化超额收益分别为19.78%和23.99%。
风险提示:根据分析师数据构建的选股策略是历史经验的总结,存在失效的可能。分析师预测与真实数据有偏差。AI量价因子有过拟合风险。
证券分析师与价值发现
证券分析师是资本市场的重要参与者。他们对上市公司开展调研,发布研究报告,提供行业前景分析、公司财务预测和股票评级推荐,从而帮助投资者更深入地理解公司价值,提升市场效率。
学术领域对分析师的研究层出不穷。一方面,不少研究发现,分析师覆盖、评级、盈利修正等信息对股票截面收益具有预测作用。Lee和So(2017)认为分析师异常覆盖与股票回报呈现正相关。Jegadeesh等人(2002)提出分析师评级变化能够稳定地预测未来收益。Gleason和Lee(2003)发现分析师发布盈利修正后,股票价格会出现同向的响应并持续漂移。另一方面,分析师并非完美无缺。Cao等人(2024)指出美国分析师会受到个人主义和集体主义文化的影响,个人主义的分析师倾向于发布更为激进的盈利预测。Jegadeesh等人(2002)总结分析师经常会推荐近期上涨和估值较高的股票。Guo等人(2020)发现分析师推荐股票时无法充分运用市场异象的信号。
对业界投资者而言,分析师预期数据能够弥补财报数据更新频率低的不足,有助于及时调整公司估值,把握投资机会。如何发现并剥离分析师的理性与非理性,或许是挖掘alpha因子的关键。
本篇报告基于朝阳永续分析师一致预期数据,从3个方向展开研究:
(1)更多分析师覆盖的股票,可能预示着股票未来回报更高,但也可能受股票市值大、近期上涨、换手高、机构持仓多等其他因素干扰,剔除这些因素后的异常覆盖因子,选股效果更稳定。
(2)分析师的评级推荐可直接构建选股信号,如果根据过往推荐数据,筛选具有异象捕捉能力的分析师,能够提升评级因子的表现。
(3)分析师盈利修正会引起股价漂移效应,寻找高创新性的盈利修正,并剔除盈利修正前股票动量的影响,可以强化这种效应。
最后,将分析师异常覆盖因子、分析师评级因子、分析师盈利修正因子合成为分析师综合因子,具有较好的选股效果。因子回测表现如下。
分析师异常覆盖因子
分析师覆盖统计
首先统计A股市场中分析师覆盖股票数量和比例随时间的变化情况。每月底,计算过去一个月分析师撰写过研报的股票数量,可以看出在4月、8月和10月等财报密集发布的月份,分析师覆盖股票数量明显更多,具有季节性规律。近年来,随着A股市场股票数量的增长,分析师覆盖股票比例有所回落,每月约有20%~50%的股票得到分析师报告层面的关注。
分析师覆盖中的信息
市场中有大量的股票在交易,精力有限的证券分析师往往难以覆盖所属行业的全部股票,而是有选择地覆盖部分股票。分析师是否覆盖股票的决策,可能预示着股票的前景,原因包括:(1)分析师一般具有更强的专业技能和信息资源整合能力;(2)分析师覆盖股票需要花费很多精力和成本;(3)覆盖股票未来的表现与分析师的市场认可度息息相关。因此分析师有动力去寻找并覆盖预期回报更高的股票。
然而,分析师覆盖股票的决策,可能还受到其他因素的影响。例如,大市值、换手多、近期上涨的股票,也会吸引更多分析师的关注。Lee和So(2017)指出,分析师的覆盖决策,包括预期回报和可观测公司特征两部分,通过回归从分析师覆盖度中剥离市值、换手率、过去收益的影响,得到的残差定义为异常覆盖度。论文在美股开展实证研究,发现原始覆盖度与未来收益无关,而异常覆盖度能够预测未来收益,高异常覆盖度股票比低异常覆盖度股票的平均月收益高0.8%。
因子计算方法
参考论文做法,本篇报告构建了分析师异常覆盖因子,方法如下:
(1)使用朝阳永续分析师数据,每月底统计个股过去3个月覆盖的研报数量、作者数量、机构数量,作为分析师覆盖度的代理变量;
(2)分别以上述三种代理变量为y,以市值、行业、动量、换手率和机构持仓比例为x,回归后取残差作为异常覆盖因子。其中行业为一级行业哑变量,其余自变量均取过去3个月均值。
(3)将异常研报数量、异常作者数量、异常机构数量3个因子等权合成,得到异常覆盖因子。
因子回测
对异常研报数量、异常作者数量、异常机构数量和异常覆盖4个因子进行单因子测试,测试方法如下:
1.股票池:分析师覆盖股票池,剔除ST股票,剔除每个截面期下一交易日停牌、涨停的股票。
2.回测区间:2011/2/1~2024/11/29。
3.调仓周期:月频,不计交易费用。
4.测试方法:IC值分析,因子分10层测试。
测试结果如下所示。无论使用研报、作者或机构数量作为分析师覆盖度的代理指标,构建的异常数量因子均具有正向选股效果,意味着在市值、行业、动量、换手率等因素保持不变的条件下,近期受到分析师关注更多的股票,预期回报更高。相较于作者和机构数量,异常研报数量因子回测表现更好,可能是因为报告数量能够更准确地体现分析师覆盖股票所投入的精力。此外,三个因子合成后的异常覆盖因子,在RankIC均值、TOP组合超额收益和信息比率等指标上有所提升。
因子相关性分析
相关性分析表明,尽管通过回归取残差,异常覆盖因子仍与市值存在负相关。这是因为:按照论文做法,全市场股票都作为回归样本,分析师无覆盖的股票取值为0,回归后残差(即异常覆盖度)与市值不相关;但本文在回测和计算相关性时,仅考虑分析师覆盖股票池,因此这部分股票的异常覆盖度跟市值又出现一定的相关性。我们做了额外测试,如果在分析师覆盖股票池对异常覆盖度因子进一步做行业市值中性化,消除市值暴露,回测表现仍然较好。
分析师评级因子
分析师评级统计
分析师报告中会对股票做出评级推荐,包括买入、增持、中性、减持、卖出、无评级几种类别。统计A股市场中分析师各类评级比例随时间的变化情况,不难看出,买入和增持评级占多数,中性评级较少且逐年下降,减持和卖出评级更少。
分析师与市场异象
分析师评级是否对投资者决策具有显著影响呢?Jegadeesh等人(2002)研究了美股市场的卖方分析师推荐行为,发现分析师倾向于推荐“魅力股”,即强动量、高成长、活跃成交和相对昂贵的股票。论文指出,投资者不能盲目地跟从推荐,只有当股票量化指标有利时(高价值、强动量),分析师推荐才能够提供增量价值。
学术领域有不少针对股票市场异象的研究,对于投资者获取超额收益具有启示作用。分析师能否把握市场异象呢?Engelberg等人(2019)探究了分析师推荐股票的目标价格与美国股票市场125个异象的关系,发现对异象看空的股票,分析师的预测过于乐观。Guo等人(2020)将11个异象指标聚合成2类异象信号(管理层决策和公司业绩),计算分析师历史推荐与异象信号的相关性,从而筛选更有技能(捕捉异象能力更强)的分析师,这些分析师推荐股票的收益往往更高。
因子计算方法
本篇报告首先根据分析师评级数据,构建评级因子,接着参考Guo等人(2020)做法,利用分析师捕捉异象能力,改进评级因子。方法如下:
(1)根据朝阳永续的默认分数(买入、增持、中性、减持、卖出、无评级分别为7、5、3、2、1、0分),将评级类别转换为连续性数据;
(2)每月底统计个股过去3个月所有分析师评级分数的均值,得到普通评级因子;
(3)以小市值、反转、低估值、高ROE作为异象代理指标,每月底统计每位分析师过去3年评级分数与股票异象指标的秩相关系数(剔除评级次数不满3次的样本),选取相关性前50%分析师,认为这些分析师具有异象捕捉能力;
(4)每月底统计个股过去3个月有异象捕捉能力的分析师评级分数的均值,得到改进评级因子。
因子回测
回测结果表明,改进评级因子的RankIC和TOP组合年化超额收益率明显优于普通评级因子,根据股票异象筛选出的分析师,或能够提供更准确的评级信息。
因子相关性分析
相比于普通评级因子,改进因子减少了对动量、市值、成交金额的正向暴露,以及对账面市值比的负向暴露(即对高估值的正向暴露)。
分析师盈利修正因子
分析师盈利预测统计
分析师报告中会对股票净利润等财务指标做出预测,盈利预测相对上期预测的变化(上调、不变或下调)对市场预期具有一定影响。统计A股市场中分析师各类盈利预测比例随时间的变化情况,发现盈利预测的分布较为均衡,最近几年下调占比相对较高。
分析师盈利修正后的价格漂移
跟盈余公告后的价格漂移类似,不少研究发现,分析师发布盈利修正后,股票价格也会呈现漂移现象:盈利预测上调后,股价持续上涨;盈利预测下调后,股价持续下跌。可能的原因包括:(1)信息不确定性;(2)交易成本;(3)盈利自相关性;(4)投资者行为偏差,如有限注意力、过度自信等。
Gleason和Lee(2003)提出,分析师盈利修正后的价格漂移,可能受到修正幅度、修正质量、信息环境、公司特征等多种因素的影响。首先,分析师盈利修正幅度越大,价格漂移现象就越强烈。接着,论文使用两种指标来衡量分析师盈利修正质量——修正创新性和分析师排名。如果分析师现在的盈利预测位于之前的盈利预测与一致预期之间,则属于低创新性修正,如果同时高于或低于之前的盈利预测与一致预期,则为高创新性修正。研究发现,市场对分析师盈利修正创新性的反应不足,高创新性修正会呈现更显著的价格漂移。相反,市场对分析师排名的反应较为强烈,明星分析师发布盈利修正对股价影响或更大,此后的价格漂移减弱。此外,覆盖分析师较多的股票,信息传递更加畅通,价格漂移现象也更弱。最后,动量、市值、市净率等公司特征也会影响预期收益,论文将其作为控制变量,以观察修正事件带来的更纯粹的股价反应。
因子计算方法
本篇报告首先根据分析师盈利修正数据,构建修正幅度、上调占比两个原始因子,接着参考Gleason和Lee(2003)做法,通过寻找创新性修正、剔除动量两种方式,改进盈利修正因子。方法如下:
(1)每月底统计个股过去3个月所有分析师盈利修正幅度的均值,得到普通修正幅度因子;
(2)每月底统计个股过去3个月盈利预测上调的研报数量,除以研报总数,得到普通上调占比因子;
(3)每月底统计个股过去3个月高创新性盈利修正(现在的盈利预测同时高于或低于之前的盈利预测与一致预期)的幅度均值,得到高创新性修正幅度因子;
(4)每月底统计个股过去3个月高创新性盈利上调的研报数量,除以研报总数,得到高创新性上调占比因子;
(5)分别以上述4个因子为y,以过去3个月动量为x,回归后取残差,得到剔除动量后的因子;
(6)将4个剔除动量后的因子等权合成,得到分析师盈利修正因子。
因子回测
修正幅度因子衡量了分析师对股票盈利预期的变化程度。该因子在2021年以前表现非常出色,但随后表现下滑。通过高创新性盈利修正和剔除动量,改进后的修正幅度因子RankIC、TOP组合年化超额收益率等指标明显提升。
上调占比因子刻画了分析师是否一致提高股票未来盈利预期。该因子在2017~2020年间表现较差,其余时间表现较好。改进后的上调占比因子回测表现有所提升。
将多个改进因子合成后的盈利修正因子,在回测期内表现最好,月度RankIC均值3.99%,TOP组合年化超额收益率9.55%。
因子相关性分析
高创新性因子是对原始因子的改进,与原始因子相关性较高。修正幅度和上调占比因子从不同角度刻画分析师盈利预期变化,相关性较低。此外,剔除动量后的因子与动量相关性降低,但不完全为0,可能是因为回归采用3个月动量,而计算相关性采用1个月动量。
分析师综合因子
将前文的分析师异常覆盖因子、改进分析师评级因子、分析师盈利修正因子等权合成,得到分析师综合因子。
因子回测
分析师综合因子的回测表现相比单因子有所提升。
因子相关性分析
分析师异常覆盖、评级、盈利修正因子间相关性较低,合成后的分析师综合因子与常见风险因子的相关性也较低。
选股策略测试
华泰金工前期报告《基于全频段量价特征的选股模型》(2023-12-08)、《如何捕捉长时间序列量价数据的规律》(2024-03-14)、《机器学习模拟投资者分歧》(2024-06-15)中,主要利用全频段量价数据和AI模型训练多个选股因子,按照静态加权合成AI量价因子。
计算发现,分析师综合因子与AI量价因子相关性仅为0.03,说明分析师数据可提供AI量价以外的增量信息。将AI量价因子与分析师综合因子按7:3比例合成,得到AI量价-分析师复合因子,测试指数增强策略。此外,利用分析师综合因子、AI量价因子和基本面因子,通过层次筛选法测试主动量化策略。
沪深300增强
沪深300增强表现较为稳定,截至11月底,今年以来超额6.91%。不过加入分析师因子后的策略表现并无提升。
中证500增强
中证500增强在今年2月份和10月份出现较大的超额回撤,截至11月底,今年以来超额3.97%。加入分析师因子后,超额最大回撤明显减小,今年超额收益有所提高。
中证1000增强
中证1000增强在今年同样经历了两次较大超额回撤,截至11月底,今年以来超额9.56%。分析师因子有助于降低策略回撤和提高今年超额。
主动量化
主动量化选股策略通过层次筛选,寻找分析师看好、基本面优秀、量价趋势有利的股票,具体构建方法如下:
(1)根据分析师综合因子,筛选排名前10%的股票;
(2)进一步根据基本面因子(包括估值、成长、盈利质量),筛选排名靠前的60只股票;
(3)最后根据AI量价因子,筛选排名靠前的20只股票作为策略持仓;
(4)持仓权重考虑等权和不等权两种情形,等权组合中每只股票的权重为5%,不等权组合中AI量价因子得分靠前的10只股票权重乘以2,靠后的10只股票权重乘以0.5,最后进行归一化;
(5)每月初调仓,以vwap价格成交,交易成本双边千分之四。
主动量化组合相对中证500长期超额收益显著,收益弹性比指数增强更大。
总结
证券分析师是资本市场的重要参与者,能够帮助投资者更深入地理解公司价值,提升市场效率。同时,分析师数据中也包含非理性的噪声。如何发现并剥离分析师的理性与非理性,或许是挖掘alpha因子的关键。本文基于分析师一致预期数据,构造了分析师异常覆盖、评级和盈利修正三个因子,合成得到的分析师综合因子具有较好的选股效果。
分析师异常覆盖度越高,股票预期收益越高。分析师覆盖股票的决策,一方面预示着股票投资价值较高,另一方面可能受市值、近期收益、换手率、机构持仓等其他因素干扰。剔除这些干扰因素后,仍受到分析师较高关注度的股票,未来超额收益或更高。本文以研报、作者和机构数量作为分析师关注度的代理变量,通过回归取残差构造分析师异常覆盖因子。在2011/1/31~2024/11/29的回测期内,分析师异常覆盖因子月度RankIC均值为2.34%,分10层TOP组合年化超额收益率为6.59%。
分析师捕捉市场异象能力越强,评级信息越有效。Jegadeesh等人(2002)研究发现,大部分分析师倾向于推荐近期上涨和估值较高的股票,而无法充分运用市场异象的信号。根据过往推荐数据,筛选出具有异象捕捉能力的分析师,这些分析师的推荐评级信息或许会更有效。本文以小市值、反转、低估值、高ROE作为异象代理指标,基于分析师评级分数与异象信号的相关性,筛选出排名靠前的分析师,并构建改进的评级因子。相比于普通评级因子,改进评级因子在回测期内月度RankIC均值从1.85%提高到2.26%,分10层TOP组合年化超额收益率从3.60%提升至5.17%。
高创新性并剔除动量的盈利修正,股价漂移现象更显著。由于信息不确定性、盈利自相关性、投资者行为偏差等原因,分析师盈利修正后会出现股价漂移效应。市场对盈利修正创新性的反应不足,因此高创新性盈利修正后的股价漂移现象可能更加显著。而前期上涨过多的股票,盈利修正后的价格漂移可能变弱。本文根据分析师盈利修正数据,先构建修正幅度和上调占比两个原始因子,接着通过寻找创新性修正、剔除动量两种方式,对因子加以改进。改进并合成后的分析师盈利修正因子月度RankIC均值为3.99%,分10层TOP组合年化超额收益率为9.55%。
分析师综合因子选股效果较好,与AI量价因子相关性低。将异常覆盖、改进评级和盈利修正因子等权合成,得到分析师综合因子。分析师综合因子月度RankIC均值为4.27%,分10层TOP组合年化超额收益率为10.55%,相比单因子有所提升。分析师综合因子与AI量价因子相关性仅为0.03,增量信息丰富。根据AI量价-分析师复合因子构建沪深300、中证500和中证1000增强组合,在2017年初至2024年11月底的回测期内年化超额收益分别为10.64%、15.48%和24.73%,信息比率分别为2.02、2.93和4.44,Calmar比率分别为2.17、2.40和4.87。利用分析师、基本面和AI量价因子,通过层次筛选法构建等权和不等权的主动量化策略,收益弹性更大,相对中证500年化超额收益分别为19.78%和23.99%。
关于分析师预期数据的研究,仍有一些值得尝试的方向:(1)关注分析师个人特征如从业年限、获奖经历,建立更全面的分析师评价体系;(2)将机器学习应用于分析师预期类因子合成;(3)使用大语言模型提取分析师研报中的情感。
风险提示
根据分析师数据构建的选股策略是历史经验的总结,存在失效的可能。分析师预测与真实数据有偏差。AI量价因子涉及的深度学习模型可解释性较弱,有过拟合风险,使用需谨慎。
参考文献
[1] Lee C M C, So E C. Uncovering expected returns: Information in analyst coverage proxies[J]. Journal of financial economics, 2017, 124(2): 331-348.
[2] Jegadeesh N, Kim J, Krische S D, et al. Analyzing the analysts: When do recommendations add value?[J]. The journal of finance, 2004, 59(3): 1083-1124.
[3] Gleason C A, Lee C M C. Analyst forecast revisions and market price discovery[J]. The Accounting Review, 2003, 78(1): 193-225.
[4] Cao Y, Hao R, Yang Y G. National culture and analysts’ forecasting[J]. Review of Accounting Studies, 2024, 29(2): 1147-1191.
[5] Guo L, Li F W, Wei K C J. Security analysts and capital market anomalies[J]. Journal of Financial Economics, 2020, 137(1): 204-230.
[6] Engelberg J, McLean R D, Pontiff J. Analysts and anomalies[J]. Journal of Accounting and Economics, 2020, 69(1): 101249.
研报:《博采众长:分析师预期类因子初探》2024年12月3日
林晓明 分析师 S0570516010001 | BPY421
何康 分析师 S0570520080004 | BRB318
卢炯 联系人 S0570123070272
https://inst.htsc.com/research
访问权限:国内机构客户
https://intl.inst.htsc.com/research
本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。
本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。
本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。
在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。
本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。