本文来自方正证券研究所于2024年3月19日发布的报告《日内协同股票性价比度量与“协同效应”因子构建——多因子选股系列研究之十六》,欲了解具体内容,请阅读报告原文,分析师:曹春晓 S1220522030005。
摘要
在股票交易过程中,当一部分投资者集中买入或卖出某只股票时,由于短时间内的流动性制约,与该股票特征相似的股票通常会受到其他投资者的买入或卖出,因此会出现短时间内同涨同跌或同步放量缩量的股票。
这种情况在受到明显利好消息或利空消息催化时尤为明显。
在这些具有协同走势的股票中,投资者一方面会选择基本面质地更好、弹性更高、辨识度更强的股票,另一方面也会综合考虑当前股价和其他信息,选择更具性价比、更有可能领涨或补涨的股票,因此符合这些条件的股票在后续的行情中有可能获得更高的超额收益。
本文中我们将从分钟频交易数据出发,观察每个交易日内具有协同走势的股票,并从
辨识度
和
性价比
两方面综合考虑,以此来寻找这些协同股票中更有可能在未来获得超额收益的股票,并据此构建了“协同效应”因子。
我们对“协同效应”因子在月度频率上的选股效果进行测试,结果显示
“协同效应”因子
表现较为出色,
Rank IC为-10.76%,Rank
ICIR为-4.09,多空组合年化收益率为36.83%,信息比率为3.00。
此外,在剔除了常用的风格因子影响后,“协同效应”因子仍然具有较好的选股能力,Rank IC均值为-5.02%,Rank ICIR为-2.82,多空组合年化收益率为15.88%,信息比率1.80。
在此前的多因子选股系列研究中,我们分别构建了
“适度冒险”、“完整潮汐”、“勇攀高峰”、“球队硬币”、“云开雾散”、“飞蛾扑火”、“草木皆兵”、“水中行舟”、“花隐林间”、“待著而救”、“多空博弈”
等11个量价因子。我们将“协同效应”因子与上述因子正交化后简单等权合成为综合量价因子,其表现相较于单个因子大幅提升。综合量价因子Rank IC均值为-12.44%,Rank
ICIR为-5.11,多空组合年化收益率为47.27%,信息比4.33,月度胜率87.22%。
风险提示
本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。
在股票交易过程中,当一部分投资者集中买入或卖出某只股票时,由于短时间内的流动性制约,与该股票特征相似的股票通常会受到其他投资者的买入或卖出,因此会出现短时间内同涨同跌或同步放量缩量的股票。
这种情况在受到明显利好消息或利空消息催化时尤为明显,例如
2023
年初
ChatGPT
获得市场广泛关注时,属于光模块、算力、数据要素等同一大类概念的股票在短时间内由于投资者对于通用人工智能的追捧而出现协同行情。
在这些具有协同走势的股票中,投资者一方面会选择基本面质地更好、弹性更高、辨识度更强的股票,另一方面也会综合考虑当前股价和其他信息,选择更具性价比、更有可能领涨或补涨的股票,因此符合这些条件的股票在后续的行情中有可能获得更高的超额收益
。
本文中我们将从分钟频交易数据出发,观察每个交易日内具有协同走势的股票,并从辨识度和性价比两方面综合考虑,以此来寻找这些协同股票中更有可能在未来获得超额收益的股票,并据此构建了“协同效应”因子。
2
“协同效应”因子构建及测试
根据上述逻辑,我们首先需要判断任意两只股票之间是否存在协同走势,然后分别从成交量和收益率两个角度出发来衡量股票在与之协同的股票中的辨识度和性价比,据此我们分别构建了“成交量协同”和“协同价差”两个细分因子。
2.1 “
成交量协同”因子构建
我们首先根据股票日内分钟频收益率数据识别股票之间的协同效应,然后根据股票的成交量刻画股票的辨识度,具体步骤如下:
1)取个股1分钟收益率数据,在每分钟末,计算过去5分钟内(包括当前分钟)高、开、低、收共20个价格数据的均值和标准差,定义当前分钟的价格区间上轨为均值+1倍标准差,区间下轨为均值-1倍标准差。我们将该分钟收盘价和上下轨的相对位置状态(大于上轨、低于下轨、位于上下轨之间)与该股票相同的股票定义为协同效应股票。
2)计算每只股票每分钟的成交量占比,在每分钟末,计算协同股票当前1分钟成交量占比之和作为该股票当前分钟的“协同成交量”。
3)计算个股日内1分钟成交量占比序列与“协同成交量”占比序列之间的相关系数,将其定义为该股票的“日成交量协同” 。我们认为,若股票自身成交量与“协同成交量”间的相关系数越大,说明该股票更能代表协同股票中的成交量变化特征,从而使得该股票在协同股票中的交易辨识度更高,更容易受到投资者的关注。
4)每月月底,分别计算过去20天的“日成交量协同”的均值和标准差,记为“月均成交量协同”因子和“月稳成交量协同”因子,最后再将二者等权合成为“成交量协同”因子。
我们首先在全市场非ST股票中进行测试,同时剔除上市不满半年的次新股,调仓频率为月频,分组数量为10组,各分组内部等权加权,测试区间为2013年1月至2024年2月底(下同),各细分因子及其合成因子表现如下:
从测试结果来看,上述三个因子Rank IC分别为-4.86%、-5.95%、-6.82%,Rank ICIR为-1.75、-3.44、-2.74,多空组合年化收益率为14.82%、19.93%、21.11%,合成因子的选股效果相对较好。
2.2
“协同价差”因子构建
区别于“成交量协同”因子,我们首先使用股票日内的收益率和成交量数据刻画股票之间的协同性,然后使用收益率数据刻画股票的性价比,具体步骤如下:
1)对每只股票,在每分钟末,判断其他股票与该股票最近1分钟收益率符号是否相同、当前1分钟收益率相对前5分钟收益率(不包括当前分钟)的变化符号是否相同、当前1分钟成交量相对前5分钟成交量(不包括当前分钟)的变化的符号是否相同,任意一项相同,均记为其他股票与该股票的1次协同。若最近1分钟收益率、当前1分钟收益率相对前5分钟收益率变化、当前1分钟成交量相对前5分钟的成交量变化为零,则它们的符号根据当前分钟的收盘价相对前5分钟(不包括当前分钟)均价的变化的符号为准,若该符号仍为零,则按照当前分钟的收盘价相对前一日收盘价变化的符号为准。以股票A为例,下表展示了如何计算股票B与股票A的日内协同次数,其中最后一行表示每分钟股票A与股票B的协同次数,然后将日内每分钟的协同次数求和,得到股票A与股票B当天的协同次数。
2)对每只股票,取当天与其协同次数最多的30只股票作为其协同效应股票,将该股票当天收益率减去这30只股票的平均收益率,得到相对协同股票的超额收益率,记为“日协同价差”。
3)每月月底,分别计算过去20天的“日协同价差”因子的均值和标准差,分别记为“月均协同价差”因子和“月稳协同价差”因子,最后再将二者等权合成为“协同价差”因子。其中,“月均协同价差”因子表示过去20日的平均日协同价差,而“月稳协同价差”因子则表示过去20日协同价差的稳定性。
我们认为,“月均协同价差”和“月稳协同价差”可以综合刻画股票相对于协同股票的性价比。“月均”因子值越大,表示该股票相对协同效应股票的短期正向超额收益越高,则股票更有可能出现过度反应,性价比较低。而“月稳”因子值越大,则表示该股票相对协同交易股票的超额收益不稳定,说明投资者分歧程度较大,因此其预期收益率也较低。
从测试结果来看,上述三个因子均为负向因子,与上述逻辑相符。Rank
IC分别为-5.64%、-9.23%、-9.36%,Rank ICIR为-2.39、-3.66、-3.71,多空组合年化收益率为17.21%、25.56%、26.83%,选股效果较好。
我们将上述构造的“成交量协同”因子和“协同价差”因子等权合成,得到“协同效应”因子。我们对“协同效应”因子在月度频率上进行选股效果测试。
从合成因子表现来看,“协同效应”因子
Rank IC
为
-10.76%
,
Rank ICIR
为
-4.09
,多空组合年化收益率为
36.83%
,信息比率为
3.00
,选股效果较为出色。
对比两个细分因子的表现,“协同效应”因子在
Rank IC
、
Rank ICIR
和多空收益上均有提升,说明通过成交量和收益率两个不同角度,能够更加全面地刻画股票相对协同股票的辨识度和性价比。
从十分组表现来看,各分组保持了较为严格的单调性,多头组合年化收益率21.54%,空头组合年化收益率-13.28%,整体区分能力较好。
分年度来看,“协同效应”因子各年份表现均较为显著,大多数年份分组单调性较为明显。2024年1-2月,多空组合相对收益6.93%。
分行业来看,“协同效应”因子在各一级行业内表现普遍较好,大多数行业内Rank IC均值超过-10%。
2.4
剥离其他风格因子影响后“协同效应”因子仍然表现较好
从上述测试结果来看,“协同效应”因子选股能力出色,进一步,我们测试其与其他常见风格因子的相关性,如下图所示,“协同效应”因子与流动性、波动率因子相关性较高,与其余因子相关性相对较低。为进一步验证因子的增量信息,我们使用常用风格因子及行业因子对“协同效应”因子进行正交化处理,得到“纯净协同效应”因子,再检验其选股能力。
可以看到,在剔除了常用的风格因子影响后,“协同效应”因子仍然具有较好的选股能力,Rank IC均值为-5.02%,Rank
ICIR为-2.82,多空组合年化收益率为15.88%,信息比率1.80。在今年初交易类因子普遍大幅回撤阶段,该因子表现依然稳健。
2.5
“协同效应”因子在不同样本空间下的表现
为了检验“协同效应”因子在其他样本空间下的选股表现,我们分别选取了沪深300成分股、中证500成分股、中证1000成分股作为股票池,测试其选股能力。可以看到,“协同效应”因子在沪深300、中证500、中证1000指数成分股内均表现较好,Rank IC均值为-7.11%、-7.42%、-10.25%,多空组合年化收益率为16.02%、17.72%、35.26%,多头组合年化超额收益分别为5.62%、7.29%和9.58%。
2.6
指数增强模型下“协同效应”因子有效性检验
我们进一步通过指增模型来验证“协同效应”因子在沪深300/中证500/中证1000/中证2000指数增强中的效果。这里我们仅通过“协同效应”因子对股票收益进行打分预测,严格控制市值中性、行业中性、个股权重偏离在1%以内,同时约束指数成分股权重之和大于80%。
从组合历史表现来看,“协同效应”因子在沪深300/中证500/中证1000指数增强中均表现较好,年化超额收益分别为7.35%、8.17%、12.26%。
3
高频因子低频化系列因子整体表现出色
3.1
“协同效应”因子与其他量价因子相关性适中
在此前的多因子选股系列研究中,我们分别构建了“适度冒险”、“完整潮汐”、“勇攀高峰”、“球队硬币”、“云开雾散”、“飞蛾扑火”、“草木皆兵”、“水中行舟”、“花隐林间”、“待著而救”、“多空博弈”等11个量价因子,其中除“球队硬币”因子数据源为日频数据外,其余所有因子均根据分钟频数据计算得到,为了降低因子换手率,我们对所有的因子进行了月度频率的平滑处理,即高频因子低频化处理。
1)“适度冒险”
——《成交量激增时刻蕴含的alpha信息——多因子选股系列研究之一》
2)“完整潮汐”
——《个股成交量的潮汐变化及“潮汐”因子构建——多因子选股系列研究之二》
3)“勇攀高峰”
——《个股波动率的变动及“勇攀高峰”因子构建——多因子选股系列研究之三》
4)“球队硬币”
——《个股动量效应的识别及“球队硬币”因子构建——多因子选股系列研究之四》
5)“云开雾散”
——《波动率的波动率与投资者模糊性厌恶——多因子选股系列研究之五》
6)“飞蛾扑火”
——《个股股价跳跃及其对振幅因子的改进——多因子选股系列研究之六》
7)“草木皆兵”
——《显著效应、极端收益扭曲决策权重和“草木皆兵”因子——多因子选股系列研究之八》
8)“水中行舟”
——《个股成交额的市场跟随性与“水中行舟”因子——多因子选股系列研究之九》
9)“花隐林间”
——《推动个股价格变化的因素分解与“花隐林间”因子——多因子选股系列研究之十》
10)“待著而救”
——《大单成交后的跟随效应与“待著而救”因子——多因子选股系列之十一》
11)“多空博弈”
——《股票日内多空博弈激烈程度度量与“多空博弈”因子构建——多因子选股系列研究之十三》
上述因子虽然由高频数据计算得到,但是在月度频率上仍然有较为出色的选股能力,以下为我们对11个量价因子的测试,测试区间为2013年1月至2024年2月,可以看到,所有因子的Rank ICIR绝对值都在4.0以上。
从各因子之间的相关性来看,“协同效应”因子与“草木皆兵”和“云开雾散”因子相关性较高,分别为61.17%和57.95%。
3.2
“协同效应”因子与其他量价因子合成后Rank IC提升至-12.44%
进一步我们将上述12个因子正交化后简单等权合成为综合量价因子,其表现相较于单个因子大幅提升。
综合量价因子Rank IC均值为-12.44%,Rank ICIR为-5.11,多空组合年化收益率为47.27%,信息比4.33,月度胜率87.22%。
从分组表现来看,综合量价因子各年份表现均较为出色,多头组合年化收益率为25.93%,空头组合年化收益率为-16.25%。
同样我们剔除常见风格因子影响后得到纯净综合量价因子,其Rank
IC均值为-7.21%,Rank ICIR为-3.84,多空组合年化收益率为27.16%,信息比2.98,月度胜率79.70%,仍然非常有效。
4 风险提示
本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。