主要进行量化投资相关的研究和讨论工作。 |
《华泰单因子测试之成长类因子》——华泰多因子系列之五, 发布于2017年1月9日
华泰单因子测试报告中详细阐述了回归法、IC值分析法、分层回测法在单因子测试中的应用方式和表现异同,是市场上关于单因子测试方法描述最详细、最具体的报告之一。我们测试的估值类因子主要包括turn_1m、turn_3m、turn_6m、bias_turn_1m、bias_turn_3m、bias_turn_6m、std_turn_1m、std_turn_3m、std_turn_6m、bias_std_turn_1m、bias_std_turn_3m、bias_std_turn_6m,对于每个单因子,都给出了详细的分析图表,并进行对比。报告原文如下,pdf版可以在百度网盘下载: http://pan.baidu.com/s/1slGQGe5 (无密码)
摘要
待测因子:近N个月每日换手率均值、标准差,及衍生的换手率乖离率等
换手率因子是一类非常重要的风格因子,本报告中我们选取了十二个具有代表性的换手率因子进行测试,包括turn_Nm(个股最近N个月日均换手率,N=1、3、6),bias_turn_Nm(个股最近N个月日均换手率除以最近两年日均换手率再减1,N=1、3、6),std_turn_Nm(个股最近N个月的日换手率序列标准差,N=1、3、6),bias_std_turn_Nm(个股最近N个月的日换手率序列标准差除以最近两年的日换手率序列标准差再减1,N=1、3、6)。经实证检验,四类因子各具特点。
换手率因子总体与市值因子呈负相关,各因子两两间正相关性很强
因市值较大的公司一般换手率不高,所以日均换手率、换手率序列标准差因子与市值因子间呈一定负相关性。经实证检验,两种衍生的换手率乖离率因子与市值因子相关性较小。各换手率因子两两之间普遍具有比较强的正相关性,与之前测试过的估值、成长、动量类因子对比,相关性显得更加突出。如果要组合使用各换手率因子构建选股模型,需要小心处理多重共线性问题。
单因子测试框架:分层回测、回归法、因子IC值分析
首先,我们对各换手率因子依次进行详细的分层模型回测,分析各分层组合的业绩表现和多空组合的表现,判别因子区分度、单调性、稳定性和在不同规模公司、不同一级行业间的业绩强弱。接下来我们使用回归法进行因子测试,对因子收益率序列和回归产生的t值序列进行统计层面上的分析。我们还计算了各因子的IC值序列、IR比率,综合识别有效因子。
测试结果:传统换手率IC值表现佳,而换手率乖离率分层测试效果好
从分层测试的结果来看,bias_turn_1m、bias_std_turn_1m因子各方面都表现出众,而turn_1m、std_turn_1m因子单调性不佳。但从回归测试的因子收益率表现和IC值均值、IR比率等角度来看,turn_1m、std_turn_1m因子效果更好一些,与分层测试的结果略有出入。如果将回归方式由WLS(流通市值平方根加权)改成OLS,则bias_turn_1m、bias_std_turn_1m因子效果又会强于turn_1m、std_turn_1m因子,这从一定程度上说明前者在大市值股票中失效程度更高。综合之前单因子测试报告的结果来看,换手率因子的效果比估值、成长因子强一些,但比动量因子稍弱。
换手率因子可考虑采用更短的样本期
我们对动量类和换手率类因子进行了样本期长度的敏感性测试,发现对换手率类因子来说,用5天左右长度的样本期能使回归测试中因子收益率以及IC值均值、IR比率达到最佳。但对于动量类因子,样本期长度在21~33天附近变动时,因子会有较好表现。因此,动量因子取1个月左右样本期比较合适,换手率因子或可考虑采用更短的样本期。
风险提示:单因子测试结果是历史经验的总结,存在失效的可能。
换手率因子在A股市场的实证分析
换手率因子的选取及测试框架
本文是我们的多因子系列研究第五篇,是单因子测试系列的第四篇,在多因子系列首篇报告中,我们系统地阐述了多因子模型的基本理论,详细描述了多因子模型构建的流程,从多因子系列第二篇报告开始,我们对不同的风格因子单独进行详细的研究和检验,通过综合对比评价,筛选出能持续获得稳健收益的优质因子,这正是构建多因子选股模型的关键一步。在首篇报告中我们共列出了十二类风格因子:估值因子(Value Factor)、成长因子(Growth Factor)、财务质量因子(Financial Quality Factor)、杠杆因子(Leverage Factor)、规模因子(Size Factor)、动量因子(Momentum Factor)、波动率因子(Volatility Factor)、换手率因子(Turnover Factor)、改进的动量因子(Modified Momentum Factor)、分析师情绪因子(Sentiment Factor)、股东因子(Shareholder Factor)和技术因子(Technical Factor),在前三篇单因子测试报告中,我们对估值、成长、动量以及改进的动量类因子进行了详细的测试分析,在本文中,我们将主要针对换手率类因子进行分析,找出其在二级市场不同行业、不同规模上市公司中的分布规律,并通过分层回测、回归法、计算因子IC值等测试因子有效性。
换手率类因子主要反映的是过去一段时间内资产的流通性强弱,是一类非常重要的风格因子。本报告中将测试的因子详细列表如下:
如果某只股票在过去一段时间的换手率明显高于同类型股票的平均水平,则该股票可能是近期资金追逐的热门股,虽然流动性强,但风险也会相对较高。在本报告中,我们第一步将先观察换手率因子在A股市场的分布规律,通过分析换手率因子在不同行业及不同规模上市公司间的差异,判断在单因子回归测试中是否应该处理行业、规模因素的影响。第二步我们将建立分层模型进行回测,详细观察因子区分度、单调性等规律。第三步我们将使用回归法进行单因子测试,结合因子IC值分析,选出有效且稳健的因子。第四步,根据以上分析结果进行对比总结,探讨各因子的特点和优劣。
换手率因子的行业间差异
换手率因子在不同行业间存在显著差异。例如,计算机行业当前具有较高的日均换手率,但其日均换手率乖离率却处于低位;钢铁行业当前日均换手率不高,但其日均换手率乖离率比较大。不同行业间因子值差异十分显著,故对上市公司直接进行跨行业比较意义不大。我们选取turn_1m、bias_turn_1m、std_turn_1m、bias_std_turn_1m 作为换手率因子的代表(因子具体定义见图表1),计算它们在2016/12/30 收盘时各一级行业的中位数分布规律,如下图所示。
上图说明了,在同一时间点,不同行业间换手率因子的水平存在明显差异。事实上,随时间变化,同一行业的换手率因子的绝对大小和与其他行业对比的相对大小也在不断变化中。以turn_1m为例,在2006年至2016年间,每年末行业因子值在所有29个一级行业中的排位变化如下表所示。可以看出,同估值、成长等因子类似,换手率因子在A股市场也存在比较明显的行业轮动现象,比如非银行金融行业在不同年份间换手率排名变化很大,计算机行业从2009年开始换手率一直较高;同时,也存在一些行业的换手率排名一直比较稳定,如银行行业一直换手率较低。行业换手率年份间的波动,一般是当时政治、金融环境等多重因素影响的结果。
换手率因子与市值因子的相关性
除去行业对因子存在较大影响外,上市公司的规模也是对各大类因子产生作用的潜在因素。我们在前三篇单因子测试报告中对估值、成长、动量类因子进行了详细分析,发现市值因子与大部分估值、动量类因子具有一定相关性,但是与成长类因子间相关性不大。这里面的逻辑也是比较明晰的,因为估值因子的计算公式里包含了总市值因素,动量因子与市值因子的相关性反映的就是市值因子本身的IC值(2007年之后一直是小盘股占上风),而成长因子完全由财报信息计算而得,与市值因子相关性较低。对于本报告中涉及的换手率类因子,由于大盘股一般换手率较小,所以猜测是负向关系。下面我们将进行详细计算 。
我们针对图表1中列出的十二个因子,详细计算了它们从2006年到2016年(在每年最后一个交易日核算)与市值因子之间的相关系数,见上表。经观察发现,换手率类因子确实与市值因子间呈负相关关系,尤其是日均换手率和日换手率序列标准差。对于换手率衍生的乖离率类因子,其与市值因子的相关性比较小。
换手率因子间相关性分析
在本章前两个小节中,我们分析了换手率因子在不同行业的分布差异性及换手率因子与市值因子的相关性,接下来,我们将计算各换手率因子之间的相关性。假设因子A和B之间的月度相关系数序列为,其中是在第个月月末这一截面上因子A、B在所有个股上的因子暴露度的相关系数,我们构造了一个相关强度指标:
该指标结合了因子平均相关系数和相关系数的稳定性,能够综合反映因子之间的相关情况。我们分别计算各因子两两之间在过去36个月(2014年1月到2016年12月)内的相关强度指标,如图表6所示。计算过程中涉及的相关系数均值和方差详细展示在图表7和8中。通过观察可以发现,各换手率因子两两之间普遍具有非常强的正相关性,与之前测试过的估值、成长、动量类因子对比,相关性显得更加突出。如果要组合使用各换手率因子构建选股模型,需要注意处理多重共线性问题。
图表7和图表8分别反映因子两两之间相关系数的平均大小和相关系数稳定性,能在图表6数据之外提供一些补充信息。
图表6对于构建风格因子具有一定参考意义,因子合成时要根据相关性关系赋予各因子合理权重,在后续报告中我们将详细阐述。
单因子测试流程
在多因子系列首篇报告《华泰多因子模型体系初探》(2016.09)中,我们系统地介绍了有效因子识别(即单因子测试)的理论基础和研究思路,在多因子系列第二篇报告《华泰单因子测试之估值类因子》中我们着眼于实践过程,给出了详细的流程操作说明。为避免阅读障碍,我们此处将单因子详细测试流程再复述一遍。
回归法
回归法是一种最常用的测试因子有效性的方法,具体做法是将因子在第期的暴露度与期的股票收益进行线性回归,所得到的回归系数即为因子在期的因子收益率,同时还能得到该因子收益率在本期回归中的显著度水平——t值。我们的回归模型为
在所有截面期上,我们对因子进行回归测试,能够得到该因子的因子收益率序列(即所有截面期回归系数构成的序列)和对应的t值序列。t值指的是对单个回归系数的t检验统计量,描述的是单个变量显著性,t值的绝对值大于临界值说明该变量是显著的,即该解释变量(期个股在的暴露度)是真正影响因变量(期个股收益率)的一个因素。也就是说,在每个截面期上,对于每个因子的回归方程,我们设
该假设检验对应的t统计量为
其中代表回归系数的标准差的无偏估计量。一般t值绝对值大于2我们就认为本期回归系数是显著异于零的(也就是说,本期因子d对下期收益率具有显著的解释作用)。注意,我们在回归模型中加入了行业因素,能在一定程度上规避行业因素对成长因子的影响。并且回归法单因子测试中并未对市值因素的影响进行调整,但是在后续计算因子IC值的部分会做一些调整。
测试模型构建方法如下:
1. 股票池:全A股,剔除ST、PT股票,剔除每个截面期下一交易日停牌的股票。
2. 回溯区间:2005-04-29至2016-12-30。
3. 截面期:每个自然月的最后一个交易日计算因子暴露度,与下一整个自然月的个股超额收益(以沪深300指数为基准)进行回归。
4. 数据处理方法:
a) 因子暴露度的计算方法已在图表1中进行说明,个股换手率均取自Wind,换手率为零的日期(即遇到停牌或类似情况)不参与平均值、标准差计算;
b) 中位数去极值:设第T期某因子在所有个股上的暴露度序列为,为该序列中位数,为序列的中位数,则将序列中所有大于的数重设为,将序列中所有小于的数重设为;
c) 标准化:将去极值处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从分布的序列,这样做可以让不同因子的暴露度之间具有可比性;
d) 缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为0(这里解释一下,由于不同因子可能在不同个股处存在缺失值,若不对缺失值进行处理则每个单因子回归的票池并不完全相同,不同单因子回归结果的可比性较差,但如果将所有出现缺失值的个股都从回归票池中剔除,当数据源质量不佳时可能会造成票池大幅减少,回归结果同样不可信,所以这里折中处理,将因子暴露度缺失的地方设为新序列的均值,即设为零,可视作当存在缺失值时我们认为此个股的因子值与全市场平均情况相同,即持中性看法)。
5. 回归权重:由于普通最小二乘回归(OLS)可能会夸大小盘股的影响(因为小盘股的估值等因子出现极端值概率较大,且小盘股数目很多,但占全市场的交易量比重较小),并且回归可能存在异方差性,故我们参考Barra手册,采用加权最小二乘回归(WLS),使用个股流通市值的平方根作为权重,此举也有利于消除异方差性。
6. 因子评价方法:
a) t值序列绝对值平均值——因子显著性的重要判据;
b) t值序列绝对值大于2的占比——判断因子的显著性是否稳定;
c) 因子收益率序列平均值,以及该均值零假设检验的t值——判断因子收益率序列是否方向一致,并且显著不为零;
d) t值序列均值的绝对值除以t值序列的标准差——结合显著性和波动性,辅助判断因子是否有效、稳健。
因子IC值的计算
因子的IC 值是指因子在第T 期的暴露度与T+1 期的股票收益的相关系数,即
其中,〖IC〗_d^T代表因子d在第T期的IC值,(R^(T+1) ) ⃗代表所有个股第T+1期的收益率向量,(d^T ) ⃗代表所有个股第T期在因子d上的暴露度向量。
测试模型构建方法如下:
1.股票池、回溯区间、截面期均与回归法相同。
2.因子值在去极值、标准化、去空值处理后,在截面期上用其做因变量对市值因子及行业因子(哑变量)做线性回归,取残差作为因子值的一个替代。这样做可以消除行业因素和市值因素对因子的影响。计算残差序列和T+1期股票收益序列的相关系数作为T期因子IC值。
3.因子评价方法:
a)IC值序列的均值大小——因子显著性;
b)IC值序列的标准差——因子稳定性;
c)IR比率(IC值序列均值与标准差的比值)——因子有效性;
d)IC值累积曲线——随时间变化效果是否稳定;
e)IC值序列大于零的占比——因子作用方向是否稳定。
因子收益率、t 值与IC 值之间的关系
前两小节分别介绍了用回归法、IC值评价因子有效性的两套思路,那它们之间到底具有怎样的区别和联系呢?为了说明这个问题,我们先介绍一个引理:设X,Y为两个向量,则
其中R^2为线性回归Y=aX+b或线性回归X=aY+b的可决系数(其中a,b是待回归系数)。
如果我们在单因子测试(线性回归法)中使用模型
(r是股票收益率,X是因子暴露度,c是常数项,c可以理解为市场因子)并且假设我们在计算因子IC值的时候,不预先对因子暴露度进行市值、行业调整了,就使用原始的因子暴露度X,则本期因子IC值为corr(X,r),根据引理,因子IC值的平方就等于单因子测试的回归模型的R^2。
所以,因子IC值本质上反映的是下期收益率和本期因子暴露度的线性相关程度(R^2的平方根),是使用该因子预测收益率的稳健性(IC值越大,这个因子的收益越稳定,波动越小);而回归法中计算出的因子收益率本质上是一个斜率,反映的是从该因子可能获得的收益率的大小,这并不能说明任何关于线性拟合优度的信息(也就是说,因子收益率很大时,也可能出现R^2很小的情形);至于回归法中计算出的t值,在一元线性回归中t值与R^2反映的信息一致(二者对应关系为,当R^2=0时t值也为0,当R^2=1时t值为无穷大),但是由于我们所采用的回归模型包括了行业变量,所以t值仅代表被测因子对股票收益的解释能力(而不能代表模型的整体拟合优度)。
总结一下,IC值反映模型整体线性拟合优度,t值反映被测单因子对模型的解释能力是否显著,因子收益率与前两者差别较大,它反映的是可能获得的收益率的大小,而对这个收益是否稳健未知。
事实上,我们在计算因子IC值时也对因子暴露度进行市值、行业预调整了,情况还比上面分析的要复杂一些,但是精髓不变,我们的结论仍然大致正确。
分层模型回测
依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般来说,通过回归法和计算因子IC值都无法确定因子的单调性(例如,某因子值排名在中间1/3的个股表现比前1/3和后1/3的个股表现要好),但是分层回测法是可以确定因子单调性的。分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特优势,是接受度非常高的一种单因子测试手段。
测试模型构建方法如下:
1.股票池、回溯区间都与回归法相同。
2.换仓期:在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日收盘价换仓。
3.数据处理方法:不进行任何加工,因子值为空的股票不参与分层。
4.分层方法:在每个一级行业内部对所有个股按因子大小进行排序,每个行业内均分成N个分层组合。如图表6所示,黄色方块代表各行业内个股初始权重,可以相等也可以不等(我们直接取相等权重进行测试),分层具体操作方法为N等分行业内个股权重累加值,例如图示行业1中,5只个股初始权重相等(不妨设每只个股权重为0.2),假设我们欲分成3层,则分层组合1在权重累加值1/3处截断,即分层组合1包含个股1和个股2,它们的权重配比为0.2:(1/3-0.2)=3:2,同样推理,分层组合2包含个股2、3、4,配比为(0.4-1/3):0.2:(2/3-0.6)=1:3:1,分层组合4包含个股4、5,配比为2:3。以上方法是用来计算各个一级行业内部个股权重配比的,行业间权重配比与基准组合(我们使用沪深300)相同,也即行业中性。
5.评价方法:回测年化收益率、夏普比率、信息比率、最大回撤、胜率等。
单因子测试结果分析
分层模型回测分析方法
在华泰单因子测试系列前两篇报告中,我们用图表夹杂文字说明的形式,对各个细分因子的分层回测结果一一进行了详细展示。从第三篇报告《华泰单因子测试之动量类因子》开始,我们对报告展示形式加以改进,在维持前两篇测试报告的细致程度的基础上,为了更高效地展示结果,我们会在此处集中说明所有图表的计算细节和分析方法,后面细分因子的测试结果均会使用相同的模板,便于读者速览和对比。
分层测试详细展示图表包括:
1. 分五层组合回测绩效分析表(20050509~20161230)。其中组合1~组合5为按该因子从小到大排序构造的行业中性的分层组合。基准组合为行业中性的等权组合,具体来说就是将组合1~组合5合并,一级行业内部个股等权配置,行业权重按当期沪深300行业权重配置。多空组合是在假设所有个股可以卖空的基础上,每月调仓时买入组合1,卖空组合5。回测模型在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日收盘价调仓(分层组合构建法等更多细节参见上一章“分层模型回测”小节)。
2. 分五层组合回测净值图。按前面说明的回测方法计算组合1~组合5、基准组合的净值,与沪深300、中证500净值对比作图。
3. 分五层组合回测,用组合1~组合5的净值除以基准组合净值的示意图。可以更清晰地展示各层组合在不同时期的效果。
4. 组合1相对沪深300月超额收益分布直方图。该直方图以[-0.5%,0.5%]为中心区间,向正负无穷方向保持组距为1%延伸,在正负两个方向上均延伸到最后一个频数不为零的组为止(即维持组距一致,组数是根据样本情况自适应调整的)。
5. 分五层时的多空组合收益图。再重复一下,多空组合是买入组合1、卖空组合5(月度调仓)的一个资产组合。多空组合收益率是由组合1的净值除以组合5的净值近似核算的。
6. 分十层组合回测时,各层组合在不同年份间的收益率及排名表。每个单元格的内容为在指定年度某层组合的收益率(均为整年收益率),以及某层组合在全部十层组合中的收益率排名。最后一列是分层组合在2006~2016的排名的均值。
7. 不同市值区间分层组合回测绩效指标对比图(分十层)。我们将全市场股票按市值排名前1/3,1/3~2/3,后1/3分成三个大类,在这三类股票中分别进行分层测试,基准组合构成方法同前面所述(注意每个大类对应的基准组合并不相同)。
8. 不同行业间分层组合回测绩效分析表(分五层)。我们在不同一级行业内部都做了分层测试,基准组合为各行业内该因子非空值的个股等权组合(注意每个行业对应的基准组合并不相同)。
turn_1m因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
turn_3m因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
turn_6m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
bias_turn_1m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
bias_turn_3m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
bias_turn_6m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
std_turn_1m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
std_turn_3m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
std_turn_6m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
bias_std_turn_1m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
bias_std_turn_3m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
bias_std_turn_6m 因子
所有图表的详细说明参见本章第一小节“分层模型回测分析方法”。
回归法测试结果分析
上一章中,我们依次展示了十二个换手率因子分层回测的结果,本章我们将使用回归法进 行截面规律统计。回归法是多因子模型领域应用最广的方法,回归法单因子测试的结果不 仅用于初步因子筛选,在后续构建收益预测模型时还会进一步应用。具体模型设置和下面 图表中各指标含义参见第二章“单因子测试流程”的第一小节“回归法”。我们还列出了 前期报告因子回归测试结果(估值、成长、动量类因子)与本期换手率类因子回归结果进 行对比,如下所示。
从上面的图表可以看出,换手率因子的整体效果都还不错。取假设检验H:因子收益率序列均值显著异于0。则假设检验H对应的t值在图表106中最后一列,所有十二个换手率因子都能通过该假设检验。如果从回归法得出的|t|均值和因子收益率均值来看,1个月日均换手率(turn_1m)和1个月内换手率序列标准差(std_turn_1m)这两个因子表现最好;如果从“因子收益率序列均值显著异于零”的t检验结果来看,1个月日均换手率乖离率(bias_turn_1m)和1个月内换手率序列标准差乖离率(bias_std_turn_1m)因子要强于turn_1m和std_turn_1m因子。其实这一现象背后的原因是——bias_turn_1m、bias_std_turn_1m这两个因子的因子收益率序列波动比较小,也就是说,这两个因子的表现相对更稳定一些。从上面的图表也确实可以看出,bias_turn_1m、bias_std_turn_1m对应的曲线比较平滑。并且,在前一章分层回测中,也是bias_turn_1m、bias_std_turn_1m因子的整体表现强于turn_1m、std_turn_1m因子。
由于换手率因子的分层测试结果与回归法结果并不完全一致,我们想要更全面地了解这种差异因何而产生。图表106中的结果是由WLS回归产生(用个股流通市值的平方根作为权重,具体描述参见第二章“单因子测试流程”的第一小节“回归法”中测试模型构建方法的第5点),我们将WLS回归改成OLS回归,回归测试结果对比显示在图表110中。通过观察可以发现,在OLS回归下所有换手率类因子的效果都有所提升,这也和换手率因子的特点有关——在大盘股中效果较差,在中、小盘股中效果很好。并且OLS回归下bias_turn_1m、bias_std_turn_1m因子的效果是好于turn_1m、std_turn_1m因子的,可以从某种程度上说明,bias_turn_1m、bias_std_turn_1m因子在大盘股中失效得更严重。
与前三篇单因子测试的报告结果进行对比,我们发现换手率因子的整体效果比估值、成长因子要好,但不如动量因子。这一结论也比较符合投资者的直观印象。估值与成长因子是部分或全部源于财务数据的因子,灵敏度不如量价类因子,在多因子模型中的贡献度也不如量价类因子。而“量”与“价”相比,通常还是价格因素给投资者带来的刺激更大,量、价间存在一定协同效应,由此还可以衍生出许多技术类因子,将在以后的测试报告中详加讨论,欢迎持续关注。
因子IC值的计算与分析
在回归法因子测试完成之后,我们还将进行因子IC值的计算与分析。请注意,我们此处计算的因子IC值并不是因子原始暴露度和下期收益的相关系数,而是“经过市值和行业调整的”因子暴露度和下期收益的相关系数(具体计算方法详见第二章“单因子测试流程”的第二小节“因子IC值的计算”),所以因子IC值的计算结果和回归测试结果并不是完全一致的(回归模型中包含行业哑变量而不包含市值相关解释变量)。
我们还仿照回归法分析过程,画出各因子IC值累积曲线,可以从图中观察换手率因子在各段历史时期的表现。
下面图表中IR比率是指因子IC值均值与标准差的比值的绝对值,能够衡量因子有效性。因子IC值的分析结果与回归法基本一致,turn_1m、std_turn_1m因子IC序列均值绝对值比较大,但是IC序列标准差也大;bias_turn_1m、bias_std_turn_1m因子IC序列均值绝对值小一些,但是IC序列标准差也小。从IR比率来看还是turn_1m、std_turn_1m要稍好一些,尤其是std_turn_1m因子的IR比率达到0.82,比动量因子中经典的1个月反转因子IR值还要高。
与前三篇单因子测试的报告结果进行对比,我们发现换手率因子在IC值分析方面各项表现也都强于估值和成长因子,比动量因子稍弱一点。
换手率因子或可选用较短样本期
近1个月收益率、近1个月换手率均为多因子模型中常见的因子,并且经测试验证,它们确实要比近N个月收益率、近N个月换手率(N>1)因子效果出色。然而,我们还想刨根究底地问一下:为什么不用最近K个交易日的量价信息构建因子,而一定要用近1个月的呢?究竟怎样的样本期长度能使因子的效果达到最优?俗话说的好,理不辨不明,事不鉴不清。于是,我们就对动量类和换手率类因子进行了样本期长度的敏感性测试,如下列图表所示。
在图表115~122中,我们分别针对本报告中详细讨论的四类换手率因子,选择样本期为N天(N=1,3,5,……,21),进行回归测试、IC值分析和分层测试。结果发现,1个月的样本期长度对于换手率类因子来说并不是最优的。对于日均换手率和日均换手率乖离率来说,用3~5天长度的样本期最佳;对于换手率序列标准差来说,也是用5天左右长度的样本期最佳;对于换手率序列标准差乖离率来说,分层法的测试结果显示11天左右长度的样本期最佳,而回归法和IC值分析的结果仍然支持5天左右最佳,两者不太一致。总而言之,我们只需要用过去几个交易日的换手率就能对下期收益率做出较好的预测了,更久以前的换手率并不能提供太多额外有效的信息。
关于换手率因子的测试结果似乎有些出乎意料,那么对于上篇报告中涉及的动量类因子呢?在图表123~124中,我们对过去N个交易日的收益率因子和过去N个交易日的日换手率加权日均收益率因子也进行了回归法测试和IC值分析(N=1,3,5,……,47)。结果发现,动量因子用过去21~33天的样本期长度较佳,在这段较宽泛的样本期选择区间内,因子表现变动不敏感。如此倒是证实了,动量因子确实是取1个月左右最佳。
综上所述,对于换手率因子,我们或可选用较短的样本期,以便产生更好的效果。
换手率因子效果对比总结
我们将分层测试的结果汇总在下面图表中,其中TOP组合是指分五层组合中的组合1,因子单调性得分是指十层组合在2006~2016年的收益排序均值与向量(1,2,…,10)’的秩相关系数。从TOP组合信息比率、多空组合年化收益率、多空组合夏普比率、因子单调性等角度来说,都是bias_turn_1m、bias_std_turn_1m因子表现出众。同时我们将回归法测试和IC值分析的结果也汇总在下面,从因子收益率均值、IC值均值、IR比率等角度来说,是turn_1m、std_turn_1m因子效果突出,与分层测试的结果略有出入。但我们在上上章“回归法测试结果分析”中也指出了,如果将回归模型由WLS回归(用个股流通市值平方根作为权重)改成OLS回归,bias_turn_1m、bias_std_turn_1m因子的表现就会强于turn_1m、std_turn_1m因子。这从侧面体现了换手率乖离率类因子在大盘股中失效程度更高。
我们将前三篇单因子测试报告中估值、成长、动量因子的结果也对比展示在下面。可以发现,换手率因子的效果整体比估值、成长因子强一些,但比动量因子稍弱。再次说明一下,估值和成长因子是部分或全部源于财务数据的因子,与量价信息相关性较低,并且逻辑清楚,是一类优质备选因子。动量、换手率以及将要测试的波动率等大类因子虽效果强于财务类因子,但彼此间相关性也比较大。需要注意的是,本期被测的十二个换手率因子间相关性很强,需要有所取舍地使用。另外,我们通过样本期长度敏感性测试发现,换手率因子或可考虑采用更短的样本期,以便取得更佳的效果。
目前我们正在陆续推出单因子测试系列报告,后续规划包括财务质量因子、杠杆因子、规模因子、波动率因子、分析师情绪因子、股东因子、技术因子等大类因子的测试,在单因子测试系列之后我们将深入探讨如何在大类因子中进行因子精选并赋予合适权重从而构造优秀的风格因子,敬请关注。
免责声明
本研究报告已由华泰证券研究所正式对外发布,一切观点、信息应以正式发布的报告为准。本公众号中提供的信息或观点不构成购买或出售所提及的投资产品的投资建议、要约或招揽。与您的特定投资目标、财务状况和特定需求无关。因此,本公众号作者与华泰证券均不承担由此信息直接或间接导致损失的责任。本公众号版权仅为华泰证券所有,未经公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。本公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:Z23032000。
周期定市
二零一六年二月,大跌之后股市仿若惊弓鸟。彼时,华泰金工据全球统一周期规律,独家坚定全球必涨;周期股引领反转,价值投资回归。一年半全球普涨验证精准判断。
量化方法高维视角发现周期统一性规律,并实现科学精确测度。据此而提之华泰周期三因子模型,净值曲线独占鳌头,实战验真理。
华泰周期研究全新视角立行业新碑、开创先河。一年一度新财富群英荟萃、百舸争先;盼君贵手能把冠军投,感恩心以精品佳作涌泉报!
华泰金工敬献!
二零一七年九月
|
南都娱乐周刊 · 郑爽抽烟竟引起轩然大波,但这就让形象坍塌了?算起烟龄,陈乔恩赵薇迅哥都是老司机啊 8 年前 |
|
中国经济网 · 17岁华裔女孩凭一篇作文被哈佛耶鲁录取?来感受一下这开挂的人生!丨可读 7 年前 |
|
山西老乡俱乐部 · 魅力山西(美食篇)|山西糖三角,绵酥香甜,有妈妈的味道! 7 年前 |
|
苏米的星座馆 · 重点 | 12星座6月工作运 7 年前 |
|
简单心理 · 心理疾病 | 看不见的冰山暗礁 7 年前 |