主要观点总结
文章主要介绍了融入注意力机制的GRU模型在量化选股领域的表现,结合神经网络编码器如RNN、CNN、Transformer的优势,并融入排序学习思想进行选股策略的优化。文章同时探讨多个Epoch模型参数对抗过拟合的问题,并取得了良好效果。最终构建了指数增强策略,在沪深300、中证500和中证1000指数增强策略上实现较高的年化超额收益。
关键观点总结
关键观点1: 融入注意力机制的GRU模型表现优异
文章结合DA-RNN两阶段注意力机制的设计思路,将注意力机制与GRU结合,在量化选股领域取得了明显的优势,超越了原本的GRU模型。
关键观点2: 参考排序学习思想在量化选股中的应用
文章参考推荐系统和搜索引擎中的排序学习思想,将其应用于量化截面选股策略,并通过对比ListWise和PairWise两大类排序学习损失函数,发现部分损失函数能有效提升多头组合表现。
关键观点3: 使用多个Epoch模型参数对抗过拟合
针对传统训练过程中早停后只使用最好轮次的模型参数进行预测存在的过拟合问题,文章提出使用多个Epoch模型参数进行预测并取均值的方法,此方法在样本外的稳健性更好。
关键观点4: 构建指数增强策略并取得良好效果
文章最终结合上述改进,构建了指数增强策略,并在沪深300、中证500和中证1000指数增强策略上实现了较高的年化超额收益。
正文
摘要
融入注意力机制的GRU表现优异
目前神经网络主流的三类编码器RNN,CNN,Transformer在量化选股领域均表现出了较强的预测效果,如何能使各类编码器发挥自身优势并有效结合成为学术界不断尝试的领域。我们参考DA-RNN两阶段注意力机制的设计思路,避免该模型在实际应用中潜在的问题,将注意力机制改为特征层面的权重分配,与GRU结合后具有明显的优势,在绝大部分指标上超越原本GRU模型。
排序学习思想与A股实证效果
我们参考了推荐系统和搜索引擎中普遍使用的排序学习思想,认为其使用场景和量化截面选股策略具有高度相似性。探讨对比了包括ListWise和PairWise两大类排序学习损失函数,部分损失函数能借助NDCG指标提升多头组合表现,且部分因子相较于传统MSE回归模型有一定提升效果,我们将相对有效且相关性相对较低的损失函数进行等全合成,发现合成后的因子在各款及股票池中表现均有增强。所得因子在全A股票池中IC均值为13.82%,多头年化超额19.69%,多头信息比率2.98。
使用多个Epoch模型参数对抗过拟合
在传统训练过程中,我们倾向于早停后只使用最好轮次的模型参数用于预测。但其面临的一个严重问题在于,训练集和验证集所得最优结果并不一定在样本外同样最优,因此存在严重的过拟合倾向。此处我们考虑,神经网络梯度下降至全局最优点本身应该追求“模糊的正确”,使用早停后验证集表现最优的5轮结果进行预测并取均值能有效缓解上述情况,从而在样本外地稳健性更好。经过对比,使用此方法所得因子在各股票池中均有一定提升。