报告摘要
本报告作为《高频收益如何及何时可预测》系列的下篇,全面展示了高频多因子模型在国内期货市场实证的结果。我们深入分析了模型的预测表现、学习曲线、特征重要性,并探讨了预测区间和日内效应对模型预测能力的影响。最后,我们还探索了模型在实际交易策略中的应用,开发了基于高频因子模型的下单算法,并通过模拟测试比较了其与传统下单算法的性能差异。
核心观点
预测表现:高频多因子模型在RB与FU上最佳模型的样本外R方分别为20.74%及15.05%,均优于文献中的样本外R方中位数10%。
学习曲线:加大样本量对于提升预测效果没有明显帮助;另外,FU比RB更过拟合,LGBM比LASSO更过拟合。
特征重要性:报价不平衡因子、成交收益因子、实际下行波动率因子具备较强有效性。
预测区间:高频收益率在较短区间内的可预测性很强,但随着区间的延长而逐渐减弱。随着预测区间从10个Tick延长到120个Tick,模型的样本外R方从20.74%单调递减至4.94%,样本外方向准确性从64.86%单调递减到53.97%。
日内效应:模型在早晨和下午开盘时段预测表现较弱,且午盘略优于早盘。
下单算法:模拟测试结果表明,基于高频因子的下单算法相比于传统算法,在交易成本上具有显著优势。具体来说,该算法有约75%的几率实现更低的交易成本,平均有0.15跳的滑点优化。