本微信号推送的内容仅面向财通证券客户中符合《证券期货投资者适当性管理办法》规定的专业投资者。本微信号建设受限于难以设置访问权限,为避免不当使用所载内容可能带来的风险,若您并非专业投资者,请勿订阅、转载或使用本微信号的信息。
数据喜忧参半,资金不松不紧,央行宽松也暂不明确,市场又进入纠结状态。怎么办?不妨看看模型怎么说。
大模型固然好,但逃不开“过拟合”问题,如果想从模型的准确性、稳健性和可解释性入手,机器学习也能提供较好结果。
结果怎么样?
模型预测胜率77.44%,区间胜率61.90%,且正确区间平均长度39.62天,错误区间平均18.75天,说明模型具有良好的方向纠错能力。择时回报上,正确区间择时回报合计165.77bp,错误区间损失合计36.36bp,正确区间产生的最大回撤8.86bp。前瞻性上,我们的模型结果能平均提前5~10天捕捉到多空转换。
稳健性怎么样?
为了检测更长周期模型择时能力的稳定性,我们剔除了一些发布时间较短的因子,将可用数据集拉长到2015年,重新训练出的模型在近10年的多轮债市周期中,同样表现出了较好的择时能力。
有哪些应用场景?
该模型凭借其较好的利率择时能力,根据具体应用场景优化后,可以融入到债券投资策略、资产配置策略的构建,以及债券投资风险控制领域。
有哪些技术细节需要注意?
在模型训练和使用中,模型参数需要由近期的数据训练得到,参数的有效期大约为2个月左右,超过时间模型输出结果会出现漂移(模型只输出看多或者看空,并不再变化),所以需要不断的滚动训练以更新模型参数;另外训练过程中,要谨慎的处理因子共线性问题。
风险提示
:模型失效风险、因子失效风险、数据质量风险
我们利用中高频经济数据进行机器学习模型训练,最终呈现了较好的利率择时效果,其结果是未来10年国债利率上行的概率。
在定量分析中,我们选取输出概率值的5日移动平均作为择时信号(signal),以确保稳健性。当signal≥60%,未来利率可能有上升趋势;signal<40%,则认为未来利率有下降趋势。
根据模型输出的概率信号和5日移动平均,择时信号相对稳定,信号持续的平均时间较长。
我们采用滚动训练预测方式,以2021年至2023年2月的数据为训练集,获得了从2023年3月3日到2025年3月18日的输出结果(模型在作出预测观点时,并未在训练数据中见过结果时间段的数据)。
其次从择时区间以及准确度来看,
2023年3月至今,模型形成择时区间21个,预测方向正确的天数总和515天,错误天数总和150天,
胜率为77.44%
。
在形成的21个择时区间中,方向正确13个,方向错误8个,
区间胜率61.90%
。
正确区间平均长度39.62天,错误区间平均18.75天,说明模型具有较好的方向纠错能力
。
择时回报上,
正确区间择时回报合计165.77bp,错误区间损失合计36.36bp,正确区间产生的最大回撤8.86bp。
为了直观的评估模型的择时能力,我们根据模型的择时信号,相应的累计国债收益率的变化值(如果是看多,则减去变化值),如下图所示。多空回报曲线基本表现出了线性增长的趋势,并且在各个时间段表现相对稳定,体现出了模型较好的择时能力。
模型良好的利率择时能力,有助于精准识别利率波动的关键节点,这一特性使其在利率相关投资和风控场景中都具有较高价值。
债券投资策略。
模型可以融入债券投资策略的构建中,通过对利率走势的预判,帮助投资者对债券的买卖时机作出判断。
资产配置策略。
债券资产配置方面,利率下行前增加长久期债券持仓,利率上行前则增加短久期持仓比重,提升债券投资组合的收益表现。大类资产配置方面,模型可以帮助投资者从宏观视角审视利率变动对不同资产类别的影响,引导合理调整股债等资产配比。
债券投资风险控制。
模型在抓取大的利率变动方面,表现出了较高的优势,在针对风控场景进一步优化后,可以帮助投资者实时监测利率波动的潜在风险,确保债券投资在复杂多变的市场环境中始终保持较高的稳定性与抗风险能力。
变量选取上,
我们提取出Wind宏观经济等数据库中关于消费、投资、政府支出、出口、价格、工业生产、货币供给、金融市场、国际资本流动等宏观和微观中高频经济变量,
合计231个
。除此之外,为有效捕捉经济指标的边际变化趋势,对部分变量采用差分、变化率、同比变化率和同比变化值等方式新增备选因子93个,
合计备选特征变量324个
。
缺失值处理方面,
根据数据类型分别采用线性插值或向前填充方式(如存款准备金率)进行处理。
频率对齐方面,
对于周频和月频数据,对于已经公布的数据之间,我们采用线性插值法填充,升频为日频;对于尚未发布最新一期的周度或月度数据,我们采用向前填充方式,往前寻找上个月发布的该数据作为替代。
最后是目标变量构建
,以当日10年期国债到期收益率为基准,分别用未来第60日到未来第1日的到期收益率减去当期值获得。
k
为到期收益率变动值的跨度。
股票量化投资中,信息系数(IC)和信息系数比率(ICIR)是评估因子预测能力的核心指标,尤其在多因子模型构建和优化中广泛应用。
IC衡量的是因子预测目标变量的能力,计算方式通常是在面板数据横截面中(即投资标的维度),因子值和目标变量之间的相关系数或秩相关系数。而ICIR则是用于衡量因子IC值在时间维度的稳定性和一致性,计算方式是IC在时间维度的平均值除以其标准差。ICIR越高,说明因子的预测能力不仅强,而且表现稳定。
客观来说,IC和ICIR的评价逻辑是用于选股的,因子值相当于是给备选股票进行打分,因子正值越高或负值越低,则该支股票在下一期的收益表现越好。
但我们目前的任务是择时,并且投资标的也只有一个,能否构建出类似的IC和ICIR指标对择时因子进行评价呢?答案是可行的。
由于只有一个投资标的,面板数据中就没有投资标的维度,只有一个时间维度。那么我们只能在时间维度同时计算IC和ICIR。在具体计算中,我们选定一个时间窗口w(比如60个交易日),在这个时间窗口中计算因子值与之后k日国债到期收益率变动值的相关系数,记为