专栏名称: 留富兵法
从量化的视角去看市场,用金融工程的思维去解决问题
目录
相关文章推荐
上海发展改革  ·  强化重大政策靠前发力,2025年上海将出台哪 ... ·  14 小时前  
上海本地宝  ·  双方都是外地户口可以在上海领证吗? ·  2 天前  
超级数学建模  ·  限时领 | Oxford ... ·  2 天前  
超级数学建模  ·  懂中式美学的人,真不简单! ·  4 天前  
51好读  ›  专栏  ›  留富兵法

国盛量化 | 解构ETF资金流的反转现象——投资者结构与折溢价套利

留富兵法  · 公众号  ·  · 2025-02-10 11:30

正文

文:国盛金融工程团队

联系人:刘富兵/杨晔


期话题 解构ETF资金流的反转现象——投资者结构与折溢价套利




本报告主要解决以下三个问题: 由ETF申购赎回带来的资金流动对跟踪指数后续收益有何影响?ETF资金流动的反转现象该怎么解释,背后的原因有哪些?如何利用这些规律构建ETF和行业轮动策略?

当下ETF市场蓬勃发展,规模已基本和主动权益持平。 自从2024年基金三季报披露以来,市场上讨论较多的话题是ETF规模已经与主动权益基金的规模基本持平,目前已达到3.5万亿。参考海外ETF产品发展和研究历史,我们认为当下可能也是研究ETF产品较好的时机,无论是因子维度还是配置维度都有较大的研究潜力。

ETF资金流/份额变动对市场定价的影响。 我们采用申购赎回清单数据构建ETF跟踪指数的份额变动和资金流动因子,发现 ETF资金流各个指标整体呈现反转效应,即ETF资金大量流入(份额快速增加)的指数未来一周收益更差,资金流出(份额减少)的指数未来一周收益更高。若根据其指数类型拆分,发现行业主题类ETF的分组收益明显单调,呈现出反转现象,而宽基类ETF分组收益则无明显特征。

反转现象解释①:投资者结构。 首先,我们验证发现个人投资者更倾向于在行业主题ETF上追涨杀跌,而机构投资者倾向于在宽基类ETF上逢低布局。然后我们根据个人投资者占比将样本分组,发现个人投资者占比高的ETF被大量资金流入后未来表现不佳,反转现象更显著,即个人投资者在ETF上的追涨杀跌容易带来负向效果。

反转现象解释②:折溢价套利。 首先,我们验证发现折溢价率仍然会持续影响未来一周的资金净流入,即越溢价的ETF未来一周更容易吸引场外资金申购,份额增加越多。然后我们根据折溢价率将样本分组,发现越溢价的ETF被大量申购后,未来表现更差,反转现象更显著。

应用初探:基于ETF资金流构建ET F/行业轮动策略。 我们综合两个维度构建ETF资金流复合因子,并在ETF轮动上进行落地。简单初筛100个ETF进行轮动,2015年至2024年9月底策略年化超额9.7%。若采用“ETF资金流映射到行业指数——筛选多头空头——匹配ETF落地”方案,一级行业ETF轮动策略多头超额11.4%,二级行业ETF轮动策略多头超额16.3%,效果均得到明显提升,且二级行业轮动效果优异。年化多头超额收益达到28.8%。此外,行业ETF资金流和拥挤度指标相关性较低,可以共同作为行业尾部风险的监控指标。

风险提示: ETF轮动模型根据历史数据规律总结,模型过拟合、市场风格切换等都可能导致未来模型失效。



一、研究背景:ETF大发展下的资产定价思考


这一章节,在ETF蓬勃大发展的背景下,我们探讨其可能对市场定价产生的影响,以及对本篇报告要研究的问题进行阐述。

1.1、当下ETF规模和主动权益基金已基本持平
2024年上半年,国务院出台的《关于加强监管防范风险推动资本市场高质量发展的若干意见》(下称“新国九条”),为蓬勃发展的ETF按下了“加速键”。“新国九条”指出,要建立交易型开放式指数基金(ETF)快速审批通道,推动指数化投资发展。

因此自2024年以来ETF发展在明显加速,规模迅速扩张。自从基金三季报披露以来,市场上讨论较多的话题是ETF规模已经与主动权益基金的规模基本持平。截止2024年10月31日,A股ETF基金总规模已达到3.53万亿,而偏股混合型基金总规模为3.50万亿,ETF规模已小幅领先。不仅如此,ETF在二级市场上的成交额也持续火热,2021年ETF占A股总成交占比尚不足5%,近年来已突破10%,成交占比中枢显著提升。


这一现象的背后固然是国家政策推动所致,但我们认为这可能只是助推器,背后更深层次的原因是:市场有效性的提升使得主动权益基金获取Alpha的难度越来越大,被动型的指数化投资开始越来越受到大家的关注。复盘我国ETF过去的发展历程,每一次在主动权益基金表现不佳的时候,ETF的规模占比就会上升比较快,比如2011-2014年期间、2017-2018年期间,以及2021年至今。

而回顾美国以及全球股市的发展历史,随着市场有效性的逐步提升,主动投资获取alpha的难度增加基本是个长期不可逆的趋势,而ETF产品则凭借着费率低和信息透明的优势得以迅猛发展。站在这个特殊的时点,我们需相当重视ETF产品相关的研究,这对我们理解ETF其产品发行、竞争策略以及其对市场定价和后续走势的影响就显得至关重要。


1.2、ETF信息成为资产定价研究中不可或缺的因素

这里我们搜集了国内外学术界关于ETF产品的研究,研究方向主要集中在定价效率、流动性风险和公司治理几个维度。不过比较有趣的是,当下ETF的研究分歧不小,其状态有点类似于2000年前后的股票市场,彼时学者们针对市场有效/无效以及市场异象是否存在产生了较多的争论,这也带来了资产定价研究的进步与发展。我们认为当下可能也是研究ETF产品较好的时机,无论是因子维度还是配置维度都有较大的研究潜力。

下面我们简单梳理总结了一下ETF定价效率相关的研究结论:目前此类研究分歧较大,有部分学者研究认为ETF持股能够改善信息环境,加速价格发现机制。具体地,Bhojraj等(2020)根据标的公司所属行业将ETF分为宽基ETF (Broad-based ETFs) 和行业ETF (Sector ETFs) ,并检验两类ETF对盈余公告信息传递的异质性影响。该文发现,行业ETF的信息传递效率更高,可以增加投资者对行业和公司特质信息的关注度,并减少股价漂移现象。此外,S.P. Kothari等(2023)研究发现随着ETF持股比例的增加,分析师预测的准确性也越高,这一现象在行业ETF上更加明显,并且行业ETF中公司的盈余公告能够有效修正分析师预测。

相反地,有部分学者认为ETF会降低股票定价效率,削弱知情交易者获取信息的动机。Brown等(2021)研究发现ETF的申购和赎回活动为股票提供了非基本面需求冲击,导致资产价格扭曲,交易成本提高,投资收益下降。朱菲菲等(2023)也发现,ETF在提高上市公司股票流动性的同时,会吸引更多的短期投资者,加剧管理层隐藏负面消息的动机,从而增加股价崩盘风险。

本篇报告作为ETF研究系列的开篇,我们重点研究三个问题:1)由ETF申购赎回带来的资金流动对跟踪指数后续收益有何影响?2)ETF资金流动的反转现象该怎么解释,背后的原因有哪些?3)如何利用这些结论构建ETF和行业轮动策略?


二、规律探讨:ETF资金流/份额变动对市场定价的影响

这一章节我们探讨了ETF资金流/份额变动对市场定价的影响,具体包括:1)ETF资金流/份额变动对指数后续收益的影响;2)有哪些原因可以解释ETF资金流背后的反转现象?3)如何基于这些解释构建更强的ETF资金流因子?

2.1、指标选取与研究对象

本篇报告我们研究的是ETF申购赎回产生的资金流动对市场定价的影响,因此数据主要来源于Wind底层数据库中ETF的申购赎回清单。具体而言,包括如下表和字段:

1) 中国ETF申购赎回清单(ChinaETFPchRedmList): 基金份额净值(F_PRT_NETASSET),用于计算ETF规模,不过需要注意的是: ETF净值的披露通常在T+1日披露,因此后续因子测算时需将调仓日同样向后滞后一天来计算收益。 根据我们观察,ETF周五的收盘净值往往在周一早上8-9点才会陆续入库,因此周一上午可能才会算好相关指标。

2 )中国ETF申购赎回成份(ChinaETFPchRedmMembers): 股票数量(S_CON_STOCKNUMBER)、成份股代码(S_CON_WINDCODE),用于计算ETF持仓成分股及其权重(基于申购赎回一揽子股票所需数量和价格测算),公式如下:

3) 中国共同基金份额(ChinaMutualFundShare): 流通份额(F_INFO_SHARE),用于计算ETF的份额变动,再结合ETF日内均价计算ETF资金流动,公式如下:

4) 中国上市基金IOPV收盘净值(CMFIOPVNAV): IOPV收盘净值( F_IOPV_NAV ),用于计算ETF的折溢价比率,公式如下:

研究指标主要包括份额变动和资金流动两类,具体定义和解释如下表所示:


其中,Share_Diff代表ETF的份额变动,即T日份额减去T-1日的份额;Share_Change代表ETF的份额变动率,即T日份额/(T-1)日份额-1;Money_Flow代表ETF的资金流入,具体计算由上述公式所示;Money_Flow_Change代表ETF的资金流入比例,即资金流入/规模。然后这里面有两个细节需要注意:


1) 时序平滑处理: 由于ETF并不是每天都会存在份额变动,这里为了使因子连续化,我们将因子做MA5处理,即用采用一周平均的份额变动数据构建因子;


2) 时序标准化处理: 为了使得资金流动数据体现出和过去的比较,我们对MA5平滑后的因子数据做过去一个季度的时序标准化,即减去过去63个交易日的均值,再除以标准差,上述公式中带std后缀的因子即是标准化后。

2.2、ETF资金流/份额变动对指数后续收益的影响
2.2.1、ETF资金流/份额变动指标回测结果
这里我们类似于选股因子回测的思路,对ETF跟踪指数的因子进行回测。具体而言,在每周五根据资金流/份额变动因子将ETF跟踪指数分成5组,前20%作为多头,后20%作为空头,然后按照下周一收盘价买入,持有到下下周一卖出,周度调仓,计算因子周度的IC值、IC胜率、ICIR、多空收益以及信息比率等。
如下表所示,ETF资金流各个指标整体呈反转效应, 即ETF资金大量流入(份额快速增加)的指数未来收益更差,资金流出(份额减少)的指数未来收益更高。 当然,这里因子做了时序标准化处理后,多头端也有可能是资金缓慢流入而不是资金流出。此外,这里有两个比较明显的现象:
1) 因子做时序标准化后表现更优: 这四个因子做时序标准化前ICIR的绝对值均在0.5附近,做了时序标准化后均超过0.5,甚至达到1;
2) 资金流动因子和份额变动因子差异不大: 前四个和后四个因子的绩效统计结果差异不大,也就是说考虑价格对因子影响不大。


综合来看,时序标准化后的份额变动率和资金流入占比因子回测效果最好且逻辑更加自 洽,后续研究主要展示 时序标准化后的份额变动率因子(Share_Change_std)。 下面再进一步观察下该因子做时序标准化后前后的分组收益,以及时序上的多空净值走势。

如下左图所示,份额变动率因子分组收益呈明显单调性,且时序标准化后的份额变动率 因子单调性优于原始份额变动率因子,因此做时序标准化十分必要;如下右图所示,Share_Change_std因子的年化多空收益达到9.9%,其中年化多头超额3.4%,空头超额-6.2%,这和个股涨跌幅的反转效应类似,都是空头端效果更强。




下面我们进一步拆分ETF的属性,观察其因子效果的差异。这里我们根据Wind对ETF基金的分类,按照ETF跟踪指数的属性,将其拆分成宽基、风格、策略、行业和主题五大类(注:这里剔除了QDII相关的ETF),然后分别在不同类别中测算因子的分组收益。


如下左图所示,与整体结论类似,行业主题类ETF的分组收益明显单调,呈现出反转现象,即资金流入越多的ETF未来一周表现更差,而宽基类ETF分组收益则无明显特征。从下右图的因子多空净值也可以看出,该因子在行业主题类ETF中有明显alpha,但是在宽基中多空收益不高,呈现出类似风险因子的特征。




那为什么行业主题类ETF的资金流动呈现出更为明显的反转现象,而宽基类ETF则无明显特征呢?其实仔细思考下来,我们猜测可能是由投资者结构差异引起的。众所周知,个人投资者相对更倾向去买行业主题类的ETF产品,而机构投资者更倾向于买宽基类的产品,并且近些年在持续净流入,这一点我们从渠道端的销售发行状况就可以看出。而个人投资者往往存在追涨杀跌的倾向,这可能会带来短期热门的行业主题类ETF容易产生溢价,从而带来资金的持续申购,导致超买现象,这可能是行业ETF存在反转现象的原因。因此下面我们从投资者结构和折溢价套利这两个角度,尝试去解释一下ETF资金流背后的反转现象。

2.2.2、反转现象解释①:投资者结构

首先,我们从基金的年报和半年报披露中获取ETF的投资者占比数据,其中共披露两个数据:个人投资者占比和机构投资者占比,这两项求和为1。该数据一年披露两次,并且根据年报和半年报的规则,一般在8月和次年4月披露,因此我们也将所有ETF的数据对齐到这两个月底进行更新。

基于上述分析,我们提出如下两个研究猜想:

1) 宽基ETF机构占比高,行业主题类ETF个人占比高

2) 个人投资者倾向于追涨杀跌,即大量买入过去一段时间涨幅高的ETF

如下左图所示,我们统计了2015年至今各个类型ETF的个人投资者占比,同一类型ETF按照规模进行加权平均。可以看到,历史上宽基类ETF个人投资者占比基本上在30%以下,2024年半年报下降至19%;而行业类ETF近些年的个人投资者占比基本稳定在50%附近,2024年半年报约为53%。这里猜想1得到验证。

然后这里有个令人意外的是策略类ETF和风格类ETF的个人投资者占比数据有明显差异,按道理来说这两类ETF都是SmartBeta型的产品,为什么投资者结构差异较大呢?我们查看了一下这两类ETF里面的产品,发现风格类ETF规模较大的是300成长和创成长,个人投资者占比较高,说明个人相对还是偏好弹性较大的品种;而策略类ETF中规模较大的主要是红利、质量和央企股东回报等,近些年机构投资者占比显著提升,这说明机构近期相对偏好偏价值的品种。


进一步地,我们去验证猜想2。这里我们先在每个截面上将ETF分成两组:个人占比高和机构占比高,对应是上右图蓝色柱子和黄色柱子。然后根据过去20日涨跌幅将其分成三组,第一组是涨跌幅最低的,第三组是涨跌幅最高的,最后去统计不同组未来一周份额变动率的中位数。可以看到,个人投资者更倾向买入过去20日涨跌幅最高的一组ETF,而机构投资者更倾向于买入过去20日涨跌幅较低的一组ETF,即机构倾向于逢低布局,个人倾向于追涨杀跌。这里猜想2得到验证。

最后,根据上述现象我们提出研究假设1: 个人投资者占比高的ETF被大量资金流入后未来表现不佳,反转现象更显著

这里我们根据ETF的个人投资者占比数据对截面样本做切割,分成全样本和个人投资者占比超过p(p取10%、20%、30%、40%和50%),然后在不同的样本里进行因子测试。如下图所示,个人投资者占比越高的样本下,因子多头收益变差,但空头收益变好(全样本时多头超额3.1%,空头超额-6.2%,个人投资者占比超过30%样本里多头超额0.5%,空头超额-8.6%)。

也就是说,个人投资者占比越高的ETF被资金大量买入后,未来业绩表现会更差,反转现象更显著,即个人投资者在ETF上的追涨杀跌容易带来负收益,研究假设1基本得到验证。因此行业主题类ETF资金流入表现出反转现象,可能的解释是行为金融学中的反应过度:该类ETF个人投资者占比较高,容易追涨杀跌,带来股价的反应过度。

2.2.3、反转现象解释②:折溢价套利

另外一个角度就是学术上讨论比较多的折溢价套利现象。众所周知,溢价的ETF容易被申购,是因为折溢价套利机制的存在:若ETF存在溢价,即二级市场价格>IOPV,此时套利交易者可以在二级市场买入ETF成分股从而推升指数价格,同时在一级市场申购ETF导致ETF份额增加,然后再在二级市场以较高的价格卖掉ETF完成套利,因为套利机制的存在,ETF折溢价会逐渐消除,回归公允价值。

由于溢价的ETF在二级市场上存在较大的卖压,根据价格压力假说,ETF短期供>求,会导致价格下跌。因此出现了“ ETF溢价——ETF份额增加(申购)然后在二级市场卖出——价格下跌(反转现象) ” 这一传导链条。

但这里有的读者可能会问:现阶段ETF做市商已基本成熟,溢价率在日内或者最多1-2天就可以消除,为什么折溢价套利这个机制还会影响到未来一周的资金流反转现象呢?

首先,我们去统计了下一些热门ETF的折溢价率水平。如下图所示,我们展示半导体和券商这两个热门指数历史的折溢价率水平。不难发现,除了一些市场的极端情况,大部分的折价率或者溢价率幅度较小,基本在-1%到1%之间。

但是,我们发现折溢价率仍然会持续影响未来一周的资金净流入。这里我们根据过去一周的折溢价率均值将所有ETF跟踪指数分成5组,去统计过去一周同步和未来一周的份额变动率。如下图所示,我们发现无论是过去还是未来,溢价率越高的ETF组,都会持续地吸引资金的净流入,带来份额的增加,并且这个分组统计具备明显的单调性。

这说明溢价率高的ETF不仅在当时吸引场外资金的申购,并且也会在未来一周吸引资金的净流入。此外,我们统计了ETF折溢价率和份额变动率的相关性。如下图所示,ETF折溢价率与份额变动相关性均值接近30%,并且历史上没有一个月为负,这说明溢价的ETF吸引场外资金申购这个现象长期持续并且稳定。我们认为这是投资者情绪的蔓延,ETF越溢价说明由于某种原因市场对该行业或者相关主题关注度越高,在未来可能会持续传播蔓延,带来资金的申购以及溢价的反复出现,从而带来短期的超买现象。

最后,根据上述现象我们提出研究假设2: 由于折溢价套利机制的存在,溢价率越高的ETF被大量申购后,未来表现更差,反转现象更显著。

这里我们根据ETF的折溢价率数据对截面样本做切割,分成全样本和折溢价率截面分位数超过p(p取10%、20%、30%、40%和50%)的样本,然后在不同的样本里进行因子测试。如下图所示,折溢价比率越高的样本下,因子多头收益和空头收益均变好(全样本时多头超额3.1%,空头超额-5.9%,折溢价比率超过50%分位数样本里多头超额4.4%,空头超额-7.3%)。

也就是说,折溢价率越越高的ETF被资金大量买入后,未来业绩表现会更差,反转现象更显著,即研究假设2基本得到验证。因此行业主题类ETF资金流入表现出反转现象,可能的解释是行为金融学中的价格压力假说: 溢价ETF因为套利空间存在和反映了投资者的关注度,容易在未来持续吸引资金的净流入,从而导致ETF在二级市场上存在超买现象,在短期带来较大价格压力


2.2.4、合成因子构建思路和回测结果

基于上述两个研究假设得到验证,我们构建ETF资金流与投资者结构、折溢价的合成因子,希望增强该因子的反转效应,具体思路如下所示:


1)投资者结构:个人占比高的ETF资金流入带来的反转效应更强,合成因子如下:

2)折溢价套利:溢价的ETF资金流入带来的反转效应更强,构建合成因子如下:


这里我们相当于通过投资者结构和折溢价套利两个角度对资金流因子Factor做缩放处理。根据上述研究结论,个人占比高、溢价的ETF资金流入未来跌得更多,所以我们希望将此类ETF因子值放大,由于是反转效应,所以因子值越大,就越是我们想要的空头。但考虑到资金流因子Factor有正有负,因此这里需要做分组讨论。举个例子,Factor大于0的时候是资金流入,将Factor×个人投资者比例,则个人占比高的资金流入因子值会越大,倒序排序就越是空头;Factor小于0的时候是资金流出,将Factor×(1-个人投资者占比),这样机构占比高的资金流出因子值越小,倒序排序越是多头。

同理,我们也对折溢价率做类似的处理。不过需要注意的是,折溢价率是个高频数据没有统一量纲,且根据上述分析大部分时间在-1%到1%之间,波动幅度较小,如果用(1+IOPV)去调整资金流因子的话,调整幅度比较小,对因子影响不大。这里我们对折溢价率同样做过去63日的时序标准化,将其标准化到-3到+3之间,然后按照上述公式去调整资金流因子,这样可以保证括号内是正的,并且对因子值大小有一定影响。


综合上述两个维度,得到复合因子如下:




然后,我们分别在全样本下测试了

三个因子的表现。如上图所示,无论是投资者结构还是折溢价套利,这两个维度的复合因子均显著提升了因子绩效,我们发现复合后的ETF资金流因子具备更强的反转效应。其中,复合因子的IC值从-2.8%提升到-3.5%,ICIR从-1.00提升到-1.45,多头超额从3.1%提升到4.6%,空头超额从-6.2%提升到-7.2%,多空对冲从9.6%提升到12.3%,信息比率从1.12提升到1.49。



三、应用初探:基于ETF资金流构建ETF/行业轮动策略


这一节我们基于第二章得到的逻辑和统计规律,基于ETF资金流因子构建ETF轮动策略,并尝试将该信息映射到行业指数上,然后构建行业轮动策略,最后对该因子的落地应用做一些探讨。


3.1、简单ETF轮动策略的构建


第二章的样本池包括400只ETF跟踪指数,5分组后每一组仍有80个指数,每一组的ETF个数有点冗余。不仅如此,这400只ETF跟踪指数内部也有较强的同质性,例如新能源相关的指数包括国证新能源和中证新能源等,半导体相关的指数包括中证全指半导体和中华半导体芯片等。


因此我们考虑将ETF跟踪指数的样本池做一定的初筛,这里综合考虑了规模、流动性、指数属性以及其所暴露的风格和行业后,初筛了100只ETF跟踪指数作为投资底池。然后我们这个底池中根据第二章最后提到的资金流复合因子,每周五选取前10%ETF作为多头,后10%作为空头,按照下周一收盘价买入,下下周一收盘价卖出,周度调仓。








请到「今天看啥」查看全文