文:
民生
策略团队
联系人:牟一凌/季宏坤/
梅锴
【报告导读】
我们建立了从市场整体情绪、不同参与者情绪、行业情绪与关注度、多资产联动等视角来度量市场“温度计”,未来将及时发布跟踪结果。当下市场情绪已有所改善,客观指标指示有上行可能的行业:石油石化、有色、化工、轻工、电新、军工、汽车、食品饮料、传媒。
投资情绪是短期扰动市场的关键因素之一,虽然投资者情绪的波动难以直接准确地预测,但一些数据却能提供更为清晰的市场脉动,为我们至少量化刻画情绪的强度与相对位置,形成持续的观测指标。我们选取
IPO的数量、上市首发收益、成交量、封闭式基金的折价率、消费者信心指数和新增投资者开户数
等6项指标,通过主成分分析,构建了中国股票市场投资者情绪综合指数(CICSI)。
CICSI走势与A股走势高度相关,在A股明显拐点处CICSI领先于A股一个月。当市场整体投资情绪修复时,往往伴随着市场的阶段反弹。
进一步的,我们将CICSI拆解成两部分,一部分是与宏观基本面因素的变化相关,另一部分是与
剔除宏观基本面因素后
的变化相关。前者或可类比于影响公司盈利,后者或可类比于影响市场估值。
为了刻画不同的参与者,我们将整体分为个人投资者和非个人投资者(机构投资者),
我们通过股吧的发帖信息,用深度学习的方法对发帖内容进行情感分析,并以阅读数和评论数作为权重,来刻画个人投资情绪;用净主动买入额剔除掉个人投资情绪后的部分来刻画机构投资情绪。个人投资情绪和机构投资情绪相结合可以用来判断市场位置或预示市场未来可能的短期走势:
个人投资情绪已明显下行且机构投资情绪已明显上行时往往对应着市场低点,市场或将反弹;个人投资情绪仍在上行但机构投资情绪已明显下行时往往对应着市场高点,市场或将回落。进一步的,我们通过构建中信一级各行业常用词库,并将发帖内容进行jieba分词处理,通过分词来锁定发帖内容所属行业,从而可以
构建行业层面的投资情绪
。同时,将分词结果汇总到中信一级行业后,我们用某一行业的词频占当日总词频的比例作为个人投资者对于该行业的相对关注度。由于
相对关注度
在不同行业间是“此消彼长”的,但有时我们也需要了解某一板块的绝对关注度情况。因此,我们用行业词频/行业加权股东户数来刻画行业绝对关注度,即单位个人投资者对行业的关注强度。绝对关注度更多是自身行业当下与自身行业过去的关注度相比,不同行业的绝对关注度是可以“同涨同跌”的。
行业相对关注度更适用于震荡行情,以及追踪不同行业间关注度的迁移;而行业绝对关注度更适用于明显的趋势行情
,同时对于行业绝对关注度的加总可以反映个人投资者对市场整体关注度的变化。无论是行业相对关注度还是绝对关注度,
在个人投资者参与越多的行业,越能准确刻画行业热度,当行业关注度过高时或预示该行业有所拥挤。
A股短期走势并不只受自身内部情绪因素等影响,还可能受到系统性的外部因素影响,这类因素对多类资产均有影响,具体表现为A股与债券、商品、汇率、美股和港股等资产的相关性显著上升。
我们通过计算多类资产的协方差矩阵,构建了多资产联动指标,来提示市场是否正受到明显宏观扰动,且该扰动在多资产维度得到了交叉验证。
从历史来看,
A股明显的拐点往往伴随着多类资产相关性的大幅提升。
4
当下市场情绪已有所改善,客观指标指示有上行可能的行业:
石油石化、有色、化工、轻工、电新、军工、汽车、食品饮料、传媒。
各项监测指标所带来的投资指引主要有:(1)市场内部整体来看,
8月CICSI显示市场整体投资情绪已有所改善,且当下CICSI与宏观经济因素相关性在减弱。
(2)多资产联动来看,
A股近期并未受到明显的外部因素影响。
(3)市场参与者来看,上周(20240826-20240830)
个人投资情绪和机构投资情绪均上行,
这种投资者情绪组合预示着
市场阶段或延续偏强走势。
(4)行业情绪来看,
石油石化、有色、化工、轻工、电新、军工、汽车、食品饮料、传媒
等板块未来短期或有所上行,建筑、商贸零售、消费者服务、纺服、医药、银行、房地产、交运等板块未来短期或有所下行。(5)个人投资者行业关注度来看,上周(20240826-20240830)
食品饮料、消费者服务、通信、军工、家电、银行
等板块的相对关注度上升较明显,
电新、医药、商贸零售、传媒、非银、机械
等板块的相对关注度下降较明显;
军工、家电、石油石化、交运、商贸零售、机械
等板块的相对关注度处于80%历史分位数以上。
投资者在进行投资决策时容易受到情绪的驱动,而投资情绪的起伏源于人的心理特点和行为偏好,贪婪与恐惧是市场中天然的不确定性。投资情绪的波动可能会导致市场价格的剧烈波动,这种波动往往超过了基本面所能解释的范畴,因此投资情绪成为短期扰动市场的关键因素之一。我们尝试将投资情绪具象化,系统性的追踪了市场整体投资情绪和市场不同参与者投资情绪。除对市场内部投资情绪的跟踪外,我们还从多资产的视角跟踪了市场短期是否正在受到明显的外部因素影响。我们尝试为市场短期波动的原因提供一些视角,并且未来将继续发布跟踪结果,从而为市场短期可能存在的机会或风险做出提示。
虽然投资者情绪的波动难以直接准确地预测,但一些数据却能提供更为清晰的市场脉动,为我们至少量化刻画情绪的强度与相对位置,形成持续的观测指标。例如,IPO的数量和上市首发收益能够反映市场的热度和风险偏好;成交量则反映了市场活跃度和投资者的交易热情;封闭式基金折价率揭示了投资者对特定资产的评估与实际价值之间的偏差;消费者信心指数直观反映了普通民众对经济前景的信心程度;而股票账户新增开户数则显示了市场吸引新参与者的能力。
基于此,我们选取了3个能反映情绪的交易数据指标:
成交量、上市首发收益、封闭式基金折价率
,以及3个能反映情绪的客观数据指标:
IPO的数量、消费者信心指数、新增投资者开户数
,共6项指标作为构建投资情绪的基础指标。考虑到指标反映情绪的领先与滞后效应,首先对6组指标(每组包含同一变量的t期值和t-1期值)共12个指标进行主成分分析。对比同一组的t期和t-1期指标的系数贡献,选出最重要的6个指标,构建最终的中国股票市场投资者情绪综合指数(CICSI)。结果来看,
CICSI走势与A股走势高度相关,在A股明显拐点处CICSI领先于A股一个月。当市场整体投资情绪修复时,往往伴随着市场的阶段反弹。
CICSI与股价高度相关,那么我们可以像拆解股价一样进一步拆解CICSI。CICSI其实蕴含着两部分:一方面是由一些宏观变量所代表的基本面因素,这些因素更多的可能会影响公司盈利;另一方面是除去基本面因素外投资者所给出的额外情绪波动,类似于市场估值。
我们选取一些能够代表中国内部宏观经济的变量,同时这些变量又与企业盈利的相关性较高,具体有:
规模以上工业增加值同比、CPI同比、PPI同比、固定资产投资完成额累计同比、制造业PMI、社零同比、M2同比等。
分别将CICSI的6项子指标与宏观变量回归,用回归的残差来表示剔除宏观因素后的指标,并根据上文同样的步骤构建了剔除宏观因素后的CICSI。
结果来看,CICSI(剔除宏观经济因素)恰好与万得全A的PE走势高度相关。
为了刻画不同的参与者,我们将整体分为个人投资者和非个人投资者(机构投资者)。
我们通过股吧的发帖信息,用深度学习的方法对发帖内容进行情感分析,并以阅读数和评论数作为权重,来刻画个人投资情绪;用净主动买入额剔除掉个人投资情绪后的部分来刻画机构投资情绪。
2.1 个人投资情绪与机构相对个人投资情绪强度
本文通过股吧数据,包括每条发帖的阅读数、评论数、内容和发帖时间等信息,共计600多万条发帖信息。经过数据预处理后,
本文使用Senta深度学习的方法对发帖内容逐条进行情感分析,并用每条发帖的阅读数和评论数作为权重,得出每一天的加权情感。
由于贴吧的发帖绝大多数都是由个人投资者发帖,因此将其定义为“个人投资情绪”。另一个角度来看,市场整体的投资情绪可以反映在投资者的买入行为中。
买入行为可分为主动买入和被动买入。市场的上涨主要由主动买入行为驱动,同时投资者情绪高涨时,也主要通过主动买入来进行交易。
净主动买入额不仅可以反映个人投资情绪,还可反映除个人投资者外其他投资者投资情绪。因此,我们将净主动买入额和个人投资情绪进行归一化处理,用
净主动买入额减去“个人投资情绪”后的部分作为“机构相对个人投资情绪强度”,简称“机构投资情绪”
[1]
。
[1]
这里的机构投资情绪更准确地说应该是除了在股吧发帖的投资者以外的投资者情绪,为了方便表述我们把不在股吧发帖的投资者概括为机构投资者。
个人投资情绪和机构投资情绪相结合可以用来判断市场位置或预示市场阶段走势。
通过复盘2016年以来市场拐点时所对应的个人投资情绪和机构投资情绪发现,绝大多数时间,
个人投资情绪已明显下行且机构投资情绪已明显上行时往往对应着市场低点,市场即将反弹;个人投资情绪仍在上行但机构投资情绪已明显下行时往往对应着市场高点,市场即将回落。
此外,如图8所示,我们给出了其他个人投资情绪和机构投资情绪不同组合时所可能预示的未来市场走势。
此外,我们还构建了行业层面的投资情绪。首先,我们构建了
中信一级各行业常用词库
,共计6942个词语。然后
将发帖内容进行jieba分词处理,将分词汇总到中信一级行业
。若某一发帖包含某一行业词库的词语,则把该条发帖归类于该一级行业下(每一条发帖可能同时被归类于两个或以上的一级行业)。将同一一级行业下的每条发帖的阅读数和评论数作为权重,用Senta情感分析的方法计算出
行业层面的个人投资情绪。
再根据上文类似的方法,用行业的净主动买入额剔除掉行业层面的个人投资情绪,从而计算出
行业层面的机构投资情绪。
与全A层面类似,对于某一行业,不同个人投资情绪和机构投资情绪的组合同样或可预示着该行业短期内的市场走势(参照图8)。
2.2 个人投资者对不同行业关注度
除投资情绪外,我们还需要了解某一行业的关注热度。因此,我们提供了一个从个人投资者对于行业关注度的视角来进行跟踪。根据上文提到的对发帖内容进行分词,将发帖的分词词频进行统计,并将词频汇总到中信一级行业,可得行业层面的词频,
某一行业的词频占当日总词频的比例作为个人投资者对于该行业的相对关注度
。
行业相对关注度的变化主要用于刻画行业相对热度的变化,相对关注度在不同行业间是“此消彼长”的。
但有时我们也需要了解某一行业的绝对关注度情况,
绝对关注度更多是自身行业当下与自身行业过去的关注度相比,不同行业的绝对关注度是可以“同涨同跌”的。
由于个人投资者数量会影响词频的数量,为剔除投资者数量变化的影响,本文首先计算了加权股东户数。加权股东户数是以个股的股东户数为基础,根据个股的自由流通市值作为权重,可计算A股整体和中信一级行业的加权股东户数。由于个人投资者的户数远多于机构的户数,且机构户数较为稳定,因此股东户数的变化可以反映个人投资者数量的变化。我们将加权股东户数拆解成中长期项(趋势项+周期项)和短期项(残差)后发现,
加权股东户数中长期走势与万得全A走势相关性明显,同时加权股东户数短期内明显上升时往往对应市场底部。
我们用
行业词频/行业加权股东户数来刻画行业绝对关注度
,即单位个人投资者对行业的关注强度
,从而剔除了由于个人投资者数量的增多所带来词频数量增多的影响。
行业相对关注度更适用于震荡的行情,以及追踪不同行业间关注度的迁移;而行业绝对关注度更适用于明显的趋势行情,
同时对于行业绝对关注度的加总可以反映市场整体关注度的变化。
需要注意的是,由于市场中不只有个人投资者,所以,
无论是行业相对关注度还是绝对关注度,
在个人投资者参与越多(加权股东户数越高)的行业,越能准确刻画行业热度,当行业关注度过高时或预示该行业有所拥挤
。
前文主要讨论了
A
股内部的投资情绪以及行业关注度的变化,接下来我们跟踪
A
股是否正在受到明显的外部因素的影响。由于不同资产价格的影响因素不尽相同,其联动关系也呈现了明显的时变关系。举例来说,当金融市场遭遇重大危机时,投资者对各类资产的风险偏好普遍下降,导致流动性危机加剧,表现为各类资产之间相关性显著提高。同时,当金融市场流动性显著宽松时,所有的风险资产会同时得到提振,也会表现为各类资产之间相关性的提升。这类影响
A
股的因素可以将其定义为外部因素。
我们从多资产视角来看A股,通过构建多资产联动指标,来提示市场是否正受到明显宏观扰动,且该扰动在多资产维度得到了交叉验证。
我们以国内股票市场为主,构建多资产联动指标。我们选取了国内股市(万得全A)、债券(中债指数)、汇率(人民币中间价)、商品(CRB指数)、美股(标普500)和港股(恒生指数),计算协方差矩阵,再求非对角线元素的均值,作为多资产联动指标。从历史来看,
A股明显的拐点往往伴随着多类资产相关性的大幅提升。
4
当下市场情绪已有所改善,客观指标指示有上行可能的行业:石油石化、有色、化工、轻工、电新、军工、汽车、食品饮料、传媒
总体来看:(1)8月CICSI指标显示A股市场整体投资情绪已有所改善。(2)A股目前并未受到明显的外部因素的影响。(3)个人和机构投资情绪均上行,该指标指示市场阶段或延续偏强走势。(4)个人投资者对市场整体关注度并没有明显提升,主要是行业间的迁移。
具体来看:
市场内部整体层面,
8月CICSI显示市场整体投资情绪已有所改善,且当下CICSI与宏观经济因素相关性在减弱。
多资产联动层面,
A股近期并未受到明显的外部因素影响。
市场参与者层面,上周(20240826-20240830)
个人投资情绪和机构投资情绪均上行,
这种投资者情绪组合预示着
市场阶段或延续偏强走势。
行业情绪层面,
上周(20240826-20240830)
石油石化、有色、化工、轻工、电新、军工、汽车、食品饮料、传媒
等板块未来短期或有所上行,建筑、商贸零售、消费者服务、纺服、医药、银行、房地产、交运等板块未来短期或有所下行。个人投资者行业关注度层面,上周(20240826-20240830)
食品饮料、消费者服务、通信、军工、家电、银行
等板块的相对关注度上升较明显,
电新、医药、商贸零售、传媒、非银、机械
等板块的相对关注度下降较明显;
军工、家电、石油石化、交运、商贸零售、机械
等板块的相对关注度处于80%历史分位数以上。
1)测算误差
。数值模型是对历史的拟合,拟合本身存在误差,另外,统计样本本身也可能造成测算结果的误差。