本文来自方正证券研究所于2024年4月12日发布的报告《
新闻中的有限注意力和“凸显效应”因子构建——多因子选股系列研究之十七
》,欲了解具体内容,请阅读报告原文,分析师:曹春晓 S1220522030005
。
一直以来,投资者尝试利用新闻数据构建有效因子,但构建有效策略的难度较大。简单来说,策略过程中遇到了几个主要挑战,这些挑战涉及到数据量、新闻质量、打分准确性及市场定价问题。
基于智普GLM4模型和新闻文本进行情感识别打分,获取大语言模型对每条新闻的情感评分,构建glm4_news_emo因子。回测区间内周频调仓的glm4_news_emo因子IC为1.2%,年化ICIR为1.3,多空年化收益率15.5%,信息比率0.95。大语言模型能够较大提升原有情感打分模型表现,在处理文本信息上具有显著优势。
基于新闻发布后市场的涨跌幅,截面均值距离化后构建news_reaction因子,我们可以看到在周频调仓下的因子表现十分稳定,周IC均值在-2.04%,年化ICIR -2.68,IC胜率63%。因子多空年化收益率20.78%,信息比率2.14,最大回撤-7.03%。
市场的注意力始终在极度利好、极度利空两类信息上,导致利好信息被过度定价,而利空很多时候会延续跌势;市场注意力越高、热度越高的股票后市都大概率下跌。
基于IFind股票热度数据,等权合成到日频维度数据,周度回测下的“凸显效应”因子多空年化收益率为33.02%,信息比率为3.19。周度IC均值为-3.13%,年化ICIR为-3.32。风格剥离后得到纯“凸显效应”因子,因子多空年化收益率为26.15%,最大回撤仅为-4.72%,信息比率高达3.76, 周度IC均值-2.44%,年化ICIR-3.49。
通过识别热度异常波动及其与涨跌幅方向不一致的时间点,这些时间点的涨跌幅通常具有动量效应,因此以此构建“热度异常”因子。“热度异常”因子周度IC为1.37%,年化ICIR达到1.97,多空年化收益10.89%,信息比率1.37,与主要风格因子相关性低,异质性强。
本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。
一直以来,投资者尝试利用新闻数据构建有效因子,但构建有效策略的难度较大。简单来说,策略过程中遇到了几个主要挑战,这些挑战涉及到数据量、新闻质量、打分准确性及市场定价问题。
1)数据量巨大且不稳定:
舆情数据源提供的信息量庞大,但其稳定性及可收集到的新闻量存在不确定性,这对数据供应商提出了较高的底层数据搜集能力、处理能力。此外,很多重复的、不及时的以及与基本面无关的新闻实际上都属于噪音,这进一步增加了因子、策略构建的难度。
2)不同信息来源的梳理:
不同的新闻来源和新闻类别对市场的影响各不相同,一些可能驱动价格动量,而另一些则可能引发价格反转。正确解读和分类这些信息源是实现策略效果的关键。
3)新闻打分的准确性和稳定性:
是否可以准确地给新闻内容打分,以及这种打分方法的准确度和稳定性,是一个关键问题。准确的打分对于评估新闻的影响和价值至关重要。
4)市场定价问题:
识别哪些新闻信息尚未被市场充分定价,以及预期之外新闻的识别,对投资者而言是一项挑战,如何影响市场但尚未被广泛认识到的信息,真正能推动股价上涨的信息是否真的会以新闻的形式出现?
在本报告中,我们尝试使用各种方式解决引言中提到的问题,我们首先使用了数库科技公司提供的舆情数据为基础,进行一系列研究,尝试解决以上问题。图表1为数库科技提供的新闻数据重要字段,其中有股票代码、新闻ID、新闻发布时间、新闻与股票相关性、文本情感打分和新闻标题文本。文本情感打分为一个情感打分分类,0为中性概率,1为正面概率,2为负面概率,三个概率和为100%。这些字段构成了新闻舆情数据的核心,帮助我们初步了解舆情数据。
通过图表2和3,可以观察到数库科技在过去一年中提供的月度新闻数据量已经突破50万条。该公司采取了高级数据清洗技术对原始文本资料进行优化处理,进而利用机器学习和深度学习算法对数据集进行评分与分类,以确保高覆盖度和数据质量。数据来源广泛,涵盖了新浪网、腾讯网和澎湃新闻等主流互联网新闻门户,以及东方财富、同花顺财经和中国经济网等专业财经网站。
基于新闻舆情数据中的emotiondetail字段,我们计算一个简易版本的新闻情绪因子,具体构建方式为每次回看过去7天的新闻数据,筛选股票相关性relavence>0.3 的新闻,然后计算单条新闻的news_emo,具体计算方式如下,
如emotiondetail为{0=0.0309,1=0.9668,2=0.0023}
,
其中0代
表中性打分概率,1为正面打分概率,2为负面,我们的计算方式为:
factor
= 0*0.0309+1*0.9668+(-1)*0.0023,再等权合成到股票维度作为新闻情绪因子,按照周度频率进行调仓测试,具体回测效果如下。
通过图表4和5,我们观察到利用原始数据所提供的新闻情绪打分构建的因子在长期表现上呈现出轻微的负相关性,这种趋势不是特别显著,波动性较大。因子的十分组单调性并不突出,且IC值的波动较大。
在初步构建的因子未能达到预期表现时,我们首先考虑的是情绪打分的准确性问题。考虑到对大量新闻内容进行精确的情绪评估本身具有挑战性。因此,本报告采用大语言模型对新闻文本进行情绪评分,以期提高因子的表现。
我们测试了一系列的国产大模型、openai 的gpt3.5、4.0,最终选择了智普ai开发的GLM-4模型。作为一款新一代认知智能大模型,GLM-4搭载了128K上下文窗口,能够处理单次提示下达300页的文本量。这一能力在总结信息、内容抽取、复杂推理及编程等多个场景下展现了对复杂长文本的卓越处理能力。技术上,GLM-4解决了长上下文信息处理中常见的精度下降问题,实现在needle test中几乎100%的精确召回率。在多项大模型评测中,GLM-4的性能接近或达到GPT-4的水平,包括MMLU、GSM8K、MATH、BBH、HellaSwag及HumanEval等重要指标。在指令跟随能力方面,GLM-4同样展现了优异表现,测试指标达到GPT-4水平的88%至100%。出于种种考虑,我们最终采用GLM-4大模型进行新闻舆情打分。同样的方式,我们通过大模型对所有基础新闻文本进行情绪打分,等权合成作为因子,回看周期同样为过去7天,进行周频、月频回测。由于测试成本等因素的限制,本报告将仅展示2018年至2020年5月期间大模型舆情因子的回测结果。
我们注意到,在回测期间,glm4_news_emo因子表现出色,具有良好的单调性,且没有出现显著的回撤或效果减弱的情况,周度IC达到1.2%,年化ICIR达到1.3,多空年化收益率达到15.5%,信息比率0.95。然而,我们也必须客观地认识到,这段时间内新闻数据所展现的动量效应可能更为显著,这可能与当时的市场风格和其他相关因素有较强的关联。因此,我们不能直接得出glm4_news_emo在识别对股价有显著影响的信息方面,相比于数库科技提供的原始情感打分具有明显优势的结论。
图表10显示,在回测期间,大模型打分生成的因子glm4_news_emo相较于scope_news_emo在IC表现上长期保持领先,展现出较高的稳定性及因子表现的高度相关性,这表明信息主要源自新闻文本,且未出现明显回撤。
通过图表11的分析,我们进行了一项对GLM4_Score打分与原始情感打分差异较大实例的随机抽样检查,采用人工核查方法来探索两种打分系统之间的差异。观察结果显示,尽管两个模型在某些情况下各有其优势,但总体而言,GLM4的打分似乎更为合理。这项发现帮助我们回答了关于原始情感打分准确性的疑问,表明为了提高新闻文本打分的精确度,采用更先进的大语言模型是构建有效因子和策略的关键步骤之一。
随着新闻数量的爆炸性增长,一个不可避免的疑问浮现:实际上有多少新闻携带着真正有价值的信息,即那些可能对股价产生影响而市场尚未充分消化的信息。识别这类新闻至关重要,因为在我们的日常观察中,市场经常呈现出“利空消息已出尽,利好消息兑现即下跌”的局面。这要求我们不仅要精准地分析和理解新闻内容,还要能够评估其对股价的潜在影响,从而在众多信息中筛选出那些真正能够为投资决策带来价值的新闻。
如图表12所示,排名靠前的新闻大多与社会责任相关或仅描述市场行情。基于投资经验,社会责任相关新闻对股价的影响较为缓慢,而描述上涨或涨停股票的市场行情新闻在中短期内往往伴随反转效应。与此相反,能快速且持续推动股价上涨的通常是业绩公告或分析师点评等信息。但是,当所有信息等权重处理时,这些关键信息容易被噪音和不相关的信息淹没。因此,本章节通过分析新闻发布后的市场波动性和动量来捕捉市场对新闻的反馈,旨在构建一个新的因子,有效识别对股价具有实质性影响的新闻,以提高信息筛选的准确性和降低噪声影响。
为深入理解新闻发布后市场的即时反应,我们专注于短期市场表现,通过精细观察新闻后续的市场动态来揭示其对股票收益率的影响。具体而言,考虑到新闻的发布时间通常位于非交易时段,我们选择在新闻发布后的第一个交易日,计算开盘后首个15分钟内的股票表现,使用分钟级别频率数据来计算此时段内收益率的平均值与标准差。这种方法使我们能够准确捕捉到市场对新闻的短期反应,评估新闻影响力。
在本研究中,我们根据以上所述,构建了news_reaction_mean与news_reaction_std,旨在捕捉市场对新闻发布的短期反应。这两个因子分别代表了我们所关注时间段内股票收益率的平均值和标准差,为我们提供了对市场反应敏感度和波动性的直接测量。
具体操作流程中,我们系统地回顾了过去7天内发布的所有新闻,对这些新闻进行了等权重的处理,计算得到每条新闻对应时间窗口内的收益率平均值和标准差,并将这些数据聚合到股票维度。这样的方法主要是为了获得市场对新闻即时反馈,解决“利空出尽”、“利好兑现”两种场景,新闻发布的时间点,及市场的反馈更重要,而不是新闻本身的情感打分。
根据图表14和图表15,我们可以观察到一个明显的现象,那些在新闻发布后表现出较大涨幅或跌幅的股票,其后续表现往往会进一步下跌。相反,那些在初期涨跌幅适中的股票,在后续可能会展现出更佳的表现。基于这一发现,我们决定对news_reaction_mean因子进行截面均值距离化处理,即我们将因子值分布的两端均纳入空头组合,称为news_reaction因子,以探索因子在预测股价未来走势中的有效性。
根据图表16,我们注意到通过对因子距离化处理后,因子的单调性显著增强。我们将原因子的多头端和空头端都通过均值距离化后纳入空头,这种做法基于市场中存在的一种持续性利空效应的观察,如盈余公告效应中的空头端现象,以及在多头端,对于大多数普通投资者而言,新闻发布后股票的快速上涨往往预示着随之而来的快速下跌。通过这种去极化的处理,我们的因子更能捕捉到市场中这种持续的利空延续存在的效应,从而提高了因子预测市场走势的准确性。
根据图表17和18,我们可以看到在周频调仓下的因子表现十分稳定,周IC均值在-2.04%,年化ICIR -2.68,IC胜率63%。因子多空年化收益率20.78%,信息比率2.14,最大回撤7%;几乎和各个大类因子相关性较低,剥离之后仍然有效。
进一步我们考察新闻发布后15分钟内收益率的波动率,考察市场对新闻反应的一致性,波动率越大代表市场分歧越大,反之代表市场分歧越小,同样回看过去一周的新闻,等权合成每个股票的波动率,得到news_reaction_std因子。
通过图表21我们观察到news_reaction_std因子显示出了良好的十分组收益单调性。这意味着,如果在新闻发布后时间为15分钟内股票收益率的波动率较高,这通常表明市场对某一消息的解读存在较大的分歧,导致未来收益显著为负。这种现象可能反映了市场在短期内对信息反应的不确定性和投资者预期的分歧。另一方面,较低的波动率并不直接预示着较高的收益。
但基于这样时点的波动率因子还是与其他普通时点测算出来的波动率因子表现类似,说明在新闻发布时点上可能存在大量噪音,即新闻存在重复发布问题。
如图表24和25所示,在回测期间,news_reaction_std因子实现了21.95%的多空组合收益,同时最大回撤为-8.75%。该因子主要收益来源于空头组合,与news_reaction因子相似,表现出多头超额收益的不显著性。此外,与主要市场风格因子的相关性低。剥离主要风格因子影响后,news_reaction_std因子表现仍然稳定。从剥离主要风格因子相关性后,我们发现新闻发布后波动率处于中等水平的股票在多头组合中获得显著且稳定的超额收益,而空头持续有效,表明在这样的因子构建上,可能为一个非线性的因子模型。
3
新闻的注意力机制和“凸显效应”
在本研究的第二节中,我们分析了目前使用新闻舆情数据时可能面临的问题、采取了多种方法尝试解决。首先,我们确保能够及时获取并处理数据,选择了能够快速提供新闻舆情数据的供应商,这方面数库科技能够较好完成基础任务。另一方面,利用先进的大型模型进一步提升了新闻文本情感打分的准确性,尝试增强选股策略表现。
我们发现一个重要的现象:市场的关注度总是有限的,且注意力总是集中在热度极高的股票:无论这种热度是由正面还是负面新闻驱动——它们的未来表现往往会展现出显著的负向收益。这一现象揭示了市场投资者的有限注意力特征,即市场倾向于对利好消息过度定价,而在利空消息出现时,机构投资者的持股情况及其减仓节奏将影响股票的未来价格走势。这强调了避免随波逐流、谨慎处理市场的热点和噪声,更多把注意力放在基本面改善加低关注度股票上。
在进一步的因子探索中,我们选用了同花顺提供的股票热度数据,一种融合了该平台新闻动态、用户论坛讨论等多元信息源的指标数据。该数据的更新频率为15分钟,自2022年开始提供,目的是为了即时映射出市场情绪和投资者的关注度变化。用户互动、论坛讨论或新闻报道的任何显著变动,均能影响到热度指数的波动。基于这一数据,我们构建了“凸显效应”因子,其构建方法是将15分钟频率的数据等权重合成为日频数据。通过这种方式,我们旨在捕捉到股票的新闻热度水平:选择那些热度较低的股票,同时避免投资于热度较高的股票。这样的策略基于一种假设,即市场的注意力是有限的,投资者往往会被热门话题所吸引,而忽略掉那些可能具有潜在价值但当前并不受到广泛关注的股票。“凸显效应”因子正是试图利用这种市场心理现象,通过筛选出热度较低的股票来寻找未被充分发掘的投资机会。
“凸显效应”因子在回测期间的表现相当出色,多空年化收益率为33.02%,信息比率为3.19。周度IC均值为-3.13%,年化ICIR为-3.32。这一表现突显了该因子在捕捉市场未充分反映的价值方面的有效性。然而,我们也必须承认,低热度股票往往在市值风格上存在一定的偏好,倾向于选择小市值股票。正如图表30所示,与主要市场风格因子的相关性分析中,与市值因子的相关性高达26%。这一现象尤其在2024年春节前后的小微盘股回撤期间显得尤为明显,因子空头配置中大市值股票的倾向性增强,对收益的影响较为显著。
我们尝试将“凸显效应”因子剥离所有常见风格因子,尝试提纯一些新闻关注度、热度的收益来源,以此避免受到风格因子表现波动影响。回归主要风格因子后的“凸显效应”因子表现优异,年化多空收益率为26.15%,最大回撤仅为-4.72%,信息比率高达3.76。特别在2024年春节前后,面对小微盘股回撤,该因子表现稳健,多空净值创新高。周度IC均值-2.44%,年化ICIR-3.49,周胜率69.8%,证明了纯“凸显效应”因子的有效性和稳定性。
在本研究中我们转向探讨股票热度数据的另一种应用,即通过捕捉热度的显著变化点来识别潜在的市场机会。与“凸显效应”因子构建方法不同,我们希望找到一些热度突然提升、下降的时刻,结合量价提取特征。具体而言,通过计算每只股票过去一周内热度数据的15分钟频数据变化差值及其统计特征。基于此,我们定义了异常热度变化的阈值为均值加减5倍标准差,以此来界定热度的显著升高或降低时刻。核心逻辑在于识别那些可能因为特定新闻事件或市场情绪变化而引起热度异常波动的股票。
新闻、热度数据可以表征为个人投资者对股票关注度的指标。根据有限注意力机制,个人投资者倾向于将其注意力聚焦于极端利好或利空的消息上。因此,当股票的涨跌方向与热度变化方向不一致时,应引起投资者的高度警觉。特别是在热度上升而股票价格下跌的情况下,这往往预示着可能的利好消息已经被市场充分消化。
在分析热度异常变化的时间段中,进一步筛选出那些市场涨跌幅与股票热度变化方向不一致的时间段。我们根据这些特定时间段内的股票涨跌情况,计算出相关时间段的涨跌幅。依此为基础,通过回顾过去一周的数据,我们计算出这些特殊时间段涨跌幅的平均值,从而构建了“热度异常”因子。
“热度异常”因子在回测期间展现了10.89%的多空年化收益率,信息比率达到1.37,主因在于该因子并非呈完全单调线性,第十分组的收益表现一般。但从总体上看,因子仍呈现出一定的动量趋势。周度IC为1.37%,年化ICIR达到1.97,显示出较好的表现。此外,该因子与主要风格因子的相关性较低,展现了较强的特异性。
一直以来,投资者尝试利用新闻数据构建有效因子,但构建有效策略的难度较大。简单来说,策略过程中遇到了几个主要挑战,主要涉及到数据量、新闻质量、打分准确性及市场定价问题。
基于智普GLM4模型和新闻文本进行情感识别打分,获取大语言模型对每条新闻的情感评分,构建glm4_news_emo因子。回测区间内周频调仓的glm4_news_emo因子IC达到1.2%,年化ICIR达到1.3,多空年化收益率15.5%,信息比率0.95。
大语言模型能够较大提升原有情感打分模型表现,在处理文本信息上具有显著优势。
基于新闻发布后市场的涨跌幅,截面均值距离化后构建news_reaction因子,我们可以看到在周频调仓下的因子表现十分稳定,周IC均值在-2.04%,年化ICIR -2.68,IC胜率63%。因子多空年化收益率20.78%,信息比率2.14,最大回撤-7.03%。
市场的注意力始终在极度利好、极度利空两类信息上,导致利好信息被过度定价,而利空很多时候会延续跌势;市场注意力越高、热度越高的股票后市都大概率下跌。基于IFind股票热度数据,等权合成到日频维度数据,周度回测下的“凸显效应”因子多空年化收益率为33.02%,信息比率为3.19。周度IC均值为-3.13%,年化ICIR为-3.32。风格剥离后得到纯“凸显效应”因子,因子多空年化收益率为26.15%,最大回撤仅为-4.72%,信息比率高达3.76, 周度IC均值-2.44%,年化ICIR-3.49。
通过识别热度异常波动及其与涨跌幅方向不一致的时间点,这些时间点的涨跌幅通常具有动量效应,因此以此构建“热度异常”因子。“热度异常”因子周度IC为1.37%,年化ICIR达到1.97,多空年化收益10.89%,信息比率1.37,与主要风格因子相关性低,异质性强。
本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。