专栏名称: 量化投资与机器学习
公众号主要介绍关于量化投资和机器学习的知识和应用。通过研报,论坛,博客,程序等途径全面的为大家带来知识食粮。版块语言分为:Python、Matlab、R,涉及领域有:量化投资、机器学习、深度学习、综合应用、干货分享等。
目录
相关文章推荐
爱可可-爱生活  ·  【[104星]Vision-R1:首个探索如 ... ·  20 小时前  
AI前线  ·  团队“DeepSeek”化!字节 Seed ... ·  昨天  
爱可可-爱生活  ·  [CL]《Knowledge ... ·  2 天前  
51好读  ›  专栏  ›  量化投资与机器学习

Robeco:使用机器学习发现被错误定价的股票

量化投资与机器学习  · 公众号  · AI  · 2022-09-29 13:47

正文

量化投资与机器学习微信公众号,是业内垂直于 量化投资、对冲基金、 Fintech、人工智能、大数据 领域的 主流自媒体 公众号拥有来自 、私募、券商、期货、银行、保险、高校 等行业 30W+ 关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2 年被腾讯云+社区评选为“年度最佳作者”。

来自: Finance Research Letters 48 (2022)
作者: Matthias X. Hanauera, Marina Kononovab, Marc Steffen Rappb
标题: Boosting agnostic fundamental analysis: Using machine learning to identify mispricing in European stock markets

股票基本面分析有效吗?分析师应该如何得出股票基本面价值?虽然理论文献已经开发了贴现现金流模型和其他高度程式化的基础估值模型,但BG(2018、2021,以下称BG)最近提出了一种不可知论方法来进行基础分析。作者“以一名缺乏金融知识的统计学家的观点”(BG, 2018,第125页),并使用线性回归分析将公司的股本市值代理为21个常用报告和现成会计项目的线性函数。
BG表明,偏离其“同行隐含公允价值”可以可靠地预测美国(BG, 2018)和世界上大多数地区(BG, 2021)的未来回报。然而,有趣的是,BG提出的策略似乎在欧洲不起作用,这是相当令人费解的,因为文献发现了欧洲股票市场缺乏效率的充分证据。有人可能会说,这是因为BG并不是完全的不可知论者。事实上,尽管BG对预测因素的相关性不可知,但它们在市场价值和基本面之间强加了一种线性关系。即使在概念上是合理的(例如,Ohlson, 1995),这一假设也是自由裁量的。
本文站在数据科学家的角度(同样只有很少的金融知识),让数据自己说话,应用线性回归和机器学习方法估计了1993-2019年17个欧洲国家股票的每月公允价值,并研究了相应错误定价信号的收益可预测性,即股票基于模型的公允价值与其实际市场价值之间的差异。LR方法与BG(2018年、2021年)密切相关。对于ML,我们应用LASSO对21个会计变量及其全套交叉积,以及基于树的回归方法。此外,我们还结合了随机森林和梯度增强树。
用BG(2021)建议的会计变量训练模型,我们的主要发现可以总结如下:
  • 首先,比较LR和ML模型,我们发现通过SHAP值测量的预测因子的重要性存在显著异质性。
  • 其次,研究了基于错误定价信号的交易策略,我们发现基于树的ml交易策略获得了显著的风险调整后的投资组合(市值加权)收益(“alpha”),为48-66bp/月,远远优于LR交易策略。这些结果在不同的特征构建的模型和不同的投资组合构建选择中都是稳健的。
  • 第三,在Fama MacBeth(1973)的横截面回归中,只有ML方法仍然高度显著,而LR方法几乎没有预测收益的能力。
  • 第四,虽然通过应用LASSO强加参数简约性相比简单LR提高了预测能力,但这样的方法并不能产生与基于树的ml的策略相媲美的收益的交易策略。
  • 最后,三种基于树的ML方法的性能非常相似,集成的ML模型相比单独的树模型有一点优势。我们的发现证明了在基础分析中考虑非线性和相互作用的重要性,以及欧洲股票市场的低效。
关于本文使用的数据,首先,我们从1987-2019年期间在欧盟17国(欧盟15国、瑞士和挪威)注册的公司中排除了非普通股股票、海外上市、二次上市、金融公司和总资产非正或缺少行业标识的公司。此外,我们要求BG(2021)中使用的所有会计变量都有非缺失值。最后,我们用每月1000万美元市值的门槛剔除了小盘股。我们最终的样本包括8121家独特的公司。附录A提供了关于变量定义(一共21个会计变量)、来源和清理的详细信息。






请到「今天看啥」查看全文