在早期的研究中,Connor et al. (2012) 和 Fan et al. (2016b) 通过将 beta 视为条件特征的非参数函数,从而实现 beta 的非线性设定(但与 IPCA 不同,为了可解释性,这些特征在时间维度上是固定的)。利用这一框架,Kim et al. (forthcoming) 研究了能够对冲掉因子风险的“套利”组合的行为。
Gu et al. (2021) 利用神经网络将 beta 表述为特征的非线性函数,从而扩展了 IPCA 模型。图 4.3 展示了他们的“条件自编码器”(CA)模型。图 4.3 揭示了其基本结构,该结构与 (4.8) 的不同之处在于,它通过非线性激活函数传递输入数据(工具变量 )。CA 是首个明确同时考虑风险和收益的股票收益率深度学习模型。其结果表明,尽管就总体 而言 CA 和 IPCA 表现相当,但在预测性 方面,它大大超过了 IPCA。换句话说,CA 能够更准确地计算资产因暴露于因子风险而获得的条件补偿。(译者注:如果使用线性激活函数,则 CA 基本上和 IPCA 等价;但由于使用了非线性激活函数,从而使 CA 能够描述协变量和收益率之间潜在的非线性关系。不过从他人后来复现的实证结果来看,虽然 CA 因能捕捉非线性而更具潜力,但是 IPCA 在样本外的表现似乎始终优于 CA。)
Gu et al. (2021) 是一个高度复杂的模型。其出色的实证表现暗示着,对于因子模型而言,复杂性提升带来的好处可能与 Kelly et al. (2022a) 在市场择时研究中所发现的效果类似(译者注:即复杂度可以提升样本外表现。)。Didisheim et al. (2023) 正式提出了上述观点并证明了因子定价模型中复杂性的优越性。他们的分析是基于条件随机贴现因子(SDF)视角展开。一般而言,SDF 可以被表述为一组风险资产的投资组合:
随着可交易资产越来越多的以及它们的高频交易数据越来越多,数据可得性的提升为估计单个资产的风险及其相互依赖性提供了独特的机会。通过简单的非参数化波动率和协方差,Andersen and Bollerslev (1998)、Andersen et al. (2001) 以及 Barndorff-Nielsen and Shephard (2002) 展示了如何利用丰富且及时的日内价格数据更好地了解资产市场的波动。使用高频指标有助于解决研究低频时间序列时面对的若干挑战。例如,它帮助研究者在无需依赖太多假设的前提下,来处理结构性变化和时变的参数。此外,对于日内数据建模而言,经典时间序列分析中关于线性、平稳性、依赖性和异方差性的许多标准假设往往是不必要的。
对于成功构建投资组合而言,准确的协方差估计至关重要。但是,由于维数灾难问题,估计高维协方差矩阵是一个极具挑战性的统计问题。许多方法依赖于各种形式的收缩以改进估计(Bickel and Levina 2008a; Bickel and Levina 2008b; Cai and Liu 2011; Ledoit and Wolf 2012; Ledoit and Wolf 2004)。受 APT 启发,Fan et al. (2008) 考察了包含可观测因子的严格因子模型,并提出了基于因子模型的协方差矩阵估计量,而 Fan et al. (2013) 则转而研究了包含隐性因子的近似因子模型,并提出了相应的估计量。
当面板数据的(横截面)维度接近样本大小时,在高频数据中使用因子结构式必要的。然而,低频和高频数据中的计量经济学方法在本质上存在差异。后者通常基于一个通用的连续时间半鞅模型,允许收益率的变化中出现随机变化和跳跃。针对日内数据,Ait-Sahalia and Xiu (2019) 提出了非参数 PCA 的渐近理论,为在连续时间中应用因子模型铺平了道路。此外,基于连续时间因子模型,Fan et al. (2016a) 和 Ait-Sahalia and Xiu (2017) 使用高频数据提出了个股高维协方差矩阵的估计量。
一个充满前景的研究方向是将关于高频风险度量的文献与关于预期收益率横截面的文献相结合,从而利用更丰富的风险信息来获得有关风险-收益权衡的深入见解。在这个方向上的一些相关研究包括 Bollerslev et al. (2016)。他们在连续时间框架下计算了个股对单一市场因子运动中连续和跳跃两部分各自的 beta 值,然后在离散时间框架中将研究了上述 beta 估计值和股票预期收益率的截面关系。Ait-Sahalia et al. (2021) 在统一的连续时间框架下为风险溢价提供了统计推断。他们在第一步考虑多个因子和随机 beta 值,并将通过第一步估计得到的 beta 应用于第二步中,进而扩展了 Shanken (1992a) 的经典推断方法。在实证方面,他们使用 Ait-Sahalia et al. (2020) 使用 15 分钟收益率构造的 Fama-French 和动量因子,检验了日内收益率的因子模型。
利用高频数据测量波动率的想法也使得有关波动率预测的研究充满前景。Corsi (2009) 提出的测量历史已实现波动率的异质自回归(HAR)模型已是当前学术研究和业界实践中领先的波动率预测模型。最近,有许多论文研究如何通过机器学习进行波动率预测,包括 Li and Tang (2022) 以及 Bollerslev et al. (2022)。但与收益率预测时机器学习预测的有效性体现为更高的夏普比率不同,对于波动率预测而言,人们尚不清楚机器学习模型能否以及在多大的经济学意义上超越了已有的 HAR 模型。这是研究中一个有趣的开放性问题。
自从 CAPM 以来,金融经济学界便开始共同寻找异象;即能获得 CAPM 无法解释的 alpha 的投资组合。其中的一些,如规模、价值和少数其他因子已被纳入基准定价模型中(Fama and French 1993;Fama and French 2015)。之后,一旦研究者发现这些基准模型无法解释的 alpha 时,就宣布找到了新的异象。Harvey et al. (2016) 对此进行了综述并整理了一个超过三百个异象的清单。他们提出了一个重要的批判观点,即在检验新异象的显著性时未能正确考虑多重假设检验的影响。
虽然资产定价文献中早就谈到了一般的数据窥探问题(Lo and MacKinlay 1990; Sullivan et al. 1999),但早期的建议是另选单一的原假设,例如 或 (例如 White 2000; Kosowski et al. 2006; Fama and French 2010)。Barras et al. (2010),Bajgrowicz and Scaillet (2012) 以及 Harvey et al. (2016) 则是最早在资产定价中采用 FDR 或 FWER 控制方法来遏制多重假设检验问题。Harvey and Liu (2020) 提出了一个双层自助法方法来控制 FDR,同时也考虑了假阴性率和几率比。Giglio et al. (2021a) 则提出了一种严格的推断方法,用于控制隐性因子模型中 alpha 的 FDR,同时解决了遗漏的变量问题、数据缺失问题以及测试资产维度过大的问题。Jensen et al. (2023) 则通过一个贝叶斯分层模型来实现对多重假设检验的修正。该模型使用了零 alpha 先验并利用因子的联合表现,允许利用因子之间的信息将 alpha 的估计值向先验收缩。
归根结底,多重假设检验在本质上是一个统计问题。前述统计方法通常满足一个好的统计检验所需具备的标准,例如控制第一类错误或伪发现率等。然而,比起统计标准,经济效益才是经济主体最关心的。但是,这两个目标通常是相互冲突的。Jensen et al. (2023) 和 Da et al. (2022) 指出,尽管传统多重假设检验方法能有效防范 FDR,但以此选择 alpha 会导致极其保守的交易策略。Jensen et al. (2023) 证明,相比于使用传统方法控制 FDR 的投资者,使用贝叶斯分层多重假设检验方法作为评判因子标准的投资者将能够获得更大的经济效益。
参考文献
Ait-Sahalia, Y., J. Jacod, and D. Xiu (2021). Continuous-time Fama-MacBeth regressions. Tech. rep. Princeton University and the University of Chicago.
Ait-Sahalia, Y., I. Kalnina, and D. Xiu (2020). High frequency factor models and regressions. Journal of Econometrics 216(1), 86-105.
Ait-Sahalia, Y. and D. Xiu (2017). Using principal component analysis to estimate a high dimensional factor model with high-frequency data. Journal of Econometrics 201(2), 384-399.
Ait-Sahalia, Y. and D. Xiu (2019). Principal component analysis of high frequency data. Journal of the American Statistical Association 114(525), 287-303.
Andersen, T. G. and T. Bollerslev (1998). Answering the skeptics: Yes, standard volatility models do provide accurate forecasts. International Economic Review 39(4), 885-905.
Andersen, T. G., T. Bollerslev, F. X. Diebold, and P. Labys (2001). The distribution of exchange rate realized volatility. Journal of the American Statistical Association 96(453), 42-55.
Bajgrowicz, P. and O. Scaillet (2012). Technical trading revisited: False discoveries, persistence tests, and transaction costs. Journal of Financial Economics 106(3), 473-491.
Barndorff-Nielsen, O. E. and N. Shephard (2002). Econometric analysis of realized volatility and its use in estimating stochastic volatility models. Journal of the Royal Statistical Society Series B (Statistical Methodology) 64(2), 253-280.
Barras, L., O. Scaillet, and R. Wermers (2010). False discoveries in mutual fund performance: Measuring luck in estimated alphas. Journal of Finance 65(1), 179-216.
Benjamini, Y. and Y. Hochberg (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B (Methodological) 57(1), 289-300.
Bickel, P. J. and E. Levina (2008a). Covariance regularization by thresholding. Annals of Statistics 36(6), 2577-2604.
Bickel, P. J. and E. Levina (2008b). Regularized estimation of large covariance matrices. Annals of Statistics 36(1), 199-227.
Bollerslev, T., S. Z. Li, and V. Todorov (2016). Roughing up beta: Continuous versus discontinuous betas and the cross section of expected stock returns. Journal of Financial Economics 120(3), 464-490.
Bollerslev, T., M. C. Medeiros, A. Patton, and R. Quaedvlieg (2022). From zero to hero: Realized partial (co)variances. Journal of Econometrics 231(2), 348-360.
Cai, T. and W. Liu (2011). Adaptive thresholding for sparse covariance matrix estimation. Journal of the American Statistical Association 106(494), 672-684.
Connor, G., M. Hagmann, and O. Linton (2012). Efficient semiparametric estimation of the Fama–French model and extensions. Econometrica 80(2), 713-754.
Corsi, F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics 7(2), 174-196.
Da, R., S. Nagel, and D. Xiu (2022). The statistical limit of arbitrage. Tech. rep. Chicago Booth.
Didisheim, A., S. Ke, B. Kelly, and S. Malamud (2023). Complexity in factor pricing models. Tech. rep. Yale University.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3-56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1-22.
Fama, E. F. and K. R. French (2010). Luck versus skill in the cross-section of mutual fund returns. Journal of Finance 65(5), 1915-1947.
Fan, J., Y. Fan, and J. Lv (2008). High dimensional covariance matrix estimation using a factor model. Journal of Econometrics 147(1), 186-197.
Fan, J., A. Furger, and D. Xiu (2016a). Incorporating global industrial classification standard into portfolio allocation: A simple factor-based large covariance matrix estimator with high frequency data. Journal of Business and Economic Statistics 34(4), 489-503.
Fan, J., Y. Liao, and M. Mincheva (2013). Large covariance estimation by thresholding principal orthogonal complements. Journal of the Royal Statistical Society Series B (Statistical Methodology) 75(4), 603-680.
Fan, J., Y. Liao, and J. Yao (2015). Power enhancement in high-dimensional cross-sectional tests. Econometrica 83(4), 1497-1541.
Fan, J., Y. Liao, and W. Wang (2016b). Projected principal component analysis in factor models. Annals of Statistics 44(1), 219-254.
Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica 57(5), 1121-1152.
Giglio, S., Y. Liao, and D. Xiu (2021a). Thousands of alpha tests. Review of Financial Studies 34(7), 3456-3496.
Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models. Journal of Econometrics 222(1), 429-450.
Harvey, C. R. and Y. Liu (2020). False (and missed) discoveries in financial economics. Journal of Finance 75(5), 2503-2553.
Harvey, C. R., Y. Liu, and H. Zhu (2016). ... and the cross-section of expected returns. Review of Financial Studies 29(1), 5-68.
Jensen, T. I., B. Kelly, and L. H. Pedersen (2023). Is there a replication crisis in finance? Journal of Finance 78(5), 2465-2518.
Kelly, B. T., S. Malamud, and K. Zhou (2022a). Virtue of complexity in return prediction. Tech. rep. Yale University.
Kim, S., R. Korajczyk, and A. Neuhierl (forthcoming). Arbitrage Portfolios. Review of Financial Studies.
Kosowski, R., A. Timmermann, R. Wermers, and H. White (2006). Can mutual fund “stars” really pick stocks? New evidence from a bootstrap analysis. Journal of Finance 61(6), 2551-2595.
Ledoit, O. and M. Wolf (2004). Honey, I shrunk the sample covariance matrix. Journal of Portfolio Management 30(4), 110-119.
Ledoit, O. and M. Wolf. (2012). Nonlinear shrinkage estimation of large-dimensional covariance matrices. Annals of Statistics 40(2), 1024-1060.
Li, S. Z. and Y. Tang (2022). Automated risk forecasting. Tech. rep. Rutgers, The State University of New Jersey.
Lo, A. W. and A. C. MacKinlay. (1990). Data-snooping biases in tests of financial asset pricing models. Review of Financial Studies 3(3), 431-467.
Pesaran, H. and T. Yamagata (2017). Testing for alpha in linear factor pricing models with a large number of securities. Tech. rep.
Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13(3), 341-360.
Shanken, J. (1992a). On the estimation of beta pricing models. Review of Financial Studies 5(1), 1-33.
Sullivan, R., A. Timmermann, and H. White (1999). Data-snooping, technical trading rule performance, and the bootstrap. Journal of Finance 54(5), 1647-1691.
White, H. (2000). A reality check for data snooping. Econometrica 68(5), 1097-1126.