文章探讨了金融市场数据展示方式的问题,具体分析了百分位值在描述金融市场数据时的局限性,以及与完整历史数据图表相比的不足之处。文章还提到了现代技术带来的机遇,以及投资者在进行市场分析时应多关注完整历史数据图表,避免过分依赖简化指标的建议。
百分位值作为统计学中的描述性指标,虽然能简化概括数据分布特征,但会造成信息损失,掩盖数据变化的细节和趋势。
将百分位值应用于沪深300指数市盈率分析时,会遇到统计学上的奇异值导致的失真、短期窗口的局限性等问题,误导投资者的判断。
现代技术条件下,我们能够生成并展示完整的历史数据图表,提供更丰富的信息,避免数据压缩带来的失真。投资者应关注完整历史数据图表,做出更明智的投资决策。
在周一写了
沪深300指数估值分析文章
后,多位读者提出了一个建议:是否可以在现有分析基础上增加百分位数据?
这个问题引发了我对金融市场数据展示方式的深入思考。经过认真权衡,我认为在当今技术条件下,增加百分位值可能弊大于利。让我们深入探讨为什么。
统计压缩的局限性
百分位值与平均数、中位数一样,本质上都是统计学中的描述性指标。这类指标的共同特点是:
试图用极其简化的方式来概括大量数据的分布特征
。虽然这种方法在某些场景下确实便于理解和使用,但它不可避免地会造成信息损失。
想象一下,当我们将一组连续的数据简化为一个百分位值时,实际上是在进行一次信息压缩。这种压缩虽然能让我们快速了解当前数值在历史分布中的相对位置,但它掩盖了数据变化的细节和趋势,这些细节在投资决策中往往至关重要。
K线图:一个经典的例子
要理解数据压缩的局限性,K线图是一个绝佳的案例。作为投资者最熟悉的技术分析工具之一,K线图将一整天的交易数据压缩为四个关键数值:
开盘价、收盘价、最高价和最低价
。这种压缩方式诞生于没有计算机时代,对于记录价格效率的追求,但也带来了信息失真的问题。
举个简单的例子:当我们看到一根十字星K线时,它可能代表完全不同的市场走势。可能是先涨后跌最后回到起点,也可能是先跌后涨再回落。这两种截然不同的市场情绪,在K线图上却呈现出完全相同的形态。这就是数据压缩带来的信息损失。
百分位值的具体问题
当我们将这种思考应用到市盈率的百分位值分析时,问题就更加明显了。以沪深300指数为例,如果我们使用从2005年指数发布以来的所有数据来计算百分位,会遇到几个关键问题:
首先,2007年牛市期间出现的极端高估值会严重影响整体分布。这些统计学上的“奇异值”会导致当前即使处于相对较高的估值水平,计算出的百分位值也可能显得不高。这种失真会误导投资者对当前市场状况的判断。
其次,即使我们采用常见的变通手段,比如五年滚动时间窗口来计算百分位,问题依然存在。短期窗口可能会让我们陷入“井底之蛙”的困境:当前估值在近五年看似处于低位,但从更长的历史周期来看,可能并不算特别低。特别是当五年窗口恰好处于估值窄幅震荡期时,这种偏差会更加明显。
压缩是特定技术条件的产物
理解数据压缩方法的产生背景很重要。比如当日本商人在上世纪中叶发明K线图时,很大程度上是手工记录交易数据时代的技术条件。
即使有了电脑,但在早年依赖电话线拨号的时代,数据传输需要依赖速度极其有限的调制解调器,实时数据的传输和存储都面临巨大挑战。在那个年代,将海量交易数据压缩为少量关键数值是无奈之选。如果用过类似通达信这样比较早的行情软件,就会知道当时下载日K线和下载分时数据是两个模块控制。一般省流许多人只下载也只能看日 K线
现代技术带来的机遇
但在今天的数字时代,这种局限已经不复存在。我们完全有能力生成并展示完整的历史数据图表,就像周一文章中展示的那样。这种完整的可视化展示相比简单的百分位值,具有诸多优势:
-
直观展示历史波动范围,让投资者能够清晰看到估值的历史高低点