专栏名称: PowerBI战友联盟
微软 Power BI MVP BI佐罗 带你学习BI真经。
目录
相关文章推荐
普象工业设计小站  ·  穿一次就上瘾的神仙内衣! ·  8 小时前  
创意铺子  ·  喝 10 斤鲜牛奶,不如吃 1 ... ·  10 小时前  
普象工业设计小站  ·  美国最火娇妻,“偷师”李子柒失败 ·  17 小时前  
普象工业设计小站  ·  25岁“好莱坞星二代”神颜出圈:比起这张脸, ... ·  2 天前  
普象工业设计小站  ·  “女版山寨雷军”全网走红:仿妆界的神,出现了! ·  2 天前  
51好读  ›  专栏  ›  PowerBI战友联盟

【DAX 系列】总计行问题终极解决方案

PowerBI战友联盟  · 公众号  ·  · 2020-01-15 22:52

正文

这是一个老生常谈的问题,本文将给你终极解决方案,并带您重新理解一种模式,从入门级到专业级,均有您需要的营养。

您可以直接使用本文的模式和套路立刻优化您的计算。

问题重现

如果你使用 DAX 很快就会发现总计行的问题。例如:

Topic.Problem =
// 这个度量值的总计行会有问题
[KPI] + 1000

出现错误的情况:

很容易看出总计行并不等于以上各行的和,然后大家会觉得 PowerBI 很傻,这个都不能算对。

其实大家误解 PowerBI 了。我们来仔细看看。

原因分析

对于 业务用户 会很自然地认为 总计 = 以上各行的和

那再来看看这个案例:

这里的总计行就不等于以上各行的和,而且必须不等于。业务用户会说,嗯,应该不等于。

所以,问题来了:

你到底希望总计行等于以上各行的和还是不等于以上各行的和呢?

得到的答案往往是,该等于的时候等于,不该等于的时候就不等于。晕~~~

理解 PowerBI

PowerBI 进行这项计算的主要方式是通过 DAX,考虑到 通用性 一般性 ,DAX 的设计满足:

在可视化层的汇总表的每个单元格都在独立的环境计算。

这就是筛选上下文的根源。

但是,很多情况是 总计 = 以上各行的和 。那么如何处理这个问题呢?

为了把这个问题揭露得更加彻底,让我们来彻底地吐槽出来先:

  • 总计 = 以上各行全部的和

  • 小计 = 在本区间内各行的和

  • 如果用户做出了部分筛选,总计和小计的计算也应该是正确的

能同时满足上述三项的才是好方法。

问题分析

对于这个问题,我们此前就给出了解决方案,很多 DAX 玩家也使用了不同的方式。但今天我们给出更全的方式,而且是一个通用套路。

微软也已经发现了这个问题,就是在可视化层面目前没有给出一个计算方案。用英文的准确写法是:Visual Calculation。

DAX 的强大就在于灵活的上下文,尤其是筛选上下文。而出现的总计行问题也是由总计行引发的。

一般的思路是:

判断当前的计算环境,如果是总计行就计算全部,如果是小计行就计算当前部分,如果是元素行就默认计算。 但问题是,如果用户在最外部筛选了部分元素呢

以上这句加粗的如果您还看懂说明还没有掉入这个坑,这是为了您下次回看准备的。

问题的深化

如果认为问题这就结束了,就错了,还会出现四种不同的演化:

  • 单列总计

  • 多列总计,但属于同一个表

  • 多列总计,且不属于同个表,但有共同的桥表

  • 多列总计,彻底独立不同表

直接给答案

请仔细观察以下方案:

我晕,这是什么鬼~

左边的蓝色框反映了前 3 种情况,即:

  • 单列总计

  • 多列总计,但属于同一个表

  • 多列总计,且不属于同个表,但有共同的桥表

右边的蓝色框反映了第 4 种情况,即:

  • 多列总计,彻底独立不同表

值得注意的是,它们在外部的部分筛选下,还保证了计算的正确性。

下面分别说明。

在继续阅读之前,我们先给出一个套路,然后按照这个套路来看实现,最后再总结这个套路。

总计行通用套路

处理总计行计算,需要分二步:

  • 第一步,定义元素计算,例如命名为:

    [KPI.Row];

  • 第二步,定义兼容计算,例如命名为:

    [KPI.Display],该度量值放置后可确保元素行,小计行,总计行全部计算正确,且在部分筛选下依然正确。

其实,平时我们使用的度量值是[KPI.Row],之所以出现总计行问题,也是因为没有考虑总计行问题。

在第二步中谈到的 兼容计算 ,就是为了兼容元素,小计,总计,外部筛选等苛刻条件,保持极高的用户友好。

这里涉及一个关键函数是:SUMX。

套路: 用 SUMX 按分组对 [KPI.Row] 进行包裹 。即可。

下面从具体的案例来说明这个套路。

【情况1】单列总计

度量值:

Topic.Value.Display.FromOneTable.OneColumn =
SUMX( VALUES( Model_Product[类别] ) , [Topic.Value.Row] )

Topic.Value.Display.FromOneTable.OneColumn 只是个名字,不必在意。

效果:

请体会这个套路。

【情况2】多列总计,同表

这种情况比上面的情况更加复杂,因为可能是多列,但他们都来自同一个表。

度量值:

Topic.Value.Display.FromOneTable.MutiColumns =
// 多列总计,但多列来自同一个表
SUMX(
SUMMARIZE(
Model_Product ,
Model_Product[类别] ,
Model_Product[子类别]
) ,
[Topic.Value.Row]
)

效果:

请体会这个套路。

【情况3】多列总计,不同表,同桥

这种情况更加复杂,多列来自不同的表,当然,有个特点是他们有一个共同的桥。

什么是桥表?

在多个一对多关系中,作为共享的多端的表,就是桥表。

从连接的角度,叫做桥表;从数据仓库的角度,叫做事实表;从业务人员的角度,叫做明细表。

度量值:

Topic.Value.Display.FromMultiTable.ButSameBirdge =
// 多列总计,多列来自不同的表,但共享一个桥表
// 什么是桥表,在多个一对多关系中,作为共享的多端的表,就是桥表。
// 从连接的角度,叫做桥表;从数据仓库的角度,叫做事实表;从业务人员的角度,叫做明细表。
SUMX(
SUMMARIZE(
Model_Order ,
Model_Product[类别] ,
Model_User[细分]
) ,
[Topic.Value.Row]
)

效果:

值得说明的是, 产品[类别] 客户[分类] 来自不同的表,但都都与 订单表 相连。如下:

其中的核心 DAX 技巧在于:

SUMMARIZE( Model_Order , Model_Product[类别] , Model_User[细分] )

用桥表用做 SUMMARIZE 的第一个参数,与桥表连接的表的列都可以用作后续参数,则这个 DAX 表达式会返回合理的多列分组。







请到「今天看啥」查看全文