在数据处理过程中,我们经常需要将多个数据源合并在一起,以便进行统一的分析。在 Power BI 和 Excel 中,Power Query 提供了强大的数据查询和转换功能,其中追加查询是一种常用的操作。通过追加查询,我们可以将多个具有相同结构的数据表合并为一个。
如果我们在追加查询后,不对原始查询的加载和刷新设置进行调整,那么原始查询和追加查询都会被加载到数据模型中。
-
数据冗余:原始查询的数据已经被包含在追加查询中,再次加载会导致数据重复,增加数据模型的大小。
-
性能下降:加载不必要的数据会占用内存和计算资源,影响报表的性能和刷新速度。
-
刷新耗时:每次刷新数据时,所有已加载的查询都会被刷新,增加了刷新时间。
因此,为了提高数据模型的效率,我们需要对原始查询的加载和刷新方式进行优化。
假设我们有两个查询,分别是 2022 Q1 和 Q2 的销售数据,当我们对这两个查询进行追加查询操作合并为一个新查询时,Power Query 中有了三个查询。
那么此时 Power Query 中会出现三个表。
但是实际上我们只需要名为 2022 上半年的查询,2022 Q1 和 Q2 的数据已经在新查询中包含了,所以此时我们应该让这个两个表不在报表中出现。
我们可以通过查询的启用加载和包含在报表中刷新这两个选项控制查询的刷新与加载,默认设置为两个选项都被勾选。
我们先勾选掉包含在报表刷新中选项,此时查询只会加载到报表中而不会在报表中刷新。
返回到 Power BI 报表中验证一下,点击刷新。
右边的数据栏有三个表,但是进行刷新操作的只有 2022 上半年一个表。
我们再将启用加载勾选掉,关闭启用加载选项之后,可以发现查询名称文本倾斜了。
回到 Power BI 中,看一下数据的加载情况。
可以看到,在我们进行刷新操作之后,不管是进行刷新的表还是数据栏的表此时都只剩下了 2022 上半年这一个表了,而我们也刚好只需要这一个表。
在 Power Query 中,合理设置原查询的加载和刷新方式,能够有效地优化数据模型的性能,减少资源消耗。通过禁用原始查询的加载与刷新,确保只将必要的数据加载到模型中;通过控制刷新行为,减少不必要的计算和等待时间。
希望本文的介绍能帮助你在使用 Power Query 时,更加高效地管理和优化数据查询。