数据驱动愿景的实现将远比您想象的要快。Tableau 2021.3 增强了数据管理功能,为数据的准备、分析、交互和协作提供了一个可信任的环境:
按照给定顺序自动化流程,并对运行失败的流程自动发出数据质量警告
在 Tableau Prep Conductor 中新增的关联任务允许您将流程设置为按顺序运行。客户通常有一个或多个流依赖于另一个流,以前您需要计算或猜测每个流程的运行时间。这将产生风险,比如错过了正确的时间导致数据没有更新或者过度安排流程的运行,导致服务器过载。同时,保守地安排流程的运行可能会导致获取新数据的时间过长。此外,在前一个流程出现问题时,这种方法无法提供任何触发器来阻止下一个流程。现在,我们通过关联任务自动化了流程,您可以设置应该运行哪些流程,以什么顺序运行(最多支持 20 个流),以及如果流程运行成功或失败时,应该采取什么措施。
假设我有多个需要关联运行的流程。如果运行失败,我想对失败的流程设置一个数据质量警告,并停止下一个流的运行。我要做的第一件事就是为任务选择一个运行时间计划:
在设置关联任务时,我可以选择指定流程成功或失败时要执行的操作。如果任务成功,它将自动启动下一个任务。如果失败,我可以添加数据质量警告和/或停止其余任务运行。
在关联任务中添加了第一个流程后,我可以通过选择 “添加下一个任务” 来添加另一个流程。Tableau 将自动呈现所有可供选择的下游流程,设置完序列后,我将在 “计划任务” 选项卡下看到所有计划的关联任务:
此功能的另一个优点是,一旦流开始运行,它们就会自动呈现在 Catalog 的世系视图中,如果有任何数据质量警告,它们将在 Tableau 生态系统中的多个位置显示。
通过数据质量警告和世系描述,
帮助所有人了解分析流程数据质量警告可帮助用户了解 Tableau 平台中的潜在数据问题,包括 Tableau Catalog、Tableau Prep 中以及 Tableau Desktop 数据窗格中的数据详细信息。现在,邮件订阅用户无需担心收到过时的报告,您可以直接在邮件中显示数据质量警告。如果上游资产(如表、数据库、数据源或流程)上已进行设置,则数据质量警告将显示在电子邮件中。此外,Server 管理员还可以控制是否为每个站点启用邮件订阅中的数据质量警告。
Tableau Catalog 中的世系功能增强了 Tableau 的数据准备能力。在 Tableau 2021.2 中,我们在 Tableau Desktop 中引入了继承的列和字段描述,以便分析师浏览已发布数据源和工作簿的上游列描述。在 Tableau 2021.3 的 Web 创作中也提供了类似的功能。当用户创建新的工作簿或数据源,或使用已发布的工作簿或数据源时,未计算字段的上游描述将显示在工具提示中:
无论世系有多复杂,最接近的继承描述都将显示给最终用户。流程、数据源和多级表都可以是世系的一部分,分析师将始终看到最接近的现有列或字段描述。与其他数据目录不同,Tableau Catalog 将数据质量警告或描述等元数据直接提供给分析师。使用 Tableau 现有的 API,这些描述可以从外部系统(如企业数据目录或数据仓库)一直流向创作空间,如 Tableau Desktop 和 Tableau Server 或 Online 中的 Web 创作。这提供了在单个位置管理数据集的便捷方式,同时让最终用户了解他们在创作模式下使用的数据,而无需检查其他工具或在应用程序之间切换。Tableau Prep Builder 2021.3 中还增加了一项新功能,现在您可以使用 “新行” 步骤为数字或日期字段生成缺少的行。这项功能使数据准备变得更加容易。当序列数据集中存在缺失时,创建计算、理解趋势和分析数据可能会很棘手。以前最简单的修复方法是手动修改数据集。现在,我们只需在 Prep 中单击几下即可完成。
使用这个新步骤很容易,只需选择是基于单个字段还是多个字段生成新行。接下来,指定递增条件以及每行中应包含哪些值。您可以很容易在 Tableau Prep 中看到生成了哪些新行,只需查看中间窗格即可。这一新步骤使数据准备比以往任何时候都更快、更灵活,帮助您更轻松地进行数据分析并获得洞察。
Tableau 2021.3 中的许多功能着重于在不妥协的情况下治理和管理企业的数据。当您为您的组织配备受信任和受管控的数据时,您可通过大规模分析和更好的业务成果取得更大的成功。获得所需的可见性和控制权,以确保始终使用可信的最新数据来进行分析决策。