数据分析是一门专注于从数据中提取见解的学科。它包括数据分析和管理的过程、工具和技术,其中包括数据的收集、组织和存储。数据分析的主要目的是对数据应用统计分析和技术以发现趋势并解决问题。作为分析和调整业务流程并改善决策和业务结果的一种手段,数据分析在企业中变得越来越重要。
数据分析来自包括计算机编程、数学、统计在内的一系列学科,可以对数据进行分析,以描述、预测和改进性能。为确保可靠的分析,数据分析团队利用一系列数据管理技术,其中包括数据挖掘、数据清理、数据转换、数据建模等。
(1)数据分析vs.数字分析
尽管术语“数据分析”和“数字分析”经常互换使用,但是数字分析是数据分析的子集,涉及检查、清理、转换和建模数据以得出结论。数据分析包括用于执行数字分析的工具和技术。
(2)数据分析vs.数据科学
数据分析和数据科学密切相关。数据分析是数据科学的组成部分,用于了解组织数据的外观。通常情况下,数据分析的输出是报告和可视化。数据科学利用分析的结果来研究和解决问题。
数据分析和数据科学之间的差异通常被视为时间尺度的差异。数据分析描述现实的当前或历史状态,而数据科学则使用这些数据来预测或理解未来。
(3)数据分析vs.业务分析
业务分析是数据分析的另一个子集。业务分析使用数据分析技术,包括数据挖掘、统计分析和预测建模,以推动更好的业务决策。调研机构Gartner公司将业务分析定义为“用于构建分析模型和模拟以创建场景、了解现实和预测未来状态的解决方案。”
以下有四种分析类型:
(1)描述性分析:发生了什么,现在正在发生什么?描述性分析通过识别趋势和模式,使用来自多个来源的历史和当前数据来描述当前状态。而在业务分析中,这是商业智能(BI)发挥的作用。
(2)诊断分析:为什么会发生?诊断分析使用数据(通常通过描述性分析生成)来发现性能的因素或原因。
(3)预测分析:将来可能会发生什么?预测分析将统计建模、预测和机器学习等技术应用于描述性和诊断分析的输出,以对未来结果进行预测。预测分析通常被认为是一种“高级分析”,通常依赖于机器学习或深度学习。
(4)规范分析:需要做什么?规范分析是一种高级分析,涉及测试和其他技术的应用,以推荐可提供预期结果的特定解决方案。在业务中,预测分析使用机器学习、业务规则和算法。
数据分析人员使用多种方法和技术来分析数据。CareerFoundry执行编辑Emily Stevens指出了最受欢迎的七个类别,其中包括: