a. 可能接触到的英文缩写
数据仓库 Data Warehouse
数据集市 Data Mart
数据挖掘 Data Mining
DBMS:Database Management System数据库管理系统
DBA: Database Administrator数据库管理员
RDBMS:Relational Database Management System关系数据库管理系统
OLAP:(On-Line Analytical Processing)联机分析处理。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
OLTP:(On-Line Transaction Processing)联机事务处理。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
BI: Business Intelligence 商业智能
KDD:knowledge discovery in databases 数据库知识发现
b. 数据分析,数据建模和数据挖掘的定义和区别
数据分析:Analysis of data is a process of inspecting, cleansing, transforming, and modeling data with the goal of discovering useful information, suggesting conclusions, and supporting decision-making.[源于wikipedia]可以看出,数据分析强调使用统计学方法,发现有用信息,支持决策,构造建设性结论。
数据挖掘:Data mining is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics, and database systems. It is an interdisciplinary subfield of computer science. The overall goal of the data mining process is to extract information from a data set and transform it into an understandable structure for further use.[源于wikipedia]数据挖掘与大数据关联性更加密切,利用人工智能,机器学习,统计学等知识,对于大型数据集进行分析,发现规律,预测未来,辅助决策。
数据建模:Data modeling is a process used to define and analyze data requirements needed to support the business processes within the scope of corresponding information systems in organizations. Therefore, the process of data modeling involves professional data modelers working closely with business stakeholders, as well as potential users of the information system.[源于wikipedia]数据建模是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。 建模过程中的主要活动包括:确定数据及其相关过程;定义数据;确保数据的完整性;定义操作过程;选择数据存储技术。数据建模大致分为三个阶段,概念建模阶段,逻辑建模阶段和物理建模阶段。其中概念建模和逻辑建模阶段与数据库厂商毫无关系,换言之,与MySQL,SQL Server,Oracle没有关系。