专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
宝玉xp  ·  我日常用 Cursor ... ·  2 天前  
黄建同学  ·  #谷歌推出新一代视频生成模型Veo2##ai ... ·  2 天前  
爱可可-爱生活  ·  《爱可可微博热门分享(12.17)》 ... ·  3 天前  
机器之心  ·  哗然!MIT教授NeurIPS演讲公开歧视中 ... ·  5 天前  
51好读  ›  专栏  ›  机器学习研究会

【学习】数据挖掘 知识重点(整理版)

机器学习研究会  · 公众号  · AI  · 2017-01-19 20:00

正文


点击上方“机器学习研究会”可以订阅哦
摘要
 

转自:数据挖掘入门与实战

1.  数据、信息和知识是广义数据表现的不同形式。

2.  主要知识模式类型有:广义知识,关联知识,类知识,预测型知识,特异型知识

3.  web挖掘研究的主要流派有:Web结构挖掘、Web使用挖掘、Web内容挖掘

4.  一般地说,KDD是一个多步骤的处理过程,一般分为问题定义、数据抽取、数据预处理、.数据挖掘以及模式评估等基本阶段。

5.  数据库中的知识发现处理过程模型有:阶梯处理过程模型,螺旋处理过程模型,以用户为中心的处理结构模型,联机KDD模型,支持多数据源多知识模式的KDD处理模型

6.  粗略地说,知识发现软件或工具的发展经历了独立的知识发现软件、横向的知识发现工具集和纵向的知识发现解决方案三个主要阶段,其中后面两种反映了目前知识发现软件的两个主要发展方向。

7.  决策树分类模型的建立通常分为两个步骤:决策树生成,决策树修剪。

8.  从使用的主要技术上看,可以把分类方法归结为四种类型:

a)                基于距离的分类方法

b)               决策树分类方法

c)               贝叶斯分类方法

d)               规则归纳方法

9.  关联规则挖掘问题可以划分成两个子问题:

a)                发现频繁项目集:通过用户给定Minsupport ,寻找所有频繁项目集或者最大频繁项目集。

b)               生成关联规则:通过用户给定Minconfidence ,在频繁项目集中,寻找关联规则。

10.   数据挖掘是相关学科充分发展的基础上被提出和发展的。

主要的相关技术:

数据库等信息技术的发展

统计学深入应用

人工智能技术的研究和应用


原文链接:

https://mp.weixin.qq.com/s?__biz=MzA3MDg0MjgxNQ==&mid=2652390773&idx=1&sn=3bf2a11e1ff03d6925ceaec9c24f4ac3&chksm=84da45a5b3adccb31ddd1c9928eb4534793511daa0cec824fa659aa3fd0ce2a47ebbab9e94ee&scene=0&pass_ticket=UhUZubnMPmbSEZDKWHUdhAI65FeJr45Pf3r73xCQK3I%3D#rd

“完整内容”请点击【阅读原文】
↓↓↓