专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
黄建同学  ·  OCR 2.0,通用 OCR ... ·  5 天前  
爱可可-爱生活  ·  《爱可可微博热门分享(9.17)》 ... ·  1 周前  
爱可可-爱生活  ·  【PsyDI:个性化和逐步深入的聊天机器人, ... ·  1 周前  
黄建同学  ·  #openai发布最强模型o1# #ai# ... ·  1 周前  
51好读  ›  专栏  ›  机器学习研究会

【学习】深入浅出理解决策树算法(一)-核心思想

机器学习研究会  · 公众号  · AI  · 2017-05-04 19:12

正文



点击上方“机器学习研究会”可以订阅哦
摘要
 

转自:自然语言处理与机器学习

  1 算法思想


决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。


其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别


使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。


总结来说

决策树模型核心是下面几部分

  • 结点和有向边组成

  • 结点有内部结点和叶结点俩种类型

  • 内部结点表示一个特征,叶节点表示一个类


决策树表示如下

(摘自周志华老师西瓜书)


决策树代表实例属性值约束的合取的析取式


从树根到树叶的每一条路径对应一组属性测试的合取,树本身对应这些合取的析取。理解这个式子,比如上图的决策树对应表达式为


2 决策实例


假如我现在告诉你,我买了一个西瓜,它的特点是纹理是清晰,根蒂是硬挺的瓜,你来给我判断一下是好瓜还是坏瓜,恰好,你构建了一颗决策树,告诉他,没问题,我马上告诉你是好瓜,还是坏瓜?


判断步骤如下:


根据纹理特征,已知是清晰,那么走下面这条路,红色标记:



好的,现在咋们到了第二层了,这个时候,由决策树图,我们看到,我们需要知道根蒂的特征是什么了?很好,他也告诉我了,是硬挺,于是,我们继续走,如下面蓝色所示:




此时,我们到达叶子结点了,根据上面总结的点,可知,叶子结点代表一种类别,我们从如上决策树中,可以知道,这是一个坏瓜!


于是我们可以很牛的告诉他,你买的这个纹理清晰,根蒂硬挺的瓜是坏瓜,orz


原文链接:

http://mp.weixin.qq.com/s/ODfGFWeEP632DJ2yxYURsg

“完整内容”请点击【阅读原文】
↓↓↓