专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
机器之心  ·  昆仑万维「天工4.0」携超强o1/4o霸气上 ... ·  昨天  
爱可可-爱生活  ·  【Smolgrad:小型自动微分引擎,灵感来 ... ·  2 天前  
黄建同学  ·  测了Hedra的AI数字人(免费版),视频测 ... ·  3 天前  
宝玉xp  ·  //@Ddd_23_:需求就是市场,一切技术 ... ·  4 天前  
51好读  ›  专栏  ›  机器学习研究会

【学习】带你搞懂朴素贝叶斯分类算法

机器学习研究会  · 公众号  · AI  · 2017-04-13 19:01

正文



点击上方“机器学习研究会”可以订阅哦
摘要
 

转自:自然语言处理与机器学习

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。


1 分类问题综述

 对于分类问题,其实谁都不会陌生,日常生活中我们每天都进行着分类过程。例如,当你看到一个人,你的脑子下意识判断他是学生还是社会上的人;你可能经常会走在路上对身旁的朋友说“这个人一看就很有钱”之类的话,其实这就是一种分类操作。


既然是贝叶斯分类算法,那么分类的数学描述又是什么呢?


从数学角度来说,分类问题可做如下定义:已知集合,确定映射规则y = f(x),使得任意有且仅有一个,使得成立


其中C叫做类别集合,其中每一个元素是一个类别,而I叫做项集合(特征集合),其中每一个元素是一个待分类项,f叫做分类器。分类算法的任务就是构造分类器f。


分类算法的内容是要求给定特征,让我们得出类别,这也是所有分类问题的关键。那么如何由指定特征,得到我们最终的类别,也是我们下面要讲的,每一个不同的分类算法,对应着不同的核心思想。


本篇文章,我会用一个具体实例,对朴素贝叶斯算法几乎所有的重要知识点进行讲解。


2 朴素贝叶斯分类

那么既然是朴素贝叶斯分类算法,它的核心算法又是什么呢?

是下面这个贝叶斯公式:



换个表达形式就会明朗很多,如下:



我们最终求的p(类别|特征)即可!就相当于完成了我们的任务。


原文链接:

https://mp.weixin.qq.com/s/dV0SQo1vaggXuKQCjHR9ew

“完整内容”请点击【阅读原文】
↓↓↓