这篇文章重点讲解一下k近邻算法的最经典算法kd树的相关知识点以及最终的总结!希望看完这篇文章,对kd树能够有一个直观的感觉~
1.k近邻算法的回顾
2.k近邻算法中的分类决策规则讲解
3.k近邻法的实现:kd树原理的讲解以及kd树详细例子讲解
4.kd树的不足以及最差情况举例
5.k近邻方法的一些优缺点总结
1.我们提出了k近邻算法,算法的核心思想是,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分类到这个类中。
更通俗说一遍算法的过程,来了一个新的输入实例,我们算出该实例与每一个训练点的距离(这里的复杂度为0(n)比较大,所以引出了下文的kd树等结构),然后找到前k个,这k个哪个类别数最多,我们就判断新的输入实例就是哪类!
2.与该实例最近邻的k个实例,那么最近邻的衡量标准是是什么。这个最近邻的定义是通过不同距离函数来定义,我们最常用的是欧式距离。
3.为了保证每个特征同等重要性,我们这里对每个特征进行归一化。
4.k值的选取,既不能太大,也不能太小,何值为最好,需要实验调整参数确定!
原文链接:
https://mp.weixin.qq.com/s/qfHBn7YydSOOnM43Be8aTg