k-means聚类算法,
一种原理简单、实现容易、好调参、收敛速度快而且聚类效果优秀的聚类工具。
这种算法的核心在于它可以通过迭代计算,将数据点归入预设数量的簇中,让簇内数据点相似度高,簇间数据点相似度低,从而实现高效的数据聚类。因此它
在众多应用场景下都是首选
,特别是金融市场预测,有成果甚至已经达到94.61%的准确率。
不过k-means基本版本还存在一些问题,为了提高聚类的质量和模型性能,研究者们致力于改进k-means。目前关于
k-means的改进思路主要有初始化策略、考虑数据的结构、动态调整K值等
,很多有效的改进策略已经发表。
为了帮助同学们找到新的idea,我这回挑选了
9个
k-means的改进与应用方案
,基本都是最新的,创新点的参考价值也比较高,相关代码也有。
扫码
添加小享,
回复“
聚类改进
”
免费获取
全部论文及代码合集
改进
Local Search k-means++ with Foresight
方法:
论文提出了一种名为Foresight LS++(FLS++)的新算法,旨在提高K-means聚类的性能。FLS++算法通过结合局部搜索技术和d2-sampling初始化方法,以期望在解质量和运行时间上都有所提升。
创新点:
-
提出了一种新的k-means算法FLS++,通过将局部搜索与d2采样相结合,以及使用前瞻性的Lloyd算法来提高算法的性能。
-
FLS++相比于LS++在质量和运行时间方面都有更好的表现。
-
实验结果表明,使用贪婪的d2采样方法可以显著提高算法的性能。
Augmented weighted K‑means grey wolf optimizer: An enhanced metaheuristic algorithm for data clustering problems
方法:
论文提出了一种名为“Augmented weighted K-means grey wolf optimizer”的算法,它是对传统的K-means聚类算法和灰狼优化器的改进。作者通过结合K-means算法的概念和一个新的权重因子来增强灰狼优化器的优化能力,以解决数据聚类问题。
创新点:
-
提出了一种名为KCGWO的新型GWO变种,它基于K-means聚类算法和位置更新的权重因子。通过将GWO的自适应能力与K-means聚类的高效性相结合,提高多样性,防止过早收敛,并确保更有效地在探索和利用之间保持平衡。
-
KCGWO能够高效地遍历解空间并迅速找到最优的聚类中心,这得益于K-means在初始解优化方面的作用和动态权重因子在整个优化过程中调整探索和利用的影响力,从而确保了高质量的解决方案。
-
KCGWO的性能优于其他几种元启发式算法,在各种统计指标上都表现出更好的结果。
扫码
添加小享,
回复“
聚类改进
”
免费获取
全部论文及代码合集
应用
Application of machine learning-based k-means clustering for financial fraud detection
方法:
论文针对当前日益数字化的金融领域中,欺诈活动的频率和复杂程度不断上升的情况,提出了一种基于机器学习的K-means聚类方法,以提高金融欺诈检测的准确性和效率。实验表明FDA模型的敏感性达到了99.72%,性能起飞。
创新点:
-
通过使用机器学习的K-means聚类方法,可以提高金融欺诈检测策略的准确性和效率。
-
通过对大量金融交易数据进行聚类,可以及时识别异常模式和行为,从而检测潜在欺诈行为。
-
与传统的基于规则的检测方法相比,基于机器学习的方法更能适应不断变化的欺诈技术和模式,同时提高了检测的灵活性和精确性。