分享个高区热点:
端到端聚类。
一区二区都有不少新成果,比如IJCV 2024的IDDC方法,性能优于所有现有无监督语义分割方法,还有LoSTer算法,训练速度比Transformer快数百倍!
这方向
已经成为了学术界与工业界的研究重点
,因为它能自动化完成从数据输入到聚类结果输出的整个过程,无需人工干预中间步骤,
极具高效性与灵活性,
在机器学习与数据挖掘领域,尤其是无监督学习和复杂数据建模中,拥有超级强大的潜力。
如今,大模型的进步推动着端到端聚类在更多领域实现“从数据到知识”的无缝衔接,未来关于它的创新将集中在
跨模态融合、算法鲁棒性提升、自动化系统开发、伦理安全设计
等方面。
本文整理了
11篇
端到端聚类的前沿论文
,开源代码有,需要参考的论文er可无偿获取,也欢迎大家评论区友好交流呀~
扫码添加小享,
回复“
端到端聚类
”
免费获取
全部论文+开源代码
End-to-End Supervised Hierarchical Graph Clustering for Speaker Diarization(二区)
方法:
论文提出了一种名为E-SHARC的端到端有监督分层图神经网络聚类算法,通过最小化同一说话者的距离和最大化不同说话者的距离,实现了说话者分割任务,并扩展到重叠说话者预测,在挑战性数据集上表现出色。
创新点:
-
提出了一种基于图神经网络 (GNN) 的端到端监督层次聚类算法,称为 E-SHARC。通过联合优化嵌入提取器和 GNN 聚类模块,实现了表示学习、度量学习和聚类的端到端优化。
-
E-SHARC 方法进一步扩展了模型能力,使其可以预测和分配重叠语音区域的多个说话人。
-
通过将图神经网络应用于说话人分离任务,该研究首次探索了层次图聚类框架的使用。
Incomplete contrastive multi-view clustering with high-confidence guiding(AAAI 2024)
方法:
该论文提出了一种新颖的端到端不完整多视图聚类方法ICMVC,通过多视图一致性关系转移和图卷积网络处理缺失值,同时设计实例级注意力模块和高置信度指导以利用互补信息,解决了多视图数据丢失问题并改进了聚类性能。
创新点:
-
提出了一种结合多视图一致性关系传递和图卷积网络(GCN)的策略来处理多视图数据中的缺失值问题。
-
通过设计实例级注意力融合机制和高置信度引导方法,作者能够充分挖掘多视图数据中的互补信息。
-
提出了一种端到端的框架,将多视图缺失数据处理、多视图表示学习和聚类分配整合为一个联合优化过程。
扫码添加小享,
回复“