专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
数据派THU  ·  【NeurIPS2024】在复杂视觉推理场景 ... ·  5 天前  
大数据文摘  ·  锤爆Sora,尺度最大,谷歌发布最强视频模型 ... ·  4 天前  
大数据与机器学习文摘  ·  26岁OpenAI举报人疑自杀!死前揭Cha ... ·  4 天前  
CDA数据分析师  ·  【话题】知乎热帖:一个人为何会陷入社会底层? ·  6 天前  
51好读  ›  专栏  ›  数据派THU

【NeurIPS2024】通过双曲嵌入学习结构化表示

数据派THU  · 公众号  · 大数据  · 2024-12-20 17:15

正文

来源:专知

本文约1000字,建议阅读5分钟

我们提出了一种新的方法——HypStructure:一种基于双曲结构正则化的方法。


大多数现实世界的数据集都包含类别之间的自然层次结构,或者具有固有的标签结构,这些结构要么已经存在,要么可以低成本地构建。然而,大多数现有的表示学习方法忽略了这一层次结构,将标签视为置换不变。近期的研究[104]提出显式地利用这些结构信息,但使用欧几里得距离可能会扭曲底层语义上下文[8]。在这项工作中,受到双曲空间在建模层次关系中的优势启发,我们提出了一种新的方法——HypStructure:一种基于双曲结构正则化的方法,用于准确地将标签层次结构嵌入到学习的表示中。HypStructure 是一个简单而有效的正则化器,由基于双曲树的表示损失和居中损失组成。它可以与任何标准任务损失结合,学习基于层次结构的信息特征。在多个大规模视觉基准测试上的大量实验表明,HypStructure 在减少失真和提升泛化性能方面非常有效,尤其是在低维场景下。为了更好地理解结构化表示,我们进行了特征值分析,将表示几何与经验上观察到的改进的分布外(OOD)检测性能关联起来。代码可在 https://github.com/uiuctml/HypStructure 获取。



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU