专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
CDA数据分析师  ·  【数据报告】7.65亿人次,超7000亿元! ... ·  4 天前  
数据派THU  ·  数据分享 | R语言逻辑回归、Naive ... ·  5 天前  
软件定义世界(SDX)  ·  长芦海晶数字化转型思路分析与探索 ·  6 天前  
数据派THU  ·  时间序列特征提取:从原理到Python实践 ·  1 周前  
51好读  ›  专栏  ›  数据派THU

【NeurIPS 2024】HaloScope:利用未标记的大型语言模型生成进行幻觉检测

数据派THU  · 公众号  · 大数据  · 2024-10-11 17:00

正文

来源:专知

本文为论文介绍,建议阅读5分钟

我们推出了 HaloScope,这是一种新颖的学习框架,利用未标记的 LLM 生成文本进行幻觉检测。


大型语言模型(LLMs)应用的激增引发了人们对生成误导性或虚假信息(即幻觉)的担忧。因此,检测幻觉已成为维护 LLM 生成内容可信度的关键。学习真实分类器的一大挑战是缺乏大量标记的真实和幻觉数据。为了解决这一挑战,我们推出了 HaloScope,这是一种新颖的学习框架,利用未标记的 LLM 生成文本进行幻觉检测。
这种未标记数据在 LLM 部署到开放世界时自由产生,包含真实和幻觉信息。为了有效利用这些未标记数据,我们提出了一种自动化的成员资格估计评分,用于区分未标记混合数据中的真实与不真实生成,从而实现二元真实分类器的训练。重要的是,我们的框架不需要额外的数据收集和人工标注,为实际应用提供了很大的灵活性和可行性。大量实验表明,HaloScope 在幻觉检测性能上表现优越,显著超过了竞争对手。代码可在https://github.com/deeplearning-wisc/haloscope 获取。



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU