Imitate Before Detect: Aligning Machine Stylistic Preference for Machine-Revised Text Detection
论文链接:
https://arxiv.org/abs/2412.10432
项目主页:
https://machine-text-detection.github.io/ImBD
在线演示:
https://ai-detector.fenz.ai
代码链接:
https://github.com/Jiaqi-Chen-00/ImBD
共同第一作者包括:
陈家棋(复旦大学、Stanford University),朱小烨(华南理工大学、NUS(重庆))、刘天炀(UCSD)。主要作者还包括:陈莹(UIUC)、陈心慧(武汉大学、Fenz.AI)、袁怡雯(CMU)、Chak Tou Leong(香港理工大学)、唐龙(独立研究者)、张磊(UCSD)、Chenyu Yan(Georgia Tech)、梅光浩(UCSD)。共同通讯作者:李祖超、张乐飞(武汉大学)、张捷(复旦大学)。
现如今,大语言模型(LLMs)已经在文本生成领域达到了接近人类水平的能力。然而,随着这些模型被广泛应用于文本创作,其在考试、学术论文等领域的滥用引发了严重关注。特别是在当前场景下,用户往往不是完全依赖 AI 生成内容,而是利用 AI 对人类原创内容进行修改和润色,这种混合型的内容给检测带来了前所未有的挑战。
传统的机器生成文本检测方法在识别纯 AI 生成内容时表现良好,但面对机器修订文本时常常误判。这是因为机器修订文本通常只对原始人类文本做出细微改动,同时包含了大量人类创作的特征和领域专业术语,这使得基于概率统计的传统检测方法难以准确识别。
随着大语言模型(LLMs)的快速发展和广泛应用,AI 辅助写作已经成为一种普遍现象。然而,这种技术的普及也带来了新的挑战,特别是在需要严格管控 AI 使用的领域,如学术写作、新闻报道等。
与传统的纯机器生成文本不同,当前更常见的场景是用户利用 AI 对人类原创内容进行修改和润色,这种混合型的内容使得检测工作变得异常困难。如图 2(a-c)所示,相比于人类原创文本和纯机器生成文本之间的明显差异,机器修订文本往往与原始人类文本只有细微的改动。
[3]. Bao G, Zhao Y, Teng Z, et al. Fast-detectgpt: Efficient zero-shot detection of machine-generated text via conditional probability curvature. arXiv preprint arXiv:2310.05130, 2023.
[4]. Tian E, Cui A, et al. GPTZero: Towards detection of AIgenerated text using zero-shot and supervised methods. https://gptzero.me, 2023.
[5]. Yang A, Yang B, Hui B, et al. Qwen2 technical report. arXiv preprint arXiv:2407.10671, 2024.
[6]. Meta A I. Introducing meta llama 3: The most capable openly available llm to date. Meta AI, 2024.
[7]. Jiang A Q, Sablayrolles A, Roux A, et al. Mixtral of experts. arXiv preprint arXiv:2401.04088, 2024.
[8]. Bi X, Chen D, Chen G, et al. Deepseek llm: Scaling open-source language models with longtermism. arXiv preprint arXiv:2401.02954, 2024.
[9]. Yang X, Cheng W, Wu Y, et al. Dna-gpt: Divergent n-gram analysis for training-free detection of gpt-generated text. arXiv preprint arXiv:2305.17359, 2023.