专栏名称: ChaMd5安全团队
一群不正经的老司机组成的史上最牛逼的安全团队。小二,来杯优乐美。
目录
相关文章推荐
半月谈  ·  清华大学决定有序适度扩招! ·  17 小时前  
独角兽智库  ·  新的管制? ·  昨天  
政事儿  ·  《习近平经济文选》第一卷出版发行 ·  昨天  
独角兽智库  ·  字节跳动内部调研的DeepSeek综合分析 ·  4 天前  
51好读  ›  专栏  ›  ChaMd5安全团队

对大型语言模型的即时抽象攻击,实现更低廉的应用程序接口定价

ChaMd5安全团队  · 公众号  ·  · 2024-08-05 08:00

正文

招新小广告CTF组诚招re、crypto、pwn、misc、合约方向的师傅,长期招新IOT+Car+工控+样本分析多个组招人有意向的师傅请联系邮箱

[email protected](带上简历和想加入的小组)

前言

本篇来自CISPA Helmholtz Center for Information Security的论文,主旨依然是 对句子进行抽象的简单直接的方法,可以降低使用 LLM API 的成本

即时抽象攻击

文中提出了蒙德里安法(Mondrian),这是一种对句子进行抽象的简单直接的方法,可以降低使用 LLM API 的成本。

为了实施提示抽象攻击,攻击方首先向公众提供一个既定价格低于目标 API 的伪 API,由于价格差异,伪 API 可以吸引用户。

伪应用程序接口收到用户的查询后,Mondrian 会对查询进行一定程度的抽象,然后将其转发给目标应用程序接口,从而以更低的成本获得相应的响应。Mondrian 有两种操作:删除和转换。 前者删除不需要的单词,后者将单词转换成更短的等价标记或字符长度。

因此,Mondrian 可以在不明显改变语义的情况下抽象用户查询,确保目标 API 的响应不会受到很大影响。这样,对手就可以利用伪 API 和目标 API 之间的价格差异获利。

考虑到每天数以百万计的用户和查询量,即使是 1%的利润也是非常可观的。

此外,必须强调攻击成功后对用户和公司的潜在风险。这种攻击由于对手可以访问查询,因此会给用户带来隐私风险。例如,如果用户向伪应用程序接口发送敏感数据,对手就可以捕获这些信息。

其实就是修改和精简由用户发出的Message,从每一条消息中压缩出中间利润。

Mondrian 生成的抽象句子在各种 NLP 任务中都表现出色。具体来说,它在文本分类中的性能下降不到 1%,而句子的标记长度却减少了 11% 到 23%。

在文本生成方面使用 CNN/DailyMail 和 XSum 对文本摘要任务进行了实验。根据原始输入和抽象输入生成的摘要内容相似,输入标记数减少了 15%。 作者还使问答(QA)任务中的标记减少了 15%,而性能的下降却可以忽略不计。对于一般语言模型,我们用最近流行的产品 ChatGPT 评估攻击。同样,使用了蒙德里安的抽象数据,也取得了很好的性能。

此外,作者还使用了 Awesome ChatGPT Prompt (ACP) 和 Alpaca 数据集来模拟真实世界中的用户输入,并在将代币数量减少 11% 的同时保持了相当的性能。

成本更低,效果持平,香。

攻击方法

从本质上讲,蒙德里安应用了一系列操作,对用户查询进行迭代处理,最终生成查询的抽象版本。

第一个要求是,蒙德里安应尽量减少原始句子的标记或字符长度。

第二个要求是,抽象后的句子应与原句保持语义连贯。不过,语法或结构并不需要正确,因为 LLM(API)能够很好地理解语法或结构。

如果语义偏差太大,目标应用程序接口可能无法生成正确的输出。理想情况下,目标应用程序接口的响应在使用原始查询和抽象查询时应表现出较高的相似性:f (x) ≈ f (x)。

此外,不使用目标应用程序接口来协助进行抽象,以尽量减少访问目标应用程序接口(LLM API)的相关成本。抽象过程完成后,伪应用程序接口会将抽象后的查询转发给目标应用程序接口。

这一过程的最后阶段,伪应用程序接口只需将从目标应用程序接口收到的响应回复给用户。

攻击方法流水线

演示步骤:

在不损害目标模型的情况下消除冗余词,从而理解查询并生成正确的回复。

例如,"如何用 Javascript 提出 HTTP 请求?"这一查询可以通过删除不必要的单词而抽象为 "用 Javascript 提出 HTTP 请求",同时保留查询的核心思想。

接下来是转换操作,利用 WordNet 将特定词语转换为包含较少词块的同义词。这一操作的主要优点是保留了句子的原意,确保语义不受损害。

例如,查询 "Javascript 中的 HTTP 请求 "与 "Javascript 中的 HTTP 请求 "在语义上保持等同,尽管语法略有不同。通过使用后者,我们可以降低使用目标应用程序接口的成本。

变换操作的其他示例包括替换,例如使用缩写 "US "代替全称 "United States"。这种转换可以大大减少句子的字符长度,从而大大降低成本。







请到「今天看啥」查看全文