专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
51好读  ›  专栏  ›  新智元

万字长文总结提示词技巧!新加坡首届GPT-4提示工程大赛冠军最新分享

新智元  · 公众号  ·  · 2024-05-13 13:31

正文



新智元报道

编辑:Henry 乔杨
【新智元导读】 提示工程已经成为了热门话题,无论是CO-STAR框架构建提示词,使用分隔符将提示词分段,使用LLM护栏创建系统提示,还是仅使用LLM(无需插件或代码)分析数据集,用户都将拥有全新的使用体验。

新加坡(GovTech)举办了首届GPT-4提示工程竞赛,Sheila Teo很幸运地取得了胜利。

提示工程是一门融合了艺术和科学的学科——它既是对技术的理解,也包含创造力和战略思维。
这次她和我们分享了她在学习过程中学到的提示工程策略,这些策略可以让任何LLM都可以完全满足用户的需求,甚至做得更多!
其中1,2指的是适合初学者的提示技术,而3,4指的是高级策略:
1. 使用CO-STAR框架构建提示词
2. 使用分隔符将提示词分段
3. 使用LLM护栏创建系统提示符
4. 仅使用LLM(无需插件或代码)分析数据集
1. 使用CO-STAR框架构建提示信息
有效的提示结构对于从LLM那里获取最佳回复至关重要。CO-STAR框架是新加坡政府科技部数据科学与人工智能团队的心血结晶,是构建提示的便捷模板。
它考虑到了LLM回答的有效性和相关性的所有关键方面,从而使回答更加优化。

具体操作如下:

(C)上下文:提供任务的上下文信息

这有助于LLM了解正在讨论的具体情景,确保其答复具有相关性。

(O)目标:确定你希望LLM执行的任务是什么

明确你的目标有助于LLM把回答的重点放在实现这一具体目标上。

(S)风格:指明你希望LLM使用的写作风格

这可以是某个名人的写作风格,也可以是某个行业的某个专家,如商业分析专家或首席执行官。这将引导LLM以符合你需求的方式和用词做出回复。

(T)语气:确定回复的态度

这可确保LLM的回复与所需的情感或情绪背景产生共鸣。例如,正式的、幽默的、善解人意的等。

(A)受众:确定回复的对象

根据受众(如某一领域的专家、初学者、儿童等)量身定制LLM的回复,确保其在所需的语境中是恰当的、可以理解的。

(R)回复:提供回复格式

这可确保LLM按照下游任务所需的准确格式输出。例如,列表、JSON、专业报告等。大多数LLM应用程序都会以编程方式LLM回复进行下游操作,对于这些应用程序来说,JSON输出格式是最理想的。

CO-STAR的实际应用
下面是一个真实的例子,说明CO-STAR框架为什么有用。
假设你是一名社交媒体经理,你需要帮助起草一篇Facebook帖子来宣传公司的新产品。
没有CO-STAR的提示工程是这样的:
Facebook 上写一篇文章,为我公司的新产品做广告。我的公司名为Alpha,产品名为Beta,是一种新型超快速吹风机。
下面是GPT-4的输出结果:
介绍Alpha公司革命性的Beta吹风机!

- 告别冗长乏味的吹发过程!阿尔法隆重推出贝塔型吹风机,这是我们在护发技术方面的最新创新。

- 超快吹干: 得益于先进、强劲的电机,Beta可以将你的吹干时间缩短一半。 让你更快做好准备,有更多时间做自己喜欢的事情!

这种输出方式虽然够用,但却非常普通,缺乏必要的细微差别和有针对性的吸引力,无法引起公司受众的共鸣。

下面是一个使用CO-STAR模板的示例,它提醒你将任务的其他方面融入你的提示中,特别是之前的快速提示中缺少的「风格」、「语气」和「受众」方面:
#上下文#
我想为我公司的新产品做广告。我的公司名叫Alpha,产品名叫Beta,是一种新型超快吹风机。

#目标#
为我创建一个Facebook帖子,目的是让人们点击产品链接购买它。

#风格#
效仿戴森等宣传类似产品的成功公司的写作风格。

#语气#
有说服力的。

#受众#
我公司在Facebook上的受众通常是老一代人。请针对这部分受众通常对美发产品的要求,量身定制你的帖子。

#回复#
Facebook上的帖子,简明扼要而又富有感染力。
通过应用CO-STAR,GPT-4的回复变得更有针对性、更有效:

用Alpha Beta拥抱轻 松优雅 -- 智慧一 代的超快吹风机。

使 用Alpha Be ta, 重新找回简单有效的护发乐趣。 我们的最新创新产品不仅仅是一款吹风机,它还是一个承诺,为那些热爱生活的人提供快速、轻柔、可靠的头发造型

- 简单直观: 告别复杂的小工具。 Alpha Beta为舒适和简便而设计,非常适合那些看中直接、无忧技术的人。

- 省心技术: 我们知道你的时间非常宝贵。 因此,Alpha Beta可以大大缩短吹干时间,让你有更多时间享受生活的乐趣。 使用Alpha Beta,让每一天都成为美好的一天。 体验精致与简约的完美融合。

CO-STAR框架指导你有条不紊地向LLM提供有关任务的所有关键信息,确保根据你的需求提供量身定制的优化回复。

2. 使用分隔符将提示词分段


分隔符是一种特殊的标记,可帮助LLM区分提示词的哪些部分应被视为一个意义单元。这一点很重要,因为你的整个提示信息是作为一长串标记符到达LLM的。
分隔符通过对提示词的特定部分进行区别对待,为这一语素序列塑造了结构。
值得注意的是,对于简单的任务,分隔符可能不会影响LLM的回复质量。
但是,任务越复杂,使用分隔符进行分段对LLM回答的影响就越大。

将分隔符用作特殊字符

分隔符可以是任何通常不会同时出现的特殊字符序列,例如:
  • ###
  • ===
  • >>> >>>

所选特殊字符的数量和类型并不重要,只要它们足够独特,能让LLM将其理解为内容分隔符而非普通标点符号即可。
下面举例说明如何在提示符中使用此类分隔符:

将<< >中每段对话的情绪分类为「积极」或「消极」。给出情感分类,无需任何其他前言文本。


###


对话示例


[Agent]:早上好,有什么能帮你的吗?

[顾客]:这个产品太糟糕了,和广告上说的完全不一样!

[顾客]:我非常失望,希望全额退款。


[Agent]:早上好,有什么可以帮你?

[顾客]:你好,我只想说你们的产品留下了深刻印象。它超出了我的预期!


###


输出示例


「消极」


「积极」


###


<<<

[Agent]:你好,欢迎来到我们的支持中心。有什么可以帮你的吗?

[顾客]:你好!我只是想让你们知道我收到了我的订单,而且太棒了。

[Agent]:很高兴听到这个消息!我们很高兴你对购买的产品感到满意。还有什么需要我帮忙的吗?

[顾客]:没有了。我只想给你一些积极的反馈。谢谢你们的优质服务。


[Agent]:你好,感谢你的联系。有什么可以帮你?

[顾客]:我对最近购买的产品非常失望。和我预期的完全不一样。

[Agent]:很遗憾听到这个消息。能否请你提供更多详细信息,以便我提供帮助?

[顾客]:产品质量很差,而且到货很晚。我真的不满意。

>>>

以上示例使用分隔符####进行分节,分节标题EXAMPLE CONVERSATIONS(示例对话)和EXAMPLE OUTPUTS(示例输出)用大写字母区分。
序言指出,要分类的对话被分在<< >>内,这些对话随后在提示的底部提供给LLM,但没有任何解释性文字,但由于分隔符<<< and>>>的存在,LLM明白这些是它应该分类的对话。
下面是GPT-4的输出结果,其中给出了情感分类,但没有像我们要求的那样输出任何其他前言文本:
「积极」

「消极」

将分隔符用作 XML标签

使用分隔符的另一种方法是将其作为XML标签。XML标签是用角括号括起来的带有开头和结尾的标签。 就是一个例子。

这种方法很有效,因为LLM已经接受过大量XML网页内容的训练,并学会了理解其格式。
下面是同样的提示,但结构上使用XML标签作为分隔符:

根据给出的示例,将以下对话的情感分为两类。在没有任何其他前言文本。


积极

消极

类>


[Agent]:早上好,有什么可以帮你?

[顾客]:这个产品太糟糕了,和广告上说的完全不一样!

[顾客]:我非常失望,希望全额退款。


[Agent]:早上好,有什么可以帮你?

[顾客]:你好,我只想说你们的产品留下了深刻印象。它超出了我的预期!

对话示例>


积极

消极

示例类>


[Agent]:你好!欢迎来到我们的支持中心。有什么可以帮你?

[顾客]:你好!我只是想让你们知道我收到了我的订单,而且太棒了。

[Agent]:很高兴听到这个消息!还有什么需要我帮忙的吗?

[顾客]:没有了。我只想给你一些积极的反馈。谢谢你们的优质服务!


[Agent]:你好,感谢你的联系。有什么可以帮你?

[顾客]:我对最近购买的产品非常失望。和我预期的完全不一样。

[Agent]:很遗憾听到这个消息。能否请你提供更多详细信息,以便我提供帮助?

[顾客]:产品的质量很差,而且很晚才送到。我对这次经历非常不满意。

对话>

在XML标签中,使用与你在说明中用来描述它们的词相同的名词,是有好处的。

我们在上述提示中给出的指令是:
用给出的例子,将以下对话的情感分为两类,不要使用任何其他序言文本。
其中我们使用了名词「对话」、「分类」和「示例」。因此,我们用作分隔符的XML标签是、、 和 ,确保LLM理解你的指令与用作分隔符的XML标签之间的关系。
同样,通过使用分隔符,以清晰、有条理的方式对指令进行分段,可确保GPT-4按你希望的方式作出回复:

「积极」

「消极」

3. 使用LLM护栏创建系统提示


在进入正题之前,需要注意的是本节只适用于具有系统提示功能的LLM,而不像本文其他章节那样适用于任何LLM。
最著名的LLM当然是ChatGPT,因此我们将使用ChatGPT作为本节的示例。
围绕系统提示的术语
首先,让我们来理清术语:关于ChatGPT,有大量资源几乎可以互换使用这三个术语:「系统提示」、「系统消息」和 「自定义指令」。
这让很多人感到困惑,以至于OpenAI发布了一篇文章来解释这些术语。以下是其摘要:
  • 「系统提示」和 「系统消息」是通过聊天完成API以编程方式与ChatGPT进行交互时使用的术语。

  • 另一方面,「自定义指令」是通过ChatGPT用户界面与ChatGPT交互时使用的术语。

不过总的来说,这三个术语指的是同一件事,所以不要被术语混淆了!今后,本节将使用「系统提示」一词。现在让我们深入了解一下!

什么是系统提示?

系统提示是一种附加提示,你可以在其中提供有关LLM行为方式的指令。它被认为是附加的,因为它不属于你对LLM的「正常」提示(即用户提示)。
在聊天中,每次你提供新提示时,系统提示都会像过滤器一样,让LLM在回复你的新提示前自动应用。这意味着LLM在聊天中的每次回复都会考虑到到系统提示。

何时使用系统提示?

你首先想到的问题可能是:既然我也可以在与LLM进一步对话之前,在新聊天的第一次提示中说明,为什么还要在系统提示中说明呢?
答案是,因为LLM的对话内存是有限的。在后一种情况下,随着对话的继续,LLM很可能会「忘记」你在聊天中提供的第一条提示,从而遗忘这些提示。
另一方面,如果在系统提示自带指令,那么这些系统提示就会与聊天中的每个新提示一起被自动考虑。
这可以确保LLM在聊天过程中继续接收这些提示,无论聊天时间多长。
总之:在整个聊天过程中使用系统提示,可提供你希望LLM在回复时记住的提示。

系统提示应包括哪些内容?

系统提示中的说明通常包括以下几类:
  • 任务定义,这样LLM就能在整个聊天过程中始终记住要做什么。
  • 输出格式,以便LLM始终记住应该如何回复。
  • 安全护栏,这样LLM就能始终记住它应该如何「不」回复。安全护栏是LLM管理中的新兴领域,指的是LLM允许在其中运行的配置范围。
例如,系统提示可能如下所示:

你将使用此文本回答问题:「插入文本」。
你将以这种格式回复一个JSON对象:{「问题」:「答案」}。
如果文本中没有足够的信息来回答问题,请不要编造信息,并将答案填写为 「NA」。
你只能回答与「插入范围」相关的问题。切勿回答任何与年龄、性别和宗教信仰等人口统计信息相关的问题。

其中每个部分涉及的类别如下:

但是,「正常」的聊天提示又是什么呢?

现在你可能会想:听起来系统提示中已经提供了很多信息。那我应该在聊天的 「正常」提示(即用户提示)中放点什么呢?
系统提示概述了当前的任务。在上面的系统提示示例中,任务被定义为只使用一段特定文本来回答问题,并且LLM被指示以{「问题」:「答案」}格式。

你将使用此文本回答问题:[插入文本]。

你将以这种格式回复一个JSON对象:{「问题」:「答案」}。
在这种情况下,聊天的每个用户提示都是你希望使用文本回答的问题。例如,用户提示可能是「文本是关于什么的」而LLM会回答{文本是关于什么的?文本是关于......}。
但是,让我们进一步概括这个任务示例。在这种情况下,我们可以将上述系统提示的第一行编辑为:

你将使用此文本回答问题:[插入文字]。

你将使用提供的文本回答问题。

现在,聊天的每个用户提示,都会包括要回答问题的文本和要回答的问题,例如:[插入文本]:
在这里,我们还使用XML标签作为分隔符,以便有条理地向LLM提供所需的2条信息。
XML标签「文本」和「问题」中使用的名词,与系统提示中使用的名词相对应,这样LLM就能理解标签与系统提示指令之间的关系。
总之,系统提示应给出总体任务指令,而每个用户提示应提供你需要任务执行的具体细节。在本例中,这些具体内容就是文本和问题。

此外:使LLM护栏动态化

以上是通过系统提示中的几句话添加的护栏。这些护栏是一成不变的,在整个聊天过程中不会改变。
如果你希望在聊天的不同阶段设置不同的护栏,该怎么办?
不幸的是,对于ChatGPT用户界面的用户来说,现在还不能直接做到这一点。
不过,如果你正在以编程方式与ChatGPT进行交互,那你就走运了!
随着人们对构建有效的LLM护栏的关注度越来越高,一些开源软件包也应运而生,它们可以让你以编程方式设置更详细、更动态的护栏。
其中值得注意的是英伟达团队开发的NeMo护栏,它允许你配置用户与LLM之间的预期对话流,从而在聊天的不同点设置不同的护栏,使动态护栏随着聊天的进行而发展。非常推荐你去看一看!

4. 仅使用LLM(无需插件或代码)分析数据集


你可能听说过OpenAI在ChatGPT的GPT-4中推出的高级数据分析插件,高级(付费)账户可以使用该插件。

它允许用户将数据集上传到ChatGPT,并直接在数据集上运行代码,从而进行精确的数据分析。

但你知道吗,使用LLM分析数据集并不一定需要这样的插件?让我们先来了解一下单纯使用LLMs分析数据集的优势和局限性。

LLM「不擅长」的数据集分析类型

你可能已经知道,LLM进行精确数学计算的能力有限,因此它们不适合从事需要对数据集进行精确定量分析的工作,例如:
  • 描述性统计:通过平均值或方差等指标对数字列进行定量总结。
  • 相关性分析:获取列之间的精确相关系数。
  • 统计分析:如假设检验,以确定各组数据点之间是否存在统计意义上的显著差异。
  • 机器学习:在数据集上执行预测建模,如使用线性回归、梯度提升树或神经网络。
在数据集上执行此类定量任务,是OpenAI高级数据分析插件存在的原因,这样编程语言就可以在数据集上运行代码来执行此类任务。
那么,为什么有人要只使用LLM而不使用此类插件来分析数据集呢?

LLM擅长的数据集分析类型

LLM擅长识别模式和趋势。这种能力源于它们在多样化和海量数据方面接受的广泛培训,使他们能够辨别可能无法立即察觉的复杂模式。
这使它们非常适合执行基于数据集模式识别的任务,例如:
  • 异常检测:根据一个或多个列值,识别偏离常规的异常数据点。
  • 聚类:将各列中具有相似特征的数据点进行分组。
  • 跨列关系:识别跨列的综合趋势。
  • 文本分析(针对基于文本的列):根据主题或情感进行分类。
  • 趋势分析(针对有时间方面的数据集):识别跨时间列内的模式、季节性变化或趋势。
对于这类基于模式的任务,仅使用LLM可能比使用代码在更短的时间内获得更好的结果!让我们用一个例子来充分说明这一点。

仅使用LLM分析Kaggle数据集

我们将使用一个流行的Kaggle数据集,该数据集是为客户个性分析而策划的,其中一家公司试图对其客户聚类进行细分,以便更好地了解客户。
为便于稍后验证LLM的分析结果,我们将把该数据集子集为50行,并只保留最相关的列。
之后,用于分析的数据集将如下所示,其中每一行代表一位客户,每一列描述客户信息:

假设你在公司的营销团队工作。你的任务是利用这个客户信息数据集来指导营销工作。
这是一项分两步走的任务:首先,利用数据集生成有意义的客户细分。
其次,就如何对每个细分市场进行最佳营销提出想法。现在,这是一个实际的商业问题,LLM的模式发现(第一步)能力在这个问题上确实可以大显身手。
让我们使用4种提示工程技术,为这项任务设计如下提示:
1. 将复杂的任务分解成简单的步骤
2. 参考每个步骤的中间输出
3. 编写LLM回答的格式
4. 将指令与数据集分开
下面是GPT-4的回复,我们继续将数据集以CSV字符串的形式传递给它。

随后,GPT-4按照我们要求的标记符报告格式回复了分析结果:
验证LLM的分析结果
为简洁起见,我们选取两个由LLM生成的客户聚类进行验证,例如年轻的家庭成员和挑剔的发烧友。
年轻的家庭
  • 由LLM综合得出的特征:1980年以后出生、已婚或同居、中低收入、有子女、经常小额消费。
  • 按LLM聚类为该组的行:3、4、7、10、16、20
  • 深入研究数据集,这些行的完整数据是:
这与LLM确定的配置文件完全一致。它甚至能够在我们没有事先进行预处理的情况下,对带有空值的行进行聚类!
挑剔的发烧友
  • 由LLM合成的特征:年龄跨度大、婚姻状况不限、收入高、子女状况各异、购物花费高。
  • 通过LLM聚类到该组的行:2、5、18、29、34、36
  • 深入研究数据集,这些行的完整数据是:

这也非常符合LLM所确定的特征!
这个例子展示了LLM在发现模式、解释多维数据集并将其提炼为有意义的见解方面的能力,同时确保其分析深深植根于数据集的事实真相。

如果我们使用ChatGPT的高级数据分析插件呢?

为了完整起见,我用同样的提示尝试了同样的任务,但要求ChatGPT使用代码来执行分析,这就激活了它的高级数据分析插件。
我的想法是让该插件使用K-Means等聚类算法直接在数据集上运行代码,以获得每个客户聚类,然后再综合每个聚类的概况,从而提供营销策略。
然而,尽管数据集只有50行,但多次尝试后都出现了以下错误信息,并且没有任何输出:






请到「今天看啥」查看全文