提示 p 的功能,是将上下文X、目标 y 及其本身,组织成模板 T。如图所示,在预测一个国家首都的任务中(LAMA-TREx P36),模板可能是“英国的首都是 [MASK]。” ,其中“……的首都是……”是提示符,“英国”是上下文,“[MASK]”是目标。提示可以非常灵活,甚至可以将它们插入上下文或目标中。令 V 记作语言模型 M 的词汇表,[Pi] 记做模板 T 中的第 i 个提示token。给定模板 T,与传统的离散提示相比,P-tuning 将 [Pi] 视为伪token,并将模板映射到可训练的嵌入张量。这样就能够找到更好的连续提示,超出M的原始词汇V所能表达的范围。最后,利用下游损失函数L,可以可微分地优化连续提示hi。