作为一个内容创作者,我每天创作的来源就是基于看到的信息,学习到的知识,越来越觉得像大语言模型的工作原理:上学时学习的基础知识,就像是预训练,然后毕业后的工作经历就像是后训练、微调和对齐。那些每天看到的信息、用户的反馈就像是 Prompt,触发了我去生成内容,但生成的内容,主要还是基于自己训练和微调的结果。
如果把内容创作者类比为大语言模型!
简单一点的内容搬运,就好比翻译模型,简单有效。
初级一点的原创就好比对内容做摘要、点评、生成图片、生成视频。
更高级一点的原创,则要把某个话题、问题、素材当成Prompt,从日常训练、微调的语料库中组织生成内容,这里重点不是你的 Prompt 多高级,而是你的语料库有多丰富,拼的是上学时的预训练和日常的输入和思考。
最高级的,已经脱离了大语言模型的范畴,而是大语言模型的优质训练语料了。
如果把内容创作者类比为大语言模型!
简单一点的内容搬运,就好比翻译模型,简单有效。
初级一点的原创就好比对内容做摘要、点评、生成图片、生成视频。
更高级一点的原创,则要把某个话题、问题、素材当成Prompt,从日常训练、微调的语料库中组织生成内容,这里重点不是你的 Prompt 多高级,而是你的语料库有多丰富,拼的是上学时的预训练和日常的输入和思考。
最高级的,已经脱离了大语言模型的范畴,而是大语言模型的优质训练语料了。