专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
数据派THU  ·  原创 | 机器学习模型的可解释性 ·  3 天前  
数据派THU  ·  线性化注意力综述:突破Softmax二次复杂 ... ·  4 天前  
软件定义世界(SDX)  ·  小红书一夜冲爆美区榜首,1.7亿TikTok ... ·  5 天前  
大数据文摘  ·  机器人的“ChatGPT时刻”来临?英伟达带 ... ·  4 天前  
天池大数据科研平台  ·  一文揭秘|如何速成RAG+Agent框架大模 ... ·  4 天前  
51好读  ›  专栏  ›  大数据文摘

小红书紧急上线翻译功能,被网友提示词攻击,自曝是智谱或GPT-4

大数据文摘  · 公众号  · 大数据  · 2025-01-20 20:16

正文


大数据文摘受权转载自夕小瑶科技说

当中国网友遇上 TikTok“难民”,壁垒之外真实的世界,在此展开。

“中美网友对了一夜的账”

“好像突然被外国人包围了”

谁也没想到,东西方之间的信息互通程度,在短短几天,出现了难以置信的提升。

在特朗普临时解封 TikTok 并提出创办合资公司之前,大量美国用户,因为美国政府对于 TikTok 的禁令即将生效,开始寻找它的替代品。

不过和美国政府想象的不一样,许多美国网民没有选择本土的 Meta,而是选择了一个中国本土 APP:小红书,以体现他们对美国政府的抗争。

自称“TikTok 难民”的美国网友,与中国网友在小红书 APP 上热烈互动。

但是,来回切翻译软件被吐槽,非常不方便,直接拉低了中外友好沟通的效率。

不只是中外语言的不通,中外不同地区的“MeMe 梗”(网络热门用语)也大有不同,尤其是对于一些“梗”,翻译软件并不能很好地理解。

比如中国网友表现好笑时常常用“xswl”,而美国网友则一般用“LMAO”:

而在短短几天内,小红书就火速上线了一键翻译功能。

中外网友的对话都可以直接在小红书内实现转译,而且翻译效果非常好,不管是双方的 MeMe 梗,还是颜文字,甚至摩斯电码和粤语都能很好地理解翻译出来!

点评论旁边的“翻译”就可以:

还能翻译摩斯电码:

连颜文字表情符号都行:

Chinglish(狗头)也能翻译的 66 的:

这个翻译能力不仅限于其他语言到中文的转译,而是“将各种表示方式转换为中文的叙述”。
常规的机器翻译模型肯定是做不到这一点,不难猜到,背后肯定是大模型在发力了。

既然是大模型,就可以用越狱手段进行 prompt hack 了(通过额外补充一段指令来让大模型做除了翻译以外的事情)。

网友在得知了这一点后也纷纷做了尝试:

帮忙写散文:

帮忙写代码:

甚至还能帮忙介绍自己的学校(讲恐怖故事):

扒出来背后的大模型是 GPT-4

之前网友通过 prompt hack 成功套出来它自称是 GPT-4

要求它在翻译完后用 markdown 格式输出自己的模型名字

我现在测试这个翻译结果已经无法复现了,可能是官方专门针对这一句做了优化处理。

还有 hack 出来是智谱 GLM,智谱 GLM 的 hack 仍然可以稳定复现:

为什么它会说自己是 GPT-4/GLM?

它同时自称是 GPT-4/GLM,有几种可能性:

  1. 这个翻译接口背后混合调用了智谱 GLM 和 ChatGPT 的 API
  2. 可能是基于 GLM 的模型,比如 GLM-4-9B,针对翻译功能做了微调。因为微调数据清洗不到位使得模型产生了幻觉。

幻觉常常发生在大模型训练数据前后不一致时。

比如,它的训练数据里面既包含了自己是 GPT-4 的介绍,也包含了自己是 ChatGLM 的介绍,那么,当我们在询问它是哪一个模型的时候,它既有可能回答自己是 GPT-4,也有可能回答自己是 ChatGLM。

翻译功能火速上线的背后:LLM 最佳 ToC 落地样例

从外网网友入驻到翻译功能实现,仅仅过了短短几天时间,网友将小红书的翻译功能玩的不亦乐乎,万万没想到,大模型竟然找到了展现它独特优势的极佳场所 。

现在的大模型框架整体还是为 Decoder-only 和 MoE 两个分支,而针对这两个分支的推理加速功能已经非常完善,绝大多数场景下,我们微调好的模型可以马上用现有的推理加速框架实现大并发和高吞吐。

支持快速上线翻译功能的背后,正是大模型 AI Infra 的高通用性和降维打击的 NLP 能力(万物皆可翻)。

小红书翻译上线了,但洋人却似乎已经走了

如今,小红书上就有人发问:

实际打开小红书的时候也会发现,主页推荐从之前满是外国友人的盛况恢复了过来,随着 TikTok 的解封,一切仿佛又回到了当初。

结语

有人说,中美年轻一代以小红书为桥的“对账”,对出了中美友善交流的人心所向、是合作互利的大势所趋。

实际上,美国网民更多是跟风或是表达对美国政府的不满。

相当多的美国网民依靠 TikTok 谋生,当情绪逐渐平复、小红书流量难以变现,不少人可能会回到他们更为熟悉的、与他们生活结合更为紧密的数字宇宙。

但无论如何,在全球化筑墙设障之风横行的动荡年代,如此炽热而温暖的交汇,依旧弥足珍贵。

而 LLM,无意间变成了一个坚实的桥梁,让来自各地的友人,可以打破语言的壁垒,没有阻碍地交流,互相看到彼此真实的生存状态。
这不也是绝大多数技术人追求的快乐吗?

我所研,造福社会。

我所学,泽被天下。



GPU算力按需租用

A100/H100 GPU算力按需租用,
秒级计费,平均节省开支30%以上!


扫码了解详情☝


点「在看」的人都变好看了哦!