专栏名称: 量子学派

专注于自然科学领域（数理哲）的教育付费平台

AIGC/AGI，中文互联网不得不争！

量子学派 · 公众号 · 科学 · 2023-04-18 22:15

正文

引

不得不说： 中文世界正面临一次危机。

这次危机的源头，正是 ChatGPT 发起的冲击。

在人工智能这个领域，过去中文世界以为自己很强。

但是ChatGPT一出现，原先竞争的平衡就被打破。

曾经以为东西方世界的“ 并驾齐驱 ”，瞬间变成“ 追赶者 ”。

所以很多人在问一个问题：

为什么ChatGPT没有诞生在中国？

这样的提问很正常，很多人都在担心，人工智能时代，中文会不会被摒弃。

我们会在本文中回答这个问题，中文在AI时代有机会最终超越吗？

特别是在 逆全球化 横行，动辄鼓吹 文明脱钩 的岁月。

如果技术上没有跟上，可能会失去一个新时代。

好消息是，不仅国内科技公司开始进入 大模型竞争 ，甚至 模型下游 的一些产品开始陆续推出。

比如，今天钉钉便率先利用阿里千问大模型，整合成为一个 智能化的生产力工具 。

这种 主动出击 ，敢于挑战，值得鼓励。

因为面对 以ChatGPT为代表 的AIGC/AGI世代，中文互联网不得不争！

“

AIGC，中文互联网不得不争！

”

不讲理的ChatGPT

说封杀就封杀

中文世界要争AIGC/AGI领域，不仅是 宏观需要 ，也是 个人诉求 。

ChatGPT出现后，国内很多人是体验不到的（禁止国内IP注册）。

而就算你“ 跋山涉水 ”成功了，也没有任何保障，说封杀就封杀。

从3月底到四月初，ChatGPT状况频频：

大规模的封号，以及暂停用户注册。

其中封号涉及的多是 亚洲用户 ，特别是 中文地区 用户。

就算开通了Plus会员，交了钱，说删号就删号。

这真不是站着赚钱，简直就是骑在用户头上赚钱。

其实不仅仅是ChatGPT，还有AIGC另一知名企业 Midjourney 体验也不友好。

那么为什么ChatGPT，或者说其背后的OpenAI敢这么做？

很简单，目前ChatGPT 一骑绝尘 ，没有其它公司可以制约它。

中文互联网

不能被“卡脖子”

尊重每一家世界级的科技公司，特别是类似OpenAI在技术上的 原生态创造 。

但 中文世界 要有自己的生态，有自己的文化，有自己的 群体感受 ，以及自己种族的尊严和利益。

只有自己拥有ChatGPT的竞品，才有可能像移动互联网时代一样，东西方两个移动互联网世界形成 良性竞争 和成长，这对全世界才有好处。

18世纪，蒸汽机带领英国人走进“ 蒸汽时代 ”。

欧洲大陆的法德，迅速跟进学习技术成为强国。

而中国沉迷于“ 田园时代 ”，最后结局可想而知。

很多人忧心忡忡：

“

为什么ChatGPT不是最早发生在中国？

”

背后其实是害怕：ChatGPT会成为新的“ 卡脖子 ”问题。

作为个人，首要反思自己，然后用善意来揣摩对方。

但作为整体，又不得不带着 竞争性 为群体考虑。

一旦被卡脖子，带来的可能是社会的 整体性影响 。

就像芯片一样，在各个方面都要受制于人。

如果有一个 ChatGPT中文镜像 ，就算不是那么杰出，但也得有自己的产品。

中文世界，有十几亿人口。

要有自己的“ChatGPT”，才能保护自己。

中文语言逻辑不同

打造我们的“ChatGPT”

在使用ChatGPT的过程中，有一个很大的感受：

英文提问与中文进行提问的对比，英文的回答质量会优质一些。

ChatGPT在中文语境下，有不少错误，还经常 胡编乱造 。

比如问：

“风萧萧兮易水寒，壮士一去兮不复还”

这句话怎么理解？

它的回答是这样的：

这不能怪别人，ChatGPT毕竟是一个以英文为主体的生成式AI。

它的底层逻辑是将 英文单词 拆解成向量传入Encoder模块，而 中文向量不可拆分 。

其实不仅仅是ChatGPT，目前大部分AIGC都是如此。

比如说Midjourney，这是一个AI绘画软件。

如果你想要用它画一幅具有 中文意境 的画，几乎是不可能的。

比如你想让它画一幅：

大漠孤烟直，长河落日圆。

结果出来是这样的：

维特根斯坦曾说：

语言的边界就是思想的边界。

语言代表的其实就是思想的表达可能性。

我们需要ChatGPT，我们也需要一个能够适应 中文语言 的“ChatGPT”。

大模型，中文互联网可以正面竞争

ChatGPT非常优秀，但并非真的是 高不可攀 。

其实不仅仅是ChatGPT，整个AIGC也就是人工智能生成内容方面，中国的公司是有能力的。

ChatGPT属于“工程类竞争”

需要的是方向和经验

ChatGPT为人类作出最大的贡献是指明了 生成式AI 是可能的，只要方向明确了，我们迟早也会调出ChatGPT类似的产品出来。

华人在这方面的能力很强

无论是理论还是实践

ChatGPT背后的真正大佬： Transformer 大模型。它是ChatGPT的基石，而看看Transformer论文，它的 第一作者第二作者 都是华人。

而OpenAI团队里也有许多 华人成员 。比如毕业于清华大学的 袁启明 ，是GPT-4项目数据集来源和处理团队的负责人。华人学者 欧阳龙 参与了ChatGPT中多个技术项目的研发工作。同时他还是InstructGPT论文的第一作者、RLHF 论文的第二作者。

中国在人工智能方面的基础并不弱

中国的人工智能产品，过去集中在实用性的计算机CV视觉工程上，对于 自然语言大模型NLP 的确缺乏远见，同时对生成式AI即AIGC更没有信心。现在方向已经非常明确，这方面中国企业和团队不会弱。

大模型，中文互联网企业一旦有了方向，是可以正面与最优秀的公司竞争的。

给技术以文明⇌给文明以技术

技术是 冷冰冰 的，是文明的存在才能让技术焕发色彩。

所以从这一角度出发，技术永远是工具，而文明才是目的。

文字代表文明，也是文明的载体。

文明是否能够跟机器融合，是否具有被机器提炼的价值，将是一大关键。

训练模型的核心，在于对其进行 大量语料喂送 ，最终 蒸馏知识 ，再加以传承。

举个例子：

上个世纪30年代，所有文明都面临一个问题—— 能否被计算机所读取 。

泰文比英文多 三个字符 ，但因为文明弱势不可能要求打字机公司单独生产多三个键的硬件。

于是泰文 自我阉割 了3个字母，这个文明得以在现代化的历程中传承下去。

如何把文明融合到算法中，未来将关乎整个民族的传承。

以上，我们说的是 给文明以技术 。

但是，也要反过来思考， 给技术以文明 。

特别是AI，它需要学习不同的 文明数据 ，这样才能让AI在 chain of thought 更进一步。

未来AI最缺乏的可能是 多元生态 的文明，这就需要给技术以文明。

我们的 文化底蕴 决定了产出内容的下限不会低。

AIGC/AGI， 中文互联网不得不争！

正文

请到「今天看啥」查看全文

AIGC/AGI，中文互联网不得不争！