专栏名称: 量子学派
专注于自然科学领域(数理哲)的教育付费平台
目录
51好读  ›  专栏  ›  量子学派

AIGC/AGI, 中文互联网不得不争!

量子学派  · 公众号  · 科学  · 2023-04-18 22:15

正文


不得不说: 中文世界正面临一次危机。

这次危机的源头,正是 ChatGPT 发起的冲击。


在人工智能这个领域,过去中文世界以为自己很强。

但是ChatGPT一出现,原先竞争的平衡就被打破。

曾经以为东西方世界的“ 并驾齐驱 ”,瞬间变成“ 追赶者 ”。


所以很多人在问一个问题:

为什么ChatGPT没有诞生在中国?

这样的提问很正常,很多人都在担心,人工智能时代,中文会不会被摒弃。

我们会在本文中回答这个问题,中文在AI时代有机会最终超越吗?


特别是在 逆全球化 横行,动辄鼓吹 文明脱钩 的岁月。

如果技术上没有跟上,可能会失去一个新时代。


好消息是,不仅国内科技公司开始进入 大模型竞争 ,甚至 模型下游 的一些产品开始陆续推出。

比如,今天 钉钉 便率先利用阿里千问大模型,整合成为一个 智能化的生产力工具

这种 主动出击 ,敢于 挑战 ,值得鼓励。


因为面对 以ChatGPT为代表 的AIGC/AGI世代,中文互联网不得不争!

AIGC,中文互联网不得不争!




1

不讲理的ChatGPT

说封杀就封杀


中文世界要争AIGC/AGI领域,不仅是 宏观需要 ,也是 个人诉求

ChatGPT出现后,国内很多人是体验不到的(禁止国内IP注册)。

而就算你“ 跋山涉水 ”成功了,也没有任何保障,说 封杀 就封杀。


从3月底到四月初,ChatGPT状况频频:

大规模的 封号 ,以及暂停用户注册。

其中封号涉及的多是 亚洲用户 ,特别是 中文地区 用户。



就算开通了Plus会员,交了钱,说删号就删号。

这真不是站着赚钱,简直就是骑在用户头上赚钱。


其实不仅仅是ChatGPT,还有AIGC另一知名企业 Midjourney 体验也不友好。


那么为什么ChatGPT,或者说其背后的OpenAI敢这么做?

很简单,目前ChatGPT 一骑绝尘 ,没有其它公司可以制约它。




2

中文互联网

不能被“卡脖子”


尊重每一家世界级的科技公司,特别是类似OpenAI在技术上的 原生态创造

中文世界 要有自己的 生态 ,有自己的 文化 ,有自己的 群体感受 ,以及自己种族的 尊严 利益


只有自己拥有ChatGPT的竞品,才有可能像移动互联网时代一样,东西方两个移动互联网世界形成 良性竞争 成长 ,这对全世界才有好处。


18世纪,蒸汽机带领英国人走进“ 蒸汽时代 ”。

欧洲大陆的法德,迅速跟进学习技术成为强国。

而中国沉迷于“ 田园时代 ”,最后结局可想而知。


很多人忧心忡忡:

为什么ChatGPT不是最早发生在中国?

背后其实是害怕:ChatGPT会成为新的“ 卡脖子 ”问题。



作为个人,首要反思自己,然后用善意来揣摩对方。

但作为整体,又不得不带着 竞争性 为群体考虑。


一旦被卡脖子,带来的可能是社会的 整体性影响

就像 芯片 一样,在各个方面都要受制于人。

如果有一个 ChatGPT中文镜像 ,就算不是那么杰出,但也得有自己的产品。


中文世界,有十几亿人口。

要有自己的“ChatGPT”,才能保护自己。




3

中文语言逻辑不同

打造我们的“ChatGPT”


在使用ChatGPT的过程中,有一个很大的感受:

英文提问与中文进行提问的对比, 英文 的回答质量会优质一些。


ChatGPT在中文语境下,有不少错误,还经常 胡编乱造

比如问:

“风萧萧兮易水寒,壮士一去兮不复还”

这句话怎么理解?

它的回答是这样的:



这不能怪别人,ChatGPT毕竟是一个以 英文 为主体的生成式AI。

它的底层逻辑是将 英文单词 拆解成 向量 传入Encoder模块,而 中文向量不可拆分


其实不仅仅是ChatGPT,目前大部分AIGC都是如此。

比如说Midjourney,这是一个AI绘画软件。

如果你想要用它画一幅具有 中文意境 的画,几乎是不可能的。


比如你想让它画一幅:

大漠孤烟直,长河落日圆。

结果出来是这样的:


维特根斯坦曾说:

语言的边界就是思想的边界。


语言代表的其实就是思想的表达可能性。

我们需要ChatGPT,我们也需要一个能够适应 中文语言 的“ChatGPT”。




4

大模型,中文互联网可以正面竞争


ChatGPT非常优秀,但并非真的是 高不可攀

其实不仅仅是ChatGPT,整个AIGC也就是人工智能生成内容方面,中国的公司是有能力的。


1

ChatGPT属于“工程类竞争”

需要的是方向和经验

ChatGPT为人类作出最大的贡献是指明了 生成式AI 是可能的,只要方向明确了,我们迟早也会调出ChatGPT类似的产品出来。


2

华人在这方面的能力很强

无论是理论还是实践

ChatGPT背后的真正大佬: Transformer 大模型。它是ChatGPT的基石,而看看Transformer论文,它的 第一作者第二作者 都是 华人


而OpenAI团队里也有许多 华人成员 。比如毕业于清华大学的 袁启明 ,是GPT-4项目数据集来源和处理团队的负责人。华人学者 欧阳龙 参与了ChatGPT中多个技术项目的研发工作。同时他还是InstructGPT论文的第一作者、RLHF 论文的第二作者。


3

中国在人工智能方面的基础并不弱

中国的人工智能产品,过去集中在实用性的计算机CV视觉工程上,对于 自然语言大模型NLP 的确缺乏远见,同时对生成式AI即AIGC更没有信心。现在方向已经非常明确,这方面中国企业和团队不会弱。


大模型,中文互联网企业一旦有了方向,是可以正面与最优秀的公司竞争的。




5

给技术以文明⇌给文明以技术


技术是 冷冰冰 的,是 文明 的存在才能让技术焕发色彩。

所以从这一角度出发,技术永远是 工具 ,而文明才是 目的


文字代表文明,也是文明的载体。

文明是否能够跟机器融合,是否具有被机器提炼的价值,将是一大关键。

训练模型的核心,在于对其进行 大量语料喂送 ,最终 蒸馏知识 ,再加以 传承

举个例子:

上个世纪30年代,所有文明都面临一个问题—— 能否被计算机所读取

泰文比英文多 三个字符 ,但因为文明弱势不可能要求打字机公司单独生产多三个键的硬件。

于是泰文 自我阉割 了3个字母,这个文明得以在现代化的历程中传承下去。


如何把文明融合到算法中,未来将关乎整个民族的传承。


以上,我们说的是 给文明以技术

但是,也要反过来思考, 给技术以文明


特别是AI,它需要学习不同的 文明数据 ,这样才能让AI在 chain of thought 更进一步。

未来AI最缺乏的可能是 多元生态 的文明,这就需要给技术以文明。

我们的 文化底蕴 决定了产出内容的下限不会低。










请到「今天看啥」查看全文