不得不说:
中文世界正面临一次危机。
这次危机的源头,正是
ChatGPT
发起的冲击。
在人工智能这个领域,过去中文世界以为自己很强。
但是ChatGPT一出现,原先竞争的平衡就被打破。
曾经以为东西方世界的“
并驾齐驱
”,瞬间变成“
追赶者
”。
所以很多人在问一个问题:
这样的提问很正常,很多人都在担心,人工智能时代,中文会不会被摒弃。
我们会在本文中回答这个问题,中文在AI时代有机会最终超越吗?
特别是在
逆全球化
横行,动辄鼓吹
文明脱钩
的岁月。
如果技术上没有跟上,可能会失去一个新时代。
好消息是,不仅国内科技公司开始进入
大模型竞争
,甚至
模型下游
的一些产品开始陆续推出。
比如,今天
钉钉
便率先利用阿里千问大模型,整合成为一个
智能化的生产力工具
。
这种
主动出击
,敢于
挑战
,值得鼓励。
因为面对
以ChatGPT为代表
的AIGC/AGI世代,中文互联网不得不争!
不讲理的ChatGPT
说封杀就封杀
中文世界要争AIGC/AGI领域,不仅是
宏观需要
,也是
个人诉求
。
ChatGPT出现后,国内很多人是体验不到的(禁止国内IP注册)。
而就算你“
跋山涉水
”成功了,也没有任何保障,说
封杀
就封杀。
从3月底到四月初,ChatGPT状况频频:
大规模的
封号
,以及暂停用户注册。
其中封号涉及的多是
亚洲用户
,特别是
中文地区
用户。
就算开通了Plus会员,交了钱,说删号就删号。
这真不是站着赚钱,简直就是骑在用户头上赚钱。
其实不仅仅是ChatGPT,还有AIGC另一知名企业
Midjourney
体验也不友好。
那么为什么ChatGPT,或者说其背后的OpenAI敢这么做?
很简单,目前ChatGPT
一骑绝尘
,没有其它公司可以制约它。
中文互联网
不能被“卡脖子”
尊重每一家世界级的科技公司,特别是类似OpenAI在技术上的
原生态创造
。
但
中文世界
要有自己的
生态
,有自己的
文化
,有自己的
群体感受
,以及自己种族的
尊严
和
利益
。
只有自己拥有ChatGPT的竞品,才有可能像移动互联网时代一样,东西方两个移动互联网世界形成
良性竞争
和
成长
,这对全世界才有好处。
18世纪,蒸汽机带领英国人走进“
蒸汽时代
”。
欧洲大陆的法德,迅速跟进学习技术成为强国。
而中国沉迷于“
田园时代
”,最后结局可想而知。
很多人忧心忡忡:
背后其实是害怕:ChatGPT会成为新的“
卡脖子
”问题。
作为个人,首要反思自己,然后用善意来揣摩对方。
但作为整体,又不得不带着
竞争性
为群体考虑。
一旦被卡脖子,带来的可能是社会的
整体性影响
。
就像
芯片
一样,在各个方面都要受制于人。
如果有一个
ChatGPT中文镜像
,就算不是那么杰出,但也得有自己的产品。
中文世界,有十几亿人口。
要有自己的“ChatGPT”,才能保护自己。
中文语言逻辑不同
打造我们的“ChatGPT”
在使用ChatGPT的过程中,有一个很大的感受:
英文提问与中文进行提问的对比,
英文
的回答质量会优质一些。
ChatGPT在中文语境下,有不少错误,还经常
胡编乱造
。
比如问:
“风萧萧兮易水寒,壮士一去兮不复还”
这句话怎么理解?
这不能怪别人,ChatGPT毕竟是一个以
英文
为主体的生成式AI。
它的底层逻辑是将
英文单词
拆解成
向量
传入Encoder模块,而
中文向量不可拆分
。
其实不仅仅是ChatGPT,目前大部分AIGC都是如此。
比如说Midjourney,这是一个AI绘画软件。
如果你想要用它画一幅具有
中文意境
的画,几乎是不可能的。
比如你想让它画一幅:
语言代表的其实就是思想的表达可能性。
我们需要ChatGPT,我们也需要一个能够适应
中文语言
的“ChatGPT”。
大模型,中文互联网可以正面竞争
ChatGPT非常优秀,但并非真的是
高不可攀
。
其实不仅仅是ChatGPT,整个AIGC也就是人工智能生成内容方面,中国的公司是有能力的。
ChatGPT属于“工程类竞争”
需要的是方向和经验
ChatGPT为人类作出最大的贡献是指明了
生成式AI
是可能的,只要方向明确了,我们迟早也会调出ChatGPT类似的产品出来。
ChatGPT背后的真正大佬:
Transformer
大模型。它是ChatGPT的基石,而看看Transformer论文,它的
第一作者第二作者
都是
华人
。
而OpenAI团队里也有许多
华人成员
。比如毕业于清华大学的
袁启明
,是GPT-4项目数据集来源和处理团队的负责人。华人学者
欧阳龙
参与了ChatGPT中多个技术项目的研发工作。同时他还是InstructGPT论文的第一作者、RLHF 论文的第二作者。
中国的人工智能产品,过去集中在实用性的计算机CV视觉工程上,对于
自然语言大模型NLP
的确缺乏远见,同时对生成式AI即AIGC更没有信心。现在方向已经非常明确,这方面中国企业和团队不会弱。
大模型,中文互联网企业一旦有了方向,是可以正面与最优秀的公司竞争的。
给技术以文明⇌给文明以技术
技术是
冷冰冰
的,是
文明
的存在才能让技术焕发色彩。
所以从这一角度出发,技术永远是
工具
,而文明才是
目的
。
文明是否能够跟机器融合,是否具有被机器提炼的价值,将是一大关键。
训练模型的核心,在于对其进行
大量语料喂送
,最终
蒸馏知识
,再加以
传承
。
上个世纪30年代,所有文明都面临一个问题——
能否被计算机所读取
。
泰文比英文多
三个字符
,但因为文明弱势不可能要求打字机公司单独生产多三个键的硬件。
于是泰文
自我阉割
了3个字母,这个文明得以在现代化的历程中传承下去。
如何把文明融合到算法中,未来将关乎整个民族的传承。
以上,我们说的是
给文明以技术
。
但是,也要反过来思考,
给技术以文明
。
特别是AI,它需要学习不同的
文明数据
,这样才能让AI在
chain of thought
更进一步。
未来AI最缺乏的可能是
多元生态
的文明,这就需要给技术以文明。
我们的
文化底蕴
决定了产出内容的下限不会低。