最近确实被DeepSeek刷屏了,我也把它的app下载到自己的手机上,用了几天,感觉还是非常不错的,坦白说这是我第一次深入使用国产AI,之前一直是用chatgpt。我不是那种喜欢尝新,喜欢评测的极客,我的原则是只选择市场上口碑和质量最好的产品。不过DeepSeek作为chatgpt的平替,还是很香的,对很多问题的解答都超出我的预期。当然,部分任务依然是取代不了chatgpt的,比如DeepSeek无法生成图片,以及无法进行语音交互,但因为它回答速度足够快(chatgpt经常慢的不行),而且质量足够好,仍然足以成为我日常用的AI工具之一。
也看到不少专业人士的解读,一些国外的评测和市场上的高光表现,相信读者从其他渠道也都了解了,我就不再转述了。那么就有一种观点,这是不是中国国产AI逆转美国的时刻,特别是扎克伯格的Meta成了一个反衬的背景板。(另一个反衬的背景板是我的老东家百度,咱就不点评了)
说真的,真的挺超出我预期的,我也没想到国产AI的表现能如此惊艳,然后我就反思去年的文章,有些逻辑我认为依然是成立的。
国内的AI和美国相比,存在四点差距,其一,算法,这个是可以追的,也是差距最小的;其二,算力,算力不只是资金的问题,因为先进的GPU芯片已经禁止向中国出售,这个差距目前相对还不算很大,未来可能会越来越大。其三,语料,中文语料在科技领域和英文依然存在相当差距。其四,合规,中国的合规成本更高,这个问题其实真的不是个小问题,这里就不展开讨论了。
关于算法,我一直认为这是我们差距最小的,是可以追的,但是说真的,即便如此,我还是低估了国内的AI工作者,这次DeepSeek的惊艳表现,通过网上对他们论文的解读,应该说,在优化能力和训练成本上,远远优于美国同行。
那么根据一些技术解读,我的理解是这样的,deepseek自身也承认,他们是基于chatgpt公开的一些算法思想研发的,仍然是站在巨人的肩上,当然chatgpt没有开源,所以只是借鉴了对方的思想,主要是基于对方论文的描述,进行了完美的复刻,然后在这个基础上,又加上了自己革命性的创新,系统的自我激励机制可以在更少的训练数据和训练资源情况下实现所谓涌现,或者说,英文原文说的是,Aha时刻,这个词很有意思,其实我觉得更精确的描述应该叫做顿悟,就是在学习和推理的过程中,突然间把一些相关的逻辑链打通了,能够正确的理解一些复杂的因果,实现合理的问题解读和判断分析。那么chatgpt的顿悟是基于巨大的训练成本和资源,而deepseek明显极大降低了这个门槛,以至于可以在一些普通的学校实验室,甚至家用高配电脑里自行训练实现顿悟,对很多学校,科研机构来说,他们对deepseek也是赞不绝口,如获至宝。
必须说,中国人在优化方面的天赋还是非常强的,在deepseek之前,尤洋教授主导的colossal ai也是一个能极大降低训练成本的AI大模型训练框架,在业内也是被广泛认同和使用的。而在AI大模型还没出现的更早期,我所了解的无论是阿里还是腾讯,对数据库负载能力的极致优化也都可以说是全球顶级的。
由于算法上超出寻常的优化能力,算力上的短板问题就很容易被克服了,而且很难得的是,幻方量化很早就是国内算力储备的Top玩家之一,虽然初衷并不是AI大模型,但也有点歪打正着的感觉。所谓算力短板,是跟美国AI巨头相比,确实差距蛮大,但是在国内来说,依然是一线算力资源的行列。
语料这块,我第一时间就猜到了他们语料供应商是谁,然后私下核对了一下,不过这种事情目前不方便公开,我就不多说了。但是我有一个猜测,说出来可能不是很正确,根据我不断测试的情况看,我猜测,国内所有大模型的基本逻辑,科学技术相关的知识储备,基本上都是英文语料训练出来的,其实早期很多国内大模型都爆露过类似问题,比如去年有案例,你说总线它给出的是巴士,你说鼠标它给出的是老鼠,我个人倾向于认为,英文语料训练依然是质量的保障,中文语料当然针对国内很多场景有价值,但对于一些深入探索的技术问题,可能依然需要更多英文语料才能达到足够的效果。
所以,感谢不方便透露的语料供应商吧,能提供覆盖全球的高质量语料数据,也是国内大模型能快速成长的幕后英雄。
然后就是合规,我真的也调戏了一下deepseek,问了不少按理说不该问的问题,当然,有些问题肯定是不能直接问,但可以通过某种方式绕过问题本身的检测,在这种情况下,它经常是先输出一段内容,然后涉及到某些可能敏感的内容时,突然快速回滚,然后切换到一段标准正能量文字。可以看出系统的审核架构,是在输出的同时进行校验的。其实这个问题倒还好,但是现在在美国很多人都在使用,这里就肯定存在某些合规的问题。
我还有一个疑问,就是它的联网搜索功能,到底是有没有受到国内互联网环境的制约,那些被屏蔽网站是否可以正常阅读,我倾向于认为是可以的,否则在海外是不可能有如此多好评的。但是否做了人群和地区切分,海外和国内是否用的同一套架构,同样的服务器资源,这些我没有验证,但这里多多少少都会存在很多合规风险。不过目前还好,因为产品表现非常惊艳,特别是能打美国政策的脸,(同样的还有小红书),在这种情况下,就具有了极高的统战价值,相关新闻大家也都看到了,所以当前应该是安全的。但未来做全球合规的难度依然很高,相信也是他们目前最大的挑战之一,也希望他们能顺利过渡。
那么以上四点的个人解读之后,回到最初的问题,这算是逆转美国的AI创新了么?
我觉得至少目前还不能算,毕竟它还是站在巨人的肩膀上,虽然有自己非常优秀的算法创新,但还谈不上那种不可超越的领先优势。在综合效果上,追平甚至超越了chatgpt免费版本,但还真不能说已经完全超越了chatgpt,以及我们都知道chatgpt有更强大的版本并没有公开出来。
而且开源之后,国外巨头也会快速跟进,在这种情况下,想要维持算法领先的难度也很高。但我们也希望这个开源项目能够在全球技术人才的共同努力下能快速进步,也许未来有一天,最大的贡献者并非来自这家中国公司,但也是很值得庆祝的事情。基于开源社区的力量(而不仅仅是商业公司的力量),干翻chatgpt,其实也是很有可能的。很期待,未来这个开源项目的贡献者名单里会出现分布在全球的各种顶级天才。
那么另一个最大的风险在于,这个团队的成绩太惊艳了,以至于团队成员被巨头挖角的概率大大增加了,已经有新闻出来小米用千万年薪挖走了一个核心的95后技术天才,据说是给出了之前4倍的年薪(必须承认,deepseek技术团队的薪酬水平还是很高的,不弱于国内互联网巨头),相信很多猎头都已经动起来了,很多巨头都在努力的下offer,动辄几倍薪资来挖人 ,对一些年轻的技术从业者来说,还是很有吸引力的。其实openAI也遇到了类似的问题,当然,这也是一个好事情,优秀的技术人才可以靠自己的技术能力实现财富自由,我一直认为这才是很正能量的事情。所以deepseek团队是否还能维持足够的凝聚力和战斗力,也是需要持续观察的。
最后, deepseek会展示它的推理过程,这一点很酷,而且很有借鉴意义,测试了一些比较复杂的数学题,注意到它的推理过程会不断否定自己,重新审视自己,可以说,就算作为人类而言,都会觉得它的思维方式非常的有借鉴意义。
那么我2024知识星球的年终福利课也已经正式发布了,主题就是《如何打造可纠错的反馈闭环》,其实去观察AI的推理过程,也真有点这个意思。
知识星球用户可以通过星球置顶帖免费进入课程。
👇 我的知识星球,三天内自行退出免费100%退款承诺。
最后,祝大家春节快乐,我的星球用户们,如果觉得我的年终福利课对你有帮助,有启发,能够加速你的成长,还请不吝分享给你的朋友们,谢谢。