专栏名称: 莫理
Hi,这有很多稀奇古怪的黑科技哟~
目录
51好读  ›  专栏  ›  莫理

王炸压台登场,最懂你的神仙工具!

莫理  · 公众号  · 科技自媒体 互联网短视频  · 2024-12-31 15:41

主要观点总结

本文介绍了自今年9月13日GPT-o1发布以来,国内大模型厂商在人工智能领域的竞争情况,以及各模型的特点。重点介绍了GLM-Zero-Preview模型,该模型在深度思考和复杂问题处理上展现出独特优势,能够初步实现推理过程中自主决策、问题拆解和多种方式解决问题。文章还提到了该模型与OpenAI等产品的对比,以及智谱开放平台的开发者资源和体验地址。

关键观点总结

关键观点1: 国内大模型厂商竞争情况

自GPT-o1发布以来,国内大模型厂商纷纷推出自己的杰作,包括k0 math、DeepSeek-R1-Lite、Skywork o1等模型,展现了我国在人工智能领域的创新实力和快速进步。

关键观点2: GLM-Zero-Preview模型的特点

GLM-Zero-Preview模型能够听懂人话,充分理解中文语言艺术,并在深度思考和复杂问题处理上展现出独特优势。该模型能够初步实现推理过程中自主决策、问题拆解和多种方式解决问题。

关键观点3: GLM-Zero-Preview与OpenAI等产品的对比

GLM-Zero-Preview与OpenAI等产品不相上下,各有千秋。智谱团队诚恳地指出了当前模型与OpenAI的o3模型之间的差距,强调看见并承认差距是取得最后成功的基础。


正文

前言

自从今年9月13日GPT-o1发布以来,一场关于大模型在深度思考和复杂问题处理能力上的较量便在全球范围内悄然展开。

在这场激烈的竞赛中,咱们国内的大模型厂商们不甘示弱,纷纷推出了自己的杰作!包括k0 math、DeepSeek-R1-Lite、Skywork o1等模型。

可谓各具特色,共同展现了我国在人工智能领域的创新实力和快速进步。也让我越来越期待还没发布的各家又在捣鼓着什么“狠活” 

正所谓好饭不怕晚,终于在2024年的最后一天咱们的“靠谱青年”也是推出了它们家的最新类o1模型—GLM-Zero-Preview(下面简称Zero推理模型)



特别的Zero

如今类o1模型已经出来了这么多,莫理也大大小小都试用体验了一番。
但是GLM-Zero推理模型给我的感受确实是别具一格的,或者说是更适合中国宝宝体质的大模型~


大伙都知道像GPT这种海外大模型因为原生语言不是中文,因此对于中文的理解本身就比国内的稍显逊色。
GLM-Zero推理模型则对比国内其他模型更进一步,也就是更能“听懂人话” 
俗话说天才吧里没有天才,弱智吧也不收真弱智。
百度贴吧作为曾经中国最大的中文互联网论坛之一,里面可谓是藏龙卧虎,其中的弱智吧甚至可以说是人类抵御AI的最后一道防线…
无数大模型都倒在了它那看似弱智却又很有道理的问题之中。
(上方为长图,请滑动查看)

在经过了长达16S的思考后,回答给我们的感觉却是:理解了,但是完全没有理解…

而咱们的Zero推理模型则恰恰相反 👇

(上方为长图,请滑动查看)

可以看见它充分理解咱们的语言艺术,并没有掉入语言陷阱~

之后俺还问了一道弱智吧精选。

智谱也能精准的点出喝酒是主要原因,压力是间接原因……

当然啦,目前还是不能做到弱智吧这种富有哲学的回答。

万一哪天AI大模型要是真这么回答了,莫理我可能就要带头投敌了~(笑

除去这种偏向娱乐性质的,GLM-Zero推理模型在专业领域同样是相当能打。

要知道它实际上是 GLM-Zero 系列中专注于增强 AI推理能力的模型,因此对于数理逻辑、代码和需要深度推理的复杂问题才属于专业对口

Be like 👇

(上方为长图,请滑动查看)

这是我之前看见有人向GPT-O1询问的一个数学题,感觉特别有意思,一下就让我想起来三体中秦国的人列计算机。

智谱对于这种问题的思考可以说非常的严谨。

先是从预估每人一秒计算一次,到每人计算十次,最后到思考到人类对于复杂问题独特的优势…

只可惜算来算去还是比不过现代计算机 

对于这种有趣的物理问题,它也会首先考虑到在实际上是不可能实现的,然后在纯理论的基础上思考分析。

同时我还故意问了它一个著名的悖论问题,回答可以说是情理之中预料之外吧 。

情理之中是知道它能够告诉我这个问题的答案,意料之外则是没想到它会像这样清晰的使用数列极限来解释。

如果俺没记错的话,极限与收敛相关可是考研数学题了。

为此莫理加大难度直接搬出了2024年数二真题~

也是看了Zero推理模型的思考过程,莫理才终于明白老师以前说的数学思维到底是什么。不仅算出了正确答案还通过演算检验排除了错误。

与现有模型不同,GLM-Zero-Preview 能够初步实现推理过程中自主决策、问题拆解和尝试多种方式解决问题

对比Open AI等产品不说超越也还是能算得上是不分伯仲,各有千秋的~

目前 GLM-Zero-Preview 已经上线使用,大家可以直接前往「智谱清言」选择「Zero推理模型」智能体免费体验~

智谱清言:

https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh

智谱开放平台:

https://bigmodel.cn/dev/api/normal-model/glm-zero-preview

2000万token免费体验资源包领取地址

https://zhipuaishengchan.datasink.sensorsdata.cn/t/7K

开发者可以在「智谱开放平台」中,通过 API 进行调用。

同时智谱团队也是很诚恳的指出了目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型还有不少的差距。

相比较有些团队无脑自嗨的对比,莫理还是更喜欢这种”老实人“。

毕竟只有看见差距、承认差距才会沉下心来不断努力取得最后的成功~


本文发表于公众号【莫理】

关注我们,阅读更多精彩内容

▽▽▽