特别的Zero
如今类o1模型已经出来了这么多,莫理也大大小小都试用体验了一番。
但是GLM-Zero推理模型给我的感受确实是别具一格的,或者说是更适合中国宝宝体质的大模型~
大伙都知道像GPT这种海外大模型因为原生语言不是中文,因此对于中文的理解本身就比国内的稍显逊色。
而GLM-Zero推理模型则对比国内其他模型更进一步,也就是更能“听懂人话”
百度贴吧作为曾经中国最大的中文互联网论坛之一,里面可谓是藏龙卧虎,其中的弱智吧甚至可以说是人类抵御AI的最后一道防线…无数大模型都倒在了它那看似弱智却又很有道理的问题之中。在经过了长达16S的思考后,回答给我们的感觉却是:理解了,但是完全没有理解…
(上方为长图,请滑动查看)
可以看见它充分理解咱们的语言艺术,并没有掉入语言陷阱~之后俺还问了一道弱智吧精选。
智谱也能精准的点出喝酒是主要原因,压力是间接原因……
当然啦,目前还是不能做到弱智吧这种富有哲学的回答。
万一哪天AI大模型要是真这么回答了,莫理我可能就要带头投敌了~(笑
除去这种偏向娱乐性质的,GLM-Zero推理模型在专业领域同样是相当能打。
要知道它实际上是 GLM-Zero 系列中专注于增强 AI推理能力的模型,因此对于数理逻辑、代码和需要深度推理的复杂问题才属于专业对口。
Be like 👇
这是我之前看见有人向GPT-O1询问的一个数学题,感觉特别有意思,一下就让我想起来三体中秦国的人列计算机。
智谱对于这种问题的思考可以说非常的严谨。
先是从预估每人一秒计算一次,到每人计算十次,最后到思考到人类对于复杂问题独特的优势…
只可惜算来算去还是比不过现代计算机
对于这种有趣的物理问题,它也会首先考虑到在实际上是不可能实现的,然后在纯理论的基础上思考分析。
同时我还故意问了它一个著名的悖论问题,回答可以说是情理之中预料之外吧 。
情理之中是知道它能够告诉我这个问题的答案,意料之外则是没想到它会像这样清晰的使用数列极限来解释。
如果俺没记错的话,极限与收敛相关可是考研数学题了。
为此莫理加大难度直接搬出了2024年数二真题~
也是看了Zero推理模型的思考过程,莫理才终于明白老师以前说的数学思维到底是什么。不仅算出了正确答案还通过演算检验排除了错误。
与现有模型不同,GLM-Zero-Preview 能够初步实现推理过程中自主决策、问题拆解和尝试多种方式解决问题。
对比Open AI等产品不说超越也还是能算得上是不分伯仲,各有千秋的~
目前 GLM-Zero-Preview 已经上线使用,大家可以直接前往「智谱清言」选择「Zero推理模型」智能体免费体验~
https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
https://bigmodel.cn/dev/api/normal-model/glm-zero-preview
https://zhipuaishengchan.datasink.sensorsdata.cn/t/7K
开发者可以在「智谱开放平台」中,通过 API 进行调用。
同时智谱团队也是很诚恳的指出了目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型还有不少的差距。
相比较有些团队无脑自嗨的对比,莫理还是更喜欢这种”老实人“。
毕竟只有看见差距、承认差距才会沉下心来不断努力取得最后的成功~
本文发表于公众号【莫理】
▽▽▽