文章介绍了智谱清言推出的全新推理模型——GLM-Zero-Preview,具有强大的AI推理能力,表现在解决问题的能力、自我反思能力以及应对复杂问题的拆解能力上。文章通过多个实例测试,如面包难题、房间灯泡问题、街边小摊营收问题等,展示了该模型的多角度思考、逻辑推理和解决问题的能力。文章还提到,该模型在编程能力上也有所突破,甚至能写俄罗斯方块游戏。最后,文章提供了使用方法和免费资源领取方式。
文章首先介绍了智谱清言全新推出的推理模型GLM-Zero-Preview,它是GLM-Zero的初代版本,拥有强大的AI推理能力。
该模型拥有自我反思的能力,能够在解决问题的过程中自主决策,面对复杂问题会进行拆解并尝试用多种方法来解决问题。
文章通过多个实例测试,展示了GLM-Zero-Preview模型的逻辑推理和解决问题的能力,包括解决面包难题、房间灯泡问题、街边小摊营收问题等。
文章最后提供了如何使用GLM-Zero-Preview模型的方法,目前该模型完全免费,可以在智谱清言官网或平台上使用,还提供了免费领取2000万token体验资源包的活动链接。
没想到2024年的最后一天,还有惊喜。
过去的一年里,阿枫给大家安利过不少AI产品,「智谱清言」更是咱们的老朋友了,几乎是隔三差五就来波全面升级,妥妥的“卷王”
万万没想到,在今年的最后一天,它还放上了个王炸,推出了全新的推理模型模型-
GLM-Zero-Preview
,它是GLM-Zero的初代版本。
这个新模型的特色在于其强大的AI推理能力,堪称AI界的“福尔摩斯”,通过下图中的测试数据可以看得出来,它已经可以追平OpenAI的o1-preview模型了,实力不容小嘘
它和我们常见模型最大的区别在于,它拥有自我反思的能力,能够在解决问题的过程中自主决策,面对复杂问题会进行拆解并尝试用多种方法来解决问题,甚至能跟学霸一样举一反三...
不得不说,它真的越来越像人类了,很难想象随着后续的不断学习,它会给咱们带来怎样的震撼。
既然它的长处在于推理能力,那么咱也不惯着,先给它丢了一道经典的“面包难题”上上强度。
通过下方完整回答,可以看到它会
不断的推理和多位思考问题
,然后进行模型建立、求解,最后给到了一个较为严谨的答案。
为了对比效果,这里我又找了个类似的o1产品来进行横向对比,看看相同问题下它的表现又如何↓
很明显,两者的回答都还不错,但相比之下
Zero确实更胜一筹
。
这可不是我无脑吹,如果你认真的看完了两者的回答,你会发现
Zero更偏向于多角度深入思考问题,会以多个视角推算出答案
,最后才会挑选一个最严谨的答案。
在解题方面,也有着详细地解题步骤,从问题描述到求解过程,最后再到得出结论,可以说是相当详细了。
前面咱说过,o1模型最擅长的就是推理,那么咱们就出一个推理题给它试试水,大家也可以先动动脑
说的是一个房间里有三个灯泡,三个灯泡的开关在房间外面,假如你只能进房间一次,如何确定哪个开关对应哪个灯泡?
毫无意外,Zero很轻松的就把这道题目给答出来了。
它的思路清晰,逻辑有序,虽然你可以通过其他的方法找出答案,但该说不说,它的回复确实更加通俗易懂,连我这样的学渣一眼也能看明白
再比如我楼下的街边小摊,每晚商贩们凌晨两三点收摊回去后还要计算一天的营收问题。那对于这类的生计问题是否能放心的交给Zero呢?
那咱们来一道脑力题,看看它会不会被绕进去:
经过它贴心的计算,不仅没有被问题绕进去,还给出了正确的答案,甚至还额外给了未出意外情况下的预期利润。
有的人可能会觉得这道题目太过于简单,不足以完全放心。那咱必须要满足你的顾虑,直接来道高等数学题瞧瞧结果又如何
还是老样子,直接把题目甩给Zero,让它来帮我计算这道我也懒得算(其实我根本不会
)的高等数学题。
可以看到它经过
不断的计算、验算、代入结果,最终得出正确的答案
。
要知道数理题最讲究一个严谨性,不仅要求详细地解题步骤,你还得会举一反三、反向推理和验算,而Zero就严格的做到了这些要求,
使用多种方法进行反复的验算,最后得出精准答案。
就这样的解题思路和方法,搁外面找个私教辅导,不得一节课花个大几百。
那对于上面那道高等数学题的答案,我也要严谨一下,刚好仔细
核对了试题的参考答案
,无疑是正确的
再来对比一下
DeepSeek,从回复的内容来看,两者之间的推理过程和结果大差不差。
因为它整个
推理和解题的过程通俗易懂,并且布局舒适且合理
,每一个步骤的
表达都很清晰
。
要知道,数理题在表达解题过程时,非常注重清晰、准确地展示每一步的推理和计算,从而便于他人理解,智谱在细节上确实花了些功夫。
说出来你可能不信,未来可能真有大批程序员要下岗了,因为AI的编程能力也越来越强了,人类是年龄越大越容易失业,而AI则恰恰相反。