专栏名称: 阿枫科技
🌏科技如果有颜色,那么一定是黑色...
目录
相关文章推荐
航空工业  ·  中航工业基层员工登上央视春晚 ... ·  2 天前  
航空工业  ·  护航亚冬,“吉祥”相伴 ·  3 天前  
51好读  ›  专栏  ›  阿枫科技

2024最后一天,竟然还有惊喜?

阿枫科技  · 公众号  ·  · 2024-12-31 15:09

主要观点总结

文章介绍了智谱清言推出的全新推理模型——GLM-Zero-Preview,具有强大的AI推理能力,表现在解决问题的能力、自我反思能力以及应对复杂问题的拆解能力上。文章通过多个实例测试,如面包难题、房间灯泡问题、街边小摊营收问题等,展示了该模型的多角度思考、逻辑推理和解决问题的能力。文章还提到,该模型在编程能力上也有所突破,甚至能写俄罗斯方块游戏。最后,文章提供了使用方法和免费资源领取方式。

关键观点总结

关键观点1: GLM-Zero-Preview模型的推出

文章首先介绍了智谱清言全新推出的推理模型GLM-Zero-Preview,它是GLM-Zero的初代版本,拥有强大的AI推理能力。

关键观点2: GLM-Zero-Preview模型的特色

该模型拥有自我反思的能力,能够在解决问题的过程中自主决策,面对复杂问题会进行拆解并尝试用多种方法来解决问题。

关键观点3: GLM-Zero-Preview模型的实战测试

文章通过多个实例测试,展示了GLM-Zero-Preview模型的逻辑推理和解决问题的能力,包括解决面包难题、房间灯泡问题、街边小摊营收问题等。

关键观点4: GLM-Zero-Preview模型的编程能力

文章提到该模型的编程能力也很强,可以编写俄罗斯方块游戏,甚至有可能导致大批程序员失业。

关键观点5: 如何使用GLM-Zero-Preview模型

文章最后提供了如何使用GLM-Zero-Preview模型的方法,目前该模型完全免费,可以在智谱清言官网或平台上使用,还提供了免费领取2000万token体验资源包的活动链接。


正文

没想到2024年的最后一天,还有惊喜。

过去的一年里,阿枫给大家安利过不少AI产品,「智谱清言」更是咱们的老朋友了,几乎是隔三差五就来波全面升级,妥妥的“卷王”

万万没想到,在今年的最后一天,它还放上了个王炸,推出了全新的推理模型模型- GLM-Zero-Preview ,它是GLM-Zero的初代版本。


这个新模型的特色在于其强大的AI推理能力,堪称AI界的“福尔摩斯”,通过下图中的测试数据可以看得出来,它已经可以追平OpenAI的o1-preview模型了,实力不容小嘘

它和我们常见模型最大的区别在于,它拥有自我反思的能力,能够在解决问题的过程中自主决策,面对复杂问题会进行拆解并尝试用多种方法来解决问题,甚至能跟学霸一样举一反三...

不得不说,它真的越来越像人类了,很难想象随着后续的不断学习,它会给咱们带来怎样的震撼。

实战测试一下效果


既然它的长处在于推理能力,那么咱也不惯着,先给它丢了一道经典的“面包难题”上上强度。

通过下方完整回答,可以看到它会 不断的推理和多位思考问题 ,然后进行模型建立、求解,最后给到了一个较为严谨的答案。

↑上下滑动查看完整解题过程↓

为了对比效果,这里我又找了个类似的o1产品来进行横向对比,看看相同问题下它的表现又如何↓

↑上下滑动查看完整解题过程↓

很明显,两者的回答都还不错,但相比之下 Zero确实更胜一筹
这可不是我无脑吹,如果你认真的看完了两者的回答,你会发现 Zero更偏向于多角度深入思考问题,会以多个视角推算出答案 ,最后才会挑选一个最严谨的答案。

在解题方面,也有着详细地解题步骤,从问题描述到求解过程,最后再到得出结论,可以说是相当详细了。
它就像一个AI版福尔摩斯
前面咱说过,o1模型最擅长的就是推理,那么咱们就出一个推理题给它试试水,大家也可以先动动脑
说的是一个房间里有三个灯泡,三个灯泡的开关在房间外面,假如你只能进房间一次,如何确定哪个开关对应哪个灯泡?


毫无意外,Zero很轻松的就把这道题目给答出来了。

它的思路清晰,逻辑有序,虽然你可以通过其他的方法找出答案,但该说不说,它的回复确实更加通俗易懂,连我这样的学渣一眼也能看明白

还能解决开店的盈亏问题

再比如我楼下的街边小摊,每晚商贩们凌晨两三点收摊回去后还要计算一天的营收问题。那对于这类的生计问题是否能放心的交给Zero呢?

那咱们来一道脑力题,看看它会不会被绕进去:

经过它贴心的计算,不仅没有被问题绕进去,还给出了正确的答案,甚至还额外给了未出意外情况下的预期利润。

↑上下滑动查看完整回答↓

有的人可能会觉得这道题目太过于简单,不足以完全放心。那咱必须要满足你的顾虑,直接来道高等数学题瞧瞧结果又如何

解决数理问题

还是老样子,直接把题目甩给Zero,让它来帮我计算这道我也懒得算(其实我根本不会 )的高等数学题。

可以看到它经过 不断的计算、验算、代入结果,最终得出正确的答案

↑上下滑动查看完整解题过程↓

要知道数理题最讲究一个严谨性,不仅要求详细地解题步骤,你还得会举一反三、反向推理和验算,而Zero就严格的做到了这些要求, 使用多种方法进行反复的验算,最后得出精准答案。
就这样的解题思路和方法,搁外面找个私教辅导,不得一节课花个大几百。

那对于上面那道高等数学题的答案,我也要严谨一下,刚好仔细 核对了试题的参考答案 ,无疑是正确的

再来对比一下 DeepSeek,从回复的内容来看,两者之间的推理过程和结果大差不差。

↑上下滑动查看完整解题过程↓

但就我个人来讲,我还是更倾向于Zero。
因为它整个 推理和解题的过程通俗易懂,并且布局舒适且合理 ,每一个步骤的 表达都很清晰

要知道,数理题在表达解题过程时,非常注重清晰、准确地展示每一步的推理和计算,从而便于他人理解,智谱在细节上确实花了些功夫。

它还是一个任劳任怨的程序员
说出来你可能不信,未来可能真有大批程序员要下岗了,因为AI的编程能力也越来越强了,人类是年龄越大越容易失业,而AI则恰恰相反。






请到「今天看啥」查看全文