大家好,我是二哥呀。
最近几天,大 A 依然在暴涨,据澎湃新闻显示:早盘35分钟成交额超万亿元,刷新历史最快万亿纪录。
真的够疯狂,这是赶在国庆节前给股民朋友们的大惊喜啊。
除了股市,国内的大模型公司也够 Crazy 的。这不,智谱面向所有用户,国庆月 10月1号至10月31号将为每位用户赠送 1亿额度 token,新老用户均可。我天呐😱,真的豪横。
快去薅它:https://sourl.cn/MnVDh5
关键是,不仅豪横,还很能打,智谱最新大模型 GLM-4-Plus 在新一轮的 SuperBench 评测当中展现出了强劲的实力,一举进入前三,打破了国外模型对前三甲的垄断地位,跻身国际第一梯队。可以说又一次刷新了记录。
能取得这样的成绩非常不易!因为不管是 OpenAI o1,还是 Claude 3.5 Sonnet,其在语言能力、长文本能力上的实力都有目共睹。面对强大的对手,不掉队,甚至在某些方面有所突破,真的值得我们为其竖起一个大拇指。
01、GLM-4-Plus真的很强
我在第一时间就将 GLM-4-Plus 集成到了技术派的派聪明 AI 助手当中,这就来带大家感受一下。先来问一道非常具有迷惑性,并且需要极强推理能力的题目:
国庆节放假安排为:10月1日至7日放假,共7天。9月29日(星期日)、10月12日(星期六)调休上班。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?
大家可以在脑海里先盘算一下答案到底是什么(不要算错哦😄)?
好,我们来看答案,GLM-4-Plus 明确告诉我答案是 3 天!
这一刻,我既惊呼国产技术的进步与准确,又哀叹为什么明明 7 天的假期却仅仅多休息了 3 天!
呜呜呜,真的我哭死,同样的问题我问了 OpenAI 的 o1-preview,注意是 OpenAI o1-preview 哦,你没看错,它竟然算错了!
慢思考了整整 17 秒,然后推理了一大推,我甚至图片都没法截全,因为真的太长了,然而最后的结果竟然是错的错的错的,它告诉我 5 天,我这何德何能啊❎
从这一刻起,我对 GLM-4-Plus 的情愫暗生,它真的在进步啊。按照官方的说法就是:
GLM-4-Plus 基座模型通过多种方式构造出了海量高质量数据,并利用 PPO 等多项技术,有效提升了模型推理、指令遵循等方面的表现,并能够更好地反映人类偏好。
好,我们再来问一个数学问题:“9.9 和 9.11 谁大?”
ok,这次答对了。
真别小看这个在我们人类看起来非常简单的数学问题,7 月份我测试这个问题的时候,所有的大模型都是错的,包括 GLM-4-AllTools,有图有真相。
注意看日期,技术派的派聪明 AI 助手会持久化每一次的对话内容到 MySQL 数据库。
除此之外,GLM-4-Plus 在代码算法任务上也有长足的进步,它可以帮我们一步步厘清解题思路,并给出清晰的计算逻辑,比如说这道题:扑克牌54张,平均分成2份,求这2份都有2张A的概率,请用代码来计算。
我只能说,这次升级后的 GLM-4-Plus 基座真的太强了,假期不打算出去人挤人的小伙伴们可以动手体验一下。
敲代码的乐趣,凌晨 5 点多起来的我是爽到了,相信热爱技术的小伙伴也会有类似的体感:纯粹、快乐,富有挑战性。
02、如何在代码中集成GLM-4-Plus
好,接下来给大家普及一下,如何快速将 GLM-4-Plus 模型集成到自己的项目当中,我就拿技术派这个开源项目来举例说明一下,五分钟搞定。
第一步,在 pom.xml 文件中添加 bigmodel 的依赖。
<dependency>
<groupId>cn.bigmodel.openapigroupId>
<artifactId>oapi-java-sdkartifactId>
<version>release-V4-2.1.0version>
dependency>
第二步,clone 技术派的源码。我已经通过 websocket 打通了前端和后端的通信。
https://github.com/itwanger/paicoding
前端发消息的代码在 paicoding-ui 的 chat-home/index.html 中。
后端接收消息并调用 GLM-4-Plus 给出流式 Steam 响应的代码在 paicoding-service 的 ZhipuIntegration 类中。
然后再将 GLM-4-Plus 返回的消息封装好返回给前端显示出来就行了。具体细节大家看一眼技术派的源码就明白了,代码注释写的非常详细。
另外给大家透露一点,这个假期我打算把 GLM-4v-Plus 基座模型也集成到技术派中,打算做一个“截图识别”的功能,比如说你敲代码的过程中遇到了一个 bug,就直接可以把控制台的错误截图上传,然后就能得到修改建议;比如说你上传一张图片,识别出图片上有什么关键信息。
还挺有意思的,画个饼大家期待一下(🤣)。
03、快来薅GLM-4-Plus
我记得智谱的第一代语言基座模型 ChatGLM 是 2023 年 3 月发布的,经过这一年多时间的深度探索,目前不管是大语言模型 GLM-4-Plus,还是文生图模型 CogView-3-Plus、图像/视频理解模型 GLM-4V-Plus、视频生成模型 CogVideoX 都取得了长足的进步,达到了国际第一梯队的水平。
就不说一年前了,就半年前吧,我觉得国产大模型还是被国外大模型吊打的,但经过这一年半载的沉淀,国产大模型真的有在崛起,无论是阿里的通义、腾讯的混元,还是智谱的 GLM,都展现出了惊人的实力,也逐渐让我对外企大厂祛魅了。
国内公司如果能踏踏实实做技术的话,迎头赶上并不是痴人说梦。反正智谱的 GLM-4-Plus 确实给了我这样的信心。
那除了上次给大家提到的 GLM-4-Flash(免费哦),这次智谱最新的 GLM-4-Plus,定价也很实在,一千 Token 仅需0.005元,相比前代旗舰 GLM-4-0520 便宜了 50%。
关键是,智谱赶在国庆节之前,在 bigmodel.cn
上悄咪咪上线的这波限时优惠活动真的力度巨大:所有用户直接赠送 1 亿 token 额度,新老用户都可以!
这还不算完,国庆期间日消耗越多的用户,次日 API 调用更优惠:
我估计啊,智谱这波国庆大酬宾活动又会打响新一轮的国内大模型价格战,又实惠又能打,反正作为开发者,我是超爱的。
尤其是那些需要注入大模型动力的公司,国庆月的这个限时活动,一定要戳👉【原文链接】羊毛薅起来了啊,服务器与其闲置,真不如趁这个月疯狂跑跑模型数据。😄