专栏名称: 沉默王二
技术文通俗易懂,吹水文风趣幽默。学 Java,认准二哥的网站 javabetter.cn
目录
相关文章推荐
macrozheng  ·  Java就业市场是真癫了。。 ·  昨天  
macrozheng  ·  Java就业市场是真癫了。。 ·  昨天  
中国半导体论坛  ·  谷歌被罚款20000000000000000 ... ·  4 天前  
中国半导体论坛  ·  谷歌被罚款20000000000000000 ... ·  4 天前  
中国交通信息化  ·  多地绿色低碳收费站建设实践与探索 ·  4 天前  
中国交通信息化  ·  多地绿色低碳收费站建设实践与探索 ·  4 天前  
睡前人间  ·  【产经破壁机037】最“省心”的科技奖 ... ·  5 天前  
睡前人间  ·  【产经破壁机037】最“省心”的科技奖 ... ·  5 天前  
光伏资讯  ·  五大龙头齐涨价! 组件价格底部出现了? ·  1 周前  
51好读  ›  专栏  ›  沉默王二

A股的国庆“大礼包”,开发者也有?

沉默王二  · 公众号  · 互联网安全 科技自媒体  · 2024-09-30 16:01

正文

大家好,我是二哥呀。

最近几天,大 A 依然在暴涨,据澎湃新闻显示:早盘35分钟成交额超万亿元,刷新历史最快万亿纪录。

真的够疯狂,这是赶在国庆节前给股民朋友们的大惊喜啊。

除了股市,国内的大模型公司也够 Crazy 的。这不,智谱面向所有用户,国庆月 10月1号至10月31号将为每位用户赠送 1亿额度 token,新老用户均可。我天呐😱,真的豪横。

快去薅它:https://sourl.cn/MnVDh5

关键是,不仅豪横,还很能打,智谱最新大模型 GLM-4-Plus 在新一轮的 SuperBench 评测当中展现出了强劲的实力,一举进入前三,打破了国外模型对前三甲的垄断地位,跻身国际第一梯队。可以说又一次刷新了记录。

截图来自 THU 基础模型

能取得这样的成绩非常不易!因为不管是 OpenAI o1,还是 Claude 3.5 Sonnet,其在语言能力、长文本能力上的实力都有目共睹。面对强大的对手,不掉队,甚至在某些方面有所突破,真的值得我们为其竖起一个大拇指。

截图来自 GLM 大模型

01、GLM-4-Plus真的很强

我在第一时间就将 GLM-4-Plus 集成到了技术派的派聪明 AI 助手当中,这就来带大家感受一下。先来问一道非常具有迷惑性,并且需要极强推理能力的题目:

国庆节放假安排为:10月1日至7日放假,共7天。9月29日(星期日)、10月12日(星期六)调休上班。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?

大家可以在脑海里先盘算一下答案到底是什么(不要算错哦😄)?

好,我们来看答案,GLM-4-Plus 明确告诉我答案是 3 天!

这一刻,我既惊呼国产技术的进步与准确,又哀叹为什么明明 7 天的假期却仅仅多休息了 3 天

呜呜呜,真的我哭死,同样的问题我问了 OpenAI 的 o1-preview,注意是 OpenAI o1-preview 哦,你没看错,它竟然算错了!

慢思考了整整 17 秒,然后推理了一大推,我甚至图片都没法截全,因为真的太长了,然而最后的结果竟然是错的错的错的,它告诉我 5 天,我这何德何能啊❎

从这一刻起,我对 GLM-4-Plus 的情愫暗生,它真的在进步啊。按照官方的说法就是:

GLM-4-Plus 基座模型通过多种方式构造出了海量高质量数据,并利用 PPO 等多项技术,有效提升了模型推理、指令遵循等方面的表现,并能够更好地反映人类偏好。

好,我们再来问一个数学问题:“9.9 和 9.11 谁大?”

ok,这次答对了。

真别小看这个在我们人类看起来非常简单的数学问题,7 月份我测试这个问题的时候,所有的大模型都是错的,包括 GLM-4-AllTools,有图有真相。

注意看日期,技术派的派聪明 AI 助手会持久化每一次的对话内容到 MySQL 数据库。

除此之外,GLM-4-Plus 在代码算法任务上也有长足的进步,它可以帮我们一步步厘清解题思路,并给出清晰的计算逻辑,比如说这道题:扑克牌54张,平均分成2份,求这2份都有2张A的概率,请用代码来计算

我只能说,这次升级后的 GLM-4-Plus 基座真的太强了,假期不打算出去人挤人的小伙伴们可以动手体验一下。

敲代码的乐趣,凌晨 5 点多起来的我是爽到了,相信热爱技术的小伙伴也会有类似的体感:纯粹、快乐,富有挑战性。

02、如何在代码中集成GLM-4-Plus

好,接下来给大家普及一下,如何快速将 GLM-4-Plus 模型集成到自己的项目当中,我就拿技术派这个开源项目来举例说明一下,五分钟搞定。

第一步,在 pom.xml 文件中添加 bigmodel 的依赖。

<dependency>
    <groupId>cn.bigmodel.openapigroupId>
    <artifactId>oapi-java-sdkartifactId>
    <version>release-V4-2.1.0version>
dependency>

第二步,clone 技术派的源码。我已经通过 websocket 打通了前端和后端的通信。

https://github.com/itwanger/paicoding

前端发消息的代码在 paicoding-ui 的 chat-home/index.html 中。

后端接收消息并调用 GLM-4-Plus 给出流式 Steam 响应的代码在 paicoding-service 的 ZhipuIntegration 类中。

然后再将 GLM-4-Plus 返回的消息封装好返回给前端显示出来就行了。具体细节大家看一眼技术派的源码就明白了,代码注释写的非常详细。

另外给大家透露一点,这个假期我打算把 GLM-4v-Plus 基座模型也集成到技术派中,打算做一个“截图识别”的功能,比如说你敲代码的过程中遇到了一个 bug,就直接可以把控制台的错误截图上传,然后就能得到修改建议;比如说你上传一张图片,识别出图片上有什么关键信息。

还挺有意思的,画个饼大家期待一下(🤣)。

03、快来薅GLM-4-Plus

我记得智谱的第一代语言基座模型 ChatGLM 是 2023 年 3 月发布的,经过这一年多时间的深度探索,目前不管是大语言模型 GLM-4-Plus,还是文生图模型 CogView-3-Plus、图像/视频理解模型 GLM-4V-Plus、视频生成模型 CogVideoX 都取得了长足的进步,达到了国际第一梯队的水平。

就不说一年前了,就半年前吧,我觉得国产大模型还是被国外大模型吊打的,但经过这一年半载的沉淀,国产大模型真的有在崛起,无论是阿里的通义、腾讯的混元,还是智谱的 GLM,都展现出了惊人的实力,也逐渐让我对外企大厂祛魅了。

国内公司如果能踏踏实实做技术的话,迎头赶上并不是痴人说梦。反正智谱的 GLM-4-Plus 确实给了我这样的信心。

那除了上次给大家提到的 GLM-4-Flash(免费哦),这次智谱最新的 GLM-4-Plus,定价也很实在,一千 Token 仅需0.005元,相比前代旗舰 GLM-4-0520 便宜了 50%。

关键是,智谱赶在国庆节之前,在 bigmodel.cn 上悄咪咪上线的这波限时优惠活动真的力度巨大:所有用户直接赠送 1 亿 token 额度,新老用户都可以!

这还不算完,国庆期间日消耗越多的用户,次日 API 调用更优惠:

  • 超 1 亿 token,次日 5 折
  • 超 10 亿 token,次日 3 折
  • 超 100 亿 token,次日 1 折

我估计啊,智谱这波国庆大酬宾活动又会打响新一轮的国内大模型价格战,又实惠又能打,反正作为开发者,我是超爱的。

尤其是那些需要注入大模型动力的公司,国庆月的这个限时活动,一定要戳👉【原文链接】羊毛薅起来了啊,服务器与其闲置,真不如趁这个月疯狂跑跑模型数据。😄