那么,问题来了——吸了如此多金&商业化战绩颇丰的智谱,下一步要做什么?
智谱透露,本轮融资将用于智谱基座大模型的进一步研发:
从回答问题升级到解决复杂推理、多模态任务,更好地支撑行业生态发展。
就在刚刚结束的由量子位主办的行业峰会——MEET 2025智能未来大会上,智谱COO张帆刚好也透露了一些讯息。
他表示,OpenAI发布了对AGI目标能力的分级,智谱也有自己的理解。
智谱把AGI分为五个等级:
第一级是语言,智谱“已经做得非常不错了”。
第二级是对复杂问题的求解,可以看到o1这样的能力出现,对模型的应用类似从“大脑的系统1”转化为“系统2”,从简单直觉的回答,变成了深度性思考和拆解。
第三级开始使用工具,回答复杂问题时,不但能直接做深度思考,还能够跟外界持续交互获取信息。比如自主智能体不但能够通过API,还可以像人一样操作手机、PC甚至汽车的界面来获取信息。
第四级是实现自我学习。
第五级还没有非常明确的定义,但方向是超越人类,AI将具备探究科学规律、世界起源等终极问题的能力。
张帆表示,智谱在不断地探索和丰富模型的能力,从最开始的语言能力,到L2的复杂问题的能力,到工具能力以及现在正在试图解决的第四级别的GLM-zero和GLM-OS等能力。
这就来系统盘点一下智谱的探索路线。
Sora爆火开年,之后多模态模型竞相出现,再到如今深度推理模型成顶流,端侧大模型和Agent技术成新风向。
梳理来看,智谱每一步都没有落下。
先有对标Sora的视频生成模型CogVideoX、对标GPT-4o的端到端语音模型GLM-4-Voice和GLM-4-VideoCall。
后有近期逐渐清晰的Agent和端侧领域布局——
智能体产品AutoGLM/GLM-PC、适配高通骁龙旗舰芯片的端侧大模型先后发布。
而在这其中,和OpenAI等不同,智谱一以贯之的准则之一是持续开源。
翻看智谱早期的GLM报告,就会发现里面有“我们邀请大家加入它的开放社区,推动大规模预训练模型的发展”的字样,这家公司将“用开源的方式和开发者、行业用户交个朋友”的习惯延续到现在。
根据目前数据,ChatGLM等20余款模型已获15万GitHub星标,开源模型全球下载量3000万。
以下是智谱今年的技术发布时间轴:
随着年末将至,大模型创业新一年的风暴也即将出现。