专栏名称: 数字生命卡兹克

反复横跳于不同的AI领域，努力分享一些很酷的AI干货

智谱AI深夜上线全新Agent GLM-PC，再见仍是巅峰。

数字生命卡兹克 · 公众号 · · 2025-01-23 12:25

正文

年前AI圈混战，热闹程度不亚于23年3月，一个个都卷麻了。

OpenAI半泄漏半预热搞了半天的Agent产品Operator还没来。

智谱的新版Agent GLM-PC悄无声息的憋了个大的，直接先来了。

昨天夜里，智谱突然让我帮忙试一下他们的Agent。

真的是夜里。。。

AI圈好热闹，但是作为一个自媒体，我的肝好想说：

求求了，大过年的，放过我吧。。。

没办法，为了首发，咋办呢，只能熬夜一个通宵，肝他娘的。

还好，在体验了一夜后，GLM-PC 1.1版本，没有让我失望。

虽然小问题还是有一些，但，前路已明。

可以说，如今AI领域，最让我兴奋、最让我觉得科幻的，也只有Agent了。

也给大家简单过一下他们Agent的历史。

2024年10月25日，智谱在 CNCC发布了第一款手机自主人工智能，AutoGLM，直接在行业内和金融市场上掀起了风暴。

2024年11月29日，智谱在Agent OpenDay上，宣布升级版的AutoGLM，还有电脑版本的自主人工智能，GLM-PC 1.0内测版。

但是那时候，GLM-PC还是非常不成熟的，我也在当时的发布会现场写到：

终于，两个月以后，GLM-PC 1.1正式版，来了。

复杂任务拆解能力大幅强化，任务成功率比1.0高太多太多了，操作速度直逼人类，每步操作几乎都在1.5s以内，虽然别看只是0.1版本的升级，但我觉得他们内部对比版本号命名还是保守了，其实完全可以叫2.0的，再不济1.5也是可以的。。。

而且，Mac和Windows，全都都可用了。

跨越时空，智谱AI也完成了7年前，老罗在鸟巢那个“理解万岁”的梦。

也不知道，老罗看着如今的GLM-PC 1.1版本，会不会也摇着扇子，感慨到：我当年那个TNT也是很酷的啊，就是这么想的啊...如果我们晚做7年...可惜啊，没有如果。

网址在此： https://cogagent.aminer.cn/home

下载注册以后，就会来到首页。

虽然我也不知道智谱他们为啥要给GLM-PC取名叫牛牛，可能，是因为GLM-PC作为新时代的Agent代表，可以堪称赛博牛马？...

这次最大的功能更新，是他们加入的深度思考。

类似于OpenAI o1那种做法，你给GLM-PC发一个任务，他会给你先生成一套非常详细的思维链，自己给自己想明白以后，再去执行。

比如说给微信上的“熬夜测试”群的所有群成员发送2025年新春祝福语。

他会一步一步思考、拆解、返回结果，即使失败了也会自己PUA自己来进行重新反思。

而且最特别的是，跟手机端的AutoGLM不一样，这次更新明显不只是纯视觉方案了，还引入了代码机制。

生成的内容，是函数，在上图中，能看到两个GLM-PC定义的函数LAUNCH_APP和CogAgent。

这个点非常有意思，代码是极度严谨、规范、正确率高的方式，他们抛弃了传统的思维链，而是使用代码式的思维链，在我几个小时的体验里，明显能感觉到，在这套逻辑的加持下，GLM-PC对复杂任务的规划、推理、和反思的能力，得到了明显的强化。

之前GLM-PC 1.0版本的模型，是智谱在2023年就开始做的多模态 GUI Agent - CogAgent，去年12月20他们也直接开源出去了，能感知和理解交互界面中的视觉元素与布局，模拟人类做出任意元操作，就比如点击、键盘输入、悬浮、拖拽那些。

而这次加入代码后，通过代码思维框架和图形界面的结合，有点像神经心理学理论中的左右脑，为右脑补齐了理性的左脑，成了一个真正完整的智能。

看看上面这个case的实际运行效果。视频为了大家观感，我都做了2倍速处理。

整体上，一气呵成，直接给我测试群里四个人，全部发了一个新春祝贺，甚至还是定制化的，每个人都写了名字，内容还不一样。

我还能说什么好呢？

真的，玩AI这么久，体验了几百款AI产品，我已经很久没有被AI所震撼了。

但是当这种任务，在电脑上，AI理解我的意图后，自动化完美的处理完成的时候，我才真真切切的感受到。

科幻变成现实的感觉。

全世界，智谱，是第一个做到的。

这一刻，怎么吹国产AI，我觉得都不为过。

2025，必是真正的Agent之年。

我也希望，是属于智谱Agent，璀璨的一年。

除了单纯的发微信文字消息，你还可以让AI，给你制作图片和视频，自动发送过去。

比如，我想让GLM-PC，给微信上的“鲜虾包”发送2025年新春祝福语，再给他制作一个新春图片和一个新春祝贺视频，发送给他。

不止发文字，GLM-PC还直接调用智谱自己的接口，创作了图和视频，发给了鲜虾包。

太太太太牛逼了。

这个图片和视频的美感虽然确实有点不太好看，但是不妨碍作为Agent的这个能力，直接酷到爆炸好吧。

又比如我还可以让它：

直接一气呵成。

虽然最后出现了BUG，一直卡死在时间循环那了，因为调用错了时间，且飞书日历只有半点和整点，时间匹配不上，所以没能成功。

但是在我看来，依然瑕不掩瑜。

整体测试上，在多步任务上表现还算是比较稳定的。

比如马上春节了，我们可以让它：打开小红书，在小红书搜索春节习俗，获取前三篇的图片和文字介绍，扩写成一篇文章，保存到桌面Word文件。

智谱AI深夜上线全新Agent GLM-PC，再见仍是巅峰。

正文

请到「今天看啥」查看全文