专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
APPSO  ·  最便宜的 AI iPhone ... ·  18 小时前  
APPSO  ·  OpenAI 放开成人内容?体验新版 ... ·  昨天  
小众软件  ·  DeepSeek ... ·  2 天前  
APPSO  ·  OpenAI ... ·  2 天前  
51好读  ›  专栏  ›  APPSO

马斯克发布地表最聪明 AI!号称超越 DeepSeek R1,20 万张卡砸出的「奇迹」

APPSO  · 公众号  · app  · 2025-02-18 14:16

正文

「聪明得可怕」,这是马斯克预告 Grok 3 时的说法,以至于今天一大早,全网都是下面这个样子👇🏻
在全网蹲点发布会时,App Store 先一步更新了。而在发布会进行过程中,Grok 网页版也一度火到崩溃。
可以,看着很有信心的样子。
Grok 3 不是一个简单的产品迭代,在此之前,是马斯克大手笔建设的数据中心、豪气的显卡配置,采用最佳的预训练模型并继续使用强化学习进行训练,堪称「富养」出来的新一代。
要点提炼如下:

美区账号已经可以更新,英区、欧洲 2.28 推出

推出 SuperGrok 高级订阅计划,月费为 30 美元,年费为 300 美元,提供额外的推理和 DeepSearch 查询功能,包含了无限量的图像生成服务
Grok 3 推理能力领先 DeepSeek R1
在 Chatbot 竞技场之称的 LMSYS 盲测中,Grok 3 在代码、指令响应等各个方面排名第一。
作为诞生于 20 万张显卡的产物,Grok 3 断层级别的表现证明了 Scaling Law 仍在生效。
相比于 DeepSeek 以低成本创造高收益,Grok 3 主打一个「大力出奇迹」。
这次,引入推理能力的 Grok 3 的重点在于更灵活地进行实时计算资源分配,在保证推理质量的同时,最聪明的使用计算资源。
曾经 Grok 2 就已经达到过当时的 SOTA 水平。在经过多次迭代之后,模型的泛化能力有大幅提升。Grok 3 在最新的 AIME 竞赛中 则再次刷新了自己的记录。
不过,仅仅只是推理能力强显然是不够的,快、狠、准才能参与大模型内卷。发布会现场,工程团队展示了两个案例。
一个是请求生成一个从地球发射到火星并返回地球的 3D 动画代码,Grok 思考了 19 秒,详细描述了其思考过程,包括使用 Python 进行绘图,以及使用 NumPy 进行计算。
另一个则是试图让 Grok 将《俄罗斯方块》和《宝石迷阵》这两款游戏结合起来,创造出一个新的游戏。
很遗憾,Grok 一上来就遭遇了连续两次的翻车,连马斯克回头看了屏幕上糟糕的演示环节,也不免尴尬地发出了一句「oh man」。
不过,后续演示中,也端上了正常的案例(该不会准备好的 demo 吧)。
而一些幸运的网友已经玩上 Grok 3 了。
图片来自 X 网友 @jesselaunz
DeepSearch 登场,要革搜索引擎的命
作为这次更新的重磅产品,Grok 3 加持的 DeepSearch 号称是下一代搜索引擎。模型将自主像 agent 一样运作,并且理解用户提问背后的意图,省下在 Google 花的时间。
现场展示的环节里,工程师给 Grok 3 出了一道有趣的题:预测 NCAA 「疯狂三月」的胜负数,也就是所有层级里的比赛结果。
这是巴菲特在 2014 年发起的一个活动,赌注高达十亿美元,赌得就是让巴菲特破产。历史上无人成功,甚至无人接近,因为即使专家预测,前几轮后也会出现大量错误。
2023 年 NCAA 对阵图
当年这就是一个营销活动,毕竟赢下的概率之小,几乎是千千亿分之一的概率,基本等于不可能。把这个问题甩给 Grok 3,不可谓不大胆。
返送的答案中,除了援引的材料,还做了结构化处理。开头介绍、背景知识、分析图表、总结陈词,相当完整。
检索的重点在于,如何交叉核实各个信息源。Grok 3 通过设计一个子任务面板来完成这个工作,用户可以自己实时监测正在进行的任务,从而保证答案是可用的、可靠的。
在这个基础上,agent 自主检索十分钟,抵掉自己摸索一小时,才是有效减少工作量。
最终 Grok 3 也给出了它认为的 2025 年 NCAA 冠军,三月还没来,让我们拭目以待它的「神预言」会不会成真。
至于 Grok 3 的体验方式,官方说了,X 的 Premium+ 订阅用户将率先体验,而其他高级功能则被纳入 xAI 推出的新计划——SuperGrok 中。
SuperGrok 的月费为 30 美元,年费为 300 美元,仅提供额外的推理和 DeepSearch 查询功能,还包含了无限量的图像生成服务。
贾维斯来了?还没完全来
就在昨晚,Shivon Zilis 路透了她和有 Grok 3 加持的人工智能助理 Ara 的对谈,并称这是生命中最意想不到的收获。
简直是徒增大家对语音模式的期待,马斯克在发布会召开前就已经宣布语音模式只会在一周内推出,这也意味着无缘演示环节。
不过,在现场直播环节,马斯克也表示这将是 Grok 最好的体验之一,在发布会的尾声,语音模型也放出了一个男声,听着倒是挺有人味的。

这一点点的路透,激起了极大的好奇,到了QA环节关于语音模式的提问涌上来。






请到「今天看啥」查看全文