马斯克吹了半年的模型终于发布：Grok 3 你需要知道的所有信息

歸藏的AI工具箱 · 公众号 · 互联网短视频科技自媒体 · 2025-02-18 13:29

主要观点总结

本文介绍了马斯克发布的Grok3模型，包括其计算资源的使用、模型能力、推理能力、深度搜索功能、使用方式和收费、未来规划等。

关键观点总结

关键观点1: Grok3模型的发布和背景

马斯克在直播活动中发布了Grok3模型，该模型是对之前计算中心的预热结果。马斯克声称其计算资源使用是前身的10倍，并在一期工程中仅用了122天完成。

关键观点2: Grok3模型的能力

Grok 3的训练量是Grok 2的10倍，并在基准测试中显著优于其他模型。它包含两个版本，即Grok3和Grok3-mini，目前早期版本在LLM竞技场排名第一。此外，Grok3具备推理能力，并在代码能力和思考过程中展现出优势。

关键观点3: Grok3的深度搜索功能和Agent能力

Grok3支持深度搜索功能，能够深入思考用户意图、考虑事实、浏览网站、交叉验证信息来源等。此外，其Agent能力也必须跟上，公开执行搜索的步骤。

关键观点4: Grok3的使用、收费和未来规划

目前，最先可以体验Grok3的渠道是推特的X Premium+会员。此外，还有单独的Grok网站和APP以及Super Grok会员。未来，网页和应用的所有功能将在一周内全面推出，API将在几周内推出。还有语音应用即将推出，Grok2将在几个月后开源。

正文

从 24 年底马斯克就开始给他们新建巨大计算中心训练的 Grok3 模型开始预热了，今天中午 12 点的直播活动中终于发布了 Grok3。

这次马斯克开始玩真的了，不仅模型的素质跟上了 Open AI 的 O1，而且在产品功能上全面对标 ChatGPT。

训练的硬件

Musk 声称 Grok 3 的开发使用了比其前身 Grok 2“10 倍”多的计算资源，xAI 一直在使用位于孟菲斯的一个庞大数据中心—— 一个包含约 20 万个 GPU 的数据中心 ——来训练 Grok 3。其中的一期工程只用了 122 天就完成了，工程这块还得看马斯克。

模型能力

Grok 3 的训练量是 Grok 2 的 10 倍，在 1 月初完成了预训练，即使现在依然在训练过程中。

Grok3 包含两个模型版本 Grok3 和 Grok3-mini，Grok 3 AIME 和 GPQA 在内的基准测试中显著优于其他模型，如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表现不错。 目前的早期版本在 Elo 机制的 LLM 竞技场 1400 分排第一。