马斯克的Grok-3，担得起「地表最强AI」之名？ | 智客星球

新浪科技 · 公众号 · · 2025-02-19 08:29

正文

请到「今天看啥」查看全文

出品 / 新浪科技（ID: techsina）

作者 / 周文猛

北京时间2月18日中午，马斯克与xAI团队的另外三位技术负责人，一同发布了公司最新推出的Grok-3基座大模型。

短短30分钟的发布过程中，马斯克及其团队介绍了Grok-3的数学和科学推理性能，这些性能相较于DeepSeek-V3、OpenAI-4o等更为突出。其还演示了大模型代码创作能力，同时也公布了后续的开源计划。

在此之前，马斯克曾称将发布的Grok-3是“地球上最聪明的人工智能”，从发布公示的模型性能来看，Grok-3确实在一定程度上取得了比DeepSeek、OpenAI更强的性能，但这些成果，是通过“20万块英伟达GPU”算力堆叠而出的。

在全球人工智能行业发展开源之风渐浓，同时也越来越注重性价比的当下，马斯克的Grok-3真的担得起“地表最强AI”之名？同时将为市场带来怎样的变化？

Grok-3数学、科学推理

超DeepSeek、OpenAI

据马斯克发布Grok-3时介绍，在数学推理、科学逻辑推理和代码写作等能力表现方面，xAI此次发布的Grok-3和Grok-3 mini两款模型，在 Math（AIME 24）、Science（GPQA）和 Coding（LCB Oct-Feb）三项Benchmarks测试中，均取得了比Gemini-2 pro、DeepSeek-v3、GPT-4o更优的性能表现。

在大模型竞技场 Chatbot Arena（LMSYS）中，Grok-3版本的得分达到1402分，超过了包括ChatGPT-4o、DeepSeek-R1等在内的所有其他模型。

据马斯克介绍，Grok-3比上一代的Grok-2能力提升了一个数量级。在后续AI用例演示过程中，马斯克及其团队成员让Grok-3 寻找去火星的时间窗口，演示了其信息收集和推理能力，同时还创作一款融合《宝石迷阵》和《俄罗斯方块》的游戏，展示了Grok-3的创意能力。

据悉，目前Grok-3已经在xAI内部运行了2周。首批用户通过X平台已可以预订体验Grok-3，目前xAI也在积极与AppStore对接，但因为上线这一平台需要满足相关合规要求，因此最新的Grok-3模型还只能是在网页上。

“我自己早上刚试了一遍Grok-3，我觉得它已经展示了非常强大的数学推理性能，一周后我们会上线所有全新的性能。”马斯克还进一步透露称，“我们通常会在新模型发布的时候，开源上一代模型，几个月后，我们也会对该系列模型进行开源”。

分析称成本为DeepSeek-V3 263倍

强大的模型性能背后，Grok-3的训练成本也成了备受关注的一个焦点。

据马斯克在直播中披露，Grok 3在训练过程累计消耗了20万块英伟达GPU，训练在xAI公司的数据中心完成。有马斯克团队人员介绍称，“我们花了122天才完成了第一个10万卡训练，但我们并没有就此止步，如果我们想要构建巨型人工智能，需要立即将集群的大小增加一倍。”

相较于DeepSeek以远低于同行“1/20的成本”训练出比肩OpenAI-01模型能力的R1模型，Grok-3的这一算力消耗，属实不小。就在马斯克公布Grok-3训练成本后，很快便有人员分析指出，“Grok-3的算力消耗是DeepSeek-v3的263倍，中国的模型团队只得望洋兴叹。”

此前，在xAI发布Grok-2模型后，便有国内AI企业创始人对新浪科技表示，“Grok-2模型参数量太大了，使用成本太高，这远远不是国内绝大多数企业用得起的，这也导致了他们的产品雷声大雨点小。”

这一次，Grok-3又一次通过堆算力的方式，带来了令人眼前一亮的模型效果。但过于庞大的训练成本，注定也会劝退绝大多数用户，尤其渴望私有化部署相关模型的企业用户。

当前，伴随DeepSeek开源相关模型带来的模型使用成本下降和性能提升，在全球范围内已经刮起了一阵大模型产品开源免费的“热潮”。

就在Grok-3发布数小时前，OpenAI 首席执行官萨姆・奥尔特曼便在X社交平台上发文，就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向：一种是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”，另一种则是“尽可能优化的手机大小模型”。

这或许意味着 OpenAI 即将开源新的大模型，这也将是2019年OpenAI开源GPT-2后再次开源大模型。而在月初的时候，奥尔特曼还曾反思称，OpenAI闭源“站在了历史错误的一边”。

国内方面，此前笃定闭源模型更先进的百度公司，也于近日宣布了旗下文心一言会员产品免费。

当全球范围内越来越多的企业都开始选择使用更低成本的AI大模型时，昔日的AI大模型机构们，也不得不放低姿态，开始拥抱市场。对于Grok-3而言，高昂的训练成本及不开源的策略，或许将成为阻碍其普及的一大关键。

在Grok-3发布后，此前传言主要产品已为xAI数据中心供货的三变科技，股价原本涨停时突然下跌，不复此前两日连续涨停的热闹景象。在一部分股友看来，回落最主要的原因，正是因为“马斯克发布会不及预期”。

结语：马斯克硬钢OpenAI，

谁能笑到最后？

就在Grok-3发布数天前，曾有消息曝出马斯克正牵头财团提出以974亿美元（约7118亿元人民币）收购OpenAI的控股权，不过该提议很快遭到了OpenAI首席执行官萨姆·阿尔特曼（Sam Altman）的拒绝。阿尔特曼在X上回应称：“不用了，谢谢，但如果你愿意，我们可以以97.4亿美元收购推特。”

随后，马斯克回击称其为“骗子”，双方矛盾再次公开化。据悉，马斯克律师团队曾于2月10日向OpenAI董事会提交收购要约，计划通过旗下AI公司xAI支持该交易，并可能在完成后与OpenAI合并。马斯克在声明中强调，此举旨在让OpenAI回归其“开源、安全优先”的初心。

马斯克作为2015年与阿尔特曼共同创立OpenAI的联合创始人，同时也是OpenAI最早的投资人。但2018年马斯克因争夺公司控制权未果而退出，此后，2019年OpenAI成立营利性子公司，并接受微软10亿美元投资，逐步转向商业化。伴随2022年ChatGPT横空出世并将OpenAI推上生成式AI巅峰，其估值飙升至千亿美元级。

在外界看来，马斯克于2023年成立xAI并推出大模型Grok，直接硬钢OpenAI，多少掺杂着一些个人情绪。在业内人士看来，相较于OpenAI目前主要依靠融资存活，马斯克旗下的Grok-3有着特斯拉、x社交平台等更为庞大的现金流和数据资源支撑，未来在空间智能等领域或许会有着更大的发展潜力。

但眼下看来，如果Grok-3模型的训练成本，让更多的企业和消费者用户用上这款产品，才是下一步发展的关键。

精彩视频

点击观看

更多精彩

点击关注

END

我知道你在看哟