专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
极客公园  ·  你们不买 iPhone 16e,有的是人买! ·  16 小时前  
新浪科技  ·  【#乔布斯时代iPhone设计全部谢幕#】北 ... ·  17 小时前  
凤凰网科技  ·  马斯克旗下xAI发布Grok 3推理模型 ... ·  2 天前  
新浪科技  ·  【#iPhoneSE4改名##苹果iPhon ... ·  3 天前  
51好读  ›  专栏  ›  DeepTech深科技

Grok 3来了!马斯克宣称“地球上最聪明的AI”,20万张GPU能否颠覆AI格局?

DeepTech深科技  · 公众号  · 科技媒体  · 2025-02-18 13:19

主要观点总结

埃隆•马斯克(Elon Musk)的AI公司xAI正式推出最新的Grok 3模型,并声称其为“地球上最聪明的AI”。该模型在数学、科学和编程基准测试上表现出色,超越了包括GPT-4在内的主流模型。此外,Grok 3还具备推理能力,并展示了其编程能力。xAI还推出了基于Grok 3的搜索引擎新产品DeepSearch。Grok 3的推出背后是强大的计算能力和训练方式,包括使用Colossus超级计算机进行训练,以及采取新的策略来优化模型能力。然而,该模型在编写代码时仍存在细节上的疏漏。尽管面临激烈的竞争,但Grok 3的发布标志着xAI在AI竞赛中的重大进展。

关键观点总结

关键观点1: Grok 3模型的推出

Grok 3是xAI公司推出的最新AI模型,被宣称是“地球上最聪明的AI”。它在数学、科学和编程基准测试上表现出色,超越了多个主流模型。

关键观点2: Grok 3的功能和特点

Grok 3具备推理能力,展示了其编程能力。xAI还推出了基于Grok 3的搜索引擎新产品DeepSearch,能够搜索网页、查找现有资料,并基于Grok 3的推理能力推测用户的意图和返回正确的信息。

关键观点3: Grok 3的背后技术

Grok 3的推出得益于强大的计算能力和训练方式,包括使用Colossus超级计算机进行训练,以及采取新的策略如合成数据集、自我纠错机制和强化学习来优化模型能力。

关键观点4: Grok 3面临的挑战和竞争

尽管Grok 3表现出色,但它仍然面临着激烈的竞争。其他AI公司如OpenAI、Anthropic等也在不断推出更先进的AI模型。未来的AI之战仍将持续升温,Grok 3能否真正超越竞争对手,成为AI领域的佼佼者,还有待市场的进一步检验。


正文

Grok 3,马斯克口中的“最聪明AI”终于来了!

当地时间2月17号,埃隆•马斯克(Elon Musk)的AI公司xAI正式推出最新的Grok 3模型,并称其是目前“地球上最聪明的AI”。

图 | Grok 3发布会(来源:xAI)

“我们非常高兴能够推出 Grok3,我们认为,在很短的时间内,它的功能比 Grok2 强大一个数量级。这要归功于一支不可思议的团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上说道。

有意思的是,他还解释了Grok这一名字的来历:Grok这个词来自罗伯特·海因莱因的小说《异乡异客》(Stranger in a Strange Land)。这是一个火星词,意思是充分而深刻地理解某事。

随后,xAI在发布会上简单粗暴地摆起了数字。

图 | Chatbot Arena成绩(来源:xAI)

Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

图 | Grok 3的数学、科学和编程基准测试成绩(来源:xAI)

同时,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则是超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。

图 | Grok 3推理模型的数学、科学和编程基准测试成绩(来源:xAI)

xAI还现场演示了Grok 3的推理+编程能力,其中一个问题是“生成3D动画代码,演示从地球发射、着陆火星,然后在下一个发射窗口返回地球的过程”。

经过近两分钟的思考,Grok 3生成了可以直接跑起来的python代码,3D动画可以运行,但是否正确还有待验证。

图 | Grok 3生成的代码可以直接运行(来源:xAI)
Grok 3的最后一个新功能是代理/智能体(Agent)。发布会演示的是新产品DeepSearch,基于Grok 3的搜索引擎。
它不仅可以搜索网页,查找现有资料,还可以“推测用户的真正意图”并加以思考,在经过交叉对比不同信源后,确保“能够返回正确的信息”。
在演示中,它还能基于搜索资料给出一些推测性的结论。
图 | DeepSearch功能演示(来源:xAI)
最后xAI表示,“我们今天将推出 Grok 3,首先从 X 上的 Premium+订阅者开始,他们将是第一批获得访问权限的人。”尚不清楚普通用户何时能用上。
马斯克补充称:“如果你想要一个更完善的版本,可能要等待一周,但每天都会有所改进。我们还在开发语音交互功能,我认为这将是 Grok 3 最好的体验之一。”
图 | 额外的DeepSearch功能演示(来源:xAI)
更强大的计算能力与训练方式
Grok 3的推出正值全球AI竞争日益激烈之际,尤其是在中国初创公司DeepSeek发布了一款能以低成本媲美OpenAI的GPT和o1/o3系列模型后,许多AI公司都开始重新评估用堆算力和参数来推进所谓的“扩展法则”是否仍然适用。
值得一提的是,马斯克曾称“Grok 3将在2024年底之前上线”,但却推迟到了今天。
至于原因,有人认为是xAI的技术团队规模较小,人才储备相对不足,难以完成马斯克“雄心勃勃的计划”。尽管如此,距离Grok 2系列模型发布才过去了六个月而已。
Grok 3由Colossus超级计算机训练完成,这台计算机是在短短八个月内建成的,搭载了10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源——是Grok 2的10倍。
图 | Colossus设施(来源:xAI)
据介绍,xAI最开始搭建这个10万GPU集群用了122天,后续拓展到20万集群仅用了92天。
马斯克表示,这一显著的算力提升让Grok 3能够更高效地处理庞大数据集,缩短训练时间,并提升AI模型的准确性。
据介绍,在训练方法上,xAI采取了一些新的策略来优化Grok 3的能力,包括合成数据集、自我纠错机制和强化学习。
Grok 3相比前代在法律领域的理解能力也有所提升。马斯克曾表示,该模型的训练数据中包含了大量法律文件,使其在解读法律相关问题时更加精准。
尽管Grok 3被马斯克誉为“地球上最聪明的AI”,但它在早期测试中仍然暴露出一些局限性。
在正式发布之前,几名X平台用户表示自己可以提前体验Grok 3,他们发现,尽管该模型能够正确回答一些困难的谜题,并生成HTML和JavaScript代码,但是它在编写代码时仍然存在一些细节上的疏漏,出现了bug。
马斯克的AI野心与行业竞争
Grok 3的发布不仅仅是一款AI产品的更新,它也是马斯克与OpenAI等竞争对手较量的一部分。
2月13号,在迪拜召开的2025年世界政府峰会上,马斯克曾视频通话中表示:“Grok 3 具有非常强大的推理能力,因此在迄今为止我们进行的测试中,它的表现已经超越目前市场上的所有产品,这是一个好兆头。”
图 | xAI对比自己的发展速度(来源:xAI)
此外,马斯克继续对OpenAI表达不满。他批评OpenAI已经从最初的开源非营利组织变成了“封闭的、以利润为导向的公司”。
此前,马斯克试图以974亿美元的价格收购OpenAI,但遭到了该公司CEO山姆•奥特曼(Sam Altman)的拒绝。奥特曼认为,马斯克的提议不过是拖慢OpenAI发展的策略。






请到「今天看啥」查看全文