地球上最聪明的AI,它来了!
北京时间2月18日中午,马斯克旗下人工智能初创公司xAI正式发布新一代AI聊天机器人Grok 3。
马斯克在发布会现场表示,Grok 3在很短时间内超越了上一代Grok 2,“我们认为它比Grok 2强大一个数量级”。
xAI公司工程师也透露,
Grok
3的训练
消耗了20万块英伟达GPU,
其计算能力约是前代Grok 2的10倍。
此前Grok 3已经在xAI内部运行了2周,现在也终于走到大众面前了!
快思慢想研究院院长、原商汤智能产业研究院创始院长田丰,
在全程观看发布会后表示
,
Grok 3采用的还是“大力出奇迹”的模式
,
其使用
20万块英伟达GPU卡训练而成,
是典型的“又好又贵”
。
有多贵咱先不谈,但“有多好”这一点,马斯克很早前也给大家打预防针,他表示
Grok 3
将是“全球最聪明”的AI大模型,特别是推理
性能远超目前市场上所有已发布的聊天机器人!
那么废话不多说,咱们看重点。
首先我们要知道,Grok 3并非单一模型,而是一个模型家族。
目前它的两个变体版本 ——Grok 3 Reasoning和Grok 3 mini Reasoning,能够像OpenAI的o3-mini和 DeepSeek的R1等“推理”模型一样,仔细“思考”问题,在给出结果前进行彻底的事实核查,从而避免一些通常会困扰模型的错误。
官方公布的测试数据显示,Grok 3和Grok 3 mini在数学推理、科学逻辑、代码等多领域的基准测试中表现优异,均超过或媲美Gemini、DeepSeek和ChatGPT等一众对手。
特别是与GPT-4o和Gemini相比,Grok 3在处理复杂问题时展现了更强的逻辑推理能力。例如在解决数学难题时,
Grok 3
不仅能给出正确答案,还能详细解释解题步骤,帮助用户理解背后的逻辑。
紧接着,Grok 3还展示了独立编写代码的能力,工程师称这一能力是Grok 3的强大之处。
具体来看,xAI工程师要求Grok 3现场生成一段太空发射3D动画的代码,这需要AI模型理解复杂物理知识。在Grok 3生成代码后,马斯克团队运行了这段代码。画面上即显示出了飞船在地球和火星间往返的动画。
团队表示,这需要AI模型理解复杂物理知识。
马斯克在现场放话,今后Space X的发射任务,包括2026年火星探索任务,都将会借助Grok 3进行AI辅助。
除此之外,Gork
3现场还制作了一款类似于俄罗斯方块的游
戏。
工程师在对话框内输入了“想要制作一款类似于俄罗斯方块的游戏”指令,Grok 3随即自行开始编写代码。经过两分多钟自我思考后,Grok 3模型成功完成代码编写,并成功制作了俄罗斯方块游戏。
以上这些演示,均展现了Grok 3在推理能力和复杂任务处理上的强大能力。话说,
之前看到马斯克说“地球上最聪明的AI”这话时,还以为他又在打嘴炮,现在看来,是我有偏见了。。。。
其实除了推理上
的惊艳表现,Grok 3的另一大亮点还有DeepSearch。
如果说Grok 3的推理能力是“大脑”,那DeepSearch就是它的“感官系统”,它能够扫描互联网和X平台(原Twitter),为用户提供信息摘要。
无论是查找最新的科技动态,还是了解某个话题的背景知识,DeepSearch都能快速给出高质量的答案。
在发布会现场,xAI团队用一场“不可能完成的任务”展示了这项功能的颠覆性——预测2025年NCAA“疯狂三月”篮球赛的全部胜负结果。
要知道,NCAA的赛制充满了偶然性,之前曾有专家预测过但最终惨败,巴菲特也曾在2014年发起十亿美元赌局,悬赏预测全胜者,但无人成功(概率低于千亿分之一)。
那么在现场演示中,
Grok 3从
援引的材料,到分析图表、总结陈词,甚至期间通过设计一个子任务面板来完成这个工作,用户可以自己实时监测正在进行的任务,从而保证答案是可用的、可靠的。
最终Grok 3给出了它认为的2025年NCAA冠军,让我们期待一下三月。
对于研究人员、学生和专业人士来说,DeepSearch无疑是一个强大的工具,它不仅节省了时间,还提高了信息获取的准确性和全面性,例如研究人员可以利用DeepSearch获取最新的学术成果
。
其实目前DeepSeek、OpenAI ChatGPT 等均已布局AI搜索引擎,AI联网搜索正成为各大人工智能企业的热门业务领域。其中OpenAI最初于去年10月向付费用户提供了搜索引擎功能,并于同年12月向所有用户开放。如今,用户无需账户即可使用该功能。
马斯克在发布会上表示,Grok 3的测试版本现已向社交平台X上的付费用户开放。
xAI推出了两种订阅模式:
1:Premium+
Premium+订阅者将首先获得Grok 3的访问权限。这一模式适合普通用户,提供了基本的推理和DeepSearch功能。
2:SuperGrok
SuperGrok计划则针对专业用户,提供了额外的推理和DeepSearch查询功能。这一模式适合研究人员、程序员等需要高频使用AI工具的用户。
但马斯克也提示大家,
Grok 3的最佳体验“大约一周之后”。后面
Grok 3将很快增加语音交互功能。
这一功能的加入,将进一步降低用户的使用门槛,让AI助手变得更加自然和便捷。
马斯克同时宣布,即将在xAI推出一个人工智能游戏工作室。
关于大家讨论很多的开源问题,目前已知Grok 3是闭源状态。马斯克称,要等到下一代Grok大模型问世后才会将Grok 3开源。
作为马斯克旗下人工智能公司xAI发布的首个AI大模型产品,
Grok在
2023年11月5日首次发布,此后迭代了2个版本。
现在我们所看到的Grok 3,是Grok的第三代版本,被视作OpenAI最新的旗舰模型o3的竞品。
这款被寄予厚望的AI,不仅在计算能力上实现了质的飞跃,还在多个领域展现了强大的竞争力。xAI工程师表示,Grok 3的预训练在大约一个月前完成,但它的推理能力仍处于早期阶段,模型仍在训练中。
目前展示的是Grok 3推理模型的一部分,Grok 3推理模型有巨大的潜力。