北京时间2月18日,xAI召开发布会宣布推出Grok-3模型,马斯克进行现场演示。据了解,发布会开始前,xAI直播间的观看人数已超100万人。
“我们非常高兴能够推出Grok-3。我们认为,在很短时间内,它的功能比Grok-2强大一个数量级。这要归功于一支不可思议的团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上表示。
“好”但是“贵”
马斯克在发布会前曾直言:“Grok-3是地球上最聪明的AI。”事实上,发布会的内容显示,Grok-3模型确实很好,但是也非常昂贵。
具体来看,xAI团队在直播中表示,Grok-3和Grok-3 mini在各类测试上的测试得分都媲美甚至超过Gemini和ChatGPT等对手。
团队为了更进一步展示Grok-3的数学和推理能力,向模型输入了两个问题:
第一个问题是,“航天器从地球发射到火星,并在下一个发射窗口返回地球”绘制3D动画并生成其代码;
第二个问题是,制作一个结合俄罗斯方块和宝石迷阵玩法的混合游戏。
Grok-3对这两个问题上均给出了完整答案,展现出了其较强的互联网搜索能力、推理能力和创意能力。
那么,强大能力的代价是什么?
答案就是
数以万计的GPU
。
xAI团队表示,在训练Grok的过程中,团队搭建了大型算力集群,并克服了散热、电力等问题所带来的挑战,用了122天让首批10万张GPU投入使用并正常运行,而现在他们将集群规模继续扩大一倍。
“思维链”成最大亮点
Grok-3最大的亮点在于,其像DeepSeek一样引入了“思维链”推理机制。
业内人士表示,Grok
-
3引入的“思维链”技术,模拟人类逐步推理过程,处理复杂任务时逻辑连贯性显著提升。例如,在解决数学难题、编写代码时,Grok
-
3能拆解步骤并自我验证,最终输出更精准的答案。
马斯克在发布会上表示,这种推理机制使得Grok
-
3在逻辑推理测试中的表现远超ChatGPT-5和谷歌的Gemini Ultra,能够构思出新颖的想法和解决方案。
“Grok
-
3具有极强的推理能力,在我们迄今为止所做的测试中,其表现优于我们所知的任何已发布产品。”马斯克表示,我们有信心Grok
-
3会比其他任何AI都强,将成为AI领域真正的颠覆者。
据xAI工程师透露,大约一个月前,Grok
-
3的预训练就已完成。从那时起,团队一直在努力将推理能力整合到当前的Grok
-
3模型中。但目前仍处于早期阶段。
“今天展示的是Grok
-