就在前两天
,马斯克带着团队搞了场大事情,全球直播发布了号称"史上最聪明AI"的Grok3。
这位科技狂人带着自家xAI团队的最新作品Grok3闪亮登场,
这场发布会可没让人失望,毕竟老马提前那么久就开始吊大家胃口,现在终于见到真身了!
“最聪明”的AI
先给没追直播的朋友划个重点:这次亮相的Grok3号称是"地球最聪明AI",不仅在数学编程这些硬核领域碾压同行,还要帮SpaceX算火星轨道!
Grok3是马斯克用20万块H100 GPU堆出的算力怪兽,咱们先来看看它的硬核
成绩。
根据xAI团队现场甩出的成绩单,Grok3在数学、编程和科学领域的测试数据简直亮瞎眼:
数学竞赛AIME'24:连拿90和93分(满分100)。
科学测试GPQA:75分碾压全场。
编程实战:解题速度比GPT快1.8倍。
X上网友的调侃图
不过
跑分归跑分
,作为一个经历过无数"PPT革命"的设计从业者,我还是更期待看到实际落地的案例,毕竟再酷炫的技术,最后都要通过用户体验这关。
但问题来了,这么个学霸型AI,怎么栽在了小学数学题上?
发布会后不少科技博主实测发现,当被问到"9.11和9.9哪个大"时,Grok3居然支支吾吾算错了。
这事儿在推特上直接炸锅,有网友调侃说:"原来天才的软肋是小数点!"
正好看到今天马斯克宣布Grok3全量免费开放了:
我就想着抛开天花乱坠的宣传话术,来一场AI界的新老对决,看看
Grok3和DeepSeek来PK一下会怎么样:
DeepSeek的攻击性明显要强一点。
本来我还想测试更多的,但是发现Grok3的深度思考免费额度
竟然只有2条
...
而DeepSeek的现状大家都懂的:
这是Grok3的地址,大家可以自己去玩玩看:
grok.com
技术参数再漂亮,最终还是要落到实际应用场景里。
马斯克团队明显在走"极致专业化"路线,把AI往科研助手的角色培养;而DeepSeek则更像"全能型选手",试图在通用性和专业性之间找平衡点。
这两种思路没有绝对优劣,就像建筑设计中的结构派与功能派,最终还是要看市场买不买单。
不过话说回来,Grok3预告的太空应用确实让人浮想联翩,如果真能帮SpaceX搞定火星任务的计算难题,那绝对是AI发展史上的里程碑事件。
现在我最关心的是,Grok3会不会重蹈当年自动驾驶的覆辙?记得马斯克
五年前
画的那张"完全自动驾驶"大饼吗?到现在咱们还在用L2级辅助驾驶。
所以这次看到他说"三年内实现诺奖级突破",我下意识看了眼日历,希望这次的时间表能准点。
干货时间
Grok3确实在硬核技术指标上领先半个身位,但DeepSeek毕竟成本低的多,
这场较量远没到终局。
今天的干货时间,就再给大家推荐一下
@C.K菜壳儿
的DeepSeek本地部署教程: