专栏名称: 哎咆科技
原「果粉查询」公众号蜕变为专注科技生活媒体,提供最前沿科技动态及爆料,产品试用测评&众筹,苹果序列号查询,山寨机&翻新机验证等服务。
目录
相关文章推荐
哎咆科技  ·  AI挑战《超级马力欧兄弟》:GPT-4o 太菜了! ·  15 小时前  
EETOP  ·  AI EDA工具系列|注册即可观看! ·  2 天前  
哎咆科技  ·  iPhone 16e 上手评测:到底谁在买啊? ·  2 天前  
EETOP  ·  多物理场仿真在半导体制程中的应用 ·  3 天前  
EETOP  ·  突发!IBM中国停运,1800人失业! ·  3 天前  
51好读  ›  专栏  ›  哎咆科技

AI挑战《超级马力欧兄弟》:GPT-4o 太菜了!

哎咆科技  · 公众号  · 硬件  · 2025-03-04 20:30

正文

上周五,加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室开展了一项别具一格的研究,他们把 AI 应用到经典游戏《超级马力欧兄弟》中,以此对 AI 性能展开测试。测试结果表明,Anthropic 的 Claude 3.7 展现出最为优异的表现,Claude 3.5 紧追其后,然而谷歌的 Gemini 1.5 Pro 以及 OpenAI 的 GPT-4o 表现欠佳。
此次实验并非采用 1985 年最初发行的游戏版本,而是借助实验室自主研发的 GamingAgent 框架,在模拟器里进行。GamingAgent 为 AI 提供基础指令和游戏截图,AI 则生成 Python 代码来控制马力欧。研究人员注意到,像 OpenAI 的 o1 这类推理模型,其表现比不上 “非推理” 模型,主要原因在于它们决定行动需要花费数秒时间,可在《超级马力欧兄弟》这款游戏里,时机的把握极为关键。






请到「今天看啥」查看全文