专栏名称: 学术头条
致力于科学传播和学术分享,关注计算机科学、认知科学、人工智能科学、神经科学、脑科学等学科领域。我们从跨学科的角度,围绕“认知智能”向科学界和大众介绍相关领域的前沿话题和深度解读。
目录
相关文章推荐
OSC开源社区  ·  2024: 大模型背景下知识图谱的理性回归 ·  昨天  
程序员的那些事  ·  成人玩偶 + ... ·  2 天前  
程序员的那些事  ·  李彦宏自曝开源真相:从骂“智商税”到送出“史 ... ·  3 天前  
程序猿  ·  问问DeepSeek,你和ChatGPT谁厉 ... ·  3 天前  
51好读  ›  专栏  ›  学术头条

今日Nature:AI游戏设计师问世,自学成才,无需任何先前知识

学术头条  · 公众号  ·  · 2025-02-20 00:11

正文


在当今数字化时代,创意产业正经历着一场由生成式人工智能(AI)引发的变革。从文本、图像到音频、 视频,AI 正以前所未有的速度和规模生成各种内容,为创意工作者提供了全新的工具和思路。


然而, 将这些技术无缝融入创意实践并非易事,尤其是在游戏开发这一复杂且富有创意的领域


游戏开发不仅需要生成新颖的内容,更需要在保持游戏世界 一致性 多样性 和用户修改 持续性 方面达到高度平衡。


近日,一篇发表在 Nature 上的研究论文 World and Human Action Models towards Gameplay Ideation 揭示了如何 利用生成式 AI 模型推动游戏玩法创意的生成


论文链接:

https://www.nature.com/articles/s41586-025-08600-3


论文报道了一个由微软研究院领导的研究团队,开发的可协助电子游戏设计师迭代设计游戏的生成式 AI 模型—— 世界与人类行动模型 (World and Human Action Model, WHAM ),其 生成的鲁棒 3D 世界能遵循设计用于电子游戏的机制


他们认为,考虑到由于 WHAM 无需任何先前知识,仅通过玩游戏的训练就能学会生成序列 ,这个工具或能轻松转换用于生成来自其他电子游戏的关卡,为游戏开发行业带来新的可能。


视频|WHAM 生成的一致性、多样性和持久性的实例以及WHAM演示器的功能。



AI 还可以做好游戏创意开发?


电子游戏在娱乐产业中占最大份额,全球有数十亿人玩和购买电子游戏。然而,游戏开发是一个涉及多学科、多技能的复杂过程,从概念设计、角色建模到关卡设计、游戏机制编程, 每一个环节都需要创意人员投入大量的时间和精力 。传统的游戏开发流程往往受限于人力和时间成本,难以快速迭代和生成多样化的游戏内容。


生成式 AI 为解决这一问题提供了可能 。通过训练 AI 模型学习大量的游戏数据,理论上可以生成新的游戏玩法序列、关卡设计甚至角色行为,从而辅助创意人员更高效地进行游戏开发。


然而,现有的生成式 AI 模型在游戏开发领域的应用 仍面临诸多挑战 ,如生成内容的一致性、多样性以及对用户修改的持续性支持不足等。


因此,在这项工作中, 研究团队旨在 开发一种能够更好地支持游戏开发创意实践的生成式 AI 模型


为了深入了解游戏开发创意人员的实际需求,研究团队邀请了来自不同游戏工作室创意团队的 27 名电子游戏设计师,开展了半结构化访谈,这些电子游戏设计师涵盖了游戏开发的多个领域,包括工程、设计和艺术等。


在访谈过程中,研究团队使用了一种名为 “设计探针” 的工具,通过模拟一个虚构但具体的游戏开发场景,激发参与者对生成式 AI 在游戏创意中的潜在应用的思考。


参与者们积极分享了他们对 AI 辅助游戏创意的看法和期望,认为当前用于打造电子游戏的 AI 方案缺乏生成许多不同创意(发散性思维)的能力,并强调 在保持游戏世界一致性的同时,实现多样化创意的重要性,以及通过设计过程来持续微调游戏各方面(迭代实践) 的重要性。


具体来说,参与者们认为,生成式 AI 应该能够帮助他们在游戏开发过程中实现以下几个目标:


  • 提供多样化的内容 :AI 模型应该能够生成多种不同的游戏玩法序列和关卡设计,以激发创意人员的灵感;

  • 保持一致性 :生成的内容应该与游戏的整体风格和机制保持一致,避免出现与游戏世界不协调的元素;

  • 支持迭代实践 :创意人员希望能够通过直接修改生成的内容来进行迭代,而不是仅仅依赖于文本提示;

  • 持续性 :用户对生成内容的修改应该能够持续地保留,而不是在后续生成过程中消失。


基于用户需求调研的结果,研究团队开发了 WHAM。


图|WHAM 模型(来源: 论文)


WHAM 模型使用了 3D 多玩家战斗模拟器《嗜血边缘》中大量的人类玩家玩法数据,包括游戏视觉画面和控制器动作。采用 Transformer 架构作为其序列预测的骨干网络,并使用 VQGAN 图像编码器将图像编码为离散的 token 序列, 通过对真实人类游戏玩法数据的训练,WHAM 能够准确预测游戏环境的 3D 结构、控制器动作的效果以及游戏的时空结构



为游戏开发提供一种全新工具


研究团队发现,WHAM 能够设计出符合《嗜血边缘》预存在机制的复杂 3D 电子游戏序列,其关卡设计也具有明显的多样性,且创意人员可对输出进行迭代调整。他们还开发了 WHAM 示范器,作为供用户操作和自定义 WHAM 输出的一个可视化界面。


为了评估 WHAM 的性能,他们还 提出了一套针对生成式 AI 模型的评估方法 ,重点关注模型在一致性、多样性和持续性这三个关键能力上的表现。



在一致性评估方面 ,他们使用 Fréchet Video Distance(FVD)指标来衡量生成的游戏玩法与真实游戏玩法在视觉和时空动态上的一致性。通过将 WHAM 生成的游戏画面与真实玩家的游戏画面进行对比,发现 随着模型规模的增大和计算资源的增加,FVD 分数逐渐降低 ,表明模型生成的内容与真实游戏数据的一致性不断提高。


在多样性评估方面 ,他们采用 Wasserstein 距离来衡量模型生成的动作分布与真实玩家动作分布之间的差异。结果表明,WHAM 能够生成与真实玩家行为相似的动作序列,且在训练过程中,Wasserstein 距离逐渐减小,说明模型在保持一致性的同时,能够生成多样化的游戏玩法。







请到「今天看啥」查看全文