专栏名称: 环球物理
环球物理,以物理学习为主题,以传播物理文化为己任。专业于物理,致力于物理!以激发学习者学习物理的兴趣为目标,分享物理的智慧,学会用物理思维去思考问题,为大家展现一个有趣,丰富多彩的,神奇的物理世界!
目录
相关文章推荐
中科院物理所  ·  跑车也喜欢用的碳纤维材料有啥好? ·  19 小时前  
环球物理  ·  【AI教学】deepseek教师指令赶紧保存! ·  2 天前  
环球物理  ·  【物理原理】物理学的六个基本原理 ·  2 天前  
51好读  ›  专栏  ›  环球物理

【物理引擎】AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果

环球物理  · 公众号  · 物理  · 2025-03-06 20:30

正文

梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

AI视频生成这就过时了吗?

刚刚,最先进的 生成式物理引擎Genesis 发布,一句话就可以生成完整精确的模拟物理世界。

一滴水滴落到一个啤酒瓶上,然后沿着瓶子表面慢慢滑落

图片

生成结果可不仅是一个视频,其中还包含物体运动的各种参数。

图片

接下来可以分为三个视角,同时追踪模拟水滴的运动……

图片

对于人物动作,也可以遵循提示词精确模拟。

一个手里拿着棍子的微型悟空在桌子表面冲刺3秒钟,然后跳到空中,并在着陆时向下摆动右臂。
摄像机从他的面部特写开始,然后稳步跟随角色,同时逐渐缩小。

图片

当猴子跳到空中时,在跳跃的最高点,动作会暂停几秒钟……摄像机围绕角色旋转 360 度,然后缓慢上升,然后动作继续。

图片


这是一项涉及20多个组织,为期24个月的大规模合作研究:

学术界, 有清华、北大、港大、CMU、马里兰、哥伦比亚、斯坦福、MIT……说是学术圈半壁江山都参与了也不为过。

产业界, 也有英伟达、太极图形,以及MIT-IBM Watson AI Lab这样的联合实验室助阵。

图片

OpenAI在2月初次演示Sora时,曾称它是“世界的模拟器”。

相比之下,Genesis不仅物理模拟更精确,还同时有更多能力:

  • 它是一个从头开始重建的通用物理引擎,能够模拟各种材料和物理现象。

  • 它是一个轻量级、超快速、Python化和用户友好的机器人仿真平台。

  • 它是一个强大而快速的照片级写实渲染系统。

  • 它是一个生成式数据引擎,可将用户提示的自然语言描述转换为各种数据模式。

一句话总结:Genesis是一个全面的物理模拟平台,专为通用机器人、具身AI和物理AI应用而设计。

图片

共同一作、CMU博士生 周衔 详细介绍了Genesis的各种能力,迅速引起业界轰动。

图片

其中大家格外关注的一点是生成速度。

它提供的模拟速度 比现实世界快约430000倍 ,并且只需 26秒 即可在单个RTX4090上训练能转移到真实机器人的运动策略。

图片

据周衔介绍,Genesis的物理引擎用纯Python代码开发,同时比现有的GPU加速堆栈(如英伟达Isaac Gym和开源的MJX)快10-80倍。

同时,速度的提高不会影响仿真精度。

图片

目前,团队正在开源底层物理引擎和模拟平台,对生成式框架的访问将在不久的将来逐步推出。

不得不说,从一句话生成视频到一句话生成物理世界,2024年的进展实在是太快了。

生成4D物理世界

Genesis由从头开始的通用物理引擎提供支持,将各种物理求解器及其耦合集成到统一的框架中。该核心物理引擎通过上层运行的生成Agent框架进一步增强,旨在为机器人及其他领域实现完全自动化的数据生成,包括以下模态:

  • 物理准确且空间一致的视频

  • 摄像机运动和参数

  • 人类和动物角色的动作

  • 机器人操作和运动策略,可部署到现实世界

  • 完全交互式 3D 场景

  • 开放世界铰接式物体生成

  • 语音音频、面部动作和表情


角色运动

关于角色运动,除了开头展示的猴子,作者还一口气放出了三个不同风格角色的运动场景。

一位日本武士正在表演拳击。
一名罗马士兵像僵尸一样向前走。
一名中国风的战士表演江南Style舞蹈。

图片

机器人策略

除了角色的运动,Genesis还可以自主提出机器人任务、设计环境、编写奖励函数,并最终自动生成机器人策略。

移动式franka机械臂将地板上的所有物品都扔进篮子里。

图片

同时支持Sim2Real,把在模拟环境训练好的策略转移到真实硬件机器人中。

一个宇树H1-2人形机器人向前走。

图片


四足机器狗双重后空翻

图片

很可惜还有一个人形机器人单脚跳跃只有模拟演示,因为团队的机器人坏掉了……

宇树H1人形机器人执行单脚跳跃。

图片

另外除了机器人,无人机编队也可以模拟,并呈现出正确的数量关系。

由24(4x6)架无人机组成的机队一起从地面起飞并一起进行翻转。

图片

3D & 全互动场景生成

一个带有客厅(包括用餐空间)、洗手间、书房和卧室的家居室内场景。


互动实体俄罗斯方块游戏。

图片

开放世界铰接式物体

生成开放世界铰接式物体的mesh资产,质量超越了人工注释,更多详细信息将随之后的论文一起公开。

图片


软体机器人

不只是各种刚性物体,Genesis针对软性的机器人也能够实现逼真的模拟。

蠕虫。

图片

柔软的抓手操纵盒子并拿起笔帽。

图片

面部动画和语音

Genesis还能够处理面部动作和表情的生成:

图片

同时还能向其中添加语音,并在面部表情不断变化的同时,保持口型与说话内容的匹配:

文本“ Genesis是一个为通用机器人/嵌入式人工智能/物理人工智能应用而设计的物理平台。” 对应的面部运动和语音,表情从中性过渡到愤怒,再到开心。

代码已开源,pip install

目前Genesis代码已开源,可以直接 pip install genesis-world 安装。

开源代码发布仅几个小时,也迅速在GitHub上揽获1.6k star。

图片







请到「今天看啥」查看全文