|
具有改进 3D 扩散策略的可通用人形机器人操控 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
LucidSim:从生成图像学习视觉跑酷 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
Re-Mix:优化数据混合以实现大规模模仿学习 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
3D Diffuser Actor:使用 3D 场景表示进行策略扩散 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
ManipLLM:以目标为中心机器人操作的具身多模态大语言模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
精度上规模化定律 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
机器人学习任务的视觉、语言和动作模型基准测试 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
DeeR-VLA:实现高效机器人执行的多模态大语言模型动态推理 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
LLARVA:视觉-动作指令调优增强机器人学习能力 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
π0:一个视觉-语言-动作的流模型用于通用机器人控制 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
Dual Process VLA:利用 VLM 实现高效的机器人操作 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
DRAMA:基于 Mamba 的高效端到端自动驾驶运动规划器 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
视觉 Mamba 的综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
多样性赋予智能:整合软件工程智体的专业知识 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
KoMA:知识驱动的多智体框架用于大语言模型自动驾驶 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
AutoMix:自动混合语言模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
路由到专家:高效奖励引导的大语言模型集成 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
IG-SLAM:即时高斯 SLAM 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
RTG-SLAM:使用高斯Splatting进行大规模实时 3D 重建 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
AGENTGEN:通过环境和任务生成去增强基于大语言模型智体的规划能力 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|