|
视觉灵活性:手中操作对新和复杂目标形状的重定向 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
DexTransfer:仅需极少的人类演示实现真实世界中多指灵巧抓取 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
VideoDex:通过互联网视频学习灵巧 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
RoboGSim:Real2Sim2Real 机器人Gaussian Splatting模拟器 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
VidMan: 利用视频扩散模型中的隐动力学实现有效的机器人操控 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
Sim Anything:利用Gaussian Splatting技术自动实现开放世界场景的 3D 物理模拟 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
Diffusion-VLA:通过统一扩散和自回归扩展机器人基础模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
DexDiffuser:用于自适应灵巧操作的交互-觉察扩散规划方法 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
DexGrip:具有灵巧抓握和手中操作能力的多模态软夹持器 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
NaVILA:视觉-语言-动作模型用于带腿机器人的导航 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
AnyBimanual:将单手策略迁移至普通的双手操作 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
Lift3D 基础策略:提升 2D 大规模预训练模型,实现稳健的 3D 机器人操作 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
学习在无姿态视频上进行大规模 3D 创作 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
元建模方法选择成本-高效的语言模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
Tryage:实时、智能地将用户提示路由至大语言模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
RoboCasa通用机器人日常任务的大规模模拟 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
具有谱扩展的蒙特卡洛树搜索用于动态系统规划 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 · |
|
|
OpenAI O1 复制:通过简单蒸馏超越 O1-preview,重大进步还是惨痛教训?-第 2 部分 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
OpenAI O1 复制:战略进展报告 - 第 1 部分 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|
|
步步验证:多步推理中的过程监督 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 · |
|