计算机视觉深度学习和自动驾驶 - 公众号 - 文章列表

视觉灵活性：手中操作对新和复杂目标形状的重定向

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

DexTransfer：仅需极少的人类演示实现真实世界中多指灵巧抓取

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

VideoDex：通过互联网视频学习灵巧

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

RoboGSim：Real2Sim2Real 机器人Gaussian Splatting模拟器

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

VidMan: 利用视频扩散模型中的隐动力学实现有效的机器人操控

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

Sim Anything：利用Gaussian Splatting技术自动实现开放世界场景的 3D 物理模拟

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

Diffusion-VLA：通过统一扩散和自回归扩展机器人基础模型

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

DexDiffuser：用于自适应灵巧操作的交互-觉察扩散规划方法

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

DexGrip：具有灵巧抓握和手中操作能力的多模态软夹持器

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

NaVILA：视觉-语言-动作模型用于带腿机器人的导航

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

AnyBimanual：将单手策略迁移至普通的双手操作

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

Lift3D 基础策略：提升 2D 大规模预训练模型，实现稳健的 3D 机器人操作

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

学习在无姿态视频上进行大规模 3D 创作

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

元建模方法选择成本-高效的语言模型

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

Tryage：实时、智能地将用户提示路由至大语言模型

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

RoboCasa通用机器人日常任务的大规模模拟

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

具有谱扩展的蒙特卡洛树搜索用于动态系统规划

计算机视觉深度学习和自动驾驶 · 公众号 · · 1 月前 ·

OpenAI O1 复制：通过简单蒸馏超越 O1-preview，重大进步还是惨痛教训？-第 2 部分

计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 ·

OpenAI O1 复制：战略进展报告 - 第 1 部分

计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 ·

步步验证：多步推理中的过程监督

计算机视觉深度学习和自动驾驶 · 公众号 · · 2 月前 ·