|
通过一个验证器进行多步骤问题解决:模型-促进的过程监督实证分析 计算机视觉深度学习和自动驾驶 · 公众号 · · 3 月前 · |
|
|
Math-Shepherd:无需人工注释,一步步验证并强化 LLM 计算机视觉深度学习和自动驾驶 · 公众号 · · 3 月前 · |
|
|
推理规模化定律:LLM 求解问题的计算-最优推理实证分析 计算机视觉深度学习和自动驾驶 · 公众号 · 科技自媒体 · 3 月前 · |
|
|
通过自动化的过程监督提高语言模型中的数学推理能力 计算机视觉深度学习和自动驾驶 · 公众号 · · 3 月前 · |
|
|
DexCap:可扩展、便携的运动捕捉数据收集系统,用于灵巧操作 计算机视觉深度学习和自动驾驶 · 公众号 · · 3 月前 · |
|
|
QUAR-VLA:四足机器人的视觉-语言-动作(VLA)模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 3 月前 · |
|
|
RVT:用于 3D 目标操控的机器人视图 Transformer 计算机视觉深度学习和自动驾驶 · 公众号 · · 3 月前 · |
|
|
RVT-2:通过少量演示学习精确操作 计算机视觉深度学习和自动驾驶 · 公众号 · 科技自媒体 · 3 月前 · |
|
|
OpenR:一个用于大语言模型高级推理的开源框架 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
LLM 的测试-时间计算规模化比模型参数规模化更有效 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
AutoRT:机器人智体大规模编排的具身基础模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
Bi-VLA:基于视觉-语言-动作模型的双手机器人灵巧操纵系统 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
HOLODECK:语言引导生成 3D 具身 AI 环境 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
MetaUrban:城市空间中具身智能的一个模拟平台 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
PHYSCENE:具身智能中物理可交互 3D 场景合成 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
RT-Trajectory:通过事后轨迹草图实现机器人任务泛化 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
SARA-RT:利用自适应鲁棒注意机制扩展机器人 Transformer 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
以自我中心的视觉语言规划 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
大模型智体:最新进展、合作范式、安全与隐私以及未来趋势 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|
|
ManiSkill3:用于通用具身 AI 的 GPU 并行机器人模拟和渲染 计算机视觉深度学习和自动驾驶 · 公众号 · · 4 月前 · |
|