|
具身人工智能综述:从模拟器到研究 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
通过强化学习和推理规模化推进语言模型推理 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
让AI成为人类的Intern,书生通用大模型体系迈向通专融合 | WAIC 2024 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
InternLM-XComposer2.5-Reward:一个简单而有效的多模态奖励模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
适用于通用和专业应用的视觉-语言大模型:综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
DeepSeekMath:在开放语言模型中突破数学推理的极限 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
DeepSeek-R1如何通过知识蒸馏把推理能力迁移到千问Qwen 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
Janus:解耦视觉编码实现统一的多模态理解和生成 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
Janus-Pro:通过数据和模型规模化实现统一的多模态理解和生成 计算机视觉深度学习和自动驾驶 · 公众号 · · 1 周前 · |
|
|
隐式 PRM:无需进程标签即可获得免费进程奖励 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
PRIME:通过隐式奖励进行过程强化 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
LLaVA-CoT:让视觉-语言模型逐步推理 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
Marco-o1:面向开放端解决方案的开放推理模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
O1-coder:O1 在编码方面的复制 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
基础模型能为机器人学习操纵带来什么:综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
机器人技术中的深度生成式模型:从多模态演示中学习的综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
自主机器人将强化学习与基础模型相结合:方法与观点 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
迈向大型推理模型:大语言模型强化推理综述 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
LLaMA-Berry:通过类似 O1 的蒙特卡洛树搜索实现奥林匹克级数学推理的成对优化 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|
|
ReST-MCTS∗:通过过程奖励引导树搜索进行 LLM 自训练 计算机视觉深度学习和自动驾驶 · 公众号 · · 2 周前 · |
|