|
奖励汤:根据插值各种奖励微调的权重实现Pareto-最优对齐 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
Model soups: 无需增加推理时间,对多个微调模型权重平均去提高准确度 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
早期权重平均满足LLM预训练的高学习率 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
奖励汤:根据插值各种奖励微调的权重实现Pareto-最优对齐 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
TIES-MERGING: 解决合并模型时的冲突 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
Arcee MergeKit:用于合并大型语言模型的工具包 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
WARM:论权重平均奖励模型的好处 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
模型合并的进化优化方法 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
LoRAHub: 动态LoRA组合的高效跨任务泛化 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
基于不确定性梯度匹配的模型合并 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
UnIVAL:图像、视频、语音和语言任务的统一模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
TradingGPT:带分层记忆和不同性格的多智体系统增强金融交易性能 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
社会化具身协同机器人:工业协同机器人与社会虚拟智体的整合 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
AIOS: LLM 智体操作系统 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
LeGo-Drive: 语言增强目标定向的闭环端到端自动驾驶 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
DBRX:一种新的混合专家开放式大模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
大模型的模型融合方法 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
模型融合(Model Merging):合理性、常见技术及其特性 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
自动驾驶问答的多帧轻量高效视觉-语言模型 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|
|
多模态情绪调节和情感一致性对具身对话智体的重要性 计算机视觉深度学习和自动驾驶 · 公众号 · · 10 月前 · |
|