|
vllm代码更新太频繁,我该怎么办? 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
LLM的范式转移:RL带来新的 Scaling Law 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
Concise Thoughts:仅通过长度限制,获取更简明的CoT能大幅度提升效果 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
情感分析的终极形态:全景式细粒度多模态对话情感分析基准PanoSent 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
校招生做大模型,选预训练还是SFT? 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
如何看待 Show-o 和 Transfusion 等 AR+Diffusion 的工作? 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
微解读 | 到底要不要使用Code?探索Code对pre-training的影响 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
OpenRLHF:大规模分布式RLHF训练系统介绍 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
当心环境内容的干扰:大模型GUI智能体的忠实度研究 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
以DeepSeek-VL为例,详解视觉语言模型原理及代码 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
MIT研究:LLM对世界模型的探索 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
Yann LeCun不看好强化学习:「我确实更喜欢 MPC」 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
GLM-4-Flash竟然免费了,还可免费微调... 让其他公司咋玩 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
从token到patch,一种LLM加速训练策略 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
长文本 Embedding 模型中的“迟分”策略 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
图文跨模态检索研究综述 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
科研工作者该如何平衡科研和生活? - 有个p的平衡... 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
从ACL 2024录用论文看混合专家模型(MoE)最新研究进展 深度学习自然语言处理 · 公众号 · 科技自媒体 · 5 月前 · |
|
|
如何解读 Yann LeCun推文建议学生不要在大模型方向工作? 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
prompt综述的解释和个人思考 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|