|
中科院提出大模型“基准泄露”排行榜,Qwen模型位居榜首 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
DPO,RM,RLHF 傻傻分不清楚 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
LLMs 能够生成创新的研究想法吗?——一项针对 100 多位 NLP 研究者的大规模人类研究 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
揭秘MagicDec:如何推测解码让长文本处理不再纠结于延迟与吞吐? 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
探索自然语言中的计划搜索:提升大型语言模型代码生成性能的新方法 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
关于如何做科研的一些个人经验 -- 清华AP、Mooncake作者 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
重复采样魔法:用更多样本击败单次尝试的最强模型 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
你真的了解GPT4o吗?连续发CCFA的博士方法介绍 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
Alignment下一站:合成数据 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
MemLong: 长文本的新记忆大师,可将上下文长度从4k提升到80k! 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
最强MoE完全开源模型发布啦~ 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
大语言模型多选题评估的偏见与鲁棒性 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
情境化逻辑:LLMs推理能力的真正试金石 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
千问团队tech lead解读Qwen2-VL:让我们先把视觉理解干上去!(一) 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
ACL2024 | LLM+RAG可能要毁了信息检索,一份深入研究 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
大模型领域,你心目中 idea 最惊艳的论文是哪篇? 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
入坑大模型18个月的反思与贩私 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
一周打完1000场官司,中科院发布首个AI法庭AgentCourt! 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|
|
揭秘LLMs不确定性背后的隐患:后门攻击的悄然兴起 深度学习自然语言处理 · 公众号 · · 5 月前 · |
|