|
浙江大学刘佐珠/吴健课题组 6篇论文被EMNLP 2024主会/Findings录用 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
LLM不会CoT隐性推理,只会显性推理! 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
本科生大作业给8分,iclr评审机制的失灵? 深度学习自然语言处理 · 公众号 · 科技创业 科技自媒体 · 2 月前 · |
|
|
很荣幸邀请两位研究员分享:大模型数据合成和增强技术 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
投机解码中高质量draft tokens不该被拒绝 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
一网打尽大模型长文本训练技术 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
ICLR 高分:深入研究多模态大模型的对齐策略 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
什么是人生的最顶级享受?DeepMind上班,年薪120万磅,研究AI的深层次的推理和思考 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
阿里提出Marco-o1:探索开放推理模型在复杂问题解决中的应用与突破 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
探索 OpenAI O1 模型复现:从 Kimi K0-Math 到 DeepSeek R1 Lite 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
MEMO-Bench揭示现有多模态在负面情绪图片识别与生成上存在巨大缺陷 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
提点超30%的WebAgent新方法,比树搜索更灵活! 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
DeepSeek 推理模型预览版上线,解密 o1 推理过程 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
微软发现不同prompt模版会导致最大40%性能差距! 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
LLM是如何将信息检索杀死的? 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
大模型也有侧脑?揭秘WISE如何带来终生学习新突破 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
LLM也怕你妈叫你回家吃饭这种模糊请求,纽大提出指导LLM澄清问题 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
最新多模态大模型综述|连续还是离散?多模态大模型的进化之路 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
人人都能看懂的RL-PPO理论知识 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|
|
最值得参加的LLM盛会!多模态/Agent/具身智能/安全/评估等15个论坛! 深度学习自然语言处理 · 公众号 · · 2 月前 · |
|