|
实践指南: hzwer大佬的模型优化与迭代策略 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
如何用一个统一的视角,分析RLHF下的各种算法? 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
模仿、探索与自我提升:慢思考推理系统的复现之路 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
只要捞"偏门",篇篇都是顶会顶刊! 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
圆桌会 | 荣幸邀请到Meta、OSU、哈佛&MIT学者来分享Agent前沿~ 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
如何增强大模型推理?Meta最新提出《大型概念模型》在句子表示空间中的语言建模 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
大模型Infra王朝2024 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
今晚8:30,荣幸邀请到电影导演和LLM科学家一起聊聊对多模态的见解 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
一位大佬的自述 | 从读博到 Google DeepMind : 旅程中的心得与感恩 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
知乎大佬解析Ilya最新言论:pre-train丸啦,搞agentic和reasoning吧 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
LLM Agent的社会模拟综述 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
从镜头到算法:多模态与电影的跨界对话 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
Ilya宣判:预训练即将终结!NeurIPS现场沸腾 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
无痛理解旋转位置编码RoPE 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
NeurIPS 2024 | MIT学者歧视国人! 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
模仿、探索与自我提升:慢思考推理系统的复现之路 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
|
每个instance应该有自己的prompt!阿里提出新方法,突破零样本思维链局限 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|