|
哈工深、微信:“慢思考”超长文档翻译智能体 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
解构DPO:从RLHF推导到多偏好对齐的简化之道 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
训练VLM(视觉语言模型)的经验 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
EMNLP2024分享会要开始啦!6大主题、2多主题,快来预约不错过 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
BWArea Model: 决策视角下的可控语言生成 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
可怕!llm训练的bug,梯度累计设置过大,会导致最终loss过大。 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
关于LLM+RL(HF)的片面脉络梳理 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
LLM实践--支线:拯救Continue Pretrain的数据 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
合成数据用于AI训练的艺术与科学 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
双工大模型—真正的对话大模型 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
可视化剖析与代码实践,带你一文掌握Mamba和SSM 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
EMNLP2024分享会要开始啦!6大主题、2多主题,快来预约不错过 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
如何从头训练大语言模型: A simple technical report 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
写在Ph.D第0年:AI/CV科研菜鸟的持续进阶之路 深度学习自然语言处理 · 公众号 · · 3 月前 · |
|
|
长序列(Long Context)大模型笔记 深度学习自然语言处理 · 公众号 · · 4 月前 · |
|
|
Journey Training:o1的一次复现尝试,极长思维链的合成 深度学习自然语言处理 · 公众号 · · 4 月前 · |
|
|
避开复数推导,我们还可以怎么理解RoPE(重制版) 深度学习自然语言处理 · 公众号 · · 4 月前 · |
|
|
决策智能与强化学习:重放比率(replay ratio) 深度学习自然语言处理 · 公众号 · · 4 月前 · |
|
|
招聘 | IT:U奥地利跨学科创新技术大学 Prof. Yufang Hou 招聘NLP方向岗位制博士生、博士后 深度学习自然语言处理 · 公众号 · · 4 月前 · |
|