|
国产模型再秀硅谷!阿里Qwen2.5-Max数学、编程能力全球第一 深度学习自然语言处理 · 公众号 · · 昨天 · |
|
|
LightTransfer:将你的LLM轻松转为Hybrid model,增强o1-like长文本生成能力 深度学习自然语言处理 · 公众号 · · 3 天前 · |
|
|
新突破!xJailbreak:用强化学习「越狱」大模型,可解释性黑盒攻击来了 深度学习自然语言处理 · 公众号 · · 4 天前 · |
|
|
腾讯AI Lab联合苏大上交提出:少切思路多挖矿,让o1类LLM做题不再「三心二意」 深度学习自然语言处理 · 公众号 · · 4 天前 · |
|
|
北航团队发布XRAG-Ollama:助力轻便本地化部署RAG实验框架 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
谈谈对DeepSeek-R1的一些理解 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
探索如何将LLM应用到个人项目中,发现高性价比大模型新宠 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
大模型由"社恐"变身"懂王"的迷之自信从何而来? 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
从话痨到省流大师,效果堪比双十一满减:TALE让LLM学会“断舍离” 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
Kimi k1.5:多模态强化学习,推理性能与效率双丰收 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
一文讲清楚大模型涉及到的精度:FP32、TF32、FP16、BF16、FP8、FP4、NF4、INT8 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
招生|上海交通大学谢伟迪组科研实习 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
通义WebWalker: 大模型乘风破浪,探索网页深海 深度学习自然语言处理 · 公众号 · · 2 周前 · |
|
|
为啥本科生都能发顶会,而博士一篇都没有? 深度学习自然语言处理 · 公众号 · · 3 周前 · |
|
|
综述OS Agents: MLLM智能体实现计算设备通用控制 | 浙大&OPPO&零一万物等 深度学习自然语言处理 · 公众号 · · 3 周前 · |
|
|
迈向多语言与多任务的医疗大模型:探索医疗语境中的语言基座模型 深度学习自然语言处理 · 公众号 · · 3 周前 · |
|
|
如何创建一个理性的基于LLM的Agent? 深度学习自然语言处理 · 公众号 · · 3 周前 · |
|
|
Nvlink对大模型推理的速度有多大提升? 深度学习自然语言处理 · 公众号 · · 3 周前 · |
|
|
deepseek技术解读(1)-彻底理解MLA(Multi-Head Latent Attention) 深度学习自然语言处理 · 公众号 · · 3 周前 · |
|