|
开源社区 DeepSeek R1 最新复现进展汇总 吃果冻不吐果冻皮 · 公众号 · · 昨天 · |
|
|
DeepSeek大模型原创核心技术解读 吃果冻不吐果冻皮 · 公众号 · · 2 天前 · |
|
|
我没有大模型经验,可以给个机会吗? 吃果冻不吐果冻皮 · 公众号 · · 3 天前 · |
|
|
张俊林:Grok 3是否意味着大力出奇迹的大模型法则仍然成立? 吃果冻不吐果冻皮 · 公众号 · · 4 天前 · |
|
|
重磅直播解析 | DeepSeek慢思考模型的技术解析与应用 吃果冻不吐果冻皮 · 公众号 · · 4 天前 · |
|
|
聊聊Reasoning Model的精巧实现(ReFT, Kimi K1.5, DeepSeek R1) 吃果冻不吐果冻皮 · 公众号 · · 5 天前 · |
|
|
大模型推理服务全景图 吃果冻不吐果冻皮 · 公众号 · · 6 天前 · |
|
|
从 DeepSeek R1 论文深入理解推理型大模型 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
Qwen架构爆改为DeepSeek,再复现R1 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
清华开源KTransformers-让24GB显卡流畅运行满血DeepSeek-R1 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
DeepSeek-R1满血蒸馏全适配:国产 GPU 、全平台 & 多机分布式 ! 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
X-R1: 不到50元,人人都能复现0.5B Aha Moment 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
DeepSeek V3, R1, Janus-Pro系列模型技术解读 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
详细谈谈DeepSeek MoE相关的技术发展 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
昇腾 910B 部署满血 DeepSeek-R1 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
干货分享!关于Zero-RL的调参经验 吃果冻不吐果冻皮 · 公众号 · · 1 周前 · |
|
|
理解DeepSeek在MoE技术的演进过程和具体实现 吃果冻不吐果冻皮 · 公众号 · · 2 周前 · |
|
|
第21期-大模型应用书籍赠送活动 吃果冻不吐果冻皮 · 公众号 · · 2 周前 · |
|
|
硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判 吃果冻不吐果冻皮 · 公众号 · · 2 周前 · |
|
|
深度解析 DeepSeek 的蒸馏技术 吃果冻不吐果冻皮 · 公众号 · · 2 周前 · |
|