|
告别通宵读文献!IAAR、人大推出全自动综述神器SurveyX,一键生成图文并茂的综述论文 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
DeepSeek-R1 解读及技术报告中文版 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025) 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
李国杰院士“七问”DeepSeek 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
DeepSeek突袭公布成本利润率:545% 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
肖朝军@清华大学:高效稀疏注意力机制研究 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
DeepSeek开源第二弹,为MoE和EP量身定制的通信库!暂和英伟达显卡绑定 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
姚班天才创办的大模型公司,卖了 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
“源神”DeepSeek!突破H800性能上限,FlashMLA重磅开源,算力成本还能降 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
从零开始绘制DeepSeek R1架构和训练流程 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
美国博士offer一夜变废纸!陶哲轩抗议LeCun建议欧洲抄底,川普新政搞崩学术圈 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了! 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
DeepSeek-R1技术剖析:没有强化学习基础也能看懂的PPO & GRPO 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
零基础入门:DeepSeek微调教程来了! 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|
|
最全梳理:一文搞懂RAG技术的5种范式! 机器学习算法与自然语言处理 · 公众号 · · 2 周前 · |
|