|
国家杰青刘永锋会场突发脑溢血离世,终年48岁!妻子公开信呈现了他的工作有多么忙碌! 机器学习算法与自然语言处理 · 公众号 · · 2 天前 · |
|
|
从刷题到搬砖,通用多模态大模型离具身智能还有多远? 机器学习算法与自然语言处理 · 公众号 · · 2 天前 · |
|
|
7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源! 机器学习算法与自然语言处理 · 公众号 · · 2 天前 · |
|
|
QwQ-32B 测评和使用教程来了! 机器学习算法与自然语言处理 · 公众号 · · 3 天前 · |
|
|
阿里巴巴:裁减 24940 人! 机器学习算法与自然语言处理 · 公众号 · · 3 天前 · |
|
|
当持续学习遇上多模态大型语言模型:综述 机器学习算法与自然语言处理 · 公众号 · · 3 天前 · |
|
|
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理 机器学习算法与自然语言处理 · 公众号 · · 4 天前 · |
|
|
用极小模型复现R1思维链的失败感悟 机器学习算法与自然语言处理 · 公众号 · · 4 天前 · |
|
|
全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键 机器学习算法与自然语言处理 · 公众号 · · 4 天前 · |
|
|
图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI 机器学习算法与自然语言处理 · 公众号 · · 5 天前 · |
|
|
港理工提出TokenSkip:让大模型在CoT中“跳”过冗余token,压缩40%,性能几乎不降! 机器学习算法与自然语言处理 · 公众号 · · 5 天前 · |
|
|
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理 机器学习算法与自然语言处理 · 公众号 · · 5 天前 · |
|
|
刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto 机器学习算法与自然语言处理 · 公众号 · · 6 天前 · |
|
|
终于有人站出来质疑LLM as a judge的合理性了! 机器学习算法与自然语言处理 · 公众号 · · 6 天前 · |
|
|
DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法 机器学习算法与自然语言处理 · 公众号 · · 6 天前 · |
|
|
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
NP难问题接近被AI破解!南航牛津爆改DeepSeek-R1推理,碾压人类27年研究 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
我没有大模型经验,可以给个机会吗? 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|
|
南大周志华团队获奖,AAAI 2025杰出论文奖出炉 机器学习算法与自然语言处理 · 公众号 · · 1 周前 · |
|