320亿参数干翻6710亿！阿里开源QwQ-32B：消费级显卡就能跑，附免费商用及网址

老马那些事 · 公众号 · · 2025-03-06 19:30

正文

请到「今天看啥」查看全文

当大多数人还在沉睡时，阿里巴巴突然向全球开发者抛出一枚“技术炸弹”——通义千问团队宣布正式开源QwQ-32B模型。

阿里通义团队表示，QwQ-32B模型拥有320亿参数，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美。在冷启动的基础上，模型针对数学和编程任务、通用能力分别进行了两轮大规模强化学习，在32B的模型尺寸上获得了令人惊喜的推理能力提升，印证了大规模强化学习可显著提高模型性能。

QwQ-32B采用了Apache 2.0开源协议，目前，所有人都可免费下载及商用QwQ-32B模型，或通过网页版Qwen Chat进行体验，该模型也将免费上架通义APP。

1.模型性能与参数规模

QwQ-32B拥有**320亿参数**，但性能可媲美参数规模更大的DeepSeek-R1模型（6710亿参数，其中370亿被激活）。通过大规模强化学习训练，其数学推理、代码生成及通用智能能力实现显著提升。

在数学能力的 AIME24 体育集上，以及评估代码能力的 LiveCodeBench 中，千问 QwQ-32B 测试表现与 DeepSeek-R1 相当，远胜于 o1-mini 及相同尺寸的 R1 后续模型；由 Meta 首席科学家杨立昆领衔的“最难 LLMs 体育排行榜” LiveBench、谷歌等提出的指令遵循能力IFEval体育集、由加州大学伯克利分校等提出的评估调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek- R1。

数学推理：采用逻辑链分解技术，解决复杂问题；

编程能力：支持代码生成与调试优化双路径；

通用智能：整合工具调用与环境交互能力，适应多场景需求。

2. 开源与部署优势

模型已全面开源，支持本地部署，消费级显卡即可运行。阿里云还提供更小版本（如QwQ-32B的轻量化变体），进一步降低使用门槛。

3. 技术背景

QwQ-32B基于**Qwen2.5-32B**模型通过强化学习优化而来，是通义千问系列的重要迭代成果。

该模型的发布被视为阿里云在AI推理领域的重要进展，兼顾高效性与实用性，为开发者提供了高性价比的开源选择。

通义千问CTO在内部信中透露：“QwQ-32B只是‘通天塔计划’的第一块基石。” 据知情人士爆料，阿里云正在秘密测试QwE-160B多模态版本，其图像生成质量据称已超越Midjourney V6。更值得关注的是，开源协议中暗藏“反哺条款”——商用利润超1亿美元的企业需反馈优化数据，这或将构建起全球最大的AI进化生态。

4、阿里股价应声大涨，AI军备竞赛升级

受开源消息刺激，港股阿里巴巴股价高开高走，一度涨超8%，现涨7.70%。

5、杀手锏：数据安全+零门槛商用，企业定制化神器

阿里云此次开源采用宽松的Apache2.0协议，企业可免费商用且无需开源衍生代码，这意味着：

数据主权保障：本地部署模式确保敏感数据无需上云，满足金融、医疗等高合规场景需求；

定制化革命：开发者可基于QwQ-32B快速打造专属AI客服、智能分析系统等解决方案。

DeepSeek最强对手来了！阿里巴巴QwQ-32B正式发布：更小尺寸消费级显卡即可部署

DeepSeek最强对手来了！阿里巴巴QwQ-32B正式发布：更小尺寸消费级显卡即可部署
打开 chat.qwen.ai ，左上角选择QwQ-32B-Preview

同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型 。 目前，QwQ-32B-Preview已经在（ chat.qwen.ai ）官网上线。

通义团队透露，下一步将探索万亿参数模型与多智能体协作框架，剑指通用人工智能（AGI）终极目标，分析师指出：QwQ-32B的发布标志着AI竞争进入"轻量化时代"，未来或将颠覆现有云计算商业模式。DeepSeek、Meta等厂商面临巨大压力，开源模型性能天花板再次被抬高。

全文完。更多资讯，尽在【老马那些事】↓↓↓

点击这里进入最强模型