专栏名称: 老马那些事
我们只关注与马云有关资讯,全面解读马云投资、融资、并购等动态,以及有关于马云从创业到阿里帝国的历程。
目录
相关文章推荐
51好读  ›  专栏  ›  老马那些事

320亿参数干翻6710亿!阿里开源QwQ-32B:消费级显卡就能跑,附免费商用及网址

老马那些事  · 公众号  ·  · 2025-03-06 19:30

正文

请到「今天看啥」查看全文


当大多数人还在沉睡时,阿里巴巴突然向全球开发者抛出一枚“技术炸弹”——通义千问团队宣布正式开源QwQ-32B模型。

阿里通义团队表示,QwQ-32B模型拥有320亿参数,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。在冷启动的基础上,模型针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。

QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。

1.模型性能与参数规模

QwQ-32B拥有**320亿参数**,但性能可媲美参数规模更大的DeepSeek-R1模型(6710亿参数,其中370亿被激活)。通过大规模强化学习训练,其数学推理、代码生成及通用智能能力实现显著提升。

image.png

在数学能力的 AIME24 体育集上,以及评估代码能力的 LiveCodeBench 中,千问 QwQ-32B 测试表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 后续模型;由 Meta 首席科学家杨立昆领衔的“最难 LLMs 体育排行榜” LiveBench、谷歌等提出的指令遵循能力IFEval体育集、由加州大学伯克利分校等提出的评估调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

数学推理: 采用逻辑链分解技术,解决复杂问题;

编程能力: 支持代码生成与调试优化双路径;

通用智能: 整合工具调用与环境交互能力,适应多场景需求。

2. 开源与部署优势

模型已全面开源,支持本地部署,消费级显卡即可运行。阿里云还提供更小版本(如QwQ-32B的轻量化变体),进一步降低使用门槛。

3. 技术背景

QwQ-32B基于**Qwen2.5-32B**模型通过强化学习优化而来,是通义千问系列的重要迭代成果。

该模型的发布被视为阿里云在AI推理领域的重要进展,兼顾高效性与实用性,为开发者提供了高性价比的开源选择。

通义千问CTO在内部信中透露:“QwQ-32B只是‘通天塔计划’的第一块基石。” 据知情人士爆料,阿里云正在秘密测试QwE-160B多模态版本,其图像生成质量据称已超越Midjourney V6。更值得关注的是,开源协议中暗藏“反哺条款”——商用利润超1亿美元的企业需反馈优化数据,这或将构建起全球最大的AI进化生态。

4、阿里股价应声大涨,AI军备竞赛升级


受开源消息刺激,港股阿里巴巴股价高开高走,一度涨超8%,现涨7.70%。
5、杀手锏:数据安全+零门槛商用,企业定制化神器

阿里云此次开源采用宽松的Apache2.0协议 ,企业可免费商用且无需开源衍生代码,这意味着:

数据主权保障:本地部署模式确保敏感数据无需上云,满足金融、医疗等高合规场景需求;
定制化革命:开发者可基于QwQ-32B快速打造专属AI客服、智能分析系统等解决方案。

DeepSeek最强对手来了!阿里巴巴QwQ-32B正式发布:更小尺寸 消费级显卡即可部署

DeepSeek最强对手来了!阿里巴巴QwQ-32B正式发布:更小尺寸 消费级显卡即可部署
打开 chat.qwen.ai ,左上角选择QwQ-32B-Preview

同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型 目前,QwQ-32B-Preview已经在( chat.qwen.ai )官网上线。

通义团队透露,下一步将探索万亿参数模型与多智能体协作框架,剑指通用人工智能(AGI)终极目标,分析师指出:QwQ-32B的发布标志着AI竞争进入"轻量化时代",未来或将颠覆现有云计算商业模式。DeepSeek、Meta等厂商面临巨大压力,开源模型性能天花板再次被抬高。

全文完。更多资讯,尽在【老马那些事 】↓↓↓
点击 这里 进入最强模型







请到「今天看啥」查看全文