专栏名称: Linux就该这么学
专注于Linux运维技术培训,让您学习的每节课都有所收获,订阅本号后可每天获得最新Linux运维行业资讯、最实用的Linux免费教程以及独家Linux考证资料,三十多万技术小伙伴的选择,Linux就该这么学!
目录
相关文章推荐
Linux就该这么学  ·  国内最流行 8 款网络监控工具,网工必备! ·  昨天  
Linux就该这么学  ·  谷歌安卓原生 Linux Terminal ... ·  昨天  
Linux爱好者  ·  北京大学出的第四份 DeepSeek ... ·  3 天前  
Linux就该这么学  ·  分库分表,可能真的要退出历史舞台了! ·  2 天前  
Linux就该这么学  ·  火狐浏览器 Firefox 136 ... ·  2 天前  
51好读  ›  专栏  ›  Linux就该这么学

史无前例!DeepSeek 最强杀手正式发布

Linux就该这么学  · 公众号  · linux  · 2025-03-08 08:02

正文

转自:快科技

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。 如今,DeepSeek诞生以来最强的对手,它来了!

DeepSeek最强对手来了!阿里巴巴QwQ-32B正式发布:更小尺寸 消费级显卡即可部署

阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布, 比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。

据了解,通过大规模强化学习, 千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。

而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前, 阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。

DeepSeek最强对手来了!阿里巴巴QwQ-32B正式发布:更小尺寸 消费级显卡即可部署

DeepSeek最强对手来了!阿里巴巴QwQ-32B正式发布:更小尺寸 消费级显卡即可部署
打开 chat.qwen.ai ,左上角选择QwQ-32B-Preview

同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型 目前,QwQ-32B-Preview已经在( chat.qwen.ai )官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。

而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。

DeepSeek最强对手来了!阿里巴巴QwQ-32B正式发布:更小尺寸 消费级显卡即可部署

规模上, QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

测试结果显示, 在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外, Qwen团队还通过展示了一段简短的示例代码 ,说明如何通过API使用 QwQ-32B。

Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响, 阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

DeepSeek最强对手来了!阿里巴巴QwQ-32B正式发布:更小尺寸 消费级显卡即可部署







请到「今天看啥」查看全文