阿里开源 QwQ-32B-Preview 推理模型。
#ai#
GPQA:65.2%,研究生水平的科学推理能力;
AIME:50.0%,强大的数学问题解决技能;
MATH-500:90.6%,在各类数学主题上的全面理解;
LiveCodeBench:50.0%,在实际编程场景中出色表现。
不过文档里也列出了现在得一些缺陷,现在是人手一个推理模型。
博客: 网页链接
GPQA:65.2%,研究生水平的科学推理能力;
AIME:50.0%,强大的数学问题解决技能;
MATH-500:90.6%,在各类数学主题上的全面理解;
LiveCodeBench:50.0%,在实际编程场景中出色表现。
不过文档里也列出了现在得一些缺陷,现在是人手一个推理模型。
博客: 网页链接