专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

目录

相关文章推荐

爱可可-爱生活 · 通俗版解读查看图片-20250130061221 · 19 小时前

人工智能那点事 · 所有人都在讨论的“DeepSeek”，究竟是啥？ · 2 天前

爱可可-爱生活 · 【[30星]Baichuan-Omni-1. ... · 3 天前

爱可可-爱生活 · 本文提出了一种利用大型语言模型微调API的新 ... · 3 天前

黄建同学 · 终极上可能每人都会有一个自己的私人AI+大模 ... · 4 天前

51好读 › 专栏 › 量子位

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

量子位 · 公众号 · AI · 2025-01-29 11:25

正文

西风梦晨发自凹非寺
量子位 | 公众号 QbitAI

昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～

就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹：

Qwen2.5-Max来袭，多个基准测试中超越当红炸子鸡DeepSeek V3。

Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下，Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o，和Claude-3.5-Sonnet也能比一比。

基座模型对比中，Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B，在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

更令AI社区关注的是，Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型，经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。

Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek，还有阿里通义Qwen，网友们不忘艾特奥特曼：

祝大家新年快乐，特别祝Sam。

阿里研究员在模型发布后也都还不睡，纷纷当起了自个儿的自来水。

阿里高级算法专家林俊旸开麦：

Qwen2.5-Max在基准测试中表现良好，希望大家可以试试看，新年快乐！

之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身：

外面的烟花照亮了天空，我却坐在电脑跟前。

多模态能力展示

下面是Qwen2.5-Max在四个使用场景上的演示。

首先是联网搜索功能，输出的每句话来源出处都有标注，整体运行也很丝滑。

代码能力上，Qwen2.5-Max能够帮助用户完成各种可视化创作，一句话就能做出下面这样旋转的球体：

有网友改造了一下，让球体内部有三个弹跳的黄色小球。

结果只尝试了一次就成功了，而且三个小球始终在大球内部运动，能正确处理碰撞：

Qwen2.5-Max也有Artifacts功能，同样一句话，能开发各种小应用、小游戏。

比如制作一个扫雷小游戏，秒秒钟“啪”一下直接就能玩：

另外Qwen2.5-Max数单词中的特定字母数量也不在话下。

现在，Qwen2.5-Max已在Qwen Chat中上线。

此外也有Hugging Face的Demo可玩，还上线了Any Chat，并且可通过阿里云服务使用API。

感兴趣的童鞋赶紧试试吧～

参考链接：
[1]https://qwenlm.github.io/blog/qwen2.5-max/
[2]https://x.com/JustinLin610/status/1884263803451498794
[3]https://x.com/_akhaliq/status/1884278071093502253
[4]https://x.com/huybery/status/1884263539675934860

— 完 —

量子位智库年终发布三大年度报告！

带你一起回顾2024年人工智能、智能驾驶、Robotaxi新趋势，预见2025年科技行业新机遇！

2024年度AI十大趋势报告

Robotaxi2024年度格局报告

智能驾驶2024年度报告

一键关注 👇 点亮星标

科技前沿进展每日见

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

推荐文章

爱可可-爱生活 · 通俗版解读查看图片-20250130061221

19 小时前

人工智能那点事 · 所有人都在讨论的“DeepSeek”，究竟是啥？

2 天前

爱可可-爱生活 · 【[30星]Baichuan-Omni-1.5：一个支持文本、图-20250127181859

3 天前

爱可可-爱生活 · 本文提出了一种利用大型语言模型微调API的新型灰盒攻击方法，通过-20250127061027

3 天前

黄建同学 · 终极上可能每人都会有一个自己的私人AI+大模型//@观察家家中观-20250126221821

4 天前

这届百度公关 · 建议把3月16日设定为公关节，大家资辞不资辞？｜这届百度公关

7 年前

瞭望智库 · 疯狂楼市必杀技

7 年前

IT之家 · 黑客气到吐血！全球勒索病毒Petya只收到7500美元赎金

7 年前

金融行业网 · 买一套300万的房子，我们给国家创造了多少钱？

7 年前

大呲花 · 世界上最笨的贼，砸了半天...

7 年前

Sov5搜索 · 小百科 · 移动版

51好读 - 好文章就要读起来!