专栏名称: AINLPer

一个专注自然语言处理（NLP）方向的公众号。机器学习（ML）、深度学习（DL）、自然语言处理相关模型理解、热门论文（Paper）分享分析、pytorch、C++、Python、Java ...

目录

相关文章推荐

51好读 › 专栏 › AINLPer

DeepSeek | DeepSeek-V3新版本模型，升级能力速览！

AINLPer · 公众号 · 科技自媒体 · 2025-03-26 22:09

正文

请到「今天看啥」查看全文

点击下方 “ AINLPer “ ，添加关注

更多干货，第一时间送达

引言

DeepSeek-V3新版本：DeepSeek-V3-0324昨夜悄悄上线了。参数量685B的V3，代码数学推理再次显著提升，甚至代码追平Claude 3.7。链接：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

更多精彩内容 --> 专注大模型/AIGC、Agent、RAG等学术前沿分享！

参数量与性能提升

参数量 ：DeepSeek-V3-0324的参数量达到685B，相比上一版本671B略有增加。
代码能力 ：代码生成和理解能力显著提升，能够与Claude 3.7 Sonnet相媲美，甚至在某些任务上超越了DeepSeek R1和GPT-4.5。
数学推理能力 ：数学推理能力大幅提升，能够解决一些复杂的数学问题，甚至包括一些原本只有推理模型才能处理的问题，如“4升水壶问题”。

开源与灵活性

开源协议 ：采用MIT开源协议，相比上一版本的自定义许可证更加开放。用户可以自由修改、分发模型，还支持模型蒸馏和商业化应用。
模型文件 ：模型文件总计641GB，主要以 .safetensors 格式存在，便于用户下载和使用。

运行效率与设备兼容性

量化技术 ：通过4-bit量化技术，模型的磁盘占用空间减少到352GB，大大降低了存储需求。
消费级设备支持 ：在苹果M3 Ultra上，通过MLX框架实现了超过20 token/s的运行速度，表明该模型可以在消费级设备上高效运行。
体验平台 ：除了本地运行，用户还可以通过OpenRouter平台体验DeepSeek-V3-0324。

多语言能力

多语言基准测试 ：在Aider的多语言基准测试中，DeepSeek-V3-0324取得了55%的成绩，较前代版本显著提升，成为仅次于Sonnet 3.7的非推理类模型第二名。

特定任务表现

物理模拟 ：在20个小球碰撞测试中，DeepSeek-V3-0324的表现优于上一版本，物理模拟能力有所提升。
数学竞赛 ：能够顺利解决AIME 2025中的数学题目，显示出较强的数学解题能力。
网页生成 ：能够根据简短的提示词生成完整的HTML5网页代码，前端开发能力显著增强。

猜想

基础架构 ：DeepSeek-V3-0324很可能是DeepSeek-R2的基础架构，预计几周后将推出专门的推理增强版。
行业影响 ：DeepSeek的这种快速迭代和开源策略，可能会对全球AI格局产生深远影响，推动开源模型的发展，缩小中美AI能力差距。

更多精彩内容-->

专注大模型/AIGC、Agent、RAG等学术前沿分享！

推荐阅读

[1] 盘点一下！大模型Agent“花式玩法”

[2] 一文带了解：含DeepSeek MoE

[3] 2025年的风口！| 万字长文纵观大模型Agent！

[4]2万字长文！一文了解Attention，非常详细！

[5]每周速递44期！大模型最前沿！

欢迎投稿或寻求报道，联系：ainlperbot

「资料整理不易，点个 再看、赞 吧」

请到「今天看啥」查看全文

推荐文章

风青杨 · 决定结婚前，请先好好问自己这15个问题

8 年前

史事挖掘机 · 一个官员为讨小老婆为何致大明王朝覆灭

8 年前

枕边阅读 · 朋友圈里那些让人泪奔的瞬间

7 年前

她读 · 如果夏天只能买一双凉鞋，我肯定选它

7 年前

广电时评 · 正剧回温，历史剧如何赢得年轻人青睐？

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!