哈哈,终于来了!最好的圣诞礼物
#AI创造营#
#ai#
Deepseek V3 开源
在 aider 多语言编程测评超过了 Claude 3.5 sonnet V2
Deepseek V2.5 的时候成功率只有 17%,现在暴增到了 48% !
采用 685B 参数的 MoE 架构
包含 256 个专家,使用 sigmoid 路由方式,每次选取前 8 个专家 (topk=8)
这里下载:huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main
Deepseek V3 开源
在 aider 多语言编程测评超过了 Claude 3.5 sonnet V2
Deepseek V2.5 的时候成功率只有 17%,现在暴增到了 48% !
采用 685B 参数的 MoE 架构
包含 256 个专家,使用 sigmoid 路由方式,每次选取前 8 个专家 (topk=8)
这里下载:huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main