主要观点总结
文章介绍了DeepSeek模型的开发时间线,包括公司成立、模型发布和应用成效等关键事件。
关键观点总结
关键观点1: DeepSeek公司成立及首个开源代码大模型发布
2023年7月17日DeepSeek公司成立,并于2023年10月28日推出首个开源代码大模型DeepSeek-Coder。
关键观点2: DeepSeek-Coder的发布及支持多种编程语言
2023年11月2日发布的DeepSeek Coder支持多种编程语言的代码生成和调试。
关键观点3: 通用大模型DeepSeek-LLM的发布
2023年11月29日发布了参数规模达670亿的通用大模型DeepSeek-LLM,包括不同版本的base及chat模型。
关键观点4: DeepSeek-V3的发布及基于混合专家架构的特点
2024年12月26日发布的DeepSeek-V3基于混合专家(MoE)架构,参数量高达671B。
关键观点5: DeepSeek高性能AI推理模型的发布及行业应用成效
DeepSeek在成立后短时间内不断推出和更新多个高性能模型,并于2025年发布高性能AI推理模型DeepSeek-R1,性能直逼OpenAI的GPT-4。随后,DeepSeek的模型在多个行业应用中取得显著成效。
正文
DeepSeek模型的开发时间线如下:
2023年7月17日 :DeepSeek公司成立。
2023年10月28日 :推出首个开源代码大模型DeepSeek-Coder。
2023年11月2日 :发布首个开源模型DeepSeek Coder,支持多种编程语言的代码生成和调试。
2023年11月29日 :发布参数规模达670亿的通用大模型DeepSeek-LLM,包括7B和67B的base及chat版本。
2024年12月26日 :发布DeepSeek-V3,基于混合专家(MoE)架构,参数量高达671B。
2025年1月20日 :发布高性能AI推理模型DeepSeek-R1,性能直逼OpenAI的GPT-4,并支持开源和免费商用。
2025年2月4日 :DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区。
2025年2月9日 :DeepSeek-R1等模型在多个行业应用中取得显著成效。
DeepSeek自成立到推出首个重要模型DeepSeek-Coder仅用了几个月时间,随后在短时间内不断推出和更新多个高性能模型,展示了其在AI领域的快速发展和创新能力。