专栏名称: 图灵人工智能

人工智能及其他科技学术前沿、机器学习、图像识别、语音识别、自动驾驶、自然语言处理、脑机接口、云计算、大数据、物联网、机器人、天文物理、生物科学、数学、区块链、比特币、计算机等学术前沿知识、报告、讲座等介绍。

DeepSeek究竟创新了什么？

图灵人工智能 · 公众号 · · 2025-02-25 00:00

正文

点击上方“ 图灵人工智能 ”，选择“星标”公众号

您想知道的人工智能干货，第一时间送达

转自财经杂志，版权属于原作者，仅用于学术分享，如有侵权留言删除

人工智能正处于创新爆发期，唯有持续创新，才能留在舞台中心

文｜《财经》执行主编马克

人工智能简史

DeepSeek创新了什么？

如今，DeepSeek又成了挑战者，它真的已经超越OpenAI了吗？并非如此。 DeepSeek在局部超过了OpenAI的水平，但整体而言OpenAI仍然领先。

先来看双方的基础大模型，OpenAI是2024年5月发布的GPT4-o，DeepSeek是2024年12月26日发布的V3。斯坦福大学基础模型研究中心有个全球大模型综合排名，最新排名是今年1月10日，一共六个指标，各指标得分加总后，DeepSeek V3总分4.835，名列第一；GPT4-o（5月版）总分4.567，仅列第六。第二到第五名都是美国模型，第二名是Claude 3.5 Sonnet，总分4.819，开发这个模型的Anthropic公司2021年2月才成立。

★算法环节：新的强化学习算法GRPO。

强化学习的目的是让计算机在没有明确人类编程指令的情况下自主学习、自主完成任务，是通往通用人工智能的重要方法。强化学习起初由谷歌引领，训练AlphaGo时就使用了强化学习算法，但是OpenAI后来居上，2015年和2017年接连推出两种新算法TRPO（Trust Region Policy Optimization，信任区域策略优化）和PPO （Proximal Policy Optimization，近端策略优化），DeepSeek更上层楼，推出新的强化学习算法GRPO（ Group Relative Policy Optimization 组相对策略优化），在显著降低计算成本的同时，还提高了模型的训练效率。

（GRPO算法公式。Source：DeepSeek-R1论文）

DeepSeek能否持续创新？

当然，中国也不是DeepSeek一家在战斗，中国也有众多优秀人工智能公司。 事实上，这些年来全球人工智能一直是中美双峰并峙，只是美国那座峰更高一些。

尽管如此， 我对梁文峰和DeepSeek团队仍有信心。 从梁文峰为数不多的采访中可以看出，他是一个既充满理想主义，又脚踏实地、有敏锐商业头脑的人。他自己肯定懂技术，但应该不是技术天才，他有可能是乔布斯、马斯克那样能把技术天才聚集在一起做出伟大产品的技术型企业家。

梁文峰在接受《暗涌》专访时说：“我们的核心技术岗位，基本以应届和毕业一两年的人为主。我们选人的标准一直都是热爱和好奇心。招人时确保价值观一致，然后通过企业文化来确保步调一致。”

“最重要的是参与到全球创新的浪潮里去。过去三十多年IT浪潮里，我们基本没有参与到真正的技术创新里。大部分中国公司习惯follow（追随），而不是创新。中国AI和美国真正的gap（差距）是原创和模仿。如果这个不改变，中国永远只能是追随者。”

“ 创新首先是一个信念问题。为什么硅谷那么有创新精神？首先是敢。我们在做最难的事。对顶级人才吸引最大的，肯定是去解决世界上最难的问题。 ”

乔布斯有句名言：只有疯狂到认为自己可以改变世界的人才能改变世界。从梁文峰身上，我看到了这句话的影子。

但是，我们对中国AI超越美国千万不能盲目乐观，DeepSeek并没有颠覆算力算法数据三要素的大模型发展路径，DeepSeek的很多创新都是因为芯片受限而不得不为，比如英伟达H100的通信带宽是每秒900GB,H800就只有每秒400GB，但DeepSeek只能用H800来训练模型。

这些天我看了大量太平洋两岸对DeepSeek的评论， “necessity is the mother of invention（迫不得已是创新之母）” ，这句源自古希腊的谚语被不同的牛人说了好几次。但是反过来想，DeepSeek能与OpenAI的同款产品打成平手，靠的是用逼出来的算法优势弥补算力劣势，可对手已被点醒，如果他们开发出同样好的算法，再加上更好的芯片，那中美大模型的差距是否会再次扩大？

另一方面，虽然DeepSeek已可适配国产芯片，但考虑到性能差距，算力劣势短期内无解。除非我们能再现电动车反转燃油车的场面，实现换道超车。比如，用量子芯片替代硅基芯片。

陷入这种思考真是一个悲剧—— 技术创新本应造福全人类，却被地缘政治因素扭曲。所以，我们更应该为DeepSeek坚决走开源路线而鼓掌。

文章精选：

1. 万字长文详解DeepSeek-R1模型工作原理

2. 巴黎AI峰会，斯坦福教授李飞飞演讲：当前才是"首个真正的AI时代"

DeepSeek究竟创新了什么？

正文

请到「今天看啥」查看全文