突然爆火，超越ChatGPT！AI界的“拼多多”DeepSeek登顶，“引起硅谷恐慌”

东方网 · 公众号 · 上海 · 2025-01-27 13:55

正文

近日，国产AI DeepSeek在中国、美国的科技圈受到广泛关注，甚至被认为是大模型行业的最大“黑马”，在外网，DeepSeek被不少人称为“神秘的东方力量”。

27日，DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜，在美区下载榜上超越了ChatGPT。

△ 苹果美国区应用商店

△ 苹果APP Store中国区免费榜

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。

△DeepSeek-R1 API价格。图源：澎湃新闻

去年12月DeepSeek-V3发布后，AI数据服务公司Scale AI创始人Alexander Wang就发贴称，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。”

不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型。

据DeepSeek介绍，其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

这一模型发布后，引发了海外AI圈众多科技大佬的讨论。例如，英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示：“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。”

CNBC则称：“一家鲜为人知的中国人工智能实验室发布了人工智能模型，尽管其搭建成本更低，但性能却超越美国最好的人工智能模型，这引发了整个硅谷的恐慌。”

△图源：证券时报

1月24号，一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称，现在Meta内部因为DeepSeek的模型，已经进入恐慌模式。

这位Meta员工写道：

“一切源于DeepSeek-V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，一家‘仅用550万美元训练预算的中国公司’就做到了这一点。

工程师们正在争分夺秒地分析DeepSeek，试图复制其中的一切可能技术。这绝非夸张。

管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本，而且这样的高管还有数十位，他们该如何向高层交代？

DeepSeek-R1的出现让情况更加严峻。具体细节属于机密，不便透露，不过很快就会公开了。”

DeepSeek之所以能取得这些创新并非一日之功，而是“孵化”数年之久，长期谋划后的结果。DeepSeek创始人梁文锋也是头部量化私募幻方量化的创始人。Deepseek充分利用了其幻方量化积累的资金、数据和卡。

梁文锋本科、研究生毕业于浙江大学，拥有信息与电子工程学系本科和硕士学位。2008年起，他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月，DeepSeek正式成立，进军通用人工智能领域，至今从未对外融资。

此前，OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇用了“一批高深莫测的奇才”，对此，梁文峰在接受自媒体采访时曾透露过，并没有什么高深莫测的奇才，都是来自Top高校的毕业生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人。

从目前已有的媒体公开报道中可以看出，DeepSeek团队最大的特点是名校、年轻，即使是团队Leader级别，年纪也多在35岁以下。不到140人的团队，工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校，工作时间都不长。

据广州日报报道，“DeepSeek爆火的原因主要可以归结为两点：性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称，R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注，也让投资界看到了其巨大的商业潜力。

更为关注的是，DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元，仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时，DeepSeek公布了API的定价，每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一，也因此，DeepSeek被称为AI界的“拼多多”。

郑磊直言，DeepSeek对硬件市场产生了重大影响，因为它可能会降低人工智能模型的硬件成本，从而推动人工智能技术的发展。

26日，DeepSeek出现了短时闪崩现象。不少网友反映，使用时遇到 “服务器繁忙” 的提示。对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一时无法满足大量用户的并发需求。不过，官方状态页并未将这一事件标记为事故。

1月26日，游戏科学创始人、CEO，《黑神话：悟空》制作人冯骥评价DeepSeek：可能是个国运级别的科技成果。

冯骥表示：“希望DeepSeek R1会让你对当前最先进的AI祛魅，让AI逐渐变成你生活中的水和电。太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步。”

来源：东方网综合中国新闻社、九派新闻、每日经济新闻、证券时报、澎湃新闻、界面新闻、广州日报等

编辑：夏小夏、小能手

审稿：钱程灿