专栏名称: 砺石商业评论

《砺石商业评论》是砺石商业旗下专注大公司报道的深度商业媒体，全网覆盖数百万商业精英，每日早7点与读者准时见面。砺石商业是由刘学辉先生创建的一家商业知识服务机构，下辖砺石商业评论、砺石咨询、砺石商业智库与砺石商业出版四大业务板块

DeepSeek创始人：大部分中国公司习惯follow，而不是创新

砺石商业评论 · 公众号 · · 2025-02-13 10:31

正文

如果不是DeepSeek的巨大成功，其创始人梁文锋的观点会让外界认为过于狂妄。但DeepSeek的成功，则证明了梁文锋这些观点背后的技术先见。

梁文锋 | 作者

砺石 | 编辑

砺石商业评论 | 出品

在整个2025年春节期间，DeepSeek的热度都一直不减。

DeepSeek的火爆，本质上还是超预期的产品体验带来的口碑裂变。这再次证明了，在真正的产品力面前，营销力不值一提。笔者在将DeepSeek与其他国产大模型进行细致对比后，最终不得不承认，DeepSeek是完全超越其他大模型一个时代的产品。

在任何一个杰出的产品背后，都离不开一个理想主义的创业者。例如，微信背后有中国最优秀的产品经理张小龙，《黑神话》背后有中国最优秀的游戏人冯骥。 DeepSeek也不例外，其成功离不开核心创始人梁文锋。

根据公开资料显示，梁文锋出生于 1985年，今年将年满40周岁，他出生于广东省湛江市吴川市覃巴镇。 2002年，17岁的梁文锋以高考状元的身份考入浙江大学电子信息工程专业，2010年获得浙江大学信息与通信工程硕士学位。

2008年全球金融危机期间，梁文锋开始探索人工智能在全自动量化交易中的应用。2015年，他在杭州创立量化投资公司幻方量化，截至目前，资产管理规模突破千亿人民币大关。在幻方量化的资金与团队支持下， 2023年7月，梁文锋又创建了专业的大模型公司DeepSeek，进军通用人工智能领域，并最终在大模型领域超越了中国所有的科技巨头，成为行业中最成功的技术领先者。

在网络上，关于梁文锋的公开报道并不多。但在 DeepSeek火爆之前，他曾接受过36氪旗下《暗涌》公众号的两篇深度专访，从这两篇颇为宝贵的专访中，我们可以清晰看出无论是在技术洞见，还是理想主义的思维模式上，梁文锋确实与众不同。

例如，他坚定的称“我们要做的是 AG I （通用人工智能），不是简单应用，也不大是云服务”，他批评“ 大部分中国公司习惯follow，而不是创新”，他认为“ OpenAI不是神，不可能一直冲在前面”，他还犀利地指出，“ 中国AI和美国真实的gap是原创和模仿的差距”。如果不是 DeepSeek的巨大成功，梁文锋的上述观点会让外界认为过于狂妄，但 DeepSeek的成功，则证明了梁文锋这些观点背后的技术先见。

为了帮助读者更好的了解这位低调的新锐创业者，我们专门汇总了其最核心的60条思考。这60条思考，一定程度上也可以帮助我们更加直观的理解 DeepSeek 这家企业脱颖而出的底层逻辑。

DeepSeek创始人梁文锋的60条思考：

1.我们做大模型，跟量化和金融都没有直接关系。我们要做的是通用人工智能，也就是AG I。

2.语言大模型是通往AGI的必经之路，并且初步具备了AGI的特征，所以我们从这里开始。

3.我们不会过早设计基于模型的一些应用，会专注在大模型上。从长期看，大模型应用门槛会越来越低，初创公司在未来20年任何时候下场，也都有机会。我们的目标很明确，就是不做垂类和应用，而是做研究，做探索。

4.我们理解人类智能的本质就是语言，人的思维就是一个语言的过程。你以为你在思考，其实可能是你在脑子里编织语言。这意味着，在语言大模型上可能诞生出类人的人工智能（AGI）。

5.只做复刻的话，可以在公开论文或开源代码基础上，只需训练很少次数，甚至只需finetune（微调）一下，成本很低。而做研究，要做各种实验和对比，需要更多算力，对人员要求也更高，所以成本更高。

6.我们希望更多人，哪怕一个小App都可以低成本去用上大模型，而不是技术只掌握在一部分人和公司手中，形成垄断。大厂的模型，可能会和他们的平台或生态捆绑，而我们是完全自由的。

7.从商业角度来讲，基础研究是投入回报比很低的。我们比较确定的是，既然我们想做这个事，又有这个能力，这个时间点上，我们就是最合适人选之一。

8.从最早的1张卡，到2015年的100张卡、2019年的1000张卡，再到一万张，这个过程是逐步发生的。很多人会以为这里边有一个不为人知的商业逻辑，但其实，主要是好奇心驱动，对AI能力边界的好奇。

9.对很多行外人来说，ChatGPT这波浪潮冲击特别大；但对行内人来说，2012年AlexNet带来的冲击已经引领一个新的时代。AlexNet的错误率远低于当时其他模型，复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变，但模型、数据和算力这三者的组合是不变的，特别是当2020年OpenAI发布GPT3后，方向很清楚，需要大量算力。那之后，我们有意识地去部署尽可能多的算力。

10.一件激动人心的事，不能单纯用钱衡量。就像家里买钢琴，一来买得起，二来是因为有一群急于在上面弹奏乐曲的人。

11.人工成本是对未来的投资，是公司最大的资产。我们选的人相对朴实一点，有好奇心，来我们这里有机会去做研究。大厂很难单纯去做研究，做训练，它更多会是业务需求驱动。如果不能很快应用，大厂不一定能持续坚持，因为它更需要看到结果。

12.我们招人有条原则是，看能力，而不是看经验。如果追求短期目标，找现成有经验的人是对的。但如果看长远，经验就没那么重要，基础能力、创造性与热爱等更重要。

13.我们的核心技术岗位，基本以应届和毕业一两年的人为主。做一件事，有经验的人会不假思索告诉你，应该这样做，但没有经验的人，会反复摸索、很认真去想应该怎么做，然后找到一个符合当前实际情况的解决办法。

14.我们招人的条件是热爱，这些人的热情通常会表现出来，因为他真的很想做这件事，所以这些人往往同时也在找你。

15.我们的考核标准和一般公司不太一样。我们没有KPI，也没有所谓的任务。

16.创新需要尽可能少的干预和管理，让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的，不是刻意安排的，更不是教出来的。我们交给员工重要的事，并且不干预他。让他自己想办法，自己发挥。

17.招人时确保价值观一致，然后通过企业文化来确保步调一致。当然，我们并没有一个成文的企业文化，因为所有成文的东西，又会阻碍创新。更多时候，是管理者的以身示范，遇到一件事，你如何做决策，会成为一种准则。

18.按照教科书的方法论来推导创业公司，在当下，他们做的事，都是活不下来的。但市场是变化的，真正的决定力量往往不是一些现成的规则和条件，而是一种适应和调整变化的能力。很多大公司的组织结构已经不能快速响应和快速做事，而且他们很容易让之前的经验和惯性成为束缚，而这波AI新浪潮之下，一定会有一批新公司诞生。

DeepSeek创始人：大部分中国公司习惯follow，而不是创新

正文

请到「今天看啥」查看全文