专栏名称: 砺石商业评论
《砺石商业评论》是砺石商业旗下专注大公司报道的深度商业媒体,全网覆盖数百万商业精英,每日早7点与读者准时见面。砺石商业是由刘学辉先生创建的一家商业知识服务机构,下辖砺石商业评论、砺石咨询、砺石商业智库与砺石商业出版四大业务板块
目录
相关文章推荐
湖北经视  ·  痛别!乐坛传奇去世,他的歌家喻户晓 ·  8 小时前  
果壳  ·  抑郁的孩子艰难长大 ·  昨天  
湖北经视  ·  8岁以下,禁售! ·  2 天前  
湖北经视  ·  突发!雷军宣布大消息,瞬间爆了 ·  2 天前  
51好读  ›  专栏  ›  砺石商业评论

DeepSeek创始人:大部分中国公司习惯follow,而不是创新

砺石商业评论  · 公众号  ·  · 2025-02-13 10:31

正文


图片
图片

图片

如果不是DeepSeek的巨大成功,其创始人梁文锋的观点会让外界认为过于狂妄。但DeepSeek的成功,则证明了梁文锋这些观点背后的技术先见。

图片
梁文锋 | 作者
砺石 | 编辑

砺石商业评论 | 出品

整个2025年春节期间,DeepSeek的热度都一直不减。

DeepSeek的火爆,本质上还是超预期的产品体验带来的口碑裂变。这再次证明了,在真正的产品力面前,营销力不值一提。笔者在将DeepSeek与其他国产大模型进行细致对比后,最终不得不承认,DeepSeek是完全超越其他大模型一个时代的产品。

在任何一个杰出的产品背后,都离不开一个理想主义的创业者。例如,微信背后有中国最优秀的产品经理张小龙,《黑神话》背后有中国最优秀的游戏人冯骥。 DeepSeek也不例 外,其成功离不开核心创始人梁文锋。

根据公开资料显示,梁文锋出生于 1985年,今年将年满40周岁,他出生于广东省湛江市吴川市覃巴镇。 2002年,17岁的梁文锋以高考状元的身份考入浙江大学电子信息工程专业,2010年获得浙江大学信息与通信工程硕士学位。

2008年全球金融危机期间, 梁文锋开始 探索人工智能在全自动量化交易中的应用。2015年,他在杭州创立量化投资公司幻方量化,截至目前,资产管理规模突破千亿人民币大关。在 幻方量化的资金与团队支持下, 2023年7月,梁文锋又创建了专业的大模型公司DeepSeek,进军通用人工智能领域,并最终在大模型领域超越了中国所有的科技巨头,成为行业中最成功的技术领先者。

在网络上,关于梁文锋的公开报道并不多。但在 DeepSeek火爆之前,他曾接受过36氪旗下《暗涌》公众号的两篇深度专访,从这两篇颇为宝贵的专访中,我们可以清晰看出 无论是在技术洞见,还是理想主义的思维模式上,梁文锋确实与众不同。

例如,他坚定的称“我们要做的是 AG I 通用人工智能),不是简单应用 ,也不大是云服务”,他批评“ 大部分中国公司习惯follow,而不是创新”,他认为“ OpenAI不是神,不可能一直冲在前面”,他还犀利地指出,“ 中国AI和美国真实的gap是原创和模仿的差距”。如果不是 DeepSeek的巨大成功,梁文锋的上述观点会让外界认为过于狂妄,但 DeepSeek的成功,则证明了梁文锋这些观点背后的技术先见。

为了帮助读者更好的了解这位低调的新锐创业者, 我们专门汇总了其最核心的60条思考。这60条思考,一定程度上也可以帮助我们 更加直观的理解 DeepSeek 这家企业 脱颖而出的底层逻辑

DeepSeek创始人梁文锋的60条思考:

1.我们做大模型,跟量化和金融都没有直接关系。我们要做的是通用人工智能,也就是AG I。

2.语言大模型是通往AGI的必经之路,并且初步具备了AGI的特征,所以我们从这里开始。

3.我们不会过早设计基于模型的一些应用,会专注在大模型上。从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。我们的目标很明确,就是不做垂类和应用,而是做研究,做探索。

4.我们理解人类智能的本质就是语言,人的思维就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。

5.只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。

6.我们希望更多人,哪怕一个小App都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。大厂的模型,可能会和他们的平台或生态捆绑,而我们是完全自由的。

7.从商业角度来讲,基础研究是投入回报比很低的。我们比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。

8.从最早的1张卡,到2015年的100张卡、2019年的1000张卡,再到一万张,这个过程是逐步发生的。很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动,对AI能力边界的好奇。

9.对很多行外人来说,ChatGPT这波浪潮冲击特别大;但对行内人来说,2012年AlexNet带来的冲击已经引领一个新的时代。AlexNet的错误率远低于当时其他模型,复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的,特别是当2020年OpenAI发布GPT3后,方向很清楚,需要大量算力。那之后,我们有意识地去部署尽可能多的算力。

10.一件激动人心的事,不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。

11.人工成本是对未来的投资,是公司最大的资产。我们选的人相对朴实一点,有好奇心,来我们这里有机会去做研究。大厂很难单纯去做研究,做训练,它更多会是业务需求驱动。如果不能很快应用,大厂不一定能持续坚持,因为它更需要看到结果。

12.我们招人有条原则是,看能力,而不是看经验。如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性与热爱等更重要。

13.我们的核心技术岗位,基本以应届和毕业一两年的人为主。做一件事,有经验的人会不假思索告诉你,应该这样做,但没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。

14.我们招人的条件是热爱,这些人的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。

15.我们的考核标准和一般公司不太一样。我们没有KPI,也没有所谓的任务。

16.创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。我们交给员工重要的事,并且不干预他。让他自己想办法,自己发挥。

17.招人时确保价值观一致,然后通过企业文化来确保步调一致。当然,我们并没有一个成文的企业文化,因为所有成文的东西,又会阻碍创新。更多时候,是管理者的以身示范,遇到一件事,你如何做决策,会成为一种准则。

18.按照教科书的方法论来推导创业公司,在当下,他们做的事,都是活不下来的。但市场是变化的,真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。很多大公司的组织结构已经不能快速响应和快速做事,而且他们很容易让之前的经验和惯性成为束缚,而这波AI新浪潮之下,一定会有一批新公司诞生。






请到「今天看啥」查看全文