文章主要介绍了DeepSeek创始人梁文锋对DeepSeek的愿景与使命、创新、竞争、开源、创新的组织与文化等五个方面的深度思考。文章还包含对技术突破、商业逻辑、行业竞争、人才战略等方面的讨论。
DeepSeek的目标是实现AGI(通用人工智能),希望更多人能够低成本地用上大模型,API和AI都应该是普惠的。
创新需要自由发挥的空间和试错机会,缺乏信心和不知道如何组织高密度的人才实现有效的创新是当前的难题。创新不完全是商业驱动的,还需要好奇心和创造欲。中国AI的发展需要像西方技术社区那样的生态。
思考的原点是能否让社会运行效率变高以及能否在产业分工链条上找到擅长的位置。市场是变化的,真正的决定力量是适应和调整变化的能力。
在颠覆性的技术面前,闭源形成的护城河是短暂的。开源更像是一个文化行为,而非商业行为,给予是一种额外的荣誉。
创新的组织文化是能吸引顶尖人才的护城河。招人有原则是看能力而不是经验。顶尖人才在中国是被系统性低估的。
提示:关注"远见财金" ,阅读精彩文章因公众号推送规则改变, 只有星标(点上方蓝字远见财金→点右上角". . ."→选设为星标)本号及下方副号卡片, 才能正常收到推文。星标能让我们更好地遇见,您的点赞、在看和分享都能拉近我们的距离。
副号荐读:(更多好文请关注上方名片)
能做出非凡之业的人,其思维和认知也一定有非凡之处。震撼中外的DeepSeek的创始人梁文锋亦是如此。正如一位网友的评价:他的思维高度,国内只在任正非身上见到,了不起!
这评价或许有一定的过誉成分,但也并非仅仅是跟风夸奖。今天,我们从暗涌主笔于丽丽于2023年5月和2024年7月发表的两篇专访《疯狂的幻方:一家隐形AI巨头的大模型之路》和《揭秘DeepSeek:一个更极致的中国技术理想主义故事》梳理出DeepSeek创始人梁文锋对DeepSeek的愿景与使命、创新、竞争、开源、创新的组织与文化等五个方面的深度思考,共30条精要观点,堪称字字珠玑,供朋友们研究参阅。1. 提供云服务不是我们的主要目标。我们的目标还是去实现AGI(通用人工智能)。2. 我们希望更多人,哪怕一个小APP都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。
无论API,还是AI,都应该是普惠的、人人可以用得起的东西。3. 创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。4. 我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。5. 过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。6. 中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。7. 我觉得创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信。这种信心通常在年轻人身上更明显。
8. 现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。
随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。
9. 中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。10. 更多的投入并不一定产生更多的创新。否则大厂可以把所有的创新包揽了。11.(关于竞争,思考的原点)我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。12. 所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。13. 大厂也没有明显占优。大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。14. 技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。15. 市场是变化的。真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。很多大公司的组织结构已经不能快速响应和快速做事,而且他们很容易让之前的经验和惯性成为束缚,而这波AI新浪潮之下,一定会有一批新公司诞生。16. 在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。17. 开源,发论文,其实并没有失去什么。对于技术人员来说,被follow是很有成就感的事。其实,开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。18. 我们不会闭源。我们认为先有一个强大的技术生态更重要。19. 其实从最早的1张卡,到2015年的100张卡、2019年的1000张卡,再到一万张,这个过程是逐步发生的。几百张卡之前,我们托管在IDC,规模再变大时,托管就没法满足要求了,就开始自建机房。很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动。
20. 一件激动人心的事,或许不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。
21.(搭一个计算机集群)人工成本不低,但人工成本也是对未来的投资,是公司最大的资产。我们选的人也会相对朴实一点,有好奇心,来这里有机会去做研究。
22. 如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。从这个角度看,国内合适的候选人就不少。23. 不一定是做过这件事的人才能做这件事。幻方招人有条原则是,看能力,而不是看经验。我们的核心技术岗位,基本以应届和毕业一两年的人为主。做一件事,有经验的人会不假思索告诉你,应该这样做,但没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。24. 我们的核心团队,连我自己,一开始都没有量化经验,这一点很特殊。不能说是成功的秘密,但这是幻方的文化之一。我们不会故意回避有经验的人,但更多是看能力。25. 其实,一家公司的基因是很难被模仿的。比如说招没有经验的人,怎么判断他的潜力,招进来之后如何才能让他成长,这些都没法直接模仿。26. 招人时确保价值观一致,然后通过企业文化来确保步调一致。当然,我们并没有一个成文的企业文化,因为所有成文东西,又会阻碍创新。更多时候,是管理者的以身示范,遇到一件事,你如何做决策,会成为一种准则。27. (招人必卡的条件)热爱,扎实的基础能力。其他都没那么重要。我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。
28.(如何招到这种人)他们的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。因为我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。
29. V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。30. DeepSeek也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。核心观点原话节选
往期荐读 :(点击即阅)
华尔街最准分析师:未来五年最重要的十大关键趋势
中国经济复苏的三大突破口: 楼市、社保、AI
重大逆转!高盛最新预测突然刷屏!逆转的时间点是...
2025,大争之年
国家要开始大规模花钱了,而且让花钱成了主要任务
一切出路,都在这些思路里
2025退税攻略!1年1次的泼天富贵,千万别错过(收藏)
未来20年, 中国经济将构建新的一个增长方式( 信息量大)