专栏名称: 创业邦

创业邦唯一官方微信，中国最权威的创业服务平台。旗下有创业邦杂志、创业邦网站、孵化器等服务。我们是中国最有影响力的创新创业产品展示活动 DEMO CHINA「创新中国」主办方。创业邦官网：www.cyzone.cn

只招1%的天才，这家中国公司让硅谷难安

创业邦 · 公众号 · 科技媒体 · 2025-01-26 11:01

正文

来源丨凤凰网科技（ID：ifeng_tech）

作者丨Danny 董雨晴

OpenAI的最强对手出现了，这一次来自中国。

2025年一开年就火遍全球的DeepSeek（深度求索），1月20日晚上演了一场“偷袭珍珠港”——发布推理模型 DeepSeek-R1 正式版，同步开源模型权重，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。这款大模型在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

R1版本的推出，在海外被惊呼“这才是真正的开放的人工智能”。英伟达高级研究科学家Jim Fan在评价R1模型时就这样说道：“我们生活在这样一个时代：一个不是美国公司的AI企业却实现了 OpenAI成立时的使命——做真正开放的前沿研究、为所有人赋能。”

随着DeepSeek的创新实力成为全球热议议题，外界也愈发关注，这家中国本土科技公司及其背后的掌舵人，究竟有何特别之处？

一个浙大学霸，勇闯无人区

1985年，梁文锋出生于广东湛江的一个五线城市。其具体的童年成长轨迹已不可考，从公开信息唯一可知的是，梁文锋有在采访中提到过自己的父亲是一名小学老师。

2002年，17岁的梁文锋凭借优异成绩考入浙江大学电子信息工程专业。2007年，22岁的梁文锋又考上了浙江大学信息与通信工程专业硕士。师从项志宇，主要做机器视觉研究。

2008年，23岁的梁文锋在浙江大学攻读硕士学位期间，与同学组建团队，开始收集市场行情、金融市场相关数据以及宏观经济数据。这一年，他带领团队运用机器学习技术探索全自动量化交易，而当时正值全球金融危机的爆发。

有消息称，大疆创始人汪滔曾邀请梁文锋共同创业，彼时大疆正处于起步阶段。

如果梁文锋加入，或许也能在大疆的发展中实现财富自由。但梁文锋坚信人工智能将改变世界，最终决定独立创业。

2010年6月，25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业，其毕业论文题目为《基于低成本PTZ摄像机的目标跟踪算法研究》。

硕士毕业后的第三年，28岁的梁文锋将人工智能与量化交易结合，和浙江大学的徐进校友创立了雅克比投资（杭州雅克比投资管理有限公司）。2015年，他们共同创立杭州幻方科技有限公司，也就是今天的浙江九章资产管理有限公司，次年又成立了宁波幻方量化投资管理合伙企业（有限合伙）。

所谓量化投资，通俗地说就是用计算机取代人，通过数量化方式，程序化发出买卖指令，投资收益较为稳定。

经过几年时间，幻方量化就在国内迅速崛起。2016年10月，幻方量化推出第一个AI模型，第一份由深度学习生成的交易仓位上线执行。到2017年底，几乎所有的量化策略都采用AI模型计算。2019年，幻方量化管理规模突破百亿，成为国内量化私募“四巨头”之一。

此后的幻方量化甚至一度成为中国首家突破千亿的私募量化大厂，准确地说也是迄今为止业内唯一规模曾迈过千亿大关的量化私募。这期间梁文锋在量化投资领域积累了强大的技术实力和算力资源，幻方量化以强大的算力支持闻名。

2023年，全球人工智能热潮爆发，梁文锋也来到了他创业之路的第十个年头。

当年5月，38岁的梁文锋宣布要做通用人工智能（AGI）。7月，杭州深度求索人工智能基础技术研究有限公司（DeepSeek）成立，专注于AI大模型的研究与开发。梁文锋也成为量化投资者投身AI创业的“第一人”。

之后便是爽文剧本式的“AI界拼多多”崛起之路，就连大厂也只能是跟随，“在豆包和阿里云之前，DeepSeek最先在全网降低了模型成本”，一位AI算法工程师对凤凰网科技表示，这让他印象非常深刻。

2024年5月，DeepSeek发布的DeepSeek V2的开源模型率先拉起了行业内的价格战。DeepSeek V2提供了一种史无前例的性价比：推理成本被降到每百万token仅1块钱，约等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

同年12月26日，仅仅时隔7个月，DeepSeek就又发布了DeepSeek V3，再次颠覆了行业对于价格的认知。DeepSeek V3的API定价为输入每百万tokens 0.5元（缓存命中）/2元（缓存未命中），输出每百万tokens 8元，与字节Doubao-pro-256k定价输入每百万tokens 5元，输出每百万tokens 9元的水平相当，在国产模型中性价比继续提升。

如今，当行业还沉浸在DeepSeek V3的震撼中时，DeepSeek-R1正式版又来了。这一次，DeepSeek真正引发了硅谷的恐慌。

微软CEO萨蒂亚・纳德拉在瑞士达沃斯世界经济论坛上表示：“看到DeepSeek的新模型，真的令人印象非常深刻。他们切实有效地开发出了一款开源模型，在推理计算方面表现出色，且超级计算效率极高。”

“我们必须非常、非常认真地对待中国的这些进展，”纳德拉说。

DeepSeek的宝贵之处，仍是创新

“DeepSeek的确有过人之处，业内都觉得他们可能是用了一些o1的数据做蒸馏，但在算法层面做了更好的创新”，一位行业从业人士认为。

在刚刚成立的一年多时间里，DeepSeek一直不声不响，据凤凰网科技了解，这家公司甚至没有设立公关团队。以至于，当多数大模型公司都在争声量，抢时间的时候，DeepSeek在闷声尝试创新。

DeepSeek的创新也是自下而上，几乎存在于整个公司内部。比如，时至今日，梁文锋的日常依旧是看论文、写代码、参与小组讨论。是少有的能堪比一线研究员能力的公司掌舵者。

由于一开始的目标就是AGI，所以DeepSeek从来不做跟随策略，即像其他商业类公司一样，选择追随全球最先进的模型，用短平快的方式做好应用，而是在模型结构层面做从0-1的创新。

在接受采访时，梁文锋也曾明确地表达，“因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年，中国公司习惯了别人做技术创新，我们拿过来做应用变现，但这并非是一种理所当然。这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展”。

过去，碍于人才构成和资本实力，中国企业做的往往是有限的创新，但现如今，强如字节等企业，已经有数百亿美元规模的年度利润。据凤凰网科技此前获悉，字节豆包大模型团队已在内部组建AGI长期研究团队，代号“Seed Edge”。

这意味着，创新已不再是难题，难的是如何保持人才密度，以及拥有自信。

据多位与DeepSeek有过接触的行业人士表述，DeepSeek的优势之处就在于人才密度极高，且多来自于中国本土市场。

“DeepSeek从一开始团队就是百人左右规模，但个个都很抗打”，一位AI行业猎头对凤凰网科技表示，“其实早期Kimi也曾想走这个路线，只是没有特别成功。”

另一位与DeepSeek有过接触的行业人士称，“DeepSeek给出的薪酬待遇非常具有竞争力，这让其一直对人才有很强的吸引力”。

此前据多家媒体报道，雷军曾亲自出手“挖deepseek的人”，支付的薪酬则在千万元级别。这个人正是DeepSeek-V2的关键开发者之一罗福莉，一个95后。

据量子位整理资料发现，DeepSeek团队最大的特点就是年轻。应届生、在读生，特别是来自清北的应届生在其中非常活跃。

“只招1%的天才，去做99%中国公司做不到的事情。”面试过DeepSeek的应届生这样评价其招聘风格。

这也使得DeepSeek全员上下，都保持着极致的创新动力。

梁文峰在接受采访时同样表达过一个观点：DeepSeek在招人时主要看能力，而不是看经验。“我们的核心技术岗位，基本以应届和毕业一两年的人为主”。并且梁文锋还表达，“V2模型没有海外回来的人，都是本土的。前50名顶尖人才可能不在中国，但也许我们能自己打造这样的人。”

和上一代功成名就的故事不同，DeepSeek代表的是一个硬核创新时代的到来。

上一代的成功人士是属于互联网的，他们在技术层面的突破并不多，更多是拼速度、拼资本、拼规模。

一个可喜的信号是，DeepSeek不是孤例，同样来自杭州本土市场，宇树科技最新推出的机器人B2-W同样惊艳全球，宇树科技的创始人兼CEO王兴兴，本科就读于浙江理工大学机械与自动控制学院机电专业，本科毕业后进入上海大学攻读机械工程专业研究生。

我们也有理由相信，中国科技创新的故事已经翻入了新一页。

参考资料

1. 揭秘DeepSeek:一个更极致的中国技术理想主义故事，暗涌Waves，作者：于丽丽

2. 全网都在扒的DeepSeek团队，是清北应届生撑起一片天，量子位

3. DeepSeek创始人梁文锋，广东人，仅靠百名中国程序员，赶超OpenAI，CEO来信