专栏名称: 蓝钻故事

硬派家国故事

一夜打崩美股，又遭大规模攻击，DeepSeek的85后老板藏不住了

蓝钻故事 · 公众号 · 读书 · 2025-01-28 13:18

正文

1月28日，英伟达暴跌16.86%，5800亿美元蒸发，创造史上最大市值损失记录。

全美半导体行业陷入恐慌，博通跌超17%，台积电跌超13%，美国科技跌超11%，Arm Holdings跌超10%，AMD跌超6%，阿斯麦跌超5%。

加密货币遭到重创，32万人一夜爆仓，比特币、以太坊、狗狗币全线暴跌，特朗普的个人货币TRUMP盘中跌幅一度达到20%，这意味着19日最高点真金白银入场的“真川粉”，仅用一周就亏损了三分之二。

震撼世界的一幕，源头是DeepSeek国产AI大模型的横空出世。

随后，对DeepSeek的大规模恶意攻击开始了。

1月28日，DeepSeek官网页面提示，其线上服务遭到大规模恶意攻击，为提供服务，暂时限制了+86手机号以外的注册方式，已注册用户不受影响。

此前，DeepSeek已登顶苹果美国区免费APP排行榜，将ChatGPT压在了第二位。本次大规模攻击，意味着海外用户将暂时无法注册DeepSeek。

白菜价

2025年开年，国务院总理主持的新年首场专家、企业家座谈会，DeepSeek和幻方量化的创始人梁文锋参加了会议。这时，圈外还很少有人知道他。

2024年1月20日，特朗普就职美国总统，志得意满，他和妻子梅拉尼娅双双推出个人加密货币，TRUMP币涨幅高达41200%，赚的盆满钵满。

同样是1月20日这一天，来自杭州的DeepSeek（深度求索）公司发布推理模型DeepSeek-R1 正式版，在中美AI开发界引发轰动，随后迅速出圈。

DeepSeek背后，是幻方量化，一家用AI进行投资的对冲基金，完成这一壮举的人，叫梁文锋，85后创业者。

他创建的DeepSeek仅用2048张GPU，耗资557万美元，在53天内打造出全球领先的大模型“DeepSeek-V3”，动摇了闻名天下的OpenAI的统治地位。

要知道这笔经费，还不到其他硅谷AI开发团队的一个零头，甚至还不到这些团队一个主管的工资。

一位Meta的工程师在美国科技公司员工社区Blind中这样写道：

Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek，它使得 Llama 4 在基准测试中已经落后。雪上加霜的是：那个不知名的中国公司，仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek，并试图从中复制一切可能的东西。

这绝非夸张。管理层正为AI研发部门的巨额投入而发愁。部门里几十位高管中每一个人的薪资都超过训练整个DeepSeek V3的成本。

中国人最擅长把高大上又暴利的科技概念做成白菜价，AI也不例外，可是谁也想不到，这一天竟然来的这么快。

此前，《黑神话》主创冯骥盛赞 DeepSeek是“堪称国运级别的科技成果”，他的解读通俗易懂：

为了讲清楚这个成果有多惊人，我打个比方：如果有一个AI大模型做到了以下的任何一条，都是超级了不起的突破——

1、强大。比肩O1的推理能力，暂时没有之一
2、便宜。参数少，训练开销与使用费用小了一个数量级
3、开源。任何人均可自行下载与部署，提供论文详细说明训练步骤与窍门，甚至提供了可以运行在手机上的mini模型。
4、免费。官方目前提供的服务完全免费，任何人随时随地可用
5、联网。暂时唯一支持联网搜索的推理模型（o1还不支持）
6、本土。深度求索是一家很小规模的年轻中国公司，由没有海外经历甚至没有资深从业经验的本土团队开发完成

上面的六条，DeepSeek全部、同时做到了。
实在太6了，6到不真实。

热战

近些年的AI神话，支持了美股疯狂上涨的股价，也带动了拜登四年任期的GDP奇迹。

然而这一切，正在摇摇欲坠。

OpenAI并没有护城河，从发布之日起就面临着大量中国团队的挑战。更何况，OpenAI团队里本来就有大量华人，比如GPT-4o mini 团队的9人中，有超过一半成员是华人，包括清华、北大和同济大学的校友。

DeepSeek此次出击，被戏称为大陆华人在AI战争中击落北美华人，而且这两批华人，大多数都是在国内完成基础教育。

DeepSeek不仅改变了AI的格局，也改变了AI产业的基础。

此前，AI的开发建立在对高算力的要求之上，这让AI芯片的领导者——英伟达赚的盆满钵满。

英伟达此前占据了AI芯片的90%份额，十年间，股价暴涨120倍，2023年，英伟达利润暴涨8倍，2024年第三季度，英伟达营收350亿美元，同比增长94%。

全球巨头正在人工智能领域开启战争，英伟达是唯一的军火商——不管谁赢，背后的英伟达都赢麻了。

无论黄仁勋是否愿意，英伟达的芯片一直是美国对华“卡脖子”的杀手锏，随着中美AI战愈演愈烈，美国商务部不断加强AI芯片对华出口限制。

然而，这一次英伟达要慌了。

DeepSeek对算力极低的需求，也让英伟达的芯片不再是必需品。当算力垄断终结之日，主导权将重新回到大中华区，毕竟近些年绝大多数的芯片投资都在这里。

Scale AI创始人Alexander Wang说，DeepSeek的性能大致相当于美国最好的模型。他认为，过去十年美国在AI竞赛中可能领先于中国，但DeepSeek的新发布可能“改变一切”。

同时，他暗示DeepSeek即将遭到美国制裁。

DeepSeek 拥有大约 50,000 个 H100 计算卡，他们显然不能谈论它，因为这违反了美国实施的出口管制。我认为这是真的，我认为他们的影响力比其他人预期的要大，但未来也会受到芯片管制和出口管制的限制。

技术封锁背后，是深深的战略焦虑，大洋两岸的AI竞赛进入"热战"。

希望这一次，大洋两岸的竞争是响当当的正面决斗，而不是各种冷枪暗箭。

人生

1985年，梁文峰出生于广东湛江，父亲是一名小学老师。

那个年代流行“下海”，民间有句话流传很广：“搞原子弹的，不如卖茶叶蛋的。”

广东是改革开放的桥头堡，赚钱机会多，下海潮尤其火热。梁文峰还记得，小时候有不少家长来过自己家里，基本都觉得读书没用。

那个年代赚钱还很容易，敢出去闯荡，敢打敢拼就行，而到了现在，环境已经改变，梁文峰接受暗涌Waves采访时认为：

以后硬核创新会越来越多。现在可能还不容易被理解，是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就，群体性想法就会改变。我们只是还需要一堆事实和一个过程。

梁文峰的“硬核创新”，源头来自国内扎实的基础育环境，即使这是一个五线小城市，一个普通家庭。

AI浪潮背后的华人做题家们，大多都是类似的教育背景，极度重视教育的中国学校和中国家庭，卷出了改变世界的一代人。

2002年，梁文峰考入浙江大学电子信息工程专业，2007年，拿到了浙江大学信息与通信工程的硕士学位。在攻读学位期间，他发表了一篇关于PTZ摄像机目标跟踪算法的论文。

梁文峰读研时，正值美国金融风暴，这让他看到了历史的巨大机遇，他带着一帮同学，尝试用把自己机器学习算法和金融联系在一起，实现自动量化交易。

2013年，梁文锋与浙大校友徐进共同创办了杭州雅克比投资管理有限公司，2015年，随着中证500股指期货的上市，30岁的梁文锋与徐进了创办幻方量化。

2015年，A股爆发股灾，很多人开始想起索罗斯的“反身性理论”，人类并非一种理性的生物，他们会犯错，预期会在欲望的牵动下左脚踩右脚上升，造成超级泡沫。

2016年3月，阿尔法狗4:1战胜李世石，在围棋领域完成了对人类的胜利。

至此，无论是“心态”还是计算能力，AI都对人类优势明显，这意味着资本市场的博弈中，新的超级玩家要出现了。

这一年，幻方量化推出了第一个由深度学习算法驱动的AI模型，并将GPU引入计算交易仓位。传统模型中的量化策略，逐步被人工智能取代。

2018年，幻方量化首次获得了中国私募证券领域的最高奖项——私募金牛奖，确立了行业内的领先地位。

2019年，幻方量化的管理规模突破百亿元，2021年，幻方量化的资金管理规模突破千亿，成为行业内的“量化四大天王”之一。

曾有一位量化基金公司的交易员描述自己的工作：

早上开盘前开电脑，系统自检并进入交易状态，然后刷微博和微信朋友圈。如果今天没客户拜访，就看书、游泳、跑步、逛街。早些年还会经常看交易报告，甚至介入人工操作，后来发现是没意义的事，做多反而错多，想起来才会看一下报告，有时候会为自己插不上手而黯然神伤。

这里也需要为国内的股民提个醒，想在股市中胜出，最好也是唯一的办法，就是选择业绩好发展好的公司，长线成长。

如果你沉迷于短线交易的高风险高利润，不妨看看自己的对手盘，都是些什么样的妖魔鬼怪。

理想

实现财务自由后，梁文锋开始追逐自己的理想。

疫情结束之后，在很多人眼里，中国经济遇冷，投资信心不足，梁文锋却有相反的乐观看法。

他觉得，赚快钱的时代结束了，“硬核创新”的时代要来了。

中国产业结构的调整，会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气，就会更愿意俯身去做真正的创新。

2023年，38岁的梁文锋创办了深度求索（DeepSeek），专注于AI大模型研发。

DeepSeek团队规模只有不到140人，工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校，鲜有“海归”，而且工作时间都不长，不少还是在读博士。即便是团队的管理者，也非常年轻。

梁文锋曾说过，“V2模型没有海外回来的人，都是本土的。前50名顶尖人才可能不在中国，但也许我们能自己打造这样的人。”

2024年5月，DeepSeek一战成名。他们推出DeepSeek V2的开源模型，用可怕的性价比打崩了整个行业：

推理成本被降到每百万token仅 1元钱，和市面上主流模型相比，约等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

DeepSeek引发了行业内的价格暴跌，字节、腾讯、百度、阿里等大厂纷纷降价。

然而，尽管在圈内引发了地震，但是AI圈的技术背景比较深，局外人大多还是看不懂到底发生了什么。

2024年12月。DeepSeek推出了新一代大模型DeepSeek-V3，2025年1月20日，又推出了DeepSeek-R1 正式版。

这两个模型的推出，意味着新模型正式出圈，走到了大众面前。

在OpenAI已经闭源的情况下，梁文锋选择了将模型开源，他宣称：

我们不会闭源。我们认为先有一个强大的技术生态更重要。

模型开源意味着，所有人都可以在DeepSeek的基础上发展，可以说，DeepSeek不止是建立了领先，还打下了坚实的基础。

互联网早期有着开放、共享的开源文化，专注于加速技术进步，减少重复开发的浪费，促进协作与多样性：大幅提升创新速度。

在梁文锋看来，开源有利于形成中国AI的原创生态，他说：

我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距，但真实的gap是原创和模仿之差。如果这个不改变，中国永远只能是追随者，所以有些探索也是逃不掉的。

英伟达的领先，不只是一个公司的努力，而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势，手里有路线图。中国AI的发展，同样需要这样的生态。很多国产芯片发展不起来，也是因为缺乏配套的技术社区，只有第二手消息，所以中国必然需要有人站到技术的前沿。

然而，随着资本对逐利的需求扩大，这一文化也日益退缩，亟需在新的一代手里重现。

他们更有理想主义，更有打破壁垒和改变世界的勇气，也需要应对各种明枪暗箭的能力。

新的时代越行越近，人工智能日益崛起，希望这个华人主导的新时代，是真正的星辰大海。

-END-

部分参考文献：

《揭秘DeepSeek:一个更极致的中国技术理想主义故事》，暗涌Waves

《85后中国学霸打崩美国AI巨头心态！DeepSeek老板竟然是他…》，北美留学生观察

《DeepSeek遭大规模恶意攻击！》长安街知事