专栏名称: 蓝钻故事
硬派家国故事
目录
相关文章推荐
书单来了  ·  倒计时3、2、1 ·  2 天前  
单向街书店  ·  【单向历】1 月 28 日,宜饱餐一顿 ·  2 天前  
蓝钻故事  ·  百年之后,他再次成为年轻人的精神偶像 ·  2 天前  
十点读书  ·  人到中年,不外求、不妥协、不纠缠 ·  5 天前  
十点读书  ·  一个人的不幸,从死要面子开始 ·  4 天前  
51好读  ›  专栏  ›  蓝钻故事

一夜打崩美股,又遭大规模攻击,DeepSeek的85后老板藏不住了

蓝钻故事  · 公众号  · 读书  · 2025-01-28 13:18

正文



1月28日,英伟达暴跌16.86%,5800亿美元蒸发,创造史上最大市值损失记录。

全美半导体行业陷入恐慌,博通跌超17%,台积电跌超13%,美国科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麦跌超5%。

加密货币遭到重创,32万人一夜爆仓,比特币、以太坊、狗狗币全线暴跌,特朗普的个人货币TRUMP盘中跌幅一度达到20%,这意味着19日最高点真金白银入场的“真川粉”,仅用一周就亏损了三分之二。

震撼世界的一幕,源头是DeepSeek国产AI大模型的横空出世。

随后,对DeepSeek的大规模恶意攻击开始了。

1月28日,DeepSeek官网页面提示,其线上服务遭到大规模恶意攻击,为提供服务,暂时限制了+86手机号以外的注册方式,已注册用户不受影响。

此前,DeepSeek已登顶苹果美国区免费APP排行榜,将ChatGPT压在了第二位。本次大规模攻击,意味着海外用户将暂时无法注册DeepSeek。


白菜价

2025年开年,国务院总理主持的新年首场专家、企业家座谈会,DeepSeek和幻方量化的创始人梁文锋参加了会议。这时,圈外还很少有人知道他。

2024年1月20日,特朗普就职美国总统,志得意满,他和妻子梅拉尼娅双双推出个人加密货币,TRUMP币涨幅高达41200%,赚的盆满钵满。

同样是1月20日这一天,来自杭州的DeepSeek(深度求索)公司发布推理模型DeepSeek-R1 正式版,在中美AI开发界引发轰动,随后迅速出圈。

DeepSeek背后,是幻方量化,一家用AI进行投资的对冲基金,完成这一壮举的人,叫梁文锋,85后创业者。

他创建的DeepSeek仅用2048张GPU,耗资557万美元,在53天内打造出全球领先的大模型“DeepSeek-V3”,动摇了闻名天下的OpenAI的统治地位。

要知道这笔经费,还不到其他硅谷AI开发团队的一个零头,甚至还不到这些团队一个主管的工资。

一位Meta的工程师在美国科技公司员工社区Blind中这样写道:

Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。

这绝非夸张。管理层正为AI研发部门的巨额投入而发愁。部门里几十位高管中每一个人的薪资都超过训练整个DeepSeek V3的成本。


中国人最擅长把高大上又暴利的科技概念做成白菜价,AI也不例外,可是谁也想不到,这一天竟然来的这么快。


此前,《黑神话》主创冯骥盛赞 DeepSeek是“堪称国运级别的科技成果”,他的解读通俗易懂:

为了讲清楚这个成果有多惊人,我打个比方:如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破——


1、强大。比肩O1的推理能力,暂时没有之一

2、便宜。参数少,训练开销与使用费用小了一个数量级

3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。

4、免费。官方目前提供的服务完全免费,任何人随时随地可用

5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持)

6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成


上面的六条,DeepSeek全部、同时做到了。

实在太6了,6到不真实。


热战

近些年的AI神话,支持了美股疯狂上涨的股价,也带动了拜登四年任期的GDP奇迹。

然而这一切,正在摇摇欲坠。

OpenAI并没有护城河,从发布之日起就面临着大量中国团队的挑战。更何况,OpenAI团队里本来就有大量华人,比如GPT-4o mini 团队的9人中,有超过一半成员是华人,包括清华、北大和同济大学的校友。

DeepSeek此次出击,被戏称为大陆华人在AI战争中击落北美华人,而且这两批华人,大多数都是在国内完成基础教育。

DeepSeek不仅改变了AI的格局,也改变了AI产业的基础。

此前,AI的开发建立在对高算力的要求之上,这让AI芯片的领导者——英伟达赚的盆满钵满。

英伟达此前占据了AI芯片的90%份额,十年间,股价暴涨120倍,2023年,英伟达利润暴涨8倍,2024年第三季度,英伟达营收350亿美元,同比增长94%。

全球巨头正在人工智能领域开启战争,英伟达是唯一的军火商——不管谁赢,背后的英伟达都赢麻了。

无论黄仁勋是否愿意,英伟达的芯片一直是美国对华“卡脖子”的杀手锏,随着中美AI战愈演愈烈,美国商务部不断加强AI芯片对华出口限制。

然而,这一次英伟达要慌了。

DeepSeek对算力极低的需求,也让英伟达的芯片不再是必需品。当算力垄断终结之日,主导权将重新回到大中华区,毕竟近些年绝大多数的芯片投资都在这里。

Scale AI创始人Alexander Wang说,DeepSeek的性能大致相当于美国最好的模型。他认为,过去十年美国在AI竞赛中可能领先于中国,但DeepSeek的新发布可能“改变一切”。

同时,他暗示DeepSeek即将遭到美国制裁。

DeepSeek 拥有大约 50,000 个 H100 计算卡,他们显然不能谈论它,因为这违反了美国实施的出口管制。我认为这是真的,我认为他们的影响力比其他人预期的要大,但未来也会受到芯片管制和出口管制的限制。

技术封锁背后,是深深的战略焦虑,大洋两岸的AI竞赛进入"热战"。

希望这一次,大洋两岸的竞争是响当当的正面决斗,而不是各种冷枪暗箭。


人生

1985年,梁文峰出生于广东湛江,父亲是一名小学老师。


那个年代流行“下海”,民间有句话流传很广:“搞原子弹的,不如卖茶叶蛋的。”


广东是改革开放的桥头堡,赚钱机会多,下海潮尤其火热。梁文峰还记得,小时候有不少家长来过自己家里,基本都觉得读书没用。


那个年代赚钱还很容易,敢出去闯荡,敢打敢拼就行,而到了现在,环境已经改变,梁文峰接受暗涌Waves采访时认为:

以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

梁文峰的“硬核创新”,源头来自国内扎实的基础育环境,即使这是一个五线小城市,一个普通家庭。

AI浪潮背后的华人做题家们,大多都是类似的教育背景,极度重视教育的中国学校和中国家庭,卷出了改变世界的一代人。

2002年,梁文峰考入浙江大学电子信息工程专业,2007年,拿到了浙江大学信息与通信工程的硕士学位。在攻读学位期间,他发表了一篇关于PTZ摄像机目标跟踪算法的论文。


梁文峰读研时,正值美国金融风暴,这让他看到了历史的巨大机遇,他带着一帮同学,尝试用把自己机器学习算法和金融联系在一起,实现自动量化交易。


2013年,梁文锋与浙大校友徐进共同创办了杭州雅克比投资管理有限公司,2015年,随着中证500股指期货的上市,30岁的梁文锋与徐进了创办幻方量化。


2015年,A股爆发股灾,很多人开始想起索罗斯的“反身性理论”,人类并非一种理性的生物,他们会犯错,预期会在欲望的牵动下左脚踩右脚上升,造成超级泡沫。


2016年3月,阿尔法狗4:1战胜李世石,在围棋领域完成了对人类的胜利。

至此,无论是“心态”还是计算能力,AI都对人类优势明显,这意味着资本市场的博弈中,新的超级玩家要出现了。

这一年,幻方量化推出了第一个由深度学习算法驱动的AI模型,并将GPU引入计算交易仓位。传统模型中的量化策略,逐步被人工智能取代。
2018年,幻方量化首次获得了中国私募证券领域的最高奖项——私募金牛奖,确立了行业内的领先地位。
2019年,幻方量化的管理规模突破百亿元,2021年,幻方量化的资金管理规模突破千亿,成为行业内的“量化四大天王”之一。
曾有一位量化基金公司的交易员描述自己的工作:
早上开盘前开电脑,系统自检并进入交易状态,然后刷微博和微信朋友圈。如果今天没客户拜访,就看书、游泳、跑步、逛街。 早些年还会经常看交易报告,甚至介入人工操作,后来发现是没意义的事,做多反而错多,想起来才会看一下报告,有时候会为自己插不上手而黯然神伤。

这里也需要为国内的股民提个醒,想在股市中胜出,最好也是唯一的办法,就是选择业绩好发展好的公司,长线成长。

如果你沉迷于短线交易的高风险高利润,不妨看看自己的对手盘,都是些什么样的妖魔鬼怪。



理想

实现财务自由后,梁文锋开始追逐自己的理想。

疫情结束之后,在很多人眼里,中国经济遇冷,投资信心不足,梁文锋却有相反的乐观看法。

他觉得,赚快钱的时代结束了,“硬核创新”的时代要来了。

中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。

2023年,38岁的梁文锋创办了深度求索(DeepSeek),专注于AI大模型研发。

DeepSeek团队规模只有不到140人,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,鲜有“海归”,而且工作时间都不长,不少还是在读博士。即便是团队的管理者,也非常年轻。

梁文锋曾说过,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”

2024年5月,DeepSeek一战成名。他们推出DeepSeek V2的开源模型,用可怕的性价比打崩了整个行业:

推理成本被降到每百万token仅 1元钱,和市面上主流模型相比,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

DeepSeek引发了行业内的价格暴跌,字节、腾讯、百度、阿里等大厂纷纷降价。

然而,尽管在圈内引发了地震,但是AI圈的技术背景比较深,局外人大多还是看不懂到底发生了什么。

2024年12月。DeepSeek推出了新一代大模型DeepSeek-V3,2025年1月20日,又推出了DeepSeek-R1 正式版。

这两个模型的推出,意味着新模型正式出圈,走到了大众面前。

在OpenAI已经闭源的情况下,梁文锋选择了将模型开源,他宣称:

我们不会闭源。我们认为先有一个强大的技术生态更重要。

模型开源意味着,所有人都可以在DeepSeek的基础上发展,可以说,DeepSeek不止是建立了领先,还打下了坚实的基础。

互联网早期有着开放、共享的开源文化,专注于加速技术进步,减少重复开发的浪费,促进协作与多样性:大幅提升创新速度。

在梁文锋看来,开源有利于形成中国AI的原创生态,他说:

我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。


英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

然而,随着资本对逐利的需求扩大,这一文化也日益退缩,亟需在新的一代手里重现。

他们更有理想主义,更有打破壁垒和改变世界的勇气,也需要应对各种明枪暗箭的能力。

新的时代越行越近,人工智能日益崛起,希望这个华人主导的新时代,是真正的星辰大海。


-END-

部分参考文献:

揭秘DeepSeek:一个更极致的中国技术理想主义故事》, 暗涌Waves

85后中国学霸打崩美国AI巨头心态!DeepSeek老板竟然是他…》,北美留学生观察

《DeepSeek遭大规模恶意攻击!》长安街知事


推荐文章
书单来了  ·  倒计时3、2、1
2 天前
单向街书店  ·  【单向历】1 月 28 日,宜饱餐一顿
2 天前
十点读书  ·  一个人的不幸,从死要面子开始
4 天前
汽车最前线  ·  猜猜看,地名谜语,绝妙游戏小知识
8 年前
中央广电总台中国之声  ·  动用孩子的压岁钱违法?
7 年前
禅语心苑  ·  茶需要捻,人需要磨
7 年前