专栏名称: 朝文社
《我们爱历史》团队由多名中国作协会员组成,弘扬正确历史观,正视听。获2015年度网易最佳自媒体奖,2016年度头条号奖,网易最有态度自媒体奖。
目录
相关文章推荐
上下五千年故事  ·  孙思邈有个千古名方,专清体内各种的湿气、痰浊 ... ·  2 天前  
荔枝新闻  ·  农历乙巳蛇年有384天 为何比公历年多19天? ·  3 天前  
上下五千年故事  ·  汉景帝的妃子因来月事,让身边宫女去侍寝,自此 ... ·  5 天前  
北京日报出版社  ·  预告 | 品读唐诗边塞篇的灿烂之花(首图站) ·  4 天前  
北京日报出版社  ·  预告 | 品读唐诗边塞篇的灿烂之花(首图站) ·  4 天前  
51好读  ›  专栏  ›  朝文社

广东神秘富豪把AI卖成了白菜价

朝文社  · 公众号  · 历史  · 2025-01-04 18:21

正文

别忘了拉到最下面添加我们的粉丝群哦~

最近一段时间,一家名为“DeepSeek”的中国AI公司,频繁被硅谷的技术大佬提起,讨论之热烈,甚至引来了美国最大的财经频道CNBC的关注。
CNBC的女主持人在试用过DeepSeek推出的语言大模型后,称赞这款产品的回答“几乎与ChatGPT-4一样完美”
其实,某家中国公司能复制出与美国差不多的产品,并不稀奇,硅谷的创新企业早已习惯了中国人的“跟随战略”。
但DeepSeek与众不同,它让硅谷感到了一股来自东方的神秘力量。
CNBC的女主持人将DeepSeek的“神秘”归纳为三点:
第一,开发成本极低。这家中国公司仅用了550万美元就训练出了美国公司要用5亿美元训练的模型。
油管上一位AI博主,统计了硅谷企业训练大模型的成本后,得出结论:DeepSeek仅用了2.8%的资金,就开发出媲美甚至超越ChatGPT-4的模型。
这意味着,中国企业,再次在AI领域取得了巨大的成本优势。
他表示自己免费使用了DeepSeek几天后,已经找不到继续每个月花20美元订阅ChatGPT的理由,完美平替。
第二,完全开源。CNBC的女主持人略带嘲讽地表示:虽然OpenAI名字里有“Open(开放)”一词,但美国主流的AI公司全是闭源的,一点不“Open”。
反倒是中国的DeepSeek完全开源——任何AI爱好者在全球任意的地点,都可以调用DeepSeek的底层代码。
正如苹果与安卓系统的竞争,闭源的苹果或许能带来更高的安全性,但开源的安卓应用更广泛,占领了全球80%的手机市场。DeepSeek似乎想用开源的方式,复制安卓的成功。
第三,最令美国人尴尬的是,DeepSeek在训练时使用的GPU是“阉割版”的英伟达H800,其性能不如美国公司使用的H100。
要知道,美国原本寄希望于禁止中国公司购买先进GPU的方式,来限制中国AI的发展。DeepSeek的横空出世,无疑让美国的制裁,看上去有点可笑了。
看到这里,很多粉丝一定好奇,DeepSeek究竟是一家什么样的公司,为何之前都没听说过???
这还真不能怪我们,因为DeepSeek成立时间太短了,距离现在仅15个月而已,成立于2023年的9月。
再者,与阿里、腾讯、百度这样动辄几万人的大厂相比,DeepSeek小的“可怜”,初创时只有50人,现在也就200来人,是一家既新又小的公司,所以之前没听过很正常。
小归小,但DeepSeek的创始人梁文锋在投资圈非常有名,这位出生于广东小县城的大佬,早年经历不详,只知道父亲是一名小学教师,家庭教育不错。
2008年左右,从浙江大学毕业后,虽然学的是人工智能专业,但梁文锋几经考虑后,还是决定“先富起来”,做起了金融,主攻对冲基金。
2015年,赚了不少钱的梁文锋回归初心,成立了一只投资AI的量化基金:幻方量化。
得益于金融、AI“双修”的背景,幻方量化仅运营了5年,管理的基金规模便突破了1000亿。
普通人遇到这种情况,嘴早笑歪了,可梁文锋看到的却是风险,近两年他着手降低基金的规模,控制在了两三百亿的范围。
2023年,梁文锋在北大附近的一座办公楼中成立了DeepSeek。起初团队只有50人,而且清一色的是没有留学背景的“土鳖”,纯中国本土大学教育培养出的团队。
这或许与梁文锋自己没有留学的经历有关,他曾说:中国的大厂,喜欢去美国挖AI人才,需要耗费大量的精力与成本不说,效果还不一定有本土团队好。
事实证明,外来的和尚,不一定会念经。
以让DeepSeek声名大噪的MLA架构为例,就是由团队中一位非常年轻的本土员工提出的。
这个架构的神奇之处在于大大降低了GPU显存的使用率,等于变相提高了算力,降低了训练成本。OpenAI的联合创始人看了MLA架构的论文后惊呼:这是今年AI行业最好的架构!
该架构的灵感来自一场讨论会,在研究完市面主流架构后,一位年轻的员工提出了一个全新的角度理解架构问题,大家听后都觉得有道理,便在CTO的组织下,进行可行性研究,没想到挖到个宝,真跑通了。
而“洋和尚”往往是硅谷次一级的人才,让他们搭建个主流架构,一点问题没有,干得又快又好,但说到创新,不好意思,硅谷公司聘他们的时候,就是来干苦活、累活的,创新是公司核心层的事儿。那些核心人才,国内的大厂别说挖,接触都接触不到的。
梁文锋还纠正了一个国内AI界流行的说法——中国的AI技术只比美国落后一到两年,好像加把劲就能追上。
但现实是,中国AI与美国的根本差距在创新上,每次都是美国人先搞出个什么东西,中国立刻跟进,仿个差不多的。这么搞永远有一到两年的差距,不可能追上。
梁文锋惋惜地表示,似乎大部分中国科技公司也习惯了这种模式,感觉追赶是理所当然的事情,领先反倒不正常了。
而DeepSeek在这波AI浪潮中,初心就不是捞一笔就跑,而是要走到技术的最前沿,去推动整个生态的发展。
考虑到DeepSeek是一家刚成立15个月的公司,我觉得梁文锋并非在“画饼”,是有可能实现的,毕竟他们已迈出了突破性的一步。
如果把DeepSeek放在更大宏达的产业转型中去分析,会发现过去中国人赚钱,大都靠运气和关系,导致中低端红利被吃干净了,未来再想发大财,更依赖技术与创新,创业的门槛正变得越来越高,想要不被时代淘汰,我们要时刻处于学习与进步之中,否则下一个被AI淘汰的就是我们自己。

欢迎关注我们的视频号

END

别忘了拉到最下面添加我们的粉丝群哦~