广东神秘富豪把AI卖成了白菜价

朝文社 · 公众号 · 历史 · 2025-01-04 18:21

正文

别忘了拉到最下面添加我们的粉丝群哦~

最近一段时间，一家名为“DeepSeek”的中国AI公司，频繁被硅谷的技术大佬提起，讨论之热烈，甚至引来了美国最大的财经频道CNBC的关注。

CNBC的女主持人在试用过DeepSeek推出的语言大模型后，称赞这款产品的回答“几乎与ChatGPT-4一样完美”。

其实，某家中国公司能复制出与美国差不多的产品，并不稀奇，硅谷的创新企业早已习惯了中国人的“跟随战略”。

但DeepSeek与众不同，它让硅谷感到了一股来自东方的神秘力量。

CNBC的女主持人将DeepSeek的“神秘”归纳为三点：

第一，开发成本极低。这家中国公司仅用了550万美元就训练出了美国公司要用5亿美元训练的模型。

油管上一位AI博主，统计了硅谷企业训练大模型的成本后，得出结论：DeepSeek仅用了2.8%的资金，就开发出媲美甚至超越ChatGPT-4的模型。

这意味着，中国企业，再次在AI领域取得了巨大的成本优势。

他表示自己免费使用了DeepSeek几天后，已经找不到继续每个月花20美元订阅ChatGPT的理由，完美平替。

第二，完全开源。CNBC的女主持人略带嘲讽地表示：虽然OpenAI名字里有“Open（开放）”一词，但美国主流的AI公司全是闭源的，一点不“Open”。

反倒是中国的DeepSeek完全开源——任何AI爱好者在全球任意的地点，都可以调用DeepSeek的底层代码。

正如苹果与安卓系统的竞争，闭源的苹果或许能带来更高的安全性，但开源的安卓应用更广泛，占领了全球80%的手机市场。DeepSeek似乎想用开源的方式，复制安卓的成功。

第三，最令美国人尴尬的是，DeepSeek在训练时使用的GPU是“阉割版”的英伟达H800，其性能不如美国公司使用的H100。

要知道，美国原本寄希望于禁止中国公司购买先进GPU的方式，来限制中国AI的发展。DeepSeek的横空出世，无疑让美国的制裁，看上去有点可笑了。

看到这里，很多粉丝一定好奇，DeepSeek究竟是一家什么样的公司，为何之前都没听说过？？？

这还真不能怪我们，因为DeepSeek成立时间太短了，距离现在仅15个月而已，成立于2023年的9月。

再者，与阿里、腾讯、百度这样动辄几万人的大厂相比，DeepSeek小的“可怜”，初创时只有50人，现在也就200来人，是一家既新又小的公司，所以之前没听过很正常。

小归小，但DeepSeek的创始人梁文锋在投资圈非常有名，这位出生于广东小县城的大佬，早年经历不详，只知道父亲是一名小学教师，家庭教育不错。

2008年左右，从浙江大学毕业后，虽然学的是人工智能专业，但梁文锋几经考虑后，还是决定“先富起来”，做起了金融，主攻对冲基金。

2015年，赚了不少钱的梁文锋回归初心，成立了一只投资AI的量化基金：幻方量化。

得益于金融、AI“双修”的背景，幻方量化仅运营了5年，管理的基金规模便突破了1000亿。

普通人遇到这种情况，嘴早笑歪了，可梁文锋看到的却是风险，近两年他着手降低基金的规模，控制在了两三百亿的范围。

2023年，梁文锋在北大附近的一座办公楼中成立了DeepSeek。起初团队只有50人，而且清一色的是没有留学背景的“土鳖”，纯中国本土大学教育培养出的团队。

这或许与梁文锋自己没有留学的经历有关，他曾说：中国的大厂，喜欢去美国挖AI人才，需要耗费大量的精力与成本不说，效果还不一定有本土团队好。

事实证明，外来的和尚，不一定会念经。

以让DeepSeek声名大噪的MLA架构为例，就是由团队中一位非常年轻的本土员工提出的。

这个架构的神奇之处在于大大降低了GPU显存的使用率，等于变相提高了算力，降低了训练成本。OpenAI的联合创始人看了MLA架构的论文后惊呼：这是今年AI行业最好的架构！

该架构的灵感来自一场讨论会，在研究完市面主流架构后，一位年轻的员工提出了一个全新的角度理解架构问题，大家听后都觉得有道理，便在CTO的组织下，进行可行性研究，没想到挖到个宝，真跑通了。

而“洋和尚”往往是硅谷次一级的人才，让他们搭建个主流架构，一点问题没有，干得又快又好，但说到创新，不好意思，硅谷公司聘他们的时候，就是来干苦活、累活的，创新是公司核心层的事儿。那些核心人才，国内的大厂别说挖，接触都接触不到的。

梁文锋还纠正了一个国内AI界流行的说法——中国的AI技术只比美国落后一到两年，好像加把劲就能追上。

但现实是，中国AI与美国的根本差距在创新上，每次都是美国人先搞出个什么东西，中国立刻跟进，仿个差不多的。这么搞永远有一到两年的差距，不可能追上。

梁文锋惋惜地表示，似乎大部分中国科技公司也习惯了这种模式，感觉追赶是理所当然的事情，领先反倒不正常了。

而DeepSeek在这波AI浪潮中，初心就不是捞一笔就跑，而是要走到技术的最前沿，去推动整个生态的发展。

考虑到DeepSeek是一家刚成立15个月的公司，我觉得梁文锋并非在“画饼”，是有可能实现的，毕竟他们已迈出了突破性的一步。

如果把DeepSeek放在更大宏达的产业转型中去分析，会发现过去中国人赚钱，大都靠运气和关系，导致中低端红利被吃干净了，未来再想发大财，更依赖技术与创新，创业的门槛正变得越来越高，想要不被时代淘汰，我们要时刻处于学习与进步之中，否则下一个被AI淘汰的就是我们自己。

欢迎关注我们的视频号

END

别忘了拉到最下面添加我们的粉丝群哦~