专栏名称: 刘润

刘润，润米咨询创始人，互联网转型专家，中国最大的私人商学院《刘润 5分钟商学院》创始人，前微软战略合作总监。刘润任多家知名企业（海尔、中远、恒基、百度等）战略顾问，通过培训、咨询、投资等方式，帮助传统企业顺利完成互联网转型，成就再次辉煌。

百度也干了

刘润 · 公众号 · 热门自媒体 · 2025-03-06 12:38

正文

今年以来，AI界仿佛摁了加速键。

就拿百度来说。前段时间，百度紧锣密鼓做了3件事：

第一，宣布文心一言4月即将全面免费。第二，文心下一代模型，也要开源了。第三，百度搜索整合了文心大模型和DeepSeek-R1深度思考模式，升级了百度APP。

(图片可上下滑动）

这一套组合拳，有点精彩。

因为，去年世界人工智能大会上，李彦宏还说开源是“智商税”。到了今年，在2月百度财报电话会上，百度摇身一变成了开源的支持者。现在，已然成了践行者。

所以不怪有网友评论： “那个坚定的开源反对者，也开源了。”

不只是百度。豆包、昆仑万维、通义千问等等大模型，不是在“开源”，就是在“开源”的路上。还有许多公司，比如华为、腾讯、京东，也纷纷在云计算上部署了DeepSeek模型。

2月的尾巴上，DeepSeek宣布启动“开源周”，每天开源一个代码。

开源。开源。开源。

开源到底是什么？为什么都在开源？开源到底有什么用处？还怎么挣钱？ 这几天，我好好研究了一下，发现背后的商业逻辑太有意思了。

今天。我们就来聊聊这件事。从哪开始呢？

按照国际惯例，就从一个故事说起吧。

开源是为了“自由”，不是为了“免费”

1991年，芬兰赫尔辛基。顶着大雪，一位大二学生打开了商店的门。他手里攥着圣诞节和生日得到的钱，准备买下一台计算机。

这台计算机价值3500美元，实在昂贵。他只能付出三分之一的“首付”，剩下的，3年之内还。

这位学生，就是后来 开源操作系统鼻祖Linux 的创始人，林纳斯·托瓦兹（Linus Torvalds）。

林纳斯买计算机，是为了能在家就能“黑”进学校，自由调用更强大的学校计算机。但想要做到这一步并不容易。

把计算机带回家，事情还没结束。除了解决钱的事，他还得不断修改操作系统，修改仿真程序。

系统方面，他花了169美元，订货了MINIX软件。当时主流系统是贝尔实验室开发出来的UNIX，但是UNIX闭源了。而MINIX则是一位大学教授基于UNIX开发出来的系统，并且教授把 源代码免费开放 给学生使用。

所以，MINIX就是比较早期的“开源”形态，林纳斯后来做出的Linux则是基于这种精神建立的。

接着，林纳斯在 MINIX 基础上，又花了一个多月的时间，从大学电脑上把熟悉的程序下载下来，调制出了自己的终端仿真程序。每当他想读新闻、看邮件，就运行自己的程序，来从大学的计算机里调出新闻、邮件。

很长一段时间，他的日常就是穿着睡衣，坐在计算机前，不断编程。

到了第二年，他不用再还计算机的尾款了。因为，他做出了Linux。

如果对Linux不熟悉，没关系。你一定熟悉淘宝、京东、QQ、微信。这些影响着全球数十亿人的服务，都运行在Linux系统上。像阿里云、腾讯云、亚马逊云服务等，也都是基于Linux系统构建的。

Linux本身并没有给他带来收入。做出来后，他就 把Linux的源代码公开 了。但是因为大家受益于他开发出来的这个操作系统，得知他还在还计算机的款，发起了众筹，帮他迅速攒好了钱。

开源，最开始并不是独独瞄准“免费”。

MINIX的教授是为了科研，Linux的林纳斯是为了好奇心。如果要说一个共同点，那么他们都是为了让更多人，都能不断在前人的基础上，自由开发。

当年为了买计算机，林纳斯参加过赫尔辛基清洁队，在大雪里锯掉长高的灌木丛，还当过邮差。又因为数学成绩一直很好，总是在拿学校的奖学金。

他很擅长，也很明白，想要拥有一些东西，应该怎样去交换。这些故事，都写在他的自传《乐者为王》里。

而开源的精神，最早来自 “自由软件之父”理查德·马修·斯托曼 。不仅是软件领域，其他领域，理查德也在不断呼吁共创、公开。他呼吁开发共创在线百科全书，促进了后来维基百科的诞生。

在这个时期，开源是一种精神： “人类知识必须共享，让每个人可以自由在任何地点、时间调用知识”。

到这里，你对于“开源”的概念，应该有了大概了解。

只是，并不是所有领域都适合开源。

比如，原研药就不能。

原研药的研发，大部分都不能开源

前段时间，我写了篇文章和你聊了聊医药集采。对这个话题感兴趣的朋友，可以在参考资料查看。

不看也没关系。重点就是，创新药、原研药的研发极其昂贵，动辄二十亿美金的成本。

如果每次原研药厂辛苦研发出来的新药，立刻全部开源，会出现什么情况？

都不需要仿制药企业重新研究了，直接就会有乌泱泱各种药厂，顺手一个复制粘贴， 超低成本迅速抢占市场。

所以，必须有20年的专利保护期，连仿制药都不给侵犯它的知识产权。

就算专利保护期到了，仿制药研制依然需要研发成本。虽然为了合规，原研药也会公开化合物的成分资料。但是从生产工艺、品控把握等等方面，依然是商业机密。也就是说，依然是“闭源”的。

只有这样，才能让企业在有限的时间里，尽量把成本赚回来。然后，进行相对公平的市场竞争。

如果开源了，商业模式覆盖不了成本，研发成本太高了。那么，还会有人愿意呕心沥血地研究吗？研究需要经费，谁来出呢？如此一来，就没人有动力不断研发新系统、提高运行效率了。

所以，可以说“闭源”这种方式，是一家企业或者项目，初期保护自身盈利能力和市场竞争力的手段。

和Linux相对的，是“闭源派”企业。他们的底层思路，其实就跟医药研发差不多。

软件业早期，大多数的商业软件是从“闭源”做起的，也就是源代码不会对外公开，自己来独家开发和维护。比如，微软的Windows系统。

那么，闭源到底怎么盈利的呢？

闭源，是为了守住盈利

作为一个之前在软件行业工作了十几年的人，闭着眼想了3秒，还是打开了deep research，帮我整理了闭源比较常见的盈利模式。

真方便。我翻译一下，简单说给你听听。

闭源的商业模式，常见有三种，分别是： 许可证、订阅制、打广告。

我们一个个来说。

第一种，是许可证授权销售。

就是通过一次性授权，或者批量授权让你用，从而获取收入。

你用过Office办公软件吗？一般是购买了软件的永久使用权限，比如Office 2019或Office 2021。

这种往往是一次性付费。

第二种，就是订阅制和SaaS服务。

订阅，是互联网快速发展的产物。一般来说是根据选择的服务类型，分为按时间或者按需求来收费。

所谓的SaaS服务收费，则是不需要下载任何软件，在线也能同样使用软件的功能和服务。收费模式也是按订阅或者按需求比较多。

OpenAI之前的模式就是典型例子： 基础版本免费，高级版本收费。

GPT-3免费使用，但是高级版本ChatGPT Plus，就需要按月订阅收费了。

另一种，则是按照“调用量”收取费用，你用多少收多少。比如ChatGPT-4的API，输入1000tokens，收费0.03美元。

OpenAI就是通过这种专有模型的API服务， 短时间积累了大量付费用户。 根据财报，它的营收从2022年的2亿美元，跃升到了2024年的37亿美元，增长了几十倍。

第三种，则是软硬件绑定和广告。

很典型的，就是任天堂的Switch游戏机。

很多开发出来的独立游戏，只有用Switch才能玩，就是游戏机平台独占的游戏。游戏是闭源产品，游戏机是硬件，把两者绑定销售。

而广告，就更容易理解了。我们手机里很多免费的应用软件，你会发现里面镶嵌这很多广告。这又是一部分收费形式。

怎么样，是不是快速唤起了很多平时使用各种软件的回忆？

闭源的 商业模式 ，不复杂，其实就是对“软件使用权”收费。

而这样做，可以直接且持续地，为厂商带来源源不断的流水。获得的利润，又能重新投入新研发，进入正循环。

那，既然闭源这么好，为什么现在这些企业都在接二连三地争相开源呢？

“不要重复造轮子”

的确，开源起初不怎么赚钱。就比如最开始的MINIX、Linux系统，开放是为了做学术、满足好奇心。

但是开源这件事发展到今天，为什么变得更有价值了呢？这是因为后来， 有了开源社区的出现。

比如，最大的开源社区，2008年上线的GitHub。

作为一个开源协作的里程碑式平台，人人可以在平台上提交代码、报告漏洞、参与讨论。这样就会形成一种协作机制，大大降低了编程的门槛。随着越来越多的人参与共创，越来越多的视角补充了上来，很多软件就是在GitHub上，从封闭顺畅走向开源的。

给你打个比方。

还记得以前读书的时候，总有一些学霸，你不知道他们怎么学习的，总之他们天天睡觉，上课偶尔还会翘课，但是成绩就特别好。

但是有一天，他们把他们的学习方法论开放给你了。

你发现，原来把老师周二发的练习题做10遍之后，你也会有自己的做题方法论。原来遇到不懂的题不要先看答案，用尽所有办法先自己证明一遍。就算是你原本是个文科生，看了理科学霸的笔记，也能去做物理考试题了。

GitHub社区，就是这样的一个， 把学霸具体怎么做的步骤，一步步开源给你的地方。甚至，你提交了“作业”后，可能学霸还会帮你改改。

Linux、Swift、Ruby等等开源项目，往往会优先在GitHub上开源代码。全球顶级的科技公司，比如苹果、脸书、阿里巴巴等加入了GitHub，在上面发布一些项目代码。上面还聚集了很多编程大佬，比如Linux的发明者林纳斯，被称作Android之神的“J神”，以及活跃的各大大厂员工，不胜枚举。

老师把答案捂得再紧，学霸也能给你推导出来。

开源社区，渐渐形成了一种“开源”文化。算法世界，从此越来越透明、互通。

那么，这样不断循环下去，就会出现一件事： 算法，无法100%闭源。

闭源，或许是没法真的“闭源”的

什么意思？

就算A研发出来的大模型是闭源的，其他BCDE等等公司，依然可以开发。只会慢一点，但不会完全做不到。

可能有点抽象。我们这样来看。如果只是看当下这个时点，你可能会有一种感觉，那就是 “国内的大模型似乎一直追不上国外的先进技术”。

但如果我们把时间线具体拉出来呢？你会发现，虽然最新的技术或许没跟上， 但是几个月前的国外版本，我们如今也自己做出来了。

比如豆包大模型，在中文理解和生成能力上，某些场景下已经能够超越早期的国际模型。又比如百度的文心一言、清华智谱的ChatGLM4等模型，在多模态能力上也取得了突破，整体逼近GPT-4。

现象背后，是有原因的。

作为一个1985年就开始学编程的商业顾问，我也去咨询了一些算法工程师朋友，和你分享两个可能原因，也欢迎你在评论区补充。

第一，学术界在理论创新上，常常领先工业界。

虽然从模型开发数量上来看，工业界占据了主导地位。但是论基础研究、理论创新和前沿探索上，学术界似乎更胜一筹。

学术界领先的程度，比起工业界，要以年计算。

比如现代大语言模型的基础，Transformer架构，早在2017年就在《Attention is All You Need》的学术论文里被提出了。工业界在2020年左右才开始大规模训练。又比如深度学习里的反向传播算法、强化学习的理论基础等等，都是学术界提出，然后逐步完善的。

而做学术研究的人，核心目标是发论文。那么，大部分的先进技术，想法本身是 公开的。

所以，原理性的知识，很难被完全封锁。其次，高校之间的流通，也会带着技术流通。

等着论文出来，工业界又可以脚跟脚找到研发支点。所以最后比的，不是核心技术，而是谁能真正让技术变成有商业价值的产品、真正让技术推广起来。

第二，人员流动性强。

除了学术界，其实在各大厂商、各大企业之间，相关技术人才的流动性也很强。

从A公司到B公司，再到C公司。来来去去，技术和知识也跟着流动。不仅如此，还可以选择私下交流，或者花钱请顾问，内部细节，也有可能被拿到手。

所以，核心技术，其实很难被100%封锁的。而社区文化，大大加速了互通、共创的进度。

现在，在人工智能领域，开源已经 不仅仅是指开放源代码。

于是，除了源代码的开放，进一步，你训练用的什么数据、从哪里整理的干净数据集，也可以开源。就像是把菜谱公开，让其他厨师也能跟着炒菜。

更进一步，则是直接把一盘熟菜端上桌，你尝尝，觉得欠点辣味。你不用重起炉灶，只需要思考往上加辣椒油还是辣椒粉就行。

所以，开源还包括已经训练好的模型参数权重，直接开放下载，别人就不用从零开始训练，拿来即用。

与此同时，越来越多的模型和数据的开源社区平台也开始出现。比如这几年很火的AI模型开放共享平台，Hugging Face Hub，上面托管了90万个机器学习模型、30万个应用程序、20多万的数据集，都对公众开放。

类似的还有数据集和竞赛平台Kaggle、TensorFlow Hub、PyTorch Hub等等，他们共同组建了一个庞大的AI领域的开源基础设施。

社区的出现，这就好比原本只有你和你的团队，可能十几个人在研究一款配方，现在开源到社区，扩张到有1000人、甚至1万人在帮你优化配方了。

这样的进化速度，远非闭源项目可比，这就是开源的巨大优势。

这也解释了，DeepSeek为何开展开源项目，这与它此前从开源中积累的经验有关，但更重要的是，这个方向能 加速其模型训练。

另外，社区平台本身，就有一定的变现能力。从中诞生了各种可以变现的培训课程，平台的赞助功能还能让优秀的创作者接受用户的捐赠。

但是随着人和项目越来越多，社区平台也遇到了问题。

这就像是，当可口可乐的配方、肯德基的配方、片仔癀的配方被人公开的时候，难道不会存在侵权的问题吗？怎么来证明呢？

有一种通用的方法，那就是： 许可证授权。

自由传播，靠的是许可证

开源的宽松程度，是通过开源许可证来决定的。这是一种法律框架，开发者可以自己去选择开放程度大小，那么使用者就得遵循这套规律。

（图片来自网络）

开源许可证有很多，目前商业世界里比较常见的有三种，分别是： GPL、MIT、Apache。

第一种，GPL，又叫做“通用公共许可证”。

也就是咱们开头提到的。“自由软件基金会”推出的许可。

它更像是一种“自由契约”，带着创始人理查德的精神，它赋予用户自由使用、修改和分享的权利，但是也要求任何基于GPL代码衍生的作品，也必须保持同样开放、自由的状态。

GPL又被叫做“传染性”许可证。无论传到多少代，都要继续把自由、开源传递下去。

比如Linux用的就是GPL许可，这种许可模式，促成了超级庞大的自由软件生态。

第二种，Apache，加入了专利授权和保护条款。

你依然可以自由使用、修改，而且在同时，不用担心专利问题带来的法律风险了。

所以许多企业都比较喜欢用Apache。它能提供双重安心。

第三种，MIT，则是比较宽松的许可证。

DeepSeek用的就是这一种。

MIT不限制你使用和分发，只不过，要求你在用的时候，署名。

所以，你会在各大平台上，看到“接入DeepSeek-R1”这样的字样。

这很有意思。天下没有免费的午餐。每一种要求，背后都有它存在的目的。

不论是严格的GPL，暖男般的Apache，还是要求署名的MIT，你有没有发现，他们都有自己的条件。

而这些条件， 其实就是在引导开源模式的赚钱思路。

前面提到，开源是因为研发费用太过高昂。那如果能找到在开源的同时，也能带来源源不断流水和用户粘性的商业模式呢？

只要用其他方法，能把钱挣回来，那为什么不让这个知识开放让全人类享受呢？越来越多的人参与创造，参与测试，人类不就进步更快吗？

这，其实就是开源的核心驱动力。

那么，具体怎样做，才能让开源也能赚钱？

让不同开源程度的产品，承担不同的角色。

开源是可以盈利的

开源，那就意味着“代码”是免费的，“模型”是免费的。那么，什么可以收费呢？ 更高级的技术和服务。

免费，降低了使用门槛。但是但凡你开始使用了，你就会存在更多的需求。而满足你的需求，就可以坐下收费了。

比如，教人怎么用。

有的企业不想用云服务，把数据完全掌握在自己手里，就想着把完全开源的代码在公司内部电脑上部署开发。

代码免费拿走没关系，但是，部署完成后，这么复杂的内容到底怎么调试，怎么改造，怎么定制开发，遇到问题怎么修复，一旦系统宕机了，谁来解决？

这些就被打包成了“服务”，如同一份保险，能确保系统正常运转，“遇到问题由我来处理”。通过售卖这样的服务，也能盈利。

又比如，鼻祖可以推出云服务版本。

开源之后，作为发布者，相当于这个项目的“鼻祖”。很多人会基于鼻祖的版本进行延展分支，但大家往往更信赖“鼻祖”版本。

所以，鼻祖推出云服务版本，就像开发APP一样，用户可以使用，还能调用API等。

用户使用它就可以收费，若有需求，还能提供更多增值服务。

还比如，把免费开源的部分当做“引流品”。

一套是免费版，包含核心部分，所有代码毫无保留开源出来，用户下载到电脑上就能直接使用，另一套则是商业化版本。

对于企业用户而言，他们的需求往往不止免费版的这些功能，还涉及企业权限管理、多服务器部署等诸多复杂功能。

于是，发行两个版本：免费版面向所有人公开，可随意使用，代码能全部拿走；商业版则是为付费企业用户量身定制。

如果市面上有同样类型的模型，他们闭源了，你免费开源，自然会虹吸过来大量的人来使用你。用着觉得好用，传播起来，又可以触达需要商业版的用户。

再比如，社区众筹和捐赠。

就像Linux最开始的募捐，自由软件之父鼓捣的基金会，通过接受企业赞助和个人捐款，从而支持项目持续发展。

所以，不用担心开源赚不到钱。开源降低了门槛之后，还可以通过提供服务、高级功能、定制开发等等后续“配套”赚钱。后续配套赚的钱再重新投入技术开发，再加上越来越多的人参与使用，技术进步就越滚越快。

那么，随着开源的知识越来越多，闭源的局限，就被放大了。人工智能时代来临， 闭源，就有可能扎堆出现效率问题。

理解了这个，你就能明白，为什么企业开始成堆开源了。

有意思的是，所谓的开源，也很少有“真正完全开源”的。什么意思？

当颗粒度足够细，你会发现，开源后的使用权，依然牢牢掌握在开发技术的厂商手里。

我们接着聊。

开源，也不会是完全开源的

比如，模型的开源， 到底开源到什么程度？

一个模型，往往是由几千亿个数字组成。每个数字有一定区间范围。这里为什么这个值？那里为什么那个值？核心的原因和生产能力，其实还是握在厂商手里的。

再加上，版本不断更新，一两个月就会更新一次。什么时候停止共享最新的数据，什么时候也可能停止当下的开源。

所以，如果你去看这些宣布开源的企业，仔细阅读你就会发现， 他们并 不是把所有的东西都开源了。

而开源的好处，是把一个做得还可以的模型，拿来给大家用。别人用了觉得好，就会开始直接用你的方案去做企业级产品。 做得多了，就更认可你。

这家公司在你的土壤上种下了一束玫瑰，那家公司在旁边种了棵柳树。渐渐地，你这片土壤就长出了各样的生态。之后，玫瑰和柳树想要长得好，都得看你的土壤营养够不够丰富。

所以你就能理解，百度部分开源，建立生态。OpenAI最开始是开源的，到后来又闭源。

有的公司是为了确保领先优势，商业变现为主。有的公司是新版本闭源，旧版本开源。在组合拳的打法下，寻找一种变现和技术的平衡。

既然开源有这么多好处，那， 是不是所有的公司都会纷纷把代码、模型、系统开源起来了？

我觉得，不太可能。

并非所有人都是开源派

不过，并不是所有人都支持开源。

Linux创始人林纳斯曾在一封给微软副总裁Mundie的信里这样写道：

“不知Mundie是否听过牛顿？牛顿说：‘我之所以能够看得更远，是因为我站在巨人肩膀上的缘故’。”

即便如此，微软副总裁Mundie依然公开痛批说， 开源是一件破坏知识产权的行为。不支持，不看好。

早期微软，是坚定的“闭源派”。这的确有他们的道理，因为开源，确实也存在不少问题。

比如，安全隐患。

不光是“好人”在用模型进行愉快的开发、协作，“坏人”也拥有同样的权利，来使用、修改模型。许可证，防君子，不防小人。

比如，恐怖分子，可能使用开源AI去研究生物武器。比如，不法分子雇佣黑客，向友商发动网络攻击。又比如，医疗领域的患者隐私信息等等。

还比如，研发成本的回收压力。

对于投入巨资来研发AI的公司，就像原研药厂一样，开源会大大削弱他们的优势。原本通过闭源熬走小玩家，现在一开源，小玩家也能上来分蛋糕了。

你就能理解，为什么一些顶尖模型，比如GPT-4会突然选择闭源。因为在前期开源引流后，确实存在变现困境，那就需要回归闭源的盈利模式，得回收数亿美元的研发投入。

所以我想，至少， 微软的核心业务就不太可能开源。

比如，已经处于市场主导地位的Windows系统。Windows系统的代码庞大且复杂，开源后，微软还需要额外投入大量资源来管理开源社区、修复漏洞和维护代码。有的代码还有专利，开源后是否侵犯专利，又是一串问题。

所以目前来看，哪怕是老版本的Windows系统，开源出来还是有些得不偿失。

不过有意思的是，微软直接把最大的开源社区GitHub给买了，还是融入到了这个开源世界。

百度也干了

正文

请到「今天看啥」查看全文