专栏名称: 刘润
刘润,润米咨询创始人,互联网转型专家,中国最大的私人商学院《刘润 5分钟商学院》创始人,前微软战略合作总监。刘润任多家知名企业(海尔、中远、恒基、百度等)战略顾问,通过培训、咨询、投资等方式,帮助传统企业顺利完成互联网转型,成就再次辉煌。
目录
相关文章推荐
界面新闻  ·  特斯拉日本停售Model S和Model X ·  9 小时前  
界面新闻  ·  DHL今年将在德国裁员近8000人 ·  10 小时前  
界面新闻  ·  一周之内第二家!极氪悬赏500万元打击黑公关 ... ·  14 小时前  
界面新闻  ·  OpenAI拟推出“博士水平”的AI ... ·  19 小时前  
51好读  ›  专栏  ›  刘润

百度也干了

刘润  · 公众号  · 热门自媒体  · 2025-03-06 12:38

正文


图片 今年以来,AI界仿佛摁了加速键。

就拿百度来说。前段时间,百度紧锣密鼓做了3件事:
第一,宣布文心一言4月即将全面免费。第二,文心下一代模型,也要开源了。第三,百度搜索整合了文心大模型和DeepSeek-R1深度思考模式,升级了百度APP。
(图片可上下滑动)
这一套组合拳,有点精彩。
因为,去年世界人工智能大会上,李彦宏还说开源是“智商税”。到了今年,在2月百度财报电话会上,百度摇身一变成了开源的支持者。现在,已然成了践行者。
所以不怪有网友评论: “那个坚定的开源反对者,也开源了。”
不只是百度。豆包、昆仑万维、通义千问等等大模型,不是在“开源”,就是在“开源”的路上。还有许多公司,比如华为、腾讯、京东,也纷纷在云计算上部署了DeepSeek模型。
2月的尾巴上,DeepSeek宣布启动“开源周”,每天开源一个代码。
开源。开源。开源。
开源到底是什么?为什么都在开源?开源到底有什么用处?还怎么挣钱? 这几天,我好好研究了一下,发现背后的商业逻辑太有意思了。
今天。我们就来聊聊这件事。从哪开始呢?
按照国际惯例,就从一个故事说起吧。

图片

图片 开源是为了“自由”,不是为了“免费”
1991年,芬兰赫尔辛基。顶着大雪,一位大二学生打开了商店的门。他手里攥着圣诞节和生日得到的钱,准备买下一台计算机。
这台计算机价值3500美元,实在昂贵。他只能付出三分之一的“首付”,剩下的,3年之内还。
这位学生,就是后来 开源操作系统鼻祖Linux 的创始人,林纳斯·托瓦兹(Linus Torvalds)。
林纳斯买计算机,是为了能在家就能“黑”进学校,自由调用更强大的学校计算机。但想要做到这一步并不容易。
把计算机带回家,事情还没结束。除了解决钱的事,他还得不断修改操作系统,修改仿真程序。
系统方面,他花了169美元,订货了MINIX软件。当时主流系统是贝尔实验室开发出来的UNIX,但是UNIX闭源了。而MINIX则是一位大学教授基于UNIX开发出来的系统,并且教授把 源代码免费开放 给学生使用。
所以,MINIX就是比较早期的“开源”形态,林纳斯后来做出的Linux则是基于这种精神建立的。
接着,林纳斯在 MINIX 基础上,又花了一个多月的时间,从大学电脑上把熟悉的程序下载下来,调制出了自己的终端仿真程序。每当他想读新闻、看邮件,就运行自己的程序,来从大学的计算机里调出新闻、邮件。
很长一段时间,他的日常就是穿着睡衣,坐在计算机前,不断编程。
到了第二年,他不用再还计算机的尾款了。因为,他做出了Linux。
如果对Linux不熟悉,没关系。你一定熟悉淘宝、京东、QQ、微信。这些影响着全球数十亿人的服务,都运行在Linux系统上。像阿里云、腾讯云、亚马逊云服务等,也都是基于Linux系统构建的。
Linux本身并没有给他带来收入。做出来后,他就 把Linux的源代码公开 了。但是因为大家受益于他开发出来的这个操作系统,得知他还在还计算机的款,发起了众筹,帮他迅速攒好了钱。
开源,最开始并不是独独瞄准“免费”。
MINIX的教授是为了科研,Linux的林纳斯是为了好奇心。如果要说一个共同点,那么他们都是为了让更多人,都能不断在前人的基础上,自由开发。
当年为了买计算机,林纳斯参加过赫尔辛基清洁队,在大雪里锯掉长高的灌木丛,还当过邮差。又因为数学成绩一直很好,总是在拿学校的奖学金。
他很擅长,也很明白,想要拥有一些东西,应该怎样去交换。 这些故事,都写在他的自传《乐者为王》里。
而开源的精神,最早来自 “自由软件之父”理查德·马修·斯托曼 。不仅是软件领域,其他领域,理查德也在不断呼吁共创、公开。他呼吁开发共创在线百科全书,促进了后来维基百科的诞生。
在这个时期,开源是一种精神: “人类知识必须共享,让每个人可以自由在任何地点、时间调用知识”。
到这里,你对于“开源”的概念,应该有了大概了解。
只是,并不是所有领域都适合开源。
比如,原研药就不能。

图片

图片

原研药的研发,大部分都不能开源
前段时间,我写了篇文章和你聊了聊医药集采。对这个话题感兴趣的朋友,可以在参考资料查看。
不看也没关系。重点就是,创新药、原研药的研发极其昂贵,动辄二十亿美金的成本。
如果每次原研药厂辛苦研发出来的新药,立刻全部开源,会出现什么情况?
都不需要仿制药企业重新研究了,直接就会有乌泱泱各种药厂,顺手一个复制粘贴, 超低成本迅速抢占市场。
所以,必须有20年的专利保护期,连仿制药都不给侵犯它的知识产权。
就算专利保护期到了,仿制药研制依然需要研发成本。虽然为了合规,原研药也会公开化合物的成分资料。但是从生产工艺、品控把握等等方面,依然是商业机密。也就是说,依然是“闭源”的。
只有这样,才能让企业在有限的时间里,尽量把成本赚回来。然后,进行相对公平的市场竞争。
如果开源了,商业模式覆盖不了成本,研发成本太高了。那么,还会有人愿意呕心沥血地研究吗?研究需要经费,谁来出呢?如此一来,就没人有动力不断研发新系统、提高运行效率了。
所以,可以说“闭源”这种方式,是一家企业或者项目,初期保护自身盈利能力和市场竞争力的手段。
和Linux相对的,是“闭源派”企业。他们的底层思路,其实就跟医药研发差不多。
软件业早期,大多数的商业软件是从“闭源”做起的,也就是源代码不会对外公开,自己来独家开发和维护。比如,微软的Windows系统。
那么,闭源到底怎么盈利的呢?

图片

图片

闭源,是为了守住盈利
作为一个之前在软件行业工作了十几年的人,闭着眼想了3秒,还是打开了deep research,帮我整理了闭源比较常见的盈利模式。
真方便。我翻译一下,简单说给你听听。
闭源的商业模式,常见有三种,分别是: 许可证、订阅制、打广告。
我们一个个来说。
第一种,是许可证授权销售。
就是通过一次性授权,或者批量授权让你用,从而获取收入。
你用过Office办公软件吗?一般是购买了软件的永久使用权限,比如Office 2019或Office 2021。
这种往往是一次性付费。
第二种,就是订阅制和SaaS服务。
订阅,是互联网快速发展的产物。一般来说是根据选择的服务类型,分为按时间或者按需求来收费。
所谓的SaaS服务收费,则是不需要下载任何软件,在线也能同样使用软件的功能和服务。收费模式也是按订阅或者按需求比较多。
OpenAI之前的模式就是典型例子: 基础版本免费,高级版本收费。
GPT-3免费使用,但是高级版本ChatGPT Plus,就需要按月订阅收费了。
另一种,则是按照“调用量”收取费用,你用多少收多少。比如ChatGPT-4的API,输入1000tokens,收费0.03美元。
OpenAI就是通过这种专有模型的API服务, 短时间积累了大量付费用户。 根据财报,它的营收从2022年的2亿美元,跃升到了2024年的37亿美元,增长了几十倍。
第三种,则是软硬件绑定和广告。
很典型的,就是任天堂的Switch游戏机。
很多开发出来的独立游戏,只有用Switch才能玩,就是游戏机平台独占的游戏。游戏是闭源产品,游戏机是硬件,把两者绑定销售。
而广告,就更容易理解了。我们手机里很多免费的应用软件,你会发现里面镶嵌这很多广告。这又是一部分收费形式。
怎么样,是不是快速唤起了很多平时使用各种软件的回忆?
闭源的 商业模式 ,不复杂,其实就是对“软件使用权”收费。
而这样做,可以直接且持续地,为厂商带来源源不断的流水。获得的利润,又能重新投入新研发,进入正循环。
那,既然闭源这么好,为什么现在这些企业都在接二连三地争相开源呢?

图片

图片

“不要重复造轮子”
的确,开源起初不怎么赚钱。就比如最开始的MINIX、Linux系统,开放是为了做学术、满足好奇心。
但是开源这件事发展到今天,为什么变得更有价值了呢?这是因为后来, 有了开源社区的出现。
比如,最大的开源社区,2008年上线的GitHub。
作为一个开源协作的里程碑式平台,人人可以在平台上提交代码、报告漏洞、参与讨论。这样就会形成一种协作机制,大大降低了编程的门槛。随着越来越多的人参与共创,越来越多的视角补充了上来,很多软件就是在GitHub上,从封闭顺畅走向开源的。
给你打个比方。
还记得以前读书的时候,总有一些学霸,你不知道他们怎么学习的,总之他们天天睡觉,上课偶尔还会翘课,但是成绩就特别好。
但是有一天,他们把他们的学习方法论开放给你了。
你发现,原来把老师周二发的练习题做10遍之后,你也会有自己的做题方法论。原来遇到不懂的题不要先看答案,用尽所有办法先自己证明一遍。就算是你原本是个文科生,看了理科学霸的笔记,也能去做物理考试题了。
GitHub社区,就是这样的一个, 把学霸具体怎么做的步骤,一步步开源给你的地方。甚至,你提交了“作业”后,可能学霸还会帮你改改。
Linux、Swift、Ruby等等开源项目,往往会优先在GitHub上开源代码。全球顶级的科技公司,比如苹果、脸书、阿里巴巴等加入了GitHub,在上面发布一些项目代码。上面还聚集了很多编程大佬,比如Linux的发明者林纳斯,被称作Android之神的“J神”,以及活跃的各大大厂员工,不胜枚举。
老师把答案捂得再紧,学霸也能给你推导出来。
开源社区,渐渐形成了一种“开源”文化。算法世界,从此越来越透明、互通。
那么,这样不断循环下去,就会出现一件事: 算法,无法100%闭源。

图片

图片

闭源,或许是没法真的“闭源”的
什么意思?
就算A研发出来的大模型是闭源的,其他BCDE等等公司,依然可以开发。只会慢一点,但不会完全做不到。
可能有点抽象。我们这样来看。如果只是看当下这个时点,你可能会有一种感觉,那就是 “国内的大模型似乎一直追不上国外的先进技术”。
但如果我们把时间线具体拉出来呢?你会发现,虽然最新的技术或许没跟上, 但是几个月前的国外版本,我们如今也自己做出来了。
比如豆包大模型,在中文理解和生成能力上,某些场景下已经能够超越早期的国际模型。又比如百度的文心一言、清华智谱的ChatGLM4等模型,在多模态能力上也取得了突破,整体逼近GPT-4。
现象背后,是有原因的。
作为一个1985年就开始学编程的商业顾问,我也去咨询了一些算法工程师朋友,和你分享两个可能原因,也欢迎你在评论区补充。
第一,学术界在理论创新上,常常领先工业界。
虽然从模型开发数量上来看,工业界占据了主导地位。但是论基础研究、理论创新和前沿探索上,学术界似乎更胜一筹。
学术界领先的程度,比起工业界,要以年计算。
比如现代大语言模型的基础,Transformer架构,早在2017年就在《Attention is All You Need》的学术论文里被提出了。工业界在2020年左右才开始大规模训练。又比如深度学习里的反向传播算法、强化学习的理论基础等等,都是学术界提出,然后逐步完善的。
而做学术研究的人,核心目标是发论文。那么,大部分的先进技术,想法本身是 公开的。
所以,原理性的知识,很难被完全封锁。其次,高校之间的流通,也会带着技术流通。
等着论文出来,工业界又可以脚跟脚找到研发支点。所以最后比的,不是核心技术,而是谁能真正让技术变成有商业价值的产品、真正让技术推广起来。
第二,人员流动性强。
除了学术界,其实在各大厂商、各大企业之间,相关技术人才的流动性也很强。
从A公司到B公司,再到C公司。来来去去,技术和知识也跟着流动。不仅如此,还可以选择私下交流,或者花钱请顾问,内部细节,也有可能被拿到手。
所以,核心技术,其实很难被100%封锁的。而社区文化,大大加速了互通、共创的进度。
现在,在人工智能领域,开源已经 不仅仅是指开放源代码。
于是,除了源代码的开放,进一步,你训练用的什么数据、从哪里整理的干净数据集,也可以开源。就像是把菜谱公开,让其他厨师也能跟着炒菜。
更进一步,则是直接把一盘熟菜端上桌,你尝尝,觉得欠点辣味。你不用重起炉灶,只需要思考往上加辣椒油还是辣椒粉就行。
所以,开源还包括已经训练好的模型参数权重,直接开放下载,别人就不用从零开始训练,拿来即用。
与此同时,越来越多的模型和数据的开源社区平台也开始出现。比如这几年很火的AI模型开放共享平台,Hugging Face Hub,上面托管了90万个机器学习模型、30万个应用程序、20多万的数据集,都对公众开放。
类似的还有数据集和竞赛平台Kaggle、TensorFlow Hub、PyTorch Hub等等,他们共同组建了一个庞大的AI领域的开源基础设施。
社区的出现,这就好比原本只有你和你的团队,可能十几个人在研究一款配方,现在开源到社区,扩张到有1000人、甚至1万人在帮你优化配方了。
这样的进化速度,远非闭源项目可比,这就是开源的巨大优势。
这也解释了,DeepSeek为何开展开源项目,这与它此前从开源中积累的经验有关,但更重要的是,这个方向能 加速其模型训练。
另外,社区平台本身,就有一定的变现能力。从中诞生了各种可以变现的培训课程,平台的赞助功能还能让优秀的创作者接受用户的捐赠。
但是随着人和项目越来越多,社区平台也遇到了问题。
这就像是,当可口可乐的配方、肯德基的配方、片仔癀的配方被人公开的时候,难道不会存在侵权的问题吗?怎么来证明呢?
有一种通用的方法,那就是: 许可证授权。

图片

图片

自由传播,靠的是许可证
开源的宽松程度,是通过开源许可证来决定的。这是一种法律框架,开发者可以自己去选择开放程度大小,那么使用者就得遵循这套规律。
(图片来自网络)
开源许可证有很多,目前商业世界里比较常见的有三种,分别是: GPL、MIT、Apache。
第一种,GPL,又叫做“通用公共许可证”。
也就是咱们开头提到的。“自由软件基金会”推出的许可。
它更像是一种“自由契约”,带着创始人理查德的精神,它赋予用户自由使用、修改和分享的权利,但是也要求任何基于GPL代码衍生的作品,也必须保持同样开放、自由的状态。
GPL又被叫做“传染性”许可证。无论传到多少代,都要继续把自由、开源传递下去。
比如Linux用的就是GPL许可,这种许可模式,促成了超级庞大的自由软件生态。
第二种,Apache,加入了专利授权和保护条款。
你依然可以自由使用、修改,而且在同时,不用担心专利问题带来的法律风险了。
所以许多企业都比较喜欢用Apache。它能提供双重安心。
第三种,MIT,则是比较宽松的许可证。
DeepSeek用的就是这一种。
MIT不限制你使用和分发,只不过,要求你在用的时候,署名
所以,你会在各大平台上,看到“接入DeepSeek-R1”这样的字样。
这很有意思。天下没有免费的午餐。每一种要求,背后都有它存在的目的。
不论是严格的GPL,暖男般的Apache,还是要求署名的MIT,你有没有发现,他们都有自己的条件。
而这些条件, 其实就是在引导开源模式的赚钱思路。
前面提到,开源是因为研发费用太过高昂。那如果能找到在开源的同时,也能带来源源不断流水和用户粘性的商业模式呢?
只要用其他方法,能把钱挣回来,那为什么不让这个知识开放让全人类享受呢?越来越多的人参与创造,参与测试,人类不就进步更快吗?
这,其实就是开源的核心驱动力。
那么,具体怎样做,才能让开源也能赚钱?
让不同开源程度的产品,承担不同的角色。

图片

图片

开源是可以盈利的
开源,那就意味着“代码”是免费的,“模型”是免费的。那么,什么可以收费呢? 更高级的技术和服务。
免费,降低了使用门槛。但是但凡你开始使用了,你就会存在更多的需求。而满足你的需求,就可以坐下收费了。
比如,教人怎么用。
有的企业不想用云服务,把数据完全掌握在自己手里,就想着把完全开源的代码在公司内部电脑上部署开发。
代码免费拿走没关系,但是,部署完成后,这么复杂的内容到底怎么调试,怎么改造,怎么定制开发,遇到问题怎么修复,一旦系统宕机了,谁来解决?
这些就被打包成了“服务”,如同一份保险,能确保系统正常运转,“遇到问题由我来处理”。通过售卖这样的服务,也能盈利。
又比如,鼻祖可以推出云服务版本。
开源之后,作为发布者,相当于这个项目的“鼻祖”。很多人会基于鼻祖的版本进行延展分支,但大家往往更信赖“鼻祖”版本。
所以,鼻祖推出云服务版本,就像开发APP一样,用户可以使用,还能调用API等。
用户使用它就可以收费,若有需求,还能提供更多增值服务。
还比如,把免费开源的部分当做“引流品”。
一套是免费版,包含核心部分,所有代码毫无保留开源出来,用户下载到电脑上就能直接使用,另一套则是商业化版本。
对于企业用户而言,他们的需求往往不止免费版的这些功能,还涉及企业权限管理、多服务器部署等诸多复杂功能。
于是,发行两个版本:免费版面向所有人公开,可随意使用,代码能全部拿走;商业版则是为付费企业用户量身定制。
如果市面上有同样类型的模型,他们闭源了,你免费开源,自然会虹吸过来大量的人来使用你。用着觉得好用,传播起来,又可以触达需要商业版的用户。
再比如,社区众筹和捐赠。
就像Linux最开始的募捐,自由软件之父鼓捣的基金会,通过接受企业赞助和个人捐款,从而支持项目持续发展。
所以,不用担心开源赚不到钱。开源降低了门槛之后,还可以通过提供服务、高级功能、定制开发等等后续“配套”赚钱。后续配套赚的钱再重新投入技术开发,再加上越来越多的人参与使用,技术进步就越滚越快。
那么,随着开源的知识越来越多,闭源的局限,就被放大了。人工智能时代来临, 闭源,就有可能扎堆出现效率问题。
理解了这个,你就能明白,为什么企业开始成堆开源了。
有意思的是,所谓的开源,也很少有“真正完全开源”的。什么意思?
当颗粒度足够细,你会发现,开源后的使用权,依然牢牢掌握在开发技术的厂商手里。
我们接着聊。

图片

图片

开源,也不会是完全开源的
比如,模型的开源, 到底开源到什么程度?
一个模型,往往是由几千亿个数字组成。每个数字有一定区间范围。这里为什么这个值?那里为什么那个值?核心的原因和生产能力,其实还是握在厂商手里的。
再加上,版本不断更新,一两个月就会更新一次。什么时候停止共享最新的数据,什么时候也可能停止当下的开源。
所以,如果你去看这些宣布开源的企业,仔细阅读你就会发现, 他们并 不是把所有的东西都开源了。
而开源的好处,是把一个做得还可以的模型,拿来给大家用。别人用了觉得好,就会开始直接用你的方案去做企业级产品。 做得多了,就更认可你。
这家公司在你的土壤上种下了一束玫瑰,那家公司在旁边种了棵柳树。渐渐地,你这片土壤就长出了各样的生态。之后,玫瑰和柳树想要长得好,都得看你的土壤营养够不够丰富。
所以你就能理解,百度部分开源,建立生态。OpenAI最开始是开源的,到后来又闭源。
有的公司是为了确保领先优势,商业变现为主。有的公司是新版本闭源,旧版本开源。在组合拳的打法下,寻找一种变现和技术的平衡。
既然开源有这么多好处,那, 是不是所有的公司都会纷纷把代码、模型、系统开源起来了?
我觉得,不太可能。

图片

图片

并非所有人都是开源派
不过,并不是所有人都支持开源。
Linux创始人林纳斯曾在一封给微软副总裁Mundie的信里这样写道:
“不知Mundie是否听过牛顿?牛顿说:‘我之所以能够看得更远,是因为我站在巨人肩膀上的缘故’。”
即便如此,微软副总裁Mundie依然公开痛批说, 开源是一件破坏知识产权的行为。不支持,不看好。
早期微软,是坚定的“闭源派”。这的确有他们的道理,因为开源,确实也存在不少问题。
比如,安全隐患。
不光是“好人”在用模型进行愉快的开发、协作,“坏人”也拥有同样的权利,来使用、修改模型。许可证,防君子,不防小人。
比如,恐怖分子,可能使用开源AI去研究生物武器。比如,不法分子雇佣黑客,向友商发动网络攻击。又比如,医疗领域的患者隐私信息等等。
还比如,研发成本的回收压力。
对于投入巨资来研发AI的公司,就像原研药厂一样,开源会大大削弱他们的优势。原本通过闭源熬走小玩家,现在一开源,小玩家也能上来分蛋糕了。
你就能理解,为什么一些顶尖模型,比如GPT-4会突然选择闭源。因为在前期开源引流后,确实存在变现困境,那就需要回归闭源的盈利模式,得回收数亿美元的研发投入。
所以我想,至少, 微软的核心业务就不太可能开源。
比如,已经处于市场主导地位的Windows系统。Windows系统的代码庞大且复杂,开源后,微软还需要额外投入大量资源来管理开源社区、修复漏洞和维护代码。有的代码还有专利,开源后是否侵犯专利,又是一串问题。
所以目前来看,哪怕是老版本的Windows系统,开源出来还是有些得不偿失。
不过有意思的是,微软直接把最大的开源社区GitHub给买了,还是融入到了这个开源世界。

图片

图片







请到「今天看啥」查看全文