金磊 发自 凹非寺
量子位 | 公众号 QbitAI
继昨天决定免费之后,
百度
刚刚又发布一则重磅消息——
下一代文心模型,决定
开源
!
而且官宣内容只有一句话
(字少事大的感觉)
:
我们将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
从收费到免费,从闭源到开源……嗯,
DeepSeek
带来的冲击着实是有亿点点大。
从闭源到开源的文心一言
回顾文心一言的发展历程,
2023年3月16日
,是一个重要的时间节点。
在这一天,百度的文心一言正式启动邀测。
而这也是上市公司里
第一个
推出类ChatGPT应用,所采取的“路径”也与OpenAI一致,闭源。
在同年的8月31日,文心一言率先向全社会全面开放。
当时有多受欢迎呢?开放首日,文心一言就共计回复网友超3342万个问题。
到了2023年11月1日,文心一言专业版正式上线,成为中国首个采用会员模式面向C端收费的大模型产品。
而在短短的2年时间里,文心一言版本也已经迭代到了4.0,从日均调用量和各种榜单成绩来看,是推动中国大模型发展不可或缺的组成部分。
从技术角度来看,文心大模型的核心技术之一是
知识增强
。
不同于仅靠大规模文本数据训练的LLM(如GPT系列),文心一言结合了百度的知识图谱(涉及万亿级实体和关系),让模型在问答任务中更精准,减少幻觉问题。
除此之外,文心一言还通过
持续学习
(Continual Learning),让模型能够动态适应新知识,避免旧知识遗忘问题。
加之
多任务学习
(Multi-Task Learning),文心一言能在对话、翻译、阅读理解、代码生成等多种任务间共享知识,提高泛化能力。
文心一言还具备强大的多模态理解和生成能力,包括图像生成、视频生成和语音交互等等。
最重要的一点是,文心一言的背后还有百度强大的生态支撑,百度搜索、百度地图、百度智能云等,可以提供更完整的AI服务。
而从收费到免费,从闭源到开源,或许是大模型发展所使然;毕竟就在昨天,不仅是百度,就连OpenAI也官宣了“免费”的动作。
不过今天百度能够决定开源,一定程度上也展示了百度在AI领域的开放态度和技术自信。
据悉,百度计划在今年发布多款模型,并在下半年文心大模型5.0版本,多模态能力将会有显著提升。
李彦宏谈DeepSeek
而就在刚刚过去的阿联酋迪拜World Governments Summit 2025峰会上,李彦宏也谈及了对DeepSeek的看法。
在被问到DeepSeek是否是意料之中时,李彦宏表示:
我认为,
创新是不能被计划的
。你不知道创新何时何地到来,你所能做的是,营造一个有利于创新的环境。
李彦宏指出大语言模型领域创新速度极快,如今大模型推理成本每年能降低 90% 以上,远超过去计算机革命的速度:
我们生活在一个非常激动人心的时代。
在过去,当我们谈论摩尔定律时说,每18个月性能会翻倍、成本会减半;但今天,当我们谈论大语言模型时,可以说每12个月,推理成本就可以降低90%以上。
这比我们过去几十年经历的计算机革命要快得多。
他认为创新的本质是成本下降与生产力提升,中国企业因成本压力在多领域积极创新,百度在推理和训练方面的创新也取得显著进步。
不过有意思的一点是,李彦宏在更早前对于“开源和闭源之争”的观点是——闭源模型比开源模型更强大……