作者 | Mr.K
编辑 | Emma
来源 | 技术领导力(ID:jishulingdaoli)
正月十五刚过,AI圈就有大事发生:2月12日,CNBC引述知情人士爆料称,百度计划在今年下半年发布下一代人工智能模型Ernie 5.0,将在模型多模态能力方面有重大增强。次日凌晨3点,OpenAI首席执行官Sam Altman就表示即将发布GPT-4.5和GPT- 5,重点是GPT- 5将免费开放。与此同时,文心一言宣布:将于4月1日0时起全面免费,PC端和App端都可使用文心系列最新模型。
中美AI行业两大领军企业为何同时宣布免费?全面开放大模型有什么样的深层次原因?全球两大头部AI产品免费开放,对AI产业有哪些影响?下面K哥谈谈自己的观察与思考。
图片由AI生成
OpenAI首席执行官Sam Altman,于2月13日凌晨公布了GPT-4.5和GPT-5的最新消息。免费版ChatGPT能在标准智能设置下无限制地使用GPT - 5进行对话。在更早之前的2月6日,OpenAI宣布ChatGPT Search向所有人开放,打开OpenAI官网即可直接使用,甚至不需要注册。
另据CNBC报道,百度计划在今年下半年发布下一代人工智能模型Ernie 5.0,将在模型多模态能力方面有重大增强。次日13日Open ai火速跟进,宣布即将发布GPT-5。
有意思的是,就在OpenAI公布ChatGPT Search全面开放的前几个小时,谷歌宣布向所有人开放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三个版本。
2月13日,文心一言在官网宣布将于4月1日0时起全面免费,所有PC端和App 端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。
从以上几家AI领军企业的最新动向不难发现,大模型开放是大势所趋,科技巨头们都在主动开放各自的大模型产品,让更多用户体验和使用。
图片由AI生成
此次开放的大模型,综合能力非常强悍。以文心一言为例,K哥作为文心一言的深度用户,对于此前开放的文心大模型3.5版和这次全面开放的4.0版,还是比较熟悉的。文心大模型4.0较之前的版本,综合能力更强大,K哥做了个测评。
先让文心大模型预测下《哪吒2》最终全球票房,以下是3.5版的预测结果。
对比一下4.0的效果,不但给出了更具可能性的结果,整个思考链路非常清晰。
再来看看文生图表现如何,我输入提示词:帮我画一个奥黛丽赫本吃汤圆。以下是3.5版本出的图,还是不错的。
4.0版本基于iRAG技术,生成了更准确的人物脸部,而且一次可以生成多张供你选择。
2月13日,文心一言还新上线了深度搜索功能,能针对专业咨询类问题的解决能力进行全面加强,以解决专业问题查询门槛高、查询渠道专精、查询结果分析难度大等使用挑战。
在民生、创业、经济分析等方面问题,能够提供专家级的内容回复;除了搜索能力以外,具备更全面的思考、规划、反思能力,针对工具规划及调用能力上进行全面加强,能够更加“聪明”的使用多个工具解决各类复杂任务问题。
接着说说大家关心的幻觉问题,RAG是主要的解决方案,百度在RAG技术上具备中文深度理解、多模态检索、垂直领域定制化以及实时数据整合能力等优势,在中文互联网、企业服务、政务等场景中更具实用性和竞争力。从RAG能力实测来看,国内外主流大模型中,百度文心一言综合表现最佳。
在解决图片生成的幻觉问题上,百度提出了iRAG(image based RAG)技术解决方案,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片,去掉了AI味儿,而且成本很低。前文测评的案例中,大家已经感受到iRAG的强大了,iRAG具备无幻觉、超真实、没成本、立等可取等特点,在影视作品、漫画作品、连续画本、海报制作等很多领域都有广泛的应用空间。
在K哥看来,文心一言的全面开放,保证了用户享有最佳体验,进一步降低AI的使用门槛。在百度的头部效应之下,会有越来越多AI公司加入开放的队伍,这将有利于推动中国AI行业的发展,促进AI普惠。
杰弗里·摩尔在《跨越鸿沟》中指出,高科技产品在市场化过程中,会面临一个难以逾越的“死亡之谷”,这是早期使用者到大众用户的过渡阶段,能否“跨越裂谷”,是高科技产品发展的关键。2024年AI产品的用户破圈增长,标志着AI已经“跨越裂谷”。
AI技术突破背后的成本降低,是这次大模型全面开放的核心原因。
一方面,大模型训练成本大幅降低。
以百度为例,文心大模型的训练成本不断降低,工程技术上的突破创新主要有3点:
1,昆仑芯性价比高,可降低单位算力成本。昆仑芯在性能上表现卓越,能够在更少的计算资源下运行大规模模型(如DeepSeek-V3/R1),这使得大模型的推理和训练所需的计算量减少,从而直接降低算力成本。
2,万卡集群规模效应,提高资源利用率。百度智能云已点亮万卡集群,并计划扩展至 3万卡。大规模集群可以通过任务并行调度、弹性算力管理等方式,提高计算资源利用率,避免算力闲置,提高单任务的计算效率,降低整体算力成本。
3,百舸平台助力大规模集群实现高效的部署管理。如:超大规模HPN高性能网络,将带宽有效性提升到90%以上;创新性散热方案,有效降低能耗,进一步优化成本;高效并行化任务切分策略,将MFU(GPU有效利用率指标)提升至58%;故障恢复时间为分钟级,集群有效训练率达到98%。
另一方面,推理成本的显著下降。
在飞桨深度学习框架的支持下,文心大模型通过优化实现推理性能提升,推理成本显著降低。正如百度创始人李彦宏在阿联酋迪拜出席“世界政府峰会”上所说的:“在过去,当我们谈论摩尔定律时,每18个月,性能水平或价格都会减半。但是今天,当我们谈论大型语言模型时,增加的成本基本上降低了,可以在12个月内降低90%以上。”
这场AI开放浪潮,预示着AI产业的全新范式:与其构建封闭的技术护城河,不如孕育创新的生态雨林。当大模型成为"水电煤"一样的基础设施,人类将会创造出远超我们想象的数字文明。
一场属于普通人的生产力革命正在悄悄降临,正如马文·明斯基所说的:"真正重要的不是机器能否思考,而是人类能否因之更好地思考。"此刻,属于每个人的AI时代,才刚刚拉开帷幕。