专栏名称: 人民日报数字传播
数智融合 屏观世界
目录
相关文章推荐
电商报Pro  ·  拼多多Temu拿下全球第一 ·  昨天  
JP欧洲跨境服务  ·  135个店铺被匿名起诉,这100+版权商标专 ... ·  昨天  
蛋先生工作室  ·  最新淘汰鸡行情 ·  昨天  
大数跨境  ·  Tokopedia-印尼第二大电商平台,月访 ... ·  3 天前  
51好读  ›  专栏  ›  人民日报数字传播

提质降价,国产大模型加速奔跑

人民日报数字传播  · 公众号  ·  · 2025-02-05 11:10

正文



国家互联网信息办公室2025年1月8日发布的信息显示,截至2024年12月31日,共302款生成式人工智能服务在国家网信办完成备案,其中2024年新增238款备案。


从名单看,细分领域的大模型大量涌现。与此同时,随着DeepSeek-V3等大模型产品凭借更低成本、更强性能引发海内外市场关注, 越来越多国产生成式人工智能大模型加入了“提质+降价”的队伍。


那么, 国产大模型应用情况如何?正处于什么样的发展阶段?


01

功能更强,工作生活“好搭子”



备案数量的增多,从一个侧面反映出国产大模型在工作和生活中出现的频率增高了。 那么, 国产大模型具体发挥着怎样的作用?


“把自己从繁琐、细碎的基础工作中解放出来” 是很多用户谈到应用体会时的第一感受。 除了搜索和生成之外,大模型提供的服务也越来越专业、越来越精细。


据百度智能云AI与大模型平台业务副总经理李景秋介绍, 扩展大模型应用场景需要满足不同维度的要求: 一是基座模型质量,要有一个可被指令增强的基础模型;二是准备相关场景化数据,关注数据与实际场景的一致性和配适性;三是在训练过程中找到最优的调试参数。


李景秋说,依托大模型强大的能力,百度智能云千帆平台开始与更多行业和企业进行合作。目前, 互联网行业之外,金融、教育、文娱、能源等行业都能看到大模型的身影。


02

成本更低,应用普及“降门槛”



本领增长的同时,国产大模型的使用成本也不断降低。


不久前,杭州深度求索人工智能基础技术研究有限公司推出的DeepSeek-V3上线并同步开源,快速吸引了全球同行的目光。 在多项基准测试中,DeepSeek-V3的成绩超越了不少开源模型,并在性能上和世界顶尖的闭源模型不分伯仲。 OpenAI创始成员安德烈·卡帕斯称赞道:“DeepSeek—V3使得在有限算力预算上进行模型预训练这件事变得容易。”


算力门槛降低、训练成本减少、性能持续提高…… 这些变化,在很多国产大模型上都有体现。



国产大模型降价底气何在?商业上是否可持续? 在降成本方面,国产大模型供应商们正在不断取得新进展。


有的 进行 峰谷调节,优化配置资源。 豆包大模型通过技术创新来降低成本,定价上有合理的毛利空间,既能保障企业和开发者用得起,又确保自身商业可持续; 有的 主打差异供给,力求事半功倍。 比如,千帆大模型平台根据用户不同需要进行针对性供给,从而降低其使用成本。

在中国信通院人工智能研究所软硬件与生态部主任李论看来, 国产大模型降价有多方面因素。


从供给侧看, 算法、芯片等软硬件进步带来的技术红利,让大模型训练及推理成本逐渐降低; 从需求侧看, 降低价格可以鼓励更多用户和企业使用大模型,从而丰富应用场景、创造全新价值、实现规模效应。


03

前景更好,“边干边学”是趋势



多位业内人士表示,理想情况下, 大模型产品应实现价格、私密安全性和大模型能力效果的平衡。 现实中,国产大模型还面临缺乏高质量数据、特定场景表现不佳、服务不稳定等挑战, 需要在性能优化中扩大应用,在应用扩大中提升性能。


数据的数量决定大模型的广度,数据的质量决定大模型的精度。 在实践中,不少企业正通过让大模型“边干边学”实现良性循环。 专家预计,这种良性循环将会让国产大模型加速走进日常生活。








请到「今天看啥」查看全文