专栏名称: 百度智能云
聚焦人工智能(AI)、大数据(Big Data)、云计算(Cloud),以“ABC”三位一体战略,帮助企业客户实现数字化、智能化转型。百度云,智能,计算无限可能!
目录
相关文章推荐
白鲸出海  ·  又一款合成游戏月入6000万,来自北京出海厂商 ·  13 小时前  
白鲸出海  ·  ChatGPT移动端月流水达1亿美元,谷歌G ... ·  13 小时前  
白鲸出海  ·  Sesame推出最新语音合成模型CSM并开源 ... ·  3 天前  
白鲸出海  ·  首周Steam销量破100万,三个瑞典宅男打 ... ·  3 天前  
白鲸出海  ·  对话Haivivi李勇:用AI做Jellyc ... ·  3 天前  
51好读  ›  专栏  ›  百度智能云

两连发!文心大模型4.5及X1,上线千帆!

百度智能云  · 公众号  · 科技公司  · 2025-03-16 09:05

正文



3月16日, 文心大模型4.5 文心大模型X1 正式发布!


目前,两款模型已在文心一言官网上线,免费向用户开放。 (https://yiyan.baidu.com/) 同时,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。


文心大模型4.5

原生多模态基础大模型

文心大模型4.5是百度自主研发的 新一代原生多模态基础大模型 ,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。


图片

多模态能力


图片

文本能力


文心大模型4.5具备优秀的多模态理解能力,能对文字、图片、音频、视频等内容进行综合理解。例如,针对下面这道题,文心大模型4.5综合理解了图中的文字与图表内容,提取出题目考查的重点;并给出详细的解题步骤和细化的选项分析,最终得出正确答案。


图片


不仅是“高智商”,文心大模型4.5也拥有“高情商”,网络梗图、讽刺漫画等等,理解起来都不在话下。例如,在下文中,这张梗图蕴含着“连续不一定可倒、可倒一定连续”的数学概念,文心大模型4.5不仅秒懂,点出梗图的巧妙和幽默;还能详细对其中蕴含的数学概念和画面逻辑进行解释。


图片


文心大模型4.5能力显著增强,离不开这些关键技术:


FlashMask动态注意力掩码 :加速大模型灵活注意力掩码计算,有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现;


多模态异构专家扩展技术 :根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力;


时空维度表征压缩技术 :在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力;


基于知识点的大规模数据构建技术 :基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉;


基于自反馈的Post-training技术 :融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。








请到「今天看啥」查看全文