专栏名称: 西二旗猿圈儿
一个从业15年的互联网猎头唠嗑的地方!及时发布互联网行业动态,各大知名互联网公司内幕八卦,裁员融资,架构调整,提供职业发展相关资讯建议和大牛职场心得!祝您职场一帆风顺!
目录
相关文章推荐
51好读  ›  专栏  ›  西二旗猿圈儿

成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线

西二旗猿圈儿  · 公众号  ·  · 2025-03-31 19:45

正文

请到「今天看啥」查看全文


3 31 日,在百度 AI DAY 上,百度发布业界首个基于全新互相关注意力 (Cross-Attention) 的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约 50%-90% 。当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。

接入全新的端到端语音语言大模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的 3-5 秒降低至 1 秒左右。

更新后的文小言还支持“多模型融合调度”,通过整合百度自研的文心 X1 、文心 4.5 等顶尖模型,并接入 DeepSeek-R1 等第三方优质模型,实现了多模型间的智能协同。用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

同时,文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后, AI 可自动解析风格并生成同款手机壳、支架等周边产品。


更多互联网行业爆料,以及职场资讯,职业技能经验分享

关注我,给你好看


【回复“健康指南”,Get 《程序员健康指南》 电子书】

回复“ 1024 ”, Get 程序猿求职面试葵花宝典 电子书】







请到「今天看啥」查看全文