日前,全球性市场研究和咨询公司 Omdia 发布了《百度智能云千帆大模型平台加速企业采用多模态生成式 AI 应用》报告。
Omdia 报告提到,为了克服大语言模型的局限性,可将文本、图像、音频等各类输入转化为不同形式输出的多模态生成式 AI 技术,正被越来越多供应商和开发者采用。
希望部署多模态生成式 AI 应用的企业可以与两类厂商合作:
(1)专注于多模态生成服务的生成式 AI 基础模型厂商。这类厂商以提供多模态生成服务为主,例如,OpenAI 推出了 Sora,这是一项文本到视频的生成服务,能够生成超逼真的视频,主要面向消费、媒体和娱乐行业。
(2)提供多模态的生成式 AI 模型和应用的生成式 AI 开发平台厂商。这些厂商通常是拥有深厚生成式AI基础设施、工程和服务专业知识的超大规模企业。例如,百度智能云支持文心大模型、多模态模型系列和多模态生成式AI应用,如百度智能云曦灵(数字人),能帮助企业快速构建多模态生成式AI应用。
相较于多模态纯生成式 AI 基础模型供应商,
Omdia 认为企业更应选择像百度智能云这样提供生成式 AI 全栈解决方案供应商,来构建符合企业业务目标的多模态应用。
Omdia 表示,百度智能云在多模态生成式 AI 技术和商业成功方面展现出了杰出的领导力。
全球生成式人工智能(AI)市场仍处于起步阶段。根据最新预测,该市场将在五年内增长五倍,从 2024 年的 146 亿美元(1060 亿元人民币)增长到 2029 年的 728 亿美元(5294 亿元人民币)。
顶尖的应用领域包括消费类、企业服务、零售业、媒体娱乐业以及医疗保健业。
其中多模态生成式 AI 市场规模预计将于 2029 年达到 142 亿美元(约 1032 亿元人民币),较 2024 年增长 6 倍。
目前百度智能云已支持了从多模态生成式 AI 模型供应商到企业、系统集成商等在多模态生成式 AI 领域的实践。
百度智能云助力生数科技打国内首个纯自研多模态大模型 Vidu:
百度智能云助力哇嘶嗒(VAST)打造通用 3D 大模型 Tripo:
百度智能云曦灵数字人平台:一句话生成3D数字人带货视频
Omdia 预计,百度智能云还将继续引领中国多模态生成式 AI 应用的部署和实施。
在服务能力方面,纯生成式 AI 基础模型供应商主要针对通用用途,缺乏定制化选项,无法针对特定用例进行再训练或满足特殊需求,在高度受监管的行业和关键业务应用中尤为受限。
相较之下,生成式 AI 全栈解决方案供应商具备深厚的生成式 AI 基础设施、工程能力和服务经验,更适合有基于数据和业务目标来开发多模态应用需求的企业。