专栏名称: 企业管理杂志
企业管理杂志由国务院国资委主管,中国企业联合会主办,是最具权威性的企业管理期刊。本刊以全球视角、本土方案,引领中国企业管理实践。
51好读  ›  专栏  ›  企业管理杂志

我的数字分身进化了

企业管理杂志  · 公众号  ·  · 2024-05-10 07:00

正文

△调用商汤“商量”大模型技术,上海银行推出两位AI数字员工 “海小智”和“海小慧”。

基于大模型能力,提升数字人在形象塑造、人机交互及场景适应等方面的灵活性和效率。


生成式AI和大模型为数字人产业注入动力


2023年是人工智能领域的重要转折点,生成式AI和大模型技术取得飞跃性进步,AI从“分类器”角色转变为具备强大创造力的“生成器”。这一根本性转变赋予AI前所未有的创新能力和深层次理解力,引领人们步入AI 2.0时代。在这一技术革新浪潮的推动下,各行业纷纷探索,将生成式AI和大模型融入产品开发和业务流程,提升客户体验、优化业务效率、创新商业模式。据Gartner预测,到2026年,将有超过80%的企业采用生成式AI,或部署支持生成式AI应用,这一比例在2023年年初还不足5%。


生成式AI、大模型应用的崛起也为数字人产业注入动力。据沙利文头豹研究院研究显示,得益于生成式AI的加持,2023年中国数字人市场规模达到355亿元人民币,比2022年翻一番。其中,生成式AI贡献占比约为35%。预计到2027年,随着技术进一步成熟,数字人市场规模有望达到680亿元人民币,而生成式AI的贡献占比预计将提高到60%以上。这一增长不仅反映出市场对生成式AI和大模型的日益依赖,也预示着数字人将在更多行业和场景中扮演重要角色。


生成式AI和大模型对数字人市场的推动效应,主要源自两大关键作用力:一是纵向提升数字人内在潜能,增强其可及性和可用性;二是横向拓展数字人应用边界,积极探索数字人在新场景、新应用下的落地潜力。


1. 从L4向L5,提升内在潜能


IDC认为,与AI深度融合的数字人才能称为AI数字人。商汤智能产业研究院在2022年发布的《企业级AI数字人白皮书》中,根据AI在数字人拟人化和生产自动化两个维度的融合程度,将数字人分为L1〜L5五个等级,并指出,只有达到L4级及以上的数字人才被认为是AI数字人(见图1)。



AI技术的发展对数字人演进至关重要。如果将AI 1.0视为CG数字人向AI数字人转变的分水岭,那么以生成式AI和大模型为代表的AI 2.0则是推动数字人从L4向L5级进化的加速器。


首先,大模型大幅提升数字人生产自动化水平,增进数字人的可及性和经济性。在大模型赋能下,通过生成式AI算法,基于深度学习模型、动作模拟、情感模拟等技术,仅需几分钟的真人视频素材,经过大模型数小时的训练,就能高效地生成具有高度逼真性的数字人。这一过程不仅极大缩短了制作时间,而且显著降低了制作成本,使得数字人的应用门槛得以降低,为更广泛的行业和领域打开应用之门。例如,用户只需要上传一段2〜5分钟手机拍摄的真人视频,就能通过商汤如影平台生成声音及动作自然、口型准确、多语种精通的数字人分身,整个制作过程耗时从原先的多则半年少则两周降低为控制在24小时以内,生产成本从百万级别降低至数千元。


其次,大模型助力数字人智能化交互更上新台阶。AI数字人作为AI技术的产物,其核心价值在于能够模拟人类智能,提供高效、准确的服务。大模型通过其强大的数据处理和学习能力,赋予数字人更加智慧的“大脑”,显著提升了数字人的智能水平,使其在多个方面实现质的飞跃。这种跨越式的飞跃,一方面体现在大模型让数字人能够更深入地理解复杂的语境和情感,使得它们在自然语言处理方面的能力大幅提升。另一方面,大模型支持数字人在多模态交互方面显著提升。这意味着数字人不仅能够处理和理解文本,还能够处理音频、图像和视频等多种形式的数据,使数字人在提供服务时更加全面和生动。

最后,大模型更生动地实现数字人角色带入,极大优化了用户沉浸式体验。大模型对数字人在语音和表情交流能力上的显著提升,使得数字人在与用户的互动中能够展现出更加自然和真实的反应,从而极大提升了用户体验的深度和丰富性。在语音交流方面,大模型使得数字人能够理解和生成更加流畅、富有情感色彩的对话,它们可以模仿真人语调、节奏和情感变化,使对话更加生动和富有表现力;在表情交流方面,基于大模型训练,数字人能够更加准确地捕捉和模拟真人面部表情变化,从而在视觉层面上实现更加真实的情感传达。


2. 融合生成式AI,拓展应用边界


大模型技术的突破性进展,使人们能够以更经济的成本拥有更聪明的数字人。这一变革不仅提升了数字人的可用性和可及性,也进一步激发了人们在更广泛的应用场景中积极探索大模型、生成式AI应用与数字人能力有机融合的兴趣,以期为用户创造更好的AI 2.0体验,为数字人市场带来前所未有的增长动力和创新活力。总结起来共两大方向(见图2)。



一是生成式AI场景为数字人落地提供了天然土壤,为用户创造了与真人无异的互动体验。IDC预测,随着大语言模型和生成式AI的进步,CUI(对话式交互界面)将在未来的AI应用中占据主导地位。这预示着用户将能够在多样化的应用场景中,与AI进行更加自然、流畅的语言交互,使用户能够便捷地接入和使用各种AI应用。这样的交互环境为数字人技术的融入提供了天然土壤,也将传统以功能为主的交互环境转变成一种更为生动的互动体验——数字人不仅能够模拟人类的情感反应,还能理解和传达信息中的情感特征,为交互过程增添丰富的情感维度。


二是数字人与大模型结合转化为新型的AI劳动力,加速向产业和个人生活中深入渗透。这种结合的核心在于,大模型的深度学习和理解能力与数字人的个性化定制及交互性相结合,共同构建了一个能够模拟并增强人类在多种工作场景中表现的智能系统。这种系统不仅极大提高了执行复杂任务的效率,减少了对传统人力资源的依赖,还能通过持续学习和适应,不断提升其在决策、分析和创造性工作方面的能力,为企业和个人带来前所未有的生产力释放和价值增长。例如,数字员工与企业大模型结合,能够全天候工作,高效处理那些重复性高、规则性强的任务。在专业领域,如金融、医疗和法律,数字专家与行业大模型结合可以提供基于海量数据的深入分析和建议,并快速吸收行业新知,为企业或个人提供实时、数据驱动的咨询和决策支持。在日常生活中,数字人助手与个人大模型结合,能够根据用户日常习惯、偏好和需求,提供高度个性化的服务,在健康管理、时间管理、学习辅导,及娱乐休闲等方面,成为用户的得力伙伴。


数字人平台全面升级


数字人平台即是生产数字人的生产力工具。进入AI 2.0时代,数字人产业的发展焦点已从单纯的AI算法驱动的数字人创建,转变为基于大模型能力,以提升数字人在形象塑造、人机交互以及场景适应性方面的灵活性和效率。


“工欲善其事,必先利其器。” 这意味着AI 2.0时代的数字人平台构建不仅要注重大模型对数字人生成的支撑作用,还需兼顾多样化场景下的用户需求,通过集成生成式AI应用和大模型技术,提升数字人在复杂环境中的表现力和实用性。


1. AI 2.0数字人平台技术架构


AI 2.0数字人平台由基础层、平台层和应用层共同构成,以支撑数字人应用生态蓬勃发展(见图3)。



基础层由AI算力平台、数据管理平台和大模型开放平台构成。它们共同为数字人的创建和应用部署提供必要的智能计算资源、数据管理支持,以及可调用的大模型服务。平台层是实现数字人应用规模化落地的关键。它涵盖了由AI引擎驱动的三大核心功能模块:数字人生成、生成式AI应用和视频合成。此外,平台层还包括了运营服务平台,旨在弥合技术实现与实际应用之间的差距,确保技术顺利部署和市场落地,从而打通创新到商业化的最后一公里。


通过运营服务平台的架桥通路,数字人平台能够实现技术与市场需求之间的无缝对接,确保技术优势转化为实际商业价值。这一过程涉及将数字人应用与用户的特定需求相结合,通过专业的运营策略和客户支持,为用户提供定制化的解决方案和售后服务。在AI 2.0数字人平台的助力下,数字人应用和解决方案稳步推进,以提升服务体验和增强AI劳动力为目标,实现在多个行业的规模化部署。这些应用和解决方案在本地生活服务、直播电商、教育培训、金融、医疗和法律等领域展现出巨大应用潜力,共同构建了一个多元化和充满活力的数字人应用生态。


2. AI 2.0数字人平台主要特点


AI 2.0数字人平台在实际部署中展现出三大显著特点,分别是产线化能力升级、应用服务一体化发展及对可信建设的重视。这些融合赋予了AI 2.0数字人平台更强的综合能力,使其能够高效创造出可信、可用、可及的AI数字人及其相关应用,更好地响应市场用户和场景需求。


首先,AI 2.0数字人平台实现了产线化能力的显著增强。一方面,结合大模型能力,数字人平台的产线化过程进一步强化了自动化和智能化水平。这不仅意味着数字人及其应用的创作流程被转化为一条高效、智能的流水线作业,而且通过集成大模型技术,平台能够在减少人工干预的同时,实现更高质量的内容生成。另一方面,产线化的模块化设计也赋予了数字人平台极高的可扩展性和灵活性,使其能够迅速适应技术迭代的需求。这种设计允许平台在不影响整体运作的情况下,对特定模块进行升级和优化。无论是算法更新、新功能引入,还是性能提升,都能够通过模块化快速替换和集成,实现平台持续进化。这种能力确保了数字人平台能够紧跟技术发展和市场变化步伐,为用户提供始终处于前沿的产品和服务。


其次,AI 2.0数字人平台更强调应用服务一体化。一键式生成数字人应用仅仅是这场创新旅程的起点。随着大模型技术的飞速发展,产业用户对数字人应用的期待已经超越了简单的场景模拟,他们寻求的是将大模型及数字人技术深度融入自身的业务流程中,以实现企业运营效率的显著提升。为了满足这一需求,数字人平台必须超越基础的创建工具,提供更加全面和定制化的专家级服务。这包括但不限于个性化的数字人定制、业务流程优化咨询,以及与企业现有系统和平台的无缝集成。通过这些服务,数字人平台能够帮助企业在客户服务、市场营销、产品展示等多个领域实现智能化转型,从而在激烈的市场竞争中保持领先地位。这也正是数字人平台技术架构中运营服务这一模块建设的意义和价值。


最后, 可信是AI 2.0数字人平台构建的必要条件。随着数字人市场的迅猛发展,随之而来的风险和挑战日益凸显。这一背景下,国家监管机构如网信办发布的《互联网信息服务深度合成管理规定》《生成式人工智能服务管理办法》和《网络信息内容生态治理规定》等法律法规,从多角度明确了技术研发者、服务提供者和用户在隐私保护、内容安全等方面应承担的责任和义务。


AI 2.0数字人平台厂商格局


根据2023年IDC全球调研报告,为了迅速把握AI 2.0时代的机遇并加速业务流程和产品创新,产业用户普遍倾向于寻求外部供应商支持。调研数据显示,超过54%的企业受访者计划将在生成式AI领域制订投资预算。本文建议,产业用户挑选生成式AI软件平台供应商时,应主要关注以下几个关键需求,包括:数据和隐私安全性;多模态内容生成能力;能否提供定制化的模型和解决方案;数据管理功能强大与否;能否支持多种AI模型以适应不同应用场景;企业级用例和API的可用性等。


1. 垂直类、AI创企和科技大厂共同塑造市场格局


随着生成式AI技术迈向商业化应用阶段,数字人平台厂商应致力于构建全面的AI解决方案,以加速数字人及在产业应用领域的落地。在这一市场起步阶段,无论是垂直类数字人厂商、AI初创企业还是具有深厚AI积累的科技大厂,都有机会在数字人市场占据一席之地。


垂直类厂商主要基于第三方大模型能力深耕数字人应用市场。这类厂商以硅基智能、相芯科技等为代表,在AI 1.0时代,甚至更早之前,他们就已经在数字人领域深耕细作,积累了丰富的运营经验和较多客户群体。随着AI 2.0时代到来,他们通过集成大模型能力,快速整合生成式AI技术和应用,进一步强化了自身产品实力,推出更加智能化、个性化的数字人应用和产品服务。这种策略使得垂直类厂商能够在保持对行业需求深刻理解的同时,快速响应技术变革。例如,硅基智能将与华为云盘古大模型联合打造行业解决方案,实现数字人+大模型在知识生产、虚拟直播等多维度的生态共建。


AI初创企业融合数字人技术开辟通用数字人市场。出门问问、智谱AI等企业代表了AI 2.0产业的创新前沿,他们具有较强的AI研发能力,通过自主研发通用或行业大模型布局和开发生成式AI应用,大多已初具市场规模。在此基础上,他们通过进一步融合数字人技术,打造更加拟人化、情感丰富的交互模式,使用户能够享受到更加自然、流畅的互动体验。由于此类企业的数字人需求主要为提升用户体验,对数字人定制化要求并不高,因此在通用数字人市场竞争中更具优势。


科技大厂基于深厚的AI技术和资源积累,积极布局公有云和定制化服务。代表性企业包括百度、商汤科技等互联网和AI原生大厂。这些大厂作为互联网和AI领域的领先企业,在大模型研发、计算资源和数据管理等关键基础设施上进行了大规模投资和长期积累,能够紧跟产业用户需求演变,不断更新和迭代数字人平台的核心功能,同时通过公有云服务和定制化服务模式,使客户能够轻松享受AI技术带来的便利和效益。例如,商汤科技组建大模型事业群,投入2万块GPU资源专注于底层大模型能力的研发和迭代,以满足上层应用的升级创新。同时,这些科技大厂极为重视数据安全和用户隐私保护,积极构建可信赖的服务环境,确保用户数据安全和隐私得到充分保障。


2. 商汤数字人平台优势


数字人市场正在蓬勃发展,越来越多不同背景的技术厂商投身其中。如何全面评价各厂商发展水平,为产业用户提供可靠的数字人平台选型参考,成为行业亟待解决的问题之一。本文充分评估当前数字人平台综合能力水平,构建了AI 2.0数字人平台评估体系,涵盖了三个核心评估维度和十二个关键指标。


产品能力主要评估厂商在构建数字人平台方面的技术积累,以及其提供的数字人产品服务的实用性、可达性和可靠性。具体包括四大评估指标:产品技术、平台能力、客户体验、可信能力。战略愿景评估主要聚焦于厂商对数字人市场发展趋势的洞察力,以及是否具备明确的战略规划和执行路径推动产品和销售。这不仅涉及对现有市场格局的深刻理解,还包括如何响应技术和市场变化,通过创新布局未来。具体包括四大评估指标:市场认知、销售策略、产品策略和创新规划。市场生态主要评估厂商数字人平台的商业化落地表现,以及围绕产业用户需求及未来战略发展的生态布局,并评估厂商在此领域的业务表现和行业客户的覆盖情况。具体包括四大评估指标:商业模式、行业覆盖、渠道生态、业绩表现。


在产品能力方面,商汤科技呈现出较强的技术实力和深厚的平台积累,基于自主研发的大模型技术和充足的算力资源,不断推动数字人产品服务创新与升级,并积极构建和完善可信体系,确保为产业用户提供持续改进的优质体验。在战略愿景方面,商汤科技拥有领先的市场认知,制订了清晰的战略方向和创新规划。公司把握AI 2.0时代产业变革趋势,不断调整和优化自身产品开发与市场销售策略,以适应不断变化的市场需求。在市场生态方面,商汤科技实施了多元化商业策略,积极构建高品质渠道网络。通过这些努力,商汤科技成功将数字人业务拓展至多个行业,实现了业务广泛落地和业绩显著提升。


商汤科技于2023年4月推出AI 2.0数字人平台——商汤如影AI数字人视频生成平台SenseAvatar(以下简称商汤如影或如影平台),该平台基于商汤AI大装置SenseCore算力基础设施和日日新SenseNova大模型体系构建,涵盖了包括数字人生成(形象、音色等)、生成式AI应用(文案生成、图像/视频素材生成)、视频合成、视频直播服务等主要核心功能和服务模块,并以SaaS、PaaS云模式及项目定制化方式向各行业提供数字人服务。


商汤如影在四个关键领域展现出竞争优势。


第一,夯实以大模型、大算力为核心的AI基础层,使平台能够持续输出高质量、高效率的AI数字人服务。大模型和大算力是实现高质量、高效率数字人生成的核心驱动力。在商汤日日新SenseNova大模型体系和AI大装置SenseCore的支持下,如影平台在生成效率和效果方面双双突破。


第二,积极践行可信原则,如影平台将可信要素深度融入产品设计、开发、部署全流程。在推动AI数字人视频生成技术创新应用过程中,商汤致力于打造可信数字人,在可信原则指导下推动虚拟人市场健康、可持续、高质量发展,让数字人生成内容与真人意愿不脱钩,数字人产业快速发展与监管不脱缰,肖像权、所有权与现实约束不脱节。


第三,如影平台针对不同用户的实际需求,提供多样化产品形态。不仅能够满足用户的广泛基础需求,还能够为寻求个性化和专业化服务的用户提供深度支持。SaaS产品形态主要面向无独立运营能力的个人用户和小微企业用户。PaaS产品形态主要面向具备独立运营和开发实力的企业用户。项目定制化服务主要面向寻求数字化转型路径的大中型企业。


第四,重视渠道生态和服务体系建设和完善,致力于与商业伙伴、产业用户形成持久共赢的合作关系。




商汤如影平台案例实践


作为全栈式AI 2.0数字人平台,商汤如影旨在帮助企业和个人轻松开展数字人短视频、直播等视频内容创作,同时也可为教育培训、营销推广、娱乐文化、金融服务等领域提供视频解决方案,为企业在AI 2.0时代享受科技红利的同时创造更多价值。


1. 微博AI营销助手


作为中国大型社交媒体平台之一,微博拥有广大创作用户群体和丰富的社交数据资源。在当前流量红利逐渐减退的大背景下,微博计划将大模型和生成式AI技术应用于其内容营销业务,以AI原生应用的视角重新审视商业需求。通过充分利用平台的用户和数据优势,微博旨在提升内容电商的效果和质量。在短短几个月里,微博增值设计研发中心与商汤科技紧密合作,基于商汤如影平台和底层语言大模型技术,结合微博多年积累的海量数据资源和行业分类标签,共同训练出一款专门针对微博业务的数字人营销助手。该助手采用智能对话方式,协助博主进行AI自动选品、AI生成营销内容,并通过如影平台生成一系列高质量的带货视频。通过这种方式,帮助微博博主和商家成功打通了“知识、种草、品牌店铺、下单”的内容电商全流程。


2. 上海银行AI数字员工


上海银行为一家具有国有背景的股份制商业银行,致力于通过专业化经营和精细化管理,不断提升服务能级。在金融行业谋求数字化转型趋势下,上海银行积极推动前中后台系统的智能化应用,加快实现对客户、产品、服务、风控等全方位的精准向导,在有限的服务人力下,为银行客户提供快速、高质量的全渠道服务,满足海量、高频、非标准化用户需求。基于商汤如影平台及调用底层商汤“商量”大模型技术,上海银行经过6个月打造,定制化推出两位AI数字员工“海小智”和“海小慧”。其中,海小慧是22〜23岁女性形象,亲和力强;海小智则是28岁男性理财顾问形象,专业度高。两位数字员工借助上海银行客服中心智能知识库平台,对接问答语料库,支持知识互动和寒暄交流。用户只需要通过自然的聊天方式,而非“搜索”,就能让数字人查询余额和明细、转账、缴费、介绍理财产品,轻松使用手机银行所有服务。此外,上海银行还部署了数字人视频生成平台,支持一键生成数字人播报视频,可在线上线下多渠道投放短视频,助力企业文宣和新产品营销。


3. 中公教育AI数字人老师


中公教育创立于 2003 年,是一家职业技能培训学校,业务包括教培图书、面授培训、在线课程,拥有 1000 多个各地分校、超 5000 位专职师资。当基于大模型的 AIGC 技术刚崭露头角时,中公教育在业内率先开启了教育产品革新,加速推动降本增效。依托商汤大装置,结合如影数字人平台及“商量”大模型技术,中公网校与商汤科技经过数月联合研发,在数字人形象、声音、互动形式,以及课件研发、内容调优等关键环节持续迭代,上线了首款人工智能课程——“AI 系统班”,并发布虚拟数字讲师“小鹿老师”授课。通过 AI 技术分析优秀师资的教学过程,针对性训练虚拟数字人模拟他们的教学方法和风格,并通过数字化方式还原真实的教学场景,使得虚拟数字人能为学员提供高质量的学习课程。在教学过程中,虚拟数字讲师“小鹿”能依托专业的内容知识库,分析学员的学习数据,实现与学员的教学互动,为他们提供实时的反馈和建议,帮助他们更好地理解和掌握知识,提升学习效率。


AI 2.0数字人展望


自ChatGPT、Sora等生成式应用爆发后,虚实融合的AI 2.0时代正式拉开帷幕,通用人工智能的概念不再遥不可及,而成为科技发展的明确目标。这一进程中,融合了生成式AI和大模型技术的数字人通过模拟人类的智能行为,提供了前所未有的交互体验,使得虚拟与现实之间的界限变得模糊。它们更和生成式AI应用融合创新,在教育、医疗、娱乐、客户服务等多个领域展现出巨大潜力。以下为AI 2.0数字人未来发展的九个展望。


第一,数字人不只是AI工具,将成为未来数字社会的基本组成。随着技术的发展,每个人都可能拥有一个“数字分身”,这个分身将集成我们的生理特征,及所有经历和记忆。这个数字化的自我将成为我们在数字世界中的化身,让我们能够以全新的方式体验和享受数字化生活。


第二,数字人将成为未来人机交互的关键窗口,带来全新的沟通与协作范式。当前,人机交互主要依赖于屏幕作为媒介,随着虚拟现实(VR)和增强现实(AR)技术的发展,数字人将引领交互方式的革新,为用户带来更立体、生动且沉浸的体验。


第三,“数字人+数字空间”的融合将开启全新的商业篇章,孕育出创新的商业模式和实践。随着技术的演进,传统商业世界的“人、货、场”三要素将被重新定义。在虚拟世界,“人”不再只是一个账号ID,而是一个具象化的数字分身,或是现实中人的增强版或者异化版的投射。这种转变意味着消费者的购买行为将不再局限于实体商品,而是扩展到虚拟世界中,数字分身的需求也将成为消费的一部分。这种趋势将为商品营销带来革命性的变革,品牌和商家需要在虚拟空间中创造新的价值主张,以吸引和满足数字分身的需求。同时,商业空间的设计也将突破物理界限,融入更多互动和沉浸式元素,为消费者提供更加丰富和个性化的购物体验。这些创新将推动商业模式的重构,引领企业在数字化浪潮中找到新的增长点。







请到「今天看啥」查看全文