在AI进化论系列的前序报告中,我们深度分析了DeepSeek的创新技术,并探讨了算力硬件的需求变化。DeepSeek深度挖掘算法、软件、硬件间的协同优化,通过工程创新带来了显著的成本优势与领先的综合性能。同时,其开源策略降低了下游应用获取AI前沿技术的难度,我们预期中国产业应用有望受益,实现“AI+”的快速商用落地助力企业降本增效。
DeepSeek的“鲶鱼效应”带动AI大模型“普惠潮”,数字化程度高的产业有望快速应用相关技术。
2025年初,DeepSeek凭借开源大模型DeepSeek-V3与R1系列,以低成本、高性能优势,在全球引发大模型平权浪潮。随后,OpenAI宣布GPT-5调整产品战略,免费版ChatGPT用户将获得“标准智能设置”下的“无限聊天权限”;百度也宣布其计划在未来几个月陆续推出文心大模型4.5系列,并于6月30日起正式开源。AI大模型作为人工智能的里程碑技术,能够理解、分析、生成各种类型的数据,其技术特性与高数字化环境的核心需求高度契合。我们认为AI大模型助力下的降本增效有望使其在数字化程度高的产业实现裂变式应用。
中国制造业具有体系全、品种多、规模大的突出优势,有望成为“AI+制造业”的全球领头羊。
在工业品类方面,根据工信部,中国是唯一拥有联合国产业分类中全部工业门类的国家,在500种主要工业产品中,中国有220多种产品产量位居全球第一。在规模方面,根据国新办,2024年,中国工业增加值40.5万亿元,制造业总规模连续15年保持全球第一。中国工业增加值已超美国、日本、德国之和。根据联合国,中国制造业产值的全球占比有望由2000年的6%提升至2030年的45%,规模优势有望延续。此外,
中国制造业高质量发展,积极探索数字化转型,其中汽车、家电制造、流程工业的数字化水平高,有望率先实现“AI+”应用。
机会初探:
我们认为中美在以信息技术为关键支撑的行业(互联网、传媒、金融服务、教育、医药等)积累了丰富的经营数据,AI可以激发其效益潜能,新应用有望快速部署;另外,中国在制造业具有独特优势,其中汽车、家电、消费电子等离散制造业、石化、化工等流程工业的数字化程度较高,为AI快速应用奠定了基础。
AI大模型创新、AI大模型成本下降、AI大模型应用落地进展不及预期。
AI 大模型堪称 AI 发展历程中特定阶段的卓越结晶,它深度融合了过往多年间涌现的各类 AI 技术,并持续进行改进、扩展和创新。在海量优质数据以及充足算力的支持下,基于大模型的AI技术取得了令人瞩目的显著成果。
AI大模型以大规模参数构建神经网络,具有强大的计算和学习能力,适应不同的业务场景和语言环境,并通过学习和推理来完成各种任务,实现高效、准确的语义理解和应用。随着算力增强及数据量快速增长,百亿级乃至千亿级参数的语言模型不断被推出。这些模型不仅在NLP领域成绩斐然,还逐步渗透至计算机视觉、多模态融合等更为广泛的领域。2023年,GPT-4发布,参数量高达1.8万亿,能够完成从文本生成到代码编写的多种任务,展现了强大的语言理解和生成能力,带来了跨模态能力的升级。2024年12月至2025年1月,DeepSeek相继开源旗下的V3和R1模型,凭借混合专家模型(MoE架构)等技术创新,带来了卓越的性能与成本优势,引发了全球对AI大模型发展的广泛关注。
我们认为大模型作为人工智能技术的重要里程碑,其出现体现了AI在理论、工程和应用层面的综合积累与突破。随着大模型相关创新研究、产品不断涌现,各行各业对其关注度日渐提升,其应用前景广泛。
资料来源:赵鑫,李军毅,周昆,唐天一,文继荣《大语言模型》,2024年12月,中金公司研究部
资料来源:赵鑫,李军毅,周昆,唐天一,文继荣《大语言模型》,2024年12月,中金公司研究部
AI大模型应用场景丰富,行业大模型可以满足多样化专业需求,占比提升。
据前瞻产业研究院、首钢基金CANPLUS、华为云等联合发布的《2024年中国AI大模型场景探索及产业应用调研报告》,截至2024年7月30日,中国已备案大模型197个,其中69%为行业大模型(教育、金融、办公、政务、医疗五个应用领域占比过半),31%为通用大模型;2024年新增备案大模型126个,其中行业大模型占比高达83%,且类型愈加丰富。我们认为行业大模型占比提升,主要由于基础技术的进步为行业大模型的训练和开发提供了坚实的技术基础,而终端应用多样化催生了个性化的需求。随着大模型技术持续突破,我们预计行业大模型的占比有望继续提升。
注:统计时间截至2024年7月30日
资料来源:《2024年中国AI大模型场景探索及产业应用调研报告》(前瞻产业研究院、首钢基金CANPLUS、华为云联合于2024年4月发布),中金公司研究部
大模型开启企业数据价值释放新征程,数字化程度高的产业有望快速应用
数据要素是数字经济时代下的新型生产要素,其创造的价值由企业内部延伸至企业外部,而AI大模型有望充分发挥数字要素的价值。
在数据从企业内部流向外部的过程中,能够创造出三次关键价值:其一,数据作为有力支撑,助力业务实现全面贯通;其二,数据能够推动企业进行数智化决策,提升决策的科学性与精准性;其三,数据资源通过流通交易,为社会赋能,创造出额外的价值。
我们认为依托于海量的高质量数据,企业可以通过“大数据+大算力+强算法”结合释放企业数据价值,提升企业运营效率,还可通过开放API或行业解决方案等方式将价值外溢至产业链上下游。
资料来源:《2024年中国AI大模型场景探索及产业应用调研报告》(前瞻产业研究院、首钢基金CANPLUS、华为云联合于2024年4月发布),中金公司研究部
AI大模型有望赋能数字化行业程度较高的产业应用。数字化程度高的行业有望受益于AI大模型的发展,主要原因包括:1、部署效果来看,1)数据层面:
高数字化场景积累的结构化数据(如生产日志、医疗影像)为模型训练提供高质量输入;
2)技术层面:
数字化程度高的企业具有更先进的IT系统、技术支持人员,算力基础设施成熟,AI大模型可以与其现有数字化系统兼容,无缝集成ERP、CRM等企业管理系统,通过API调用实现数据交互与流程联动;
2、使用效益来看,1)提升沟通效率:
AI大模型作为组织内部和外部的沟通工具,帮助员工、客户、合作伙伴等进行快速、准确、友好的交流;
2)流程优化:
AI大模型通过自动化流程(如代码生成、质检、合同审核、智能客服)显著降低人力成本并提升业务效率,为数字化程度高的行业带来更高效益;
3)支持关键决策:
AI大模型通过知识抽取与推理能力(如分析市场趋势、优化投资策略),帮助企业在数据驱动的竞争中快速响应,做出决策;
4)增强组织的创新能力:
AI大模型可以生成有价值、有启发性的建议,激发创新灵感。
在数字化率较高的行业,AI技术应用呈加速之势。从AI的行业拥抱程度
(入围全球3000强的公司中,行业内披露的Advanced AI应用案例的公司占所有公司比例)、
AI应用场景的多样性
(行业内应用Advanced AI的种类/总的类别的比例)
两个维度去评估,我们发现数字基础较好、数字化程度较高的行业
(图6中的先锋行业:软件与平台、高科技制造、通讯与媒体、新零售等)
在AI大模型应用中呈现领先之势。
►
以第二产业中的高科技制造行业为例,我们看到其数字化水平提升的成效斐然。根据中国信通院发布的《全球数字经济发展研究报告(2024)》,截至2023年12月底,我国制造业重点领域数字化水平快速提升,关键工序数控化率、数字化研发设计工具普及率分别达到62.2%和79.6%,分别是2013年的1.5和2.3倍。我们认为高端制造业数字化进程加速,这为AI大模型在该领域的应用筑牢根基,如图6所示,其Advanced AI的行业拥抱度在2024年达到约75%,且2023-2024年区间内提升较快。
此外,我们发现2023至2024年期间,AI的拥抱程度边际增幅较大的行业主要为数字化程度较高、或数字化渗透率提速较快的行业
(见图6中的气泡较大的行业:高科技制造、汽车、资本市场、旅游、新零售、生命科学等)。
►
以第二产业中的汽车行业为例,我们认为行业变革的上半场聚焦数字化,这为下半场的智能化升级做了铺垫。根据华为官网,其已与东风汽车、长安汽车、江汽集团等车企展开数字化、智能化合作。长安汽车通过打造数字底座,其成功实现了数智工厂的全联接,12000+台设备、200+座工厂的海量生产数据得以“流动”,制造效率也综合提升了20%。我们认为汽车行业搭建制造数字化开发平台是其构建智能化生产系统的基础,数字化程度快速提升的汽车行业有望加速落地AI应用。
►
第三产业中的金融/资本市场行业属于信息密集型行业,由于该行业风险规避及强监管的属性,其行业拥抱度在2023-2024年增幅较大,但仍然只有约50%。我们认为金融行业应用大模型有数据优势,随着AI大模型“智能化”水平提升,金融行业应用大模型的步伐有望大幅加快。金融行业日常运转中会产生海量数据,涵盖客户信息、交易记录、市场行情等各个维度,为AI大模型提供了丰富的“养料”。而AI大模型强大的数据分析、模式识别、预测评估能力有望助力于金融业务的风险评估、决策效率、精准营销等场景。根据IDC数据,2024年,中国金融行业AI与生成式AI的投资规模达到196.94亿元,预计到2027年有望达到415.48亿元,增幅达111%。此外,东方财富董事长其实近日表示,金融行业正系统性的拥抱AI。我们认为AI大模型的推理准确性提升后,或可以更充分的满足金融行业在管控、合规、安全层面的要求,AI应用空间可期。
过去,人工智能已经被广泛应用于软件与平台、通讯与媒体、高科技制造等行业。我们认为,未来随着AI大模型性能持续突破、价格不断下探,其应用场景有望愈发丰富,
我们建议关注AI在数字化程度较高产业的应用机会。
图表6:2023-2024年,中国不同行业大型企业对Advanced Al的应用趋势
注:Advanced AI指利用深度学习、自然语言处理(NLP)、多模态学习和生成式人工智能(GenAI)等先进AI技术,以模拟、理解或增强人类的认知功能,实现自动化和智能决策的技术系统,如自动驾驶,视频生成,医疗诊断等。本研究针对的是入围全球3000强(G3000)的中国企业。横轴拥抱度衡量的是行业内披露了Advanced AI应用案例的公司占比;纵轴用例多样性衡量的是行业应用Advanced AI的种类/总的类别的比例;气泡大小代表行业拥抱度在2023年4月1日―2024年4月1日间的增幅。
资料来源:Moody’s News Edge data,埃森哲,中金公司研究部
DeepSeek技术平权,大模型降本增效带动行业应用快速落地
DeepSeek模型创新带来成本大幅下探,倒逼AI大模型厂家纷纷调整技术与价格。
构建人工智能大模型通常需要高昂的费用,比如要投入大量资金购买GPU等算力资源、需要海量数据,以及聘请专业领域人才。而DeepSeek通过模型层技术创新,如在MLP层引入稀疏化的MoE架构,引入FP8精度训练,采用MTP(多token生成)优化训练效率,独创GRPO算法等方式,大幅减少算力开销,在成本控制方面卓有成效。DeepSeek的V3版本模型单次训练成本557万美元,耗时低于两个月,以仅1/10训练成本消耗便获得了与海外领先模型GPT-4o对标的能力,此外,DeepSeek通过对V3同一基础模型的后训练,获得了能力对齐GPT-o1的R1模型。DeepSeek将推理成本推动到每百万tokens1元,推理成本大幅下探。DeepSeek采用MIT开源协议,允许企业免费商用和二次开发,同时,在最新“开源周”,DeepSeek陆续开源了FlashMLA、DeepEP、DeepGEMM、并行优化策略等项目,涉及大模型推理框架、MoE模型、FP8计算性能等方面提升,降低了前沿AI技术的获取门槛。在DeepSeek推出开源模型后,OpenAI宣布GPT-5调整产品战略,免费版ChatGPT用户将获得“标准智能设置”下的“无限聊天权限”,而付费用户将享受更高智能水平的服务;百度也宣布其计划在未来几个月陆续推出文心大模型4.5系列,并于6月30日起正式开源。
我们看到DeepSeek开源的鲶鱼效应明显,有望带动AI大模型厂家降低大模型的接入成本,为大模型被广泛应用奠定基础。
技术平权与开源生态有望提高B端客户经济效益,AI大模型有望迎来应用场景的裂变式发展。
相较于C端客户对价格敏感度较高,AI的B端应用更易变现。根据量子位智库2024年3月发布的《中国AIGC应用全景报告》,AI新应用产品中有约50%的产品面向B端,其中80%以上产品实现营收,而近50%的C端产品当前未有明确的收入模式。
B端用户需求清晰,两大核心原因促使其有意愿为AI大模型付费:
1)数据安全与隐私保护:AI大模型可以用于智能办公、团队协作、智能搜索和知识推荐等场景,B端企业客户对数据安全和合规性有严格的要求,因此偏好于私有化部署大模型;2)针对特定场景优化,大模型经济效益显著:B端客户希望大模型具备垂直领域专业知识,通过将大模型微调或领域知识增强,可以针对性的提高模型在特定应用场景中的性能,降本增效的经济效益使企业更愿意为AI大模型私有化部署付费。
我们认为,DeepSeek等开源大模型可以有效降低下游企业部署大模型的成本,缩短产品迭代周期,高性价比优势有望进一步释放各行业B端用户的需求。下游需求的裂变式增长与开源模式的开发者社区建设有望促进跨领域协作与创新,推动全球开发者生态建设
。
图表7:DeepSeek大模型与OpenAI-o1模型性能对比
注:图表发布于2025年1月20日
资料来源:深度求索官方公众号,中金公司研究部
图表8:DeepSeek-R1与OpenAI-o1定价对比