专栏名称: 新技术法学
究新技术法理,铸未来法基石
目录
相关文章推荐
知乎日报  ·  知乎瞎扯|人可以后知后觉到什么程度? ·  3 小时前  
知乎日报  ·  时隔 24 ... ·  昨天  
知乎日报  ·  有哪些东西是被过度设计的? ·  2 天前  
Quora文选英语  ·  Quora_你最近最快乐的时刻是什么时候?【 ... ·  2 天前  
知乎日报  ·  世界上第一个养猫的人是谁? ·  3 天前  
51好读  ›  专栏  ›  新技术法学

中国信通院魏凯:人工智能技术产业观察与展望

新技术法学  · 公众号  ·  · 2025-02-03 15:53

正文

近期,中国信通院人工智能研究所所长魏凯在中国信通院2025深度观察报告会上发表主题为“人工智能技术产业观察与展望”的演讲,梳理2024年人工智能技术产业进展,展望未来发展趋势。以下是该演讲的核心观点。


一、基础模型能力快速提升,在新方向上延续规模扩展



目前以大模型为主线的人工智能技术创新非常活跃,潜力巨大。头部企业和实验室沿着规模定律一路扩张,不断刷新基础大模型的能力上限。无论以任何一种基准测试的得分为指标,梳理一年来前沿模型的进展,都会呈现出一条陡峭向上的曲线。根据中国信通院最新一期的大模型基准测试结果,基础语言模型的综合得分一年来提升了30%。

2024年下半年以来,大语言模型在预训练阶段的扩展将遇瓶颈已成为行业共识。在此背景下,OpenAI o1等深度推理模型的推出,为大语言模型开辟了新的扩展方向,使得扩展定律在另外一条路上继续前行。与此同时,语言基座模型的进步,以及视觉编码器、模态连接器等模块能力的提升,推动多模态理解模型逐渐成熟,正在打开机器认知和理解世界的全新通道。基础模型越来越大,同时也在变得更小,2024年出现了很多只有几十亿参数的小模型,在某些方向上性能可以达到以往千亿甚至万亿参数的水平,小模型能力更聚焦,算力成本大大降低,有望加速私有化部署和应用,助推边缘与端侧AI普及。


二、大模型训练成本激增,推理需求崛起推动智算供需结构变化


在训练算力方面,据估计前沿大模型的训练成本已经高达10亿美元,一年增长了近9倍。由于预训练算力需求的持续走高,国内外万卡十万卡大规模智算集群建设如火如荼。但随着国内外预训练大模型研发主体的逐步收敛,以及预训练阶段算力投入的边际效应递减,未来超大规模训练集群的需求增速或将放缓。

与此相对的是,随着应用普及和推理侧扩展,预计推理算力需求将得到激发,智算算力的需求结构将发生变化,据IDC预测我国AI服务器负载中,推理负载将从2023年的41%提升至2027年的73%。推理算力的需求多样,头部互联网企业都在加大定制推理芯片力度。总体来看,未来芯片、网络等硬件与框架、算法等软件的深度协同是推动大规模训练效能提升、降低推理成本的关键。


三、训练数据作用凸显,三方面举措助力突破“数据墙”


有很多观点认为,大模型规模定律放缓,与“数据墙”有关。一方面,大模型数据投入密度持续增强,2024年发布的Qwen2的数据量/参数量的比值是2021年发布的GPT3的97.2倍。另一方面,研究显示全球可公开获取的互联网数据已接近天花板,包括Web数据、代码、书籍、学术出版物、社交媒体、公开可用音视频在内的全球大模型可用公开数据总量约4.47*10的14次方 Tokens。训练数据预计将在2028年前后耗尽。

未来突破“数据墙”有三条途径:一是激活沉睡数据,研究显示,Common Crawl可爬取的数据仅占全网数据的6%~9%,企业内部大量非结构化数据目前缺乏供给的机制和技术手段。二是发展合成数据,目前,英伟达Nemotron-4 340B指令模型依靠98%合成数据训练,OpenAI计划使用o1模型合成数据来训练即将推出的Orion模型。三是推动数据精标。国外Scale AI公司瞄准高质量数据标注市场,面向专业场景提供数据精标服务,成为炙手可热的独角兽。我国数据资源总量丰富,在全球遭遇数据墙的情况下,充分发挥我国数据资源优势,加快培育高水平的人工智能数据产业,前景巨大。



四、工程化是AI技术形成生产力的关键环节,生态培育仍需加强


基础模型只是整个人工智能应用架构中的一部分,甚至只是一小部分。2024年,围绕大模型的工程化体系不断成熟,AI原生应用的架构实践往前迈出了一大步。检索增强生成(RAG)、智能体,甚至多智能体工作流等工程化技术得到了快速发展。如果把大模型比作操作系统,那么智能体就像是APP。智能体以大模型为智能中枢,融合规划、记忆和工具调用等能力,在众多领域初步展现出巨大潜力。

人工智能的工程化技术从表面上看技术含量不高,实际上至关重要,是联接前沿技术和用户实际场景的桥梁,在降低幻觉、提升应用效果的同时,能显著降低用户使用大模型的门槛。国内外互联网大厂纷纷推出了MaaS服务和智能体开发平台。但总体上看,人工智能应用服务领域的企业仍然不够多、不够强,但反过来看,这也为很多软件企业转型进入人工智能赛道提供了巨大机会。我们正在与头部企业合作,积极培育大模型服务提供商生态。



五、应用赋能在价值链两端率先启动,重点行业走深向实


基座模型不断进步和工程化持续成熟,为人工智能+铺平了道路。2024年随着国家实施人工智能+行动,大力推动人工智能赋能新型工业化,大模型在工业领域的应用案例越来越多。我们对大模型应用案例的统计发现,从流程上看,工业大模型在“微笑曲线”两端率先发力,符合赋能新型工业化内涵。在工业领域的源头创新方面,大模型在软件开发中的应用最为广泛,材料和药物研发、仿真设计等也在探索,AI提升研发效能方面的成效初现。在后端场景中,企业管理、客户服务、市场营销这三个场景,充分发挥了当前大模型的强项,成为各类企业较为普遍的入门场景。

从行业上看,工业大模型在能源电力、电子信息和通用机械领域等重点行业落地应用相对成熟。此外,消费端办公助手、智能搜索等办公效率类工具应用量大面广,有望极大提升企业员工的人效,同样是人工智能赋能实体经济的重要方向,也是赋能新型工业化的重要支撑力量。当然,人工智能+还处于初期,政府部门和企业要应用人工智能,也是系统工程,不仅需要持续夯实数字化基础,更需要加快理念、组织和流程等变革。


六、企业AI安全治理内驱力持续增强, 安全生态正在形成


人工智能的高水平发展离不开高水平安全,以善治促善智成为全球共识。2024年,人工智能安全治理在各个层面都正从原则走向实践。站在产业界的角度看,越来越多的企业都已经把开展体系化的AI风险治理提上日程,产业各方积极发布治理框架、制定标准规范、推出测试平台、迭代评估工具等,全方位提升微观层面的人工智能安全治理能力,以确保伦理原则和法律法规要求能够得到贯彻,用户的安全关切也能够得到充分的关注和保障。人工智能技术和产业发展如同高速行驶的汽车,只有把好方向盘,装上刹车,才敢跑得快,才能行稳致远。







请到「今天看啥」查看全文