2024年12月中央经济工作会议明确了2025年的九项重点任务,其中之一就是以科技创新引领新质生产力发展,建设现代化产业体系,开展“人工智能+”行动。智能体作为大模型的重要应用模式,将模型能力转化为实际问题的解决能力,可有效赋能多种业务场景,推动企业数智化转型,深度契合“人工智能+”行动要求。然而,智能体作为新型技术,应用落地仍面临挑战,亟需在标准研制、评估测试等方面多措并举,为智能体技术发展提供指引。
中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注智能体技术发展和应用现状,联合业界单位共同编制了《智能体技术要求与评估方法》系列标准,目前已发布智能体平台和工具、智能体技术能力、智能体应用服务、金融智能体、政务智能体等十余项联盟标准。此外,由中国信通院牵头的国际标准《基于大模型的智能体技术能力要求与评估方法》已在ITU-T SG16成功立项,行业标准《智能体开发平台技术要求》《智能体通用技术能力要求》《智能体应用服务能力要求》《面向场景的智能体技术要求 第1部分:数据分析》《代理型人工智能技术要求》均已在中国通信标准化协会TC1WG1工作组成功立项。
同时,中国信通院依据以上标准已开展多轮智能体评估工作,
截至目前,累计为15家企业提供17项智能体专项评估服务,评估涉及智能体平台和工具、智能体技术能力、金融智能体、手机智能体四个模块
。
为进一步促进智能体应用,提升技术方先行示范影响力,协助应用方选取适配产品,
中国信通院将开展智能体第三批评估工作
。评估面向通用智能体、行业智能体和任务智能体三大方向,具体评估范围如下。
关注智能体管理、开发和使用过程,旨在保障智能体技术支撑底座稳定可控,涵盖智能体平台管理和运营、智能体开发和管理、API服务和管理共3个能力域,30余个能力项。
关注智能体各项技术能力及性能,旨在建立全面的能力框架并评估,涵盖感知认知能力、规划能力、记忆能力、执行能力共4个能力域,30余个能力项。
关注智能体服务的质量和效果,旨在保障智能体服务的稳定可靠,涵盖应用丰富度、服务优越度、应用成熟度共3个能力域,30余个能力项。
关注金融智能体在智能营销、智能投研、智能投顾、智能风控等场景的能力支持度,包含基础能力、业务场景和服务应用三个能力域,20余个能力项。
关注城市治理、公共服务、业务办公三大政务场景,包含基础能力、业务场景、服务应用3大能力域,20余个能力项。
关注汽车研发场景、生产场景、营销场景等专用领域场景,包含基础能力、场景支持和服务应用3个能力域,20余个能力项。
关注智能体在手机行业的技术及应用效能,包含基础层、模型层、能力层、应用层以及安全层5个能力域,60余个能力项。
关注基础办公、任务管理、协同办公、人力资源等办公场景,包含能力支持、业务场景和应用服务3个能力域,30余个能力项。
关注数据分析智能体在对话式分析和可视化分析两大场景上的任务覆盖度,包含技术能力、场景能力和服务成熟度3个能力域,20余个能力项。
关注客服智能体在用户服务、坐席服务、运营服务等场景的服务能力,包含服务能力和应用成熟度2个能力域,20余个能力项。
关注运维智能体在异常检测、故障分析、自主决策、故障修复等运维专用场景上的任务覆盖度,包含基础技术能力、场景应用能力和服务成熟度3个能力域,30余个能力项。