人工智能系统是基于机器的系统,被设计为以不同程度的自主性运行,在部署后可能表现出适应性,并且为了明确或隐含的目标,从接收到的输入中推断如何生成诸如预测、内容、建议或决策等输出,这些输出能够影响物理或虚拟环境。
包括基于机器的系统、被设计为以不同程度的自主性运行、在部署后可能表现出适应性、为了明确或隐含的目标、从接收到的输入中推断如何生成输出、诸如预测、内容、建议或决策等输出能够影响物理或虚拟环境等七个要素。
包括仅遵循预定义规则或操作的系统、仅进行基本数据处理或描述性分析的系统、基于经典启发式算法的系统、简单预测系统等。
人工智能系统不是被动的,能够积极影响其部署的环境,其输出能够影响物理或虚拟环境。
昨晚,
欧盟委员会发布人工智能系统定义指南,以推动首部《人工智能法案》规则的实施。
不属于AI系统的情形有:
(1)用于改进数学优化、(2)仅进行基本数据处理、(3)基于经典启发式算法,
以及
(4)性能依赖基本统计学习规则的简单预测系统。
人工智能系统定义指南阐释了《人工智能法案》中法定概念的实际应用。欧盟委员会发布人工智能系统定义指南,旨在
帮助供应商及其他相关人员判断某个软件系统是否属于人工智能系统
,从而推动相关规则的有效实施。
人工智能系统定义指南不具有约束力。
其会随时间推移不断发展,并将根据实际经验、新出现的问题和应用案例按需更新。
除了《人工智能法案》所定义的禁止人工智能实践指南外,欧盟委员会还发布了这些指南。
《人工智能法案》旨在促进创新,同时确保高水平的健康、安全和基本权利保护,该法案将人工智能系统划分为不同风险类别,包括被禁止的、高风险的以及需履行透明度义务的系统。
自2月2日星期日起,《人工智能法案》下的首批规则开始生效。其中包括人工智能系统定义、人工智能素养相关规定,以及《人工智能法案》中列出的极少数在欧盟构成不可接受风险的被禁止人工智能应用场景。
请注意,
欧盟委员会已批准指南草案,但尚未正式通过
。
以下为全文翻译,原文可见:
https://digital-strategy.ec.europa.eu/en/library/commission-publishes-guidelines-ai-system-definition-facilitate-first-ai-acts-rules-application
欧盟委员会
布鲁塞尔,2025年2月6日 C(2025) 924最终版
附件
委员会通报附件——委员会关于《欧盟条例(EU)2024/1689(人工智能法案)》所确立的人工智能系统定义的指南
英文版本
一、指南目的
(1)欧洲议会和理事会的《欧盟条例(EU)2024/1689》(“人工智能法案” )于2024年8月1日生效。该法案为欧盟境内人工智能(“AI”)的开发、投放市场、投入使用和利用制定了统一规则。其目的是促进人工智能的创新和应用,同时确保在欧盟范围内对健康、安全和基本权利(包括民主和法治)提供高水平保护。
(2)人工智能法案并非适用于所有系统,仅适用于符合该法案第3(1)条所定义的 “人工智能系统” 的那些系统。因此,人工智能系统的定义是理解该法案适用范围的关键。
(3)人工智能法案第96(1)(f)条要求委员会制定关于该法案第3(1)条所规定的人工智能系统定义适用的指南。通过发布本指南,委员会旨在帮助供应商及其他相关人员(包括市场和机构利益相关者)确定某一系统是否属于人工智能法案所定义的人工智能系统,从而推动该法案的有效实施和执行。
(4)人工智能系统的定义与人工智能法案第一章和第二章的其他条款(尤其是关于禁止人工智能实践的第5条)于2025年2月2日起生效。鉴于人工智能系统的定义对于理解包括被禁止实践在内的人工智能法案的适用范围具有决定性作用,本指南与委员会关于禁止人工智能实践的指南同步通过。
(5)本指南考虑了利益相关者咨询和欧洲人工智能委员会咨询的结果。
(6)鉴于人工智能系统种类繁多,本指南无法详尽列出所有潜在的人工智能系统。这与人工智能法案的序言第12条一致,该条明确指出,“人工智能系统” 的概念应明确定义,同时 “具备灵活性以适应该领域快速的技术发展”。人工智能系统的定义不应机械套用;必须根据每个系统的具体特征进行评估。
(7)本指南不具有约束力。对人工智能法案的任何权威性解释最终仅可由欧盟法院(CJEU)作出。
二、人工智能系统定义的目标和主要要素
(8)人工智能法案第3(1)条对人工智能系统定义如下:
“‘人工智能系统’ 是指一种基于机器的系统,该系统被设计为以不同程度的自主性运行,在部署后可能表现出适应性,并且为了明确或隐含的目标,从其接收到的输入中推断如何生成诸如预测、内容、建议或决策等输出,这些输出能够影响物理或虚拟环境。”
(9)该定义包含七个主要要素:(1)基于机器的系统;(2)被设计为以不同程度的自主性运行;(3)在部署后可能表现出适应性;(4)为了明确或隐含的目标;(5)从其接收到的输入中推断如何生成输出;(6)诸如预测、内容、建议或决策;(7)能够影响物理或虚拟环境。
(10)人工智能系统的定义采用基于生命周期的视角,涵盖系统的两个主要阶段:系统的部署前或 “构建” 阶段以及部署后或 “使用” 阶段。该定义中列出的七个要素并非要求在整个生命周期的两个阶段都持续存在。相反,该定义承认特定要素可能出现在某一阶段,但不一定在两个阶段都存在。这种定义人工智能系统的方法反映了人工智能系统的复杂性和多样性,确保该定义通过涵盖广泛的人工智能系统来符合人工智能法案的目标。
1. 基于机器的系统
(11)“基于机器” 一词指人工智能系统是借助机器开发并在机器上运行的事实。“机器” 一词可理解为包括使人工智能系统能够运行的硬件和软件组件。硬件组件指机器的物理元件,如处理单元、内存、存储设备、网络单元和输入/输出接口,它们为计算提供基础设施。软件组件包括计算机代码、指令、程序、操作系统和应用程序,用于处理硬件如何处理数据和执行任务。
(12)所有人工智能系统都是基于机器的,因为它们需要机器来实现其功能,如模型训练、数据处理、预测建模和大规模自动化决策。先进人工智能系统的整个生命周期依赖于可能包含许多硬件或软件组件的机器。人工智能系统定义中的 “基于机器” 要素强调了人工智能系统必须由计算驱动并基于机器操作这一事实。
(13)“基于机器” 一词涵盖了各种各样的计算系统。例如,目前最先进的新兴量子计算系统,尽管其操作原理独特并利用量子力学现象,但与传统计算系统有显著差异,它们也属于基于机器的系统;同样,生物或有机系统只要具备计算能力,也属于此类。
2. 自主性
(14)该定义的第二个要素是系统 “被设计为以不同程度的自主性运行”。人工智能法案序言第12条阐明,“不同程度的自主性” 是指人工智能系统被设计为在行动上 “在一定程度上独立于人类参与,并且具备在无人类干预的情况下运行的能力”。
(15)自主性和推断能力密切相关:人工智能系统的推断能力(即其生成诸如预测、内容、建议或决策等能够影响物理或虚拟环境的输出的能力)是实现其自主性的关键。
(16)自主性概念的核心是 “人类参与” 和 “人类干预”,因此也涉及人机交互。在可能的人机交互的一个极端是那些设计为通过手动操作功能执行所有任务的系统。另一个极端是那些能够在没有任何人类参与或干预的情况下运行的系统,即完全自主运行的系统。
(17)人工智能法案序言第12条中提到的 “一定程度的行动独立性” 排除了那些设计为仅在完全手动的人类参与和干预下运行的系统。人类参与和人类干预可以是直接的,例如通过手动控制;也可以是间接的,例如通过基于自动化系统的控制,使人类能够委托或监督系统操作。
(18)例如,一个需要手动提供输入才能自行生成输出的系统具有 “一定程度的行动独立性”,因为该系统被设计为具有在输出不受手动控制、未由人类明确且精确指定的情况下生成输出的能力。同样,一个在人类委托流程自动化后,能够根据人类提供的输入自行生成诸如建议等输出的专家系统,也具有 “一定程度的行动独立性”。
(19)人工智能法案第3(1)条中人工智能系统定义提及 “被设计为以不同程度的自主性运行的基于机器的系统”,这强调了系统与外部环境交互的能力,而不是系统开发所采用的特定技术(如机器学习)或模型架构的选择。
(20)因此,自主性水平是确定一个系统是否符合人工智能系统定义的必要条件。所有被设计为在行动上具有一定合理程度独立性的系统都满足人工智能系统定义中的自主性条件。
(21)在特定使用场景(如人工智能法案附件一和附件三确定的高风险领域)中能够在有限或无人类干预的情况下运行的系统,在某些条件下可能会引发额外的潜在风险,并需要考虑人类监督问题。例如,在设计系统时,供应商在考虑系统预期用途的背景下制定系统的人类监督或风险缓解措施时,自主性水平是一个重要的考量因素。
3. 适应性
(22)人工智能法案第3(1)条定义中的第三个要素是系统 “在部署后可能表现出适应性”。自主性和适应性是两个不同但密切相关的概念。它们经常被一起讨论,但代表了人工智能系统功能的不同维度。人工智能法案序言第12条阐明,“适应性” 指自我学习能力,使系统在使用过程中行为能够改变。适应后的系统对于相同的输入可能会产生与先前系统不同的结果。
(23)在定义的这一要素中使用 “可能” 一词表明,一个系统在部署后可能(但并非必须)具备适应性或自我学习能力才能构成人工智能系统。因此,系统自动学习、发现新的数据模式或识别超出其初始训练范围的关系的能力是可选的,并非确定系统是否符合人工智能系统定义的决定性条件。
4. 人工智能系统目标
(24)定义的第四个要素是人工智能系统目标。人工智能系统被设计为根据一个或多个目标运行。系统的目标可以是明确或隐含定义的。明确目标指开发者直接编码到系统中的明确陈述的目标。例如,它们可以被指定为优化某些成本函数、概率或累积奖励。隐含目标指未明确陈述但可以从系统的行为或潜在假设中推断出的目标。这些目标可能源于训练数据或人工智能系统与其环境的交互。
(25)人工智能法案序言第12条阐明,“人工智能系统的目标在特定背景下可能与人工智能系统的预期用途不同”。人工智能系统的目标是系统内部的,指要执行的任务目标及其结果。例如,企业虚拟人工智能助手系统的目标可能是以高准确率和低错误率回答用户关于一组文档的问题。相比之下,预期用途是面向外部的,包括系统设计部署的背景以及必须如何操作。实际上,根据人工智能法案第3(12)条,人工智能系统的预期用途指 “供应商预期人工智能系统的用途”。例如,对于企业虚拟人工智能助手系统,预期用途可能是协助公司的某个部门执行特定任务。这可能要求虚拟助手使用的文档符合某些要求(例如长度、格式),并且用户问题限于系统预期运行的领域。这一预期用途不仅通过系统内部操作实现其目标来达成,还通过其他因素实现,例如将系统集成到更广泛的客户服务工作流程中、系统使用的数据或使用说明。
5. 使用人工智能技术推断如何生成输出
(26)人工智能系统的第五个要素是它必须能够从接收到的输入中推断如何生成输出。人工智能法案序言第12条阐明,“人工智能系统的一个关键特征是其推断能力”。如该序言进一步解释的,人工智能系统应与 “更简单的传统软件系统或编程方法区分开来,不应涵盖那些仅基于自然人定义的规则自动执行操作的系统”。因此,这种推断能力是区分人工智能系统与其他类型系统的关键、不可或缺的条件。
(27)序言第12条还解释说,“这种推断能力是指获得诸如预测、内容、建议或决策等能够影响物理和虚拟环境的输出的过程,以及人工智能系统从输入或数据中推导模型或算法(或两者皆有)的能力”。对 “推断” 概念的这种理解与ISO/IEC 22989标准并不矛盾,该标准将推断定义为 “从已知前提得出结论的推理”,并且该标准包含一个针对人工智能的注释,指出:“在人工智能中,前提可以是事实、规则、模型、特征或原始数据。”
(28)“获得诸如预测、内容、建议或决策等能够影响物理和虚拟环境的输出的过程” 主要指人工智能系统在 “使用阶段” 基于输入生成输出的能力。“人工智能系统从输入或数据中推导模型或算法(或两者皆有)的能力” 主要(但不限于)指系统的 “构建阶段”,并强调了构建系统所使用技术的相关性。
(29)人工智能法案第3(1)条中使用并在序言第12条中阐明的 “推断如何” 一词,比将推断概念狭义地理解为系统从给定输入中得出输出并推断结果的能力更宽泛。因此,人工智能法案第3(1)条中使用的表述 “推断如何生成输出” 应理解为涉及构建阶段,在该阶段系统通过能够进行推断的人工智能技术得出输出。
5.1 实现推断的人工智能技术
(30)专门关注人工智能系统的构建阶段,人工智能法案序言第12条进一步阐明,“在构建人工智能系统时实现推断的技术包括从数据中学习如何实现特定目标的机器学习方法,以及从编码知识或待解决任务的符号表示中进行推断的基于逻辑和知识的方法”。这些技术应被理解为 “人工智能技术”。
(31)这一阐释明确强调,“推断” 概念应从更广泛的意义上理解,包括人工智能系统的 “构建阶段”。人工智能法案序言第12条随后就使人工智能系统具备推断如何生成输出的能力的技术提供了进一步指导。因此,可用于实现推断的技术包括 “从数据中学习如何实现特定目标的机器学习方法,以及从编码知识或待解决任务的符号表示中进行推断的基于逻辑和知识的方法”。
(32)人工智能法案序言第12条提到的第一类人工智能技术是 “从数据中学习如何实现特定目标的机器学习方法”。该类别包括多种使系统能够 “学习” 的方法,如监督学习、无监督学习、自监督学习和强化学习。,
(33)在监督学习的情况下,人工智能系统从注释(标记数据)中学习,其中输入数据与正确输出配对。系统使用这些注释学习从输入到输出的映射,然后将其推广到新的、未见过的数据。基于人工智能的电子邮件垃圾邮件检测系统就是一个监督学习系统的例子。在其构建阶段,该系统在包含人类标记为 “垃圾邮件” 或 “非垃圾邮件” 的电子邮件的数据集上进行训练,以从标记电子邮件的特征中学习模式。一旦训练完成并投入使用,该系统可以分析新邮件,并根据从标记数据中学习到的模式将其分类为垃圾邮件或非垃圾邮件。
(34)其他基于监督学习的人工智能系统的例子包括在图像数据集上训练的图像分类系统(每个图像都标记有一组标签,如汽车等物体)、在人类专家标记的医学影像上训练的医疗设备诊断系统,以及在标记交易数据上训练的欺诈检测系统。
(35)在无监督学习的情况下,人工智能系统从未标记的数据中学习。模型在没有任何预定义标签或输出的数据上进行训练。使用聚类、降维、关联规则学习、异常检测或生成模型等不同技术,系统被训练在没有关于结果应该是什么的明确指导的情况下,在数据中寻找模式、结构或关系。制药公司用于药物发现的人工智能系统就是无监督学习的一个例子。人工智能系统使用无监督学习(例如聚类或异常检测)对化合物进行分组,并根据它们与现有
药物的相似性预测潜在的新疾病治疗方法。
(36)自监督学习是无监督学习的一个子类别,其中人工智能系统以监督的方式从未标记的数据中学习,使用数据本身创建自己的标签或目标。基于自监督学习的人工智能系统使用各种技术,如自动编码器、生成对抗网络或对比学习。通过预测图像中缺失像素来学习识别物体的图像识别系统就是基于自监督学习的人工智能系统的一个例子。其他例子包括通过预测句子中的下一个标记来学习的语言模型,或通过预测音频信号中的下一个声学特征来学习识别口语单词的语音识别系统。
(37)基于强化学习的人工智能系统通过 “奖励” 函数从自身经验中收集的数据中学习。与从标记数据中学习的人工智能系统(监督学习)或从模式中学习的系统(无监督学习)不同,基于强化学习的人工智能系统从经验中学习。系统没有被给予明确的标签,而是通过试错学习,根据从环境中获得的反馈改进其策略。能够执行抓取物体等任务的基于人工智能的机器人手臂就是基于强化学习的人工智能系统的一个例子。强化学习也可用于,例如,优化搜索引擎中的个性化内容推荐和自动驾驶汽车的性能。
(38)深度学习是机器学习的一个子集,它利用分层架构(神经网络)进行表示学习。基于深度学习的人工智能系统可以自动从原始数据中学习特征,无需手动进行特征工程。由于层数和参数数量较多,基于深度学习的人工智能系统通常需要大量数据进行训练,但在有足够数据的情况下,可以学习识别模式并进行高精度的预测。基于深度学习的人工智能系统被广泛使用,它是许多近期人工智能突破背后的技术。
(39)除了上述各种机器学习方法外,人工智能法案序言第12条提到的第二类技术是 “从编码知识或待解决任务的符号表示中进行推断的基于逻辑和知识的方法”。这些人工智能系统不是从数据中学习,而是从人类专家编码的知识(包括规则、事实和关系)中学习。基于人类专家编码的知识,这些系统可以通过演绎或归纳引擎,或使用排序、搜索、匹配、链接等操作进行 “推理”。通过使用逻辑推理得出结论,此类系统将形式逻辑、预定义规则或本体应用于新情况。基于逻辑和知识的方法包括,例如,知识表示、归纳(逻辑)编程、知识库、推理和演绎引擎、(符号)推理、专家系统以及搜索和优化方法。例如,基于语法知识和逻辑语义的经典语言处理模型依赖于语言结构,识别句子的句法和语法成分以提取给定文本的含义。基于逻辑和知识的方法的另一个突出例子是早期用于医学诊断的专家系统,这些系统通过编码一系列医学专家的知识开发而成,旨在从给定患者的一组症状中得出结论。
5.2 不属于人工智能系统定义范围的系统
(40)序言第12条还解释说,人工智能系统的定义应将人工智能系统与 “更简单的传统软件系统或编程方法区分开来,不应涵盖那些仅基于自然人定义的规则自动执行操作的系统”。
(41)有些系统具有狭义的推断能力,但由于其分析模式和自主调整输出的能力有限,可能仍不属于人工智能系统定义的范围。此类系统可能包括:
用于改进数学优化的系统
(42)用于改进数学优化或加速和近似传统成熟优化方法(如线性或逻辑回归方法)的系统不属于人工智能系统定义的范围。这是因为,尽管这些模型具有推断能力,但它们并未超越 “基本数据处理”。一个表明系统未超越基本数据处理的迹象可能是它已被长期稳定使用。这包括,例如,在优化问题中近似函数或参数同时保持性能的基于机器学习的模型。这些系统旨在提高计算问题中使用的优化算法的效率。例如,它们通过提供学习到的近似值、启发式方法或搜索策略来帮助加速优化任务。
(43)例如,基于物理的系统可能使用机器学习技术来提高计算性能,加速传统基于物理的模拟或估计参数,然后将这些参数输入到已有的物理模型中。这些系统不属于人工智能系统的定义范畴。在此示例中,机器学习模型对复杂的大气过程(如云微物理或湍流)进行近似处理,从而实现更快且计算效率更高的预测。
(44)另一个不属于该定义范围的系统示例是用于优化带宽分配和资源管理的卫星电信系统。在卫星通信中,传统的优化方法可能难以满足网络流量的实时需求,尤其是在针对不同地区变化的用户需求进行调整时。例如,机器学习模型可用于预测网络流量,并优化卫星转发器的功率和带宽等资源的分配,其性能与该领域的传统方法相近。
(45)虽然这些系统可能包含自动自我调整功能,但这些调整旨在通过提高计算性能来优化系统功能,而不是以智能的方式调整其决策模型。在这种情况下,它们可能被排除在人工智能系统的定义之外。
基本数据处理系统
(46)基本数据处理系统是指遵循预定义的、明确指令或操作的系统。这些系统在开发和部署时,基于手动输入或规则执行任务,在系统生命周期的任何阶段都不进行 “学习、推理或建模”。它们根据固定的人为编程规则运行,不使用机器学习或基于逻辑的推理等人工智能技术来生成输出。这类基本数据处理系统包括,例如,用于根据特定标准(如 “查找上个月购买特定产品的所有客户”)对数据进行排序或筛选的数据库管理系统、不包含人工智能功能的标准电子表格软件应用程序,以及从调查中计算总体平均值并在一般情况下使用该结果的软件。
(47)仅用于描述性分析、假设检验和可视化的系统也不属于人工智能系统的定义范畴。例如,在用于销售报告可视化的软件中,可使用统计方法创建一个销售仪表板,展示总销售额、各地区平均销售额以及随时间的销售趋势。借助统计方法,这些数据可以汇总并以图表和图形的形式可视化。然而,该系统并不推荐如何提高销售额或推广哪些产品。另一个例子是一个软件系统,它应用统计技术处理民意调查或调查数据,以确定其有效性、可靠性、相关性和统计显著性。这类系统不进行 “学习、推理或建模”,只是以提供信息的方式呈现数据。