Insight Partners发布了一篇非常详尽的人工智能智能体的调研,一篇文章就可以完成对智能体概念的入门。
详细介绍了自动化平台的演化过程、RPA和任务自动化平台的实现方式、现阶段 AI 智能体的定义以及分类、最后是关于企业和智能体构建者的建议。
本篇正文共 10538 字,仔细阅读约 20 分钟
AI 工具的普及点燃了人们对知识工作者和消费者生产力大幅提升的希望。基于 Transformer 的大语言模型 (Large Language Models, LLMs) 展示了正在通过全新自动化方法来革新工作流程的 AI 能力。本文将追溯 AI 时代的自动化历程,深入探讨一些当前和不断发展的平台。文章内容基于我们与研究人员、开发者、从业者、企业用户以及 Insight 内部的众多讨论。
我们先从几个自动化领域发展趋势的预测开始:
从消费者到知识工作者,每个人都将拥有自己的 AI 助手。这将重新定义垂直应用、自动化平台和 IT 服务之间的传统边界,为企业家创造变革性的市场机会。AI 助手将以不同形式出现,从现有平台的辅助工具,到内嵌 AI 的应用,再到各种形态的 AI 智能体 (AI Agent)。
人机协作是部署生成式 AI 解决方案的核心。目前大多数应用场景都处于实验或早期生产阶段,侧重于建议和辅助型工作流程。LLMs 还不具备可靠的规划和推理能力,记忆和上下文理解等领域仍在研究中。在自动化平台上,确定性执行至关重要,LLMs 被用于"设计期"的特定任务,而非"运行期"。
自动化是一个被低估的难题。从业者正将 AI 加入他们的解决方案和专业经验,以提升平台效率和用户体验。顶尖的 LLM 提供商正在加入智能体建模、协作和工具访问功能,让用户能快速构建 AI 智能体 (如 GPT 系列)。有望突破的新兴企业需要利用独特的数据集和简洁的用户体验,提供差异化的客户价值,重塑工作流程。
内置 AI 的自动化部署将采取"从简单到复杂"的渐进方式,从简单任务开始,逐步过渡到复杂工作流。关键是持续尝试智能体,了解 AI 功能在哪些地方真正创造价值,并确保在数据、工具和运行时等方面搭建合适的"脚手架",使其成为自动化架构的一部分。随着 AI 模型能力的增强,可以逐步扩大 AI 功能的应用范围。
代码生成已成为开发基于生成式 AI (GenAI) 应用和 Agent 自动化平台的关键要素。代码兼具文本形式和明确性能指标两大特性,是 LLM 的理想功能。编程辅助工具的初版已经广泛部署,我们看到更成熟的 AI 驱动开发平台正在涌现。代码生成型 LLMs 将在智能体架构中扮演关键角色。
生成式 AI 有望加速这一自动化进程,因为从业者正将令人惊叹的新功能融入平台,开发者正在尝试全新架构,研究人员也在朝着自主人工通用智能 (AGI) 的终极目标不断努力。
AI 自动化架构的进化
预测类 AI、生成类 AI、通用 AI
自动化中的 AI:多元参与者,差异化方法
企业自动化通常是复杂的系统工程,从业者甚至将其视为编排多个要素来执行工作流的"乐谱"。随着生成式 AI 的兴起,从业者和创业公司正从不同视角把握这一机遇。
RPA 和任务自动化平台凭借丰富的自动化工作流程库和企业复杂流程实施经验,拥有先发优势。生成式 AI 为其提供了通过简化用户体验,解决系统脆弱性和繁琐搭建等难题的良机。
Microsoft 365、Notion 等应用平台正在将 AI 直接嵌入平台和用户工作流,辅助任务完成、提供建议并生成内容,为用户赋能。
原生 AI 方法从应用或工作流出发,以第一性原理重新思考自动化。在应用层面,Swimm、Writer 等新生产力工具令人惊艳地展示了生成式 AI 对工作模式的革新。各行业应用如销售、营销、法律、财务等也在利用生成式 AI 简化复杂工作。LLM 提供商和创业公司在自动化领域开辟新路径,利用智能体驾驭生成式 AI 能力执行简单任务。另一些方法将 LLMs 与必要的"脚手架"相结合,应对复杂工作流和应用。Agent 自动化是目前不断创新和研究的焦点,开发者正在模型、架构和工具方面进行广泛实验。
如前所述,"人在环"界面是当前架构的关键要素。开发者正通过多种方式将智能体植根于用户上下文,从在上下文窗口中输入,到将智能体设计为浏览器插件以观察用户行为并捕获上下文。LLM 插件引入外部数据或工具,是赋予智能体更多技能的关键。此外,智能体可通过 API 与电子邮件、生产力工具、通信平台等用户平台互动,模拟典型的人工工作流。智能体间交互界面是一个活跃的研究和开发领域。在 MoE 模型中,具有不同能力的任务智能体需要如前所述进行交互。久而久之,我们可以设想智能体之间通过交互来完成任务——类似于如今连接应用的 API,延伸出支持 AI 的版本。
企业部署自动化的考量
大多数企业已采用一系列自动化平台,从针对特定任务的经典 RPA 和任务自动化平台,到内部研发的解决方案。AI 带来的生产力提升仍更多停留在炒作阶段。基于生成式 AI 的自动化方案需要进行客观的成本效益分析,因为它们将经历与之前方法类似的成熟过程。
"关键在数据,笨蛋。" AI 智能体的性能与训练数据的质量和相关性直接相关。对许多企业而言,构建干净且集中的数据集和数据管道来训练模型,是这一旅程的起点。
随着 GPT-5/Llama 3 的即将发布,LLM 领域正在快速演进,这将刷新 SOTA 标准。同时,现在已有多个达到 GPT-4 级别性能的模型,且成本更具吸引力。企业可根据用例和功能需求,在不同来源、不同性价比的模型中做出选择。
在平台层面,市场有多种选择。established players 正将 AI 嵌入产品或提供辅助工具,以加速用户价值实现。初创公司/规模化企业和 LLM 提供商正采用原生 AI 方法重塑垂直领域应用,或打造全新平台,以变革成本、性能和用户体验。应根据工作流和性能基准做出选择。
当前的 LLM 对输入提示非常敏感,细微差异可能导致模型输出偏移。在用例层面(而非模型层面)建立明确的性能度量标准至关重要。治理和数据安全同样如此。如今,"人在环"是所有 AI 部署的基本特征。
[11]
The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey
[9]
–
Tula Masterman
[10]
,
Sandi Besen
[11]
,
Mason Sawtell
[12]
,
Alex Chao
[13]