报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。
在第二章《TOP 101-2024 大模型观点》中,广东智用人工智能应用研究院担任工业 & 社区 CTO
张善友
认为,AI Agent 逐渐成为 AI 应用的核心架构,通过自主感知、决策和执行能力,实现对现有软件的智能化改造和升级,从而改变业务流程和用户交互方式。
全文如下:
AI Agent 逐渐成为 AI 应用的核心架构
文 / 张善友
随着人工智能技术的迅猛发展,大模型应用已经成为了 2024 年的热点话题,大模型应用已逐渐从初期的 Chatbot 迈向 RAG、Copilot 及 Agent 等更为高级的阶段。这些大模型具备强大的数据处理能力和深度学习能力,为各种应用场景提供了前所未有的便利。
单一的大模型在处理所有任务时往往存在局限性,因此需要借助外部工具或函数来增强其处理能力。
2023 年 6 月 13 日 OpenAI 发布的 GPT 模型的 Function Calling 功能,成为大模型与现实世界交互的桥梁。Function Calling 机制在很大程度上推动了 Agent 技术的发展。Agent 技术以其独特的自主性和智能性,正逐渐成为大模型应用的重要组成部分,引领着新的发展趋势。
在智能化方面,Agent 的学习能力得到了极大的增强。传统的机器学习技术为 Agent 提供了初步的学习框架,使得 Agent 能够通过数据驱动的方式学习并优化自身行为。
然而,随着神经网络模型的广泛应用,Agent 的学习能力得到了质的飞跃。深度学习技术使得 Agent 能够处理更加复杂、高维的数据,从而更精确地感知环境信息并做出相应决策。此外,强化学习技术的不断发展也为 Agent 提供了持续学习和自我优化的能力,使得 Agent 能够在与环境的互动中不断改进自身策略,实现更高级别的智能化。
早期的 Agent 系统往往依赖于预设的规则和策略进行决策和行动,自主性和灵活性相对有限。然而,随着大模型推理能力的发展,Agent 已经具备了更高的自主性。这种自主性不仅体现在 Agent 能够根据环境变化和任务需求自主调整行为策略上,更表现在 Agent 能够在一定程度上进行自我管理和自我修复,以应对各种复杂和不确定的情况。
AI Agent 的发展趋势是其逐渐成为 AI 应用的核心架构,通过自主感知、决策和执行能力,实现对现有软件的智能化改造和升级,从而改变业务流程和用户交互方式。
2024 年,开源社区中出现了一些著名的多智能体框架,如 MetaGPT、LangGraph 和 AutoGen,这些框架通过不同的技术手段来解决多智能体系统中的信息冗余和任务复杂性问题。
这些框架的出现表明,未来多智能体系统将更加注重灵活性和可定制性。
多智能体框架逐渐成为主流,有效解决了单智能体视角局限的问题,实现了多工作流的并行处理,使得推理过程更加可靠,并具备了对多模态数据的兼容性。这种趋势表明,未来的 AI Agent 将不再局限于单一任务,而是能够处理复杂的多任务环境,提高整体效率和可靠性。
AI Agent 的发展还依赖于大模型的持续优化和创新。
大模型的发展方向包括优化性能、利用庞大的训练数据集模拟人类行为以及增强模型固有的通用能力。
这些优化和创新将推动 AI Agent 在推理、规划、记忆和工具使用等方面的能力提升,2024 年的 OpenAI 的 o1 模型是这方面的典型代表,不仅是 OpenAI 所代表的闭源的大模型是这样,开源的大模型也是在不断提升智能化能力,例如 2024 年 9 月阿里发布的 Qwen 2.5 72B 模型成为全球最强开源大模型。此外,Qwen 2.5 的整体性能相比前一代提升了超过 18%,并且在多模态能力、长文本处理和指令遵循等方面也有所增强。
大模型应用从 Chatbot 到 RAG、Copilot 和 Agent 的发展历程充满了挑战与机遇。随着技术的不断进步和创新,我们有理由相信,大模型应用将在未来展现出更加广阔的应用前景和巨大的社会价值。
张善友
从事.NET 技术开发二十三年,认证 CKAD 专家,曾在腾讯工作 12 年,目前在广东智用人工智能应用研究院担任工业 & 社区 CTO。业余积极参与运营.NET 技术社区、Dapr 中文社区、Semantic Kernel 中文社区,.NET 黄埔论坛以及相关开源项目,运营微信公众号“dotNET跨平台”和“新一代智能应用”。荣获连任 19 次微软最有价值专家 MVP,6 届华为云 HCDE,6 届腾讯云最有价值专家 TVP。
阅读完整报告