专栏名称: 王吉伟
王吉伟自频道,关注IOT与产业互联网,专注互联网+、产业升级及数字化转型,致力于探索IOT时代产业升级新机会。
目录
相关文章推荐
英国大家谈  ·  威廉王子癌症检查,白金汉宫沉默不语 ·  2 天前  
英国报姐  ·  不到百元入Jennie同款牛仔裤,也太显腿直 ... ·  3 天前  
51好读  ›  专栏  ›  王吉伟

【深度盘点】从科技巨头到创业公司,先一步布局的AI Agent加速应用落地

王吉伟  · 公众号  ·  · 2024-03-29 17:24

正文

  • 从概念阶段到实际应用,国内AI Agent商业落地应用案例大盘点
  • 从概念到现实,那些在商业战场上脱颖而出的AI Agent应用案例
  • 从科技巨头到创业公司,先一步布局的AI Agent已经进入落地周期
  • 谷歌、Meta、微软的AI Agent聚焦应用,百度、 钉钉、 飞书的AI Agent已经落地
  • 全球科技巨头推进AI Agent应用落地,国内技术厂商率先开启商用
  • 大语言模型落地之年刚开始,国内AI Agent应用已经频频落地
  • 国内AI Agent的应用情况咋样了?盘点7家厂商智能体落地情况

全文约6800字,阅读时间10分钟
文/王吉伟

海外科技巨头对于AI Agent的探索,更加聚焦落地应用。

就在3.15期间,谷歌DeepMind宣布推出了一个可扩展指令多世界智能体(Scalable Instructable Multiworld Agent,SIMA),其特点就如其名字,可扩展、可指导、多世界。

论文地址: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

这是首个能在广泛3D虚拟环境和视频游戏中遵循自然语言指令的通用AI Agent,可根据自然语言指令在各种视频游戏环境中执行任务,可以成为玩家拍档、帮忙干活打杂。

相对于能玩《星际争霸 II》的AlphaStar系统,SIMA被DeepMind称作是“新的里程碑”,主打从适用单一游戏转向通用多种游戏,且可遵循语言指令。谷歌的研究重点,也会从单一游戏转向通用、可指导的游戏AI Agent。

SIMA最终将学会如何玩任何视频游戏,甚至是没有线性结束路径的游戏和开放世界游戏,将会成为与玩家默契配合的游戏助理。

虽然SIMA还处于研究阶段,但它已在多个游戏中有不错的表现。可以在《模拟山羊3》(Goat Simulator 3)中当司机开开车,在《幸福工厂》(Satisfactory)中挖矿石,在《瓦尔海姆》(Valheim)中寻找水源,在《无人深空》中(No Man’s Sky)驾驶宇宙飞船射击小行星收集资源。

Google正在与八个游戏工作室合作,在九种不同的视频游戏上训练和测试SIMA。相信用不了多久,SIMA就能实现游戏领域的商业化。

在Open AI的Sora刚火之时,Meta也发布了AI自动剪辑视频工具 LAVE。

这是一个专用于视频剪辑的AI Agent,采用AI技术实现简单短视频和广告视频的自动生成,无需人工干预。工具界面包括输入提示、素材库和视频时间轴,而Agents设计则指导编辑行动计划的执行。

论文地址:https://arxiv.org/pdf/2402.10294.pdf

LAVE 支持五种LLM功能,包括素材概览、创意头脑风暴、视频检索、故事板和剪辑修剪,实现自动生成的语言构建视频编辑。系统提示包括角色分配、动作描述和格式指导,以及最近的对话历史和用户输入,帮助生成行动计划。

LAVE的发布将为视频编辑带来革命性变化,实现更高效、智能的视频剪辑流程。而在行业市场的刚需的推动下,它将会快速实现商业落地。

在更早一些的春节期间,微软推出了名为UFO的Windows Agent。这是一款用于构建用户界面(UI)交互智能体的 Agent 框架,能够快速理解和执行用户的自然语言请求。

项目地址:https://github.com/microsoft/UFO

技术报告:https://arxiv.org/abs/2402.07939

UFO可以在Windows内自主回答用户查询,可在单个或者跨多个App中无缝导航和操作来满足Windows 操作系统上的用户请求。可以更加智能地理解用户的意图,不用人工干预,自动执行相应的操作。

UFO,或许会成为下一代Windows系统的核心,以后会存在于任何基于windows系统的PC、笔记本电脑等移动终端,想要开启商业化落地也是非常容易。

可以看到,海外的科技巨头在AI Agent的研发与应用方向上越来越具体化,这意味着这些Agent的应用将会快速形成AI应用或者融合进入传统软件系统,在更多的应用场景助力更多组织的高效运营。

事实上,国内科技企业在AI Agent的探索与落地应用方面也有了不错的进展。

比如百度灵境平台的某Agent应用上线3个月就已突破几百万访问量,再如超过70万家企业已在多个业务场景中部署了钉钉超级助理,还有实在Agent智能体、澜码AskXBO、金智维等也已在很多应用场景实现商用落地。

本文,王吉伟频道盘点了国内七家科技厂商的AI智能体发展与应用现状,将通过一些用户数据和实际应用案例,为大家揭晓国内厂商AI Agent的应用落地情况。

(注:回复 0329 ,获取本文提到的所有论文资源。)


科技巨头的应用落地情况

随着大语言模型技术的日益成熟,国内科技巨头纷纷加快在AI Agent领域的布局和应用落地。凭借自身强大的技术积累和丰富的应用场景,推动AI Agent技术在各行各业的深度融合与创新应用。

下面,我们来看看百度、飞书及钉钉的AI Agent落地情况。

百度灵境矩阵

百度在去年12月份将「灵境矩阵」平台升级为「文心大模型智能体平台」。

灵境矩阵基于文心大模型,平台的初衷是帮助开发者以更低的成本开发AI应用(智能体Agent),减少开发过程中的负担,同时为开发者提供分发渠道、流量支持等全方位服务,以实现商业价值的闭环。通过这一举措,百度希望推动大模型及其生态的繁荣发展。

百度灵境矩阵已有超过3万开发者申请入驻,并能依托百度全域场景,获得更多的流量分发路径和商业机会。目前,已有法律智能助手、TreeMind树图、职场密码AI智能简历等众多智能体通过灵境矩阵跑通从开发到分发再到变现的路径。

相关数据显示,至今年1月份,「灵境矩阵」已经有 2000+ 智能体上线,让多个合作伙伴成功跑通从低成本开发到分发,再到变现的完整路径。

比如「法律智能助手」这款AI应用,就是通过灵境矩阵平台的数据类接入模式,以较低成本接入文心大模型,并在各类合适的场景中实现分发。目前「法律智能助手」上线 3 个月,已累计超过230万的用户访问。

再如「TreeMind树图」也是灵境矩阵平台其中一个成功跑通商业闭环的案例。日均调用次数已经超过 5 万,而通过百度场景转化的用户,注册率超过 60%。

在注册充值率上,「TreeMind树图」的转化比例也有3%,超过工具付费率行业均值。目前 Treemind 树图的日活用户中,来自百度分发渠道的占比已经超过 10%。

目前,灵境矩阵平台上的智能体类型已经覆盖了办公、生活服务等多个领域,智能体应用也在不断飞速增长。

钉钉AI助理

钉钉AI助理是钉钉推出的一款集成了多种AI产品能力的应用,旨在帮助企业或个人用户迈入智能新时代。它通过自然语言交互,具备感知、记忆、规划和行动能力,能够执行包括信息摘要、写工作总结、写文档等通用办公工作。

钉钉AI助理也被看作是钉钉对AI Agent的一次探索落地,被称作钉钉在No App时代成为超级流量入口的机会。

钉钉AI助理能够快速产生AI价值,一方面得益于AI Agent技术,另一方面在于其丰富的业务场景和企业数据。经过九年发展,目前钉钉已深度集成了协同工作、沟通、任务管理等多种工作场景,为AI助理提供了实际应用的肥沃土壤。

同时在系统连接能力上,钉钉能够无缝集成钉钉平台的其他功能和第三方应用,实现跨应用的高效协同。

不仅企业可以利用自身的知识库和业务数据,创建招聘、财务、报表等AI助理,个人用户也能在AI助理页面快速创建工作、旅游、资讯等个性化AI助理。

比如百里集团通过钉钉研发的AI助理“货品数字员工”,有效解决了商品流通中的收发差异问题;佳沃集团的AI助理“小佳”在蓝莓种植领域成为采摘工人的得力助手;

钉钉AI助理在各行各业展现出卓越的应用效果,官方数据显示,已有超过70万家企业在多个业务场景中部署了钉钉超级助理,创造了众多智能化解决方案。

钉钉不仅推出了AI助理,还积极构建AI智能助理平台与应用市场,类似于App Store或Google Play,连接开发者与用户,促进个性化AI应用的分发与使用。

通过建设这样一个市场,与Discord的开放平台策略相似。旨在通过构建生态系统,让用户、开发者和ISV基于钉钉的AI PaaS基础设施,轻松开发AI助理。

据悉,目前已经有一批技术厂商与钉钉达成了在数字化、AI Agent、全域数据分析等领域达成了战略合作,下面要说的实在智能就是其中一家。

3月28日,钉钉宣布AI助理升级。升级后上线了图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与 RPA 技术在AI应用的落地。

飞书智能伙伴

飞书智能伙伴是飞书AI交流平台的重要组成部分,它基于人工智能算法提供服务,旨在提升个人工作效率和企业业务运转效率。飞书智能伙伴能够在问答、群聊、创作、会议、数据分析等多个场景中发挥作用,提供强大的文档创作能力。

飞书智能伙伴是基于人工智能算法提供的服务,它具备知识、记忆和主动性,能够深入业务中,提供文档创作、数据分析、内容总结等能力,是一个典型的AI Agent产品。

智能伙伴的引入使得飞书成为一个解决人与人、人与AI协同工作的平台。用户可以创建具备专属名字及头像的智能伙伴,随时通过对话框与智能伙伴进行对话,并向其提出需求。

智能伙伴能够迅速获取信息并生成相关内容,还能帮助用户提炼会议要点、总结未读消息、分析PDF与音视频等,以及自动续写或生成文档、表格、邮件、思维导图、问卷等。

目前,飞书智能伙伴已经有了一些落地的应用案例。

比如,元气森林与飞书智能伙伴合作,将重塑线下零售补货流程。业务员通过语音指令即可自动完成下单,大幅提升工作效率。数米科技则借助飞书智能伙伴实现销售流程数字化,显著提升销售效率和商机管理,从而带来千万级的额外收益。

安克创新携手飞书智能伙伴,将系统升级为智库,实现知识随手可得、即用。作为全球消费电子领军企业,安克创新积极拥抱AI,通过提升工作中的AI含量,显著改善效率。

他们利用飞书智能伙伴对QMS系统进行迭代,使产品经理、研发团队等能够通过问答快速获取关键洞察,从而指导业务决策。

创业公司AI Agent落地情况

除了科技巨头集体发力AI Agent,众多创业公司也在拼命迎头追赶。有些创业公司立足行业场景需求,基于已有技术积累,开发出各具特色的AI Agent产品和服务,为用户的数字化转型提供智能化的交互体验和决策支持。

下面,我们也来看几个创业公司的AI Agent应用落地情况。

实在智能实在Agent智能体

实在智能的Agent智能体是一种结合了人工智能(AI)和机器人过程自动化(RPA)技术的产品,旨在通过自研AGI大模型和超自动化技术,实现高度自主、适应性和交互性的软件实体。这种智能体能够自主理解环境、做出决策并执行相应动作,为各个领域带来前所未有的便利和创新。

基于自研垂直大语言模型TARS和ISSUT(智能屏幕语义理解技术),实在Agent智能体不仅支持私有化部署,还支持无需部署即可使用的超自动化智能体。

下面是两个实在Agent智能体实际应用案例。

某市公安局为了解决基层警务工作中面临的人力紧张、工作效率低下等痛点问题,与实在智能合作开发了Agent数字干警小助手。这款智能助手能够模拟人类操作,实现业务流程的自动化处理,为基层提供不间断的数字警力支援服务。

通过实际应用,Agent数字干警小助手在交巡警、刑侦、经侦、反诈止付等多个警务领域,均取得了显著成效。

最显著的效果就是在启用Agent数字警员小助手后,仅需一名值班警力兼职看管,并可接待以往五名民警24小时轮班操作,日服被骗率由原先的5.1下降至0.55,整个被骗率下降近90%。出入境管理支队民警- 用1小时就能处理原本需要5小时才能完成的工作,看守所民警仅用5—6分钟就能实现超400多在押人员身份查询。

再看一个手机Agent应用案例。

春节开工期间,用户正忙于工作,无暇分身向客户发送开工问候。类似这种重复性工作,在手机智能体的帮助下就可以自动完成,只需对手机说出“向标签为客户的好友发送开工问候”的需求,它就可以识别您的微信标签备注,向该标签下所有客户发送专属问候语,成为用户的手机办公助理。

除了这两个应用案例,实在智能正在与多家大型企业合作开发面向不同应用场景涉及多种业务流程的AI Agent实际应用开发。

其最新消息是,公测产品更新了全新个人助理交互模式,将在4月正式对外公测。

澜码科技AskXBOT

澜码科技的AskXBOT是一个企业级AI Agent平台,它允许企业用户通过对话的方式提出需求,设计、创建和管理Agent,以快速定制企业级AI Agent来完成各类任务。

AskXBOT平台由设计器、知识中心、使用端、管理平台四大核心模块构成,为企业提供文档检索、AI调用等服务。此外,该平台还具有预置多种Agent模版、高效创建Agent、灵活配置满足企业个性需求等特点,该平台旨在提升组织的工作质量的同时降低成本。

以下,是它的两个应用案例。

案例1:澜码科技通过AskXBOT平台为某市监局打造了法律知识问答Agent,用于提高消费者权益保护工作的效率。这款Agent能够基于法律知识库为用户提供法律问答服务,并支持多种法律任务的处理,包括查询、推理等。

其准确率高达90%以上,不仅大大提高了市监局的执法效率,还有助于提升基层人员的执法经验,为市场监管领域的行业模型建立奠定了基础。

案例2:针对某人寿保险公司在提升保险代理人销售能力方面面临的挑战,澜码科技同样运用AskXBOT平台,为其定制了保险产品营销顾问与销售培训Agent。

这两款Agent积累了保险行业知识、产品卖点和销售技巧等关键信息,能够为代理人在产品咨询和销售提升方面提供全方位的支持。通过本地化大模型部署,Agent还可以为代理人提供各个环节的销售辅助,使用满意度达到90%。

目前,AskXBOT已经有不少应用案例,均帮助企业用户构建面向各种业务场景的具备不同功能Agent。

金智维K-Agent

金智维K-Agent是一款基于RPA+LLM打造的AI Agent类产品,为大模型落地应用提供平台。

K-Agent平台具备智能交互、思考、分析、自训练等能力,可以进行持续学习和自我优化。用户基于K-Agent平台,可以实现快速开发、部署各类智能助手(Copilot)型数字员工,从而应对不同的业务场景需求。

在K-Agent平台上开发的智能助手依托精调的领域模型,能够自主分析任务指令并规划操作流程,生成RPA脚本调用对应的平台或应用,高效优质地完成业务需求,给出执行结果反馈或者问答用户问题,将复杂的业务决策转化为可执行的业务能力。

金智维已开发出客情维护助手、营销内容助手、舆情风控助手、Web页面探索助手等数十种智能助手,让用户按需选取,大幅降低大模型使用门槛,让大模型的“小”型化部署成为可能。

目前,金智维基于政务智能体打造面向人社局等机构的政务大厅数字人智能导办场景,用户轻轻点一点屏幕,就能享受到一位和蔼可亲的虚拟数智柜员的服务,快速办理相关业务。

在K-Agent的支持下,数智柜员能够通过一对一的多轮对话方式,精准理解群众需求,使得问答交互的准确性大幅提升,在一问一答之间轻松解决群众办事需求,在优化政务大厅自助服务流程的同时,也提升人民群众对政府服务的满意度,助力政务机构持续打造“问办一体”新模式。

壹沓科技 「运小沓•数字员工平台」

壹沓科技打造的供应链专属大模型产品「运小沓•数字员工平台」, 是一个基于大模型的数字员工聚合及训练平台。

该平台可为供应链企业提供资深供应链运价经理、物流可视追踪经理、供应链新人成长师等高频业务场景的虚拟数字员工专家团队,为员工提供高效「所答即所问」的供应链领域准确知识, 助力企业构建「白领员工+Al Agent运小沓数字员工」人机协作模式。

下面,是 「运小沓•数字员工平台」 的一个落地应用案例。

某头部供应链企业所遇到的经营成本日益高企、业务效率不高、数据孤岛林立等业务挑战。在深度了解与分析该企业的现状与痛点后,壹沓科技为其定制了CubeAgent数字员工解决方案。

该方案通过自然语言式对话, 「运小沓•数字员工平台」 为客户提供开箱即用的Agent数字员工和精准的行业答案,为供应链企业量身打造虚拟数字员工专家团队、资深供应链运价经理、物流可视追踪经理、供应链新人成长师、行业案例专家行业翻译大师、行政问答助理等,协助白领员工完成各类数字化工作,让人聚焦创意、决策等高价值工作,从而为企业创造巨大价值。

方案实施后,通过「白领员工+Al Agent运小沓数字员工]工作模式,大幅提升运营效率和人才密度,实现降本增效。并通过非侵入式对接高度整合现有系统,串联起了数据孤岛,实现自动化与智能化。还打造了端到端业务超自动化,深度链接上下游,实现生产力跃迁。

后记: 走向商业生态拓展

从当前国内各大科技企业在AI Agent领域所取得的最新进展和突破不难看出,AI Agent正在向着更垂直的业务领域渗透。

完成了技术研发与产品实现,就要考虑市场生态的进一步建设与拓展。早期推出产品与解决方案的AI Agent厂商,已经在AI Agent的落地方面先一步走上了商业生态拓展之路。

以百度灵境矩阵、飞书智能伙伴、钉钉AI助理为代表的大模型厂商所推出的AI Agent构建平台,凭借强大的模型能力和便捷的Agent构建方式,先一步吸引了一些企业用户、AIGC应用厂商以及个人开发者。

在携手开发者助力企业用户高效开发AI应用的同时,也为更多普通用户提供了从业务视角开发个性应用的机会。

2024是大语言模型落地之年,大模型厂商们也在尽力拓展商业生态,以吸引更多垂直领域的技术供应商入驻平台。而为了更快地实现商业落地,创业公司也在努力拓展自身的生态,这样加入国产大模型厂商以及科技厂商的生态圈就成了不二之选。

以实在Agent智能体为例,其产品特性是能够与企业在用的第三方大模型进行完美融合,能够轻松实现直接调用。融合后的AI应用执行能力更强,可以跨端跨应用深入更多企业管理软件执行复杂业务流程。

当然对于有产研能力的企业客户,也可以将实在Agent集成进自身的自动化平台或是运营平台,以达到在人力成本不增加的情况下帮助企业提效,寻优的目标。

而“被集成”这个特性,也催生了AI Agent厂商的两种Agent服务解决方案:

一是为具备产研能力的拥有或者引入大语言模型的企业提供面向Agent构建的解决方案,在已有的大模型的基础上构建执行能力更强的企业级Agent;

二是为还不具备技术能力的还没有引入大语言模型的企业提供包括部署、构建、运营、维护在内的一站式Agent解决方案,部署完毕后企业就拥有了包括大语言模型在内的可以深入复杂业务流程的企业级AI Agent。

在这个基础上,衍生出了更多的生态合作商业模式,AI Agent厂商将会籍此进入更多的商业生态以加速商业落地进度。

比如实在智能已经与钉钉达成战略协作,双方将在企业数字化、AI Agent、全域数据分析等领域展开全面深度合作。

未来的AI Agent将能够为企业打造覆盖全部门、全流程、全任务流的超级智能体助手,通过最简单、直接、高效、智能的人机协同,让人的能力得到增强,帮企业在资源紧张的情况下实现持续,稳定的增长。

也就是,以最简单的人机协同,处理最复杂的业务流程。

智能体解决方案,将会为广大企业和组织带去更加智能、高效的经营模式,在财务、运营等部门担任各种要职。任何部门以及场景都可以部署多个不同职能的Agent,人们将与这些不同的Agent相互协作,实现更加高效的工作、学习与生活。

这样,AI Agent会遍布各个企业的场景、部门、组织以及分公司,由大量Agent构成的智能体网络或者智能体集群,将会参与到越来越多的业务流程中去,帮助企业实现快速稳定增效降本。

同时,它们也将最大程度的释放人力资源,把人们从简单、重复的枯燥业务中解放出去从事更有价值的工作,提升愉悦指数,让工作和生活更加平衡与完美。


全文完
【文末福利1】: 后台发消息 0329 获取本文提到的所有研报资源。

文末福利2 】:后台发消息 Agent2024 ,获取本文提到的十份研报及论文资源


RECOMMEND

推荐阅读

1、 API难以解决AI智能体执行能力问题,AI Agent深度落地锁定RPA
2、多家厂商引入ChatGPT,集成与融合生成式AI成为RPA技术新趋势
3、 【万字长文】全球AI Agent大盘点,大语言模型创业一定要参考的60个AI智能体
4、 AI Agent发展简史,从哲学思想启蒙到人工智能实体落地
5、RPA终极发展方向瞄准AI Agent,超自动化智能体时代已经开启
6、正在强烈冲击AI Agent的“准Agent” GPTs,真的会杀死AI智能体吗?


AIGC研究系列文章

AI Agent涌向移动终端,手机智能体开启跨端跨应用业务连接新场景

AI Agent引爆AGI时代,十篇研报透视AI智能体的现在与未来

【万字长文】数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向

详解AI Agent市场格局、技术路径与未来市场,智能体创业一定不要错过

API难以解决AI智能体执行能力问题,AI Agent深度落地锁定RPA

热闹的人工智能VS酷寒的资本寒冬,2023年AI Agent项目盘点与融资分析

正在强烈冲击AI Agent的“准Agent” GPTs,真的会杀死AI智能体吗?

AI Agent发展简史,从哲学思想启蒙到人工智能实体落地

【万字长文】全球AI Agent大盘点,大语言模型创业一定要参考的60个AI智能体

RPA终极发展方向瞄准AI Agent,超自动化智能体时代已经开启

从大语言模型到大流程模型,生成式AI带来的BPM范式转变

产业上下游齐发力LLM挺进端侧,大语言模型加速落地利好超自动化







请到「今天看啥」查看全文