专栏名称: 硅发布
我们在硅谷,为您报道最前沿趋势。
目录
相关文章推荐
中国日报网  ·  夜·赏|《山海经》五行神 ·  昨天  
中国日报网  ·  夜·赏|《山海经》五行神 ·  昨天  
北京交通广播  ·  多彩非遗庆新春 | 瑞蚨祥:一针一线见证传承 ·  2 天前  
春江潮起  ·  火出圈!40多分钟,央视专题报道镇江 ·  3 天前  
春江潮起  ·  火出圈!40多分钟,央视专题报道镇江 ·  3 天前  
51好读  ›  专栏  ›  硅发布

终于,OpenAI 的 AI Agents 来了!

硅发布  · 公众号  ·  · 2025-01-24 10:00

正文


千盼万盼,OpenAI 的 AI Agents 终于来了。 几小时前,OpenAI 宣布:
其通用 AI Agent——Operator 的研究预览版 ,将首先通过 ChatGPT 的 200 美元 Pro 订阅计划向美国用户推出,并最终推广给 ChatGPT 的 Plus、Team 和 Enterprise 用户。此外,Operator 很快会登陆其他国家,但欧洲还需要一段时间。
Operator 可自行控制网络并独立执行某些操作,它将自动执行包括预订旅行住宿、预订餐厅及在线购物等任务 。其界面也有多种任务类别可供用户选择:购物、送货、餐饮与旅行。见下图,所有这些类别都支持不同类型的自动化:


不过,我想提醒大家注意四件事:
1,既然 Operator 被称为是“研究预览版”,就意味着它目前还有局限性,发展过程中会出现错误。
这也是 OpenAI 称“希望首先与最活跃用户合作”的原因,这些用户“更愿承认该产品还处于研究预览阶段”。
OpenAI 还强调:“ 这是人机交互方式的根本区别,是一项艰巨的技术挑战。”

根据 OpenAI 的介绍:Operator 使用一种名为“计算机使用代理”(CUA)的新 AI 模型,该模型将其 GPT-4o 模型的视觉功能与“高级推理”相结合。OpenAI 称过去一年,其对其模型的形象与推理能力的改进变得更乐观,且 CUA 经过训练可以与人们通常在网页上看到的文本、按钮和菜单进行交互,因此 尽管目前存在局限性,但公司在“花了一些时间完善”后,认为 Operator 已准备好进行有限发布。

2,我很关心这类产品的应用场景。
OpenAI 的首席商务官吉安卡洛·里奥内蒂将这个问题总结为是: 帮助节省家庭与工作时间,因为这些地方有“巨大的机会”来实现常见任务的自动化。
去年底,里奥内蒂在接受美媒采访时其实还提到过如下一段话, 他说:

“当考虑 AGI 级别时,OpenAI 认为每个级别都会解决新用例。第一级,是聊天机器人;第二级,是推理;第三级,是 Agents;第四级,是可以产生突破性想法的 AI;第五级,是可以充当组织的 AI。而到第五级时,我们相信我们将达到完全的 AGI。

因此对于应用场景, 第一个层次,是基本的对话式 AI 系统,类似于今天的 AI 聊天机器人。第二个层次,是推理,让你有能力解决复杂问题,如在法律或制造行业中的案例。 第三个层次,是 Agents, 这些系统可以自主采取行动并完成任务, 这将开辟出许多全新的用例, 并很快将成为可能。”

可见,AI Agents 的应用场景将远远不止 Operator 目前已经推出的这些可选项。

3,企业级市场。

去年 9 月我曾写过美国步入 Agents 的 临界点

当时美国十几家大公司都推出了 Agents,如 Salesforce 和 Workday 等,这些 Agents 可以在商用场景中完成如汇总报告、联系销售前景和求职等任务。 而大公司们之所以等不及了,就是因为担心 OpenAI 推出 Agents 抢走他们的客户群。

此外在初创公司的较量中, Anthropic 实际上要比 OpenAI 更早地在 Agents 方面有所行动。 但双方还是有很多区别的,如 Anthropic 只专注企业级市场, 而目前 OpenAI 似乎也暂时不想在企业级市场做出 Aggressive 的动作。

它称:它可能会考虑为企业客户增加特定的控制或护栏,但目前公司的重点是首批用户。

关于安全性,OpenAI 已经为消费级用户构建起隐私、安全和控制功能,有助于确保 Agents 不会偏离其编程,更重要的是,让用户能够控制 AI。

例如,Operator 有一项名为“接管模式”的功能,要求人们接管输入付款详细信息或登录信息的控制权。OpenAI 称,Operator 还会在完成发送电邮等高风险任务前要求获得批准,且它不适用于银行交易或对工作申请做出决定。该公司补充说,Operator 不会使用用户之前与 ChatGPT 共享的数据来采取行动。

4,最后,就是可用性。

这个问题还有待观察。

OpenAI Operator 的第一批企业合作名单(如 Instacart、Uber、OpenTable 等)让我想起了此前 OpenAI 那曾经让很多人激动、最终却不了了之的插件计划。

我想, 可用性也可能会是 Agents 的最大挑战之一 ,因为目前实际上大多数人都还没在日常生活中使用过。 即使是对于企业,大多数的 AI Agents 目前也还在以有限的方式进行测试或使用。


// 您也可以加入会员解锁所有付费内容。

会员权益: 一年 251 个工作日,每个工作日我将撰写美国 AI 前沿最重要的一件事/一家公司/一个趋势,并说明为什么重要。251 天后,您对美国科技前沿趋势的了解将超过国内 99% 的人。如下扫码登录(老会员续费请见底下那个二维码)






请到「今天看啥」查看全文