专栏名称: AI小岛
AI小岛,高效不烦恼!这里是AI的宝藏岛,通过AI魔法让学习和工作事半功倍,开启新生活的无限可能。
目录
相关文章推荐
贵州日报  ·  李炳军在黔南州调研 ·  18 小时前  
百姓关注  ·  2025年第1号预警发布! ·  昨天  
百姓关注  ·  降价了!300多万人受益 ·  2 天前  
百姓关注  ·  痛惜!贵州女孩凌晨去世,年仅28岁 ·  2 天前  
百姓关注  ·  接连宣布:免费! ·  3 天前  
51好读  ›  专栏  ›  AI小岛

ChatGPT Operator 来了!实测结果曝光,效果竟然如此惊人!

AI小岛  · 公众号  ·  · 2025-01-25 10:59

正文

2025 年刚开年,OpenAI 就推出首波智能体“Tasks” ,不到 10 天,OpenAI 又放了个大招,紧随其后,发布全新智能体 ChatGPT Operator。

这次不仅要挑战自己,也要直接对标 Anthropic 的 Claude Computer Use。

在多项基准测试中,Operator 的表现可谓十分亮眼,尤其是在 WebVoyager 测试中,成功率高达 87%。


那么,ChatGPT Operator 到底有什么过人之处?

作为早期体验者,The Rundown AI 的创始人 Rowan Cheung 对ChatGPT Operator 进行详细的内测。

以下是他分享的一些体验,真的让人感到震撼。

1. 用图像和食谱购买晚餐食材

假设你已经看中了某个食谱,甚至拍下了食材的照片,过去你可能需要手动查找食材并下单。

现在,只需要把食谱和照片发给ChatGPT Operator,它能识别图片中的食材,并根据食谱自动为你下单。

视频为加速过程

2. 挑选周末旅行目的地

旅行规划是一个繁琐的过程,特别是当你需要根据预算、兴趣以及隐藏的旅游宝地来安排行程时。

ChatGPT Operator 通过在Reddit等社区收集信息,结合你的偏好 ,自动为你规划一个周末旅行路线。

甚至当网站对其进行屏蔽时,它竟然能通过其他搜索引擎找到解决方案,展示惊人的自主灵活性,着实让人惊讶。

3. 根据预算推荐家政服务

家政服务的预约往往涉及多个平台和大量信息比对。

ChatGPT Operator通过预先设置好的预算信息,能够为你筛选出多个符合要求的家政服务供应商,甚至能够提供详细的评价,帮助你做出选择。

这样,你可以省去自己反复查询和比较的时间。

4. 代为进行加密货币投资研究

加密货币的市场变化无常,选择哪个代币进行投资常常需要耗费大量的时间和精力。

但ChatGPT Operator 在这一点上竟然能展现出不容小觑的优势。

当需要了解哪些代币值得关注时,不仅能快速扫描相关的加密货币信息,还能绕过某些验证码,继续提供实用的分析。

这种“创新性的解决方案”,你不得不再次惊讶。

5. 从头到尾帮你完成机票预订

无论是预订一张机票,还是修改航班,ChatGPT Operator都能通过与Booking系统的整合,自动为你完成。

即使需要你确认航班信息或付款细节,它也能及时提醒,确保每个环节都顺利进行。

6. 从多个渠道比价并购买生日礼物

为了挑选一份合适的生日礼物,ChatGPT Operator 不仅能根据需求提供合理的建议,还能比较各大网站的价格。

虽然有些网站会设置限制,阻止其获取信息,但它依然能在其他网站上找到相关的商品,并且确保给我提供最划算的选择。

7. 健康保险:突破隐性信息障碍

当涉及到健康保险时,大多数保险公司并不会公开所有价格,往往需要预约才能获取完整的报价。

然而,ChatGPT Operator能通过博客、论坛等其他途径,为你提供相关的建议和引导。

直接突破信息壁垒,让你更轻松地做出决策。


智能体的进化

如果你对OpenAI的“Tasks”功能仅仅停留在一个“还行”的印象中,那么面对ChatGPT Operator这几个案例,你可能会感到一阵惊讶。

这一次,OpenAI将智能体的能力提升到了一个全新的层次,ChatGPT Operator不仅能够理解任务需求,它还可以主动执行,甚至解决复杂的情境。

从功能层面上看,ChatGPT Operator的主要目标是代替我们处理繁琐且重复性的任务。

比方说,假设你要订个晚餐、预订一趟机票,或者在各大电商平台上比价购买商品。

过去你可能需要自己亲自操作,但现在,ChatGPT Operator可以在你做其他事情时,独立完成这些任务,并且高效完成。


是什么让 ChatGPT Operator 如此强大呢?

ChatGPT Operator 背后的核心技术精妙无比,基于OpenAI的“计算机使用代理”(Computer-Using Agent,CUA)模型。

这一模型结合GPT-4的视觉处理能力和高级推理能力,使其能够像人类一样“观察”网页内容(例如通过屏幕截图)并通过模拟鼠标点击和键盘输入来完成任务,无需依赖特定的API接口。

这种自主性和适应性是ChatGPT Operator的一大优势,也是 与 Claude Computer Use 的最大区别,这种能力 在执行复杂任务时,表现得异常高效。

ChatGPT Operator 更像一个真正的智能体,能够适应各种网页和任务,而 Claude 则更多依赖于预设的指令或 API 接口。

此外,ChatGPT Operator 还具备智能化的决策与自纠正能力。

在执行任务时,如果遇到困难或错误,它能通过推理和分析当前情况做出调整。

例如,假如餐厅预定时间已满,它会主动询问用户是否改订其他时间,而不是直接失败。

然,ChatGPT Operator 也非常注重用户的安全和隐私保护。

在执行涉及敏感信息的操作时(如支付信息),它会主动暂停任务并请求用户确认,从而确保用户信息的安全性。


局限和未来

不过,尽管ChatGPT Operator 在很多方面表现得非常出色,它也并非完美。

部分网站会检测到AI的存在并加以屏蔽,导致无法顺利操作。

另外,目前与ChatGPT Operator整合的合作伙伴数量有限,尚不能在所有领域广泛应用。

同时,它的任务执行输出较短,主要用于执行具体任务,而不像传统ChatGPT那样生成长篇文章或复杂的代码。

然而,这些局限性并不影响其巨大的发展潜力。

作为一款仍处于研究预览阶段的工具,ChatGPT Operator 正在不断迭代,未来有望带来更多突破。


2025年是智能体之年







请到「今天看啥」查看全文


推荐文章
贵州日报  ·  李炳军在黔南州调研
18 小时前
百姓关注  ·  2025年第1号预警发布!
昨天
百姓关注  ·  降价了!300多万人受益
2 天前
百姓关注  ·  接连宣布:免费!
3 天前
王国强  ·  重要的双缺口
7 年前
冷兔  ·  你经历过绝望吗?
7 年前