专栏名称: 硅发布
我们在硅谷,为您报道最前沿趋势。
目录
相关文章推荐
人民日报评论  ·  过年回家,方言和普通话哪个“烫嘴”? | ... ·  20 小时前  
求是网  ·  延续八闽文脉 建设更高水平的文化强省 ·  3 天前  
人民日报评论  ·  人民日报任平文章:从春节看中国“和”文化 ·  3 天前  
51好读  ›  专栏  ›  硅发布

Anthropic 与 /dev/agents 展开竞争

硅发布  · 公众号  ·  · 2024-11-29 19:58

正文

让我来化繁为简。OpenAI 的第一位投资者 Vinod Khosla 说过:模型层的战争大概在 5 年的时间范围内。目前,时间已经过去了一半多,从产品的性能与融资速度看,实际上模型层的赢家已经基本可以确定。
他们(仅指闭源模型)是:OpenAI、Anthropic、谷歌的 Gemini,还有伊隆.马斯克的 xAI。
甚至从某些产品的性能看,Anthropic 可能还要更胜一筹。
据 10 月底美媒 The Information 的报道,OpenAI 评估模型编码能力的一些指标显示:最近 Anthropic 的模型具有优势,因此 OpenAI 正加大力度来改进其软件编程工具。
需要注意的是, 根据美国业界的说法:如果一个模型能够在生成良好代码方面表现更出色,那么通常它也能对非代码生成类型的其他用户查询产生更好的答案。
此外,在 Agents 的大赛中,Anthropic 也处于暂时领先地位。
同是 10 月底的消息:Anthropic 在 AI Agents 方面往前迈进了一大步,其在 Claude 3.5 Sonnet 中引入了一项新功能,叫“计算机使用”。这是一项技术突破,因为它可以将它的 AI 模型应用于任何的软件来进行工作,而不需要通过如像 Claude 的网络工具或 OpenAI 的 ChatGPT 这样的特定用户界面。
具体来说:当开发人员要求 Claude 模型使用一款计算机软件并给它必要的访问权时, Claude 会查看用户的屏幕截图 ,之后,计算出需要垂直或水平移动光标多少像素才能点击到正确位置。
Anthropic 称:该工作还刚起步,远没有准备好投入常规使用,但它已经提出了许多可能性。
例如:当该功能变得更好时,有可能会给 RPA 市场敲响丧钟。此外,如果 AI 软件不需要接入辅助功能,或不需要查看底层代码就能真正看到屏幕内容,那么这将带来大量的新机遇。
而就在这两天,刚刚 Anthropic 又提出了一种将数据连接到 AI 聊天机器人的新方法,名为——模型上下文协议,简称 MCP,目前已经开源。
MCP 可以支持任何模型(不仅仅是 Anthropic 自己的模型)通过各种业务工具、软件及内容存储库与应用开发环境中提取数据来完成任务,以帮助 AI 模型对用户查询做出更好、更具相关性的响应。
也就是说,其实昨天我写的 /dev/agents ,以及 Anthropic 刚推出的这一开源框架,本质上都是在针对 Agents 技术基础设施的一个空白,那就是:究竟该如何打破模型与模型背后的数据隔离与信息孤岛呢?
两者实际上都是在通过改善与外部系统的集成来增强 AI 的能力。 但是,两者的实现方式不一样:
Anthropic 的思路是: 通过开源协议解决问题。也就是通过开源一个革命性的新协议 MCP 协议,来允许开发人员在数据源和由 AI 驱动的应用之间建立起双向连接,并希望由此彻底解决LLM 应用连接数据难的痛点。以后开发人员再不用为每个数据源写定制的集成代码,MCP 一个协议全部搞定。
/dev/agents 的思路则是: 他们相信这里会存在一个全新的第三方操作系统,并且只有第三方操作系统的存在,才有可能释放出 Agents 的全部潜力。
其中,/dev/agents 预计产品的第一个版本将在明年年初至年中上市。
而 Anthropic 则称:目前包括 Block 和 Apollo 等公司已将 MCP 集成到他们的系统中,此外开发工具公司如 Replit、Codeium 和 Sourcegraph 等,正在向他们的平台添加 MCP 支持。
理论上说,这两者都有机会。
因为 Anthropic 的对手肯定不会希望进入 Anthropic 的生态,尤其是 OpenAI,它肯定会更希望它的客户与生态伙伴都使用 OpenAI 的数据连接方法和相关规范。事实上,最近 OpenAI 已经为 ChatGPT 引入了一项数据连接功能——Work with Apps,类似于 MCP 驱动的使用场景,它允许 ChatGPT 读取以开发为中心的编码应用中的代码。
OpenAI 还表示,计划未来把这项功能引入到其他类型的应用中,但目前它正在与亲密的合作伙伴一起实施,而不是通过开源底层技术的方式。
看起来,两者是否能成功,将取决于各自的可用性、性能的情况,以及推动市场采用的策略。


说明:因为各种各样的原因,我在微信公号写的东西和我在知识星球写的不一样,关心美国创投圈的专业读者,请移步到我的知识星球。如下扫码登录(老星球用户续费请见底下那个二维码)






请到「今天看啥」查看全文