专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
木木说卡  ·  速度!抓紧提额,冲飞猪大招 ·  昨天  
南方人物周刊  ·  豆瓣高分,这套书我一定要给孩子看! ·  昨天  
南方人物周刊  ·  陈英 ... ·  昨天  
南方人物周刊  ·  科幻,正成为写作者最大的风口 ·  2 天前  
51好读  ›  专栏  ›  歸藏的AI工具箱

微软也要搞 Computer use 帮 Open AI 狙击 -20241024215837

歸藏的AI工具箱  · 微博  ·  · 2024-10-24 21:58

正文

2024-10-24 21:58

微软也要搞 Computer use 帮 Open AI 狙击 Anthropic? #ai#

他们开源了一个纯视觉基础 UI 解析 Agents OmniParser。

能够提高视觉语言模型在用户界面上执行任务的能力,通过准确识别交互式图标并理解屏幕截图中各元素的语义。

想做类似 Computer use 功能的朋友可以参考一下。

项目地址:microsoft.github.io/OmniParser/






请到「今天看啥」查看全文