专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
中国航务周刊  ·  第七届进博会火热进行中!达飞两大主题等你来探 ·  2 天前  
中国航务周刊  ·  商务部:对这些国家100%“零关税” ·  1 周前  
中国航务周刊  ·  上港集团第三季度净利润33.95亿元 ·  1 周前  
中国航务周刊  ·  散货船“RU MENG LING”轮,网络竞价转让 ·  1 周前  
51好读  ›  专栏  ›  歸藏的AI工具箱

微软也要搞 Computer use 帮 Open AI 狙击 -20241024215837

歸藏的AI工具箱  · 微博  ·  · 2024-10-24 21:58

正文

2024-10-24 21:58

微软也要搞 Computer use 帮 Open AI 狙击 Anthropic?#ai#

他们开源了一个纯视觉基础 UI 解析 Agents OmniParser。

能够提高视觉语言模型在用户界面上执行任务的能力,通过准确识别交互式图标并理解屏幕截图中各元素的语义。

想做类似 Computer use 功能的朋友可以参考一下。

项目地址:microsoft.github.io/OmniParser/