专栏名称: 黄建同学

数码博主超话主持人（ChatGPT超话）头条文章作者我的学习笔记，关注AI+新能源

目录

相关文章推荐

Java编程精选 · 阿里云机房火灾，字节等服务瘫痪，网友：吃瓜吃 ... · 2 天前

英国报姐 · 英国70岁继女状告54岁中国后妈！为千万遗产 ... · 昨天

英国那些事儿 · 伦敦220万镑豪宅扩建地下室时突然倒塌！邻居 ... · 6 天前

英国报姐 · 美国宝妈连生10个儿子只为要女儿？网友：是不 ... · 5 天前

英国那些事儿 · 傻脸娜最新采访信息量超大！自曝婚后不随夫姓， ... · 1 周前

51好读 › 专栏 › 黄建同学

ScreenAI 是由 Google AI 开发的视觉语言模型 -20240423185517

黄建同学 · 微博 · · 2024-04-23 18:55

正文

2024-04-23 18:55
本条微博链接

ScreenAI 是由 Google AI 开发的视觉语言模型 (VLM)，可以理解用户界面 (UI) 和信息图表。

它很强大 — — 能够执行图形问答、元素注释、总结、屏幕导航和特定于 UI 的 QA 等任务。#chatgpt##ai探索计划#

Blog：research.google/blog/screenai-a-visual-language-model-for-ui-and-visually-situated-language-understanding/

工作原理：就像一个超强的 UI 解释器

ScreenAI 采用两个阶段：
- 预训练：应用自监督学习自动生成数据标签
- 微调：使用人工评估者手动标记的数据

使用例子：
1. 问答，可以回答有关屏幕截图内容的问题
2. 屏幕导航，将自然语言表达转换为屏幕上可执行的操作。例如，“单击搜索按钮。”
3. 屏幕摘要，用一两句话概括屏幕内容

黄建同学的微博视频

推荐文章

Java编程精选 · 阿里云机房火灾，字节等服务瘫痪，网友：吃瓜吃到自己头上了

2 天前

英国报姐 · 英国70岁继女状告54岁中国后妈！为千万遗产骗婚93岁老头，还把自己儿子写进遗嘱？

昨天

英国那些事儿 · 伦敦220万镑豪宅扩建地下室时突然倒塌！邻居们仓皇失措：吓死人了！

6 天前

英国报姐 · 美国宝妈连生10个儿子只为要女儿？网友：是不是都叫招妹、来妹、盼妹…

5 天前

英国那些事儿 · 傻脸娜最新采访信息量超大！自曝婚后不随夫姓，永远无法怀孕，想找代孕...？

1 周前

数码评价 · 小米能用手机俘获二次元？三大难关需要破解

7 年前

摄像人网 · 星云5100“编码器”深度解析

7 年前

叶子猪游戏网 · 胡说八卦：妹子能好好把你的裙子撩回去么

7 年前

bookface · 父亲，是世界上无人可替代的工作

7 年前

A股备忘录 · 一对夫妻买彩票中了30个亿，5个月后，他们的生活照被曝光，震惊世界……

7 年前

Sov5搜索 · 小百科 · 移动版

51好读 - 好文章就要读起来!