专栏名称: 赛博禅心

拜AI古佛，修赛博禅心

大模型是色盲吗？

赛博禅心 · 公众号 · · 2025-01-16 18:14

正文

先说结论：

多数模型，是色盲

人的绝大多数信息，来源于视觉输入。

我们用眼睛去看朝阳，看皎月，看大漠孤烟，看碧海雄关。那么，当我们拍下美景，来和大模型去讨论的时候：大模型看到的，和我们一样吗？

或许，大模型看到的，和我们，并不一样。

于是就有了这个测试：大模型是色盲吗？

做体检的时候，大夫可能会拿出几张图，问你是什么数字，就像下面这种

这是石原氏色盲检测图，由多种颜色的圆点组成多个数字：色觉正常者可以正确区分，而色盲患者则会判断错误。

那么，当我们把这些测试图给到 AI，让他来看看。这里取了两张最经典的：一个是色盲看不出来数字（红绿色盲读错），一个是只有色盲才能看出来数字

测试 A

正常读数：74

红绿色盲：21

测试 B

正常读数：无数字

红绿色盲：5

被测试方，选了 4 家：

OpenAI 的 GPT-4o
Claude(Anthropic) 的 3.5 Sonnet，通过 Claude
Gemini(Google) 的 2.0 (exp-1206)
智谱的 GLM-4

Prompt 统一使用：图里有数字吗？如果有的话，是什么？

第一题

正常读数：74；红绿色盲：21

ChatGPT 的 GPT-4o，回答正确

Claude 的 3.5 Sonnet，有些色盲

Gemini 的 2.0 (exp-1206)，实锤红绿色盲

智谱的 GLM-4，回答正确

小结： OpenAI 和智谱的模型，在这个测试中，色觉正常。Gemini 是红绿色盲，Claude 不知道是什么色盲

第二题

正常读数：无数字；红绿色盲：5

ChatGPT 的 GPT-4o，回答出了一个 5，鉴定为半色盲

Claude 的 3.5 Sonnet，回答出了一个 5，鉴定为半色盲

Gemini 的 2.0 (exp-1206)，啥也不是

智谱的 GLM-4，回答正确

小结：在这个测试中，只有 GLM-4 回答正确。

得出结论

先说结论：基于上面的色盲样本测试，智谱在视觉理解上比大多数模型都强。

	OpenAI	Claude	Gemini	智谱
测试 A	✅

请到「今天看啥」查看全文

推荐文章

清晨朗读会 · 渊源直播

4 天前

清晨朗读会 · 清晨朗读3197：Create a Mindful Relationship with Your Tech (3)

2 天前

清晨朗读会 · 清晨朗读3195：Create a Mindful Relationship with Your Tech (1)

4 天前

清晨朗读会 · 渊源直播

3 天前

桦爸聊升学 · 2024年下半年全国大学英语四、六级考试成绩公布！

昨天

今日日本 · 干货推荐！12款MUJI护肤品及工具，好用到家了！

8 年前

数字营销微刊 · 专栏 | 杨炯纬：互联网广告发展的必然趋势：人工智能与失控(上) ——原生广告“失控”后的破局之路

7 年前

深圳吃货小分队 · 烧烤早茶店,凌晨2点还能吃

7 年前

心理测试 · 超准测试：一个人在家，这些事情同时发生，你会先做什么？

7 年前

柴知道 · “博弈实验”结果统计：89人取得优胜

7 年前