图片来源:123rf.com.cn正版图片库
谁能在彩虹里画下紫色结束、橙色开始的分界线呢?我们能清晰地看到颜色的不同,但是究竟在什么地方一种颜色逐渐地混入了另一种颜色呢?理智和疯狂的界限,亦是如此。
——赫尔曼·梅维尔,《比利·巴德》
橙色,红色?我都不知道该相信什么了!
——匿名,颜色调查
如果你再问我更多颜色问题我就用勺子把你的心脏吃掉
——匿名,颜色调查
究竟是在什么地方,一种颜色变成了另一种呢?《睡莲》,[法]莫奈。图片来源:en.wikipedia.org
编辑的话:美国网络漫画家Randall在其网站XKCD上进行了一次颜色调查,玩法是这样,程序会在屏幕上显示出一种颜色,参与调查的用户填入他们心中这种颜色的名称,如此反复直到用户退出为止。我们编译了他这次颜色调查的结果,很有一些让人意想不到的发现。
(文/Randall)谢谢大家在这次颜色调查里给我的所有帮助。总计222,500位用户人次共计命名了超过500万种颜色。总的来说,结果非常酷,分析起来也很好玩。这项调查有些根本的局限性,会在文末讨论。但是,光看这些数据量就已经很酷了。
首先,几个基本的发现:
如果你让人给颜色命名,足够长的时间之后他们都会疯掉。
“呕”和“吐”绝对是真正的颜色。
色盲的人比非色盲的人更可能键入“X你的”(或其类似变体)并怒退。
“靛”绝对必须是人为发明出来的颜色,就是为了凑齐“红橙黄绿蓝靛紫”。大概因为他们看“赤橙黄绿青蓝紫”不顺眼吧。其实彩虹用红橙黄绿蓝紫就足够了。
有几十个人在颜色的名字里内置了 SQL ‘drop table’ 语句。不赖嘛,小家伙。
男色女色,并没那么大不同
出于某种奇特的巧合,就在我公开发布颜色调查的那天晚上,网漫Doghouse Diaries放出了这么一则漫画:
这图很搞笑,但是我意识到我可以测试它是否准确(至少是针对染色体性别而言。我们的调查包括了染色体,因为它和色盲紧密相关。)调查结束后,我用真实的数据生成了这幅漫画的另一个版本,列出了原漫画里这些颜色在调查中最近似色得到的最常见名字:
【编辑小贴士】记住“亮粉色”或“艳粉色”(hot pink)这个词,偶尔来一句“亮粉色很适合(不太适合)你”,妹纸会顿时觉得你很专业。
基本上,女性用起修饰词来稍微更自由一些,但是其他方面两性大致能达成一致(少量差异可能是采样误差)。别的颜色结果也是类似的——男性和女性倾向于给颜色起一样的名字。
最男性化的颜色 VS 最女性化的颜色
所以这性别平等让我感觉良好。接着我决定计算出“最男性化的”和“最女性化的”颜色。这些颜色名字是在两性之间分布最不均匀的名字——也就是说,相对而言,最多的女性和最少的男性给出了这个名字(反之亦然)。
以下是女性中最不成比例地受欢迎的颜色:
靛灰色(Dusty Teal)
肉粉色(Blush Pink)
薰衣草灰(Dusty Lavender)
鹅黄色(Butter Yellow)
玫瑰灰(Dusky Rose)
好吧,至少是蛮花哨的。有点香料炸弹爆在家居店里面的味道。嗯,接下来我们看看另外一组列表——
以下是男性中最不成比例地受欢迎的颜色:
Penis(“太屌了”)
Gay(“太娘了”)
WTF(“纳尼”、“我去”、“你妹啊”)
Dunno(“母鸡呀”、“你问我我问谁”)
Baige(“屎”)
最后一个不是我打错了字,它就是“米色”(beige)的误拼。请记住,这是基于给颜色命名的人数得出的列表,和他们每个人输入多少次无关。这不是几个人刷屏刷出来的结果。事实上,这是经过了刷屏过滤之后的结果。
我为我所属的性别而默默哭泣。但是,接下来——
“蓝色”是什么样子的
每一个电脑里显示出的颜色都对应一个RGB数值,但是人脑海中的颜色并没有精确的对应。不过,如果我们统计一下比如“蓝色”在大家心目中是什么样的,计算出它的“平均”RGB值,就得到了受访者心中“典型”的蓝色。
根据用户的答案,我计算出一个颜色名字所对应的RGB值,这个结果并不好算。我试了简单的几何平均值(概念上就有问题)、蛮力搜索所有可能的中心点(太慢)、还试着拟合了核密度函数(用到的数学太难)。最后,我用了一系列的随机爬山算法的平均值。
根据数据,大约有一千种颜色名字,我可以相当精确地找到对应的RGB值(以普通液晶显示器的白底显示为准)。以下是其中的前48种:
一般人在说“紫色”的时候,心中想的就是上图第一行左一的那个颜色;说“黄色”的时候,指的就是第二行右一的那个颜色,以此类推——但对于我们,“蓝色”、“绿色”必须是“果壳色”才行啊。
什么时候红色变成了黄?
以下是根据RGB立方体的一部分绘制的颜色边界地图。数据来自调查结果的一部分(150万个结果),这部分所采样的颜色全都位于所选取的立方体部分之中,并且显示时用了黑白两种背景。
这幅图展现了人们心目中颜色之间的过渡。例如,人们常说的“蓝色”和“紫色”就是图中右边表示出的颜色范围,蓝紫边界线代表了被认为是蓝色或紫色几率相等的颜色。
问题讨论
当然了,这个颜色调查有些基本问题。人们之前看到的颜色会产生启动效应,这会增加整体噪音和数据偏差(虽然最后看起来是抵消了)。更重要的是,不同的显示器有所差异,RGB并不是一个绝对的色空间。幸运的是,我感兴趣的是颜色在“典型”显示器上是啥样子,所以大部分数据是所有非色盲者在各种各样显示器上看到的总和(90%以上是液晶,约6%是CRT显示器)。
颜色是个迷人的话题,特别是因为我们平常学到了好多不同的、常常相互矛盾的观点——关于彩虹、关于不同主色,还有光的频率。如果你想了解更多,可以尝试《费曼物理学讲义》第一卷35章,读一下Charles Poynton的颜色FAQ,或者从维基百科的颜色文章开始追链接。对于这次调查,我们都是在普通显示器的RGB空间里的,所以该数据仅用于选择和命名屏幕上的颜色,而不一定适用于现实——但说真的,如果你在读这个博客的话,很可能你和我一样,盯屏幕的时间比看窗外面的时间多多了。
轻松一刻
最后,以下是人们命名颜色时想出来的各种各样的玩意儿。
如果你想进一步分析结果,我把原始数据以SQLite dump形式贴在了这里http://xkcd.com/color/colorsurvey.tar.gz (84 MB .tar.gz文件),已经匿名化了,IP、URL、电子邮件全部抹去。我也有GeoIP数据,如果你想做什么地理相关分析的话,我可以在几天内提供一版数据包含基本的区域级经纬数据(为保护隐私不能更细了)。
又及:一位网友为这次调查制作了一个可视化版本 http://www.luminoso.com/colors/ 。欢迎大家围观。
本文为果壳网原创,谢绝转载。如有需要请联系[email protected]