在这个大数据时代,大数据其实跟我们没有什么关系。但是我们有一些小数据。
谢谢大家来,我叫向帆。我们现在每天都听到人们在谈大数据,大家都觉得大数据特别地神奇。但你有没有想过,这个大数据跟你有什么关系?你可以买大数据吗?你家的硬盘可以放下大数据吗?你从来不能拥有大数据,大数据不是你的。
你可以说我不需要拥有大数据,我总可以用吧。但如果你不会写代码,其实你也不会用。那你说我是一个用户啊。对,我们共同拥有一个名字,叫用户。而用户有什么权利呢?用户只能是选择给钱或者不给钱,用收费的还是免费的。
给钱也行,但你不觉得是人家开发什么你就用什么吗?它能满足你的愿望吗?往往有时候我们还没有愿望的时候,它们就被开发出来了,然后我们就跟着有了愿望。比如说我们按照微信规定的方式开始游玩,因为那个游戏是他们发明的。
所以我一直在想,其实到现在为止,这些软件并没有解决我内心很多真正想解决的问题。社交软件最多解决的就是社交,无法改我变内心的焦虑。
我是清华大学的老师,我最焦虑的是什么?我最焦虑的就是我经常上课的时候,学生都看着我,就像你们现在都看着我一样,但我不知道他们是谁。我对他们一无所知。
这个事情我应该怎么办呢?在很多年前我就想了一个办法。那个时候他们都用QQ,我想QQ有可能是真实的他们。后来我指导2010年的毕业生王赢用QQ班群里的数据来做了一个毕业设计。
比如说你可以观察一个同学的在线时长,他有太阳、月亮、星星,如果他有很多太阳的话就是他经常在线;另外看看他们QQ有多少朋友、他在班群里面是不是经常发言。我让他帮我跟踪几个月,看看我们能看到什么。
我们获得这些班级的数据以后,就把它转化了一下形态。女生是粉红色的,男生是蓝色的。如果他的好友越多,他的身体就会越胖。如果他在线的时间越长,他的头发就越长。我们还做了一个圆圈的嘴,如果他特别爱发言,嘴巴就会越大。这样我们就可以组合出来班里有一些什么样的人物。
结果我们就看到这样一班小怪物。虽然大家看上去都是一样的同学,实际上人人都非常不一样。
尤其不一样的,比如说这三个同学。
左边第一个,是个美女,不上网也有很多朋友。中间那个男生他特别爱讲话,而且他特别爱上网,但没人跟他交朋友。然后右边这个女生,她又有朋友,又爱上网,但她就是不说话。你会觉得她很神秘,你会奇怪她这朋友怎么交的呢,不说话还能有这么多朋友。是不是很好玩?
这种方式让我们都觉得特别有趣,就是这样一个小游戏,可以让你看到眼前的人背后的性格,作为老师这对我来说是一个很好的观察方式。
同时我也有许多自己的烦恼。很久以前我就会在深夜里写博客,我坚持写了一段时间。有一次我的师兄跟我说,你知道吗?有一些网站,你去拷贝一段代码,你不用学代码,你拷贝一段然后把它埋进去,你就可以知道谁来看过你的博客。
我当时听完心里一惊。我想,真的吗?如果有那么好的话,那我也许可以看一看,有一个人他是不是来看过我的博客。这个代码非常神奇,只要拷贝粘贴就好了,就可以跟踪来看我博客的人。
我可以看他们看得非常清楚。比如说他是几点来的,从哪来的,他是什么电脑,他的浏览器是什么版本的,他使用了什么样的电信服务,还有他来了以后在我的网站上浏览了哪些页面。
这是一个等待的地方。我可以去观察,他是不是从我希望的那个城市来,从我希望的那台电脑来,他的工作性质可能决定他用什么样的系统。我希望他能出现。我大概等了一年多,确实等到了不少人。像有些人他会老来,但是我不知道他是谁。
后来我发现有一个人,也就是下面我标方框的那个人,她来自于成都,用一台比较旧的电脑,还在用Windows XP。这个系统已经早就被替换了,已经没什么人用了,并且她还在用IE的浏览器。这个人最稳定,是来得最勤的、最关心我的一个来访者。
这个人我可以大概猜到是谁,她应该就是我的妈妈。
这样一种希望看到来访者的心态,我不知道大家有没有,但有人一定有相同的感受,我估计他就是LinkedIn的开发者。
比如我登录LinkedIn的时候,它会告诉我,这段时间有7个人来看过你。这7个人是谁啊?你可能特别想知道。
然后它就给你看照片。这4个人是谁谁谁,我大概都认识。
但是右边你看有3个灰的人被隐藏了,他们是谁?它说对不起,他们已经付费了,他们不让你看见他是谁。那我觉得LinkedIn实在太聪明了,它了解人心。它知道你心里在想什么,它也许知道你在等,所以它为自己开发了一个很好的商业模式。
现在你再回想一下你正在使用的微信,微信会告诉你这些吗?你知道发出来一张照片有多少人在看吗?可能你没有概念,你一开心就发了。我前两天发了一条朋友圈,有6个人点赞。也就是说有6个人愿意告诉我,他们经过了我的窗前。
那我实际有多少好友呢?1366个。
如果微信能够向我们发出这样的信号的话,可能你会犹豫一下。只有6个人理我,我还该不该发呢?或者说有1366个人同时看着你,你可能路都不会走了。但是微信到目前为止都没有暗示过任何这样的信息,以至于我们所有的人都在盲用这个产品。
微信整个的开发其实是回到了原点,把最简单的给你用,但是在保护隐私、在培养你的数字产品修养上面,他们几乎没有负任何责任。当我发出这条朋友圈的时候,它不仅仅是一次表达,我们每个人应该要去了解,可以观看的受众的体量到底有多大。这样一种体量如果能让人意识到的话,那对于我们今天如何安全地使用网络,对于人的隐私保护就会特别有帮助。
在虚拟世界我们会不想遇到一些人。但在真实的世界里面我们其实想相遇很多人。我第一次去洛杉矶的时候非常激动,因为洛杉矶对我来说就是八卦新闻。
所有的明星都住在洛杉矶,一不小心你就会碰见谁在你旁边买菜,这实在是一个让人非常非常兴奋的事情。后来我在好莱坞附近住了三个月。
但我从来没有碰到过明星。我每天碰到很多游客,这些游客都好像来找恐龙一样。因为地上有明星在水泥上按的手印、签名什么的,他们像考古科学家一样发现一个个恐龙的遗迹。
而洛杉矶不应该是这样的,洛杉矶应该是有很多明星,甚至让你感受到那些明星就在身边,这座城市对我来说才有意思。
后来我就想,那我可以为洛杉矶做一点什么?也许我可以把所有八卦的消息收集起来,它终归是有时间、地点和人物的。有这三个信息,就可以形成一个时空矩阵。
这样沿着日落大道走来,我们就会知道谁从这儿经过,谁曾在这里跟谁在一起,在哪个年代。这是一个虚拟空间,带上手机,手机有GPS地理信号,随着你在空间移动,我们就可以虚拟地去相遇曾经这里的人,知道谁曾经也在这里。
于是我就设计了这样一个软件,当你在洛杉矶开启它,走到有些地方手机就会告诉你,嘿,谁正在离你越来越近。
比如此刻你在手机上看到赫本,就说明她曾经在附近发表过演讲。你说你太老了,我跟你不是一代的,那你可以滑动右边的时间滑条,选择前往另一个时代。
通过这样的方式,我们可以跟物理的空间更加亲近,虽然实际上非常地陌生。我总觉得这样一种探索世界的方式会更有意思。
在美国生活的时候,我最喜欢做的就是开车出去旅行。我最想去的城市之一就是西雅图。西雅图被称为音乐之城,这个城市发生了很多乐队的故事。很多乐队在这里诞生,很多歌手在这里成名或者死亡。
但是当你开车走在城市里,你拥有的只是一张无声的地图。于是我在想,为什么一个音乐的城市只给每个游客一张相同的地图?地图可以听见声音吗?
那我怎么样解决呢?我想我可以把曾经发生在西雅图的音乐事件、在这里诞生的音乐,定点标记在这个城市不同的角落,让每一首音乐占有一个空间。
就像我现在站在这块圆的地毯上一样,我只要站在这里,这首歌就归我,这个圆的大小取决于歌曲的长度。
当每首歌拥有了自己的空间,我们根据历史记录赋予它地点,整个城市的街道就成为了一个可以穿越的音乐长廊。而且声音会互相叠加,互相有机会转换。随着你一边开车,你就像在实体空间里面做DJ一样,可以自己混响音乐。
然后我做了一个原型,自己开车去体验了一把。左边是我在开车,右边是我所在的位置。
每个人开车穿越这些街道,由于他的路线不同,都会由自己的路线组合而成不同的西雅图音乐。
回到中国以后,我们国家有很多让我作为中国人都非常困惑的东西。比如说,中药、太极,比如广东人会说这个东西热气,那个东西有凉气,你经常不知道这个气到底何在。面对中国这种很悬的、古老的文化,我经常会手足无措、不能理解。我希望用我的方式去解读它。
然后我就针对太极,去收集了一个打陈式太极拳的人的手脚的移动数据,我希望可以看见那个看不见的文化的形状。开始的时候我们把数据放到软件里面去,它就只能画几个线,我自己也没看懂。
现在很多人在谈数据的可视化、视觉化,这些东西都能看见,但你看得懂吗?其实你看不懂。我们想了很久怎么样才能够看得懂,这件事我们研究了很久,换颜色换线条。
所以有时候可见的东西,反而会让人越看越不明白。最后我们发现,手和脚在有些点上面停留的时间比较长。也就是说太极不仅仅关乎移动,可能还和停顿、韵律有关系。
我们把这个韵律就转向了深浅的变化。有了这样一个深浅的变化,它就有了一点国画的感觉。那我们就让太极来画一幅国画吧。
这幅国画画好以后我其实认为它没什么用,我就把它上传到优酷上面,也没管它。到昨天给一席的工作人员看的时候,发现竟然有这么多人看。那很奇怪,这个东西连我自己都不看,有3000多人看。谁在看它呢?仔细一看发现,都是搞太极的人在看。
为什么自己搞太极的人,还要看我这个不懂太极的人做的东西呢?我想这段视频可能让熟悉太极拳的人,看到了没有见过的太极拳的风景。
我是一个在中国教书的人,我身在大学中,但是我也想知道我所熟悉的大学到底是什么样子的。我常常通过上网去了解我的学校究竟发生了什么。但如果你去看中国各大艺术院校的网页的话,你基本是看不到学生的,看到的都是领导,领导在开会。
换一所学校,还是领导在开会。
通过这种方式,我确实很难理解我所身处的这所学校在发生着什么。
于是我就把各个大学的网站,中国的美术学院,还有美国的和英国的艺术院校的机构图谱,以及公布的机构信息下载下来,我想看一下这些学校的院系结构有什么不同。
分完以后你就看到各个学校真的长得挺奇怪的。从结构来说,它们就像是不同的生物一样。对比一下,左边是中国的一所美术学院,右边是两所美国的美术院校。这三所学校一比较,你看一下咱中国有多少院长。
我们把所有的院系拉出来看一看,每个学校就有了自己的样子。你可以看到左边都是中国的学校,右边都是英国的和美国的学校。
整体比较而言,你会发现,美国的学校都很“小”,左边的中国院校都很“大”,那为什么我们这么“大”,为什么我们有这么多层级呢。作为一个专业老师来说,这个图也能够帮我明白,我自己在什么位置上。我们还做了一个动态的效果,希望你们能看到每个大学就像一个活体一样,可以看到它在怎样的变化。
后来我就把这样一个景观放在了一次中国设计教育的展览上面。我想提供大家另外一种去观察中国和国际艺术教育的角度。
回到国内经常可以跟父母在一起,跟父母在一起有一个头疼的事情,就是过春节你一定要回去,而且你得陪他吃年夜饭,你得陪他看电视,一看看5个小时,并且每年你都觉得看的是一样的。
每年春节晚会,大家都觉得是一样的。我就在想它是不是真的一样?我希望以一种更鸟瞰的方式看春晚。我们可以先把这个朱军都缩小,获得一个宏观的景观再来看。
然后我就用一段段代码把每秒钟的春晚视频吃进了我的电脑里面。
这是2012年的春晚的开头15分钟。
这个是中国春晚的30年,最右边是2012年,最左边是1983年,左上角那大片蓝紫色是一段当年的手工动画。你会看到春晚整体越来越红了。
如果你再仔细看会看到更多的信息,你会看到春晚的变化其实也是中国电视技术的变化。比如剪辑速度、屏幕、现场灯光等等都在变化。这背后隐藏了非常多的因素。我想这应该是你人生第一次这样看电视。
当我们把年份打破,把每一秒按照颜色来排列的时候,这就是整个春晚的色彩。
那我们最后再改变这个时间线会是什么样子呢?如果你这样去看的话,你会看到一个宇宙,像一个瞳孔一样。
如果把每年的春晚都像蚊香一样卷起来的话,它就是这样的。你会看到每年春晚是不是很不一样?但你总觉得它是一样的。我觉得这对春晚来说是一个很好的话题,你们为什么每年都那么努力,做的都那么不一样,大家觉得还是一样?
这是我小时候。我回到中国以后,非常希望能够努力地工作,让我父母开心。我爸爸是一个画家,他一直都想在全国美展获奖。我很小的时候就跟他去看美展,但我爸爸没有获过奖,所以我想我应该去获得一次,让他开心。
刚好2014年我在中国美院开会,全国美展的油画获奖作品就在杭州举办展览,我就专门去看了一下。我们总要看一下隔壁家小明到底有多优秀是吧?刚进展厅的时候,我旁边同行的人就跟我说,你知道吗,这个是有规律的,今年沙发上的女人特别多。
我一看,这个人还说得挺准的。
走两步,我又发现一个女人在沙发上。
再走两步,还有。
实际还不止这些。那天我看完以后就有点懵了,难道这是一个新的趋势吗?
而且我知道一个被我证实了的老的趋势,就是只要画丰收,比如少数民族在丰收,或者说是老大娘、老大伯在捡麦子什么的,也容易获奖。
后来我在想那到底是不是有规律呢?我和我的学生,还有包括我的同事们一起努力,在图书馆里一本一本去找当年每一届全国美展的获奖作品资料。最后历经半个月的搜集和扫描,一共整理了2276张获奖作品。
我们首先最好奇的是,什么颜色的作品最容易获奖呢?我们把作品进行了颜色的分类。最后发现,如果说下面这个画面是立体的,在黄红色的那个区应该可以堆起来非常非常厚的作品,它们都集中在这个颜色。这是第一个发现。
那应该画什么题材呢?应该画多大呢?这就是按照每一张画的大小进行分类的。当你这样一分类的话,你会感叹,画大的画有那么大,画小的画那么小,小到只有一张A4纸大。然后你会发现右下角画得特别大的,都是革命题材。
看到这张图的时候我们以为是数据出错了,因为有两张特别像。一查发现,看着很像,实际上是两张画。也就是说这个艺术家他在十年里面画了两张非常相似的画,都获得了国家艺术的奖项。这个人为什么会这样呢?因为我们是做设计的,我们不可能用同一个设计稿在同一个奖项去评两次奖。
这种情况是不是少见呢?我们发现他不是唯一的。这个人拿了三次奖。
于是我们就把多次获奖者的作品全部都找出来,现在你看到一纵列就是一个人的作品。像不像?大家可以自己去判断。
还有一个问题也很重要,什么样的年龄更容易获奖?看完这个结果我很欣慰,我离最高峰的获奖年龄还有十年时间。同时你也会看到,全国美展正在成为一个接近退休的人的展览。
那天我们做完这些数据分析以后,就发布在公众号上。后来来自全国美院的同事都跟我说,你刷屏了。既然大家都喜欢,而这个数据又是我们从公共空间获得的公共的数据,就应该把它分享给所有人。而且我们得到的结论也是有限的,有人还可以从这个数据中发现更多的秘密。
所以我们把它发布到了网上。这个交互的网站叫做Award Puzzle,找到这个网站以后你可以自己去探索更多的秘密。总的来说,这个平台是这样玩的。
结论就是,统计性地来说,如果你这样画肯定能赢:一个少数民族妇女坐在窗前的沙发上,旁边最好还有一头牛。
这个网站的设计帮助我们赢得了 Science 杂志去年主办的数据故事比赛,跟我们一起获奖的是美国国家实验室NASA、拉莫斯国家实验室,还有Climate.gov国家气象实验室。
我们当时看到他们公布结果的时候非常地震惊。因为我开启这件事情仅仅是想得一个奖,结果最后我们跟科学家一起获奖。他们用的是航天的数据、太空的数据,而我用的仅仅是网上和书里搜集的一些图片的数据而已。我没有大数据,我的数据非常小。
在这个大数据时代,大数据其实跟我们没有什么关系。但是我们有一些小数据。我们做的事情让我想到了日本一个当代艺术家关根伸夫的作品。
他就是在地上挖个坑,把坑里面的土再堆起来给你看。实际上他让你看到什么呢?这个草地表象背后的本质。这可以让你看很久,它看起来好像比草地还要丰富。
而我们做的事情,其实就是把你靠肉眼观察,无论多么辛苦都看不到的东西,想办法转化为你能看到的,并且愿意看的东西。
谢谢大家。
演讲者:向帆,学者、设计师,清华大学美术学院副教授。
点击图片阅读
AI说人“画” | 什么?咱俩说的是一个“模型”嘛!