专栏名称: 社会学吧
社会学吧最早创办于2004年,我们坚持以促进中国群学发展为宗旨,服务于广大社会学师生和爱好者。严肃但有情怀,专业不失玩乐!和我们一起热爱社会学吧!
目录
相关文章推荐
长城新媒体  ·  一地官宣:生育三孩及以上补贴10万 ·  昨天  
长城新媒体  ·  一地官宣:生育三孩及以上补贴10万 ·  昨天  
人民日报  ·  7个表现,提示你可能气血不足 ·  昨天  
新闻晨报  ·  别碰!街头已大量出现,容易“中招”! ·  2 天前  
新华社  ·  夜读|爱要及时,别总说下一次 ·  2 天前  
51好读  ›  专栏  ›  社会学吧

潘绥铭:生活是如何被篡改为数据的?

社会学吧  · 公众号  · 社会  · 2017-09-05 19:00

正文

近年来,对于大数据已经出现了盲目崇拜,就是无质疑、不反思地跟风颂扬和无限拔高。本文不涉及任何自然科学领域中的大数据及其应用,仅讨论一个根本问题:大数据能够套用到对于人类的研究中吗?

对这个问题,我国学术界虽然也出现了一些质疑,但是不仅寥若晨星,而且在学理上也主要是在可操作性的层次上争论,并没有击中要害。其实,大数据最值得质疑的,既不是其定义,也不是其功能或意义,还不是方法论层次上的“以相关分析取代因果分析”,而是“一切皆可量化”这个核心口号和基本理论。它表述了大数据的三层意思:其一,没有量化,就没有数据,更不可能有什么大数据;其二,物质世界当然是可以被量化的,但是如果仅限于此,那么所谓的大数据就仅仅是数量的增加,性质毫无改变,纯属炒作,例如天气预报一直就在分析海量的数据,却并没有以大数据自居,更没有形成崇拜;其三,现在的大数据之所以被崇拜,要害其实只有一点:把人类的行为及其结果,也给量化了,而且号称无所不包。

这样一来,大数据的性质就变了,从自然科学侵入到人文社会研究,从科学蜕变为“唯科学主义”。这就不仅仅是一个研究工具的问题,而是一个认识论的根本问题。对此进行批评的人文社科著作汗牛充栋,本文不再一一列举,仅在操作的层次上分析一下,人类无限丰富的生活实践,在被“唯科学主义”改造成“数据”的过程中,究竟发生了什么。

一、现实生活被裁剪

大数据崇拜者极力鼓吹“4V”(规模大、种类多、高速度、高价值),却故意回避了一个根本的问题:在最开始,您收集到的,就是可以用来分析的数据吗?

在社会学的问卷调查中,这是有可能做到的;但是在所谓的大数据中,却绝对不可能。因为大数据并不是研究者主动去收集的人类行为及其结果,而是五花八门的所谓“客观记录”,是人类生活中微乎其微的那一部分“可获得信息”,例如上网活动所留下的痕迹、监控记录等。

可是尽人皆知,在人类活动的全部信息中,可获得的要远远少于不可获得的。后者最典型的就是人类的一切精神活动的信息,在可预见的未来,仍然不但是无法获得的,而且根本就是无法监测的。这样一来,所谓大数据所获得的信息,首先是极端片面;其次是漫无边际;第三是支离破碎;第四是毫无意义;根本不可能直接用于任何量化的分析。

那么,这样的信息怎么才能转化为可分析的数据呢?首先是必须加以“界定”,就是保留什么和舍弃什么;其次是进行“分类”,就是把什么归属于什么;第三步是加以“定义”,就是给某类信息赋予特定的人类意义;最后一步则是“赋值”,就是把不同的定义转换为可计算的数值。

以上网活动的痕迹为例,大数据的生产者,怎么来界定那些痕迹是有意的还是无意的、闲置的还是凝视的、主动寻找的还是被引导而来的?界定之后,到底是根据停留时间长短还是活动的频率,来制造出“活跃”或者“不活跃”

这样的类别呢?为什么把“活跃”就给定义为“需求”呢?最后,把“需求”赋值成什么?从“不需求”到“强需求”的不同赋值之间,究竟是什么样的数量关系呢?

显而易见,在这个四部曲的过程中,完完全全是研究者自己在主观地、人为地、强制地“整理”那些“可获得信息”,把人类生活的痕迹,完完全全地篡改为自己的世界观和价值观所能接受的“数据”。往好里说,这叫做无可避免地加工;往坏里说,这就是赤裸裸地伪造。

这就是说,所谓的大数据,其实一点都没有超出“小数据”原有的局限性:裁剪生活,撕碎人生;非要把整体生存的“人”,视为一堆杂乱的零碎。在实际生活中,人类绝对不是,也不可能是这样来“量化地”认知和行动的。因此,大数据其实并不是帮助人类思考,而是企图取代和控制人类的生活经验,是人工智能的噩兆。

二、社会情境被忽视

有人已经发现,大数据记录的都是单独个人的行为,无法发现不同行为者之间的关系;于是问题就来了:在这个现实世界里,难道真的存在一种与他人毫无关系的个人行为吗?难道个人的一切行为,不都是在一定的人际关系中,才会产生,才会带来某种结果吗?

社会不是个人的简单集合,而是人们通过各种关系有机地组织起来的。同时,人们又是在特定的社会环境中做出各种行为的,不可能天马行空,独往独来。因此,人类活动留下的一切痕迹,必定蕴含着无限丰富的社会内容。如果舍弃之,那么不管什么样的数据,不仅是浮光掠影,而且必定是盲人摸象。

尤其是,每一个人都在特定的社会中,一点一点地成长为“此时此景中的此人”,然后才会做出“此因此果的此行为”。这就是每个人的社会历史建构过程,其中最重要的就是我们的一切社会背景、生活状况和成长经历。

可是这一切,往往仅仅存在于我们自己的经验与记忆之中;往往难于言表,更往往无法记录。从“客观监测”的角度来说,根本就是“风过无痕”。那么,就算毫无隐私,就算监测可以天罗地网,所谓大数据的信息源又是从何而来的呢?因此,对于了解人类生活而言,大数据其实根本就是空中楼阁。

如上所述,这样的批评还是很中肯的:“数据不懂社交、不懂背景,会制造出更多噪音,遗漏真正有价值的东西。大数据无法解决大问题。”

三、主体建构被抹煞

“大数据崇拜者”很可能不知道,或者不敢承认:在人类生活中还有一种现象,叫做“主体建构”。即人们对于自己的行为所做出的解释,很可能与监测者的解释大相径庭,甚至背道而驰。最常见的就是,一切人际的误会,盖源于此。







请到「今天看啥」查看全文