大数据时代的社会学研究
大数据及数据科学的流行给社会学研究带来不可忽视的挑战。 Savage 与 Burrows ( 2007 )曾撰文警示“经验社会学即将到来的危机”,而该文成为 Sociology 期刊过去十年间被用最多的一篇。同时,大数据分析方法的兴起也为社会学研究提来了新的机遇, Big Data & Society 的创刊在某种程度上可看做这一机遇的佐证。在中国,大数据与社会学的关系也得到了部分研究者的关注。有研究者呼吁社会学家应该拥抱大数据(孙秀林、施润华, 2016 ),有研究者通过具体的研究展示数据科学在社会学研究中的应用( 陈云松, 2015 ; 陈云松等, 2015 ;陈华珊, 2017 ;黄荣贵, 2017 ) ,还有研究者围绕大数据和社会学研究展开方法论争论(《新视野》, 2016 年第 3-4 期)。 【更完整的文献列表参见《定量群学文摘》第三期 | 大数据与社会学】
如果我们将大数据的主要来源大致分为电子化的传统文本(如谷歌图书)、搜索数据(如百度或谷歌的搜索关键词)、以及社交媒体数据(如微博、推特)三种类型,那对当前经验研究影响最大的要数社交媒体大数据。社交媒体的广泛使用既为社会学家提出了重要的新议题(如网络民族主义、极化),也为社会学研究提供了新的经验数据。当然,除新议题和新数据以外,社交媒体大数据对社会学研究的实际影响还取决于四个要素,即新的分析技术、掌握新技术的研究者社群、新的写作范式、制度化的发表渠道,而掌握新分析技术的研究者群体的发展壮大对大数据时代的社会学研究尤为重要。在笔者看来,对社会学研究而言,大数据的特殊性并不完全取决于海量的数据量,而是由数据类型的特殊性及相应的分析技术共同决定。具体而言,研究者主要面对的数据是自然语言与社会关系数据,而所采取的分析方法在不同程度上包含了社会计算技术。从这个角度来看,掌握新分析技术的研究者社群是推动“大数据与社会学”研究的关键。
为了吸引更多的学子了解和掌握大数据分析技术,笔者与桂勇教授在复旦大学社会学系为本科生开设了《互联网与社会》课程,初步讲授了自然语言处理、社会网络分析、以及基于Python语言的系列分析工具。承蒙《定量群学》的邀请,我借此机会组织曾修读该课程的6位同学来推送一组大数据分析相关的文章,希望能通过例解的方式展示大数据在社会科学中的应用、吸引更多同行关注“大数据与社会学”这一新兴议题。虽然这是一支非常年轻的团队,但基于大数据的社会学研究的发展主要属于年轻一代的研究者,他们理当是主力。在操作层面,本次推送团队成员浏览了New Media & Society(传播学)、Information, Communication & Society(社会学、传播学)、Computer Social Science Review(综合性期刊)这三本期刊过去2-3年所发表的文章,并从中选出若干文章进行推送。所推送的文章涉及了词频分析、自动化监督学习、文本聚类、社会网络分析、社会网络可视化、基于社会网络的意识形态测度,等等。当然,本月的推送只触及冰山一角,不免要挂一漏万,还望行家高抬贵手,多多指正。
编辑: 张柏杨 张亮亮
· · · · · ·
定量群学
ID:sociologynju
《定量群学》是由一群从事社会科学研究的师生所运营的公众号。我们来自牛津大学、斯坦福大学、南京大学、清华大学、中山大学、东南大学和西安交通大学等高校。
宗旨:为社会科学研究提供最新学术资讯;为定量分析学者提供人文交流的角落;以科学人文之理,治定量研究之学。
内容:主编原创文章,追踪学术前沿及热点;按专题整理重要期刊的定量社会学文献;定量分析软件使用方法;最新学术资讯等