如何将计算的方法应用于人文社会科学研究？

质化研究 · 公众号 · 科研 · 2017-09-01 21:23

正文

2012年随着社会化媒体和开放数据的逐渐兴起，互联网信息总量呈现井喷式发展。在社会科学研究领域，大数据可以提供了丰富的信息，例如网络媒体中民众政治意见的表达、政治信息的传播和获取，品牌营销，病毒式传播，媒体报道的议程设置以及政府与民众的互动、公共政策的制定等等。大数据的出现为传统的社会科学研究提供了新的研究路径和方式。以此同时，数据资源呈现出数据粒度小，记录单元碎片化，结构多元化的特征，资料的汇集、保存和综合对计算机的的依赖也更加明显。

大数据环境下，数据不仅可以作为科学研究的结果，还是科学研究的必要基础；面对人文社科领域内的海量数据，对知识对象化、可计算化趋势更加明显。人文社会科学的“科学性”显著增强，以“人文计算”、复杂网络分析、大规模数据分析为特征的研究方法逐渐被采纳，人文社会科学的研究过程中对计算机的依赖也逐渐加强。

为此，本系列课程以数据的抓取和文本挖掘为主，主要教授如何从互联网上通过程序自动爬取需要的研究内容，然后针对大数据里最有价值的文本数据，我们将教授如何对文本进行挖掘和分析。

说到数据计算，很多从事社科研究的老师和学生就会很头疼，一边是数据计算在科研中越来越重要，一边是大多讲数据分析的课程都晦涩难懂，学习周期长，入门门槛高。

但是这些你都不用担心，学长为大家请来了知深的人气老师谈和（小唐老师），谈老师之前在知深上开设的课程获得众多学员的一致好评，这一次他带着最新课程来了。文科生没有计算机基础？不怕！谈老师在授课过程中充分考虑大家的知识接受能力，用通俗易懂的语言教你学计算研究方法。

教师简介

谈和老师，中国传媒大学互联网信息研究院博士生。中国传媒大学大数据挖掘与社会计算实验室研究员，主要负责数据抓取、文本处理以及可视化开发。同时也是中国传媒大学数据新闻专业的授课者之一，负责教授信息图设计制作和可视化编程等技能。目前的研究方向为互联网群体传播与群体行为、新闻报道中的交互式数据可视化和社会媒体研究中的自然语言处理。

课程简介

第一讲研究数据的获取(9月4日19:30——21:30）

1. 数据获取的途径和方法

2. 网络数据抓取的机制和原理

3. 爬虫软件的使用

4. 用python编写爬虫程序

5. 案例：微博数据的抓取

6. 案例：弹幕的抓取

第二讲文本数据的处理(9月5日19:30——21:30）

1. 文本挖掘的原理

2. 文本挖掘的工具介绍

3. 文本数据的清洗

第三讲文本挖掘(9月7日19:30——21:30）

1. 词频分析

2. 情感分析

3. 文本分类

4. 主体模型

第四讲网络分析(9月8日19:30——21:30）

1. 微博转发数据的处理

2. 网络分析工具

3. 微博转发路径的构建及分析

适用人群

高校老师、本硕博在校生

➤特别说明：本课程面向所有从事人文社科研究的老师和学生，不需要有专业的计算机基础，只要你使用过电脑，老师都能教会你。

课程信息

时间：9月4日——8日

费用：299元/人

直播方式：QQ群视频直播

报名截止：9月4日17:00

（为保证课程效果，此次课程名额有限，请大家尽快报名！）

▲长按上方二维码识别即可报名

课前准备

1.支付成功后，请务必点击完成，并长按二维码加入QQ沟通群，加群请备注：付款订单号（订单号：在知深，个人中心，我的—订单里面查找，如未保存群号，也可在我的订单中查看）

2.报名之后，如想退款的话，请在9月3日下午6点之前联系学长，之后以及课程开始之后不再接受退款。

3.本次为QQ群视频直播，请一定使用Windows版本的电脑听课，苹果系统、平板不支持群视频功能，手机看不到实时操作！

4.课程所需软件由老师提供，在课前发送给学员。

点击“阅读原文”查看更多课程