2012年随着社会化媒体和开放数据的逐渐兴起,互联网信息总量呈现井喷式发展。在社会科学研究领域,大数据可以提供了丰富的信息,例如网络媒体中民众政治意见的表达、政治信息的传播和获取,品牌营销,病毒式传播,媒体报道的议程设置以及政府与民众的互动、公共政策的制定等等。大数据的出现为传统的社会科学研究提供了新的研究路径和方式。以此同时,数据资源呈现出数据粒度小,记录单元碎片化,结构多元化的特征,资料的汇集、保存和综合对计算机的的依赖也更加明显。
大数据环境下,数据不仅可以作为科学研究的结果,还是科学研究的必要基础;面对人文社科领域内的海量数据,对知识对象化、可计算化趋势更加明显。人文社会科学的“科学性”显著增强,以“人文计算”、复杂网络分析、大规模数据分析为特征的研究方法逐渐被采纳,人文社会科学的研究过程中对计算机的依赖也逐渐加强。
为此,本系列课程以数据的抓取和文本挖掘为主,主要教授如何从互联网上通过程序自动爬取需要的研究内容,然后针对大数据里最有价值的文本数据,我们将教授如何对文本进行挖掘和分析。
说到数据计算,很多从事社科研究的老师和学生就会很头疼,一边是数据计算在科研中越来越重要,一边是大多讲数据分析的课程都晦涩难懂,学习周期长,入门门槛高。
但是这些你都不用担心,学长为大家请来了知深的人气老师谈和(小唐老师),谈老师之前在知深上开设的课程获得众多学员的一致好评,这一次他带着最新课程来了。文科生没有计算机基础?不怕!谈老师在授课过程中充分考虑大家的知识接受能力,用通俗易懂的语言教你学计算研究方法。
谈和老师,中国传媒大学互联网信息研究院博士生。中国传媒大学大数据挖掘与社会计算实验室研究员,主要负责数据抓取、文本处理以及可视化开发。同时也是中国传媒大学数据新闻专业的授课者之一,负责教授信息图设计制作和可视化编程等技能。目前的研究方向为互联网群体传播与群体行为、新闻报道中的交互式数据可视化和社会媒体研究中的自然语言处理。
第一讲 研究数据的获取(9月4日19:30——21:30)
1. 数据获取的途径和方法
2. 网络数据抓取的机制和原理
3. 爬虫软件的使用
4. 用python编写爬虫程序
5. 案例:微博数据的抓取
6. 案例:弹幕的抓取
第二讲 文本数据的处理(9月5日19:30——21:30)
1. 文本挖掘的原理
2. 文本挖掘的工具介绍
3. 文本数据的清洗
第三讲 文本挖掘(9月7日19:30——21:30)
1. 词频分析
2. 情感分析
3. 文本分类
4. 主体模型
第四讲 网络分析(9月8日19:30——21:30)
1. 微博转发数据的处理
2. 网络分析工具
3. 微博转发路径的构建及分析
高校老师、本硕博在校生
➤特别说明:本课程面向所有从事人文社科研究的老师和学生,不需要有专业的计算机基础,只要你使用过电脑,老师都能教会你。
时间:9月4日——8日
费用:299元/人
直播方式:QQ群视频直播
报名截止:9月4日17:00
(为保证课程效果,此次课程名额有限,请大家尽快报名!)
▲长按上方二维码识别即可报名
1.支付成功后,请务必点击完成,并长按二维码加入QQ沟通群,加群请备注:付款订单号(订单号:在知深,个人中心,我的—订单里面查找,如未保存群号,也可在我的订单中查看)
2.报名之后,如想退款的话,请在9月3日下午6点之前联系学长,之后以及课程开始之后不再接受退款。
3.本次为QQ群视频直播,请一定使用Windows版本的电脑听课,苹果系统、平板不支持群视频功能,手机看不到实时操作!
4.课程所需软件由老师提供,在课前发送给学员。