1
月25日上午
主讲人:邓旭东
课程安排:
python
语法入门
1、Python跟英语一样是一种语言
2、数据类型之字符串
3、 数据类型之列表元组集合
4、 数据类型之字典
5、数据类型之布尔值、None
6、逻辑语句(if&for&tryexcept)
7、列表推导式
8、理解函数
9、 常用的内置函数
10、文件路径库os库
11、数据清洗re库
12、数据存储csv库
13、初学python常出错误汇总
1
月25日下午
主讲人:邓旭东
课程安排:数据采集
1、网络爬虫原理
2、发现网址规律
3、 网络访问requests库
4、网页解析pyquery库
5、实战:大众点评
6、如何解析json数据
7、实战: 知乎
8、实战: 微博
9、实战: 批量下载多媒体文件
10、实战: 批量下载上市公司定期报告pdf
11、实战: 各种宏观经济、金融、政治数据下载
12、爬虫知识点总结
1
月26日上午
主讲人:邓旭东
课程安排:文本处理入门
1、文本分析概述
2、读取文件中数据(pdf、docx、txt、excel)
3、中文分词及数据清洗
4、实战: 词频统计(词云图制作)
5、实战: 中文情感分析(词典法)
6、实战: 将多文件数据汇总到一个excel
7、 数据分析pandas库快速入门
8、实战: 对excel中的文本进行情感分析
9、从pdf中提取表格数据
10、共现法扩展情感词典(领域词典)
11、从非结构化文本数据中提取结构化数据(文本数据清洗re库)
1
月26日下午
主讲人:邓旭东
课程安排:文本分析进阶
1、了解机器学习
2、使用机器学习做文本分析的流程
3、scikit-learn机器学习库简介
4、文本特征抽取(特征工程)
5、
实战:在线评论情感分析(机器学习法)
6、文本相似性(cos/编辑距离/jaccard)
7、实战: 使用文本相似性自动识别冲击(改变的)时间点
8、Kmeans聚类算法
9、LDA话题模型
10、文本分析在经管研究中的应用
11、补充: 如何在R语言中调用Python的代码
1月27日上午
主讲人:江艇
课程安排:因果推断导论
1、如何理解因果“识别”
2、随机实验:因果推断的参照系
3、观测性数据研究的根本挑战
4、回归模型与结构模型的区别
5、潜在结果模型
6、分配机制与识别假设
7、线性结构模型与潜在结果模型的关系
1月27日下午、1月28日上午
主讲人:江艇
课程安排:截面数据的参数和非参数方法
1、截面数据的非参数方法:匹配
2、截面数据的参数方法:控制回归
3、参数方法与非参数方法的比较
4、匹配方法的操作细节
5、控制变量与固定效应
6、系数稳定性理论:如何在回归中逃避控制
7、交互项模型与因果关系的作用机制
8、因果关系的作用渠道
1月28日下午
主讲人:江艇
课程安排:面板数据、双重差分及其与匹配的结合
1、面板数据固定效应模型的本质
2、双重差分方法的识别假设探究
3、几种主要的双重差分模型
4、双重差分模型的稳健性检验
5、双重差分与匹配的几种结合方式
6、面板数据的匹配操作细节
1
月29日上午
主讲人:王非
课程安排:起点:文献阅读及理论建构
1、如何搜集研究所需的文献
2、如何快速有效阅读和整理文献
3、文献综述怎么写
4、如何借助简单理论深化经验研究:从回归模型搭建到经验研究“三件套”
1
月29日下午
主讲人:王非
课程安排:基础:数据清洗与数据描述
1、公式化数据清洗,使纷繁庞杂的数据处理变得异常清晰
2、经验研究的拨乱反正:数据描述不只是一张表
3、常用数据清洗与描述的实战演示
1月30日上午
主讲人:王非
课程安排:进阶:工具变量法
1、工具变量法为什么是因果推断根本大法:工具变量法与其他“方法”的关系
2、工具变量经典方法与步骤系统化梳理
3、寻找工具变量的一般方法
4、应对弱工具变量的一般流程
5、工具变量经典论文的结果复制
1月30日下午
主讲人:王非
课程安排:拓展:断点回归、合成控制及方法进展
1、断点回归经典设计思路与实践步骤系统化梳理
2、断点回归前沿论文的结果复制
3、合成控制经典步骤及最新发展的系统化梳理
4、合成控制前沿论文的结果复制
5、因果推断方法最新发展介绍及演示
1
月31日上午
主讲人:司继春
课程安排:线性回归基础
1、外生性与自然实验介绍
2、线性回归模型基础
3、系数的解释与模型设定:平方项、交叉项的解读与使用
4、系数的解释与模型设定:加权最小二乘以及权重的使用
5、线性回归中固定效应的使用
6、控制变量的选择
7、统计推断:异方差稳健标准误与聚类标准误
8、多方程回归及其假设检验
1
月31日下午
主讲人:司继春
课程安排:线性面板数据模型
1、面板数据的基本设定
2、随机效应模型与混合最小二乘
3、一阶差分模型与固定效应模型
4、不同估计量之间的关系和选择
5、线性面板数据中的时间固定效应与时间趋势
6、交互固定效应模型
2月1日上午