第一部分:Stata初步与数据读入
1)熟悉界面(菜单栏、工具栏、命令输入窗口、历史命令窗口、结果输出窗口等)
2)读入Stata格式的数据(use)
3)寻求帮助(在线帮助、搜索帮助、人肉帮助)
4)DOS命令(cd、mkdir、dir、erase、rm、rmdir、copy、type、shell等)
5)Winexec调用windows系统(播放音乐、打开、关闭浏览器等)
6)Copy命令(文件转移、文件重命名、网络文件读取、网页源代码读取)
7)常用命令(常用的30个命令:keep、drop、use save table browse等)
8)日期定义(Stata可识别的日期和时间格式、主要日期函数、时间函数等)
9)函数(数学函数、字符串函数、随机函数、编程函数等)
10)egen函数(egen与bysort结合、egen与常见统计量结合等)
11)读入TXT、CSV文件(万德交易数据为例)
12)Excel文件 (单个Excel文件、单个Sheet的读入与保存)
13)固定宽度的txt文件(构造固定宽度数据,用命令读入)
14)分行显示的txt文件(构造分行显示的固定宽度数据,用命令读入)
15)基金经理变更案例(不规则数据的整理、数据搬家与填充)
第二部分:宏与循环
1)Local概念与基本操作(如何定义local)
2)global概念与基本操作(与local的区别)
3)宏扩展函数(将dis结果、dir结果等赋值给local)
4)while 循环
5)forvalue 循环
6)跳出循环的continue 和continue, break
7)NBER工作论文下载案例(forvalue循环与copy命令)
8)上交所年报抓取案例(forvalue循环,日期函数、容错命令cap、循环过程中的终止)
9)foreach循环, 读入多个csv文件(以wind交易数据为例)
10)获取文件夹中文件名列表(fs命令)并对多个文件循环
11)获取一个变量的取值列表(levelsof命令)并对变量的多个取值进行循环
12)读入多个Excel的多个Sheet案例(以csmar交易和财务数据为例)
第三部分:数据库操作
1)数据的纵向合并(CSMAR交易数据为例、cntrade命令、工企数据库运用)
2)数据的横向合并 (财务数据为例)
3)数据长宽变换 (wind财务数据、多列变一列reshape,stack命令)
4)美国流行歌曲目录案例(reshape命令长变宽)
5)起死回生(preserve restore命令)
6) CSSCI期刊目录案例(preserve restore一列变多列)
7) label(文件label、变量label、观测值label)
8)用label找变量(labelsof、label 的宏扩展函数)
9)字符串处理(长度、关键词、替换、提取、寻找总经理、寻找董事长、两职合一)
第四部分:Post命令与网络爬虫入门
1)post 原理
2)定义post
3)用post计算同步性和Beta
4)基于网络数据的事件研究
5)股本变更数据
6)新浪公告数据抓取
7)新浪高管任职数据抓取
第五部分:绘图
1)基本统计图形的绘制:
a) 散点图:twoway scatter
b) 折线图:twoway line
c) 连线图:twoway connected
d) 连线阴影图:twoway area
e) 柱状图: twoway bar
f) 直方图: twoway histogram
g) 条形统计图:graph bar
h) 饼图:graph pie
2)基本统计图形的属性:颜色、形状、大小、标签、位置、坐标轴、图例等
3)复杂图形的绘制(多个图形在同一个图形中的显示,多个坐标轴的绘画等)
4)透明图片的绘制
5)命令grss的运用
6)图形的保存、合并和输出
7)中国地图的绘制
8)DID的平行性趋势检验图形绘制
9)断点回归的图形绘制
第六部分:回归分析及结果输出
1)输出表格或图形到WORD文档、EXCEL文档和PDF文档:putdocx、putpdf、putexcel
2)基本统计信息:sum2doxc
3)分组检验:t2docx
4)相关系数矩阵:corr2docx
5)简单线性回归:reg2docx
第七部分:论文实证重现(如果时间允许)
1)知识产权保护与企业创新
2)分析师跟踪与盈余管理