专栏名称: 挖地兔
金融数据采集与挖掘,开启量化金融的第一扇大门。
目录
相关文章推荐
新能源汽车评论  ·  誓死不国产的“日系车之王”,16年后终于低头了? ·  6 小时前  
新能源汽车评论  ·  誓死不国产的“日系车之王”,16年后终于低头了? ·  6 小时前  
重庆之声  ·  新规丨正式实施!驾驶证申领政策有变 ·  昨天  
汽车金融大全APP  ·  抵押解押上牌过户,全国可做 ·  昨天  
有车以后  ·  智驾必须有激光雷达?除非开的是阿维塔 ·  3 天前  
51好读  ›  专栏  ›  挖地兔

数据实操和量化策略上路的一次分享

挖地兔  · 公众号  ·  · 2020-02-05 23:00

正文



假期分享

数据实操和量化策略指引


Tushare线上活动



在新型冠状病毒疫情漫向全国的这个春节里,绝大多数人都被迫自行隔离在家里,吃吃喝喝,躺躺坐坐,浑浑噩噩。


有的人享受这“天上掉下来”的长假,甚是惬意,巴不得且过下去。有的人却是如坐针毡,度日如年,期望能早入回到工作岗位,回归正常的工作生活状态。


但事实是,只能看着新闻刷着微博朋友圈,无奈的继续等待疫情的结束。不外出,不往来,就是在为战胜疫情贡献力量。


大家在社区里讨论着抗艾滋病药物可以抵抗新冠病毒,也看到双黄连可以抑制新冠病毒,后来又发现阿比朵尔、达芦那韦也可以抑制病毒,但大家都感觉很难让每天的新增病例减少。


终于, 有人在社群里发出了积压在内心很久的呼唤——学习Python可以抵抗新型冠状病毒 。我以惊叹加敬佩的眼神拱手一礼:真他哥的有道理!


在几个爱学习,同时愿为抗击病毒做出贡献的几个用户的怂恿下,在经过了对Tushare社区用户画像分析后,我紧急的搞出了一个学习培训方案。也就是从金融数据的基础业务知识,数据的采集和入库,量化策略的入门实现方面做了一个讲义。当然,借此机会,必然也少不了对Tushare发展历程和理念做一次汇报。


在短短的两天时间里,在付费的情况下报名人数达到了400多,可见大家认真学习的态度,以及对抗击新型冠状病毒的决心。


课程培训从晚上8点开始,直到22点40分才正式结束,期间对金融数据和信息公司,对爬虫实现,对量化投资的历史和2019年现状做了详细解说,中间穿插代码和效果演示,还算是比较成功。


于是,今天再次整理,发布到公众号,希望对有兴趣有需求的小伙伴有所帮助。


一、铺垫部分

量化投资的基础是数据,以及围绕数据的各类信息处理。如果对数据不了解,包括数据的种类,数据的来源,已经数据的采集不熟悉,可能很难真正的做好量化投资。


所以,在第一部分,主要从量化投资常用的数据进行了解说,包括这些数据的特点和难点等关键信息展开了说明。

了解了主要数据及其重要性之后,继续讲解数据的主要渠道来源。以亲身经历和体会例举了国内外常用的数据源供应商,包括这些公司的服务方式,服务特点,以及服务过程中的“潜规则”。

数据之后,我们也延伸到了对量化投资现状的说明,包括2019年市场上私募量化产品的表现以及背后的私募公司做了介绍。

2019年表现较好的私募公司和量化产品情况:


二、数据采集和落地入库实操

在数据采集方面,我们从容易实现,最低成本,以及最优方式角度对数据的提取做了详细介绍。


从针对个人投资者来说,免费数据应该是大家优先考虑的选项。我们介绍了三种形式:

免费数据及落地




● 免费金融终端数据采集

1、无需编程导出数据

2、历史数据文件读取

● 金融网站数据爬取

1、AJAX模式的JSON数据抓取

2、HTML格式的内容提取

● Tushare数据调取

1、Tushare接口设计的特点和各类数据说明

2、Tushare数据的最优调取方法

● 数据入库落地最优方案

1、入库MySQL的实现

2、入库MongoDB的实现

以上内容,全部用可运行的源代码进行了讲解和演示。代码也随培训群发送到共享文件夹内,用户可以下载直接运行和扩展使用。


以下是代码目录结构和程序:

相信对绝大数的用户在数据采集和落地方面都会有很大的帮助,最关键是了解为什么。








请到「今天看啥」查看全文