专栏名称: 中国人工智能学会
关注中国人工智能学会官方公共账号,收取学会的科普信息、新闻动态、活动预告及人工智能领域科技前沿信息。
目录
相关文章推荐
爱可可-爱生活  ·  [LG]《Time After Time: ... ·  14 小时前  
黄建同学  ·  //@蚁工厂:这个价格,机器人上的手机和笔记 ... ·  22 小时前  
爱可可-爱生活  ·  AGO:为检索增强生成服务带来系统级性能优化 ... ·  昨天  
爱可可-爱生活  ·  【[114星]OmniSQL:大规模高质量文 ... ·  昨天  
黄建同学  ·  这个有意思,Gemini AI + ... ·  2 天前  
51好读  ›  专栏  ›  中国人工智能学会

2017GAITC智能金融分论坛实录丨朱英姿:机器学习与量化投资

中国人工智能学会  · 公众号  · AI  · 2017-05-27 17:48

正文

主题:智能金融分论坛

时间:2017年5月22日上午

地点:国家会议中心403


本文根据速记进行整理


机器学习与量化投资

朱英姿

清华大学经济管理学院教授


主持人: 产学研结合,王健宗是业内的杰出代表,下面请清华大学经管学院朱英姿教授,简历大家可以在网上搜,朱英姿以前在纽约大学学数学,在花旗银行工作了很多年时间,然后回国在清华大学。我和朱教授第一次见面的时候印象非常深刻,那个时候阳光非常明媚,我在朋友圈里写春风十里不如你,为什么?我和朱教授在清华东门星巴克聊了三个半小时,聊什么我不说,朱教授在接下来的报告里跟大家分享机器学习与量化投资。


朱英姿:我那天和柳博士在星巴克聊得很嗨,聊的就是策略,上次我们是3月份,现在是5月份,两个月过去了,我的想法有很大的改变。为什么现在我不嗨了,那次我们聊的时候正好我们在做一个机器学习的量化策略,当时东西刚出来我特别兴奋,弄出来的Sharpe Ratio我很兴奋,但是回过来我发现很多策略、很多机器学习的方法、很多学生每天在实验室里泡着,每天看着图像给一个例子,如果得到的图像不尽人意的话,他会在朋友圈里抱怨一下,凌晨十二点出来一个好图像,其他同学就给他欢呼,这就是现在在学校里做机器学习的一种倾向。后来我反思,这样做出来的东西我如何控制,我敢不敢用,这就是我两个月的思考,现在冷静下来了,我现在发掘策略本身不重要,机器学习是非常强的拟合搜索的引擎,非常强大,给任何的数据可以拟合出非常漂亮的曲线,但是这个不重要,重要的是怎么样控制过拟合,这就是今天我要讲的。


这是一个非常难的问题,在你不知道真实答案的时候,在你不知道这个市场上有多少钱可赚的时候,你不知道你的limit在哪里,当你不知道limit在哪里的时候很难控制Type II、Type I error。回答这个问题之前我知道这个问题在量化投资里永远没办法回答,刚才柳博士说深度学习,有些领域确实可以不在乎,在量化投资领域我们非常在乎,因为金融数据里信噪比是非常低的。当你在金融里做一个回归的时候如果能得到R2=2%、1%就非常高兴了,性噪比只有50-100。我从另一个角度看看别人怎么做的,美国人怎么做的,现在行业里的标准在怎么做,我还想看看这样的问题不光是量化投资里,物理学、生物学、药学里同样存在非常大的问题,我想看行业里到底怎么做,给我们量化投资未来在这个行业在这个方向有一些启示,这就是我今天要讲的。


我搜索了一下量化投资的商业模式,大概可以分这三种,我不说非常传统的从共同基金,我们就说从现在机器学习发展开始,引入量化投资以及量化投资飞速增长的这几年来看,我们到底有哪些模式。第一种模式,Smart beta,这个模式涵盖了所有过去传统的投资,包括基金、指数投资。Smart beta现在变得更加smarter,得益于机器学习,但是它如何控制它的过拟合,这是个行业的问题。现在所用的Smart beta有两个典型的公司,大家都知道,叫DFA和AQR,这两个公司是美国第一第二大基金,除了纯指数,这两个是基于主动和被动之间。他们大概的规模是几千亿美金。


第二种模式是Alpha factory,典型的代表公司,清华任何一个工科同学,对量化感兴趣的都知道。Alpha本身并不是一个新概念,如果你认为市场有钱赚,市场是非有效的,通过发现非有效性就可以去挖掘超额收益,Alpha就是超额收益。为什么会有factory,这就得益于机器学习。


最后一个是Data Science,就是王总公司所做的非常超前的领域,这是一种非常新的模式,但其还未成形,从数据手机到产生策略、进行组合到投入应用还有很长的路要走。


我们首先讲讲Smart Beta,也叫聪明Beta,它是在传统指数投资的基础上,采用系统性方法,对选股策略进行优化,达到跑赢传统指数投资目的的策略。举一个简单的例子,买小股票一定可以跑赢大股票,长期来看怎么看怎么好,只要有中国A股市场经验的人都知道小而美,但前年的十一月到十二月间月有一小段窗口期可能会有些辗转。我们可以通过不同的权重来做仓小盘股,从而获得超额回报。从Smart Beta的市场来说,这是一种被动投资,其优势就是管理费用低、信息透明度高,普通人在投资前不需要告知要做什么,这一点非常透明。以美国的经验来看,此类投资将会是主流。现在绝大部分的散户的钱,因为监管的原因,基本会投资在此类型产品中。但是如果我们重新定义Smart Beta,所有这些称之为指数型投资、Smart Beta型投资或者小股票型的投资,其本质特点是什么?规则事前已确定,在招股说明书中也已确定投资人。从小股票指数开始,所有内容都写在了学术文件中,可随时查询,所有人都知道他在做什么,市场上谁做得最好,谁的规模最大。


我们所讨论的机器学习方法,也是在选择一种规则,这种规则要在投资前就确定好,要将各样策略的测试呈现给投资人,投资人根据策略测试的结果进行投资。目前这个行业最大的问题,即如何判断策略测试的结果是否有效。


Smart Beta是金融资产定价理论的直接产物,这是一种采用因子模型的直接的机器学习。量化流程便可通过机器计量方法进行各种优化组合。当我刚开始接触机器学习的方法,我特别兴奋,因为它就是金融计量方法的延伸,可以从线性模型到非线性模型,低维度到高维度,运算速度非常快。可采用的工具很多,但所有的问题的核心仍然是数据。美国的可靠数据是从1929年开始收集的,而中国可靠的数据却是从1995年开始收集的,更可靠的股权分置改革以后的数据的收集时间就就更短了,仅仅只有10多年。因为我们的数据非常稀缺,我们非常珍惜数据。


若一个模型有95%的概率是正确的,这叫选择偏差。这是2000年诺贝尔经济学奖获得者Heckman的获奖成果,选择偏差在社会科学研究中广泛存在。以抛硬币为例,若抛硬币十次,硬币都是正面朝上的概率非常小,重复实验两次,概率依然很小,实验十次呢?实验一千次一万次呢?则在这一万次连抛十枚硬币试验中出现一次硬币都是正面的概率会大大增加,抛的越多则能得到我们想要结果的概率会大大增加。这一点和我们做实验是一样的。若我们选择一个策略,不行,再继续实验,看看什么地方不对,这是我们一直在做的,也是各种各样的研究都在做的。这些工作以前是人工来做的,现在由计算机帮我们做,所有计算机都可哟在一秒钟内计算十万次,那么这个问题就非常严重了,如何控制不吻合的情况,如何使得结果可信,我们自己都不知道真正的范围在哪里,这是个严重的问题。







请到「今天看啥」查看全文