人工智能之热,伴随新一代 AlphaGo 轻松战胜围棋第一人柯洁之后,进入了一个新高潮。
当然,对于我等股民,永远关心的还是人工智能到底能不能帮助赚钱?
6 月 13 日的时候,国内顶尖的基金公司华夏基金和互联巨头微软一起在北京召开了一场发布会,宣布双方战略合作。
本来,我也受邀参加这次发布会,很可惜最终因为个人的原因,未能成行。虽然未能成行,但是这次发布会不能不关注。
是的,眼下说人工智能 + 投资的,如过江之鲫。但是说到底,绝大多数公司在人工智能这样先进领域的技术储备,是不可能像微软这样纵横江湖几十年的巨头那样有着无尽金矿可以开采的。
所以,看了直播,还重温了下文字速记,果然收获颇丰。这里和大家分享下我看下来的亮点。
▌ 为什么做投资不能小觑微软
说到人工智能,估计许多人可能第一时间想到的是谷歌。
的确,AlphaGo 让谷歌是名声大噪。不过人工智能是一个极大的领域,谷歌也不过是其中一家巨头而已。
从早年 Windows、Office 到近年的云计算,微软始终活跃在 IT 产业的第一线,而且很早就专注与人工智能,就如这次发布会上,微软亚洲研究院院长洪小文博士所言:
在 1991 年,在座的很多可能都没有出生,比尔 · 盖茨先生创立微软研究院,当时他的梦想就是希望将来每个计算机可以看,可以听懂,可以了解我们的语言,我们所接触的万物,这确确实实就是人工智能的一个最宏大的一个目标。
那么多年投入和研发下来,其实微软在人工智能领域的是绝对不容小觑的——尤其是对于金融投资的帮手。我来说这句话,其实没什么说服力。但是只要看最近的一个 「跳槽」 变动,就明白了:
5 月中旬的时候,微软人工智能首席科学家邓力离职,加入对冲基金公司 Citadel(大本营) 担任首席人工智能官。
关于 Citadel,熟悉海外投资的股民应该不会陌生,资产规模超过 260 亿美元,绝对是对冲基金产业的巨头。这样的巨头,要从微软挖角,可见对金融行业的巨头而言,微软的人工智能是很强的,而且是对对冲基金行业是有用的。
所以,这次华夏基金和微软亚洲研究院战略合作,绝对是和人工智能领域巨头级的合作,眼光是超级好——一定程度上,华夏基金借此可以获得的技术储备,某种程度上都未必会逊色于 Citadel(大本营)了。
▌ 投资,围棋好不如语音识别好
在这次的合作发布会上,微软亚洲研究院副院长刘铁岩博士是负责干货部分的,他讲了几个潜在的人工智能在投资领域的合作方向。而其中最重要的就是语音识别。
对于这块,刘铁岩这么表述:
在时序序列分析方面,2016 年底,来自我们微软研究院的, 基于深入神经网络的语音识别技术 ,首次达到了人类语音识别的精度, 秒杀了其他同类的算法 。再举个离子在二维的模式识别方面来自微软亚洲研究院的 ResNet 技术、正式率先地超过了人类,获得了 2015 年的冠军,如今已经成为了图象识别领域首选的算法,这些例子想告诉大家,在人工智能模型的设计和研发方面,微软亚洲研究院具有非常强的实力,如果再配合上华夏基金非常丰富的知识积累,我们一定可以为量价分析这样的技术取得更好的效果。
如果你有留意过量化基金巨头文艺复兴基金当年神奇招人的股市就会知道,当年出生于数学科学的量化投资大师西蒙斯在挖人时候,也是大量招聘了从事语音识别技术的人员,因为他们发现识别语音和识别股票的趋势,有着异曲同工之妙。
而微软刘铁岩的发言来看,语音识别眼下对于判断股市的价格波动,依然有着巨大的左右——而且这些年语音识别技术突飞猛进,从十多年前需要朗读上千字的范文机器才能识别你的语音到如今直接可用而且非常准确,这里面带来的潜力,不容忽视啊。
在这个问题上,又要说回大本营挖角了邓力了,网上对于邓力的一段公开资料如是说:
作为深度学习、人工智能、自然语言理解与语音识别方面的专家,邓力早在 2009 年就同 Geoffrey Hinton 教授合作,首次提出并将深度神经网络应用到大规模语言识别中,显著提高了机器对语音的识别率,极大推动了人机交互领域的发展与进步。目前,邓力的研究方向主要为应用于大数据、语音、文本、图像和多模态处理的深度学习和机器智能方法。在语音、NLP、大数据分析、企业智能、互联网搜索、机器智能、深度学习等领域,邓力曾获 70 多项美国或国际专利。
可见,对冲基金巨头大本营,如今依然认为语音识别领域的专家,对于投资是大有帮助的。
看来,要想用人工智能赚钱, 围棋下得好,也许真不如语音识别好来得实在 。
▌ 董事长们谁在说谎?
当然,从这次华夏基金和微软的战略发布会做的展示来看,语音识别技术在投资上的帮助,已经不仅限于用类似的方式来识别价格的波动,甚至在大家更熟悉的基本面投资,在公司调研上也能派上用处。
在发布会上,华夏基金的首席策略分析师轩伟和一个名为 「小精灵」 的人工智能有一段展示,展示中小精灵对于某家上市公司在股东大会上的发言进行语音识别,并且得出了多个重要结论:
1)通过自然语言处理系统找到该语言过去五年的记录,建立音频参考界限,对音频进行对比,改变的体征变化也会反馈到声音上,通过多层声音分析系统,分析音频多型上的变化,我判断 声音传达信息的可信度很高 。
2)发现公司的战略布局逐步成型,业务范围不断延伸,同时征信和小微贷在科技改革浪潮中充分受益,进而业绩存在超预期可能。结合音频分析,发现董事长对公司未来发展前景 预期还有所保留 。
就是一段音频,不但可以判断发言的可信度高不高,而且还可以进一步判断当事人的表态是否保守打了折扣——是不是让你突然有看多年前那部著名美剧《Lie to me》的感觉。
不过,在美剧中,当事人原型行为学专家 Paul Ekman 博士是经过多年的训练,才能从微表情等细节中做出如此的判断,而如今借助人工智能的技术,只要拥有系统,都可能可以快速判断上市公司的董事长们谁在说谎,谁乐观谁悲观。
这样的系统,无疑将改变上市公司调研的传统流程,提问将不再仅仅是获得回答,甚至回答的音频分析可能可以传递出更多的信息量。
华夏基金本来就是拥有 200 名投研的大型基金,在对于上市公司的调研覆盖率上本来就已经有巨大的优势。如今如果可以借助类似的系统对于调研的可能性做出更深层次的评价,这个在基金面研究上,绝对也算是如虎添翼了。
▌ 还有那些技术会有用武之地?
相比语音识别的两面开花,其实发布会上,微软亚洲研究院副院长刘铁岩博士还说了一些可能性。这里也简单提一下,有些技术可能威力不逊色于语音识别。
◢ 文本分析
基于 Twitter 上的股民言论乐观 / 悲观程度预测股市,这个已经不是新鲜新闻了。虽然这个思路很简单,但是其实有大量的优化空间。
这个问题上,刘铁岩说了不少技术储备:
文本数据也是非常重要的一个数据源,我们可以通过对文本数据的分类,语义分析,主题分析和情感分析,来预测市场对于一个行业或一个公司的预期,我们甚至可以去预测股票走势的拐点。
说到对互联上海量文本数据的分析也并非是一件容易事儿,传统的一些统计工具和分类方法,可能会遇到巨大的挑战,比如说如果我们将要处理的文本数据是来自于整个互联网上的海量文本,它的词表里面如果包含了上千万量级的处理,这个模型的训练要用非常长的时间甚至长达百年。如果我们想对文本数据做非常细力度的分析,比如说我们想区分超过百万个不同内容的主题,也同样会遇到巨大的挑战,我们会动用成千论万台机器用上几周或者几个月的时间。
这些看似不可能完成的任务,在微软亚洲研究院的面前,却变得可行。这是因为我们拥有能够处理千万词表的人工智能网络 LiigtRNN 这套系统可以把体量缩小上千倍,把可能需要几百年的时间缩小到一个月。同时我们拥有可以分析百万主题的人工智能模型 LightLDA 在用(英)进行分布式部署,我们就可以只有几十太机器的小型集群可以实现使百万量级的主题分析。如果我们有了像 LiigtRNN、LigtLDA 拓展性非常强的技术,就可以对非常大的文本数据进行超细密度的分析,并且这些事情可以实时做到。这就使得我们能够在信息的获取和处理方面获得巨大的优势。
上述的描述,技术性相当强,要看懂不容易。不过简单来说,其实对于文本分析,尤其是中文这样的语言,不是一件容易的事情。虽然我自己没尝试过深度学习之类技术,但是文本分析之前的分词、情绪判断还是有所尝试,这一块要精确分析出股民是乐观有多乐观,绝不是容易的事情——但是分析精确后对于一个反转模型而言,又是至关重要的。
◢ 知识图谱
在这个问题上,刘铁岩有这样的介绍:
我们微软亚洲研究院拥有目前最高效的知识图谱的索引和分析的开源引擎,有了这种引擎的支持,我们就可以对巨大体量的知识图谱,进行实时的分析推理,使高阶因果关系进行改变,插上理性的翅膀。
人工智能或者说眼下主流的深度学习,很大程度上是知其然不知其所以然,通过调参可以获得一个预测率比较高的模型,但是这个模型是不是有逻辑的支撑,并不容易判断。
这样的模型,简单用于亚马逊推荐书籍风险很小,但是用于大量资金的投资,就会比较危险了。
如何找到经验预测背后的逻辑性,避免在十多年前数据挖掘和投资交叉时就遭遇的 「过度挖掘」 问题,就需要知识图谱来寻找背后的逻辑了。
当然,知识图谱的价值,还不仅于此。刘铁岩还介绍了另一个应用:
在投资的时候我们常常会利用一些信息,比如说政治事件、金融事件、经济事件,比如说我们可以利用供应链的上下游关系,利用投资人和公司之间的这种关系来进行推理。这就会遇到几个问题,首先我们如何去构建一个可靠的、信息丰富的金融知识图谱,第二当我们拥有大量的金融知识图谱的时候,我们如何进行分析和推理。
◢ 对偶增强学习
人工智能,思路千千万。
现在大热的一些方法,其实是基于对于大量数据标识之后的计算。但是这样的算法,有很大的局限性。在这个问题上,微软擅长的语音识别、翻译等用到的对偶增强就有了额外的用武之地。
对此,刘铁岩这么说:
投资经理还需要根据市场的反馈不断地调整他之前既定的一个决策投资方案。如何能够实时地、快速地根据市场进行反应,并且能够对市场里面参与者,比如说其他的参与者、投资机构、散户他们的经过建模成为致胜的力器,来自微软亚洲研究院比如说对偶增强学习,博弈机器学习将会有大有用武之地,会有先发优势。
▼
这次华夏基金与微软的战略合作发布会上,个人关注的干货大体在此,当然有兴趣的读者,不妨多多关注微软过去一段时间在人工智能上的新研究和论文,也许从中可以发现更多未来和华夏基金合作发掘新投资能力的可能性。
当然,笔者也更希望,这些高精尖的技术,能够早日转化为基金投资中的一个个环节,为投资者带来更多的超额收益。