专栏名称: 36氪
36氪(36Kr.com)是中国领先的科技新媒体,我们报道最新的互联网科技新闻以及最有潜力的互联网创业企业。
目录
51好读  ›  专栏  ›  36氪

布尔财经想做金融领域的今日头条,并从信息中挖掘交易机会

36氪  · 公众号  · 科技媒体  · 2016-12-01 08:48

正文



布尔财经可以提供200多个单一主题的回归测试,平均准确率也在60%左右。在选股方面,布尔财经的模型可以做到在题材股爆发行情中段给出信号,帮助投资者获取爆发行情末段的超额收益。




文 | 老扎



上世纪七十年代美国宇航局NASA裁员缩减开支,一大批火箭科学家失业了,然而他们意外的发现另一个用武之地——华尔街,并由此开创了量化投资的先河。


不过一直以来量化投资使用的主要是交易数据,这些数据都是结构化的,比较易于处理和分析。DT时代的到来产生了大量新闻、帖子、搜索等非结构化的数据。布尔财经希望做的首先是一个金融领域的今日头条,为用户个性化推荐所需的金融信息,与此同时,帮助投资者从这些数据中挖掘新的投资机会。


布尔财经基于过去一年的40多万条财经信息,筛选出了1000多个节点,构架了一个拥有5个层次的树形金融领域的兴趣图谱。相比于线性模型简单打标签的做法,树形的兴趣图谱可以实现上下级继承和不同的强度值,当用户一个动作影响一个因素时,也会影响其分支上下游的因素,只是强度有所降低。


布尔财经创始人邱致中介绍,采用树形兴趣图谱的技术,在模型工程复杂度方面比线性模型高了一个数量级,但是树形模型可以实现对用户偏好更好的理解。同时为了在未来实现处理金融行情,布尔财经采用了处理速度更快的Storm构架,并通过实时增量的机器学习技术,做到在几秒内完成推荐算法的更新计算。


布尔财经技术上的另一个特点是将用户行为划分为长期、中期和短期三个时间周期,综合决定对用户的新闻推荐。这样做的原因是有些重大事件是投资者普遍需要关注的,例如美国大选或重要的财经数据发布,但是用户并不想每天浏览这些信息,只是在一个时间节点需要获得推送。根据不同时间周期的优化,布尔财经希望可以更好的平衡用户的长期兴趣、中期的阶段性关注点和短期的突发新闻。


关于舆情数据是否真的对交易有价值之前一直有所争论,有些券商研究显示舆情数据对策略的贡献微不足道,但是邱致中认为,这是因为券商采购的数据缺少处理过程,只能简单统计类似文章数量等一些简单指标,才导致了舆情数据的无效。事实上舆情数据一直未被量化投资采用,处于“盒子以外”,完全可以给出一个新的有效因子,提高投资的收益率。


布尔财经根据过去5年的数据分析了市场主题传播和价格的关系,提炼出对择时和选股都有意义的指标。例如市场情绪指标,一些机构在建仓之前会考虑市场情绪,布尔财经的模型通过全市场的新闻,股吧里的回复和跟贴的数量等指标,目前可以做到60%准确率提前2-4周给出市场情绪转折信号。


同时,布尔财经可以提供200多个单一主题的回归测试,平均准确率也在60%左右。在选股方面,布尔财经的模型可以做到在题材股爆发行情中段给出信号,帮助投资者获取爆发行情末段的超额收益。


布尔财经针对C端的产品采用基础版本免费,高级功能收费的方式。这些收费功能主要是效率工具,例如EPF一致性预期,以往专业研究员需要花费数小时统计市场上有意义的预测,并跟踪同一预测源的连续变化趋势,布尔财经的这一功能将实现统计的自动化,节约研发人员的时间。


邱致中认为,未来布尔财经商业化将主要围绕高净值的大C用户和中小型B端机构用户展开,这类用户往往缺乏自有的研究能力,但是却有很多投研需求,也有付费意愿。不过二级市场的数据通常具有排他性,很难做到既有很高的客单价,又能做到很大的规模,也许未来被大基金收购是布尔财经一个不错的选择。


布尔财经成立于2015年,前期主要在开发产品,目前已经有几家量化基金在合作之中,嘉实基金也在使用布尔财经的主题产品。布尔财经创始人邱致中毕业于复旦大学,2006年曾创办 NLP公司,主营业务是通过语义分析技术为政府和军队等提供舆情服务。布尔财经目前获得了来自两位个人投资者的数百万人民币种子投资。





推荐阅读

点击下方图片即可阅读



新世相张伟:反思“丢”书大作战,“有一点点不甘心”