专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
新智元  ·  美国教授痛心:UC伯克利GPA ... ·  17 小时前  
爱可可-爱生活  ·  【AI前沿:从智能合作到语言模型的最新突破】 ... ·  20 小时前  
宝玉xp  ·  //@笑叹词穷·:你小子还有点洞察 ... ·  3 天前  
爱可可-爱生活  ·  【M2DGR-Benchmark:基于M2D ... ·  3 天前  
人工智能学家  ·  transformer的细节到底是怎么样的? ... ·  6 天前  
51好读  ›  专栏  ›  机器学习研究会

【学习】智能问答在金融领域中的实践与应用

机器学习研究会  · 公众号  · AI  · 2017-03-27 19:12

正文



点击上方“机器学习研究会”可以订阅哦
摘要
 

转自:大数据杂谈 

大家好,我是数库科技的CTO夏磊,我们是一家创业型企业,成立于2009年,先后获得穆迪和京东金融的投资,在2016年被KPMG评为金融科技50强,非常高兴有机会跟大家分享下我们在行业工作中的一些经验。今天我主要想从下面几个方面来讲:

演讲提纲:

第一部分:人工智能与金融创新  

我相信今天大家每天都能听到甚至接触到人工智能相关的信息和产品,最近人工智能也被首次写入2017年的全国政府工作报告。从百度、阿里、腾讯、滴滴、今日头条到Facebook, Microsoft, Google, IBM, Amazon都在将人工智能技术融入数据、产品和服务,通过大数据、机器学习及深度学习为用户提供更好的服务和互动。

在金融领域,人工智能将与传统金融市场的诸多功能紧密结合从而提高效率;涉及到决策、交易以及风险控制,学习模仿专家进行交易、通过用户画像和交易行为分析进行风险控制等。


下图是数库统计的在金融领域与科技相关的最热门的一些概念。

在开始介绍数库的智能助手之前,想先简单介绍一下金融领域这两年很热的两个人工智能的应用方向:智能投顾和服务机器人。


先说智能投顾,2016年,毕马威在对1500名银行客户调查后发布《智能投顾——跟进步伐,引领潮流》报告(Robo Advising Catching Up And Getting Ahead),预计到2020年美国智能投顾的资产管理规模将会达到2.2万亿美元。智能投顾实质上是解决了平衡风险与收益的同时,提高效率、降低成本。这类公司有像Betterment、Wealthfront、Future Advisor等;在国内,智能投顾解决的一个问题是以前通过专业的理财投顾来服务少数高净值人群,现在可以通过机器用更低的费用服务更广大的中低净值人群。目前国内的金融机构多是通过黑盒方式提供服务的,其背后或者是结合投资者风险偏好、财产状况与理财目标做智能投资组合分析,或者是通过量化分析进行交易决策。但国内的问题是刚刚起步,我们大数据的挖掘不够深入,标准理财品种比较少,投资者以追求短期收益为主等,所以人工智能到底发挥了多少价值这个很难说清楚。


再来说服务机器人,这里主要说聊天机器人(chatterbot),提供一个人机交互界面来做问答,多用在客服、教育等特定领域,国内已经有很多这种中文聊天机器人的产品,更类似一种百科或者知识库,但是在金融领域,关于投资的决策往往非常复杂,决策往往不是一个有标准答案的问题,想实现智能问答还有很长一段路要走,一方面把已经有的一些先进的方法论用机器实现,一方面要收集清洗并提取大量数据形成知识。

所以就以上的两点,数库对于金融领域智能问答的定位,更偏向于两者的结合,投顾+智能问答。数库在金融领域专注于交易前的决策环节,我们挖掘有价值的数据,在图像识别和自然语言处理的技术支持下,我们可以对更多非结构化数据进行信息提取、知识分类和聚类,加入量化分析,形成知识库,以此来辅助决策,不断减少个体从得到信息到决策的时间。


我们在服务机构用户时,实际是如何操作的呢?通常分为两步:

第一,首先对企业内部散落的数据进行挖掘和关联,形成知识库;知识库的搭建并不是简单的数据的汇总,现在企业比较困扰的是数据过多,对于基础数据的整理需要耗费大量的人力。比方说关于一家上市公司的研报会有几十篇,上百页,如果仅仅是把数据做汇总,需要大量的时间去消化理解这些信息。所以在面对当前信息过量的情况,我们做的是基于数据做提取观点、挖掘知识,才能够真正地辅助决策。

这里我举个例子,对研究员来说可能想了解某个行业、上市公司的一些信息,如:公司业务分布、产量产能、供应链、产业链图谱、研究员评级和观点、公司业务的外币构成(美元升值)、主要客户、参控股关系、主题概念、公司事件轴、量化分析等,这些信息其实分布在研究报告、上市公司财报、互联网媒体资讯中,我们要做的就是首先从这些数据源挖掘出知识和观点,通过我们的多因子和事件驱动回测分析服务进行实时分析。


第二,知识库搭建后,如何让用户使用呢。通过搜索、问答的方式,是目前最为便捷和简单的一个方式。但是如何理解用户的问题并给一个有效的答案是技术上的一个很大的挑战。这部分也是我今天分享的重点。除了智能问答以外,我们也为金融企业中一些特定的场景,搭建从信息到决策的自动化流程。

图示:从知识到问答


原文链接:

http://mp.weixin.qq.com/s/4a8hGw-E73FVoGsAW0UWHQ

“完整内容”请点击【阅读原文】
↓↓↓