专栏名称: 格上私募圈
格上理财旗下专注私募行业的微信公众号。每天精选私募行业动态、私募大佬观点、私募研究报告与您分享,同时涵盖宏观经济、个股、投资理念方面的精华文章。了解私募行业,关注格上私募圈!
目录
相关文章推荐
51好读  ›  专栏  ›  格上私募圈

41万亿元规模的消金行业,重构势在必行,AI算法会是突破口?

格上私募圈  · 公众号  · 理财  · 2017-05-07 20:43

正文


作者:CreditX氪信

来源:虎嗅网(www.huxiu.com/)


据BCG公布的数据显示,目前有1000多家金融科技创新企业获得超100亿美金的风投资金。与此同时,普惠金融持续爆发式增长,2015年中国消费信贷规模达到19万亿元,同比增长23.3%,预计2019年将达到41.1万亿元。


面对如此巨大的风口,整个消费金融业态正在技术、资本和市场的共同作用下发生数字化重构,不论是生活中我们每个人触手可及的借贷、支付、理财等金融服务,还是行业内BAT等互联网巨头布局金融的积极行动,都在昭示:我们正在迎来金融3.0时代,金融业务的变革势在必行。



金融3.0时代


颠覆背后,对比互联网金融与传统金融的差异,我们逐渐从以往依赖人工放贷或发信用卡等到现在实时的金融服务,不难发现本质是从人工数据收集处理方式到整个数据能力自动化的转变。这种转变不同于人工1.0时代到线上2.0时代的简单切换,偏向于在大数据上用规则或评分卡体系简单刻画数据与业务目标关系这样一种线上化的过程。


我们讲数据能力,核心在于将金融专家的深厚经验赋能机器,真正地让机器刻画纷繁数据与目标的复杂关系实现全自动化3.0时代,这对人工智能产生了真正的巨大需求。 因此,如何搭建一整套从数据到人工智能算法到平台的数据架构体系,将直接决定未来商业竞争制高点,这也是所有金融业务变革的基础。



说易行难,现下关于神化或忧虑人工智能的观点都比较多,我们讲技术创新怎么才能定义为成功?一定是结合业务能产生核心价值的。过去谷歌、微软、亚马逊等巨头将人工智能用在搜索、推荐、广告上做了十几年的结合终获得巨大提升。


在金融场景上,人工智能真正能在业务上产生核心价值也必然面临一系列磨合的问题,把金融体系的深厚经验与机器刻画复杂数据关系的能力结合,实现金融业务的价值最大化,需要大量艰难的尝试。下面从工业实践的角度,简要分析当下人工智能重构金融数据架构体系的3个方面,以及为什么必须要用这些人工智能技术?


为什么必须要用全域知识图谱


首先谈底层数据架构体系的知识图谱,其本质是语义网络,一种基于图的数据结构,由节点(point)和边(edge)组成。 在金融知识图谱里,其实我们每一个申请人、手机号、设备、地址、IP等都是节点,而诸如申请人拥有设备、手机号呼叫手机号等有向联系就是图中的边,边的权重为关联的紧密程度。


通俗地讲,全域金融知识图谱就是把所有不同种类的信息连接在一起而得到的关系网络,为金融机构提供了从“关系”的角度去分析问题的能力。



可为什么说我们需要知识图谱?金融的核心在于风险,而风险控制的关键就是基于纷繁复杂的各种数据,通过数据金融化和数据价值挖掘,合理建模从而进行风险程度评估。这涉及几个点:


一是数据的表现能力, 以往我们只能局限于一度关系分析,而图谱对实体间关系的强扩展能力可有效帮助我们处理局部或全网数据间的关系;


二是数据的管理能力, 随着金融机构不同渠道和系统数据越来越多,整个底层数据体系的管理将愈发复杂,通过定义主流的业界规范来对数据进行转换和清洗,可将异质异构的数据统一管理;


三是扩展能力, 我们知道大机构接入的数据越来越多,与以往大量数据表间的合并不同,知识图谱可按之前所述对新数据转换从而无限扩展整合。



有了知识图谱,事实上就可以实现针对金融风险的精准用户画像构建,我们既可以抽取丰富的局部关系特征和网络全局特征,同时也可以运用先进的无监督聚类算法辟如社区挖掘来识别风险团体,在此之上运用有监督算法的集成机器学习模型,相对传统规则模型,金融机构自身的群体反欺诈能力往往会有一个巨大的提升。如下图,从解决当下互金曝光较多的黑产、团贷等问题角度看,也是必须用知识图谱的一个理由。



为什么必须要用深度学习







请到「今天看啥」查看全文