专栏名称: 数据猿

关注大数据行业的最前沿资讯，分享最有价值的大数据深度文章，关注“数据猿”就是关注大数据！

【案例】某银行信用卡中心——大数据反欺诈应用案例

数据猿 · 公众号 · 大数据 · 2017-06-23 08:00

正文

数据猿导读

2003年以来我国经济的快速增长，国内信用消费环境的日趋成熟，我国信用卡市场近几年得到了爆炸性的大发展。根据中国银行业协会统计，信用卡欺诈损失排名前三类型为伪卡、虚假身份和互联网欺诈。

本篇案例为数据猿推出的大型“金融大数据主题策划”活动（查看详情）第一部分的系列案例/征文；感谢 百融金服 的投递

作为整体活动的第二部分，2017年6月29日，由数据猿主办，互联网普惠金融研究院联合主办，上海金融行业信息协会、中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟、上海张江发展战略研究院、人大人科创协办的《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》还将在上海隆重举办【论坛详情】【上届回顾（点击阅读原文查看）】

在论坛现场，也将颁发“技术案例奖”、“应用案例奖”、“实践案例奖”、“优秀征文奖”四大类奖项

来源：数据猿丨投递：百融金服

本文长度为6800字，建议阅读14分钟

2003年以来我国经济的快速增长，国内信用消费环境的日趋成熟，我国信用卡市场近几年得到了爆炸性的大发展。根据中国银行业协会统计，截至2015年末，信用卡累计发卡量5.3亿张，信用卡欺诈损失排名前三类型为伪卡、虚假身份和互联网欺诈。

随着互联网信息技术的发展与移动互联时代的到来，信用卡业务的申请受理也逐渐由线下转移到线上渠道。某银行信用卡中心申请进件的重心，也逐渐向线上渠道倾斜。这就要求卡中心在审批流程和方法上与时俱进，采用更多渠道通过第三方服务，对申请进件的信用资质、真实性等方面进行核查，以防止欺诈行为的发生。

周期/节奏

1.2014年开始测试.

2.2015年上线第一版发卡模型，在网申行方A卡中分段的客群上使用。百融评分大于一定分数就发卡，初期控制总量，验证6个月后放量。

3.2016年改进版模型上线，全量查询百融，和自有评分组合使用。

4.2016年底，为满足人民银行征信中心合规要求，调整网申流程。进件通过百融初审，初审通过后邀请到网点面签，面签通过再查人行完成终审。

5.2017年针对纯线上样本再次优化模型，目前已完成开发，准备上线。

客户名称/所属分类

某银行信用卡中心/风险控制/反欺诈

任务/目标

信用卡业务竞争本质上就是客户的竞争，而且是优质客户的竞争。针对线上审批在客户发现、客户提升、客户保持、忠诚度、反欺诈和个人信用风险等等一系列围绕客户的新问题，支持日常运作的信用卡审批无法提供线上实时的、大量的、复杂的申请提供快速的决策分析，希望建立一套以客户为中心的大数据分析系统以实现上述目的。

挑战

今年两会上，总理在《政府工作报告》中指出，当前系统性风险总体可控，但对不良资产、证券违约、影子银行、互联网金融等积累风险要高度警惕。金融行业长期面临欺诈风险和信用风险，欺诈风险和信用风险有着本质的不同，信用风险指借款人因一些原因未能及时、足额偿还债务而违约的可能性，信用风险和收益一般是正向关系，金融机构对信用风险是主动承担的，风险管理的目的在于将风险控制在一定范围内而获得更好的收益。

而欺诈风险则是借款人恶意利用金融规则的漏洞以非法占有为目的，采用虚构事实或者隐瞒事实真相的方法，骗取借款的风险，金融机构是被动承担的，并不会从承担欺诈风险中获得交易收益，风险管理的目的在于将风险减少到最低和严防风险发生。但欺诈风险与信用风险又有一定的联系，欺诈风险可以引发新的信用风险或增大原有的风险程度，为风险管理带来一定难度。

金融反欺诈是指金融机构通过借助技术手段、改善业务流程等方式，检测、识别并处理欺诈行为，以预防和减少金融欺诈的发生。反欺诈在国内是个刚需，对很多金融机构来说，其所面临的欺诈风险远大于信用风险。尤其是近年来互联网金融和消费金融的快速发展，同时传统金融机构也不断向线上转移业务，很多平台等在风险管理方面准备不足即开展业务，面临大量的网贷申请欺诈和交易欺诈。同时对与p2p平台和消费金融公司来说，低廉的造假成本和风控能力较弱，大大降低了网贷申请过程中的诈骗难度，给其识别风险带了很大的冲击和挑战。

通过对各种场景中常见的欺诈行为的研究，可以对于外部欺诈的主要特征做出初步判断，欺诈行为主要可分为以下几大类：

1、身份欺诈，即利用虚假的身份信息向金融机构申请贷款。身份造假有以下几种类型：

第一，盗用或冒用他人身份信息，欺诈分子通过暴力破解、撞库等技术手段非法盗取网上银行/手机银行账户，并采用集码器等获取手机验证码等校验信息，利用账户资金进行非法消费、转账或提现等操作。

第二，盗用银行卡，即非法获取持卡人的银行卡信息，绑定支付账户，或者通过复制银行卡，提取银行卡内资金。

第三，虚假注册，即利用身份信息交易黑色产业链大量收购身份信息，在线注册账户，并利用虚假注册的非本人账户进行骗贷或洗钱，这类成本较低的欺诈方式主要用于攻击风险控制薄弱（例如提供身份证即可放款）的借贷平台。

随着放贷机构风险管理手段的升级，近期还有针对性地发展出“虚拟人物养成”的新模式，即花费时间和经济成本“刷”出各类信用记录，例如通过作弊手段，将芝麻信用分“养”到600分以上，创造出一个“真实”的有良好信用信息的人以骗取贷款。

第四，电信诈骗，即通过网络、电话等诈骗方式，诱使客户主动将资金转移到欺诈分子账户。在身份欺诈中，既有个人实施的单笔骗贷，也有专门的骗贷团伙，专门研究各个金融机构的管理漏洞，利用各种技术手段实施团伙欺诈，例如攻击某个平台，大量盗取用户信息，或通过一台主机同时控制几百部手机或平板电脑，或同一台手机不断插拔多个手机号进行申请，其手段更为隐蔽，从单一的身份属性验证角度难以识别此类团伙行为或机器行为。

2、信息隐瞒或造假，即刻意隐藏不良信息，或征信不达标的个人，在黑中介的协助下，通过各种手段将自己包装成“信用合格”人员，从而顺利获得贷款。例如申请人存在电信、公共事业、各类罚款等方面的欠缴行为，或者其名下个人资产是法院的执行对象等负面信息，或者其配偶在金融机构有过多次逾期或不良记录，即使申请人本人信用状况良好，但法律规定的代偿义务直接影响到了申请人的还款能力和意愿。由于婚姻关系不是申请表的必填信息，此类信息不对称具有相当的隐蔽性，难以被金融机构察觉。

另外，还有欺诈分子通过作弊手段，短时间内大幅提高芝麻分等信用记录，或伪造高学历证明、工作证明、通讯信息、银行流水信息等，试图提高信用审核的通过率。

3、隐形的欺诈意图，由于信用意识和超前消费的准备不足，一部分拥有正常信贷需求的人可能出现未能正确评估自身还款能力或丧失还款意愿的情况。

申请人本人及其密切联系人（尤其是有代偿义务和代偿意愿的联系人）是否在新的贷款机构提交了借款申请，是否从新的贷款机构借款，借贷产品的类型和借贷渠道是否发生了变更等，尤其是从传统金融机构转向风控较为松懈的新型贷款机构申请贷款，或新申请了短期高息贷款，或频繁使用信用卡提现等异常现象，如果出现此类情况，有理由相信，在客户收入保持现有水平的情况下，难以偿还所有这些欠款，很大程度上能够反映出资金紧张或信用状况恶化，需要额外加以关注。

4、商户欺诈，商户与借款人形成套现、套利的勾结关系，骗取金融机构对于特定消费场景的补贴等。

实施过程/解决方案

技术要点及解决方案

随着网络和移动通讯技术在金融领域的广泛应用，网络欺诈也日益复杂多样，并呈现多种欺诈手段的复合型欺诈和分工精细的团伙化欺诈趋势。传统的反欺诈手段通常是每遇到一次欺诈，就将其行为特点记录下来形成“规则”，再基于规则建立防范机制，通过金融机构自有业务数据进行分析建模做反欺诈风控，但由于我国目前征信体系并不完善，数据滞后性和数据不全面问题导致金融机构只能做到一定程度的预防，不能跟上日益隐蔽和变化的欺诈手段，起不到真正的全面风险控制。

百融金服凭借服务银行等金融机构的行业先入优势、超强的大数据处理和建模能力，为信贷行业用户提供包括反欺诈、贷前信审、贷中管控以及贷后管理在内的客户全生命周期产品和服务。通过大数据的方式进行筛选、整合、聚类等处理，针对未来可能产生欺诈行为的异常信息进行判定，为用户做全方位画像，就成为金融机构防范欺诈风险和信贷决策的重要补充。

影响反欺诈效果的因素包括数据的来源及质量、算法模型的有效性、系统构架以及对应的反制措施。

图1 百融反欺诈框架

在反欺诈系统中，能否形成全面的用户画像，进而对用户下一步的欺诈风险进行预测，多维度和深度的大数据是必不可少的条件。

随着互联网和移动互联网渠道的不断发展，从各类场景识别欺诈行为的重要性将日渐突显。百融拥有详尽且经过检验的预置规则集，对于不同的业务场景，可以基于测试样本的测试效果，选择适用规则进行使用，还可以通过对金融机构具体应用场景和客群的特征分析，开发客制化规则并检验效果，择优选用、部署，确保贷前反欺诈效果。

图2 不同场景下的欺诈方式

一般来说，反欺诈模型有两种，一是使用大量欺诈样本，应用规则引擎及统计分析技术，进行多维度多规则的组合，根据对欺诈识别和预测能力的贡献，每条规则被赋予相应的权重，命中相关规则的行为会得到累积的分值，即对单次信贷申请行为的欺诈度的综合量化结果，从而来预测欺诈的概率。

图3 反欺诈专家判断模型（规则引擎）

另一种是反欺诈机器学习模型，它指的是采用数据挖掘方法，基于历史（即已知的欺诈申请和正常申请）而建立的分类模型，通过机器训练利用海量数据来对借款人进行判断。

图4 反欺诈机器学习模型

机器学习主要有两种学习方式，监督学习和无监督学习。监督学习模型，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型，具有对未知数据进行推测和分类的能力，比如在已知“好”和“坏”标签的前提下，尝试从历史数据中，挖掘出欺诈团伙的典型特征和行为模式，从而遇到相似的行为时可以分辨是否是欺诈团伙。

监督模型虽然在预测准确性上有不错的表现，但是，实际情况中，“好”和“坏”的标签往往很难得到。因此，在没有额外信息的时候，就需要通过无监督学习模型进行分析。无监督式学习网络在学习时并不知道其分类结果是否正确，也没有告诉它何种学习是正确的)，仅提供输入范例，而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后，便可以将之应用到新的案例上。

在反欺诈规则引擎中，这些甄别欺诈行为的规则依赖于从大量历史案例中总结出来的“专家知识”，而机器学习模型采用更复杂的算法建立的模型，需要大量数据建立一个良好的训练集，以保证输出结果的准确。基于两类模型各自的优劣势，在应用其评分结果时，百融建议根据金融机构的实际情况，制定分阶段应用策略，并持续监控和改进模型。

图5 两种模型的应用策略

上文提到欺诈行为呈现团伙化特征，关系网络提供了全新的反欺诈分析角度，通过无监督学习算法，挖掘诈骗团伙的特征，从而识别诈骗团伙。

亚里士多德提出“人是社会性动物”，社会个体成员之间因为互动而形成的相对稳定的关系体系，关系网络关注的是人们之间的互动和联系，社会关系包括朋友关系、同学关系、生意伙伴关系、种族信仰关系等，经由这些社会关系，把从偶然相识的泛泛之交到紧密结合的家庭关系的各种人们或组织串连起来。

关系网络指的是一种基于图的数据结构，由节点和边组成，每个节点代表一个个体，每条边为个体与个体之间的关系。关系网络把不同的个体按照其关系连接在一起，从而提供了从“关系”的角度分析问题的能力，这就让我们可以从正常行为中识别出到异常的团伙欺诈行为。

图6 关系网络图

异常检测是在无监督模型学习中比较有代表性的方法，即在数据中找出具有异常性质的点或团体。在检测欺诈团体的情况下，异常检测被认为是比较有效果的。

比如一般情况下在关系网络中，正常的个体应该是与另一个节点组成一度关系，如果出现与其它众多节点关系密切，关系在二度以上，且网络中有多个节点具有欺诈嫌疑，则这个关系网络的团体可以看作是异常，其每个节点均有可能是欺诈团伙的参与者，发生借贷行为时，可以进行重点审查或直接拒绝。异常检测并不能够明确的给出一个团体是否欺诈，但是可以通过这种方法排查出可疑的团伙，从而进行调查。

综上所述，从金融机构的业务流程来看，风险是存在于信贷行为的整个生命周期的，百融通过用户画像、反欺诈识别、信用评估等手段建立贷前审核、贷中监控、贷后管理的信贷全生命周期风控体系，帮助金融机构降低潜在风险。

图7 全生命周期管理方案

实施过程

1、客群分析

在建立模型前，百融金服将根据信用卡中心的业务模式和客户群体特征，明确客群分类，以此来确定模型的种类，确保模型准确性的前提下避免重复工作。根据信用卡中心的客群分析研究结果，识别其风险特征，确定与其信用风险强相关的变量，与百融金服进行联合建模。

2、客制化建模

在建模的过程中，百融金服的专业人员该信用卡中心的业务人员共同对贷前反欺诈、信用评估、建模、贷中监控等环节进行深入研究和探讨，及时根据其信用卡中心的需求对模型进行调整。

欺诈检测方面，通过收集和整理各行业、机构的黑名单信息，通过多样化的机器学习模型及大数据关联分析等技术，给银行、个人等企业提供风险管控和反欺诈的服务。

风险评级方面，使用专业技术和工具，评估风险账户相关数据的客观性、准确度，量化其信用风险、履约等能力;在控制风险前提下，使个人能够实现安全汇款。

建模方面，根据该银行信用卡的业务特征以及百融在同业的实践经验，本项目将主要采用广义线性模型框架下的逻辑回归模型来实现。逻辑回归模型具有稳定性高、解释性强、部署简易的优点，使得其广泛的应用于风险评估、市场营销等诸多领域。评分将基于科学且严密的建模流程，同时建模过程中将充分吸收百融金服积累的专家经验与行业经验，形成最终的最适用于其信用卡中心的定制化评分。定制化评分将助力其信用卡中心提升信用风险评估的精准性，提升审批效率和审核通过率。

贷中监控方面，发掘与相关账户的信用相关的预警信息，形成预警信号并向相关风险管理系统主动推送，进而跟踪预警信号处置流程，直至形成最终结论或风险管控方案，形成一个风险预警、通知、处置和关闭的闭环处理流程。

3、查询接口

百融将根据该银行信用卡中心的需求，提供网页查询和专线接口查询两种方式。

1）接口查询方式

百融提供相应的接口程序，接口可支持不同业务系统开发不同接口查询功能，保证拓展性的基础上，可实现单笔查询和批量查询两种功能，满足该银行信用卡中心发起一次查询返回所有结果的需求。其中，单笔查询和批量查询都可满足实时返回查得结果需求。

2）网页查询方式

百融将为该银行信用卡中心提供网页查询方式，用户可通过网页输入相关信息进行查询，网页版是百融自主研发的风险罗盘系统，同样支持单笔和批量两种查询方式。其中，单笔查询和批量查询都可满足实时返回查得结果需求。

结果/效果总结

百融征信局评分在银行客群上具有优秀的风险区分度和稳定的排序能力，与银行申请评分交叉使用后可以更精准得区分出好坏客户。对于无央行征信报告的客户，百融仍能对75%以上的客户实现风险区分，经过百融评分，找回了原本认为坏的客户，拒绝了原本认为好的客户，在保持通过率基本不变的情况下，审批通过率提升了8%，实现不良率由1.54%下降至1.25%，降低银行约20%的损失。

企业介绍：

百融金融信息服务股份有限公司（简称“百融金服”）成立于2014年3月，是一家利用大数据、人工智能、风控云等先进技术手段，创新性地为信贷，保险，投资理财等金融行业客户提供全生命周期管理产品和服务的高科技公司。公司总部位于北京中关村，在上海、深圳、武汉等城市设有分支机构，服务覆盖全国。公司目前有近400位来自大型金融机构、知名互联网企业及国际咨询公司的精英加盟，并邀请到在大数据风控、互联网金融、保险等领域有深入研究和实操经验、并拥有丰富管理经验的资深顾问来共同推动公司发展。

截至目前，百融金服已为2000余家金融机构提供营销获客、风控以及贷后管理等产品和服务。凭借卓越的市场表现和巨大发展潜力，百融金服于2016年完成由中国国际金融股份有限公司领投的B+轮融资。目前百融金服的股东包括中国国际金融股份有限公司、华融资产管理有限公司、高瓴资本人民币基金、红杉资本人民币基金、浙报传媒、联动优势、IDG资本人民币基金等。

2014年百融金服成功获得由中国人民银行颁发的企业征信牌照，并于2016年获得公安部颁发的国家信息安全等级保护三级认证，标志着百融金服已经具备媲美大型银行的信息系统安全评级。

百融金服坚持社会良知和责任，坚持开放、互补的数据联盟战略，致力于运用新技术、新手段，为金融机构搭建营销与风控体系，立志成为国内金融领域最大的风控及营销服务提供商，并以传播诚信文化理念，开拓诚信生态环境为己任。百融金服也积极和业内企业探讨各种创新技术，利用人工智能，机器深度学习等技术不断提升服务效率，降低交易成本，促进普惠金融有序发展。

同时百融金服积极响应双高司法解释，网安法和监管机构要求，做好个人隐私信息的主动保护，公民个人信息的采集、整理、加工和对外提供必须确保合法合规，在完全在有授权的情况下与合作伙伴开展业务，并确保信息完全匿名化。由百融金服、百度金融、京东金融、51信用卡、通付盾、融之家、浅橙科技、算话征信等50余家金融机构组成的中国新金融领袖的社交与合作平台——新金融联盟发起“个人信息保护联合倡议”活动，以响应监管号召，推动行业稳健发展。

数据猿超声波

「2017金融科技商业价值探索高峰论坛」

（点击图片，了解详情）

相关阅读：

【案例】农业银行大数据平台项目——海量数据复杂运算处理

【案例】广发银行——呼叫中心语音大数据分析系统建设

【案例】国信证券——人工智能在量化投资中的应用

【案例】宜信——可信金融风控SMART-ITFIN大数据支撑应用

【案例】恒丰银行——基于大数据的客户关系管理系统

【案例】恒丰银行——基于大数据的财富管理平台

来源：数据猿