近年来,金融欺诈犯罪凸显非接触性和隐蔽性的特征,犯罪分子作案更趋向专业化、智能化、集团化,使得很多银行、网贷等金融平台与用户的财产安全受到了严重侵害。
据了解,大中小型商业银行、支付机构在反欺诈工作成效上存在较大差异,大型金融机构体系相对完善,中小型机构仍处于起步阶段。为应对不断翻新的金融欺诈手段,金融类机构必须考虑主动投资反欺诈的技术手段、防控工具和策略,综合利用行内外各类基础数据,构建智能数据库和风控模型,提升欺诈交易识别率,有效减少欺诈带来的风险损失和资本损失。
在这里,主要跟大家分享一下以怎样的开发流程才能搭建一个有效、有用、有价值的反欺诈模型,希望有所启发。
从国内各机构建立反欺诈模型的具体过程可以看出,模型建立流程包含数据采集、数据预处理、风险特征挖掘、模型迭代、模型测试五个环节,如下图所示:
在数据采集阶段,调研机构不仅整合了内部数据(客户个人数据信息、账户聚合数据信息、交易数据及相关的各类交易日志等),而且集成了诸多外部数据。外部数据来自人民银行、法院、公安部、检察院、工商总局、环保总局、海关总署等多家机构,包含刑事犯罪信息、商业犯罪信息、金融诈骗涉案账户信息、网络犯罪信息、单位违法账户信息,以及由来自国内外同业等提供的各类欺诈信息。
由于数据来源广泛,直接导致数据种类和规模急剧增加。各调研机构在数据处理技术方面除了采用成熟的商用数据库外,还广泛应用大数据分析技术。
模型构建流程
在数据预处理阶段,主要对数据进行结构化处理,包括检测数据质量、统一格式、剔除无关数据、数据标准转换、数据关联等。以银行为例,采集到的交易数据涵盖了网上银行、手机银行、电话银行、短信银行、ATM、POS、智能终端等各个渠道,数据涉及存折、借记卡、准贷记卡、贷记卡等介质。预处理操作分析渠道、介质等关联关系,并将这些数据按照时间、金额、交易类别、交易状况等维度进行聚类,分析交易行为的主要特征。
对于客户数据,需跨越不同渠道归集客户相关属性,如年龄、账龄、教育程度、地域等要素,建立客户画像档案,描述客户特征。对于商户数据,应根据商户信用评级信息、产品销售量、商户类别等要素,建立商户档案,划分商户风险等级。
在风险特征挖掘阶段,常用的分析方法有假设分析、关联分析、模式归纳分析等。假设分析的目的是对问题提出各种可能的假设,并评估假设的分析过程;关联分析的目的是找出各信息片段之间的直接或间接联系,或者已知一个信息片段,找到与之直接或间接联系的另一信息片段;模式归纳分析的主要目的是归纳欺诈的各种规律特点。
在对交易、客户、商户、设备、地理位置等数据进行深入分析之后,以时间、频率、金额、距离、比例等统计口径,构建风险特征库,如近30分钟交易总金额、近1小时同一设备登录次数等。通过具体的分析方法,运用大数据处理技术,可以计算出每个风险特征对欺诈识别的贡献能力,以及风险特征之间的相关性,再选取贡献能力强、相关性弱的风险特征,作为后续模型的预测变量。
模型需要不断迭代优化,才能贴近真实情况。在模型迭代阶段,模型迭代样本是由正常交易数据与欺诈交易数据组成的。通过不断优化模型,训练模型各项指标(包括准确率、对数损失函数、精确率-召回率、混淆矩阵等),达到理想的预测效果。
对模型进行线上测试,评价模型适用的场景、精度、误差等各项指标(如图)。
分析知识拓扑表
风控领域,大数据等一些先进技术的应用场景和方向在哪里?
风险的关键只在于“是否有效”,而如何实现“有效风控”,除了时机选择、制度安排及辅助等要素之外,更多的内因还取决于其背后所驱动及支撑的逻辑。
对于金融业而言,风险是与生俱来的。客观上讲,信贷经营的本质,就是经营风险。既然如此,我们就应当用经营的方式去把握和控制风险,而不是试图利用主观意识、过去的经验以及千篇一律的风控技术去应付或被动承受风险。
事实上,风控技术无关强弱,谁也不能说谁比谁更厉害,关键只在于“是否有效”。而如何实现“有效风控”,除了时机选择、制度安排及辅助等要素之外,更多的内因还取决于其背后所驱动及支撑的逻辑。
近年来,随着银行、保险等大型金融机构逐渐将视线转向小微信贷领域,小贷公司、P2P、消费金融公司、电商平台等身体力行“普惠金融”,越来越多的小微贷客户看到了融资路上的些许曙光。
然而,不同于其他信贷客户类型,小微贷客户对于资金的需求往往“短、小、频、急”,又因为其财务信息不透明、不健全、生存能力薄弱等特点,导致小微贷款提供者不可避免的面临着成本高、不良率高、风控水平要求高等“三高”局面。
事实上,最初的小微贷风控技术依旧是沿用了传统的信贷技术,典型特征即为“抵押物”模式,然而,该模式并不适用小微贷客群的特点,在实际应用领域犹如“大象起舞”般笨拙。
“这种模式在技术上肯定是有效的,只不过不能满足众多小微企业的需求,实际上是‘惠而不普’,虽然利率不高但惠及面比较窄,经常要求客户提供诸多资料、报表之类,效率也比较低。”柳博说。
2005年,德国IPC 微贷技术被引入到中国,该技术由德国国际项目咨询公司研发而成,这是一家专门为以微小企业贷款业务为主的银行提供一体化咨询服务的公司。以IPC技术为核心的微小贷款项目在十多个国家和地区运作下来,其平均不良率低于3%。
据了解,从2005年开始,德国IPC通过国家开发银行微小企业贷款项目,成功和国内12家银行合作。
德国IPC技术的信贷流程包括市场营销、贷款申请、信贷分析、信贷审批、贷款发放、贷款回收等,其核心是评估客户还款能力,同时,该技术一般要求小贷业务以独立的事业部方式运作,总行设小贷中心,分行设区域经理。
IPC 微贷技术在一定历史时期取得了巨大的成功。另外,与德国IPC技术类似的还包括法国沛丰的小贷技术,印尼人民银行小贷技术等。
“我们统称为‘信贷员技术’,对人的技能要求较高,靠信贷员的经验去做判断,但是,信贷员对于这套技术模型真正运用娴熟需要一年以上时间,是一套比较占用人力成本和需要时间传承的技术。且信贷流程需要信贷员全程参与,也使得放贷的道德风险加剧。”柳博说。
实际上,这套技术更加适合小型金融机构或区域性金融机构,比如村镇银行、城商行、小贷公司等,而随着小微贷款面临大规模扩张,IPC技术就显得心有余而力不足,随着科技金融技术的发展,新型审核授信技术的出现迫在眉睫。
以此推论,其背后的逻辑是什么?又该当如何实施呢?两个要点:即风险警示和风险管理。前者“取势定位”,决定你该不该做,后者“亡羊补牢”,保障你该怎么做。两者相辅相成,另外再加上个制度加以约束,并保持绝对执行。
目前在国内,包括BAT,都没有一个完善的模型开发标准流程。
一个完整的开发模型流程,需要满足以下要素:
这些东西,其实在国内还不规范。
另一个是,在风控领域,大数据等一些先进技术的应用场景和方向在哪里。
首先,要能做到自动化,尽量减少人工的干预,减少主管臆断。
其次,通过大数据能实现“差异化”,做到客制化产品设计,客户画像补全,客户需求的深度挖掘。
再次,就是做到精准度,这些需要模型驱动,包括交易成本评估、差异化定价、反欺诈等。
最后,是创新性的评估。比如,现在行业最大的一个瓶颈,是底层数据不能共享,如何实现数据安全的共享。
现在营销有两种方式:一个是覆盖式营销,主要是借助电视、广播、报纸德国传统媒介,他的优势是覆盖面广,单成本非常高,但营销效果,比如我们把转化率做为评估,它是非常难以量化评估。
另一个是精准营销,你的触达方式,是电销、运营商的网运营商的网络或者是社交网络传播,他可以根据人群的特点需求,做一个定制化的投放,定制化的投放最大好处,他可以做到极致化,可能是千人千面这么一个营销方式,那么每个人需求是不一样,他的消费能力能力是不一样,而且他最大的优势,他的效果可以做量化的。
欺诈分为三种:
第一方欺诈,是客户本人是欺诈的实施者,他进行消费的时候没有还款欲望,提供虚假的信息;或者刻意提高自己的信用体系,不断地提高信用额度,当自己的信用额度达到一定程度以后,就忽然爆发。
第二方欺诈,是非常不常见的,它犯罪主体是受害人的亲戚或者公司的雇员,通常被当作第三方欺诈处理。
第三方欺诈,客户是受害人,不主动实施欺诈,欺诈方式包括身份盗用或账号盗用。
第一方欺诈分为几类:
一是深度欺诈,用自己的身份申请贷款,但没有偿还意愿。
二是first payment default,这在现金贷首轮是非常普遍的,比如,第一天首轮客户达到30%,第二天可能降到20%,这批客户有好利润,但欺诈的频率是非常高的。
三是余额欺诈(bust-out)。
国内平台都有自己的提额策略,一个增长性的收信方式,一种方式是客户主动提出申请;另一种是平台通过判断策略判断用户是否达到提额的要求,做一个被动提额。只要存在提额的空间,就可以给欺诈份子一个动机。
现金贷用户经常会遇到,有些用户会借了还,但不是在还款到期时还,可能借了三四天之后就还了。这里面有一部分人,就是在测试,他们通过不停的提前还款、按时还款,把额度在很短时间内刷到他认为比较高的阶段,他可能一次把钱取出来,就消失了。
第四种是空头支票,这在国外比较常见,但在国内,大家不接受支票付款的,所以这种欺诈方式还未出现。
国内,风控还处在校验阶段,通过身份验证、识别,在前端防范欺诈。比如你要求用户提供银行卡流水,三要素、六要素验证,甚至是眨眼等活体验证,这都是有可能被攻破的。所以通过交验的方式,是目前国内是比较普遍使用的方式。
在无意偿还的这一块,有效的方式就是黑名单,进一步做风险信用评级,用户画像。但针对还款意愿的判断是非常难的。
余额欺诈,会频繁的申请额度提升,最有效的是建立恶意提额识别模型,设置恶意提额识别策略,在实施大额提现时,平台能拦截异常交易。
另外可以结合其他维度进行监控,社交网络、网上浏览数据、其他行为数据等。
第三方申请欺诈,有账户盗用、资料造假,恶意违约;交易欺诈,包括账户冒用、养卡、套现。他们的防控难度和危害程度,都比较急迫。
具体要如何防范呢?
1 最常用的方法是建立“漫网”体系识别,通过多元数据交叉比对,搭建模型建立精准的客户画像。
“漫网”体系识别是我们内部提出来的一个概念,是通过机器分析社交网络额度一个方式,通过地址关联,设备关联等建立网络图谱,当建立起来全网关联后,你看到的不是欺诈的个体,而是一个消费群落,可以快速定位欺诈团伙行为。
2 多种数据来源的交叉对比,包括地址、移动设备行为等各种用户信息进行交叉对比,产生置信度。
3 模型的方式,建立精准的客户画像,这被认为是最有效的,通过身份特质、购物历史、交易特征,构建千人千面的模型,可以根据交易进行画像对比,符合就通过。
客户画像模型构建分为三个部分:
第一,用户档案,与传统风险模型不同,为每一个客户建立一套专有的行为档案。
第二,数据光滑,当客户自身的历史行为不足以支撑是,需要用行为近似的数据进行补充。
第三,时间衰减,对于我们服务的年轻客群,变化非常快,需要及时更新行为档案。
文章来源:
一本财经学院
/网络
往期
精彩
回顾