专栏名称: 大数据风控联盟
传递大数据风控前沿讯息;聚合顶尖信贷行业精英;分享云风控实操案例 。
目录
相关文章推荐
软件定义世界(SDX)  ·  最全数据资产管理知识地图 ·  4 天前  
软件定义世界(SDX)  ·  文字实录 | 国家数据局举行专题新闻发布会 ... ·  2 天前  
大数据文摘  ·  强化学习之父 Rich Sutton ... ·  5 天前  
天池大数据科研平台  ·  附获奖名单|巅峰时刻,「第6届天池全球数据库 ... ·  3 天前  
51好读  ›  专栏  ›  大数据风控联盟

浅谈风控领域中的用户画像

大数据风控联盟  · 公众号  · 大数据  · 2017-03-26 13:19

正文


用户画像(User Profile)一词在近几年瞬间火了起来,由互联网领头的各行各业开始不断的尝试构建用户画像来提供自身的业务能力,那究竟什么才是用户画像,为什么要构建用户画像呢?


用户画像介绍


用户画像最初是希望产品设计工作者在定性目标用户时,不再像之前那样想当然地猜测假想用户的需求,取而代之的是使用用户画像来侧写目标用户,从而将设计聚焦在真正用户的动机和行为上。


用户画像最早被互联网应用于电商中,在定性目标用户时,企业数据分析人员会将用户数据进行分析,并形成合适的用户画像,常见的会包括有姓名,性别,年龄,收货地址,手机号,银行卡,身份证号,邮箱等基础属性,和浏览分类,点击偏好,购买习惯,登录设备类型等特殊属性。然后通过分析此类信息,以方便后续分析了解目标用户的需求,如男性/女性用户更倾向于哪类商品,又如90后客户更偏爱购买哪类商品,不同地域热销商品的排行等。


可以看到,用户画像可以将用户人群进行分类,最终目的是为用户打上各类标签,如为用户打上诸如健身用户、化妆品受众等标签,之后市场人员可以对各类标签用户提供精准营销。




为什么要构建用户画像


文本分享的是风控方向的用户画像,其和电商侧的会有所不同,电商中构建用户画像是为了更好的进行精准营销,提升营业额,转化率。而在风控领域中构建用户画像的目的是:


1. 系统的梳理用户群体,尽可能的找到异同点并将用户分类,分类是多维度的,可以是购买偏好,也可以是薅羊毛党,应该从各个角度去侧写用户

2. 便于更深刻的理解业务,理解用户需求,风控离不开具体业务,只有深刻理解业务后,才可以拆解出可能的潜在风险

3. 便于后期的数据挖掘,了解恶意用户的行为特征,可以更具用户特征做关联规则分析

4. 便于对不同类型的用户,采用针对性的风控规则。单纯去侧写用户画像是没有意义的,当构建了用户画像后,需要结合实际的风控规则,来管控用户请求事件。


如何构建用户画像


在了解了构建用户画像的目的后,接下来一起了解如何构建用户画像,在风控领域中,一次完整的用户画像构建过程为:




收集数据


在现今互联网的高速发展中,无论是促销活动,市场推广,还是网上信贷,都离不开数据,庞大且完整的数据可以提供更多维度的支持。一般来说,需要收集的数据包括但不限于以下几种:


1. 账户数据如账户名、手机号、银行卡号、姓名、年龄、性别、身份证、地址等,这类信息主要提供了用户的基础属性

2. 业务数据,主要收集业务场景下的数据,贷款业务有贷款维度的属性,优惠券兑换有优惠券的信息,在对这部分事件做风控时,业务数据是核心关键数据

3. 设备信息,在风控过程中,还需要对用户的常用设备指纹,环境信息进行收集

4. 用户轨迹,主要包括用户的访问顺序,操作频率,按键信息等


收据的数据信息需要通过业务埋点来将用户侧的信息发送到服务风控侧,而后进入数据清洗工作。


数据清洗


顾名思义,将收集的数据进行数据清洗,转变为需要关注的数据集。在本文最初提到了电商中的用户画像,但风控领域的会有所不同,一般将用户画像分为两类:基础属性和风控属性。


基础属性包括姓名,性别,年龄,收入,工作,技能,喜好,收货地址,职业,教育水平,银行卡号,身份证号等属性,一般是用来侧写用户状态的,此类属性一般每个用户都会具有且更新不频繁,作为用户基础属性,存在画像中。


相较于基础属性,风控属性具有更强针对性,是针对于不同风控维度属性的聚合,常见的包括有购买偏好,社交网络,行为特征,风险偏好等,另外风控属性又具有极强的业务性,在不同的业务点中,建立的风控属性有的时候又会有所偏差。


如有的时候在风控过程中,我们需要了解用户本次登录是否异常,从用户画像的角度,我们需要构建出用户的常用IP是哪,是否属于异地登录,还需要构建出用户的常用登录平台,设备是什么?是时常WEB登录的,还是时常手机端登录,是iphone6的用户群,还是小米等。只有拥有了这些画像,才能更好的进行风控规则。


 数据建模


本文不再在建模分析中深入展开,主要聊一下建模分析过程中的一些问题。在风险建模中,很多时候数据源是庞大的,我们需要用到大数据的分析手段,另外在建模构建用户画像的过程中,数据精准是非常重要的,坏样本的定义和范围是需要严格定义的,这对后期通过规则做查准查全率会有极大影响。所以用户画像的验证阶段需要对通过分析打上标签的结果数据进行验证,对于有事实依据的(真实坏样本)和无事实依据的(疑似恶意样本)需要有一整套完成的验证机制。


构建画像


到这一步我们需要开始构建用户画像,将一个唯一标志性KEY(一般为用户ID)作为“用户”标识,来对其打上各类标签。这边列举下风控领域的用户画像标签:如是否曾经被盗、常用设备、常用地、消费偏好、所属企业画像、是否有危险伙伴往来、手机画像、IP画像、社工账号等。在上述标签中,不难发现像手机画像,IP画像可能并不是直接从数据收集中获取,这类信息很多时候我们是通过另外的技术手段进行的收集工作,如手机是否为猫池号,是否为小号空号,如IP是否为VPN、代理、是否属于爬虫等。




如何使用用户画像


如前文所说,用户画像最终会给不同的用户群体打上各类标签,最终每个用户可能会各自不同的属性和多个标签,这些数据充分地从各个维度刻画出当前用户的方方面面,也使相关分析人员可以第一时间了解到想要关注的人群。


用户画像是需要结合风控规则一起使用的,在实际风控过程中,当用户发起一些事件请求如领取优惠券,购买理财产品时,风控系统可以结合事件的风控规则,通过数据服务的筛选,与用户画像的比对给出最终的风控响应。一个成熟的风控产品是可以快速甄别符合同样风险属性的恶意用户再次发起事件请求的。

 

本文属原创文章,未经许可禁止转载


RoarTalk
微信:roartalk

分享最新的安全资讯
长按二维码关注