一名央行官员的反思：征信不是超级警察

新金融琅琊榜 · 公众号 · 互联网金融 · 2020-01-14 07:49

正文

新金融2019：换了人间

反思银行业金融科技战略

阿里联姻工行：继往开来与石破天惊

信用数据的加工，不管是原始的征信报告，还是信用评分，还是别的各种创新产品，都要停留在个人金融信用领域，不应过界，不要把个人征信这个事儿搞得像是非要算出来谁是好人一样，没有人有这个权利。

本文首发于财新网，作者穆长春，系 央行数字货币研究所所长、支付司副司长

“你答应了我上个周五晚上请我吃饭，可你没请，你言而无信！ ”“你当初追我的时候答应过不抽烟，可你不守信用！ ” 又如一个人开车闯了红灯，不遵守交通规则，被开了罚单。这算不算失信？类似这种数据能不能当作信用数据或征信数据？

近日，中共中央、国务院发布支持民营企业的28条意见，其中明确提出“要进一步规范失信联合惩戒对象纳入标准和程序，建立完善信用修复机制和异议制度，规范信用核查和联合惩戒”。中央文件发出了纠偏的信号，意味着目前无限制扩大化的失信联合惩戒措施将受到规制。

百行征信成立时，人民银行领导取这个名字之意，来自于周敦颐《通书》：”诚，五常之本，百行之源也。”那么这个诚或者征信到底是什么意思？

要回答这个问题，先来看什么是征信，国际金融公司给过一个定义，Credit reporting systems are essential to creating sound financial infrastructures that facilitate lending and help expand access to credit to a significant share of individuals，microfinance， and small and medium enterprises. Also， they help satisfy lenders'need for accurate， credible information that reduces the risk of lending and the cost of loan losses。（征信报告对于建立健全的金融基础设施是至关重要的，这些基础设施能够促进贷款，并扩大很大一部分个人和小微企业获得信贷的渠道。它们也有助于满足贷款人对准确、可信信息的需求，从而降低贷款风险和贷款损失成本。）

中国人民银行征信中心对征信给出的定义，是指对企业、事业单位等组织的信用信息和个人的信用信息进行采集、整理、保存、加工，并向信息使用者提供的活动。而这里说的信用信息，特指在交易的一方承诺未来偿还的前提下，另一方为其提供商品或服务的行为，是随着商品流转与货币流转相分离，商品运动与货币运动时空分离而产生的。

可见，征信最重要的目的是落在经济层面上，是用于预测一个人在非即付并无抵押的经济活动中是否守约。需要强调的是，征信系统也是金融基础设施的一部分，是一个公共产品，有很强的外部性，直接影响社会大众的隐私保护、信贷公平性等公共利益，应该本着“最少、必要”的原则进行信息采集、保存和加工，这样才符合公共产品的要求。

通俗的说，个人信用数据基本上指的就是借债还钱的数据，而征信就是减少有人借钱不还的风险，同时也帮助有还钱习惯的人顺利地借钱。

反过来说，征信不是超级警察，不能管大家的私生活，也不是为了评选社会道德楷模。信用数据的加工，不管是原始的征信报告，还是信用评分，还是别的各种创新产品，都要停留在个人金融信用领域，不应过界，不要把个人征信这个事儿搞得像是非要算出来谁是好人一样，没有人有这个权利。

大数据的推导结果是相关关系，并非因果关系

什么是大数据（big data）？大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据就是巨量数据集合，包括结构化、半结构化和非结构化数据。其中，非结构化数据越来越成为数据的主要部分。因此，大数据无法用单机进行处理，必须依托云计算进行分布式处理。

大数据分析是将实时数据流分析和历史相关数据相结合，然后分析并发现其中隐藏的模式、相关性、趋势、偏好等等，并建立所需的数学模型，就是找规律，并运用从过去数据中得到的规律，来预测未来。需要注意的是，大数据分析模型显示的是数据相关关系，并不是因果关系。

这两者有何区别，举例而言：有人收集了一年内冰激淋销量与溺水死亡人数的大量数据，发现冰激淋销量高的月份里，溺水死亡的人数就多；冰激淋卖的不好的月份里，溺水死亡的人就少。这能不能得出结论：为了减少溺水的人数，这些月份里不要卖冰激淋了？大家都知道：绝对不行！这是因为，冰激淋销量和溺水死亡人数的关系，只是相关关系，并不是因果关系！

那么大数据分析到底能不能应用在征信上？是李逵还是李鬼？根据前述，“个人信用数据基本上是指借债还钱的数据”，从性质上来说，征信数据必须是与合同、契约有关的因果关系数据。

如果在征信模型中应用大数据分析，需要把一个人方方面面的信息都收集起来，包括本人信息、生活习惯、社交关系等等，大而全、细而精，恨不得无孔不入、挖祖宗三代，然后对大量的相关数据进行分析，来找到做信贷决策的模型。

但需要强调的是，这是相关关系，不是因果关系；以大数据分析建立的征信模型并不符合金融基础设施的信息收集原则！而且这些非金融信息的行为数据既不能用于分析一个人的还款意愿、也不能用于判断借款人的偿还能力。

再比如，一个人闯了红灯，不遵守交通规则，这个数据算不算信用数据？如前所述，征信数据用于预测一个人在非即付并无抵押的经济活动中是否守约。由于这个闯红灯的人之前并没有向任何人承诺遵守交通规则，并不能算失信；同时，这个行为数据与经济活动无关。所以，开车闯红灯可以开罚单扣分，走路闯红灯可以罚款，帮助协警管理交通，但这种数据不能用于征信！

又有人说，“通过我们对各种大数据的研究，我们发现，很多看起来与信用没关系的事件之间，是存在着关联的。”按他这个逻辑，这不是征信数据，属于大数据。

假如根据大数据分析，有可能发现爱闯红灯的人，还款的信用表现确实不怎么样，但这只能证明两者的相关关系，而不是因果关系。因为如果在这个爱闯红灯的人每天必经路口全修上立交桥，他再也不用闯红灯了，那么，他的信用分或者信用表现就会因此提高。而如果银行据此进行信贷决策，贷款就可能会打水漂。正像冰淇淋和溺水死亡率的例子一样，就算其中存在强相关性，也不能拿闯红灯的数据去判断一个人的信用，更不能用于征信。

同样，如果一个人开车闯红灯或超速，吃了罚单，交通局再三催促也不交罚款，甚至这一记录被移交给催债公司。这个数据算不算信用记录？大多数人觉得这个算，比如美国征信局就收集这个数据。但准确地说，美国征信局曾经收集过这些闯红灯的数据，那些不交罚款的司机的信用评分会下降。但是2016 年 6 月，美国三大征信局和 31 个州的检察长们达成庭外和解，个人征信机构不得收集任何与合同或协议无关的付款信息，包括罚款、罚单等数据。因为征信机构在收集这些闯红灯的行为数据时，数据质量可能存在问题，比如拍照机器误读、数据不准、缺乏证据等，这违反了消费者保护法中关于行业欺骗和不公平操作的有关条款，将面临整顿和600万美元的罚款。而且，前述和解协议的效力是可以回溯的，就是说征信机构之前收集的那些记录都将删除。

这个和解协议对征信业的影响是深远的。对于征信机构来说，权力受到约束，而消费者的征信权益则受到了保护。

再举个例子，超级网购的大买家和“信用好”这两者是否存在相关性，这还需要数据验证。但可以确定的是，这两者之间根本谈不上因果关系。这不仅不符合征信原则，还对无网购行为的消费者和其他网购平台的消费者造成了歧视。如果仅仅因为闯红灯或者没有网购被剥夺借贷权利，就如同要降低溺水死亡率而禁止销售冰淇淋一样可笑，老百姓的征信权益因此受到侵害。

所以说，大数据分析用于征信是有边界的，因为要保护消费者权益，反对不公平竞争。

信用评分怎么来的？

一个人在征信机构里的数据是很多的，信用报告内容很丰富，包含了这个人在过去几年的信用记录，审贷人员从头到尾看一遍要花不少时间，如果两个审贷人员去看同一个申请人的信用记录，就算他们是双胞胎，也很有可能会由于个人的经验和主观判断不同而得出不一样的决定。

所以，单纯用信用报告来做决定，既不能达到审批标准的一致性，也无法提高效率，毕竟个人信用产品的申请人数目特别大，信贷审核成本也会无法承受。于是，信用评分闪亮登场！

信用评分，指的是征信机构在收集了数据以后，通过对信用记录数据的清洗、加工和分析，输入到数学模型里得到的一个非常直观的分数。根据传统习惯，分数越高越好，高分表示信用风险低。分数的范围是可以事先界定的，萝卜青菜，各有所爱，有人喜欢百分制，有人喜欢 300-900 这个范围。

信用评分模型是怎么得来的？首先，巧妇难为无米之炊，做饭需要原材料。开发数学模型的原材料，就是信用数据。

一个人的信用数据有很多项，比如：这个人有几张信用卡、信用卡的最早开卡日期等很多“变量”。在开发数学模型的时候，不仅仅会用收集来的变量，还会根据已有数据再加工出来一些变量，比如：最早的信用卡开卡日期距今天的天数等。至少涉及上千个变量。

接下来，数学家们要决定需要开发多少个数学模型。举个例子，信用污点严重的、轻微的和没有信用污点的就需要分开建模；信用历史比较长、刚有信用记录的菜鸟，也需要分开建模。

确定好建模型对象和建模数量之后，数学家要确定模型变量和参数，他们不会把所有的变量都放进模型，并不是因为算不过来，而是因为变量之间的关系比较复杂，有的变量之间互相干扰；也有的变量需要进一步考察再决定，比如，如果一个人的信用记录在一段时间内被查询了很多次，说明这个人可能最近很缺钱，是比较负面的信息，会带来信用评分的下降；但是在进一步考察后，应剔除来自招聘单位的查询，因为招聘单位查个人信用的目的并不是要给他贷款。

此外，有些变量值需要做组合，比如上个月实际还款金额占应还款金额的百分比，就需要分成从 0 到 100%之间好几档，而不是直接用百分比。这种组合分档是为了让使模型更加稳健，不至于因为一点小变化带来分数的大幅度变动。最终进入到一个模型里的变量在 10-20 个之间。

建好一个数学模型，把各种参数和模型使用的条件都输入到电脑系统里，就像做了一个“月光宝盒”。根据个人情况选定适用模型，算出来一个分数。金融机构根据分数的高低来决定是不是贷款，收多少利息，贷款多长期限等。

究竟哪些因素是信用评分模型中最重要的，是不是网购时多买点东西就能改变我们的信用评分呢？再举个例子，根据公开信息，著名的 FICO 评分是这样算的：35%的信息来源是个人还款记录，30%是欠款金额，15%是信用历史长度，10%是信用产品类型，10%是近期内开始使用的信用产品。

怎么来理解FICO 评分中信息来源的构成？对信用评分的正确解读是：对那些与贷款申请人有类似信贷行为表现的人，根据按时还款比例的高低，类推该申请人将来按时还款的可能性高低。

请注意，信用评分高的张三不一定会按时还钱；而信用评分低的李四也不一定就一定不会按时还钱。只能说，信用分高的张三，将来按时还钱的可能性高，信用分低的李四，将来按时还钱的可能性低。于是，银行就设个分数线，低于这个分数线的人都不给贷款。同理，银行的行长也不一定信用分就高，因为信用分从来就不是近水楼台先得月的事。

所以信用分是个历史表现的标尺，相对稳定，不会大起大落。所谓“青山易改，本性难移”，要提高自己的信用分，要靠多年的表现好换来的。如果说一个征信公司的信用分，可以靠在一个购物平台血拼一个月暴涨，这不叫信用分，这是网购积分。

一名央行官员的反思：征信不是超级警察

正文

请到「今天看啥」查看全文