Rho,Python中文社区专栏作者,现居深圳。知乎专栏地址:https://zhuanlan.zhihu.com/BecomingaDataScientist注册会计师带你用Python进行探索性风险分析(一)
多维变量分析
首先对时间数据类型进行转换
二季度4月份贷款最低,而5月和6月的贷款金额基本持平。由于本数据集只包含2017Q2的数据,如果数据集能包括横跨几年业务数据,可以将数据按年按月做横向和纵向对比,更能反映公司业务的发展情况。初步看来,Leding Club 平台在2017Q2业务持续增长。
得知Lending Club 的总部在加州,因此加州的市场开拓也相对其他较好。其次是德克萨斯州和纽约州。
同时,从风险防范角度来看,应重点审核这几个城市贷款申请人的基本信息。
从表格可以看出,P2P平台的利率最高档为30%,而利率最低档为7%左右,总体利率水平也相对传统银行较高。 信用评级从A到G,A的的借款人信用评分最高,财务状况较好,违约发生的可能性较低,因此利率也相对较低。
贷款期限长意味着不确定性增加,风险也随之增加,期限较长的贷款在同信用等级下的借款利率也相对高。
贷款用途分别为house、small_business以及Other的贷款利率较高。其中贷款用途为house的贷款利率为最高。
图的中间是贷款金额和利率的线性关系图,图的上方和右方分别是贷款金额和利率的分布图。我们从图中并没有发现贷款金额和贷款利率有明显的关系。
违约次数越多的人意味着自身财务状况较差,偿付能力也较低,因此此类客户贷款风险越高,对此部分资产应给予更高的利率定价。
数据可视化
从图可以看出,工作年限越长,客户的收入也越高,自身现金流比较充足,此类客户偿还债务的能力较强,违约的情况较少,相应享受更低的利率。
总结
1.影响风险的因素
分析企业偿债能力主要考察企业的资产状况和经营情况,只有负债结构与企业盈利能力合理匹配,企业才能持续稳定地发展。
个人的资产状况好比企业的资产负债表,个人收入犹如企业的利润表或现金流量表。高收入的客户意味着有良好的现金流,偿还债务能力较高,违约的可能性较低,一般来说此类客户的信用评级也相对较高,平台对应的贷款资产风险也相对较低;个人过往的信用记录能够反映客户的偿还意愿,长期有不良信用记录的客户再次发生违约的可能性也较高,为对违约风险,对此类客户应匹配更高的利率定价。
2.Lending Club 平台特点
平台业务持续稳定发展:第二季度业务持续增长,平台业务主要集中于加州、德克萨斯州和纽约州。
平台贷款金额以 小额贷款为主,贷款金额主要集中在10,000美元左右,小而散的贷款金额能够很好的分散资金风险。
平台贷款利率较高,贷款利率集中在12.62%,贷款利率相对传统金融机构较高。
平台二季度违约风险得到良好的控制,平台贷款发生违约的数量较少,贷款正常状态占比为98.38%。
3.个人建议
注册会计师带你用Python进行探索性风险分析(一)
最近热门文章:
一键获取免费真实的匿名代理
Python告诉我巴黎的地铁线路有多不靠谱!
用 Python分析胡歌的《猎场》到底值不值得看?
用Python预测比特币价格
Python分析《羞羞的铁拳》电影观众评论
如何快速爬取B站全站视频信息
长按扫描关注Python中文社区,
获取更多技术干货!
Python 中 文 社 区
Python中文开发者的精神家园
合作、投稿请联系微信:
pythonpost
— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS