专栏名称: 机器学习研究会

机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织，旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外，协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。

【学习】决策树之玩转借贷俱乐部

机器学习研究会 · 公众号 · AI · 2017-04-20 23:17

正文

点击上方“机器学习研究会”可以订阅哦

摘要

转自：王的机器

在线性回归之玩转金郡和对率分类之玩转美亚中，斯蒂文帮助老板建的房价预测模型和婴儿产品推荐模型让老板很满意。最近老板接到借贷俱乐部 (lending club) 的一个项目，就是根据借款者的信息来判断这笔贷款是否有风险。

老板给了斯蒂文一份 csv 数据里面记录着 122,000 多条数据 (每条数据有 68 个特征)，下图选了几条不完整的信息展示：

上图记录着一些重要特征如 loan_amount, term, int_rate 和 grade，分别指是贷款本金、年限、利率和评级。

经过一周的努力，斯蒂文用下面的方法一步步探索了借贷俱乐部的数据

首先预处理数据
再用 sklearn 自带树模型
然后自己编写决策树模型
最后修剪树而防止过拟合

进入王的机器公众号，在对话框回复 ML14 可下载代码 (ipython notebook 格式) 和数据 (csv格式)

第一章 - 数据预处理

1.1 引用包

1.2 研究数据

1.3 处理数据

第二章 - 决策树 (sklearn)

第三章 - 决策树 (MM)

3.1 子函数

3.2 构建决策树

3.3 可视化决策树

第三章 - 决策树 (pruning)

3.1 子函数

3.2 构建决策树

3.3 探索决策树

下面斯蒂文用 ipython notebook 带你们玩转借贷俱乐部。

原文链接：

http://mp.weixin.qq.com/s/NluKadt3gj5V2xBQUoSTxA

“完整内容”请点击【阅读原文】

↓↓↓

推荐文章

宝玉xp · 回复@oO支离破碎Oo:编程用Cursor、Windsurf、G-20241214230844

4 天前

爱可可-爱生活 · 【ErikKaum runner：一个实验性的Python代码执-20241214160800

4 天前

黄建同学 · 一本在线的免费机器学习电子书↓ 适合深入了解机器学习的原理。#a-20241212220430

6 天前

爱可可-爱生活 · 【PLAID：蛋白质设计辅助工具，通过人工智能技术辅助蛋白质结构-20241212134109

6 天前

爱可可-爱生活 · 【ComfyUI-OmniGen：集成了 OmniGen 模型的-20241212134543

6 天前

治愈系心理学 · 老公夜夜都想吻我这里，真相竟然是这个！

7 年前

19楼 · 还有这种操作？横店2日游，全家带娃出游竟然不花钱！

7 年前

北京得谦书院 · 【公益学习】北京7月1~5日《太上感应篇》研习班

7 年前

创业家 · 马化腾：让产品自己召唤人

7 年前

科Way · “索菲娅”启示录：当AI遇见机器人……

7 年前