专栏名称: 老齐Py
Data Science
目录
相关文章推荐
沪考一点通  ·  华二6人!2025信奥上海队名单公示! ·  昨天  
姑苏晚报  ·  官方点名通报 ·  昨天  
姑苏晚报  ·  官方点名通报 ·  昨天  
雪漠禅坛  ·  如何看待道德理想主义? ·  2 天前  
雪漠禅坛  ·  如何看待道德理想主义? ·  2 天前  
51好读  ›  专栏  ›  老齐Py

【译】写给初学者的LASSO回归

老齐Py  · 掘金  ·  · 2020-03-20 02:51

正文

阅读 9

【译】写给初学者的LASSO回归

作者:Benjamin Obi Tayo Ph.D.

翻译:老齐

与本文相关的图书:《数据准备和特征工程》


LASSO回归是对回归算法正则化的一个例子。正则化是一种方法,它通过增加额外参数来解决过拟合问题,从而减少模型的参数、限制复杂度。正则化线性回归最常用的三种方法是岭回归、最小绝对值收敛和选择算子(LASSO)以及弹性网络回归。

在本文中,我将重点介绍LASSO,并且对岭回归和弹性网络回归做简单的扩展。

假设我们想在一个数据集上建立一个正则化回归模型,这个数据集包含n个观察和m个特征。

LASSO回归是一个L1惩罚模型,我们只需将L1范数添加到最小二乘的代价函数中:

看这里

通过增大超参数α的值,我们加强了模型的正则化强度,并降低了模型的权重。请注意,没有把截距项w0正则化,还要注意α=0对应于标准回归。

通过调整正则化的强度,某些权重可以变为零,这使得LASSO方法成为一种非常强大的降维技巧。

LASSO算法

  • 对于给定的α,只需把代价函数最小化,即可找到权重或模型参数w。
  • 然后使用下面的等式计算w(不包括w0)的范数:

案例研究:使用游轮数据集预测船员人数

我们将使用邮轮数据集cruise_ship_info.csv来演示LASSO技术

本案例已经发布在实验平台,请关注微信公众号:老齐教室。并回复: #姓名+手机号+案例# 获取。 注意: # 必须要有

1.导入必要的库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
复制代码

2.读取数据集并显示列

df = pd.read_csv("cruise_ship_info.csv")
df.head()
复制代码







请到「今天看啥」查看全文