由线性模型引出平方损失函数
假设有一个房屋销售的数据如下:
我们将上面数据可视化如下(大致说明数据分布特点):
那么,我们来了一个新的面积,需要预测它对应的房屋价格应该怎么办呢?
我们可以用一条曲线尽量准的拟合这些数据,如果有新的输入数据过来,我们就可以将曲线上该面积对应的价格返回。如果用一条直线拟合,可能是下面这个图像:
恩,上图的红线就是我们想要得到的直线(线性模型)。
线性回归假设特征和结果满足线性关系。 其实线性关系的表达能力非常强大,每个特征对结果的影响强弱可以有前面的参数体现,一般化线性模型,我们是有多个变量的线性模型。我们用向量形式来表达线性模型,如下:
那么我们可以求出不同的,来得到不同的模型。
这样的话,问题来了,我们如何知道每一个模型的好坏,也就是说,我们需要一个机制来判断我们的是好是坏!
这就引出了我们的损失函数,如下:
我们通过最小化损失函数得到的,就是我们觉得最优的,也就是我们认为此时的模型(知道了参数也就确定了我们的模型)最优(这里也很好理解,这个公式尽可能使得我们预测出来的值与真实的值无限逼近!!)
原文链接:
https://mp.weixin.qq.com/s/vSBcA3UgpDb8ZauWePPSjA