专栏名称: 马同学图解数学
看图学数学!可能是中国最好的高等数学的基础概念讲解,深入浅出、形象生动。没有高深的数学符号,只有你能懂的数学内容。
目录
相关文章推荐
超级数学建模  ·  限时领 | 迪士尼神奇英语 ... ·  昨天  
超级数学建模  ·  当我有两条裙子,刚好男朋友也想试试... ·  昨天  
超级数学建模  ·  DeepSeek开源周来了!网友:纯粹的工程 ... ·  4 天前  
超级数学建模  ·  阿姨让我辞职跟她一起住,可是我... ·  3 天前  
超级数学建模  ·  限时领 | ... ·  4 天前  
51好读  ›  专栏  ›  马同学图解数学

如何理解机器学习中的“偏差”和“方差”?

马同学图解数学  · 公众号  · 数学  · 2021-01-21 14:41

正文

假设有如下未知的曲线(用虚线画出表示我们并不真正清楚该曲线的具体方程),因为未知,所以下面称为“上帝曲线”。在“上帝曲线”的附近会产生一些随机数据,这就是之后要用到的数据集:



下面会通过该数据集来解释下什么是机器学习中的“偏差”和“方差”。

1 “偏差”
我们可以选择不同复杂度的模型来拟合该数据集,比如线性回归,或者多项式回归:



可以看到线性回归比较简单,和“上帝曲线”相差较大,也就是“偏差”较大。 而多项式回归可以较好的拟合“上帝曲线”,所以说该模型的“偏差”较小。


2 “方差”
数据集是有随机性的,除了上一节使用的数据集外,我们还可能得到如右侧这样新的数据集:



新的数据集上当然也可以运用线性回归,或者多项式回归:



可见,较简单的线性回归变化不大,也就是说“方差”较小。 而多项式回归对数 据太敏感,变化太大,也就是说“方差”较大。因此带来 的后果是,修改数据后对“上帝曲线”的拟合很糟糕。


3 “欠拟合”和“过拟合”

综上,可以知道“偏差”和“方差”对机器学习的影响是:

(1)“欠拟合”:较简单的模型“偏差”较大,不能对数据集进行很好的拟合,从而与“上帝曲线”相差较大,这在机器学习中称为“欠拟合”。解决方案是选择“偏差”小的模型,即复杂度高的模型。

(2)“过拟合”:复杂的模型,可以较好地拟合当前数据集,但由于“方差”较大,反而和“上帝曲线”相距较远,这在机器学习中称为“过拟合”。解决方案是选择“方差”小的模型,即复杂度低的模型。

所以我们要选择恰当的复杂度的模型,其“偏差”和“方差”也都适度,才能“适度拟合”:



最后用一幅图来总结,由于“偏差”和“方差”的存在,在机器学习中我们要选择恰当的模型复杂度:


我们通过通俗易懂、图形化的方式,对机器学习中的《监督式学习》进行了精讲,目前还在连载中,可以享受早鸟价格,可以点击下面的链接购买:


👉 也可以直接点击下面这个图片购买机器学习的前置课程,《线性代数》、《单变量微积分》、《多变量微积分》、《概率论与数理统计》:



最易懂的数学知识库:

马同学图解数学







请到「今天看啥」查看全文