专栏名称: 人机与认知实验室

北京邮电大学人机交互与认知工程实验室联系方式：[email protected]

目录

相关文章推荐

51好读 › 专栏 › 人机与认知实验室

如何通过链式法则计算损失对各层权重的梯度

人机与认知实验室 · 公众号 · · 2024-11-02 00:00

正文

请到「今天看啥」查看全文

通过链式法则计算损失对各层权重的梯度是反向传播算法的核心。我们可以用一个简单的神经网络示例来说明这个过程。

示例：简单的两层神经网络

假设我们有一个简单的神经网络，包括一个输入层、一个隐藏层和一个输出层。

输入层 ：
隐藏层 ：权重为，激活函数为
输出层 ：权重为，损失函数为

一、前向传播

计算隐藏层输出 ：
𝑍 1 = 𝑊 1 𝑋
$𝐴 1 = 𝑓 (𝑍 1)$
计算输出层输出 ：
$𝑍 2 = 𝑊 2 𝐴 1$
其中是输出层的激活函数（例如Sigmoid或Softmax）。
计算损失 ：
$𝐿 = Loss (𝐴 2, 𝑌)$
其中是真实标签。

2. 反向传播

计算损失对输出层权重的梯度

计算输出层误差 ：
$𝛿 2 = \partial 𝐿 \partial 𝐴 2 \cdot 𝑔' (𝑍 2)$
这里，是输出激活函数的导数。
计算权重梯度 ：
$\partial 𝐿/ \partial 𝑊 2 = 𝛿 2 \cdot 𝐴 1 𝑇$

计算隐藏层权重的梯度

计算隐藏层误差 ：
$𝛿 1 = (𝑊 2 𝑇 𝛿 2) \cdot 𝑓' (𝑍 1)$ 这里，是隐藏层激活函数的导数。
计算权重梯度 ：
$\partial 𝐿/ \partial 𝑊 1 = 𝛿 1 \cdot 𝑋 𝑇$

3. 更新权重

使用计算得到的梯度更新权重：

其中是学习率。

通过这个例子，我们看到了如何使用链式法则计算损失对各层权重的梯度。前向传播用于计算输出和损失，而反向传播则利用链式法则将误差从输出层向后传播，以更新每一层的权重。这个过程是深度学习模型训练的基础。

请到「今天看啥」查看全文

推荐文章

郎club · 私企真正的成本来自国企的搅局

8 年前

IPO案例库 · IPO财务核查重点关注事项（虚假交易、体外循环等）

7 年前

手游那点事 · 苹果App Store将在9月份开启全新改版！

7 年前

素食星球 · 作为一个吃货，你被这些 “网络谣言”坑了吗？！

7 年前

勇往直前 · 【安信建筑】日报资讯（2017-09-22）中国铁建中标42.27亿元项目、山东路桥中标3.7亿元项目

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!