专栏名称: 生信圈

关注生物医学大数据、以及数据分析方法在转化医学研究中的应用进展，讨论与生物信息相关的一切话题。

一名工程师对于深度学习的理解：神经网络基础ANN

生信圈 · 公众号 · · 2017-07-13 21:00

正文

按要求转载自云栖社区

ID：yunqiinsight

作者 | doflamingo

序

读书期间对于深度学习也有涉及，不过只是皮毛，在这个数据和算法的时代，也需要更加贴近算法 。于是从一名工程师角度出发，希望通过几篇文章，将深度学习基础记录下来，同时也是对于自己学习的总结和积累。总体思路是ANN－CNN－DNN，中间想起来有什么忘记的，也会加番。

神经网络概述

这是一张典型的人工神经网络的图，图中的节点称为神经元，图共分为三层，第一层为输入层，第二层为隐藏层，第三层为输出层。输入层接受外部世界的输入，具像化为图像的像素值，实体的特征值等，输出层概率预测结果，具像化为该图像是人像，该实体为潜在商家。

神经元

一个神经元将多个输入及其权值统一为下层节点的一个输入。例如：

而神经元一般都使用sigmoid函数，至于为什么使用sigmoid函数，也是个很有探讨意义的问题，具体可以看这篇文章了解sigmoid的特性，http://www.tuicool.com/articles/uMraAb。

其中，w表示权重向量，x表示输入向量，b为该节点的阈值。

那么下面问题就是如何选择合适的权重和阈值，构建出来合适的网络。

构建合适的网络

网络结构往往决定了算法复杂度和模型可调度，输出层主要由向量决定，输出层主要由预测类型决定，主要问题就在中间层数和节点数的选择上，节点数和层数越多意味着模型可调节性越强，预测结果的粒度越细，但同时也意味着计算复杂度越高。经验中间层一般选1-2层，节点数作为可调参数。

选择合适权重和阈值

首先，定义损失函数，损失函数的意义在于对于训练集评价预测结果和真实结果之间的差异：

该损失函数其实是预测结果与真实结果之间的方差

我们希望通过调整权重w和阈值b的值来使预测结果和真实结果之间的差更小。相当于在一个解空间中寻找最优解。解法有很多，如梯度下降法，拟牛顿法等。

梯度下降法

推荐文章

爱可可-爱生活 · LLMBRACES 创新性地提出通过动态调整前馈网络子更新贡献来-20250322054258

14 小时前

宝玉xp · 天天炸裂炸麻了😄//@i陆三金:为什么OpenAI这个更新关注-20250321105717

昨天

AI范儿 · OpenAI 新语音技术发布，AI 助手终于学会"说人话"了！

昨天

爱可可-爱生活 · 非线性表示学习的鲁棒性研究突破查看图片 //@爱可可-爱生活-20250321070659

昨天

雨生云计算 · 黄仁勋深度解读DeepSeek R1：推理型AI的算力需求是传统模型的100倍

昨天

雨生云计算 · 黄仁勋深度解读DeepSeek R1：推理型AI的算力需求是传统模型的100倍

昨天

哈尔滨发布 · 【出行提示】12对旅客列车改至哈西站乘降丨具体列车运行时刻可打12306咨询

7 年前

腾讯财讯 · 【小崔看盘】黑色周一再度上演：三大真凶出没后市非熊非牛？

7 年前

不正常人类研究中心 · 嫂子教我的那些事儿

7 年前

文案有翅膀 · 有没有那么一首歌，会让你想起我

7 年前

上海发布 · 【提示】静安、杨浦、闵行部分区域将试点公共停车场收费新规

7 年前