专栏名称: 生信圈
关注生物医学大数据、以及数据分析方法在转化医学研究中的应用进展,讨论与生物信息相关的一切话题。
目录
相关文章推荐
爱可可-爱生活  ·  LLMBRACES ... ·  14 小时前  
AI范儿  ·  OpenAI 新语音技术发布,AI ... ·  昨天  
爱可可-爱生活  ·  非线性表示学习的鲁棒性研究突破 查看图片 ... ·  昨天  
雨生云计算  ·  黄仁勋深度解读DeepSeek ... ·  昨天  
雨生云计算  ·  黄仁勋深度解读DeepSeek ... ·  昨天  
51好读  ›  专栏  ›  生信圈

一名工程师对于深度学习的理解:神经网络基础ANN

生信圈  · 公众号  ·  · 2017-07-13 21:00

正文

按要求转载自云栖社区

ID:yunqiinsight

作者 | doflamingo



读书期间对于深度学习也有涉及,不过只是皮毛,在这个数据和算法的时代,也需要更加贴近算法 。于是从一名工程师角度出发,希望通过几篇文章,将深度学习基础记录下来,同时也是对于自己学习的总结和积累。总体思路是ANN-CNN-DNN,中间想起来有什么忘记的,也会加番。


神经网络概述



这是一张典型的人工神经网络的图,图中的节点称为神经元,图共分为三层,第一层为输入层,第二层为隐藏层,第三层为输出层。输入层接受外部世界的输入,具像化为图像的像素值,实体的特征值等,输出层概率预测结果,具像化为该图像是人像,该实体为潜在商家。


神经元


一个神经元将多个输入及其权值统一为下层节点的一个输入。例如:

而神经元一般都使用sigmoid函数,至于为什么使用sigmoid函数,也是个很有探讨意义的问题,具体可以看这篇文章了解sigmoid的特性,http://www.tuicool.com/articles/uMraAb。

其中,w表示权重向量,x表示输入向量,b为该节点的阈值。

那么下面问题就是如何选择合适的权重和阈值,构建出来合适的网络。


构建合适的网络


网络结构往往决定了算法复杂度和模型可调度,输出层主要由向量决定,输出层主要由预测类型决定,主要问题就在中间层数和节点数的选择上,节点数和层数越多意味着模型可调节性越强,预测结果的粒度越细,但同时也意味着计算复杂度越高。经验中间层一般选1-2层,节点数作为可调参数。


选择合适权重和阈值


首先,定义损失函数,损失函数的意义在于对于训练集评价预测结果和真实结果之间的差异:

该损失函数其实是预测结果与真实结果之间的方差


我们希望通过调整权重w和阈值b的值来使预测结果和真实结果之间的差更小。相当于在一个解空间中寻找最优解。解法有很多,如梯度下降法,拟牛顿法等。


梯度下降法







请到「今天看啥」查看全文