神经网络读书笔记

资源ID：55685376 资源大小：1.12MB 全文页数：10页
资源格式： PDF 下载权限：游客/注册会员 下载费用：10积分【人民币10元】

快捷注册下载

会员登录下载

三方登录下载：

下载资源需要10积分【人民币10元】

邮箱/手机：
温馨提示：	支付成功后，系统会自动生成账号（用户名和密码都是您填写的邮箱或者手机号），方便下次登录下载和查询订单；
支付方式：
验证码：	换一换

下载资源需要10积分【人民币10元】

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，既可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰

网站客服

侵权投诉

神经网络读书笔记

神经网络部分知识点总结神经网络部分知识点总结一、神经网络的基础 1.1 神经网络概念神经网络是由简单处理单元构成的大规模并行分布式处理器，天然具有存储经验知识和使之可用的特性。神经网络在这两方面与大脑相似 1. 神经网络是通过学习过程从外界环境中获取知识的。 2. 互连神经元的连接强度，即突触权值，用于存储获取的知识。 1.2 神经网络性质和能力神经网络具有以下有用的性质和能力 1.非线性人工神经网络可以是线性或者非线性的。 2.输入输出映射称之为有教师学习learning with a teacher或监督学习 supervised learning的关于学习的流行方法。它使用带标号的的训练样例 training example或任务样例task example对神经网络的突触权值进行修改。 3.自适应性神经网络具有调整自身突触权值以适应外界环境变化的固有能力。 4.证据响应evidential response在模式分类问题中，神经网络可以设计成不仅能够提供选择哪一个特定模式的信息，还提供关于决策的置信度信息。后者可以用来拒判那些可能出现的过于模糊的模式，从而进一步改善网络的分类性能。 5.上下文信息contextual ination神经网络的特定结构和激发状态代表知识。网络中每一个神经元都受到所有其他神经元全局活动的潜在影响。 6.容错性一个以硬件形式实现的神经网络具有天生的容错性，或者是鲁棒性的计算能力。 7.VLSI 实现神经网络的大规模并行性使它具有快速处理某些任务的潜在能力，很适合使用超大规模集成VLSI技术来实现。 8.分析和设计一致性。 9.神经生物类比。 1.3 神经元模型的三个基本元素 1、突触或连接链集，每一个都由其权值或者强度作为特征。如在连到神经元 k 的突触 j 上的输入信号𝑥 𝑗被乘以 k 的突触权值𝑤𝑘𝑗，第一个下标指正在研究的这个神经元，第二个下标指权值所在突触的输入端。 2、加法器，用于求输入信号被神经元相应突触加权的和。 3、激活函数，用于限制神经元输出振幅。上图为非线性神经元模型，标记为第 k 个神经元。用数学方程描述神经元其中𝑥 𝑗是输入信号，𝑤𝑘𝑗是神经元 k 的突触权值，𝑢𝑘是输入信号的线性组合器的输出，𝑏𝑘为偏置，激活函数为φ，𝑦𝑘为神经元输出信号。 1.4 激活函数的类型 1、阈值函数Heavside 函数如图（a）所示 2、sigmoid 函数sigmoid 函数的一个例子是 logistic 函数如图（b）所示其中 a 是 sigmoid 函数的倾斜参数。 1.5 网络结构神经网络分为三个基本结构 1、单层前馈网络源节点构成输入层，直接投射到神经元输出节点上。 2、多层前馈网络有一层或多层隐藏层，相应的计算机节点称为隐藏神经元。隐藏是指神经网络的这一部分无论从网络的输入端或者输出端都不能直接看到。 3、递归网络和前馈网络的区别在于它至少有一个反馈环。 1.6 学习过程广义上讲，可以通过对神经网络的功能来对其学习过程进行分类有教师学习和无教师学习。按同样标准，后者又可以分为无监督学习和强化学习两个子类。 1、有教师学习也称监督学习。从概念上讲，我们可以认为教师具有对周围环境的知识，这些知识被表达为一系列的输入-输出样本。然而神经网络对环境一无所知。 2、无教师学习没有任何带标号的样例可以供神经网络学习。强化学习输入输出映射的学习是通过与环境的不断交互完成的，目的是使一个标量性能指标达到最小。如左下图。无监督学习没有外部的教师或者评价来监督的学习过程。如右下图。二、感知器 2.1 感知器模型感知器神经元模型由一个线性组合器和随后的硬限幅器（执行一个符号函数）组成。如图为感知器符号流图。硬限幅器输入或神经元的诱导局部域是感知器的目的就是将外部作用激励正确分为两类。在最简单的感知器中存在被一个超平面分开的两个决策区域，此超平面定义为 2.2 感知器收敛定理偏置 bn被当作一个等于1 的固定输入量所驱动的突触权重。定义输入向量 n 代表迭代步数，对应的权值向量为线性组合器输出存在一个权值向量存在以下性质感知器不能正确对向量进行分类，在常量𝜂𝑛 1的情况下有两边同时乘以行向量𝒘𝑇 0，有根据定义有𝒘𝑇 0𝒘n 1 ≥ 𝑛𝛼 Cauchy-Schwarz不等式有对权值调整公式两边同取欧几里得范数的平方，得到但是，𝒘𝑇𝑘𝒙𝑘 ≤ 0，因此，这里β是一个正数，定义为比较发现一个是大于等于一个是小于等于相矛盾，故取相等求最大迭代次数。 2.3 感知器收敛算法概述三、用于非线性模式识别的神经网络非线性模式识别的神经网络包括多层感知器（MLP）网络、径向基函数（RBF）网络、支持向量基（SVM）、数据处理的通用模型（GMDH，也叫做多项式网络）、通用回归神经网络（GRNN）和通用神经网络（GNN）。带有一个隐含层的多层感知器模型在预报应用里（或函数逼近里）通常是单输出，在分类应用里是一个或多用非线性多层感知器网络为多维数据建模，通常情况下有 n 个输入，m 个第 j 个神经元的隐含神经元的输入𝑢 𝑗和输出𝑦𝑗是 𝑛 个输出。隐含神经元和 k 个输出神经元，MLP 的中间处理构成 𝑢 𝑗 𝑎 𝑗0 ∑𝑎 𝑗𝑖𝑥𝑖 ,𝑦 𝑗 𝑓𝑢𝑗 𝑖1 第 k 个神经元的隐含神经元的输入𝑣𝑘和输出𝑧𝑘是 𝑛 𝑣𝑘 𝑏𝑘0 ∑𝑎𝑘𝑗𝑦 𝑗 ,𝑧𝑘 𝑓𝑣𝑘 𝑗1 四、神经网络对非线性模式的学习对于一个具有输出神经元的网络的所有训练模式的预报最通用的误差表示 MSE 可以写成（式中，𝑡𝑖,𝑧𝑖分别表示目标输出和预报输出） 𝑁 E 1 2𝑁 ∑𝑡𝑖− 𝑧𝑖2 𝑖 4.1 梯度下降法梯度下降法提出将权值向误差下降最快的方向改变。关于输出神经元权值的误差梯度假设输出神经元的激励函数为关于隐含神经元误差梯度由于𝑣 𝑏0 𝑏1𝑦 ,因此， 𝜕𝑥 𝑏1 𝜕𝑦 学习率和权值更新，对m 1次训练时间的新权值𝑤𝑚1可以表示为 𝑁 𝑤𝑚1 𝑤𝑚 ∆𝑤𝑚,∆𝑤𝑚 −𝜀𝑑𝑚,𝑑𝑚 ∑[ 𝑛1 𝜕𝐸 ] 𝜕𝑤 𝑚 𝑛 动量法的思想就是利用所有以前权值的变化的指数平均导出当前变化。式中，𝜇是一个在 0 到 1 之间的动量参数；∆𝑤𝑚−1是前一个训练时间里的权值变化。因此𝜇表示过去权值变化对新的权值增量∆𝑤𝑚的相对重要性。动量可以稳定学习过程。多输入、多隐含神经元多输出网络网络的总误差是每一个输出神经元的 MSE 之和，可以表示为输出神经元权值的导数 𝜕𝐸𝜕𝐸 𝑝1 𝑧1− 𝑡1 𝑧 11− 𝑧1,

注意事项

本文（神经网络读书笔记）为本站会员（sunhongz113）主动上传，蚂蚁文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知蚂蚁文库（发送邮件至2303240369@qq.com或直接QQ联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。