公务员期刊网 精选范文 神经网络范文

神经网络精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络主题范文,仅供参考,欢迎阅读并收藏。

神经网络

第1篇:神经网络范文

摘要:

高轨卫星是我国卫星导航系统的重要组成部分。提升该类卫星的轨道预报精度有利于用户定位精度的提高。提出了一种改进高轨卫星轨道预报精度的新方法。该方法避开了精化动力学模型的困难,尝试从轨道预报误差的规律中寻找突破。利用神经网络作为建立预报模型的工具,将某历史时刻的轨道预报误差作为训练样本,利用训练好的神经网络模型补偿当前时刻的预报轨道以提高轨道预报精度。对影响神经网络模型补偿效果的各因素进行了详细分析,制定了适应于高轨卫星短期、中期和长期预报的神经网络最优模型。利用实测数据进行了试验分析,结果表明:预报8,15及30d应选择的训练步长分别为10,20及25min;轨道预报8~30d时,训练噪声均选取0.01。神经网络模型有效地改进了高轨卫星的轨道预报精度,预报4~30d,轨道精度提高幅度为34.67%~82.37%不等。

关键词:

神经网络;轨道预报;训练噪声;训练步长;地球静止轨道卫星;倾斜地球同步轨道卫星

高轨卫星在我国的航天系统中应用十分广泛。特别是我国的卫星导航系统BDS(Beidousystem),其主要包括GEO卫星和IGSO卫星。导航卫星星历的精度是定位精度的基础,而广播星历本身便是轨道预报的结果。预报精度问题是制约BDS卫星导航系统服务性能的关键因素,因此有必要对导航系统中的高轨卫星轨道预报精度展开研究[1]。改进轨道预报精度的一种方法是建立更加精准的动力学模型[2 ̄3]。然而由于该方法需要长期精密轨道数据的支撑,周期长、难度大。改进轨道预报精度的另一种方法可以从轨道预报误差的规律中寻找突破[4]。神经网络作为一种新兴的建模工具,特点在于处理高维性、非线性的问题时不需要准确知道输出输入函数的结构参数。只要通过训练来掌握它们之间的内在关系,在输入训练集以外的数据时,神经网络可以获得它们之间正确的映射关系。该方法的优势在于不确定性系统的控制和预测。目前在轨道预报中使用神经网络工具的相关研究较少,文献[5]根据GPS卫星星历的相关周期特性,以时间系列预报作为基础,利用神经网络建立预报模型。在没有任何动力学模型的情况下得到了精度为数百米(1周)的预报结果。但是由于将卫星位置量直接作为神经网络的输出,神经网络算法的状态量动态范围大,限制了预报精度的提高。文献[6]利用GPS卫星精密星历已知的优势,将神经网络与动力学模型相结合组成混合预报模型,改进GPS导航卫星的中长期预报。该方法可以在一定程度上改进轨道预报精度,但不是每次改进均能成功,存在改进失效的情况。针对高轨卫星的高精度轨道预报这一难题展开研究。以神经网络作为建立预报模型的工具,在动力学模型基础上建立神经网络模型,通过对历史时刻预报误差的学习及训练,掌握其变化规律,再用于补偿和改进当前时刻的预报轨道,以达到提高预报精度的目的。针对神经网络训练及补偿特性,分析了不同因素对神经网络模型性能的影响。基于此制定了短、中、长期轨道预报的最优模型,最后利用不同类型卫星进行了试验分析。

1基于BP神经网络的轨道预报算法

BP神经网络是一种多层网络的“逆推”学习算法[7 ̄9]。利用神经网络进行轨道预报分为训练和补偿两个阶段。在训练阶段,采用拼接方法得到一条长时间的精密轨道,用于衡量动力学模型预报误差及神经网络模型的训练误差。针对拼接处小量级的跳跃现象,采用Robust ̄loess数值滤波方法进行轨道预报误差平滑[10]。由于预报轨道和预报误差为训练样本,故需要对两者的特性进行分析。同时神经网络模型参数在一定程度上影响神经网络的训练效果,因此有必要对影响神经网络模型的一些关键因素进行分析,以确定最优的神经网络模型。在补偿阶段,将当前时刻的预报轨道X(T)和V(T)作为神经网络模型的输入;将利用函数f(X,V)计算得到神经网络模型的输出作为当前时刻预报轨道的补偿值ΔXNN(T),将改进后的预报轨道X(T)和V(T)作为最终轨道输出。在神经网络具体应用中,为了提高网络性能以完成预定任务,需要认真考虑训练集预处理、网络结构设定以及训练算法等内容。网络的性能主要表现在训练效率及泛化能力。泛化能力是指辨识训练样本中所隐藏的规律并且当被输入样本以外数据时,网络能正确地反应这种规律的能力。关于网络泛化能力的相关讨论及改进措施,已有文献进行了比较详实的总结。这里涉及到的方法主要包括下列3个方面:一是处理训练样本的方法[11],将神经网络的训练样本进行归一化处理,使其在[-1,1]变化,以提高神经网络的性能;二是训练步长的选取;三是增加随机噪声[12 ̄13]。

2不同因素对神经网络模型性能的影响

分别针对预报轨道和预报误差特征、训练步长的选择、训练噪声的大小对神经网络模型性能的影响进行讨论。

2.1预报轨道和预报误差的特征分析

2.1.1中长期预报轨道和预报误差特征将短期轨道预报弧长定位为1~13d,中期轨道预报弧长为14~27d,长期轨道预报弧长大于27d。以某初始时刻的预报误差作为训练样本训练得到的神经网络可以对其他初始时刻的预报轨道提供补偿,但前提是两个初始时刻的预报误差数值大小及波形图要相近。对GEO卫星的预报误差进行时间序列分析,结果可以看出,预报误差最大值呈现以14d为周期的变化规律;IGSO卫星具有相同的特征。文中选取的训练弧长与当前时刻的轨道预报弧长相等。对于中长期轨道预报可以采用以下方案:假设预报弧长为md(14n≤m≤14(n+1),n≥1),用当前时刻起14(n+1)d之前那天的预报误差和预报轨道作为训练样本,训练弧长为md,训练得到神经网络模型。采用神经网络模型计算得到的补偿误差波形对当前的预报误差进行补偿。对于短期预报,由于预报弧长小于14d,其轨道预报方案中还考虑了预报误差波形的最佳匹配。即充分结合预报误差和预报轨道的动力学特性,建立了一个训练样本集。根据当前时刻的预报误差波形变化特征在样本集中搜索最佳训练样本,实现两者波形变化的最优匹配,从而实现最优的补偿效果。在中长期预报中未采用波形匹配算法的主要原因是,需要兼顾工程应用中的实时性,波形匹配耗时较长。

2.1.2短期预报中的波形匹配算法航天器是一个受摄动力系统,其初值不稳定性使得利用不同初始轨道得到的预报轨道和预报误差的特性均不同。这就导致不同初始时刻的预报误差并无规律。为了实现最佳的神经网络模型补偿效果,必须找到与当前时刻预报误差变化波形最为相近的历史时刻中的一条预报轨道。采用历史时刻的预报轨道和预报误差作为训练样本,训练得到神经网络模型。在实际工程应用中,因为当前时刻之后的预报弧段中的精密轨道无法获取,故不能获得当前时刻的预报误差波形变化规律,所以并不能直接通过预报误差波形比对来寻找补偿当前时刻预报轨道的训练样本。但是基于动力学模型外推可以得到当前时刻的预报轨道,如果能找到预报轨道与预报误差之间的波形变化对应关系,就可得到当前时刻的预报误差波形变化规律。由于预报误差的变化周期与轨道周期相同,对于GEO/IGSO卫星均为1d,通过对比预报误差波形变化最大值和最小值出现的时刻,搜寻得到用于补偿当前时刻预报误差的训练样本。由于预报轨道在数值上远远大于预报误差,为了便于分析问题,将两者进行归一化处理,即分别将两者除以各自的最大值,这样它们就在±1之间变化。图2和图3分别给出了某GEO卫星和某IGSO卫星在2013年第23天预报8d的轨道与相应的预报误差之间的对应关系。其中,横坐标表示预报时间,单位为d;纵坐标表示归一化后的数值,无量纲。1)对于两种类型的卫星,在J2000坐标系中X和Y轴方向,当预报轨道X/Y=0时,对应时刻的预报误差为最大值(峰值)或最小值(谷值)。预报轨道从正值变化为负值经过零值的时刻对应着预报误差的峰值,从负值变化为正值经过零值的时刻则对应着预报误差的谷值。2)在Z轴方向,GEO卫星的预报轨道和预报误差之间并无明显的对应关系;IGSO卫星存在与X/Y轴相同的对应关系。将作为训练样本的预报误差选择定义在J2000坐标系中,主要是因为在该坐标系中预报误差的规律性强,并且与预报轨道之间存在一定的对应关系。

2.2训练步长对预报精度的影响预报误差改进率的计算公式如下。以某GEO卫星为例,表1给出了不同预报弧长、不同训练步长下利用神经网络模型得到的预报误差改进率。分析表1中的数据可以看出下列3点。1)训练步长越小,神经网络模型的改进率就越高。2)预报弧长的长度与对训练步长的敏感度成反比,即弧长越长,训练步长的延长对改进率的影响就越小。训练步长从5min延长至40min,预报8,15和30d的改进率分别降低5.68%,3.9%和1.36%。3)由于训练步长越小,训练时间越长,因此改进率与训练时间是一对矛盾体。从综合改进率和训练时间的要求考虑,即改进率应尽可能高,而训练时间应尽可能短。故预报8,15和30d应选择的训练步长分别为10,20和25min。

2.3训练噪声对预报精度的影响以某初始时刻的轨道预报误差(称为训练值)作为训练样本训练神经网络模型,用其补偿另一个初始时刻利用动力学模型外推得到的预报误差(称为期望值)。如果训练值和期望值在同一时刻吻合的很好,那么利用神经网络模型一定能很好地修正动力学模型的预报误差。以某GEO卫星轨道预报8d为例,图4给出了采用不同噪声值时训练值和期望值之间的吻合关系。分为无噪声、噪声为0.01、噪声为0.05和噪声为0.10共4种情况。从图4中可以看到,不加噪声时训练值与其期望值的差别较大,因此应加入训练噪声以提高神经网络的泛化能力;加入噪声后训练值与期望值吻合的较好,但无法区分噪声值为多大时预报精度最高。表2给出了采用不同训练噪声时,经神经网络模型补偿后的轨道预报误差最大值的统计结果。其中原始预报误差为未进行补偿时的采用动力学模型外推得到的预报误差。表2不同训练噪声下的预报分析表2中数据可以看出下列两点。1)无噪声时,前4d无改善,精度反而降低;预报8d及更长弧段时预报误差略有改善,故应加入训练噪声。2)增加噪声后,噪声从0.001~0.100的变化对预报精度的改进幅度相当。但从总体来看,噪声越小,前6d的预报精度越高;但预报8d以及更长弧段时噪声为0.010的预报误差最小,故应选择训练噪声为0.010。

3试验结果及分析

根据上述短、中、长期轨道预报方案,并结合不同神经网络模型参数的优化设计分析,给出了利用神经网络模型进行轨道预报的试验结果。通过与精密星历比对可以分别得到动力学模型和神经网络模型的预报精度。表3列出了BDS系统中两颗GEO、三颗IGSO共5颗卫星在2013年第23天利用神经网络模型和动力学模型外推得到的预报误差(其中NN代表神经网络模型;Dyn代表动力学模型)。Sat02卫星由于轨道机动未能统计其中长期预报结果。表3中误差是在一定弧段内预报误差的最大值。从表3可得,神经网络模型1d预报误差有时会大于动力学模型的预报误差;但预报4,8,15及30d各卫星采用神经网络模型补偿后的预报精度均有所提高。这主要因为1d的预报弧段规律性不强,不利于神经网络模型的学习及训练。随着弧段的增长,训练样本的规律性增强,神经网络模型的补偿效果有所提高。为了更好地衡量神经网络模型的改进效果,给出各卫星的预报精度提高幅度,其与预报误差改进率的计算公式相同。表4给出了各卫星经神经网络模型补偿后的预报精度提高幅度。从表4中可以看出,预报4d各卫星的轨道精度改进幅度为40.25%~60.31%;预报8d各卫星的轨道精度改进幅度为63.28%~72.59%;预报15d改进幅度为47.01%~82.37%;预报30d改进幅度为34.67%~82.35%。可见神经网络模型在改进轨道预报误差中的作用显著。

4结论

第2篇:神经网络范文

关键词:神经网络技术,ANNBP网络算法

 

1、人工神经网络概述

人工神经网络是模拟生物神经信息处理方法的新型计算机系统,它可以模拟人脑的一些基本特征,(如自适应性,自组织性和容错性),是一个并行、分布处理结构,它由处理单元及其称为联接的无向信号通道互连而成。

人工神经网络力图模仿生物神经系统,通过接受外部输入的刺激,不断获得并积累知识,进而具有一定的判断预测能力。尽管神经网络模型的种类很多,但基本模式都是由大量简单的计算单元(又称为节点或神经元)广泛相互连接而构成的一种并行分布处理网络。。基于神经信息传输的原理,各个节点通过可变的权值彼此相连接,每个节点对N个加权的输入求和,当求和值超过某个阈值时,节点呈“兴奋”状态,有信号输出。节点的特征由其阈值、非线性函数的类型所决定,而整个神经网络则由网络拓扑、节点特征以及对其进行训练所使用的规则所决定。

2、多层前向网络

神经网络按拓扑结构分为前馈型网络和反馈型网络。前馈型网络在结构上采用的是其信息只能从前一层到它下面一层的单元,在网络运算过程中不存在任何反馈。从学习观点看,前馈网络是一种强有力的学习系统,其结构简单,易于编程;从系统观点看,前馈网络是非线性映射,通过简单非线性处理单元的复合映射可获得复杂的非线性处理能力,因此具有较强的分类能力和模式识别能力。

反向传播(BP)网络是典型的前馈型网络,结构上它属于多层前向网络,它的结构如图1所示。它分为输入层、隐含层和输出层,层与层之间多采用全互连方式,同一层之间不存在相互连接。网络中每一层权值都可通过学习来调节,且网络的基本处理单元(输入单元除外)为非线性输入、输出关系,处理单元的输入、输出值可连续变化。由于BP网络可在多个连续的输入和一个或多个连续的输出之间建立非线性映射这一特性,它常被用于智能预测。

多层前向网络是使用最广泛的一种网络结构,它可很好的解决XOR等经典的非线性问题,比起单层的感知器有很大的优越性,尤其80年代中期,Rumelhart和Mcclelland最先提出了多层前馈网络的反向传播学习算法,简称BP算法,它的效率很高,是目前应用最为普遍的训练算法,这使得多层前馈网络应用更加广泛。应该指出,我们常说的BP网络,严格说是基于BP算法的多层前向网络。

图 1 BP网络结构图

4、 BP网络算法

BP网络算法的思想是把一组样本的I/O问题变为一个非线性优化问题,使用了优化中最普通的梯度下降法,用迭代运算求解权对应于学习记忆问题,加入隐含层节点使优化问题的可调参数增加,从而可得到更精确的解。BP网络模型设计的最大特点是网络权值是通过使用网络模型输出值与已知的样本值之间的误差平方和达到期望值而不断调整出来的,并且确定BP神经网络评价模型时涉及隐含层节点数、转移函数、学习参数和网络模型的最后选定等问题。下面简单介绍一下基本BP算法相关数学描述:

(1)梯度下降算法

(2)S(Sigmoid)型函数

BP网络的激活函数经常使用的是Sigmoid对数或正切激活函数和线性函数。对数S型函数 f(x)=1/(1+exp(-x)), Sigmoid 函数具有非线性放大功能,它可以把输入从负无穷大到正无穷大的信号,变换成-1到1之间的输出,对较大的输入信号,放大系数较小,而较小的输入,放大系数较大,所以采用S型激活函数可以去逼近非线性的输入/输出关系。

(3)BP算法

BP网络学习是典型的有导师学习,其学习算法是对简单的学习规则的推广和发展。BP网络实现了多层网络学习的设想,其学习过程包括正向传播和反向传播两部分。。

在正向传播过程中,给定网络的一个输入模式时,输入信息从输入层经过隐含层逐层处理,并传向输出层,每一层神经元的状态只影响下一层神经元的状态,由输出层单元产生一个输出模式,这是一个逐层状态更新过程,称为前向传播。。如果输出响应与期望输出的模式误差值不满足要求,那么就转入误差反向传播,将误差值沿连接通路逐层传送并修正各层连接权值。对于给定的一组样本,不断用一个个训练模式进行学习,重复前向传播和误差反向传播过程,当各个训练模式都满足要求时,BP网络训练完毕。

其中的激发函数我们采用S型函数, 即f(x)=1/(1+exp(-x))。BP算法描述如下:

(2)提供训练样本:输入矢量Xk ,k=1,2,..n 和期望输出tk, k=1,2,…,m;对每个输入样本进行(3)到(5)的迭代。

(3)计算网络的实际输出okj 。

(4)分别计算输出层和隐含层的训练误差

其中(4-2)为输出层的误差值, (4-3)为隐含层的误差值。

(5)修正权值和阈值

(6)判断实际误差指标是否满足规定误差的要求,满足则到(7)。

(7)结束 。

BP算法是人工神经网络中最为重要的网络之一, 也是迄今为止应用最为广泛的网络算法, 实践证明这种基于误差反传递算法可以解决许多实际问题, 但其算法自身也存在着局部极小点、算法的收敛速度慢等缺陷,需要我们在今后的研究中不断完善改进。

第3篇:神经网络范文

一般而言,计算机网路安全管理指的是计算机在连接网络后进行信息的交换、浏览以及下载的过程中,对信息安全进行有效的管理,防止信息被他人窃取或者破坏。随着信息时代的到来,越来越多的人对计算机产生了很强的依赖,从儿童到老年人,计算机的影响无处不在,随着计算机的普及,人们在使用计算机的过程中对其安全性就有了顾忌。对于计算机网络,只要连接互联网,随时都存在被攻击的可能,相对而言,没有任何计算机是绝对的安全或者是不受到任何的攻击。运用计算机网络技术进行攻击或者盗取个人信息或者是企业信息的事件凡乎每年都会发生,计算机网络存在严重的安全隐患。所以,要及时的认识以及了解计算机网络面临的安全隐患,积极的采取相应的措施加强对计算机网络安全的管理

2神经网络在计算机网络安全管理应用的现状

2.1对神经网络在计算机安全管理运用中的重视程度不够。计算机网络安全是因特网发展的最基础的目的,但与此同时近乎所有的计算机网络在开创以及不断的发展过程中都趋向于实用以及便利,相反却在一定程度卜没有重视对计算机的安全管理,更没有将神经网络技术运用到计算机的安全管理中,进而对计算机网络的安全管理留下了严重的隐患。另外,神经网络在计算机网络安全管理中主要是对计算机的网络安全进行评估,然而由于不重视对神经网络在计算机网络安全管理中的运用,使得没有建立良好的计算机网络安全评价标准体系。

2.2对神经网络在计算机网络安全评价模型的设计和实际运用不够合理。一般来说,神经网络在计算机网络安全管理中主要是对计算机网络安全进行一定的评估,在对其进行评估的过程中,就需要设计一定的计算机网络安全评价模型,主要包含刊浦俞入层、输出层以及隐含层的设计;但是,目前神经网络在计算机网络安全管理中对于评价模型的设计还没有将这三方面有效的联系起来、除此之外,对神经网络在计算机网络安全管理的实际运用中,不能科学、合理的实现计算机网络安全管理评价模型运用,不注重对评价模型的学习以及不关注对评价模型进行有效的验证。

3加强神经网络在计算机网络安全管理中的应用采取的措施

3.1神经网络在计算机网络安全管理中要科学、合理的设计网络安全评价模型。神经网络在计算机网络安全管理中要科学。合理的设计网络安全评价模型,以便更好的实现计算机网络安全、高效的运行。为此,计算机网络安全评价模型需要进行一下设计:首先是对输入层的设计,一般来说,神经网络在计算机网络安全管理运用中,对于输入层考虑的是神经元的节点数以及评价指标的数量,尽可能的使这两者数量保持一致。其次是对隐含层的设计,对于隐含层的设计需要注意的是若某个连续函数在任意的闭区间中,可以通过在隐含层里的神经网络来靠近,大多数情况下,神经网络通常运用的是单隐含层。最后是输出层的设计,神经网络的输出层设计主要是获得计算机网络安全管理评价的最终结果,例如可以设置计算机网络安全管理评价的输出层节点数为2,那么相应的输出结果(l,)l指的是非常安全、(o,)l指的是较不安全、(,l山指的是基本安全以及(,0切指的是非常的不安全。

3.2神经网络在计算机网络安全管理运用中要对评价模型进行有效的验证。需要注意的是,神经网络在计算机网络安全管理运用中要对评价模型进行有效的验证,一般体现在一下几方面:首先是要关注评价模型的实现,为了实现神经网络在计算机网络安全管理中的良好运用,就要依据客户满意的评价模型,运用计算机网络技术创建设置含有输入层、隐含层以及输出层的神经网络模型,然后再对网络安全进行检验。其次是要注意对评价模型的学习,在对计算机网络安全进行评价之前,需要对神经网络进行标准化的处理,才能尽可能的减少对计算机网络安全管理评价中的误差。最后要注意对评价模型进行验证,当神经网络经过标准化处理以及在计l章机网络安全评价之后,就需要刊输出的结果进行一定的验证,以便确定神经网络对计算机网络安全的评价输出结果是否与期望的评价结果相一致,进一步验证神经网络在计算机网络安全管理中安全评价模型的准确与否。

3.3重视神经网络在计算机网络安全管理运用以及建立健全安全评价标准体系。神经网络在计算机网络安全管理运用中主要的任务是对计算机网络的安全进行一定的评价,并且将评价的结果准确、及时的反馈给用户,所以就应该对其在计算机网络安全管理中的应用引起高度的重视,为此就应该建立健全计算机网络安全管理的评价标准体系。一方面是评价指标的建立,计算机网络安全管理是复杂的过程,同时影响计算机网络安全的因素比较多。因此,建立科学、合理以及有效的计算机网络安全管理评价标准,对于神经网络高效的开展评价工作有很大的关联。另一方面是刊评价标准的准确化,影响计算机网络安全管理的因素非常的多,就应该对各种评价标准进行细化,以达到评价的准确。

4结束语

第4篇:神经网络范文

1基于贝叶斯算法的BP神经网络

1.1贝叶斯算法基于贝叶斯算法的BP神经网络是基于贝叶斯定理而发展出来的用于解决统计问题的方法,即任意一个待求量都可以看作是一个随机变量,因此可以通过概率分布来对待求量进行描述,这个概率是在抽样前就有的关于待求量的先验概率分布。贝叶斯理论正是在没有样本信息时,只根据先验概率分布来求解待求量。而在有样本后,则可根据总体、样本和先验信息的联合分布来对未知量进行判断。后验分布π(θ|x)是反映人们在抽样后对随机变量θ的认识,其与先验分布即样本x的差异是由于样本出现后人们对θ的调整,即后验分布π(θ|x)为抽样信息对先验分布π(θ)调整的结果[6]。

1.2贝叶斯算法BP神经网络基于贝叶斯算法的BP神经网络是一种以神经网络基本原理为构架,通过引入贝叶斯推理有效地控制网络模型的复杂度,进而更好地解决非线性问题及其不确定性[7]。在BP神经网络中,训练样本集为D(xm,Om),xm为输入信号,Om为输出节点,在一定的网络结构A与网络参数W下,可以得到网络的输出由网络的输入D唯一的确定。网络训练的目标函数为误差函数ED(D|W,A),则有。采用贝叶斯算法BP神经网络步骤如下:(1)确定网络结构A,初始化超参数α,β,对网络参数W进行赋值。(2)以最终目标函数为M(W)最小为原则,对BP神经网络进行训练,寻找最优可能网络参数W。(3)寻找最优可能参数α,β。(4)采用不同初始网络参数寻找最优网络参数。(5)对不同网络结构A,寻找最优网络参数。

2贝叶斯算法的BP神经网络量化结果分析

2.1训练样本与测试样本在对管道进行磁化的过程中,最常用的方法是沿管道轴向进行磁化,提取缺陷处沿轴向变化的漏磁场与沿周向变化的漏磁场,缺陷的长度信息主要由沿轴向变化漏磁场反应,缺陷的宽度信息主要由沿周向变化的漏磁场反应,而缺陷的深度信息则是由这两个量共同反应[9]。本文采用实验的方法获取网络所需样本,这里以对陡壁缺陷的分析为例,研究贝叶斯算法的BP神经网络对陡壁缺陷量化的有效性。分别制作缺陷长度为3,3.5,4,4.5,5,5.5倍管道壁厚,宽度为0.5,1,1.5,2倍管道壁厚,深度为0.1,0.15,0.2,0.25倍管道壁厚,共得到96组测量结果,取其中80个缺陷特征作为网络的训练样本,剩余的16个缺陷特征作为测试样本。

2.2长度的量化采用统计分析的方法选取与缺陷长度关系密切的特征量作为神经网络的输入信号,将缺陷长度作为网络的输出信号来对网络进行训练。所选取主要特征有漏磁场轴向分量的静态阈值截取长度、一阶微分信号极小值的位置与周向变化漏磁场动态阈值截取长度。分别对基本的BP神经网络与贝叶斯算法的BP神经网络进行训练,当均方误差小于10-3时停止训练,得到两种网络的训练与学习过程如图1所示。比较两种算法训练过程可以看出贝叶斯算法的BP神经网络总共进行了331次训练,而基本的BP神经网络总共进行了1789次训练,可见贝叶斯算法的BP神经网络的收敛速率更快。用16组测试数据对两种网络长度的量化误差进行比较,得到量化后缺陷最大相对误差与最小相对误差如表1所示,对应贝叶斯算法BP神经网络量化的缺陷如表2所示。从表2中可以看出,采用贝叶斯算法的BP神经网络量化得到的缺陷长度与设计值的误差明显小于基本的BP神经网络,最大相对误差仅为0.05%。

2.3宽度的量化与缺陷长度的量化相似,采用统计分析的方法选取与缺陷宽度关系密切的特征量作为神经网络的输入信号,将缺陷宽度作为网络的输出信号来对网络进行训练。所选取主要特征有轴向变化漏磁场峰谷值、周向变化漏磁场波形面积、波形能量、静态阈值截取长度。分别对基本的BP神经网络与贝叶斯算法的BP神经网络进行训练,当均方误差小于10-3时停止训练,得到两种网络的训练与学习过程如图2所示。比较两种算法训练过程可以看出贝叶斯算法的BP神经网络总共进行了269次训练,而基本的BP神经网络总共进行了2248次训练,可见引入贝叶斯算法后的BP神经网络的收敛速率大幅提升。与之前相同,用16组测试数据对两种网络宽度的量化误差进行比较,得到量化后缺陷误差如表3所示,贝叶斯算法BP神经网络量化达到误差的缺陷见表4。在对缺陷宽度进行量化的过程中,尽管量化得到的最大相对误差仍较大,采用贝叶斯算法的BP神经网络量化得到的缺陷宽度与设计值的误差明显小于基本的BP神经网络。

2.4深度的量化在对缺陷的深度进行量化时,采用统计分析的方法选取了缺陷的长度、宽度以及轴向变化漏磁场的两个峰谷值、波形面积、周向变化漏磁场峰值、峰谷值作为神经网络的输入信号,将缺陷深度作为网络的输出信号来对网络进行训练。对基本的BP神经网络与贝叶斯算法的BP神经网络进行训练,得到两种网络的训练与学习过程如图3所示。贝叶斯算法BP神经网络总共进行了4152次训练,基本的BP神经网络总共进行了8763次训练,尽管引入贝叶斯算法BP神经网络的训练过程仍旧较长,但比基本BP神经网络的收敛速率有所提升。用16组测试数据对两种网络深度的量化误差进行比较,得到量化后缺陷误差如表5所示,贝叶斯算法BP神经网络量化达到误差的缺陷见表6。从对缺陷深度量化结果可以看出,采用贝叶斯算法的BP神经网络对缺陷深度进行量化,得到的缺陷深度与设计值的误差小于基本的BP神经网络。

3结束语

第5篇:神经网络范文

本文主要介绍了人工神经网络的概念,并对几种具体的神经网络进行介绍,从它们的提出时间、网络结构和适用范围几个方面来深入讲解。

【关键词】神经网络 感知器网络 径向基网络 反馈神经网络

1 引言

人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新型信息处理体系。它实际上是一个由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统,通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能,利用这一特性,可以设计处具有类似大脑某些功能的智能系统来处理各种信息,解决不同问题。下面对几种具体的神经网络进行介绍。

2 感知器网络

感知器是由美国学者Rosenblatt在1957年首次提出的,感知器可谓是最早的人工神经网络。感知器具有分层结构,信息从输入层进入网络,逐层向前传递到输出层。感知器是神经网络用来进行模式识别的一种最简单模型,属于前向神经网络类型。

2.1 单层感知器

单层感知器是指只有一层处理单元的感知器,它的结构与功能都非常简单,通过读网络权值的训练,可以使感知器对一组输入矢量的响应达到元素为0或1的目标输出,从而实现对输入矢量分类的目的,目前在解决实际问题时很少被采用,但由于它在神经网络研究中具有重要意义,是研究其他网络的基础,而且较易学习和理解,适合于作为学习神经网络的起点。

2.2 多层感知器

多层感知器是对单层感知器的推广,它能够成功解决单层感知器所不能解决的非线性可分问题,在输入层与输出层之间引入隐层作为输入模式的“内部表示”,即可将单层感知器变成多层感知器。

3 线性神经网络

线性神经网络类似于感知器,但是线性

神经网络的激活函数是线性的,而不是硬限转移函数。因此线性神经网络的输出可以使任意值,而感知器的输出不是0就是1。线性神经网络最早的典型代表就是在1963年由美国斯坦福大学教授Berhard Windrow提出的自适应线性元件网络,它是一个由输入层和输出层构成的单层前馈性网络。自适应线性神经网络的学习算法比感知器的学习算法的收敛速度和精度都有较大的提高,自适应线性神经网络主要用于函数逼近、信号预测、系统辨识、模式识别和控制等领域。

4 BP神经网络

BP神经网络是1986年由以Rumelhart和McCelland为首的科学家小组提出的,是一种按误差逆传播算法训练的多层前馈网络,在人工神经网络的实际应用中,80%~90%的人工神经网络模型采用BP网络或者它的变化形式,它也是前向网络的核心部分,体现了人工神经网络最精华的部分,BP神经网络由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经过一步处理后完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者达到预先设定的学习次数为止。

BP网络主要应用于以下方面:

(1)函数逼近:用输入矢量和相应的输出矢量训练一个网络逼近一个函数。

(2)模式识别:用一个特定的输出矢量将它与输入矢量联系起来。

(3)分类:对输入矢量以所定义的合适方式进行分类。

(4)数据压缩:减少输出矢量维数以便于传输或存储。

5 反馈神经网络

美国加州理工学院物理学家J.J.Hopfield教授于1982年发表了对神经网络发展颇具影响的论文,提出一种单层反馈神经网络,后来人们将这种反馈网络称作Hopfield网。在多输入/多输出的动态系统中,控制对象特性复杂,传统方法难以描述复杂的系统。为控制对象建立模型可以减少直接进行实验带来的负面影响,所以模型显得尤为重要。但是,前馈神经网络从结构上说属于一种静态网络,其输入、输出向量之间是简单的非线性函数映射关系。实际应用中系统过程大多是动态的,前馈神经网络辨识就暴露出明显的不足,用前馈神经网络只是非线性对应网络,无反馈记忆环节,因此,利用反馈神经网络的动态特性就可以克服前馈神经网络的缺点,使神经网络更加接近系统的实际过程。

Hopfield神经网络的应用:

(1)在数字识别方面。

(2)高校科研能力评价。

(3)应用于联想记忆的MATLAB程序。

6 径向基神经网络

径向基RBF网络是一个3层的网络,除了输入、输出层之间外仅有一个隐层。隐层中的转换函数是局部响应的高斯函数,而其他前向网络,转换函数一般都是全局响应函数。由于这样的差异,要实现同样的功能,RBF需要更多的神经元,这就是RBF网络不能取代标准前向型络的原因。但是RBF网络的训练时间更短,它对函数的逼近时最优的,可以以任意精度逼近任意连续函数。隐层中的神经元越多,逼近越精确。

径向基网络的应用:

(1)用于曲线拟合的RBF网络。

(2)径向基网络实现非线性函数回归。

7 自组织神经网络

自组织竞争型神经网络是一种无教师监督学习,具有自组织功能的神经网络,网络通过自身的训练。能自动对输入模式进行分类,一般由输入层和竞争层够曾。两层之间各神经元实现双向连接,而且网络没有隐含层。有时竞争层之间还存在着横向连接。

常用自组织网络有一下几种:

(1)自组织特征映射网络。

(2)学习矢量量化网络。

(3)自适应共振理论模型。

(4)对偶传播网络。

参考文献

[1]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.

[2]周品.神经网络设计与应用[M].北京:清华大学出版社,2013.

作者简介

孔令文(1989-),男,黑龙江省齐齐哈尔市人。现为西南林业大学机械与交通学院在读研究生。研究方向为计算机仿真。

第6篇:神经网络范文

关键词:神经网络;RBF神经网络;高压断路器;故障诊断

中图分类号:TP3文献标识码:A文章编号:1009-3044(2009)25-7224-02

The Research and Application of RBF Neural Network

MA Yan-fang1,2, ZHOU Bing2

(1.Henan Polytechnic University, Jiaozuo 454000, China; 2.JiaoZuo University, Jiaozuo 454000, China)

Abstract: neural network is the mathematical simulation to human brain’s nervous system, its goal is to study and imitate human brain's information processing way. The paper introduced the principle and model of neural network, the learning process of RBF neural network as well as the training process of using RBF neural network to carry on fault diagnosis on high voltage circuit breaker.

Key words: neural network; RBF neural network; high voltage circuit breaker; fault diagnosis

神经网络是对人脑神经系统的数学模拟,其目的是学习和模仿人脑的信息处理方式。人们对神经系统的研究已经有了很长一段历史,早在十九世纪末,人们就开始认识到人脑包含着数量大约在1010-1012之间的神经元,他们有着复杂的联接,并形成一个整体,使得人脑具有各种智能行为,由三个区组成:细胞体、树突、轴突。一个神经元有多个树突,它们起感受作业即接受外部(包括其它神经元)传来的信息。轴突只有一条,用于传递和输出消息。神经元之间通过突触联结,突触是一个神经元轴突的末梢与另一个神经元的细胞体或树突相接触的地方,每个神经元大约有103-104个突触与其它神经元有连接,正是因为这些突触才使得全部大脑神经元形成一个复杂的网络结构。

由此可知,人脑神经系统的工作原理就是:外部刺激信号或上级神经元信号经合成后由树突传给神经元细胞体处理,最后由突触输出给下级神经元或做出响应。

人工神经网络的网络模型有很多种,如感知器网络、线性网络、BP网络、径向基函数网络(RBF网络)、自组织网络、回归网络等。本文介绍RBF网络的学习过程以及采用RBF神经网络进行高压断路器故障诊断的过程。

1 RBF神经网络的学习过程

对于RBF网络的数学描述可表达为:在n维空间中,给定N个输入样本Xi(i=1,2,…,N),则网络隐含层的第k个节点的输出可以表示为:

(1)

其中,Xi是n维输入向量;Tk是第k个隐层节点的中心,k=1,2,…,l;・通常为欧式范数。

R(・)即是RBF函数,具有局部感受的特性,体现了RBF网络的非线性映射能力。而网络输出层第j个节点的输出,则为隐含层节点到输出层的线性映射,即:

(2)

式中,wkj是隐含层到输出层的权值,θj是第j个输出节点的阈值,m是输出节点数。

最常用的RBF函数形式是Gauss函数:

(3)

它的可调参数有两个,即中心和宽度参数隐含层节点k的传递函数表达式为:

(4)

其中,X=(x1,x2,…,xn)―n维输入向量,Tki为节点k的中心Tk的第i个分量,σk为节点k的Gauss分布宽度,・表示欧式范数。

输出层节点j相应的输出则可以表示为:

(5)

由此可见,对于RBF网络来说,Tk、σk及w是最为重要的参数,设计RBF网络的任务就是用一定的学习算法来确定这三个参数。

设有N个训练样本,则系统对所有N个训练样本的总误差函数为:

(6)

式中,N为模式样本对数;L为网络输出节点数;tkp表示在样本p作用下的第k个神经元的期望输出;ykp表示在样本p作用下的第k个神经元的实际输出。

RBF网络的学习过程分为两个阶段:第一阶段是无教师学习,是根据所有的输入样本决定隐含层各节点的高斯核函数的中心向量ci和标准化常数σi;第二阶段是有教师学习,在决定好隐含层的参数后,根据样本,利用最小二乘原则,求出隐含层和输出层的权值wki。有时在完成第二阶段的学习后,再根据样本信号,同时校正隐含层和输出层的参数,以进一步提高网络的精度。下面具体介绍一下这两个阶段:

1) 无教师学习阶段

无教师学习也称为非监督学习,是对所有样本的输入进行聚类,求得各隐含层节点的RBF的中心向量ci。这里介绍k-均值聚类算法调整中心向量,此算法将训练样本集中的输入向量分为若干族,在每个数据族内找出一个径向基函数中心向量,使得该族内各样本向量距该族中心的距离最小。

算法步骤如下:

① 给定各隐节点的初始中心向量ci(0)和判定停止计算的ε;

② 计算距离(欧氏距离)并求出最小距离的节点;

(7)

式中,k为样本序号,r为中心向量ci(k-1)与输入样本x(k)距离最近的隐节点序号;

③ 调整中心

(8)

式中,β(k)是学习速率;, int(・)表示对(・)进行取整运算。可见,每经过q个取样本之后,调小一次学习速率,逐渐减至零;

④ 判定聚类质量

对于全部样本k(k=1,2,…,N)反复进行以上②, ③步,直至满足以下条件,则聚类结束。

(9)

2) 有教师学习阶段

有教师学习也称为有监督学习。当确定以后,训练由隐含层至输出层之间的权值,由上可知,它是一个线性方程组,则求权值就成为线性优化问题。因此,问题有惟一确定的解,不存在BP网络中所遇到的局部极小值问题,肯定能获得全局最小点。

类似于线性网络,RBF神经网络的隐含层至输出层之间的连接权值wki(k=1,2,…,L;i=1,2,…,q)学习算法为

(10)

式中,,Ri(x)为高斯函数;η为学习速率。可以证明,当0

2 高压断路器故障的训练

对高压断路器进行状态监测,获取12组故障样本数据,包括机构正常(ZC)、操作电压过低(GD)、合闸铁心开始阶段有卡涩(HKS)、操作机构有卡涩(CKS)、合闸铁心空行程太大(TD)、辅助开关动作接触不良(FK),其中前6组数据作为建立神经网络时的输入向量,二进制输出向量的位数由故障的种类数来决定,发生某种故障时其所对应的二进制位为1,其余位为0。利用

net=newrb(P,T,Goal,SPREAD)

建立神经网络,取误差目标值Goal为 0.01;RBF网络的分布密度SPREAD为0.6。

接下来对网络进行训练,用后六组数据如表1做为训练样本。输入到上面建立的RBF网络中。

训练结果如图1所示。

可见,经过10次的训练后,网络的输出已经达到预先设定的精度要求,结果如图1所示。输出结果如表2所示。

以表2中所示的样本序号3为例,当输入合闸铁心开始阶段有卡涩故障样本数据时,其输出结果中越接近1表明发生该故障的几率越大,因此可以看出发生HKS故障的几率最大。说明此RBF神经网络可以投入实际应用之中。

3 结束语

人工神经网络是模仿生物脑结构和功能的一种信息处理系统,已经在信号处理、目标跟踪、模式识别、机器人控制、专家系统等众多领域显示出极大的应用价值。本文介绍了RBF神经网络的学习过程,并给出了RBF神经网络在高压断路器故障诊断中的应用。

参考文献:

[1] 刘爱民,林苹,刘向东.基于(RBF)神经网络的自动化电器设备故障诊断方法[J].控制与监测,2005.(12):67-72.

第7篇:神经网络范文

关键词:ZISC78;径向基函数神经网络(RBFNN);实时;预报

1引言

神经网络是近年来得到广泛关注的一种非线性建模预报技术。它具有自组织、自学习、自适应和非线性处理、并行处理、信息分布存储、容错能力强等特性,对传统方法效果欠佳的预报领域有很强的吸引力。基于神经网络的非线性信息处理方法已应用于军事信息处理及现代武器装备系统的各个方面,并有可能成为未来集成智能化的军事电子信息处理系统的支撑技术。该技术在一些先进国家已部分形成了现实的战斗力。

船舶在波浪中航行,会受到风、浪和流的影响,因而将不可避免地发生摇荡运动。严重的摇荡会使船员工作效率下降、物品损坏、军舰的战斗力下降。如果能够预知未来一段时间船舶的运动情况,不仅有利于尽早采用先进控制算法控制舰载武器平台隔离船舶运动的影响,使其始终稳定瞄准目标,而且还可获得未来一个海浪周期内的船舶运动情况,以研究船载武器上层的控制策略,从而提高火力密度,因此,有必要研究在海浪中具有一定精度的海浪中船舶运动的短期预报。此外,如能有效准确地预报船舶的横摇运动,对于提高船舶的耐波性和适航性也有重要意义。

国内外学者也将神经网络用于船舶运动预报研究,但往往没有考虑实时性等实现问题,因而不能实用化。神经网络实现技术是神经网络研究的一个重要方面。神经网络实现可分为全硬件实现和软件实现两种。目前神经网络的实现还主要以软件模拟为主,由于现行的冯诺曼计算机体系结构不能实现并行计算,因而神经网络软件的实时应用还受到一定限制。

目前,一些著名集成电路制造公司如Intel、Mo-torola、松下、日立、富士通等均已推出自己的模拟或数字神经网络芯片,这些芯片无论在网络规模还是运行速度上都已接近实用化的程度,因而给神经网络应用的发展以极大的推动。由于舰载武器系统,需选用具有在片学习功能的神经网络芯片,即将网络训练所需的反馈电路及权值存储、计算和修正电路都集成在了一个芯片,因而可实现全硬件的、具有自学习能力的神经网络系统,也可以说,这是一种具有自适应能力的神经网络。

2ZISC78的功能及工作原理

ZISC78是由IBM公司和Sillicon联合研制的一种低成本、在线学习、33MHz主频、CMOS型100脚LQFP封装的VLSI芯片,图1所示是ZISC78的引脚排列图。ZISC78的特点如下:

内含78个神经元;

采用并行结构,运行速度与神经元数量无关;

支持RBF/KNN算法;

内部可分为若干独立子网络;

采用链连接,扩展不受限制;

具有64字节宽度向量;

L1或LSUP范数可用于距离计算;

具有同步/异步工作模式。

2.1ZISC78神经元结构

ZISC78采用的神经元结构如图2所示,该神经元有以下几种状态:

(1)休眠状态:神经网络初始化时,通常处于这种状态。

(2)准备学习状态:任何时侯,神经网络中的神经元都处于这种状态。

(3)委托状态:一个包含有原型和类型的神经元处于委托状态。

(4)激活状态:一个处于委托状态的神经元,通过评估,其输入矢量处于其影响域时,神经元就被激活而处于激活状态。

(5)退化状态:当一个神经元的原型处于其它神经元类型空间内,而大部分被其他神经元类型空间重叠时,这个神经元被宣布处于退化状态。

2.2ZISC78神经网络结构

从图3所示的ZISC78神经网络结构可以看出,所有神经元均通过“片内通信总线”进行通信,以实现网络内所有神经元的“真正”并行操作。“片内通信总线”允许若干个ZISC78芯片进行连接以扩大神经网络的规模,而这种操作不影响网络性能。

ZISC78片内有6bit地址总线和16bit数据总线,其中数据总线用于传输矢量数据、矢量类型、距离值和其它数据。

2.3ZISC78的寄存器组

ZISC78使用两种寄存器:全局寄存器和神经元寄存器。全局寄存器用于存储与所有神经元有关的信息,每片仅有一组全局寄存器。全局寄存器组中的信息可被传送到所有处于准备学习状态和委托状态的神经元。神经元寄存器用于存储所属神经元的信息,该信息在训练学习操作中写入,在识别操作中读出。

2.4ZISC78的操作

ZISC78的操作包括初始化、矢量数据传播、识别和分类等三部分。

初始化包括复位过程和清除过程。

矢量数据传播包括矢量数据输入过程和神经元距离计算过程。神经元距离就是输入矢量和神经元中存储的原型之间的范数。通常可选L1范数或Lsup范数:

其中,Xi为输入矢量数据,Xs为存贮的原型数据。

对于识别和分类,ZISC78提供有两种可选择的学习算法RBF和KNN。其中RBF是典型的径向基函数神经网络。在该RBF模式下,可输出识别、不确定或不认识的状态;KNN模式是RBF模式的限制形式,即在KNN模式下,新原型的影响域总被设为1,输出的是输入向量和存储原型之间的距离。需要指出的是,ZISC78具有自动增加或减小神经元个数以适应输入信号的分类和识别功能,神经元个数的最大值和最小值在全局寄存器组中设定。

2.5ZISC78的组网

一个ZISC78芯片内可以通过寄存器操作定义若干个独立的网络。若干个ZISC78芯片通过层叠可以组成一个更大的神经网络,组网芯片数量没有限制,小于10个ZISC78组网时,甚至连电源中继器件也不需要。所以,ZISC78具有最大的灵活性,能够满足不同的需要。

3仿真实例

为了验证ZISC78用于船舶运动实时预报的精度,本文对径向基函数神经网络预报进行了仿真,图4给出了基于径向基函数神经网络和船舶运动惯导实测信号预报的0.3秒(15步)误差曲线图。

通过以惯导实测数据ZHX_lg.dat为例预报0.3秒(15步)以后的船舶运动,作者运用相空间重构理论已经判断出本数据为非线性信号。

该仿真的最大预报误差方差为6.4666e-004,该数据可以满足战技指标。

第8篇:神经网络范文

关键词:BP神经网络;学习过程;模式识别;旋转机械;故障诊断

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2009)15-3982-02

The Study and Application of the BP Neural Network

HOU Zhi-bin, WEN Bi-teng, PENG-Hua, LI Chun-hou

(Department for Graduate Students of Artillery Academy, Hefei 230031,China)

Abstract: The manual NN as a highly integrated chiasma subject. Most of models about NN are adopting the BP network and the changed form at the practical appliance, which is also the hard core of forward network, incarnating the essential part of NN. The paper introduces the studying process of the BP network and uses the BP network for the mechanical failure diagnoses as assorted organ in the mode identification.

Key words: BP neural network; studying process; mode identification; revolving machine; failure diagnoses

1 引言

人工神经网络是一门高度综合的交叉学科,它的研究和发展涉及神经生理学、数理科学、信息科学和计算机科学等众多学科领域。

人工神经网络是模仿生物脑结构和功能的一种信息处理系统,虽然目前的模仿还处于低水平,但已显示出一些与生物脑类似的特点:1) 大规模并行结构与信息的分布式存储和并行处理,克服了传统的智能诊断系统出现的无穷递归、组合爆炸及匹配冲突问题,它特别适用于快速处理大量的并行信息。2) 具有良好的自适应性,系统在知识表示和组织、诊断求解策略与实施等方面可根据生存环境自适应、自组织达到自我完善。3) 具有较强的学习、记忆、联想、识别功能,系统可根据环境提供的大量信息,自动进行联想、书记及聚类等方面的自组织学习,也可在导师的指导下学习特定的任务,从而达到自我完善。4) 具有很强的容错性,当外界输入到神经网络中的信息存在某些局部错误时,不会影响到整个系统的输出性能。神经网络已经在信号处理、模式识别、目标跟踪、机器人控制、专家系统、系统辨识等众多领域显示出其极大的应用价值,作为一种新的模式识别技术或一种知识处理方法,神经网络在机械故障诊断中显示了其极大应用潜力。

目前,在人工神经网络的实际应用中,绝大部分的神经网络模型是采用BP网络和它的变化形式,它也是前向网络的核心部分,体现了人工神经网络最精华的部分。本文介绍BP网络的学习过程以及从模式识别角度应用BP神经网络作为分类器进行机械故障诊断。

2 BP神经网络的学习过程

有多层感知器可知,输入层中人以神经元的输出为输入模式分量的加权和。其余各层中,设某一层中任一神经元j输入为netj,输出为yi,与这一层相邻的低一层中任一神经元i的输出为yi。则有

如式(5)和式(6)所示,输出层中神经元的输出误差反向传播到前面各层,以各层之间的权值进行修正。

3 旋转机械故障的训练

表1是一组旋转机械故障的训练示例,表内的值表示各训练示例的特征值大小,其取值区间为[0,1],如在不平衡训练示例中,0~1/4倍频的振动幅值的当量值为0;1/4~3/4倍频的振动幅值的当量值为0;3/4~1倍频的振动幅值的当量值还为0;1倍频的振动幅值的当量值为0.9;2倍频的振动幅值的当量值为0.1;等等,其余类推。

将这些故障训练示例输入到一个具有8个输入节点,8个中间层节点和3个输出层节点的网络中,经过1200次迭代,形成了一个网络,该网络的记忆效果如表2所示,经过12000次迭代形成网络的记忆效果如表3所示。

表2中第一行表示,当输入一组不平衡故障时,得出该故障的置信度为0.94,而其他故障几乎为0;第二行表示,当输入一组油膜涡动故障时,得出该故障的置信度为0.96,而其他故障几乎为0;第三行表示,当输入一组不对中故障时,得出该故障的置信度为0.90,而其他故障几乎为0。表3中的结果有所改进,其值已趋于稳定。通过比较表2和表3,可看出训练中迭代次数越多,所得到的网络越能够更好的联想出训练示例。但训练次数不宜过长,只要满足精度要求,训练次应尽可能少,以减少训练时间。

4 结论

人工神经网络是模仿生物脑结构和功能的一种信息处理系统,并且已经在信号处理、模式识别、目标跟踪、机器人控制、专家系统、系统辨识等众多领域显示出其极大的应用价值。文章介绍了BP神经网络的学习过程,并给出了BP神经网络在旋转机械故障诊断中的应用。作为一种新的模式识别技术或一种知识处理方法,神经网络在机械故障诊断中显示了其极大的应用潜力。

参考文献:

[1] 王江萍.机械设备故障诊断技术及应用[M].西安:西北工业大学出版社,2001.

[2] 盛兆顺,尹琦岭.设备状态监测与故障诊断技术及应用[M].北京:化学工业出版社,2003.

[3] 温熙森.模式识别与状态监控[M].长沙:国防科技大学出版社,1997.

[4] 李孝安.神经网络与神经计算机导论[M].西安: 西北工业大学出版社,1994.

第9篇:神经网络范文

关键词神经网络;反向传播算法;PSO算法;适应度函数

人工神经网络是由人工神经元互连而成的网络,它从微观结构和功能上实现对人脑的抽象和简化,具有许多优点。对神经网络的权值系数的确定,传统上采用反向传播算法(BP算法)。BP网络是一种多层前向反馈神经网络,BP算法是由两部分组成:信息的正向传递与误差的反向传播。在反向传播算法中,对权值的训练采用的是爬山法(即:δ算法)。这种方法在诸多领域取得了巨大的成功,但是它有可能陷入局部最小值,不能保证收敛到全局极小点。另外,反向传播算法训练次数多,收敛速度慢,使学习结果不能令人满意。

粒子群优化算法(ParticleSwarmOptimizer,PSO)是一种进化计算技术(evolutionarycomputation)。源于对鸟群捕食的行为研究,PSO中,每个优化问题的解都是搜索空间中的一只鸟,我们称之为粒子。所有的粒子都有一个由被优化的函数决定的适应值(fitnessvalue),每个粒子还有一个速度决定他们飞翔的方向和距离。然后粒子们就追随当前的最优粒子在解空间中搜索。如果用粒子群算法对神经网络的权值进行训练,会得到较快的收敛速度,而且可以避免局部最值得出现。研究表明PSO是一种很有潜力的神经网络算法。

本文提出了一种基于PSO算法的BP网络学习算法,并通过MATLAB7.0实现对一组简单的向量进行训练对PSO—BP算法和BP算法进行了对比,试验结果说明PSO—BP算法适合训练BP网络,并且也有希望应用于其他种类的前向网络的训练。

1PSO算法

PSO中,每个优化问题的解都是搜索空间中的一只鸟。我们称之为“粒子”。所有的例子都有一个由被优化的函数决定的适应值(fitnessvalue),每个粒子还有一个速度决定它们飞翔的方向和距离。然后粒子们就追随当前的最优粒子在解空间中搜索。

D维搜索空间中,有m个粒子,其中第i个粒子的位置是,m,其速度为。将带入目标函数可计算出适应值。记第i个粒子搜索到的最优位置为,整个粒子群搜索到的最优位置为。离子状态更新操作为:

其中,i=1,2…,m,d=1,2…,D;是非负常数,称为惯性因子。也可以随着迭代线性减小;学习因子,是非负常数;r1,r2是介于[0,1]之间的随机数;是常数。

迭代中止条件一般选为最大迭代次数和粒子群迄今为止搜索到的最有位置满足适应阈值。

2基于PSO的BP网络学习算法

BP网络是一种多层结构的前向网络,其隐层神经元的激活函数为S型函数,而输出神经元的激活函数可以是S型函数,也可以实线性函数,典型的S型函数为:

(3)

其中:s为神经元的加权输入函数。

用PSO算法训练BP网络时,定义粒子群的位置向量的元素是BP网络的全体连接权和阈值。首先初始化位置向量,然后用PSO算法搜索最优位置,使如下均方误差指标(适应值)达到最小

(4)

其中,N是训练集的样本数;是第i个样本的第j个网络输出节点的理想输出值;是第i个样本的第j个网络输出节点的实际输出值;C是网络输出神经远的个数。

基于PSO算法的BP网络学习算法流程如下:

1)选定粒子数m;适应值阈值ε;最大允许迭代步数;、和;初始化X和V为(0,1)间的随机数。

8)endfor

9)fori=1:1:m

10)按式(1)计算;按式(2)计算;

11)endfor

12)endwhile

13)以所得权值阈值为初始值用BP算法对网络进行训练

上述流程中,1)到12)用标准PSO算法对权值和阈值进行训练,13)对PSO输出的权值和阈值作为初始值用BP算法训练网络(MATLAB中有集成的训练函数)。另外,,其中是第I个粒子的位置;V=,其中是第I个粒子的速度;是m个粒子迄今搜索到的最优适应值,其对应的粒子位置矩阵是p=;是粒子群迄今搜索到的最优适应值,对应的最优粒子位置是,粒子数m选定为30个。

3结果分析

本实例中随机选取机输入和输出矩阵,如:p=[00000;10001;01001;00100;00010];t=[0000;1000;0100;0010;0001]。由于P是五行的矩阵,所以网络输入层的神经元个数为:5个,T为五行矩阵,故输出层神经元个数为:5个,隐含层神经元个数为:6个。

首先观察一下PSO算法中的适应值(fitness)的变化过程,图1中,实线表示适应值的平均值,虚线表示是最优适应值。从图中可以看出适应值迅速的选择过程。

图2为用PSO—BP算法和BP算法在训练误差精度为0.002的情况下的误差演化曲线:(a)为PSO—BP算法训练误差演化曲线,所用时间是20.422000s。(b)为常用BP算法训练误差演化曲线,对权值的训练采用的是梯度下降法,所用时间是27.172000s。从图中可以看到:PSO—BP算法的迭代次数远远小于BP算法,并且训练时间也缩短了。

(a)

(b)

图2

为了充分说明实验结果,笔者做了多次反复实验,实验结果如下表:在训练误差精度为0.002的情况下,十次试验中PSO—BP算法的平均迭代次数远小于BP算法,收敛时间较接近。

算法

次数BP算法PSO—BP算法

迭代次数收敛时间迭代次数收敛时间

1158735.79700071719.547000

2105123.17200079433.390000

391718.28100068327.813000

480916.28200087933.265000

5132333.125000109730.218000

6214643.76600093126.046000

7116123.64100056817.391000

853014.68700073625.782000

9141526.75000086927.625000

10122724.17200095329.422000

平均值1216.625.967300822.727.04990

4结论

本次试验中对BP算法和PSO—BP算法进行了对比试验,试验结果证明:PSO—BP算法优于BP算法。具体表现在:学习算法的收敛速度有所提高;BP算法中的局部极小问题常令学习结果不满意,PSO的全局优化能力使问题得到解决。

参考文献

[1]MartinT.Hagan,HowardB.Demuth,MarkH.Beale,著,戴葵,等译.《神经网络设计》.机械工业出版社,2002年9月

[2]徐丽娜编著.《神经网络控制》.电子工业出版社,2003年2月

[3]高隽编著.《人工神经网络原理及仿真实例》.机械工业出版社,2003年8月

[4]ZbigniewMichalewicz,DavidB.Fogel著,曹宏庆,李艳,董红斌,吴志健,译.《如何求解问题——现代启发式方法》.中国水利水电出版社,2003年2月

相关热门标签