公务员期刊网 精选范文 神经网络的运用范文

神经网络的运用精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络的运用主题范文,仅供参考,欢迎阅读并收藏。

神经网络的运用

第1篇:神经网络的运用范文

关键词:物流;神经网络;Matlab;预测;多种模型

中图分类号:U294.1 文献标识码:A 文章编号:2095-1302(2016)01-00-02

0 引 言

现如今物流业的快速发展对人们的生活与产能经济都产生了重要影响,而整个物流链中的关键就是货运环节。影响货物运输的因素比较复杂,包括相关体制、交通条件、城市环境、产业布局等,这些因素在数学模型上是非线性且不确定的,于是给预测造成了较大困难。为了做好库存控制、信息管理的工作,在货物运输前对货运量进行预测是非常有必要的。

1 神经网络模型及其特点

1.1 系统概述

本文研究的预测模型是基于货运预测系统的,该系统的主要功能是将项目输入的数据确定为预测目标,并根据具体要求与有关资料动态分析出可执行计划,将预测结果保存到数据库备份。货运预测系统的具体结构包括初始数据模块、预测方法选择、结果处理模块、系统辅助管理及数据库模块等。系统结构图如图1所示。

图1 货运预测系统结构图

1.2 模型特点

神经网络分为单层前向网络(LMS学习算法)、多层前向网络(BP学习算法)、改进型神经网络等,其中BP神经网络是目前应用最广泛的模型之一,模型拓扑结构如图2所示。

图2 含有两个隐层的BP网络结构

多层前向网络是单层感知器的推广,解决了非线性可分问题,其由输入层、隐含层和输出层组成,其中隐含层可以为一层或多层。输入层中每个源节点作为激励单元,组成了下一层的输入信号,而该层的输出信号又成为后层的输入,以此类推。多层感知器中每个神经元的激励函数是可微的Sigmoid函数,见式(1)所示:

(1)

式中ui是第i个神经元的输入信号,vi是该神经元的输出信号。

BP学习过程具有工作信号正向传播、误差信号反向传播的特点。对于图2,设输入层任意一个输入信号用m表示,第一层、第二层、输出层任意神经元分别用i,j,p表示。按误差反向传播方向,从输出节点到隐含层的修正权值公式见式(2):

(2)

按Delta学习规则求得:

Δwjp(n)=ηδp(n)vj(n) (3)

其中,η是学习步长, vj(n) 可由信号的正向传播过程求得。

该系统的训练目标是总的平均误差能量Eav达到最小,。其中,ekp为网络输入第k个训练样本时输出神经元p的误差,N为训练样本的个数。

2 预测实例及结果分析

2.1 问题描述

货站是物流的一种重要形式,被认为是物流中心,包含着物资信息、资金流动等管理,这里取若干年的某货站数据进行预测并与实际结果对比,货运量走势如图3所示。

图3 近十年某货站物流量走势图

图中曲线很明显不适合做直线拟合,我们可运用指数平滑法、神经网络等进行外推预测。对于指数平滑法,历史数据影响程度逐渐减小,随着数据远离权数收敛趋近零,因此适用于短期预测;对于灰色模型,十分依赖于历史数据,其精度受原始数据的影响较大。本预测系统会根据输入数据的各项因子最终选择最合适的算法模型。下面就神经网络的一般预测步骤进行说明。

2.2 预测步骤

一般来说,BP算法的预测步骤如下:

(1)样本预处理。由于数据的评价标准或量纲不一样,所以需要对样本作归一化处理。可采取极差变换(xn-xmin)/(xmax-xmin)进行处理;

(2)样本分组。每组前m个值作为输入,后一个作为输出期望值;

(3)网络训练。使训练后的网络自适应样本数据的特征,网络训练状态如图4所示;

图4 网络训练状态

(4)得到预测值后。可通过对2001至2010年数据的网络训练,得到2011年的输出预测值。Matlab中仿真程序如下:

x=[105129.1 113918.7 121421.3 122757.9 122690.2 135560.5 159988.1 172152 210655.0 238749.2];

r=max(x)-min(x);

for n=1:length(x)

y(n)=[x(n)-min(x)]/r;

end

p=[y(length(x)-4) y(length(x)-3) y(length(x)-2) y(length(x)-1)]’;

L=length(p);

R1=zeros(1,L);

R2=ones(1,L);

R=[R1;R2]’;

t=y(length(x));

input=[y(length(x)-3) y(length(x)-2) y(length(x)-1) y(length(x))]’;

net=newff(R,[4,5,1],{‘logsig’,’logsig’,’purelin’},’trainlm’);

net.trainParam.show=20;

net.trainParam.lr=0.01;

net.trainParam.epochs=100; net.trainParam.goal=1.0e-030; net=train(net,p,t);

out=sim(net,input);

out=out*r+min(x);

(5)反归一化处理。由于第一步对样本进行归一化处理,则需要把结果还原,才能得到有效的预测值。

2.3 结果分析

最后得到2011年货运量预测值为259 137(吨)[实际值262 551(吨)],与指数平滑法的271 740(吨)相比误差由3.5%降为-1.3%。需要指出的是,增加隐含层的数目可以更加逼近非线性曲线提高映射能力,但多于某个值,会使整体预测性能降低。

3 结 语

货运预测影响因素的不确定性直接给预测系统的研究带来困难,人工神经网络模仿自人的大脑,具备自适应算法特性,拥有运算、推理、识别及控制等能力,若能将其很好地运用在货运预测方面,则能为物流业提供更大意义的帮助。

参考文献

[1] Simon Haykin.神经网络原理[M].叶世伟,史忠植,译.北京:机械工业出版社,2004.

[2]孙明玺.预测与评价[M].杭州:浙江教育出版社,2000.

[3]李采蓉.新的组合模型及在港口客流量预测上的应用[J].辽宁大学学报,2000,27(4):309-311.

[4]云俊,王少梅.物流系统的多目标预测[J].武汉理工大学学报(社会科学版),2001,14(3):243-245.

[5]骆温平.物流与供应链管理[M].北京:电子工业出版社,2002.

[6](美)Tom M.Mitchell.机器学习[M].曾华军,译.北京:机械工业出版社,2008.

[7](美)Martin T Hagan,Howard B.Demuth.神经网络设计[M].戴葵,等,译.北京:机械工业出版社,2005.

[8]党耀国,刘思峰,王正新.灰色预测与决策模型研究[M].北京:科学出版社,2009.

第2篇:神经网络的运用范文

关键词:神经网络;计算机网络;安全管理;应用

中图分类号:TP393.08

进入到信息时代,便捷的计算机网络技术不仅给人们的生活带来了极大的便利,但同时也容易遭到蠕虫病毒、木马病毒等破坏性极强的程序病毒攻击留下便利的通道,使得计算机网络安全面临巨大的威胁。鉴于此,要对计算机网络安全所面临的风险进行科学、合理以及准确的分析、评估,同时要采取相应的措施对面临的风险有效的进行防范,尽可能的减少由于计算机网络安全管理问题所带来的损失。另外,计算机网络安全受到很多种因素的影响,主要有病毒的入侵以及系统漏洞,更重要的是这些因素之间有很强的关联性,这也就导致计算机网络安全管理的问题逐渐趋于复杂化,在这种情况下,就必须要求计算机网络系统的管理者以及使用者对网络的安全进行有效的管理,更要对网络的安全性有清楚的认识和了解,切实的掌握影响计算机网络安全的因素。为了更好的解决计算机网络安全管理问题,神经网络逐渐被应用到计算机网络安全管理之中,使得对计算机网络安全管理更加准确和有效。

1 计算机网络安全管理概述

一般而言,计算机网路安全管理指的是计算机在连接网络后进行信息的交换、浏览以及下载的过程中,对信息安全进行有效的管理,防止信息被他人窃取或者破坏。随着信息时代的到来,越来越多的人对计算机产生了很强的依赖,从儿童到老年人,计算机的影响无处不在,随着计算机的普及,人们在使用计算机的过程中对其安全性就有了顾忌。对于计算机网络,只要连接互联网,随时都存在被攻击的可能,相对而言,没有任何计算机是绝对的安全或者是不受到任何的攻击。运用计算机网络技术进行攻击或者盗取个人信息或者是企业信息的事件几乎每年都会发生,计算机网络存在严重的安全隐患。所以,要及时的认识以及了解计算机网络面临的安全隐患,积极的采取相应的措施加强对计算机网络安全的管理。

2 神经网络在计算机网络安全管理应用的现状

2.1 对神经网络在计算机安全管理运用中的重视程度不够

计算机网络安全是因特网发展的最基础的目的,但与此同时近乎所有的计算机网络在开创以及不断的发展过程中都趋向于实用以及便利,相反却在一定程度上没有重视对计算机的安全管理,更没有将神经网络技术运用到计算机的安全管理中,进而对计算机网络的安全管理留下了严重的隐患。另外,神经网络在计算机网络安全管理中主要是对计算机的网络安全进行评估,然而由于不重视对神经网络在计算机网络安全管理中的运用,使得没有建立良好的计算机网络安全评价标准体系。

2.2 对神经网络在计算机网络安全评价模型的设计和实际运用不够合理

一般来说,神经网络在计算机网络安全管理中主要是对计算机网络安全进行一定的评估,在对其进行评估的过程中,就需要设计一定的计算机网络安全评价模型,主要包含对输入层、输出层以及隐含层的设计;但是,目前神经网络在计算机网络安全管理中对于评价模型的设计还没有将这三方面有效的联系起来。除此之外,对神经网络在计算机网络安全管理的实际运用中,不能科学、合理的实现计算机网络安全管理评价模型运用,不注重对评价模型的学习以及不关注对评价模型进行有效的验证。

3 加强神经网络在计算机网络安全管理中的应用采取的措施

3.1 神经网络在计算机网络安全管理中要科学、合理的设计网络安全评价模型

神经网络在计算机网络安全管理中要科学、合理的设计网络安全评价模型,以便更好的实现计算机网络安全、高效的运行。为此,计算机网络安全评价模型需要进行一下设计:首先是对输入层的设计,一般来说,神经网络在计算机网络安全管理运用中,对于输入层考虑的是神经元的节点数以及评价指标的数量,尽可能的使这两者数量保持一致。其次是对隐含层的设计,对于隐含层的设计需要注意的是若某个连续函数在任意的闭区间中,可以通过在隐含层里的神经网络来靠近,大多数情况下,神经网络通常运用的是单隐含层。最后是输出层的设计,神经网络的输出层设计主要是获得计算机网络安全管理评价的最终结果,例如可以设置计算机网络安全管理评价的输出层节点数为2,那么相应的输出结果(1,1)指的是非常安全、(0,1)指的是较不安全、(1,0)指的是基本安全以及(0,0)指的是非常的不安全。

3.2 神经网络在计算机网络安全管理运用中要对评价模型进行有效的验证

需要注意的是,神经网络在计算机网络安全管理运用中要对评价模型进行有效的验证,一般体现在一下几方面:首先是要关注评价模型的实现,为了实现神经网络在计算机网络安全管理中的良好运用,就要依据客户满意的评价模型,运用计算机网络技术创建设置含有输入层、隐含层以及输出层的神经网络模型,然后再对网络安全进行检验。其次是要注意对评价模型的学习,在对计算机网络安全进行评价之前,需要对神经网络进行标准化的处理,才能尽可能的减少对计算机网络安全管理评价中的误差。最后要注意对评价模型进行验证,当神经网络经过标准化处理以及在计算机网络安全评价之后,就需要对输出的结果进行一定的验证,以便确定神经网络对计算机网络安全的评价输出结果是否与期望的评价结果相一致,进一步验证神经网络在计算机网络安全管理中安全评价模型的准确与否。

3.3 重视神经网络在计算机网络安全管理运用以及建立健全安全评价标准体系

神经网络在计算机网络安全管理运用中主要的任务是对计算机网络的安全进行一定的评价,并且将评价的结果准确、及时的反馈给用户,所以就应该对其在计算机网络安全管理中的应用引起高度的重视,为此就应该建立健全计算机网络安全管理的评价标准体系。一方面是评价指标的建立,计算机网络安全管理是复杂的过程,同时影响计算机网络安全的因素比较多。因此,建立科学、合理以及有效的计算机网络安全管理评价标准,对于神经网络高效的开展评价工作有很大的关联。另一方面是对评价标准的准确化,影响计算机网络安全管理的因素非常的多,就应该对各种评价标准进行细化,以达到评价的准确。

4 结束语

综上所述,通过神经网络对计算机网络安全的评价,可以有效的对计算机网络安全进行管理。运用神经网络技术手段,提高了计算机网络安全管理的效率,并且在运用神经网络的过程中建立健全安全评价标准体系、注重对评价模型进行有效的验证以及加强对计算机网络安全评价模型的设计,切实的提升计算机网络安全管理水平。

参考文献:

[1]毛志勇.BP神经网络在计算机网络安全评价中的应用[J].信息技术,2008(06).

[2]周忠.神经网络技术在网络安全中的应用[J].科技致富向导,2010(32).

[3]赵冬梅,刘海峰,刘晨光.基于BP神经网络的信息安全风险评估[J].计算机工程与应用,2007(01).

[4]楼文高,姜丽,孟祥辉.计算机网络安全综合评价的神经网络模型[J].计算机工程与应用,2007(32).

[5]沈宗庆,刘西林.基于BP神经网络的分销商绩效指标评价及应用[J].华东交通大学学报,2007(04).

第3篇:神经网络的运用范文

关键词:BP神经网络、图像分割、特征提取

Abstract: the image recognition process including the image preprocessing, feature extraction, image understanding and analysis. Which BP artificial neural network in the image segmentation using better; In the feature extraction phase BP neural network is also very good find application, and obtain the better feature extraction results; In the image understanding and the analysis phase using neural network classifier design, can get accurate classification results.

Keywords: BP neural network, image segmentation, feature extraction

中图分类号:TP183 文献标识码:A文章编号:

引言

BP人工神经网络算法是现今应用较为广泛的多层前向反馈式神经网络算法,BP人工神经网络有较好的容错能力、鲁棒性、并行协同处理能力和自适应能力,受到了国内外众多领域学者的关注。由于神经网络高效率的集体计算能力和较强的鲁棒性,它在图像分割方面的应用已经很广泛,Jain和Karu采用了多通道滤波与前向神经网络相结合的方法实现图像纹理分割算法。神经网络算法在特征提取阶段,压缩特征数量,以提高分类速度和精度。在图像识别领域中神经网络作为分类器的研究也得到了很大的进展,尤其是其学习能力和容错性对于模式识别是非常有利的,在一定程度上提高了训练速度和识别率。Le Cun等人提出了多层特征选择(Multilayer Selection Procedure)方法用于字符识别,每一层神经网络处理较低层次的特征,获取该层特征信息并传给上一层。

BP神经网络的基本原理

人工神经网络的研究起源于对生物神经系统的研究,它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制可以模仿人的神经系统的动作过程,以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络的学习过程实际上就是不断地调整权值和阈值的过程。根据有无训练样本的指导可以将神经网络的学习方式分为两种:监督学习方式和非监督学习方式,也称为有导师指导学习方式和无导师指导学习方式。监督学习方式,是在给定固定的输入输出样本集的情况下,由网络根据一定的学习规则进行训练学习,每一次学习完成后,通过对比实际的输出和期望的输出,以此决定网络是否需要再学习,如果还没有达到期望的误差,则将实际误差反馈到网络,进行权值和阈值的调整,使实际的误差随着学习的反复进行而逐步减小,直至达到所要求的性能指标为止。非监督学习方式,是在没有外界的指导下进行的学习方式,在学习过程中,调整网络的权重不受外来教师的影响,但在网络内部会对其性能进行自适应调节。

BP神经网络分类器的设计

BP神经网络是基于误差反向传播算法(Back Propagation Algorithm,BPA)的多层前向神经网络,由输入层、输出层、一个或多个隐含层所组成。BP神经网络结构确定之后,通过对输出和输入样本集进行训练,反复修正网络的权值和阈值,达到学习训练的期望误差,以使网络能够实现给定的输入输出映射关系。BP人工神经网络的学习过程分为两个阶段,第一阶段是输入己知的学习样本数据,给定网络的结构和初始连接权值和阈值,从输入层逐层向后计算各神经元的输出;第二阶段是对权值和阈值进行修改,即根据网络误差从最后一层向前反馈计算各层权值和阈值的增减量,来逐层修正各层权值和阈值。以上正反两个阶段反复交替,直到网络收敛。具体实现步骤如下:

(1) 网络的初始化:首先对输入的学习训练样本进行归一化处理,对权值矩阵W和阈值向量赋初值,将网络计数器和训练次数计数器置为1,网络误差置为0。

(2) 输入训练样本,计算输入层,隐含层以及输出层的实际输出。

(3) 计算网络输出误差。将实际的输出和期望的输出值进行对比,采用均方根误差指标作为网络的误差性能函数。

(4) 若误差还没达到期望标准,则根据误差信号,逐层调整权值矩阵和阈值向量。

(5) 若最终调整之后的网络输出达到了误差范围之内,则进行下一组训练样本继续训练网络。

(6) 若全部的训练样本训练完毕,并且达到了期望的误差,则训练结束,输出最终的网络联接权值和阈值。

BP神经网络可以逼近任意连续函数,具有很强的非线性映射能力,而且BP神经网络中间层数、各层神经元数及网络学习速率等参数均可以根据具体情况设定,灵活性较强,所以BP神经网络在许多领域中广泛应用。一般来说,神经网络方法应同传统的人工智能方法相联系的。神经网络本身结构及性能上的特点使其对问题的处理更富有弹性,更加稳健。神经网络的基本特点是采用自下而上的设计思路,使其容易确定具体的目标分割或识别算法,在增加了不确定因素的同时也产生了网络最优化的问题,这就是所谓的伪状态(pseudo-trap)。尽管在实践中并非所有的伪状态对应完全失败的结果,但是毕竟这不符合对之完美的或者说合理的期望。人工智能则一般采用自上而下的方法,偏重于逻辑推理建立系统模型。因此将神经网络同人工智能结合起来,相当于赋予神经网络高层指导的知识及逻辑推理的能力,具有潜在的优势。

输入层中间层 输出层

图1 BP人工神经网络结构

BP神经网络的训练

4.1 BP神经网络的设计

BP神经网络的设计主要包括两方面内容:一是神经网络结构的确定,特别是隐含层层数及隐含层单元数目的确定;二是高精度收敛问题,隐含层和隐含层单元数过多,将导致训练时间过长并出现过度拟和的问题,隐含层单元数过少又导致网络收敛速度慢甚至不收敛,达不到误差精度要求。在确定隐含层层数以及隐含层单元数目时,没有一个严格的理论依据指导,需要根据特定的问题,结合经验公式确定大致范围来进行逐步试算比较得到。

4.2 数据预处理

为了加快网络的训练速度,通常在网络训练前进行神经网络输入和输出数据预处理,即将每组数据都归一化变为[-1,1]之间的数值的处理过程。

4.3 神经网络的训练

%当前输入层权值和阈值

inputWeights=net.IW{1,1}

inputbias=net.b{1}

%当前网络层权值和阈值

layerWeights=net.LW{2,1}

layerbias=net.b{2}

%设置训练参数

net.trainParam.show = 1000;%限时训练迭代过程

net.trainParam.lr = 0.1; %学习率,缺省为0.01

net.trainParam.epochs = 100000; %最大训练次数,缺省为100

net.trainParam.goal = 0.001; %训练要求精度,缺省为0

[net,tr]=train(net,P,T);%调用 TRAINGDM 算法训练 BP 网络

A = sim(net,P) %对 BP 网络进行仿真

E = T - A;%计算仿真误差

MSE=mse(E)

结束语

BP网络因为具有较强的学习性、自适应型和容错性,在很多领域均已经大量运用。本文将BP人工神经网络运用于图像的识别,探索人工神经网络在图像识别领域中的重要的现实意义。研究表明,BP人工神经网络应用于图像识别在一定程度上提高了识别的效率和准确率。但是,BP神经网络算法还存在以下几点不足之处:(1)权的调整方法存在局限性,容易陷入局部最优;(2)网络的结构需要提前指定或者在训练过程中不断的修正;(3)过分依赖学习样本,由于学习样本是有限的或者学习样本质量不高,那么会导致训练达不到效果;(4)对于规模较大的模式映射问题,存在收敛速度慢、容易陷入局部极小点、判断不准确等缺陷。总之,如何解决以上问题,如何进一步提高识别精度,扩大识别范围,使之更具有更好的工程实用性,是有待进一步研究的内容。

参考文献:

[1] WE Blanz,S L Gish.A Connectionist Classifier Architecture Applied to Image Segmentation.Proc.10th ICPR,1990,272-277.

[2] Y Le Cun,L D Jackel,B Boser,J S Denker,H P Graf,I Guyon,D Henderson,R E Howard,and W Hubbard,Handwriten Digit Recognition:Applications of Neural Network Chips and Automatic Learning,IEEE Comm.Magazine.Nov.1989.

[3] A K Jain and K Karu,Automatic Filter Design for Texture Discrimination,Proc.12th Int’l Conf.NeuralNetworks,Orlando,Oct.1994,454-458.

[4] 边肇其,张学工.模式识别(第二版)[M].清华大学出版社,北京.1999,12.

[5] 陈书海,傅录祥.实用数字图像处理[M].科学出版社,北京.2005.

[6] 万来毅,陈建勋.基于BP神经网络的图像识别研究[J].武汉科技大学学报(自然科学版).2006,6.

[7] 丛爽.面向MATLAB工具箱的神经网络理论与应用(第2版)[M].北京:中国科学技术出版社,2003.

[8] 王娟,慈林林等.特征方法综述[J].计算机工程与科学.2005.27(12).68-71.

[9] 贾花萍.基于神经网络的特征选择与提取方法研究[J].网络安全.2008,7.33-35.

[10] 龚声荣,刘纯平等编著.数字图像处理与分析[M].清华大学出版社,北京.2006.7.

第4篇:神经网络的运用范文

在上世纪九十年代初期,利用数学知识将感知器模型的弊病全面提出,致使社会各界对于人工神经网络的探究非常少。另一方面,针对逻辑运算的人工神经网络研究存在一定的弊端,一直没有被大家发现,因此,致使人工神经网络探究工程进入严重的低谷期。

关于人工神经网络技术飞速发展时期,九十年代初期,对于人工神经网络技术的弊端予以充分解决,尤其是Hopefield的人工神经网络技术模型的提出,致使对于互联网的稳定性以及收敛性的探究有了充分的理论依据。而且将人工神经网络模型全面应用到具体的实践中,并且得到全面推广,同时,将科学技术和人工神经网络进行有机结合,使人工神经网络技术更加具有可研究性。

2关于人工神经技术的构造以及典型模型

互联网人工神经技术的构造的组成包括以神经元件为主,同时,这项包含多种神经元结构的互联网信息处理技术是可以并行存在的。每一个具体的人工神经元件可以单一输出,还可以和其他的神经元件相结合,并且具有非常多的连接输出方法,每一种连接措施都会有相应的权系数。具体的人工神经网络技术的特点有:(1)针对每一个节点i,都会有相应的状态变量Xi存在;(2)节点j到节点i之间,是相应的权系数Wij存在;(3)在每一个节点i的后面,具体存在相应的阈值θi;(4)在每一个节点i的后面,存在变换函数fi(Xi,Wijθi),但是,通常情况来说,这个函数取fi(∑,WijXi-θi)的情况。

3将人工神经网络技术进行全面使用

互联网的人工神经网络技术具有独特的结构和处理措施,具体包括在:自动控制处理和网络技术模式识别、模型图像处理和相应的传感器信号处理技术。信号处理技术和机器人控制处理技术、地理领域和焊接、在电力系统应用和相关数据挖掘、军事和交通行业、农业和气象行业等多个领域纷纷体现出其卓越的贡献。

ART人工神经网络技术的运用。人工神经网络技术ART在网络语音和网络图像、文字处理和具体识别等方面,得到广泛的应用;同时,在工业处理系统中也有相应的应用,例如,在工业系统中的故障诊断和故障检测以及事故警报等情况的控制;人工神经网络ART技术还应用在数据挖掘方面,在相关数据中挖掘最稳定和最有意义的模式。具体的神经网络技术ART的优势为:网络技术处理能力高、稳定性强以及聚类效果非常好。

4结束语

第5篇:神经网络的运用范文

介绍了基于神经网络的故障针诊断方法和结合模糊理论应用的故障诊断。分析了小波变换的现代模拟电路软故障诊断的研究现状。

关键词:

模拟电路;软故障诊断;神经网络;模糊理论;小波变换

在最近几年,现代模拟电路故障诊断方法的研究成为了新的热点。其中有基于神经网络。并结合专家系统、小波变换、模糊理论和遗传算法。“小波神经网络”和“模糊神经网络”成为主流的模拟电路软故障诊断方法。

1基于神经网络的故障诊断方法

神经网络有自组织性、自学性、并行性、联想记忆和分类功能,这些信息处理特点使其能够解决一些传统模式难以解决的问题。其中模拟电路故障诊断中的非线性和容差问题就是运用神经网络的非线性映射能力和泛化能力来解决的,同时这也是专家门的较为感兴趣的研究热点。基于神经网络的模拟电路故障诊断方法有一些,其中包括测试节点的选择、确定被测故障集、故障特征的提取等步骤,这种方法与基于测前仿真的故障字典法雷同。前者用制作神经网络和样本集来储存特征信息,而且在测试完毕后定位故障是通过神经网络来处理。所以可以把基于神经网络的方法当作是基于测后仿真和测前仿真的延伸与综合。在故障诊断领域,误差反传神经网络(backpropagationneuralnetwork,BPNN)拥有较好的模式分类特性。然而仅仅以节点电压视作故障特征训练的BPNN只能适用于诊断模拟电路的硬故障。在软故障方面,一般需要基于神经网络和多种特征提取方法的综合应用来诊断。

2基于模糊理论应用的模拟电路软故障诊断

在一些故障诊断问题中,模糊规则适合描述故障诊断的机理。模糊理论中的模糊运算、模糊逻辑系统、模糊集合拥有对模糊信息的准确应付能力,这使得模糊理论成为故障诊断的一种有力工具。神经网络与模糊理论相结合,充分发挥了模糊理论和神经网络各自的优点,并以此来弥补各自的不足,这就是所谓的“模糊神经网络”。这种方法的基本思想是在BPNN的输出层和输入层中间增加一到两层模糊层构造模糊神经网络,分别利用神经网络和模糊逻辑处理低层感知数据与描述高层的逻辑框架,这样一来跟神经网络分类器相比,“模糊神经网络”对模拟电路软故障诊断效果的优势就非常明显。通过一个无监督的聚类算法自组织地确定模糊规则的数目并生成一个初始的故障诊断模糊规则库,构造了一类模糊神经网络,通过训练调整网络权值,使故障诊断模糊规则库的分类更加精确,实现了电路元件的软故障诊断。

3基于小波变换的模拟电路软故障诊断

小波变换是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的"时间-频率"窗口,是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征,能对时间(空间)频率的局部化分析,通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,解决了Fourier变换的困难问题,成为继Fourier变换以来在科学方法上的重大突破。若满足时,则由经过伸缩和平移得到的函数成为小波函数族。小波变换具有时域局部特征,而神经网络具有鲁棒性、自学习、自适性和容错性。如何把二者的优势结合起来一直是人们所关注的问题。一种方法是用小波变换对信号进行预处理,即以小波空间作为模式识别的特征空间,通过小波分析来实现信号的特征提取,然后将提取的特征向量送入神经网络处理;另一种即所谓的小波神经网络或小波网络。小波神经网络是神经网络与小波理论相结合的产物,最早是由法国著名的信息科学研究机构IRLSA的ZhangQinghu等人1992年提出来的。小波神经用络是基于小波变换而构成的神经网络模型,即用非线性小波基取代通常的神经元非线性激励函数(如Sigmoid函数),把小波变换与神经网络有机地结合起来,充分继承了两者的优点。近几年来,国内外有关小波网络的研究报告层出不穷。小波与前馈神经网络是小波网络的主要研究方向。小波还可以与其他类型的神经网络结合,例如Kohonen网络对信号做自适应小波分解。

由于神经网络、小波变换、模糊理论在当今的发展上还不是很完善,例如在诊断中,模糊度该如何准确地定量化,对小波变换之后故障信号进行怎样构造能体现故障类别的特征等,因此这些基于神经网络的诊断方法或多或少地存在一些局限性。一般来说,神经网络方法的长处并不是提高诊断精度,而且无论运用什么方法,在选取状态特征参量和确定电路故障集方面,传统的故障诊断方法仍然具有理论上的指导意义。所以,抽取合理的故障特征比构造合适的神经网络更为重要。

参考文献:

[1]梁戈超,何怡刚,朱彦卿.基于模糊神经网络融合遗传算法的模拟电路故障诊断法[J].电路与系统学报,2004,9(2):54-57.

[2]谭阳红,何怡刚.模拟电路故障诊断的小波方法[J].电工技术学报,2005,20(8):89-93.

第6篇:神经网络的运用范文

【关键词】混合时滞 神经网络 稳定性分析

【中图分类号】G642 【文献标识码】A 【文章编号】2095-3089(2016)04-0237-02

人工神经网络是基于人脑的功能,通过建构与生物神经元类似的电路结构,从而在微观的层次上实现对人类智能的仿真。神经网络是由神经元的相互连接而形成的,反映在数学中,神经元实质上就是适当的函数,也被称为激活函数。神经网络在模式识别、优化计算、智能控制以及联想记忆等领域得到了广泛的应用,发展前景非常的广阔[1]。

一、混合时滞神经网络发展的脉络

稳定性研究的开始可以追溯到十九世纪末期的Lyapunov理论和Poincare理论,在我国对稳定性进行充分研究的是著名物理学家钱学森,钱学森在其著名的《工程控制论》中,明确指出,稳定性是系统控制的第一要求。美国的著名数学家LsSalle也说过,吸引全世界的数学家注意的点就是稳定性。由此可见,稳定性在数学研究中具有极其重要的作用[2]。

大部分的动力系统都会随着时间的演化不仅依赖于系统的当前状态,并且还会依赖于系统过去的某个时刻,这就是被科学家们称作的时滞动力系统。在工程系统中,时滞一般是指对测控过程中的测量时滞、形成控制决策所需要的时滞以及信号传输中的时滞等,这也是为什么大部分的动力学系统都需要时滞动力系统来进行描述的主要原因。事实上,时滞系统的初始状态空间是一个无限维的空间,而且没有特殊的性质,因此对其进行理论分析非常困难 [3]。

二、混合时滞神经网络稳定性的发展研究分析

系统的稳定性在神经网络的应用中非常的广泛,如最优化的问题研究、模式识别研究以及图像处理研究等,都需要运用系统的稳定性。在上个世纪,有很多文献都给出了不同类型神经网络的稳定性判据,最著名的当属Hopfield神经网络。神经网络规模的应用范围也在不断的扩大,人们对时滞神经网络模型的研究也越来越深入。时滞通常是由定时的时滞发展到连续分布的时滞。当前神经网络稳定性的研究领域运用的主要方法就是Lyapunov泛函,然后再利用不同的不等式来对不等式进行分析,从而得到具有稳定性的数据[4]。

在优化问题的应用中,需要根据问题的基本特征,对设计所要求的神经网络达到唯一的、全局的渐进稳定的平衡点。当神经网络应用于实时的计算时,为了有效的提高收敛的速度,就需要神经网络必须具有非常高的指数收敛度。这也是时滞神经网络的全局渐近稳定性与全局指数稳定性研究如此吸引人的最为主要的原因。时滞反馈网络的应用和研究需要大量的具有稳定性的数据作为基础,因此,人们需要在不断扩展的网络模型的条件下放宽对网络中所有参数和激励函数的限制。只有这样,才能更好的促进神经网络研究的快速发展[5]。

目前,对时滞反馈神经网络解的稳定性进行判别和分析的主要方法是Lyapunov方法,在进行判别和分析时,需要同时结合泛函数的分不等式稳定性理论来推导网络解的稳定性,通过这一方法能够将稳定性的研究放到某个适当的定义系统的轨迹上,而且通过对这些泛函数的研究分析,能够得到稳定性的相应条件。这些稳定性条件的最常用的表述形式就是我们经常用的线矩不等式、系数矩阵的范数不等式以及Hanalay微分不等式。在这一研究领域,由于线矩不等式方法对系统的参数的限制比其它方法要少,而且比较容易验证,因此,这种方法在稳定性理论的研究中应用的非常的广泛[6]。

三、混合时滞神经网络的稳定性分析研究

最近几年,随着人们对稳定性研究的进一步发展,人们对于驱动-响应系统的同步问题更加的重视,而且经过大量的实践和理论分析,人们发现驱动-响应系统是包含同样的激活函数的。但是,在实际的模型中,驱动-响应系统却含有不同的激活函数,需要对非恒同的情况进行分析研究,也就是说驱动-响应系统的激活函数含有不相匹配的参数,致使对混沌系统的同步控制变得更加的复杂。由此可知,研究混合时滞神经网络的稳定性是非常有必要的[7]。

如下混合时滞神经网络

其中,是神经元的状态,

。在(1)中,是定义在上的实值内部函数。代表离散时滞,表示分布时滞;代表外部输入;;,,,分别代表连接权矩阵,离散时滞连接权矩阵和分布时滞连接权矩阵。

对于如下两种情形的时滞,

第一种情形是,如果所有的和给定的标量 、h>0和,

是一个可微函数,且满足以下条件:,,

是一个连续函数且满足以下条件

。 。

第二种情形是,如果所有的和给定的标量 、h>0和,且和都是连续的函数,且函数和函数满足以下条件:

假设是系统(1)的平衡点,那么会得到如下系统

根据上面的条件我们可以得出对于混合时滞神经网络系统(2), 在满足一定条件的第一种情况和第二种情况下,它的平衡点是全局指数稳定的 [8]。

时滞神经网络的稳定性在理论和实践方面都得到了广泛的研究,但是对混合时滞的神经网络模型稳定性的研究并不是很多。除此之外,在神经网络稳定性的研究领域,虽然有很多大量的判别条件,不过由于大部分的条件都需要采用计算矩阵范数的方法来进行,在进行验证的时候也比较的困难,而且限制条件也非常的严格,在实际中的应用比较少。通过利用线性矩阵不等式研究神经网络的稳定性能够在很大程度上克服以上提及的缺点,所得到的条件更少保守,并且更容易得到充分的验证[9]。

线性矩阵不等式的研究在最近几年受到人们的广泛关注的原因,既有理论方面的原因,也有实践方面的原因。从理论上来说,人们可以利用很多的矩形运算技巧来对线性矩阵不等式问题进行研究和推理;但是,从实际的观点来说,线性矩阵不等式问题也可以凭借数值算法并借助电脑的强大的运算能力从而快速、有效的求出数值解,最终使得线性矩阵不等式的求解变得更加的容易控制,从而使问题的解决更加可行。假设可以将一个复杂的问题转换成线性矩阵不等式问题,那么就能够利用Matab的LMI Toolbox进行求解了。

运用线性矩阵的不等式对混合时滞条件下的神经网络的稳定性进行研究分析,可以充分掌握神经网络的全局指数的稳定性。通过建构新的Lyapunov-Krasovkii泛函,利用随机微分与矩阵变换技巧导出线性矩阵不等式的稳定性数据。由于线性矩阵不等式的稳定性数据比利用矩阵范数进行估计的判据更为保守,因此,人们可以利用MATLAB提供的线性矩阵不等式工具箱进行求解验证,从而真正应用于实践[10]。

人们按照Lyapunov的稳定性理论,建构了新型的Lyapunov-Krasovskii泛函。从而对混合时滞条件下神经网络的稳定性进行了科学、合理的分析。在对混合时滞条件下的神经网络的稳定性进行分析时,线性矩阵不等式的应用为对时滞稳定性的进一步研究提供了有利的条件。同时,对网络中所包含的随机扰动采用了随机微分公式的讨论模式,从而使得混合时滞条件下的神经网络能够应用Lyapunov的稳定性讨论技巧与方法。在模型中对激活函数或者连接权矩阵的限制对混合时滞条件下的神经网络的研究深有帮助,而且采用线性矩阵不等式的表示方式,比之前的矩阵范数的判别条件要更加的有利。

四、结语

综上所述,混合时滞条件下的神经网络的稳定性分析是以Lyapunov的稳定性理论与线性矩阵不等式技术为基础,同时利用积分不等式的方法,对混合时滞条件下的神经网络的稳定性进行了科学、合理的分析,并给出了时滞依赖指数稳定性的基本准则,从而将对混合时滞条件下的神经网络的稳定性的研究又向前推进了一大步。

参考文献:

[1]武志鹏.带有混合时滞的神经网络的稳定性分析[D].山西大学,2008.

[2]刘晓琳.混合变时滞神经网指数稳定性分析[D].曲阜师范大学,2009.

[3]王宁,孙晓玲.基于LMI的混合时滞随机神经网络指数稳定性[J].计算机仿真,2010,07:125-129.

[4]张金.具混合时滞的随机神经网络的稳定性分析[J].苏州大学学报(自然科学版),2011,02:16-22.

[5]吴文娟,刘德友,张静文,刘海涛.具有混合时滞的随机Hopfield神经网络的稳定性分析[J].兰州理工大学学报,2011,03:89-93.

[6]陈一鸣,徐增辉,赵所所,周志全.具有混合时滞随机离散神经网络的渐近稳定性分析[J].郑州大学学报(理学版),2011,04:33-38.

[7]耿立杰,李海颖,张晓静,苏广.具有混合时滞的随机反应扩散神经网络指数稳定性[J].工程数学学报,2014,05:687-696.

[8]龙述君,张永新,向丽.具有混合时滞的随机细胞神经网络的稳定性分析[J].四川师范大学学报(自然科学版),2012,06:796-801.

第7篇:神经网络的运用范文

关键词:科技型创业企业;信用评价;BP神经网络

中图分类号:F27

文献标识码:A

文章编号:16723198(2015)23006203

1 引言

目前,科技型创业企业已成为推动国民经济持续健康发展的重要动力之一,然而在其发展和壮大过程中也最容易出现制约其发展的问题。由于科技型创业企业需要大量的资金投入,融资问题已成为影响其是否取得成功的关键因素。在国内企业取得融资的有限渠道中,银行和金融市场起着至关重要的作用,但往往由于市场信息的不对称以及企业信息不透明等因素的限制,出于规避高昂的监督成本和收益的高度不确定性等风险,银行和金融机构在放贷额度中给予科技型创业企业的融资额度相对有限。由于科技型创业企业的研发周期长,在缺乏有效的外部融资的状况下,即使项目有大好投资前景,企业也有较大的失败风险,最终无法发挥出科技型创业企业对企业技术创新的促进作用。因此,对国内科技型创业企业进行信用评价,建立适合其特征的信用评价模型,来提高其信用水平、财务信息透明度、拓宽其融资渠道十分必要。目前国内针对企业信用评价的研究有了一定的发展,但统一的主要针对科技型创业企业信用评价的指标体系和评价模型尚未形成。

传统的企业信用评价模型主要有专家打分法、信用评级方法和信用评分方法等,现代的信用评价模型主要有:KMV模型、财务比率分析模型、Logit回归模型、神经网络模型、模糊综合评价法和AHP(Analytical Hierarchy Process)法。由于企业的信用风险与反映企业信用风险状况的各项指标变量之间通常具有非线性的关系,而上述企业信用评价方法都不能有效解决变量之间的非线性关系,也不能有效解决指标变量存在的非正态分布问题。由于神经网络模型在解决变量间的非线性关系问题中具有优越性,在Odom(1990年)运用神经网络模型解决企业信用评价问题之后,神经网络模型逐渐获得了相关实践者和学者的极大关注。Tam(1991)、Kiang(1992)、Datta(1991)和Shekhar(1992)将神经网络模型用于银行破产预测,Altman(1994)将其用于对意大利企业经营成败状况进行预测,取得了比多元判别分析模型预测结果更加准确的结果。根据小微型科技企业信用状况的特点,何跃、蒋国银(2005)运用人工神经网络原理构建了三层BP神经网络信用评价模型,该模型的优点是具有较强的自学习和非线性处理能力,针对小微型科技企业信用状况的预测具有较高的预测结果。国内许多学者(鲍盛祥、殷永飞,2009;庞素琳,2012)认为,在变量之间是非线性关系的情况下,人工神经网络模型的精度优于传统的统计方法。

2 BP神经网络概述

BP神经网络具有准确性高、误差小、收敛速度快的显著优势,相比其他企业信用评价方法,BP神经网络模型的自学习能力和自联想功能较强,也不要求样本数据呈正态分布、满足先验概率已知以及协方差相等要求,同时也具有能够有效解决非线性分类问题、对样本数据容量不做具体要求等优势,是处理企业信用评价问题的理想方法。因此,本文使用BP神经网络来建立适合科技型创业企业的信用评价模型。

神经网络内部依次为输入层、隐含层、输出层,BP神经网络属于前向反馈神经网络,BP神经网络的学习算法包含了正向和反向传播两个过程,正向传播过程即为:指标变量信息由输入层经隐含层各神经元传向输出层,前层神经元的处理结果只对后层神经元的结果产生影响,如果最后输出层产生的结果与期望输出不符,则自动转变为反向传播过程。反向传播即为:将输出误差经隐含层神经元向输入层逐层反馈,在此过程中,网络会将误差均摊给各层的每一个神经元,从而网络可以取得各层神经元传来的误差信号,网络将其作为修正各神经元权值的依据,经过权值的不断调整使网络完成训练。权值的调整过程持续到预先设定的学习次数或输出误差减小到可接受程度为止。三层前馈BP神经网络的结构如图1所示。其中,X=(x1,x2,……,xn)代表输入向量,Y=(y1,y2,……,ym)代表输出向量,n和m分别代表输入和输出向量的维数。不同层间的神经元属于全互联接,每层次内的神经元没有任何连接。

来衡量其信用的高低。反映科技型创业企业经营和财务状况的财务指标具体包括偿债能力、盈利能力、营运能力和成长能力等方面。本文在借鉴现有企业信用评价研究成果并结合科技型创业企业的特征,选择出16项可以有效反映科技型创业企业特点的财务指标。为解决某些财务指标变量间高度的相关性问题,本文通过SPSS 19.0软件,使用因子分析法对这些指标变量进行分析和整理,在删除那些与科技型创业企业信用状况不相关或与其他指标高度相关的指标后,本文最终确定了包含12项指标变量的指标体系作为下文对科技型创业企业的信用状况进行评价的指标体系(如图1所示)。但由于保留的指标变量间还可能存在多重共线性问题,为保证评价结果的准确性、可靠性,本文再次对其进行因子分析来提取公因子,以特征根大于1且累计方差贡献率大于80%作为提取公因子的标准,通过分析本文提出了5个能够体现原始变量的主要信息的公因子,它们即为下文评价模型中的输入变量。

由于选取的样本企业的各项财务指标包含了不同的量纲和数量级,本文首先将各指标变量进行标准化处理,从而使各个指标变量都具有共同的数值特性。本文运用的标准化方法如下式所示:

Xij=xij-xjσj,其中,Xj为原始数据的均值,Xj=1ni=1xi,σj为原始数据的标准差,σj=1nni=1(xij-xj)。

4 科技型创业企业信用评价实证分析

4.1 BP神经网络的设计

BP神经网络可以根据实际情况来设置一个或者多个隐含层,当样本较多时,增加一个隐含层可以显著减小网络规模。由于包含单个隐含层网络可以通过适当调增神经元个数来实现任意非线性映射,所以,包含单个隐含层的神经网络即可解决大部分场合下问题。因此本文建立的BP神经网络模型包含单个隐含层。

(1)输入层和输出层神经元个数。输入层神经元个数等于输入变量的个数,由于本文得到了5个公因子,因此输入层神经元数n=5。输出层神经元的个数m取决于科技型创业企业信用评价结果类别。本文用输出“1”表示中小企业信用正常,用输出“0”表示中小企业信用较差,因此本文建立的模型的输出层神经元的个数为1。

(2)隐含层神经元个数。隐含层神经元个数的确定目前还没有一个理想的解析式,通常根据经验公式来确定。

常用的经验公式为:n1=n+m+a,其中m为输出层个数,n为输入层个数,a为[1,10]之间的常数,有上文可知,m=1,n=5,代入公式可知隐含层个数的取值范围为(3,13),经过实际对比分析,当隐含层选10时,训练误差较小,因此,本文设定隐含层个数为10。

(3)训练函数的选择。本文建立的BP神经网络模型的输入层和输出层函数均为Sigmoid函数,并设定最大训练步长epoch=1500。

(4)样本原始数据来源。本文选择了100家在创业板和新三板上市的科技型创业企业的财务数据作为实证样本数据进行训练,各项数据取自于瑞思数据库和东方财富Choices数据库。为了确保能够得到可靠、准确的训练结果,样本企业行业的选取包含了电子、化工、制药、家电、生物科技、机械制造、金属加工等多个行业部门,能够反映科技型创业企业的特征。

4.2 实证分析与结果输出

本文运行Matlab2014a版本并运用编写的程序将100家企业各自的5项主因子作为输入变量,对网络进行训练和检验并对训练样本进行了仿真。本文将前90家企业数据作为训练样本来训练网络,将后10家企业数据作为检验样本代入网络以检验网络的预测精度。对于得出的预测结果设定以0.5为分界值,如过大于05,则将公司判定为信用好的企业,反之则判定为信用差的企业。由图2可知网络可以以较快的速度实现收敛。

为了抵消随机因素的影响,本文取相同的训练参数和测试样本代入网络重复运算20次,统计正确率和迭代次数(如图3所示),20次训练结果如表2。

由网络20次训练结果(表2)可知,使用BP神经网络模型对实证样本数据进行预测的结果和期望输出对比后,模型的平均正确率达到83%,预测精度较高,适合作为预测科技型创业企业信用状况的评价模型。实证结果表明,利用BP神经网络对科技型创业企业进行信用评价,具有较高的可操作性和准确性。

5 结论

本文在借鉴国内外现有的企业信用评价理论和相关研究成果的基础上,结合科技型创业企业的特点构建了适合对其进行信用评价的指标体系,然后在运用因子分析提取反映企业信用状况的公因子作为代入模型的指标变量,据此建立了BP神经网络信用评价模型,通过对国内100家在创业板和新三板上市公司的实际数据进行分析,得出的实证结果表明使用BP神经网络对科技型创业企业进行信用评价的平均正确率可以达到83%,具有较高的准确率和可操作性。因此,金融机构可以据此加强对科技型创业企业的信用评价,筛选优秀的科技型创业企业借款人以降低信用风险,同时也可改善科技型创业企业与金融机构之间的信息不对称程度,使科技型创业企业能够获得更多的融资机会,促使其能够以健康的方式持续的发展,进而充分发挥出其促进企业技术创新的作用。

参考文献

[1]庞素琳.信用评价与股市预测模型研究及应用统计学、神经网络与支持向量基方法[M].北京:科学出版社,2005.

[2]迟国泰,章穗,齐菲.小企业贷款信用评价模型及实证研究―基于最优组合赋权视角[J].财经问题研究,2012,(9):5357.

[3]李菁苗,吴吉义,章剑林等.电子商务环境下中小企业信用评价[J].系统工程理论与实践,2012,(3):555560.

[4]刘湘勤,龙海雯.银行结构、信用环境与中小企业发展:基于中国跨省数据的实证分析[J].西北大学学报(哲学社会科学版),2007,(6):159161.

[5]谭庆美,吴金克,赵黎明.基于BP神经网络的中小企业信用评价研究[J].西北农林科技大学学报(社会科学版),2009,(5):5762.

[6]邢乐成,梁永贤.中小企业融资难的困境与出路[J].济南大学学报(社会科学版),2013,(2):17.

第8篇:神经网络的运用范文

【摘要】 将小麦叶片原始光谱经过预处理后,采用主成分分析(PCA)对数据进行降维,取前3个主成分输入小波神经网络,建立了基于主成分分析和小波神经网络的近红外多组分预测模型(WNN);进一步研究了小波基函数个数的选取(WNN隐层节点数)对小波神经网络模型性能的影响,并将WNN模型与偏最小二乘法(PLS)和传统的反向传播神经网络(BPNN)模型进行了比较。结果表明,所建立的WNN模型能用于同时预测小麦叶片全氮和可溶性总糖两种组分含量,其预测均方根误差(RMSEP)分别为0.101%和0.089%,预测相关系数(R)分别为0.980和0.967。另外,在收敛速度和预测精度上,WNN模型明显优于BPNN和PLS模型,从而为将小波神经网络用于近红外光谱的多组分定量分析奠定了基础。

【关键词】 小波神经网络, 主成分分析, 近红外光谱, 小麦叶片, 全氮, 可溶性总糖

本文系教育部新世纪优秀人才支持计划(No.NCET080797)、国家自然科学基金(No.30871448)、国家科技支撑计划(No.2008BADA4B02)、江苏省创新学者攀登计划(No.BK20081479)和江苏省自然科学基金(No.BK2008330)资助

1 引 言

近红外光谱(NIR)分析技术以其快速、环保、可多组分同时检测等优点[1],在各个领域得到了广泛应用[2]。NIR属于弱信号,信息提取必须依靠化学计量学才能实现,传统的定量校正方法,如偏最小二乘法(PLS),仅适用于线性模型,而实际应用中却存在很多非线性关系[3]。人工神经网络可解决连续非线性函数的逼近,在多组分分析中优势明显,其中反向传播(BP)算法是采用最多也是最成熟的神经网络训练算法之一[4],但是BP网络(BPNN)存在着易陷于局部最小和收敛速度慢等弱点[5,6]。

小波神经网络(Wavelet neural network, WNN)已经在化学领域得到了广泛应用[7,8]。小波神经网络综合了小波多尺度分析和神经网络自学习的优点,因而具有比传统神经网络更快的收敛速度和更强的逼近性能。已有的多组分预测模型大都采用PLS方法[9]和传统BP网络[10,11],而将小波神经网络用于近红外光谱定量分析的报道较少。小波神经网络用于函数优化时,其输入层的维数和小波基函数都不能太多,否则会大大增加模型参数[12]。主成分分析(Principal component analysis, PCA)是对光谱数据压缩和信息提取的有效方法[13],通过提取少数几个主成分(即原始变量的线性组合),并把它们作为小波神经网络的输入,既可以保证输入数据的精度,又可以大大加快神经网络的收敛速度[14,15]。

本研究首先运用主成分分析方法(PCA)从预处理后的小麦叶片近红外光谱中提取主成分,以达到降维目的;然后将降维后得到的主成分作为小波神经网络的输入,建立基于主成分分析和小波神经网络的近红外多组分预测模型,以用于同时预测小麦叶片全氮和可溶性总糖含量;最后通过与PLS方法和传统神经网络的比较分析,检验小波神经网络模型的收敛速度和预测精度。

2 理论部分

2.1 主成分分析

主成分分析(PCA)是一种数据压缩的常用方法,通过少数几个主成分(即原始变量的线性组合)解释多变量的方差, 即导出少数几个主成分,使它们尽可能完整地保留原始变量的信息,且彼此间不相关,以达到简化数据的目的。将该方法结合神经网络用于近红外光谱定量分析,既能保证输入数据的精度、减少训练时间,又能简化网络结构[13]。

2.2 小波神经网络理论

小波神经网络(WNN)是将小波理论与人工神经网络的思想相结合而形成的一种新的神经网络[7]。它将传统神经网络中的隐层节点激励函数(如Sigmoid函数)用小波函数Ψ来代替, 图1 小波神经网络结构

Fig.1 Structure of wavelet neural network相应的输入层到隐层的权值及隐层阈值分别由小波函数的伸缩参数a与平移参数b所代替,而输出层通常为线性神经元,它将隐层的小波伸缩系进行线性叠加形成输出结果。对于一个单隐层的神经网络,假设有p个输入节点,h个隐层节点,q个输出节点,则小波神经网络的结构如图1所示,其输出表达式见公式(1):fk(x)=∑hj=1wjk[ψ(∑pi=1xi-bjaj)](1)其中,xi(i=1, 2, …, p)为输入层第i个输入变量,k =1, 2, …, q,h为隐层节点数,Ψ为隐层的小波基函数,wjk是隐层第j个节点到输出层第k个节点的连接权值,bj和aj分别是小波函数的平移参数(隐层节点的阈值)和伸缩参数(输入层到隐层节点的权值)。由此可见,小波网络可调整的参数包括wjk、bj和aj,共有3×h个,它们通过最小均方误差函数得到优化。本研究选择常用的Morlet小波函数[16]作为小波神经网络的隐层激励函数,该小波是余弦调制的高斯波,时频域分辩率较高。

3 实验部分

3.1 样品和仪器

3.1.1 样品来源 样品采自以下2个小麦田间试验,于主要生育期获取小麦不同叶位的叶片共144份,杀青烘干后粉碎过40目筛,用自封带密封后置于干燥器中备用。实验1 2006~2007年在江苏南京市农林局试验站(南京市江宁区,118°59′E,31°56′N)进行。土壤有机质含量1.01%、全氮含量0.11%、速效氮含量90.3 mg/kg、速效磷含量40.3 mg/kg、速效钾含量100.3 mg/kg,前茬水稻。供试品种为宁麦9号和豫麦34号,试验设4个施氮水平,分别为0, 90, 180和270 kg N/ha纯氮 (ha为公顷),两因素随机区组排列,3次重复,每小区面积约为23 m2,基本苗1.5×106 株/ha,行距25 cm。氮肥基追比2∶1∶1,追肥时期为拔节期和孕穗期,各占25%。各处理配施105 kg/ha P2O5和80 kg/ha KCl,全部用作基肥。其它管理措施同高产小麦田。实验2 2007~2008年在南京农业大学江浦试验站(南京市浦口区,118°37′E,32°02′N)进行。土壤有机质含量1.95%,全氮含量0.08%,速效磷含量13.4 mg/kg,速效钾含量48.9 mg/kg,前茬玉米。供试品种为宁麦9号,设4个施氮水平,分别为0, 90, 180和270 kg/ha 纯氮,两因素随机区组排列,3次重复,每小区面积约为16 m2,基本苗1.5×106株/ha,行距25 cm。氮肥基追比1∶1,追肥时期为拔节期,占50%。各处理配施150 kg/ha P2O5和 150 kg/ha K2O,全部用作基肥。其它管理措施同高产小麦田。

3.1.2 光谱采集和化学值测定 光谱采集用Thermo Nicolet 5700 FTIR近红外光谱仪(自带OMNIC 7.2集成软件和内径2.5 cm、高5 cm的专用石英杯)。光谱采集前,先在室温下开机预热约1 h,然后将过筛样品装入石英杯,容量约1/3,用专用砝码压紧,置于样品台上扫描,每次采集前均用镀金内壁作背景。扫描范围10000~4000 cm-1,分辨率4 cm-1,每次光谱采集扫描64次,每份样品重复采集光谱9次,取平均值代表该样品的光谱,以吸光度的格式存储于计算机中。 图2 叶片样品近红外吸光度谱图

Fig.2 Near infrared absorbance spectra of leaf samples所有光谱数据都转化为波长形式,范围为1000~2500 nm,数据点间隔取为1 nm,因而所有的样品光谱就组成了一个144行1501列的矩阵。图2为144份样品的近红外原始光谱图。

样品全氮含量(TNC)采用凯氏微量定氮法测定,可溶性总糖含量(TSSC)采用蒽酮比色法测定[17]。每份样品每个指标重复测定3次,取平均值作为该样品化学值(各组分含量单位均为%),样品集的全氮和可溶性总糖含量变化范围分别为0.60%~4.32%和0.50%~4.78%。

3.2 数据处理与分析

运用马氏距离法[18]剔除奇异样品后,对NIR光谱进行多元散射校正和Norris一阶导数滤波处理,然后采用PCA方法将光谱压缩成若干主成分,最后将降维后的主成分分别作为小波神经网络和BP网络的输入节点,全氮和可溶性总糖两个化学组分作为输出节点,进行网络训练后得到模型,同时利用预处理后的光谱进行PLS建模。本研究中涉及到光谱预处理方法、PCA和神经网络算法均在Matlab 7.0下编程实现。

3.2.1 样品集的划分 为了减少偶然误差、提高模型精度,首先运用马氏距离法[18]从采集到的144份样品中剔除5份奇异样品,剩下139份样品,再从中随机选择出100份作为校正集,其余39份作为检验集。

3.2.2 光谱预处理 光谱预处理方法的选择关系着模型的预测性能。为了消除光谱散射、平移和偏转,减少环境噪声对光谱的干扰,通过对样品光谱预处理方法的多次选择,发现采用多元散射校正(MSC)[19]和Norris一阶导数[20]处理后的光谱建模效果最好,处理结果见图3。因此,在用1000~2500 nm全谱区进行建模前,采用上述方法对光谱进行预处理。

3.2.3 光谱主成分的提取 光谱经过预处理后,用PCA方法提取其主成分,结果如表1所示,前3个主成分累计贡献达99.69%,可代表样品光谱,因而可将前3个主成分(原变量的线性组合)经标准化处理后作为网络的输入节点。由此可以确定,小波神经网络的输入层节点数应为3,依次对应于3个主成分;而输出层节点数是2,对应于全氮和可溶性总糖两个化学组分。为了与PLS方法和传统神经网络进行比较, 图3 经预处理后的叶片NIR光谱

Fig.3 Near infrared spectra after preprocessing利用光谱仪自带的TQ化学计量学软件建立PLS模型,同时将PCA提取的3个主成分作为三层BP神经网络的输入。表1 光谱数据前3个主成分的贡献率

3.3 模型性能的优化与评价

为保证模型的整体性能,本研究通过“剔一法”(Leaveoneout)得到的交互检验均方根误差RMSECV(Root mean square error of crossvalidation)来优化建模参数;而模型的预测性能,则通过预测均方根误差RMSEP(Root mean square error of prediction)和相关系数R(Correlation coefficient)来评价,计算公式如下:RMSECV=∑Mi=1(Oi-Pi)2M-1(2)

RMSEP=∑Ni=1(Oi-Pi)2N(3)式中M,N分别表示用于建模和检验的样品数, Oi, Pi分别为样品i化学组分的观测值(Observed value)和预测值(Predicted value)。

4 结果与讨论

4.1 隐层节点数的选取

隐层节点数(h)对神经网络的整体性能影响巨大,但是目前还无明确理论来指导h的选值[21]。 h过多可能造成训练时间过长和过拟合; h过少又可能导致训练达不到要求[22]。对于小波神经网络, h就是小波基函数的个数。可以依据小波分析方法,事先确定小波基函数的个数,但是一般不宜超过10,因为h的增加会大大增加小波神经网络模型的参数[14]。本研究为了找到最佳h,在实际操作中,比较了基于不同h(h≤10)所建模型的RMSECV,见图4a;而对于传统的BP网络,则尝试了取不同的h(h≤15)进行建模,见图4b。进一步将RMSECV最小时的h确定为最佳h,由此获得小波神经网络和BP网络的最佳h分别为5和7(图4)。

4.2 神经网络参数的确定

神经网络参数关系着模型的预测性能,关于小波神经网络参数的选取方法,已有众多报道[23,24]。本研究中,两种神经网络都采用三层结构,其中,小波神经网络的隐层小波基函数采用时频域分辩率较高的Morlet函数[16,24];BP网络隐层传递函数分别采用常用的Tansig函数,输出层采用Purelin函数。为了便于比较两种网络模型的性能,经过反复尝试,并综合考虑网络稳定性和训练时间,将学习速率均设为0.01,网络优化算法选择LevevbergMarquardt算法,最大训练次数都为1000,期望误差为0.001。

4.3 模型性能的检验与评价

用WNN模型对39个测试样品的全氮(TNC)和可溶性总糖含量(TSSC)进行了预测,结果如图5。从预测均方根误差(RMSEP)和相关系数(R)可以看出,小波神经网络模型的拟合精度较。

a. 全氮(Total nitrogen content); b. 可溶性总糖(Total soluble sugar content)。综合比较了WNN模型和BPNN模型的收敛时间(Time)、达到期望误差时的训练次数(Iteration, Iter)以及PLS模型对39份测试样品的预测性能(RMSEP和R) (表2)。可见,两种神经网络模型的预表2 WNN模型、PLS模型和BPNN模型的表现比较测精度都高于PLS模型,因为PLS是线性回归方法,而在近红外光谱上,尽管官能团特征吸收频率的位置是基本固定的,但是样品各组分化合物之间的关系复杂,会发生不同程度的缔合作用,如诱导效应、空间位阻效应和氢键效应等[25],这些因素决定了叶片样品近红外光谱与各组分之间的非线性关系,人工神经网络可以有效克服这种非线性干扰[3];从综合收敛速度和预测精度来看,WNN模型均优于传统的BPNN模型[26]。即,在保证不发生过拟合的前提下,要达到同样的期望误差,小波神经网络所用的训练时间和训练次数均少于传统的BP网络;而经过同样的训练次数,小波神经网络达到的预测精度也会比BP网络高。因为传统BP网络的隐层基函数一般为Sigmoid函数(本研究为Tansig函数),这类函数相互不正交,权重的学习容易出现峡谷型误差曲面,导致收敛速度变慢,也很难保证非线性系统的唯一解。而小波神经网络的基函数是小波函数,它具有快速衰减性,局部逼近能力也就更强;另一方面,小波基函数是正交或者近似正交的,权重之间相关冗余度很小,且小波神经网络的误差函数是关于权值的凸函数,不存在局部极小点,因而收敛速度更快。

4.4 小结

本研究将小波神经网络引入到近红外光谱的多组分分析模型中,建立了能同时预测小麦叶片全氮和可溶性总糖含量的小波神经网络(WNN)模型,并对WNN模型的整体性能与表现进行了检验和比较。结果表明,WNN模型预测结果可靠,可用于小麦近红外光谱的多组分预测;与偏最小二乘法(PLS)和传统神经网络模型(BPNN)相比,小波神经网络模型具有更好的全局收敛性和预测精度,从而为近红外光谱的多组分定量分析提供了新的建模方法。

参考文献

1 Yan YanLu(严衍禄). Near Infrared Spectroscopy and its application(近红外光谱分析基础与应用). Beijing(北京): China Light Industry Press(中国轻工业出版社), 2005: 1~115

2 Zhu XiaoLi(褚小立), Tian GaoYou(田高友), Yuan HongFu(袁洪福), Lu WanZhen(陆婉珍). Chinese J. Anal. Chem.(分析化学), 2006, 34(9): S175~S178

3 PérezMarín D, GarridoVaro A, Guerrero J E. Talanta, 2007, 72(1): 28~42

4 Marengo E, Bobba M, Robotti E, Lenti M. Anal. Chim. Acta, 2004, 511(2): 313~322

5 Xu Lu(许 禄), Shao XueGuang(邵学广). Methods of Chemometrics(化学计量学方法). Beijing(北京): Science Press(科学出版社), 2004: 279~298

6 Phua P K H, Ming Daohua. IEEE Transactions on Neural Networks, 2003, 14(6): 1460~1467

7 Tabaraki R, Khayamian T, Ensafi A A. Dyes and Pigments, 2007, 73 (2): 230~238

8 Balabin R M, Safieva R Z, Lomakina E I. Chemometrics and Intelligent Laboratory Systems, 2008, 93(1): 58~62

9 Wang JiaJun(王家俊), Liang YiZeng(梁逸曾), Wang Fan(汪 帆). Chinese J. Anal. Chem.(分析化学), 2005, 33(6): 793~797

10 Liu BoPing(刘波平), Qin HuaJun(秦华俊), Luo Xiang(罗 香), Cao ShuWen(曹树稳), Wang JunDe(王俊德). Chinese J. Anal. Chem.(分析化学), 2007, 35(4): 525~528

11 Dou Y, Sun Y, Ren Y, Ren Y. Anal. Chim. Acta, 2005, 528(1): 55~61

12 Zhang Q. IEEE Transactions on Neural Networks, 1997, 8(2): 227~236

13 He Y, Li X, Deng X. Journal of Food Engineering, 2007, 79(4): 1238~1242

14 Wang W, Paliwal J. Biosystems Engineering, 2006, 94(1): 7~18

15 Dou Y, Mi H, Zhao L, Ren Y, Ren Y. Anal. Biochem., 2006, 351(2): 174~180

16 Subasi A, Alkan A, Koklukaya E, Kiymik M K. Neural Networks, 2005, 18(7): 985~997

17 Li HeSheng(李合生). The Principle and Technology of Physiological and Biochemical Experiment of Plant(植物生理生化实验原理和技术). Beijing(北京): Higher Education Press(高等教育出版社), 2000: 186~197

18 Smith B M, Gemperline P J. Anal. Chim. Acta, 2000, 423(2): 167~177

19 Fernandez J E, Badiali M, Guidetti A, Scot V. Nuclear Instruments and Methods in Physics Research, 2007, 580(1): 77~80

20 Norris K H, Williams P C. Cereal Chemistry, 1984, 61(2): 158~165

21 Janik L J, Cozzolino D, Dambergs R, Cynkar W, Gishen M. Anal. Chim. Acta, 2007, 594(1): 107~118

22 Wen Xin(闻 新), Zhou Lu(周 露), Wang DanLi(力), Xiong XiaoYing(熊晓英). MATLAB Design for Neural Networks application(MATLAB神经网络应用设计). Beijing(北京): Science Press (科学出版社), 2001: 225~232

23 Xu J, Daniel W C H. Neurocomputing, 2002, 48: 681~689

24 Tabaraki R, Khayamian T, Ensafi A A. Journal of Molecular Graphics and Modelling, 2006, 25(1): 46~54

第9篇:神经网络的运用范文

只有清楚地了解电梯控制系统的运行原理才能够及时准确的诊断出电梯故障原因,因此清楚的了解电梯运行原理,每一个电梯维修人员必须要做到。电梯运行过程总体上可分为以下几个阶段:第一、登记层外召唤信号和登记内选指令阶段;第二、电梯门关闭或者电梯按照系统指令停运阶段;第三、启动阶段;第四、在到达信号记录的楼层前进行减速制动;第五、平层开门阶段。在整个过程中电梯需要从外界接收信号并处理,然后完成相应的指令或者输出信号,由此可以将电梯看作是一个完整的独立的系统,只需要外界给予相应的信号就可以自动的做出动作。电梯系统内部复杂的构件紧密的结合在一起,正是如此才使得电梯系统故障具有了复杂性、层次性、相关性以及不确定性的特点。

二、神经网络技术基本原理

生物学上的神经是由一个个简单的神经元相互连接进而形成了复杂的庞大的神经系统,同理,神经网络就是由大量简单的处理单元相互连接形成的复杂的智能系统。单独的处理单元类似于一个神经元,是一个可以接受不同信息但是只输出一种信息的结构单位。神经网络系统与生物学神经系统相似的是具有自我修改能力,它可以同时接收大量的数据并进行统一的分析处理,进而输出相应的处理结果。这就使得神经网络系统具有了高度容错性、高度并行性、自我修改性、学习性以及高度复杂性,也正是由于这些特性才使的利用神经网络技术能够及时准确的查明电梯故障原因并得出故障解决方案。电梯故障诊断中应用的神经网络模型分为三个层次:输入层、接收外部信号或者是电梯自我检测信息(如载重信息);隐含层、对接收到了大量数据进行相应的分析处理;输出层、将记录着动作命令的数据传送出来。在电梯出现故障时,首先可以通过神经网络模型快速确定故障发生在哪一层达到节约时间的目的。但是神经网络也会因为收敛速度过于慢、训练强度太大或者是选择的网络模型不好等问题导致诊断结果受到影响。

三、神经网络模型在电梯故障诊断中的应用分类

神经网络模型已经成为了如今电梯故障诊断中应用最广泛的技术模型,相比于传统方式它具有诊断速度快、故障原因命中率高的优点,因此引起了各方面专业人士的强烈关注,并在他们的不懈努力下得到了发展与创新。它跨越多个专业领域、通过对各种复杂的高难度工作的不断的发展与改进出现了越来越多的应用模型,下面主要介绍了当前应用最普遍的BP网络模型,并且简单的引入并介绍了近年来新兴的模糊神经网络模型和遗传小波神经网络模型。

(一)BP网络模型

BP神经网络作为神经网络应用最广泛的一种,它多应用的误差反向传播算法使其在模式识别、诊断故障、图像识别以及管理系统方面具有相对先进性。基于BP网络的电梯故障诊断技术就是通过学习故障信息、诊断经验并不断训练,并将所学到的知识利用各层次之间节点上的权值从而表达出来。BP网络系统的主要诊断步骤主要可以分为三步。第一步:对输入输出的数据进行归一化处理,将数据映射到特定的区间。第二步:建立BP网络模型,训练BP网络模型。第三:通过已经训练好的网络模型对原来的样本进行全面的检测。算法步骤:a、在一定的取值范围内对数据进行初始化;b、确定输入值数值大小,计算出预期输出量;c、用实际输出的值减去上一步得到的数值;d、将上一步得到的误差分配到隐含层,从而计算出隐含层的误差;e、修正输出层的权值和阈值,修正隐含层的权值;f、修正隐含层的阈值,修正隐含层和输入层的权值。

(二)遗传小波神经网络模型

遗传算法运用了生物界的优胜劣汰、适者生存的思想对复杂问题进行优化,适用于复杂的故障,起到了优化简化问题的作用。对局部数据进行详细的分析是小波法最大的特点,所以它被誉为“数字显微镜”。遗传算法小波神经网络就是运用小波进行分解的方法分解模拟故障信号,将得到的数据进行归一化,将归一化后的数值输入到神经网络模型中。它融合了神经网络、小波分析和遗传算法三者所有的优点。基于遗传小波神经网络的电梯故障诊断的一般步骤为:测试节点信号采样、小波分解、故障特征量提取、归一化得到训练样本集、遗传算法优化、得到故障类型。遗传小波神经网络模型在故障原因复杂、数据信息量巨大的电梯系统的应用中能够发挥更大的作用。

(三)模糊神经网络模型

模糊神经网络模型就是创新性的将神经网络与模糊理论结合到一起。它采用了广义的方向推理和广义的前向推理两种推理方式。与其它两种模型不同的是,它的语言逻辑、判断依据和结论都是模糊的。但是它的数据处理能力还有自我学习能力并没有因此而变差,反而更加丰富了它的定性知识的内容。在处理实际问题的过程中,首先要建立所有可能发生的故障的完整集合,其次将所有的故障发生原因归入到同一个集合中去,最后就是建立故障和原因的关系矩阵。分别叫做模糊故障集、模糊原因集、模糊关系矩阵。相较于BP网络模型,这种模型更加的简单易行,充分发挥了神经网络和模糊逻辑的优点,不会因为故障原因过于复杂而失去诊断的准确性,在原本丰富定性知识和强大数据处理能力的基础上具有了很大的自我训练能力。

四、结语

相关热门标签