公务员期刊网 精选范文 人工神经网络的优缺点范文

人工神经网络的优缺点精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的人工神经网络的优缺点主题范文,仅供参考,欢迎阅读并收藏。

人工神经网络的优缺点

第1篇:人工神经网络的优缺点范文

关键词:质谱解析;模式识别;算法

中图分类号:TP302 文献标识码:A 文章编号:1009-3044(2016)36-0181-03

在生活中,人们能够认出周围不同的人分辨他们说话的声音和方式,认出住的小区工作的单位,人们的这种能力就是“模式识别”。随着科技的发展,人们研究用计算机模拟人的模式识别能力,对不同类型形式的数据进行描述、分类、识别。

模式识别的计算过程大致概况成以下几部分:首先从训练样本获得原始数据,对各元素进行综合分析,获得最能反映样本属性的观测量,从众多的特征中找到合适有效的特征量,然后进行特征提取,构成模式空间或特征空间。数据需要预先进行处理,处理后,即可通过模式识别算法进行训练和分类,然后根据训练分类所得的判据对未知样本进行判别(或称计算机预报)。过程如图1所示。

1 线性学习机(linear learning machine)

1.1 原理

此方法亦称为纠错反馈法。最早由Kowalski等引入化学数据的解析,之后被广泛地用于质谱、红外光谱及核磁共振谱。

该方法使用判别函数进行分类,判别函数在二维空间为一直线,在三维空间为一平面,而在多维空间则为一超平面,判别函数将N维空间分成类别区域,预测实验样本属于哪一类别。在LLM中,判别函数先将样本分为两类,使属于一类的样本处于平面的一侧,而属于另一类的样本处于另一侧。判别函数可以通过训练样本求得,并在通过校验集的验证后用于预测待测样本的归属。

1.2 算法步骤

线性学习机是一种有监督的学习类型的简单线性判别函数的迭代算法,可通过以下步骤来实现:

设在训练集中有两类样本,记为[ω1]和[ω2],

1)随机选取一个与样本矢量具有相同维数的矢量作为w

2)对于每个样本都进行计算(k=1~n)。如果[xk∈ω1],而且如果[wtxk>0],则[wnew=wold](判决矢量保持不变)。反之,如果[wtxk

3)重复第二步,直至对所有的样本都正确分类。

值得提出的是,以上算法是对于线性可分的情况而设计的,对于线性不可分的情况,则规定重复次数,到了规定次数还不能完全将训练集分开,则认为属于线性不可分的。

另外,在本算法中的修正判决矢量的计算,实际上是将当前的不能正确分类的判决矢量进行反射,这是因为

[wtnewxk=(wold-λxk)txk=wtoldxk-2wtoldxkxtkxk/xk2=-wtoldxk]

也就是说,经过这样的修正以后,原来不能正确分类的现在可以分类正确了。一般来说,这样的重复次数在20次左右就足够了。

1.3 缺点

LLM方法的缺点之一是没有唯一解,当训练对象的表示次序发生改变时会出现不同的答案。并且只有当样本线性可分时,LLM才能很好的工作。LLM的另一缺点是判别面简单、异常点容易错误分类以及收敛缓慢的不足。另外,LLM只适用于区分两个类别的情况。

2 K最邻近法(K-nearest neighbors,K-NN)

2.1 原理

K最邻近法在化学上应用极为广泛,它是直接以模式识别的基本假设即同类样本在模式空间相互靠近为依据的分类方法。它计算在最近邻域中k个已知样本到未知的待判别样本的距离,即使所研究的体系线性不可分,此方法仍可适用。

KNN法对每一个待分类的未知样本都要计算它到全体已知样本之间的距离,得到它的k个最近邻点进行判决。若k=1,未知样本属于这一个最近邻样本。若k>1,则未知样本与这k个最近邻样本不一定属于一类。这时要采用权值的方法,对这k个近邻的情况按少数服从多数进行表决。一个近邻相当于一票,但考虑k个邻近与未知样本的距离有所判别,所以对各票进行加权,距离最近的近邻的类属,应予以较重的权。

[V=i=1kviDi]或[V=i=1kviD2i]

式中,[vi]为近邻的类属取值。对两类分类,i属于第一类时取“+1”,属于第二类时取“-1”。Di为未知样本与第i个近邻的距离,k樽罱邻数。当V>0时,则未知样本归入为类1;否则归于类2。

这种方法因采用获多数“票”的方法确定未知样本的归属,所以k一般采用奇数。k值不同时,未知样本的分类结果可能不同。

2.2 算法步骤

1)取一个未知样本,记为[xunknown],计算该样本到训练集各样本的距离[Di](i=1,2,…,n),在此n为所有训练集样本的总数。

2)取出k个距离最短的训练集样本,计算它们的权值和

[Vunknown=ViDi] (i=1,2,…,k)

如果[xi∈ω1],则取[Vi=1];反之,如果[xi∈ω2],[Vi=-1];[Di]是待判别的一本与近邻的距离。

3)建立判别标准,即当[Vunknown>0],则[xunknown]判别为第一类[ω1];反之,[Vunknown

2.3 缺点

不幸的是,这种分类方式依赖于每一类中的对象个数。当类与类有重叠时,未知对象将被分配给对象个数较多的类。在没有唯一标准而允许近邻数可变的条件下,这种情况有时也可以得到解决。

3 人工神经网络判别法

3.1 原理

人工神经网络(artificial neural network)的研究是受人脑组织的生理学启发而创立的,是由处理单元(神经元)组成,通过一定的模型结成一个网络,相互间的联系可以在不同神经元之间传递增强或抑制信号。人工神经网络用于化学模式识别的基本思路与判别分析方法是相同的,它也是通过对已知类别的训练集的拟合来建立模型从而进行分类与预测。

3.2 算法

人工神经网络有多种算法,大致分为两类:有管理的人工神经网络和无管理的人工神经网络。有管理的人工神经网络的方法主要是对已知式样进行训练,然后对未知式样进行预测。例如BP(Back Propagation)人工神经网络,是一种误差反向传输网络,其采用最小均方差学习方式,是一种使用最广泛的网络。无管理方法,也称自组织(self-organization)人工神经网络,无需对已知样本进行训练,则可用于化合物的分类,例如被称为自组织特征映射网络(SOM)的Kohonen神经网络和典型的反馈式网络Hopfield神经网络。BP人工神经网络是使用最广泛的网络,所以下面对它进行介绍。

BP算法由以下几步构成:

1)数据预处理。因大都采用由s型非线性函数(sigmoid nonlinearity)为其活性函数,即[fu=(1+e-u)-1],其输出值都介于0~1之间,所以需要对网络的输出进行预处理,使之同样落入0~1之间。这样的预处理不会影响问题的一般性。

2)随机选取连接权重[wme2ki]和[wme1ij](j=1,…,n;i=1,…,m;k=1,…,L),其中n为输入矢量的节点数(或称输入矢量的维数);m为隐节点数;L为输出节点数。一般用(-0.5~0.5)的均匀分布随机函数产生。

3)设a=1,…,A,重复迭代以下步骤,直至收敛。

a.前传计算。按照

[ymej=fwme1ijlnpi+wme10]

[Outk=fwme2kiymej+wme20=fwme2ki[fwme1ijlnpi+wme1oi]+wme2o]

来计算Out,并与所期望得到的数值比较,计算出误差函数E。

b.反鞯鹘凇<扑隳勘旰数对连接权重的一阶导数,以此调节连接权重[wme2ki]和[wme1ij](在此只介绍最陡梯度法,用的是一阶导数,别的优化算法同样可行)。

[Δwij=ρδiuj]

式中:[ρ]―― 一步长因子可在(0~1)之间取值;

[u]――第j节点上的抽象变量,视其是在输出层还是隐蔽层,就分别等于[fwme1ijlnpi+wme10]或[fwme2kiymej+wme20];

[δ]――梯度因子,对于不同层,有不同表达式

[] [δi]= [(ui-Expi)(ui)(1-ui)] 如[ui]为输出节点

[(wme1ijδk)(ui)(1-ui)] 如[ui]为隐蔽层节点

在这里[u(1-u)=u′]。这是因为

[u=fwme1ijlnpi+wme10=fx=1/(1+e-x)]

所以有

[u′=f″x=[1/(1+e-x)]/dx=-(1+e-x)-2(e-x)(-1)=(11+e-x)[1-(11+e-x)]=u(1-u)]

[Δwij=ρδiuj]中步长因子[ρ]的取值大小对收敛速度有很大影响,如取值太大,可能引起迭代过程的振荡(oscillation);反之若取值太小,则会导致权重调节的迭代过程收敛太慢。一般来说,为了加快迭代过程且防止迭代过程的振荡,在[Δwij=ρδiuj]中引入一个惯量因子λ,有

[Δwij(a+1)=ρδiuj+λΔwij(a)]

以保证迭代收敛速度。

3.3 缺点

人工神经网络能精确的对复杂问题进行预测,但却难以理解。此外也有其他一些问题,如网络训练速度问题、神经网络易受训练过度的影响,网络中的神经网络节点个数难以确定,网络结构优化等问题。

4 小结

人类能很轻易通过视觉辨别文字、图片,通过听觉辨别语言,这是人的一种基本技能。但是要机器模拟人进行识别,涉及的问题就比较复杂。本文就模式识别中的三种常用算法:线性学习机、K最邻近法、人工神经网络判别法,简单分析比较了他们的优缺点

参考文献:

[1] 郭传杰.计算机辅助质谱解析的谱图匹配和模式识别方法[J].质谱学杂志,1984,5(3):19-24.

[2] Jurs P C, Venhour T L. Chemical Application of Pattern Recognition[M].Wiley Interscience Publication,1975.

[3] Kowalski B R, bender C F,J.Am.Chem.Soc.,94,5632 (1972).

第2篇:人工神经网络的优缺点范文

关键词:自主导航;人工智能;模糊神经网络;避障;BP神经网络

中图分类号:TP79文献标识码:A文章编号:1005-3824(2014)03-0083-03

0引言

2013年12月14日21时11分,嫦娥三号探测器在月球表面预选着陆区域成功着陆,装着红外成像光谱仪、避障相机、机械臂和激光点阵器等设备的月球车“玉兔”驱动着6个轮子在月球表面留下了历史的痕迹。这标志着我国已成为世界上第3个实现地外天体软着陆的国家,也展现出了智能控制系统[1]在航天事业上的卓越应用。在如今的社会生活中,随处体现着智能技术的存在,人们已经离不开智能技术,智能机器人的发展也飞速前进,从儿童的玩具机器人到太空探索的机器人,可以预见智能机器人的应用将更加广泛。近年来,非线性动态系统的自适应控制在我国引起了广泛的研究,模糊神经网络控制是一个重要的自适应方法,因此得到了很多专家学者的青睐。

模糊逻辑控制在宏观上模仿人的思维,处理语言和思维中的模糊性概念,它是以模糊集合论、模糊语言变量和模糊逻辑推理为基础的一种计算机数字控制技术;神经网络是从微观上模仿人的智能行为,进行分布式并行信息处理算法的数学模型,它是根据人脑的生理结构和信息处理过程创造的[2]。模糊控制与神经网络各自都有一定的应用局限,因此,人们早在20世纪80―90年代就把它们相结合,组成更为完善的控制方法。模糊控制与神经网络的结合有多种方式,根据研究角度和应用领域的变化而不同。1模糊控制与神经网络的介绍

1.1模糊逻辑控制系统

模糊逻辑控制系统主要包含输入变量、模糊控制器、被控对象和偏差。模糊逻辑控制系统结构如图1所示。

知识库:是模糊控制器的核心。由数据库和规则库组成,数据库中存着有关模糊化、模糊推理、解模糊的一切知识,规则库是由若干模糊规则组成的。

模糊推理机:根据模糊逻辑法则把逻辑规则库中的模糊“if-then”转换成某种映射。

反模糊化:反模糊化的方法一般有最大隶属度平均法、最大中点法、面积等分法、重心法和加权平均法等。

模糊控制的优点:可以在预先不知道被控对象的精确数学模型;规则一般是由有经验的操作人员或者专家的经验总结出来并且以条件语句表示的,便于学习和理解;控制是由人的语言形式表示,有利于人机对话和系统知识的处理等。不足之处:精度不够高;自适应能力有限;模糊规则库非常庞大,难以进行更改优化[3]。

1.2人工神经网络

人工神经网络(ANN)是一种模拟人脑神经系统的结构和功能的运算模型,由大量的节点,即神经元及相互之间连接构成的,它是人工方式构造的一种网络系统。神经元结构模型如图3所示。

传递函数f又称转移函数或激活函数,是单调上升的有界函数,常用的转移函数有线性函数、斜坡函数、阶跃函数及单双极S型函数等。但是最常用的还是单极S型函数:

神经网络的结构形式也有几种,例如,全互连型结构、层次型结构和网孔型结构等[4]。前馈型网络是一类单方向层次型网络模块,其最基本的单层神经元网络如图4所示。

图4单层神经元网络3层BP神经网络是比较常用的结构,图5是它的基本结构。

图5BP神经网络的基本结构BP神经网络至少有3层,图5中,第Ⅰ层是输入层,第Ⅱ层为隐藏层,第Ⅲ层为输出层。由于3层的BP神经网络就具有了模糊系统中万能逼近的能力[5],为了不使系统变得更复杂,本文就只用了3层的BP神经网络,当然,也可以根据自身的实际应用情况增加隐层的层数,但并不是层数越多,精度就越高,相对的系统的反应时间就会增加,时延也会增长。

神经网络的优点:能够通过学习和训练获取用数据表达的知识,不仅可以记忆一直获得的信息,还具有较强的概括及联想记忆能力,它的应用已经延伸到各个领域,在各方面取得很好的进展等。不足之处:缺乏统一的方法处理非线性系统;网络的权值是随机选取的;学习的时间长;无法利用系统信息和专家经验等语言信息;难以理解建立的模型等[6]。

所以,综合以上模糊逻辑系统与神经网络各自的优缺点,就提出了一种它们的结合方法,即模糊神经网络控制方法。

2模糊神经网络的结合方式

模糊神经网络大致分为3种形式:逻辑模糊神经网络、算术模糊神经网络和混合模糊神经网络。

在这3种形式的系统中,模糊神经混合系统是根据模糊控制系统和神经网络各自不同的功能、用途集成在一个系统里面的[7]。在这类系统中,我们可以将神经网络用于输入信号处理,模糊逻辑系统用于行为决策[8](如图6),或者把模糊逻辑系统作为输入信号处理,神经网络系统作为输出行为决策,再或者是将神经网络去代替模糊控制器的一部分,还可以将基于神经元网络的模糊系统或者神经元网络用在模糊神经混合系统中。

在本文的应用中,使用的是轮式智能小车,它一共安装了3个超声波传感器、3个红外传感器和1个角度传感器,红外传感器除了应用在小车循迹外,还用来增加控制系统测量的精确性和弥补超声波测距的盲区。例如,在某一路或者几路超声波受到了外界的干扰时,红外线就可以测量出系统所需要的数量值。超声波与红外线用来测量小车到左、前、右障碍物的距离Ll,Lf,Lr;模糊神经系统中控制器的输入包括: Ll,Lf,Lr,小车与障碍物的夹角tg;输出为小车的转角sa和小车的加速度va。将Ll,Lf,Lr的模糊变量设为{near ,far},论域为(0―2 m);tg的模糊变量为{LB,LM,ZO,RM,RB}表示{左大,左小,零,右小,右大},论域为(-1800,1800);距离和夹角的隶属度函数如图7和图8所示。输出变量的隶属度函数在这里就不再赘述了。

在系统解模糊化时,是将一个模糊量转换成确定量,常用的解模糊化的方法有最大隶属度函数法、重心法、加权平均法。在本文中用的是重心法。

智能小车避障的控制系统如图9所示。

第3篇:人工神经网络的优缺点范文

【关键词】负荷;优先次序法;等微增率法;遗传算法;人工神经网络法

一、引言

随着工业的发展,节能减排也日益突出,成为电力系统应该重点注意的一项工作。电能是我国重要的能源之一,不是取之不尽用之不竭的,且没有可以被贮存的功能,因此,需要在进行负荷分配的时候,注意最优化选择与经济效益,以同时加强电力企业的竞争力与降低成本。本文针对以上情况,对合理进行最优化负荷分配进行了详细的分析与讨论。主要介绍了常用的分配方法与具体的智能算法,可以为电厂根据自身情况选择合理的分配方案提供指导作用。

二、电厂负荷自动控制系统的特点

(一)参加调峰、调频。调峰与调频在电网运行中是非常重要的,因此,电厂负荷自动控制系统与参加调峰、调频密不可分。为此,要合理控制、规划电网的调峰与调频情况,保证自动化控制系统可以满足电网的基本要求。

(二)稳定机组运行。机组在运动过程中将会受到不同程度的内外干扰,从而造成一定的机组运行不稳定情况发生。因此,要保证机组在运行过程中的能量平衡与质量平衡,进而稳定机组的运行状态。

(三)接口完善。电厂负荷自动控制系统运行属于闭环控制系统,需要与其他系统进行不断的信息交互工作,为此,必须保证接口完善,任务交互不会发生错误,使得系统的协调性更强,更加完善。

(四)可供选择性强。电厂负荷自动控制系统的设计必须可以满足不同的要求。在实际的电厂工作运行中,情况较多且均比较复杂。而且,机组在运行过程中可以会发生错误,导致其中的一个或几个机组被分割到运行之外,此时,电厂负荷自动控制系统不能因此停止运行,必须继续保持系统的稳定运行状态。

三、电厂负荷的分配方法

(一)优先次序法。优先次序法的主要步骤如下:首先,根据电厂中机组的实际运行效率计算出各个机组单独工作时的最大效率;然后,将各个机组按照效率的高低,由大至小进行排序,进而各个机组依次分配负荷。

(二)等微增率法。等微增率法[1]指的是在等式的约束条件下,有效使用基于数学极致计算理论得到的等微增率法,进行各个机组的负荷分配。这种分配方法具备计算简单、使用方便的优点。但是,由于该方法要是各个机组的煤耗为严格的凸函数,增率曲线是单调递增可微的,因此容易导致计算失真的情况发生。

(三)逐点法。这种方法也被称为穷举法,是根据指定的间隔依次确定总分配方案的方法。针对每一种方案分别计算出对应的各个机组的煤耗与发电厂的总煤耗[2],合理选择出使全厂煤耗最小的分配方法。这种分配方法通过实测性能曲线对各个机组工况点进行了计算,有效的避免人为拟合导致的误差的产生,且对性能曲线的连续光滑性没有要求。但这种方法的计算消耗时间较长,无法保证其可被用于实时计算。

(四)动态规划法。动态规划法要求所需要求解的问题要具备明确的阶段性,需要使用运筹学原理,用这种方法求解机组的负荷最优分配问题时,调度区间被分为若干个时间段,每个时间段通常为一个小时。由初始阶段开始依次计算到达各个阶段各个状态的累计花费[3],包含启停机组的花费与运行时所消耗的燃料费用。再根据最后阶段所累计费用的最小状态,依次记录各个阶段,使得总的累计费用为最小的最优状态。这种方法不需要硬性规定任何先决条件,可以避开微增率曲线,因此,该方法被广泛使用。

四、智能决策方法

智能决策方法是指通过利用计算机程序的智能原理,结合人类的思想,进行建模,从而达到目的的方法。该决策方法目前已被广泛使用于工业领域。

(一)遗传算法。遗传算法是通过模拟生物根据达尔文进化论在自然界中的遗传与进化过程,从而形成的一种自适应搜索最优方法的模型[4]。这种算法的实际应用型较强,是属于框架式的算法,可以根据不同的实际问题套用,从而得到最优解,且该算法对目标函数没有硬性的特殊规定与要求。这种算法具备鲁棒性强、搜索效率高的优点。且不易在搜索过程中陷入局部最优,从理论上分析,该算法可以有效找到全局的最优解。使用这种方法求解电厂符合最优分配方法,可以得到多个可供选择的方法,该算法具备灵活的特点,且可以同时考虑多种不同的约束。

(二)人工神经网络法。人工神经网络法是模拟人类大脑物理结构的模型的算法。该算法可以充分逼近任意复杂的非线性关系。解决问题时候所涉及到的定量与定性的参数都可以以等式的方式被存储在神经网络内的每个神经单元内,因此,该算法具备鲁棒性的优点,且具备一定的容错性。多层前馈神经网络模型是目前常用的人工神经算法之一。该算法具备如下优点:预测准确性较强;当计算遇到错误或干扰时,鲁棒性较强;输出具备较强的灵活性,可以是离散形式的真值,也可以是含有一些离散值和真值的向量;评估速度较快。但是,该算法也有一些缺点不容忽视:函数比较复杂,不易理解;收敛速度较慢。

(三)混沌算法。混沌算法获取最优值的方法是通过约束条件将系统与机组用罚函数所表示出来。然后,把目标值与罚函数定为寻优目标,进而进行根据混沌运动特性与自身过滤特性的方式的搜索过程。从而获得电厂负荷最优分配的结果。混沌算法是一种智能型算法,具备某种随机性。该算法具备以下优点:效率较高;使用便利;保密性好;安全性高。

五、结束语

合理进行电厂负荷最优化分配是电力行业的一个重要的问题。降级机组的运行成本可以提高企业的竞争力,是电厂普遍关心的问题之一。本文针对最优化选择电厂负荷分配方法进行了归纳与总结,在介绍电厂负荷分配方法的基础上,对目前常用的几种算法进行了讨论,给电力企业针对自身情况,合理选择负荷分配提供了一定的参考。

参考文献:

[1]缪国钧,葛晓霞.电厂负荷的优化分配方法[J].电站辅机, 2010 (003): 1-5.

[2]于国强,吕剑虹,龚诚.电厂负荷调度的智能决策方法 [J].热能动力工程, 2003, 18(5): 507-511.

第4篇:人工神经网络的优缺点范文

关键词:变电站;无功电压;控制

中图分类号:TM63 文献标识码:A

电压的稳定不但能够保障电力系统安全运行,而且对国民经济正常的生产也有着极为重要的作用。稳定的电压可以延长电力设备的使用寿命,也能够提高电能的质量。随着电站负荷的加剧,其电压与无功调节的需要愈加频繁,这对变电站无功电压控制的考验也更加严峻。

一、变电站无功电压控制的重要意义

电能质量的标志是电压,若电压的偏移额定制较大,将会极大的缩短用户家电的使用寿命,影响家电正常工作,甚至还对电力系统稳定运行造成一定的阻碍。经研究分析表明,电压偏移是因为电力系统无功率分布不均匀而导致,所以电压调整便是针对无功功率合理分布的问题。我国电力系统的电压调整采用有载电压变压器分接头位置,从而造成变压器的变比改变;另外一种方法便是投切并联电容器组,最后对无功电压进行无功补偿,这两种方法仍旧存在着一定的局限性,变电站电压的调整需要人工来进行完成,人工操作难以准确合理的调节、自动调控装置仅仅只针对电压无功进行独立调节,并未将无功电业和自动调节相结合,若无功电压调节次数过于频繁,将会增大变压器的负担,从而降低供电可靠性。

二、变电站电压无功控制策略

1 按功率因数进行控制。根据功率因数的大小来对电网无功电压进行控制,根据电网中可以放映出电流和电压相位差功率的因数来控制信号,控制并联的电容器投切,然后达到无功补偿的目的,这种较为传统的无功电压控制方法虽然有很多优点,但却不能全面对无功电压进行控制,功率因数只是影响无功分量的一个因素,而且功率因数的大小并没有直观的放映出无功缺额的大小,按功率因数大小来控制无功电网这种策略极易导致控制系统的投切震荡,从而使控制系统使用寿命和可靠性大大降低,对于电网以及用户家电的正常运行造成了极为不利的影响。

2 根据母线电压来对无功电压进行控制。根据母线电压的高低来进行无功电压控制,无功功率的波动往往会导致电网电压的波动,一些针对电压有着严格要求的变电站,仅仅以母线电压的高低来对供电站无功电压进行控制,没有真正的考虑无功电压平衡的基本条件,这种片面的判断方法容易导致并联电容的自动投切在变电站中的补偿效果并不明显,这种按母线电压高低来进行无功控制的方法,存在着一定的局限性。

3 按照九区图进行综合控制。九区图电压控制是无功电压控制的方法之一,是根据变电站的运行方式,运用实时监测以及对电压的判断从而构成变电站无功电压控制的策略。综合逻辑判断是根据固定无功和固定电压上下的特性,将无功电压与凭借分成九个区域,在每一个区域之内采用不同的控制策略,在电容器组以及有载调压变压器控制时,九区图控制的原理较为清晰,而且能够轻易的实现,然而这种九区图控制却有一个前提,那便是固定电压无功的上下线,而且没有充分考虑到电压影响和相互协调之间的关系,在分析运算的过程中,实时数据太过于分散和随机,导致控制的不确定性,容易出现设备投切极为频繁。

4 模糊逻辑无功电压控制。模糊理论经常解决不同量纲、不确定、相互冲突多目标优化的问题,所以运用模糊理论方法解决变动站无功电压的问题效果较为突出,模糊控制算法一般要按照几个顺序来进行,首先确定电压控制的输入输出信号;其次确定信号的模糊集;再次确定电容器组和有载调压的分接头;最后确定和选择模糊逻辑算法。然而模糊理论同样具有一定的片面性,信息的模糊处理直接导致控制系统精确度降低,而且缺乏系统的设计方法,很难定义精确的控制目标,在选择控制规则、选取论域、选择量化分子以及定义模糊集等多采用试凑法,对于一些复杂的控制系统效果并不明显。

三、针对人控智能无功控制有关策略

1 专家系统无功电压控制。推理结构和知识库共同组成专家控制系统,根据某一领域中权威提供的一些专业知识,进行准确推理,模拟出权威专家做决策的整个过程,专家系统提供专家级别水平的解决方案,让调度的工作人员在运用信息化技术时,也能够借鉴人类专家系统分析来增强控制的结果,就目前而言,专家系统存在着一定的片面性。如当系统的规则较多、规模较大时,推理的速度就会受到一定的限制、某些转接缺乏一定的经验,处理一些新问题的能力有限以及兼容性较差等,在系统出现故障时,系统参数变化较大,优势可能会给出一些错误的策略、建造大型的专家系统,耗费的时间较长,而且知识的校对以及获取都有一定的难度。

2 人工神经网络的电压无功控制。人工神经网络的电压无功控制主要是运用了神经网络特点,总结出一种神经网络无功电压综合性的智能策略,神经网络的输入包括了有功与无功、低压侧与高压侧等,输出主要包括接头位置以及并联的电容器开关状态,训练样本则主要是根据变电站监控系统中一些相关的历史数据,这种办法虽然综合考虑了电压控制与无功电压的权重,取得了一定程度的控制,但仍旧存在一定的局限性,如学习的速度较为缓慢而且训练的时间很长,不易收敛局部几点较少,系统结构若是发生变化,就要对新样本进行重新学习,提供不了相关信息,无法帮助工作任运进行正确的推断,输出结果不易理解。

3 人工智能方法的点发无功控制。人工智能为解决电压无功问题拓展了新思路,不同特性的人工职能对于所解决问题的侧重点自然有所区别,取得的效果也有所差异,所以人们才将能够解决无功电压的各种方法综合在一起,去其糟粕取其精华。将模糊理论和专家系统紧密结合,同时克服模糊技术建模困难、学习能力较差的缺点,主要是以专家系统中所形成的知识库作为无功电压控制的重要依据,以模糊机构来进行控制,保证了专家系统规则能够合理的推理以及生产操作指令。

结语

变电站无功电压控制对国民经济有着重要影响,本文深入研究了变电站无功电压控制的问题和意义、变电站电压无功控制策略,主要策略有按功率因数控制;按母线电压控制;九区图综合控制;模糊逻辑无功电压控制;专家系统电压无功控制;人工神经网络电压无功控制;人工智能方法的点发无功控制,这些针对变电站无功电压控制的策略各有优缺点,希望有关工作人员在实际操作中应该用其所长,避其所短。

第5篇:人工神经网络的优缺点范文

关键词:BP神经网络 水资源消费 预测

1 前言

水资源消费量预测是合理开发利用水资源的主要内容之一,其值将直接影响城市发展规划与建设计划。随着我国城市化进程的加快,由此带来的城市需水的增长与水资源短缺的矛盾日益明显。因此,在基于可持续发展的区域水资源规划中,城市水资源消费量是一个不可或缺的重要参数[1]。

城市水资源消费量的预测涉及许多因素和条件,如水资源状况、环境特性、气候条件等自然因素,以及国家建设方针、政策,国民经济计划,社会经济结构,科学技术水平,经济发展速度,人民生活水平,人口控制计划,水资源利用技术状况等诸多方面。常用的用水量预测方法可分为两类[2],一类是解释性预测方法,即找出被预测量的各影响因素,建立回归分析模型;另一类是时间序列分析方法,它是依据被预测量的历史观测数据,通过序列分析,找出其顺序变化规律。但两类方法各有优缺点[3]。近年来,人工神经网络理论迅速发展,并在模式识别、评价、预报等领域广泛应用。本文应用人工神经网络中比较成熟的BP网络理论[4],结合灰色理论中的等维新息建模思想[5],建立水资源消费量预测模式。

2 BP网络的结构及基本原理

人工神经网络BP(Back-Propagation network)模型是一种由非线性单元组成的前馈网络,多输入单输出网络结构示意图见附图。典型的BP网络由输入层、隐层和输出层构成,其中各层节点间以权值W形式连接,θ为预先设定的节点阈值。BP网络的输入输出采用单调上升的非线性变换Y=1/(1+e-x),连接权的算法用有教师的δ学习律,即用已知例子作为教师,对网络的权进行学习,设Xpi,Tp(p=1,2,…,P;i=1,2,…,n)为已知的输入、输出的例子,Xpi,Tp为n维和一维矢量,Tp=(T1,T2,…,Tp)T,Xpi=(Xp1,Xp2,…,Xpn)T,把Xpi作为神经元的输入,在权的作用下可算出实际神经元网络的输出Yp(Y1,Y2,…,Yp),在Tp与Yp之间存在一个差的平方和E(误差),BP网络的学习就是通过调整权值,使得每一次样本训练误差E最小,直到满足要求的精度ε,此时网络训练完毕。训练中,误差E是一个具有极其复杂形状的曲面,求其最小点,即梯度为零时可能有几种情况:(Tp-Yp)0,产生多值解;Yp(1-Yp)0,可能进入一些平坦区域;存在一些局部极小点。以上三种情况可能产生满足条件而非最小的解,为达到要求,需做以下改进。

在BP算法中,步长η是不变的,当网络的误差曲面有平坦区存在时,步长太小,使迭代次数增加,步长太大又使误差增加,因此对于步长做如下改进[6]。即:

>1,当ΔE<0时;

β<1,当ΔE>0时。

这里,β为常数,ΔE=E(n0)-E(n0-1)(n0为迭代次数)。通过以上修正,就可以进行顺利迭代了。

3

建模及实例

3.1 模型建立

由前面的介绍,BP网络的结构及算法已经很清晰,现在问题的关键是如何选取已知的样本{Xpi}及已知的输出{Tp}来训练模型。对一个城市来说,历史上历年的用水量是已知的,即存在一个已知的用水量序列{Xi}(i=1,2,…,m)。首先视数据的多少选择约为已知数据一半的前期信息作为训练样本的数据,进行模型拟合;而另一半已知的后期信息作为模型的预测检验样本,来验证模型的精度。对一个时间序列的用水量数据,排除突发因素,其内部能够体现用水量的变化趋势,即这些数据中存在着某些动态记忆特征。这里引入灰色理论中建立等维新息模型的思想,建立如下训练样本。

已知输入:{X1,X2,…,Xn},

{X2,X3,…,Xn+1},

{Xp,Xp+1,…,Xn+p-1}.

期望输出:{Xn+1,Xn+2,…,Xn+p}T .

可见,每一组输入,其对应的期望输出皆为下一年的实际用水量值,而且后面的输入序列总是去掉老信息而增加新信息,并保持等维,因此称之为等维新息训练样本,用这样的样本训练BP网络,所得的模型称为神经网络等维新息预测模型。

3.2 实例研究

某市水资源消费量数据序列详见表1。用等维新息BP网络模型对其进行训练,建立预测模型,并进行预测检验。

表1 历年水资源消费量统计表

时序/年

水资源消费量/108t

时序/年

水资源消费量/108t

1

2

3

4

5

6

0.117 982

0.139 121

0.177 574

0.223 077

0.231 682

0.254 230

7

8

9

10

11

0.293 284

0.336 624

0.365 843

0.407 947

0.438 403

将表1所列数据序列用{Xi}(i=1,2,…,11)表示。以{Xi},{Xi+1},{Xi+2},{Xi+3}(i=1,2,3,4)4个子数据序列为模型的训练样本,期望输出为{X5,X6,X7,X8}T,建立4个输入节点,4个隐节点,1个输出节点的BP网络等维新息模型。赋予初始权值为随机小量,初始步长为0.3,将训练样本输入网络反复训练,训练3 990次后,误差小于0.000 02,训练结束,模型拟合完毕。

下面用已知的数据序列建立如下3个已知数据子序列{Xi+4},{Xi+5},{Xi+6}(i=1,2,3,4)作为预测样本来检验模型的精度。将以上3组数据输入拟合模型中,将其输出及拟合模型的实际输出与实际值比较。同时将结果与常规的趋势移动平均和灰色模型等预测方法的运算结果对比,并采用误差分析定量指标对模型进行评价,结果一并列入见表2。其中常规预测方法采用DPS数据处理系统软件[7]进行处理。

表2  水资源消费预测模型输出值与实际值比较结果

时序/年

水资源消费量

/108t

趋势移动平均模型

GM(1,1)模型

等维新息BP网络模型

输出值/108t

误差/%

输出值/108t

误差/%

输出值/108t

误差/%

5

6

7

8

9

10

11

0.231 682

0.254 230

0.293 284

0.336 624

0.365 843

0.407 947

0.438 403

0.231 589

0.262 633

0.297 990

0.333 348

0.368 706

0.404 064

0.439 400

0.04

-3.30

-1.60

0.97

-0.78

0.95

-0.22

0.230 716

0.258 252

0.289 073

0.323 573

0.362 191

0.45 417

0.453 803

0.41

-1.58

1.43

3.87

0.99

0.62

-3.51

0.227 532

0.257 966

0.295 524

0.333 554

0.365 634

0.404 763

0.450 912

1.36

-1.07

-0.76

0.91

0.06

0.78

-2.85

平均误差/%

1.12

1.52

1.11

从比较结果可见,城市用水量预测的神经网络等维新息模型,实例验证了其输出值与原始值的误差平稳而且较小,模型误差较小,预测精度较高。

转贴于 4 结语

城市水资源消费是一个多因素、多层次的复杂系统,要准确描述这些因素与水资源消费量的相关模型是困难的,但从水资源消费量的时间序列中能体现出城市水资源消费的发展趋势,也就是利用这种动态记忆特征,结合灰色理论应用中建立等维新息模型的思想,通过建立能反映其趋势的等维新息训练样本,进行BP网络学习,以多维权值的形式反映用水量的内在规律。已知输入,只需上机运算,而不需任何其它的人工行为,网络本身具有很强的自组织、自适应能力。模型训练好之后,就可以对未来城市水资源消费进行预测。

神经网络理论结合灰色建模思想进行时间序列问题的预测是一种试的尝试,如何选择训练样本,如何确定输入节点及隐节点个数才能进一步提高模型精度,需进一步讨论。但就本文的实例验证来看,所建模型无疑是有发展潜力的。

参考文献

[1] 彭岳津. 城市化进程对水资源需求的影响[A]. 水资源与水环境承载能力研究文集[C]. 北京:中国水利水电出版社,2002.

[2] 吴文桂, 洪世华. 城市水资源评价及开发利用[M]. 南京:河海大学出版社,1988.

[3] 陈惠源,万俊. 水资源开发利用[M]. 武汉:武汉大学出版社,2001.

[4] 杨建刚. 人工神经网络实用教程[M]. 杭州:浙江大学出版社,2001.

[5] 李正最. 排污量灰色预测方法[J]. 水资源保护,1991,(2):18~22.

[6] 李正最. 推算洪水流量的人工神经网络方法[J]. 四川水力发电, 1997, (1):10~14.

[7] 唐启义,冯明光. 实用统计分析及其DPS数据处理系统[M]. 北京:科学出版社,2002.

The Equal-dimension and New-information BP Neural Network Model of Water Resources Consumption

第6篇:人工神经网络的优缺点范文

【关键词】数据挖掘 异常数据挖掘 人工智能

1 引言

人工智能用于异常数据检测的方法很多,传统的如基于统计(statistical-based)的方法、基于距离(distance-based)的方法 [1]、基于密度(density-based)的方法[2],基于聚类的方法[3]等。但这么传统的异常数据检测方法仍然存在着一些缺陷与不足。基于统计的数据检测方法要求预先知道被检测数据的分布情况,基于距离的方法中距离函数与参数的选择存在较大的困难,基于密度的数据检测方法方法时间复杂度较高,这些问题极大地限制了异常数据挖掘算法在现实中的应用。本文重点论述人工智能方法用于异常数据挖掘的发展史,分析和比较各自的优缺点。

2 常用于异常数据挖掘的几种人工智能方法的分析

2.1 神经网络方法

神经网络模型主要由三层结构组成,主要包括输入层、隐含层和输出层。第一层为输入层,输入层的节点代表多个预测变量,输出层的节点代表多个目标变量,位于输入层和输出层之间的是隐含层,神经网络模型的复杂度取决于隐含层的层数和节点数。每一层的节点都允许有多个。神经网络模型主要用于解决回归和分类两类问题,其结构图如下图所示。

从上图可得,节点X1,X2,X3作为神经元的输入,代表多个预测变量,它可以是来自神经网络的信息,也可以是另一个神经元的输出;W1,W2,……,Wn是神经元的权值,表示各个神经元的连接强度。通过神经网络模型的结构图可知,该方法的实现过程:首先将每个训练样本的各属性取值同时赋给第1层即输入层;各属性值再结合各自的权重赋给第2层(隐含层的第1层),第1层隐含层再结合各自的权重输出又作为下一隐含层的输入,最后一层的隐含层节点带权输出赋给输出层单元,输出层最终给出各个训练样本的预测输出。

2.2 蚁群聚类算法

在数据挖掘中,聚类是一个活跃的研究领域,涉及的范围较广。许多计算机学者们通过模仿生物行为提出一系列解决问题的新颖方法。蚂蚁搜索模式样本所归属的聚类中心的概率计算公式如式(1)。

(1)

其中,α,β为参数,初始聚类中心为随机选取的k个模式样本点。τ(i,j)为样本Xj到聚类中心mj之问的信息素i=1,2, …,n,j=1,2, …,k ;η(i,j)为启发函数,其表达式如式(2)所示。

(2)

其中,dj为模式样本Xj到聚类中心mj的欧氏距离为(i=1,2, …,n,j=1,2, …,k)。

蚂蚁搜索整个模式样本空间,形成一个聚类结果后,聚类中心mj各分量的值为该类Cj中模式样本各属性的均值,计算公式如(3)。

(3)

2.3 基于知识粒度的异常数据挖掘算法

粒计算是人工智能领域新发展起来的一个研究方向,该方法针对不确定性信息进行处理。它主要包括三种模型,分别是粗糙集模型、模糊集模型与商空间模型。该方法的基本思想是利用不同粒度上的信息进行问题求解。该理论在多个领域得到了广泛的应用,如数据挖掘、决策支持与分析和机器学习等。知识粒度为异常数据挖掘处理不确定性数据提供一种新的解决方法。基于知识粒度的异常数据挖掘算法,该算法不需要预先知道数据的分布情况,并且采用知识粒度度量各个对象间的距离与异常度时,能有效挖掘出异常数据。

3 各方法的比较

通过以上各种方法的分析,各种方法具有各自的优点以及不足之处。基于聚类的数据挖掘方法侧重与于聚类的问题,该问题极大地限制了该算法在实际生活中的应用。神经网络方法用于数据挖掘,是人工智能中较早应用于数据挖掘领域的方法之一,能够较好的进行异常数据的挖掘,但是该方法的层数的确定比较困难,同时该方法的时间复杂度比较高;蚁群聚类算法是在聚类算法的基础上改进推广而得,能够达到异常数据检测的目的,但该算法的收敛速度慢,而且算法存在随机移动而延长聚类时间。

4 结束语

异常数据挖掘研究是一个有价值的研究问题,近年来引起越来越多的学者关注和研究,从而使得异常数据挖掘算法取得了新的进展,在生态系统分析、公共卫生、气象预报、金融领域、客户分类、网络入侵检测、药物研究等方面得到了广泛的应用。希望本论文中的方法可以给读者提供更多异常数据挖掘方面的思路,并且能够很好的将人工智能中的方法运用异常数据挖掘中,克服各种方法不足,让人们能够更好的应用。

参考文献

[1]Knorr E. Alothms for Mining Distance based Outliers in Large Datasets[C] //Very Large Databases(VLDB’98). New York: Proc of Int Conf, 1998: 392-403.

[2]Breunig M M, Kriegel H P. Sander, LOF: Identifying Density-Based Local Outliers[C]// ACM SIGMODC onference Proceedings. [S.I]:[s.n.],2000.

[3]王鑫等.数据挖掘中聚类方法比较研材[D].济南:山东师范大学管理学院,2006.

[4]魏海坤,徐嗣鑫,宋文忠.神经网络的泛华理论和泛化方法[J].自动化学报, 2001,27(6):806-814.

[5]庞胜利,吴瑰丽.人工神经网络在大型桥梁健康监测系统中应用研究[J].石家庄铁道学院学报,2002,15(2):63-65.

[6]金微. 蚁群聚类算法分析[J].计算机光盘软件与应用,2011,(13):199, 202.

[7]陈玉明,吴克寿,孙金华.基于知识粒度的异常数据挖掘算法[J].计算机工程与应用,2012, 48(4):118-121.

[8]苗夺谦,王国胤,刘清等.粒计算:过去、现在与展望[M].北京:科学出版社, 2007.

[9]苗夺谦,范世栋.知识的粒度计算及其应用[J].系统工程理论与实践,2002, 22(1):48-56.

第7篇:人工神经网络的优缺点范文

[关键词]动态系统建模 仿真 人工神经网络

在讲授完线性与非线性动态系统建模方法基本理论以后,需要让学生进行上机实验[1]以达到以下目的:1进一步加深理解学习的基本理论;2各种参数的选择对建模效果的影响;3各种建模方法的优缺点及适用场合。为了达到这些目的,我们模拟实际应用时的情况,提供给学生模拟的输入输出数据,以便学生利用这些数据,进行编程建立模型。同时我们编程实现基于最小二乘法、最大似然估计、BP神经网络、RBF神经网络的动态系统建模方法[2,3],学生可以利用这些Matlab程序进行各种方法的学习、各种情况下建模效果的对比,以及各种方法的适用场合的对比。

一、 基于Matlab仿真的线性动态系统最小二乘法建模的教学

假设系统的差分方程为:y(k)=-a1y(k-1)-a2y(k-2)-…-any(k-n)+b0u(k)+b1u(k-1)+…+bmu(k-m)+e(k)。其中y(k)为输出,u(k)为输入,e(k)为模型残差。假定建模用的数据序列从y(k)开始,则构建以下数据矩阵及数据向量:

如果模型残差为白噪声(实际情况多为有色噪声,但当噪声强度不大时,可近似当作白噪声处理),则根据最小二乘法,由这 组数据估计得到的参数 。

以上的最小二乘法需要输入(u(K-m),u(K-1),…,u(K+N-1))和输出(y(K-n),y(K-n+1),…,y(K+N-1))数据,我们可用以下的Matlab程序(程序1)产生模拟的输入输出数据(程序中采用了一个简单的二阶离散系统,学生实验时可换成需要的模型),并形成数据矩阵及数据向量。

程序1:

clear all

K=3;%残差序列开始序号

N=1000;%共N组数据

n=2;%对应

m=2;%对应

u=randn(1,K+N-1)*0.1;%随机产生输入数据

for i=1:1:n

y(i)=0;%设定初始状态

end

for k=n+1:1:K+N-1

y(k)=0.2*y(k-1)+0.5*y(k-2)+u(k)+0.3*u(k-1);%根据输入计算输出

end

y=y+randn(1,K+N-1)*0.001; %在求得的单位阶跃响应上叠加噪声用以模拟测量误差

X=zeros(N,n+m+1);

for i=K:1:K+N-1

for j=1:1:n

X(i-K+1,j)=y(i-j);%构成矩阵X

end

for j=n+1:1:n+m+1

X(i-K+1,j)=u(i-j+n+1); %构成矩阵X

end

end

for i=K:1:K+N-1

Y(i-K+1)=y(i);%构成向量Y

end

save X X;

save Y Y;

save N N;

运行程序1将生产数据矩阵X(保存在X.mat中)及数据向量Y(保存在Y.mat中)。以下是根据最小二乘法估计参数的程序(程序2)。

程序2:

clear all

load X;

load Y;

XT=X';

sita=(XT*X)^(-1)*XT*Y'%计算得到估计的参数sita

运行程序2,将得到估计的参数sita。如某一次运行中sita=[0.2004,0.4998,0.9998,0.2995,-0.0005]T,与模型中的值(见程序1)a1=0.2,a2=0.5,b0=1,b1=0.3,b2=0非常接近。

二、 基于Matlab仿真的线性动态系统最大似然估计建模的教学

在模型残差为白噪声的假设下,最大似然估计和最小二乘法在估计参数时是相同的,但最大似然估计还能估计出噪声的强度,程序3为相应的程序。

程序3:

clear all

load X;

load Y;

load N;

XT=X';

sita=(XT*X)^(-1)*XT*Y'

Z=Y'-X*sita;

StdV=sqrt(Z'*Z/N)%估计标准差

运行程序3,得到和程序2一样的参数估计值,除此之外,还能得到噪声的标准差(或方差)。如某一次的运行结果为StdV=0.0011,和模型中值(见程序1)0.001非常接近。

三、 基于Matlab仿真的非线性动态系统BP神经网络建模的教学

基于神经网络的非线性动态系统建模的输入输出的样本数据组织如图1所示。

图1:基于神经网络的动态系统建模的样本数据的组织

如图1所示,当输入为y(K-1),y(K-2),…,y(K-n),u(K),u(K-1),…,u(K-m)时,期望输出为y(K),因此BP神经网络的输入输出数据样本对为(x,y),其中x,y分别为上述最小二乘法中的数据矩阵及数据向量,将程序1中的动态系统以非线性动态系统代替(如将y(k)=0.2*y(k-1)+0.5*y(k-2)+u(k)+0.3*u(k-1)

改为y(k)=0.2*y(k-1)+0.5*y(k-2)+2*u(k)*u(k)+0.3*u(k-1)),采用程序1产生非线性动态系统的数据,然后设计如下的基于BP神经网络的非线性动态系统建模程序(程序4)。

程序4:

clear all

load X;

load Y;

net = newff(X',Y,10);

net.trainParam.epochs = 100;

net.trainParam.goal = 0.000001;

net = train(net,X',Y);

Y1 = sim(net,X');

plot(Y,'s-');

hold on

plot(Y1,'*-');

save net net;

从程序4运行后的产生的图形中可以看出BP神经网络训练的效果。

四、 基于RBF神经网络的非线性动态系统建模教学

基于RBF神经网络的非线性动态系统建模的样本数据的组织和BP神经网络相同,因此可以使用BP神经网络建模时所用的样本数据进行建模实验,以便对比两种网络的建模效果。以下(程序5)是RBF神经网络建模的样例程序。

程序5:

clear all

load X;

load Y;

net=newrb(X',Y,0.000001);

Y1=sim(net,X');

plot(Y,'s-');

hold on

plot(Y1,'*-');

save net net;

从程序5运行后的产生的图形中可以看出RBF神经网络训练的效果。

五、 结论

本文设计了matlab程序,模拟产生较逼真的输入输出数据样本数据供学生使用,学生可以利用这些数据进行线性与非线性动态系统建模实验。同时也提供了面向动态系统建模的最小二乘法、最大似然估计、BP神经网络、RBF神经网络样例程序供学生学习使用。学生可以利用这些Matlab程序进行各种方法的学习、各种情况下建模效果的对比,以及各种方法的适用场合的对比。学生也可以参照这些程序编制更加复杂的程序以解决实际的系统建模问题。

基金资助:本文系东华大学信息学院教改项目的研究成果。

[参考文献]

[1]刘娣许有熊林健,基于MATLAB的“系统辨识”课程实验教学改革[J].中国电力教育,2013(1):139-140.

[2]王秀峰,卢桂章.系统建模与辨识[M].北京:电子工业出版社,2004.

第8篇:人工神经网络的优缺点范文

[关键词]信用评价 指标 模型

信用风险一直以来都是各个经济主体面临的重要金融风险,信用风险评价的研究在国际上得到了高度的重视和迅速的发展。次贷危机的爆发,使得信用评价研究的重要性更加不言而喻。我国的信用风险度量方法虽然起步较晚,但随着我国市场经济和金融市场地发展不断演进,越来越多的学者加入到信用评价的研究中来。

综观我国的信用评价研究,焦点主要集中在信用评价指标体系的建立、信用评价的分析方法和信用评价模型中的有效性研究三个方面。

一、信用评价指标体系的研究

在指标的选取上,许剑生(1997)认为现行企业信用等级评定指标体系存在着以企业资产负债表和损益表数据为主,忽略了对企业现金流量的分析和部分指标设置不科学两大缺陷。

夏红芳、赵丽萍(1998)则指出现行指标体系存在着与新财务管理准则的核算口径不统一、定性分析指标太多、单项指标设置内涵过宽三个方面做得不足。认为当前的指标系统未能全面反映企业经营情况。

周佰成等(2003)认为一个指标体系应能准确地反映评估对象的特点与实际水平。

李小燕、卢闯(2004)研究了基于业绩企业信用评价指标与股权所有者的利益相关性,从而提出改进和完善现有企业信用评价模型的构想。研究结果表明:企业信用评价指标体系中的业绩指标较非业绩指标与企业的信用等级更相关。

田俊平(2005)在其硕士论文中提出现有信用评价指标较多关注企业的短期能力,应更多地关注反映企业长期能力的指标。

曲艳梅(2006)根据平衡计分卡原理,分别设计定性指标和定量指标的四个维度。其中定性指标的四个维度指标均衡分布,各为25分。而定量指标中的偿债能力指标定为50分。

综合现有文献中所采用的信用评价指标体系,信用评价所强调的是债权人的利益,而非股东的利益,故指标体系中最为看重的是体现偿债能力的指标。现有的指标体系普遍存在着定量指标比重过大,定性指标较少的现象,评价指标中所涉及的现金流量指标也较少。

二、信用评价的分析方法研究

当前我国学者研究得更多的是各种分析方法在信用评价模型中的应用。

最早用于建立信用评价模型的线性判别法(Liner Discriminate Analysis,简称LDA)是一种简单的参数统计方法。考虑到财务比率的多维性,信用评价模型中更为常用的是多元判别法(Multivariate Discriminate Analysis,简称MDA)。近年来,线性概率模型和Logistic回归模型,特别是神经网络法等也被广泛应用于企业信用评级。

最先将多元线性判别法用于信用分析的是美国的Redward•Altman于1968使用22个财务指标分析了美国破产企业和非破产企业,并从中选出5个最有代表性的关键指标建立了著名的五变量Z模型。该模型简单且成本低,在美国商业银行得到广泛应用。我国学者陈静(1999)使用多元判别法进行实证研究,建立了评价企业信用风险水平的现行判别模型。方洪全、曾勇(2004)以银行实际贷款数据样本为分析对象,使用SAS软件在66个财务指标中选取7个财务指标运用多元统计技术建立起4水平的线性判别模型,并根据对模型的检验证实了该判别模型对信用风险的定量评估有较强的解释和预测能力。

这些多元判别分析模型一般情况下只能对企业信用划分成两类,即还本付息和违约。这种分类不利于使用者对企业的风险进行更深层的管理。同时,由于多元判别分析法对变量数据要求较多,应用前提过于严格,而实际所使用的数据却有一定的违背,使得这种模型的误判率较高。

为了解决多元判别法应用前提的局限,美国学者Ohlson将多元逻辑回归(Logistic regression,简称Logit分析法)引入了信用评价研究中。使用Logit分析法的模型采用Logistic函数,在数据不满足正态分布情况下其判别正确率高于多元判别分析法的结果。

在国内,许多学者将Logit模型用于上市公司财务困境的预测研究,并取得了不错的效果。陈晓、陈治鸿(2000)使用Logit模型对ST公司和非ST公司进行了预测,其判别准确率为86.5%。常丽娟、张俊瑞(2007)建立了多元因变量Logit模型对69家进行了实证分析,并使用一个样本进行检验,评价结果与中介机构评价结果一致。

随着信息技术的发展,人工智能模型被引入到企业信用评估中,最典型的是人工神经网络(Artificial neural networks,简称ANN)的运用。神经网络对数据的要求不严格,处理非线性关系的变量具有良好的效果。但其工作的随机性较强,往往需要进行多重的训练。国外学者Altman、Marco、Jenson等都使用了神经网络分析法对公司的财务危机进行了预测研究,并取得了一定的成果。

王春峰、万海晖、张维(1999)使用神经网络法对100个企业样本进行了信用分析,研究结果中使用判别分析法的误判率为25.45%,神经网络法的误判率为18.18%。神经网络的预测准确性明显优于判别分析法。刘庆宏,刘列励(2009)对各类方法中的代表模型使用了两个数据集来验证他们的在信用评级应用中的评价效果,结论认为在各种方法中人工神经网络方法较为灵活与准确。但由于该研究数据为澳大利亚与德国企业的数据,未能代表其在中国的应用效果。

由于神经网络工作的随机性较大,需要人为地对网络结构进行调试,其应用受到了一定的限制。Altman(1997)经过研究后认为“神经网络分析方法在信用风险识别和预测中的应用,并没有实质性低优于线性判别模型”。

也有部分学者针对如何解决各种样本存在的问题,在模型中引入了各种处理方法进行改进。在解决小样本问题上,王春峰(2001)、胜(2004)的研究结果认为将cross-validation法引入信用风险评估建模技术,对于小样本情况更为有效。章华、卢太平(2006)考虑到企业财务信息不确定和样本的非典型分布特征,将灰靶模型引入对企业信用等级的评价。王慧玲等(2009)的研究表明在财务信用评价中引入熵模型,能够更加客观的确定评价指标的权重。

综合相关文献,我们可以发现随着统计分析方法的发展,越来越多的方法被应用到信用评价模型的分析中来以解决样本数据存在的缺陷。尽管信用风险评估方法层出不穷,但主流的方法只有多元Logistic回归、多元判别分析和神经网络法三大类。当前在准确性上较为认可的是神经网络法。

三、信用评价模型有效性研究

现代信用风险度量模型主要包括Credit Metrics模型、基于精算方法的信用风险附加(Credit Risk)模型、信用证券组合(Credit Portfolio View)模型以及基于期权定价理论的KMV模型。国内对现代信用风险度量模型的涉及最初见于对信用风险模型的综述类和比较类文献。阳(2000)、梁世栋等(200)、春等(2004)分别对各种信用风险度量模型做了比较分析。李志光(2007)在其硕士论文中对Credit Metrics模型、KMV模型、Credit Risk模型、CPV模型进行了分析比较,得出了Credit Metrics模型比其他模型在我国商业银行更具适用性和可行性的结论。

而对于Credit Risk模型,常丽娟等(2007)认为在我国的银行贷款业务中,行业特征和风险会对各笔贷款的独立性产生影响,不符合Credit Risk模型将每笔贷款是为独立的重要假设,该模型在我国的适用性令人怀疑。

国内对CPV模型进行的研究较少。靳凤菊(2007)基于CPV模型,选取了综合领先指标、中国房地产开发企业综合景气指数和企业景气指数三个指标从宏观层面对房地产信贷的信用风险进行了研究。杨岗、陈帅(2009)对KMV模型与CPV模型进行比较分析后认为,CPV模型能更好地把握经济变化对信用风险的影响。谢赤等(2006)对Credit Metrics模型与CPV模型进行了比较研究,结论认为CPV模型有利于提高信用风险度量的精确性,特别适用于投机性债务人。

国内较多的研究验证集中于KMV模型在我国的适用性。主要研究成果有:薛锋等(2003)讨论了运用KMV模型分析我国上市公司信用风险的优缺点和运用前景。常丽娟、张俊瑞(2007)使用中国上市公司数据,对KMV模型做了有效性检验,研究结果认为KMV模型在我国股票市场环境下具备整体有效性,但由于我国股票市场信息效率存在一定的缺陷,模型的预测效力尚显不足。李磊宁等(2007)在KMV模型中引入了公司资产价值增长率,使得模型在我国的适用性有了提高。李博、王海生(2008)使用修正后的KMV模型进行信用风险评价并检验了模型识别我国房地产上市公司信用风险的能力,发现模型能较好的识别出ST与非ST公司之间信用风险的差别,但同时也认为其在我国上市公司的预测准确率同其在国外的预测准确率相比相对较低。夏红芳、马俊海(2008)利用KMV模型,通过对我国4家上市公司5年股票价格的违约距离实证分析表明,KMV模型的灵敏度和预测能力都相当好。

这些学者普遍认为KMV模型在我国的实用性不高,主要在于我国缺乏一个完善的违约数据库,难以确定一个较为准确客观的经验EDF值。且我国资本市场上处于初步发展阶段,企业信息披露存在不足。必须结合我国的实际情况,不断地对模型进行修订与校验,才能提高KMV模型在我国的有效性。

四、小结

近年来我国经济一直在保持持续增长,在增长的同时我国的社会信用体系建设却严重滞后。企业缺乏一个良好的信用氛围,对于社会保障各种信用关系的健康发展和整个金融市场的稳定有着一定的影响。目前我国政府也越来越重视这个问题,并相应出台了一系列政策措施。如何有效地、客观地对企业的信用进行评价,不仅有利于保障企业各相关经济关系主体的利益,更有助于我们今后继续推进社会的信用体系建设。

参考文献

[1]夏红芳,赵丽萍.企业债券信用评级指标体系及神经网络方法[J].华东船舶工业学院学报,1998 (2).

[2]李小燕,卢闯等.企业信用评价模型、信用等级与业绩相关性研究[J].中国软科学,2003 (5).

[3]陈晓,陈治鸿.企业财务理论、方法及应用[J].投资研究,2000 (2).

[4]常丽娟,张俊瑞.企业财务信用评价与管理研究[M].大连:东北大学出版社,2007.

[5]王春峰,万海晖,张维.商业银行信用风险评估及其实证研究[J].管理科学学报,1998,1(1).

[6]李志光:Credit Metrics模型在我国商业银行信用风险管理的应用研究――基于我国商业银行某分机构的实证分析[D].上海财经大学,2007.

第9篇:人工神经网络的优缺点范文

论文关键词:适宜性评价,土地适宜性,GIS

0引言

土地适宜性评价作为土地评价的重要组成部分,是根据土地的自然和社会经济属性,研究土地对某一现状用途或预定用途的适宜程度。1976年联合国粮农组织(FAO)正式公布的《土地评价纲要》是最为典型的土地适宜性评价指南。由于土地适宜性评价针对性强,实用性大,应用很广,适宜性评价方法也不断有新的进展。

1评价方法

1.1经验法

评价人员与当地科技人员和有实际经验的人讨论,并依据研究区的具体情况和自己多年土地利用的经验,决定如何将各单项土地质量的适宜等级综合为总的土地适宜等级。该方法的优点是能考虑数学方法所不能包括的各种非数量因子及具体变化情况,缺点是要求评价者对当地条件、土地质量状况和作物生物学特性具有丰富的知识,才能做出正确的判断(夏敏,2000),而且不可避免的是易造成评价结果的主观性。由于这些局限加上新方法、新技术的发展,经验法的受用面越来越小。

徐樵利(1994)在湖北省宜昌县完成的适种柑橘的土地评价系统就采用经验法,参照《土地评价纲要》建立起来的。首先确定影响柑橘生长的限制因素,然后逐项对它们进行分级,最后再综合成总的土地适宜等级。同时,在评价过程中适当考虑管理、投资和柑橘产量等社会经济因素。李秀斌(1989)对黄淮海平原土地做的农业适宜性评价也采用了此法。

1.2极限条件法

该方法主要强调主导因子的作用,运用“木桶原理”,将单项因子评价中的最低等级直接作为综合评价的等级(黑龙江省农、林、牧土地适宜性评价,赵松乔等;江苏省宜兴市南部丘陵山区的土地适宜性评价,倪绍祥)。极限条件法简单易操作,能很好体现个别极端决定土地利用适宜性的因素,但该方法未考虑到在一些情况下,土地某种性质的不足可为其他部分所弥补(陈建飞等GIS,1999),因此得出的结论偏于草率和绝对,而且在多数情况下,综合评定出的土地等级偏低。

1.3数学方法

数学方法以权重法为中心,即确定各个参评因子及其权重,然后对两者的乘积加总,以和作为分等级的根据。主要分为多因素综合评定法和模糊综合评判法。

1.3.1多因素综合评定法(指数和法)

该方法将各参评因子按其对土地适宜性贡献或限制的大小进行经验分级或统计分级并赋值,然后用各参评因子指数之和来表示土地适宜性的高低。最后按照指数和大小排序,以经验确定指数和的分等界线。其中各参评因子及其权重系数的确定可依据回归分析法、层次分析法、专家征询法(Delphi)等。采用这些数学方法的目的都是为了获得尽量准确的权重和指数和,以期尽量准确地评价适宜性等级(夏敏,2000),而且非数量化质量性状数量化和不同计量单元无量纲化使得各参评因子间具有了明显的可比性(何敦煌,1994),缺点在于较极限条件法需增加大量计算过程,在地类复杂、评价单元数量较多的区域工作量明显增加(何敦煌,1994),同时不能考虑到非数量因子的具体变化情况(夏敏,2000),而以和值计算土地质量综合指数往往会掩盖某些特别限制因子对评价目标所造成的质的影响(徐丽莎,2008),层次分析法、Delphi法在确定权重系数时主观性过大。

刘胤汉等(1995)在陕西采用专家征询法对农业土地资源作了综合性适宜性评价,经过两轮征询后确定了坡度、高程等6个指标极其权重系数,最后将农业土地分为最佳适宜、中等适宜和临界适宜三等,并按此法对水稻作了单向性土地适宜性评价。吴燕辉等(2008)以湖北省潜江市为研究范围,在GIS技术的支持下,阐述了如何用层次分析法进行土地适宜性评价,得到了潜江市的适宜性等级图,并单独对农用地、林地、建设用地的适宜性评价结果作了分析。

1.3.2模糊综合评判法

这种方法用于评价的原理,是对参评因子和适宜性等级建立隶属函数,对参评因子的评价由参评因子对每一个适宜性等级的隶属度构成,评定结果是参评因子对适宜性等级的隶属值矩阵;参评因子对适宜性的影响大小用权重系数表示,构成权重矩阵,将权重矩阵与隶属值矩阵进行复合运算,得到一个综合评价矩阵,表示该土地单元对每一个适宜性等级的隶属度。模糊综合评判方法较好地体现了主导因素和综合分析的相结合,比较符合客观实际,通过对参评因素隶属度的计算和模糊矩阵的复合运算得出评价单元对应于各等级的隶属度,其计算过程无需再掺入人为因素,减少了主观性的干扰(陈建飞等,1999)。但是根据实地采集的调查数据对模糊综合评判模型进行验证,会发现模型存在一定的误差,有一部分正确的样本数据却得不到正确的结果(焦利民等,2004)。

E. Van Ranst等(1994)采用该法对泰国半岛的橡胶生产区做了土地适宜性评价。他们创新地根据每个因素对产量的影响赋予一定的权重系数,并将单项因子的适宜性评价与综合的土地适宜等级结合起来。最后将评价结果与常规的极 限条件法、参数法和多元线性回归的评价结果相比较,得出模糊综合评价法的准确性较好,从而证明了该法的潜力。P.A.BURROUGH等(1992)采用加拿大阿尔伯塔农业实验农场的数据,分别用布尔数学法和模糊分类法对每个细胞的土地属性进行分类,得出布尔方法比模糊分类拒绝更多的细胞GIS,选取的细胞也不够毗连。而模糊分类法在所有的阶段都获得更多的有效信息,分类的连续变化性也更好。

姚建民(1994)在典型的黄土残塬沟壑区——隰县针对如何利用农作物、果树、林木和牧草开发土地资源问题,重点筛选出原土地利用类型、坡度、坡向和海拔高程4个指标,运用模糊综合评判法进行适宜性评价,划分出土地适宜性开发类型区。刘耀林等(1995)在十堰市土地利用现状调查的基础上,针对现有坡荒地,通过对制约土地的自然因素和社会经济条件的综合分析,依照土地质量满足对预定用途要求的程度,采用模糊数学的方法完成了坡荒地的宜农、宜林、宜牧、宜园4个适宜类的评价。陈建飞等(1999)应用模糊综合评判(Fuzzy Set)法、经验指数和法、极限条件法进行长乐市土地适宜性评价,对不同方法及结果进行对比分析,得出模糊综合评判的结果与经验指数和的结果有较大的相似性、极限条件法的结论往往过于简单,着重探讨了模糊综合评判方法的优点——合理、客观。

1.4人工智能方法

人工智能方法基于自学习、自适应系统的样本学习机制,如人工神经网络方法、遗传算法、元胞自动机等。刘耀林、焦利民(2004)基于神经网络来构造模糊系统,建立了土地适宜性评价的模糊神经网络模型;根据神经网络误差反向修正的原理,设计和推导了该模型的学习算法,并通过实验证明该模型应用于土地适宜性评价具有高效、客观、准确等优点。次年(2005),两人将计算智能理论引入土地评价领域,构建了一个全新的土地适宜性评价模型:首先基于模糊逻辑和人工神经网络构造了一个模糊神经网络模型,然后采用改进的遗传算法进行训练,能够快速收敛到最优解,对初始的规则库进行修正,形成了一个自学习、自适应的评价系统。

1.5改进后的方法

以上介绍了在土地适宜性评价中常用的基本方法。近年来,鉴于各种方法本身的局限性,很多学者提出了各种方法相互结合或对原方法加以改进的评价方案,并应用于某地的土地适宜性评价,取得了较好的结果。

厦门大学何敦煌(1994)在福建龙海适宜性评价中尝试采用了极限条件法和指数和法相结合的两次评价,即用极限条件法评价土地适宜类,用极限条件法和指数和法评价土地适宜等并确定土地限制性(适宜级)是同时进行的。这一方法不仅克服了极限条件法和指数和法的缺点,还相互间起了交叉检验的作用。

南京大学彭补拙等在做中亚热带北缘青梅土地适宜性评价时对盛花期温度和土壤PH值这两项对青梅生产发育有重要限制作用的因素采用极限条件法,对其余的评价因子采用逐步回归分析法进行分析,作必要的因子剔除,得到它们的总适宜等级,最后再对这三项评价的结果按极限条件法进行归总,得到该土地利用方式的适宜性等级最后评价结果,该结合体现各土地构成要素的不同贡献,提高评价结果的科学性和合理性。

北大的杜红悦等以攀枝花为例,用模糊数学方法对FAO的农业生态地带法(AEZ)进行改进,并将GIS技术应用于AEZ法中;欧阳进良等针对不同作物进行土地适宜性评价,并据评价结果、各类土地的特点及区位和经济因素进行作物种植分区。

2新技术的应用

随着数学方法的改进和新技术如3S(遥感技术RS、全球定位系统GPS和地理信息系统GIS)、ES(专家系统)的应用,给土地评价,尤其是土地适宜性评价带来了飞跃,它们在数据的获得、处理、分析上的强大功能不仅使工作效率大大提高,还使基于大范围的调查评价成为可能。

Jacek Malczewski (2004)对基于GIS的土地适宜型分析做了系统全面的梳理,他先从历史的角度介绍了GIS的知识及其发展过程,然后回顾了基于GIS的土地适宜型评价的相关方法和技术,最后分析了其存在的挑战、未来趋势和前景。胡小华等(1995)通过专家系统的引入、层次分析法的应用以及如何借助地理信息系统强大的空间分析功能及图形和属性的结合,实现了多目标土地适宜性的评价。张红旗(1998)在评价柑桔土地适宜性时,结合GIS技术GIS,改变以往仅考虑自然条件的做法,分别建立柑桔土地的自然、经济、社会属性适宜性评价模型及综合评价模型,提高评价结果的科学性和合理性,也为其他类型的单作物(广义)土地适宜性评价提供了一个可行的模式。

S.Kalogirou (2002)运用专家系统和地理信息系统技术,建立了支持实证研究的土地适宜性评价模型——LEIGIS软件。该模型基于联合国粮农组织的作物土地分类,分为物理评价和经济评价。物理评估选用了17种指标因子,采用布尔分类法,包括了一般种植作物和5种特定作物(小麦,大麦,玉米,棉花种子,甜菜)的评价模型。经济评价考虑了市场限制下的收入最大化问题。专家系统使得评价不同作物时规则可以适当改变,地理信息系统使得空间数据的管理和结果可视化成为可能。该软件支持任何空间数据集的评价和介绍,而且不需要评价者掌握特殊的电脑技能。夏敏(2000)在其硕士论文里探讨了以地理信息系统和专家系统为技术支持,开发农地适宜性评价专家系统的可行性,在Mapinfo地理信息系统的支持下,建立了一个具有一定通用性的农地适宜性评价专家系统,并通过了在邳州市的实证研究。

3结论

我国的土地适宜性评价始于50年代,综合的土地适宜性评价从70年代末全面展开,近l0年来,土地适宜性评价得到了更快的发展,更重视定性与定量相结合、针对特定目标或对象。经验法、极限条件法、多因素综合评定法法、层次分析法等继续得到使用,但通常做适当的改进或与其他方法相结合,弥补各自的缺陷。模糊综合评价法、灰色关联度分析法仍然得到了很广的应用,神经网络模型、遗传算法等新方法开始尝试性应用。科技的发展使得3S技术和专家系统等新技术广泛用于土地评价,尤其给土地适宜性评价中带来了质的飞跃,接下来的土地适宜性评价仍基于上述技术的支持是必然的趋势。

参考文献

[1]Burrough Pa, Macmillan Ra and Vandeursen W. 1992. Fuzzy Classification Methodsfor Determining Land Suitability from Soil-profile Observations and Topography[J].Journal of Soil Science, 43(2), pp. 193-210

[2]E. Van Ranst, H. Tang, R. Groenemam andS. Sinthurahat. 1996. Application of Fuzzy Logic to Land Suitability for RubberProduction in Peninsular Thailand[J]. Geoderma, 70(1), pp. 1-19

[3]FAO. A Framwork for Land Evaluation[S]. FAO Soil Bulletin32,Rome, 1976

[4]Jacek Malczewski. 2004. GIS-basedLand-use Suitability Analysis: a CriticalOverview[J]. Progress in Planning, 62(1), pp. 3-65

[5]S. Kalogirou. 2002. Expert Systems and GIS: an Applicationof Land Suitability Evaluation[J]. Computers, Environment and Urban Systems, 26( 2-3), pp. 89-112

[6]陈建飞,刘卫民.Fuzzy综合评判在土地适宜性评价中应用[J].资源科学,1999,21(4):71-74

[7]杜红悦等.土地农业适宜性评价方法研究与系统实现——以攀枝花为例[J].资源科学,2001,23(5):41-45

[8]何敦煌.关于土地适宜性评价工作的几个问题探讨[J].中国土地科学,1994,8(6):11-15

[9]胡小华等.GIS支持的多目标土地适宜性评价[J].中国土地科学,1995,9(5):33-37

[10]焦利民,刘耀林.土地适宜性评价的模糊神经网络模型[J].武汉大学学报·信息科学版,2004,29(6):513-516

[11]李秀斌等.黄淮海平原土地农业适应性评价[J].自然资源,1989,(4):32-38

[12]刘胤汉等.农业土地资源适宜性评价的理论和方法[J].地域研究与开发,1995,14(3):11-16

[13]刘耀林等.模糊综合评判在土地适宜性评价中应用研究[J].武汉测绘大学学报,1995,20(1):71-75

[14]刘耀林,焦利民.基于计算智能的土地适宜性评价模型[J].武汉大学学报·信息科学版,2005,30(4):283-287

[15]倪绍祥著.土地类型与土地评价概论[M].高等教育出版社,1999

[16]倪绍祥.近10年来中国土地评价研究的进展[J].自然资源学报,2003,18(6):672-683

[17]欧阳进良,宇振荣.基于GIS的县域不同作物土地综合生产力评价[J].农业现代化研究,2002,23(2):97-10

[18]彭补拙等.中亚热带北缘青梅土地适宜性评价方法探讨[J].自然资源,1994,(2):14-21

[19]邱炳文等.GIS在土地适宜性评价中的应用与展望[J].地理与地理信息科学,2004,(5):20-23,44

[20]钱海滨等.土地资源合理利用评价研究综述[J].中国土地科学,2001,15(2):14-19

[21]吴燕辉等.土地利用规划中的土地适宜性评价[J].农业系统科学与综合研究,2008,24(2):232-235,242

[22]徐丽莎.土地适应性评价的理论与评价方法综述[J].今日南国,2008,(9):18-20

[23]夏敏.农地适宜性评价专家系统研究[D].南京农业大学硕士论文.2000

[24]徐樵利,谭传凤等.山地地理系统综论[M].华东师范大学出版社,1994