公务员期刊网 精选范文 人工神经网络的缺点范文

人工神经网络的缺点精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的人工神经网络的缺点主题范文,仅供参考,欢迎阅读并收藏。

人工神经网络的缺点

第1篇:人工神经网络的缺点范文

关键词:人工神经网络 矿山 安全状态 评判能力

中图分类号:TD77;TP181 文献标识码:A 文章编号:1007-9416(2015)04-0206-01

通过改变神经网络训练样本等方式,对神经网络不同训练样本的反应能力进行对比分析,从而探讨人工神经网络对矿山安全程度评价的适应性。为了有效的提高人工神经网络对矿山安全程度评价的能力,可以通过改变神经网络的神经元数目以及初值赋值的方式来测试不同的结构,从而得出不同参数下神经网络对相同训练样本的评价结论,以便提高其评价能力,在矿山安全状态评判中充分发挥出人工神经网络的作用。

1 人工神经网络中的网络结构设计与原始数据的准备

本文中主要采取如1所示的神经网络结构,根据测试目的的差异性,其测试过程中神经网络的部分性能也就不同,但是对整个网络结构的性能不会改变。

这种神经网络的主体结构是单输入、三层式BP的网络结构,输出连接、目标连接、输入权重连接、偏置连接以及层权连接等是其主要的连接方式。各层神经元的分类包括:第一隐含层有8个正切S型神经元,第二隐含层有8个对数S型的神经元,输入层有4个元素,输出层有一个线性神经元。其网络函数主要包括训练函数、初始化函数、性能函数以及各网络层的层初始化函数。其训练函数需要采取TRAINLM回转方法来运算;初始化函数需要采取逐层初始化的方法运算;性能函数需要采取均方误差法来计算;各网络层的层初始化函数需要采取优化规则的方式计算,有的时候还需要采取INITWB的方式进行运算。各个权阈值的初始化需要采用RANDS方法来计算。在人工神经网络训练的原始样本数据以及期望值中,这些数据主要是用来评价地质因素对矿山安全影响程度的原始数据。当训练完成之后,需要对其各种数据进行仿真测试,以便评断这种人工神经网络结构在矿山安全状态中的应用价值与能力,并对其不足之处以及缺陷问题等进行分析,以便寻找出更加优化的方案,从而提高人工神经网络在矿山安全状态中的评判作用与能力。

2 人工神经网络对矿山安全状态评判能力的训练以及仿真测试

对矿山安全评价的方法较多,但是能够较好的应用于矿山安全评价的方法却很少,例如事故树分析法、概率风险评价法以及事件树分析法等,这些方法均由于基本事件的发生概率的确定方面存在一定的困难,从而导致运用于矿山过程中的安全评价效率不高。另外,在矿山安全状态评价的过程中,其安全检查表、专家评价方法等存在一定的缺点与不足,其在评价的过程中,主观性较强,受到个人意识的影响较大。综合指标评价法由于其指标间的逻辑关系,指标的权值与指标的量化等问题,从而导致该方法难以在矿山安全状态中进行准确的评价。只有能够更好的适应这种复杂的动态系统的安全评价方法,才能够将其更好的应用在矿山安全状态评价中[1]。

其中人工神经网络在处理无法使用简单规则或公式进行描述的大量的原始数据的问题时,以及在处理规律不清楚的问题时,其具有较大的优势。也正是由于这种方法能够对复杂的非线性动力学系统的适应,才能够使其在矿山安全状态评价中得到引进与推广。将人工神经网络对矿山安全状态评价能力的训练进行仿真实验,在每次实验检测之前,都需要对同一神经网络进行重新初始化,之后需要运用相同的训练样本数据对神经网络进行训练,以便达到训练要求后对网络进行仿真测试,训练性能函数的误差需要保持在10以内。其神经网络的训练过程是网络在初始权阈值的基础上,对其权阈值进行不断的修改,以便寻找出它们之间的某种联系,使得输入的整个训练样本集数据经过网络的运算之后,其输出与相应的目标数据差别能够满足性能函数的要求。因此,在人工网络对矿山安全状态进行评判的时候,即使所有数据与性能均符合要求,但是由于在训练的时候就被赋予了不同的权阈值,训练之后得到的权阈值的最终组合也会存在较大的差异。通过神经网络对矿山进行安全评判的目的在于运用神经网络总结分析数据,对矿井各个致灾的贡献率进行分析,进而对矿山的安装状态进行评判。从神经网络的角度来分析,通过运用网络的运算功能对训练样本的数据进行统计分析,并从中找出满足目标值以及性能要求的权阈值组合形式,从而通过仿真方式来评价矿山的安全状态。

3 结语

通过对人工神经网络在矿山安全状态的评判能力进行训练以及仿真测试后,发现人工神经网络与人类评判方法存在一定的差异性,在今后的发展过程中,还需要对人工神经网络在矿山安全状态中的评判能力进行不断的优化与改进,以便更好的适应矿山安全状态的评判,在矿山安全状态的评判中充分发挥出人工神经网络的作用,从而更好的确保矿山生产与经营的安全性。

第2篇:人工神经网络的缺点范文

Abstract: The technology of affecting the output accuracy of artificial neural network model has affected widespread ettention,and influence researches of sample quality to neural network output accuracy are very few,and the majority of these researcher about neural network structure. This paper analyses the influence of the sample to the output of artificial neural network,having important significance to improve accuracy of neural network output.

关键词: 人工神经网络;局部影响;BP神经网络;算法

Key words: artificial neural networks;local influence;BP neural network;algorithm

中图分类号:TP393.092 文献标识码:A文章编号:1006-4311(2010)07-0144-02

0引言

神经网络应用到预测有许多问题需要解决, 其中最为突出的问题就是没有一个确定的最合适的神经网络结构的标准方法,由于影响神经网络预测能力的参数很多,本文针对最为常用的BP神经网络,对影响神经网络预测精度的样本质量进行了详细分析和研究, 并在此基础上,给出优化样本后的具体例子。

1样本质量对网络的影响

用于神经网络的样本分为训练样本和测试样本,训练样本的质量在一定程度上决定着预测精度。首先,训练样本和待预测样本的均值存在较大差异, 预测误差会随着长时间的训练而增大。其次,训练误差会随着训练样本和待预测样本均值间差异的增大而增大。再次,训练误差会随着训练样本和待预测样本方差间差异的增大而增大[1]。下面是文献[1]对样本质量分析的方法。

文献[1]的人工神经网络预测误差为e=em+et+er,其中,e为预测误差;em为模型误差,它由所建回归模型与实际系统的差异引起的;et为最终的训练误差;er为人工神经网络训练和预测过程中引入的随机误差。et和er的存在是不可避免的,而em为:em=ef+ed,式中ef为实际输出值与预测输出值之间的误差,它反映了样本质量;为由不正确的嵌入维数引起的误差, 它可通过选择合适的输入神经元数来消除。

为了评价训练样本质量,根据ef提出“一致度”的指标。文献[1]定义了伪距离DCTP-D,但计算伪距离是相当复杂的,难于实现对样本质量的分析和应用。下面用协方差比统计量分析训练样本对预测精度的影响。

设训练样本为θ,是神经网络的输出,i是从θ中剔除第i个数据点的神经网络输出。则剔除第i个数据点的协方差比统计量CR=cv()cv()表明了剔除第个数据点对神经网络输出精度的影响,从精度方面刻画了第i个数据点的重要程度。CRi-1的值越大,对预测精度(神经网络输出)的影响越大。在使用PB神经网络预测时先对训练样本进行筛选,剔除对网络输出结果影响小的样本点。

样本精简:矩阵初等行变换能保持矩阵列向量之间的线性关系,利用这个结论我们可以用来进行样本数据的精简,这样精简后的样本数据能够保持各属性字段之间的线性关系。神经网络的训练实际上是一个通过给定样本实时调整网络连接权重的过程,样本预处理的结果对于网络训练的收敛性起到关键的作用。

2实例分析

本文采用麻省理工大学林肯实验室的测试数据KDDCUP99,它是专门用来进行入侵检测评估的。我们采用数据集上的一个子集10%作为实验数据源,它一共包含有494021条网络连接,其中正常连接97277 条,异常连接396744条。

下面我们针对DOS攻击类型数据(DOS攻击类型编码为“0 0 0 1”)进行分析。

设A为样本数据矩阵,其中每一行向量表示一条样本数据,则该行向量含34个数据,假设有a条样本,则A为a行34列矩阵;由于每条样本数据输入网络后都会有一条对应的输出,加上本实例为DOS攻击类型以编码“0 0 0 1”表示,则期望输出矩阵B为a行4列矩阵(暂时先不考虑阈值,只考虑权重问题)。本文BP神经网络的输入节点数为34个,隐含层节点数为15个,输出层节点数为4个虽然神经网络的连接权重可以用一个实数串进行表示,但在进行网络的训练时,还需要将实数串分为两部分,设输入层到隐含层的连接权重矩阵为W1,则W1为34行15列矩阵;同理,隐含层到输出层的连接权重矩阵W2为15行4列矩阵。于是我们可以得到公式(1)。

AWW=B(1)

如式(2)所示,A和B是系数矩阵 ,C是增广矩阵。经过带约束初等行变换后如式(3)所示。

C=[AB](2)

C=[AB]A′B′C D(3)

式(3)中,C、D为零矩阵,经过处理以后,由原先的A对应输出B变成了现在的A′对应输出B′,通过这样的处理,我们就可以将大样本变为小样本,从而使计算更加快速,样本数据更加精简。 为了能使样本应用于本文提出的分类检测器同步检测模型,我们将样本数据先进行归类合并,分别构造出DOS、PROBE、U2R、R2L四大类攻击样本数据集,这样四个检测器分别检测四大类攻击。为了降低可疑攻击数,即四大攻击类型数据集之间的重叠记录数要少。精度过大会增加计算量,从而会降低学习速度;精度过小,会使记录重叠数增加,从而造成可疑攻击数增加,影响训练结果。

对训练样本用上述方法进行优化后,利用矩阵初等行变换能保持矩阵列向量之间的线性关系这个结论,我们可以进一步对样本数据的精简,这样精简后的样本数据能够保持各属性字段之间的线性关系。神经网络的训练实际上是一个通过给定样本实时调整网络连接权重的过程,样本预处理的结果对于网络训练的收敛性起到关键的作用。

3结论

(1)分析神经网络进行非线性预测多变量预测的优越性以及神经网络用于预测的缺点所在。

(2)提出了影响网络预测能力的五个重要参数:样本质量、样本归一化、输人层节点数、隐层节点数及网络训练允许误差目标值。

(3)在一定允许训练误差的情况下,研究了无个参数对网络预测精度的影响,发现存在一个最优的样本、输入层节点数和隐层节点数,这样的网络具有较强的预测能力。

(4)本文用遗传算法构造了同时优化影响神经网络预测精度的参数(输入层节点数、隐层节点数及样本允许训练误差)的算法, 得到了较优的网络预测模型最后, 用算例验证了本文分析结果的正确性。

参考文献:

[1]陈果.神经网络模型的预测精度影响因素分析[J].北京: 模式识别与人工智能,2005,18(5):528-533.

[2]蒋林,陈涛,屈梁生.训练样本质量对人工神经网络性能的影响[J].北京:中国机械工程,1979,8(2):50-53.

[3]李敏强,徐博艺,寇纪淞.遗传算法与神经网络的结合[J].北京:系统工程理论与实践,1999(2).

[4]吴怀宇,宋玉阶.非线性回归分析中的神经网络方法[J].武汉:武汉冶金科技大学学报,1998,21(1):90-93.

第3篇:人工神经网络的缺点范文

关键词 矿井提升机;模糊理论;神经网络;小波变化;智能诊断

中图分类号:TD534 文献标识码:A 文章编号:1671—7597(2013)051-041-01

矿井提升机是集械、电、液于一体的大型设备。矿井提升机在煤矿生产过程中主要担负着提升人员、生产设备、煤炭和矸石等任务。矿井提升机一旦发生故障,轻则导致矿山停产停工,严重时则有可能造成人员伤亡事件。为了确保矿井提升机能够安全运行避免矿山事故的发生,国内外相关科技工作者也进行了大量的探讨和研究,其中矿井提升机的故障诊断技术是一个重要方面。矿井提升机故障诊断技术的成功应用对煤矿的安全生产起到了积极的作用,为煤矿企业也会产生巨大的经济效益。

1 矿井提升机故障分类

矿井提升机的故障可分为机械故障与电气故障两类。机械故障是指矿井提升机设备上的某些参数超过了正常运行时的额限,是一种提升机设备的外在表现形式,主要解决方法是给提升机设备增加一些保护装置,防止机械故障发生。电气故障需要测量和检测提升机设备上的工况参数和数据信息,并将这些工矿参数和数据信息进行数据处理和综合分析才能诊断出提升机设备的故障位置、故障问题和原因。由于矿井提升机的电气故障往往与很多的设备变量和参数有关联,从而降低了提升机故障诊断的准确率。如果电气故障不能有效而快速的得到解决,也会导致提升机设备机械故障的发生。

2 矿井提升机故障诊断存在的问题

目前关于提升机故障诊断研究还相对较少,现有的提升机故障诊断系统也存在一些不足和缺陷。比如,当提升机控制系统中的传感器或执行器发生故障问题, 将会严重影响提升机系统的安全可靠运行;对矿井提升机系统中的工矿参数和数据信息处理准确度不高,提升机设备智能化程度相对较低,也是目前矿井提升机故障诊断中存在的问题;对于以开发的矿井提升机智能故障诊断系统还存在自适应能力弱,实时性不强等缺点。

3 矿井提升机智能故障诊断技术及发展趋势

提高矿井提升机的安全可靠性,通常有2种方法。一种是设计高可靠的矿井提升机制动系统,二是对矿井提升机的制动系统进行故障诊断。目前对于矿井提升机的智能故障诊断的研究成果很多,下面主要介绍几种常见的智能故障诊断技术以及提升机故障诊断技术未来的发展趋势。

3.1 基于模糊理论的矿井提升机故障诊断方法

矿井提升机的模糊诊断法是将数学集合论的概念应用到提升机设备的故障诊断中,进行模糊推理,实现矿井提升机的故障诊断,从而解决提升机设备征兆与故障间的不确定关系。该诊断方法模糊推理逻辑严谨,但是由于较难确定矿井提升机故障的模糊关系,模糊诊断知识获取困难等原因,因此矿井提升机的模糊诊断法还缺乏一定的准确性。

3.2 基于神经网络的矿井提升机故障诊断方法

人工神经网络具有容错能力、自学习和自适应能力以及并行处理信息能力强等特点。由于人工神经网络具有以上特点,目前将人工神经网络应用到矿井提升机故障诊断的研究也逐渐增多,主要研究有基于BP神经网络或基于Elman神经网络的矿井提升机故障诊断方法。该方法的主要思想是将矿井提升机的故障特征向量作为人工神经网络的输入,将矿井提升机的故障分类模式向量作为人工神经网络的输出。输入特征信号的提取方法主要有:时域特征法、频域特征法以及幅值域特征法;时间序列法;小波变换特征提取法等。

3.3 基于小波变换的矿井提升机故障诊断方法

小波变换是时间频率的局部化分析,它通过平移伸缩运算对信号进行多尺度细化,从而达到在信号低频处频率细分,高频处时间细分,进而可以观察到信号的任意特性细节。其最显著的特点是能够进行信号的多分辨率分析,对于正常信号中夹带的瞬态反常现象,不仅能检测出来,还能够展示该反常信号的成分,因此基于小波变换技术在矿井提升机的故障诊断中得到了广泛应用。利用小波变换对矿井提升机的动态系统的故障检测与诊断也具有很好的效果,为矿井提升机的智能故障诊断技术提供了一种强而有力的分析手段。

3.4 基于人工智能的矿井提升机故障诊断方法

基于免疫粒子群算法的矿井提升机故障诊断方法是将人工免疫模型和离散粒子群进化算法相结合的一种矿井提升机故障诊断方法。该方法提高了矿井提升机故障诊断的执行效率,并且能够适应提升机故障诊断过程中出现的不确定性,还可以实现多种提升机故障诊断。

基于遗传神经网络算法的矿井提升机故障诊断方法是将遗传算法和人工神经网络相结合的一种新的提升机故障诊断方法。该方法将遗传算法的全局特性和神经网络的并行处理信息能力强等优点相接合,能够有效的克服人工神经网络收敛速度慢以及容易陷入局部极小等缺点,从而更加准确的建立矿井提升机故障诊断系统,快速地判断出矿井提升机的故障。

4 结束语

随着现代科技的发展,越来越多的新型智能诊断理论开始应用于矿井提升机的故障诊断,如小波分析、人工神经网络、免疫算法以及遗传算法等。开展对矿井提升机的智能故障诊断的研究,将会极大地提高提升机运行的安全可靠性,避免矿井事故的发生,减少不必要的损失, 为矿井提升机设备的经济、高效以及安全运行提供强而有力的技术支持。

参考文献

[1]张平.矿用机电设备常见故障及其解决策略[J].硅谷,2012(6):88.

[2]罗永仁,晏飞.故障智能诊断技术及其在矿井提升机上的应用研究[J].2006(11):117-119.

[3]吴舰,吴楠.基于小波分析的煤矿机电设备故障检测关键技术应用研究[J].自动化与仪器仪表,2011(5):85-86.

[4]汪楚娇,夏士雄,牛强.免疫粒子群算法及其在矿井提升机故障诊断中的应用[J].电子学报,2010:94-98.

作者简介

第4篇:人工神经网络的缺点范文

关键词性能对比感知器BP网络霍普菲尔德网络字符识别

1引言

人工神经网络是在人类对其大脑神经网络认识理解的基础上人工构造的能够实现某种功能的神经网络。 它是理论化的人脑神经网络的数学模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。因其自组织、自学习能力以及具有信息的分布式存储和并行处理,信息存储与处理的合一等特点得到了广泛的关注,已经发展了上百种人工神经网络。

一般来说,人工神经网络从结构上可分为两种:前向网络和反馈网络。典型的前向网络有单层感知器、BP网络等,反馈网络有霍普菲尔德网络等[1]。

人工神经网络已经被广泛应用于模式识别、信号处理、专家系统、优化组合、智能控制等各个方面,其中采用人工神经网络进行模式识别具有一些传统技术所没有的优点:良好的容错能力[2j、分类能力、并行处理能力和自学习能力,并且其运行速度快,自适应性能好,具有较高的分辨率。单层感知器、BP网络和霍普菲尔德网络均可以用于字符识别。

本文通过具体采用感知器网络、BP网络和霍普菲尔德反馈网络对26个英文字母进行识别的应用,通过实验给出各自的识别出错率,通过比较,可以看出这3种神经网络的识别能力以及各自的优缺点。

2 字符识别问题描述与网络识别前的预处理

字符识别在现代日常生活的应用越来越广泛,比如车辆牌照自动识别系统[3,4],手写识别系统[5],办公自动化等等[6]。毕业论文 本文采用单层感知器、BP网络和霍普菲尔德网络对26个英文字母进行识别。首先将待识别的26个字母中的每一个字母都通过长和宽分别为7×5的方格进行数字化处理,并用一个向量表示。其相应有数据的位置置为1,其他位置置为O。图1给出了字母A、B和C的数字化过程,其中最左边的为字母A的数字化处理结果所得对应的向量为:IetterA~「00100010100101010001111111000110001〕’,由此可得每个字母由35个元素组成一个向量。由26个标准字母组成的输人向量被定义为一个输人向量矩阵alphabet,即神经网络的样本输人为一个35×26的矩阵。其中alphabet=[letterA,letterB,lettere,……letterZj。网络样本输出需要一个对26个输人字母进行区分输出向量,对于任意一个输人字母,网络输出在字母对应的顺序位置上的值为1,其余为O,即网络输出矩阵为对角线上为1的26×26的单位阵,定义target=eye(26)。

本文共有两类这样的数据作为输人:一类是理想的标准输人信号;另一类是在标准输人信号中加上用MATLAB工具箱里的噪声信号,即randn函数。

3 识别字符的网络设计及其实验分析

3.1单层感知器的设计及其识别效果

选取网络35个输人节点和26个输出节点,设置目标误差为0.0001,最大训练次数为40。设计出的网络使输出矢量在正确的位置上输出为1,在其他位置上输出为O。医学论文 首先用理想输人信号训练网络,得到无噪声训练结果,然后用两组标准输入矢量加上两组带有随机噪声的输人矢量训练网络,这样可以保证网络同时具有对理想输人和噪声输人分类的能力。网络训练完后,为保证网络能准确无误地识别出理想的字符,再用无噪声的标准输入训练网络,最终得到有能力识别带有噪声输人的网络。下一步是对所设计的网络进行性能测试:给网络输人任意字母,并在其上加人具有平均值从。~0.2的噪声,随机产生100个输人矢量,分别对上述两种网络的字母识别出错率进行实验,结果如图2所示。其中纵坐标所表示的识别出错率是将实际输出减去期望输出所得的输出矩阵中所有元素的绝对值和的一半再除以26得到的;虚线代表用无噪声的标准输人信号训练出网络的出错率,实线代表用有噪声训练出网络的出错率。从图中可以看出,无噪声训练网络对字符进行识别时,当字符一出现噪声时,该网络识别立刻出现错误;当噪声均值超过0.02时,识别出错率急剧上升,其最大出错率达到21.5%。由此可见,无噪声训练网络识别几乎没有抗干扰能力。而有噪声训练出的网络具有一定的抗干扰能力,它在均值为。~0.06之间的噪声环境下,能够准确无误地识别;其最大识别出错率约为6.6%,远远小于无噪声训练出的网络。

3.2BP网络的设计及其识别效果

该网络设计方法在文献[lj中有详细介绍。网络具有35个输人节点和26个输出节点。目标误差为0.0001,采用输人在(0,l)范围内对数S型激活函数两层109519/109519网络,隐含层根据经验选取10个神经元。和单层感知器一样,分别用理想输人信号和带有随机噪声的输人训练网络,得到有噪声训练网络和无噪声训练网络。由于噪声输人矢量可能会导致网络的1或o输出不正确,或出现其他值,所以为了使网络具有抗干扰能力,在网络训练后,再将其输出经过一层竞争网络的处理,使网络的输出只在本列中的最大值的位t为1,保证在其他位置输出为O,其中网络的训练采用自适应学习速率加附加动量法,在MATLAB工具箱中直接调用traingdx。在与单层感知器相同的测试条件下对网络进行性能测试,结果如图3所示。其中虚线代表用无噪声训练网络的出错率,实线代表用有噪声训练网络的出错率。从图中可以看出,在均值为o一0.12之间的噪声环境下,两个网络都能够准确地进行识别。在0.12~0.15之间的噪声环境下,由于噪声幅度相对较小,待识别字符接近于理想字符,故无噪声训练网络的出错率较有噪声训练网络略低。当所加的噪声均值超过。.15时,待识别字符在噪声作用下不再接近于理想字符,无噪声训练网络的出错率急剧上升,此时有噪声训练网络的性能较优.

转贴于 3.3离散型,霍普菲尔德网络的设计及其识别效果

此时网络输人节点数目与输出神经元的数目是相等的,有r=s=35,采用正交化的权值设计方法。在MATLAB工具箱中可直接调用函数newh叩.m。要注意的是,由于调用函数newhoP.m,需要将输人信号中所有的。英语论文 变换为一1。如letterA~[一1一11~1-1一11一11一l一11一11一11一1一1一11111111一l一l一111一1一1一11〕’。设计离散型霍普菲尔德网络进行字符识别,只需要让网络记忆所要求的稳定平衡点,即待识别的26个英文字母。故只需要用理想输人信号来训练网络。对于训练后的网络,我们进行性能测试。给网络输入任意字母,并在其上加人具有平均值从。~0.5的噪声,随机产生100个输人矢量,观察字母识别出错率,结果如图4所示。从图中可以看出,在均值为0~0.33之间的噪声环境下,网络能够准确地进行识别。在0.33~0.4之间的噪声环境下,识别出错率不到1%,在0.4以上的噪声环境下,网络识别出错率急剧上升,最高达到大约10%。可以看出,该网络稳定点的吸引域大约在0.3~。.4之间。当噪声均值在吸引域内时,网络进行字符识别时几乎不出错,而当噪声均值超过吸引域时,网络出错率急剧上升。

4结论

本文设计了3种人工神经网络对26个英文字母进行了识别。可以看出,这3种人工神经网络均能有效地进行字符识别,并且识别速度快,自适应性能好,分辨率较高。由图2和图3可以看出,单层感知器的有噪声训练网络在均值为O~0.06之间的噪声环境下可以准确无误的识别,而有噪声训练的BP网络可以在o~0.12之间的噪声环境下准确无误的识别,故BP络网络容错性比单层感知器的容错性好;此外,噪声达到0.2时,单层感知器的有噪声训练网络的识别出错率为6.6%,而有噪声训练的BP网络的识别出错率为2.1%,故BP网络比单层感知器识别能力强。另外,由图2、图3和图4可以看出,这3种网络中霍普菲尔德网络识别率最高,它在噪声为0.33以前几乎不会出错,BP网络次之,感知器最差。

通过设计、应用与性能对比,我们可得单层感知器网络结构和算法都很简单,训练时间短,但识别出错率较高,容错性也较差。BP网络结构和算法比单层感知器结构稍复杂,但其识别率和容错性都较好。霍普菲尔德网络具有设计简单且容错性最好的双重优点。因此,我们应根据网络的特点以及实际要求来选择人工神经网络对字符进行识别。 参考文献

[1]丛爽.面向MATLAB工具箱的神经网络理论与应用「M.合肥:中国科学技术大学出版社,2003.

[2]武强,童学锋,季隽.基于人工神经网络的数字字符识别[J].计算机工程,2003,29(14):112一113.

[3]廖翔云,许锦标,龚仕伟.车牌识别技术研究[J].徽机发展,2003,13:30一35.

[4]李中凯,王效岳,魏修亭.BP网络在汽车牌照字符识别中的应用[J].东理工大学学报,2004,18(4):69一72.

第5篇:人工神经网络的缺点范文

关键词:电力系统超短期负荷预测人工神经网络外推法

中图分类号:F407文献标识码: A

1 负荷预测概述[1]

负荷的大小与特性对于电力系统设计和运行都是极为重要的因素。对负荷的变化与特性有一个事先的估计是电力系统运行、控制和规划不可缺少的一部分。

指导调度员控制联络线交换功率在规定范围,一般需5~15min 的负荷数据。预防性控制和紧急状态处理需要10min至1h的预测值[2] 。这也是本文的主要研究方向。

2 电力系统负荷预测方法简介

长期以来,国内外学者对负荷预测的理论和方法做了大量的研究,提出了各种各样的预测方法,这些方法大致可分为两大类:一类是以时间序列法为代表的传统方法,另一类是以人工神经网络为代表的新型人工智能方法。传统方法中主要有时间序列法、多元线性回归法及傅立叶展开法等。人工智能方法中主要有专家系统法、模糊逻辑法、人工神经网络法及小波分析法等。由于电力负荷的变化有其不确定性,如气候变化、意外事故的发生等对电力负荷造成随机干扰,因此,每种方法均有一定的适应场合,并需要不断的完善。

2.1 回归分析法

回归分析法又称统计分析法,回归模型有一元线性回归、多元线性回归、非线性回归等回归预测模型;其中,线性回归用于中期负荷预测。优点是:预测精度较高,适用于在中、短期预测使用。缺点是:1.规划水平年的工农业总产值很难详细统计;2.用回归分析法只能测算出综合用电负荷的发展水平,无法测算出各供电区的负荷发展水平,也就无法进行具体的电网建设规划。

2.2 弹性系数法

弹性系数是电量平均增长率与国内生产总值之间的比值,根据国内生产总值的增长速度结合弹性系数得到规划期末的总用电量。弹性系数法是从宏观上确定电力发展同国民经济发展的相对速度,它是衡量国民经济发展和用电需求的重要参数。电力弹性系数可以用下面的公式来表示:

(2-1-1)

式中:为电力弹性系数;为为电力消费年平均增长率;为国民经济年平均增长率

在市场经济条件下,电力弹性系数已经变得捉摸不定,并且随着科学技术的迅猛发展,节电技术和电力需求侧管理,电力与经济的关系急剧变化,电力需求与经济发展的变化步伐严重失调,使得弹性系数难以捉摸,使用弹性系数法预测电力需求难以得到满意的效果。2.3 时间序列法

时间序列法是短期负荷预测的经典方法,是根据负荷的历史资料,设法建立一个数学模型,用这个数学模型一方面来描述电力负荷这个随机变量变化过程的统计规律,另一方面在该数学模型的基础上再确立负荷预测的数学表达式,对未来的负荷进行预报。就一般地时间序列预测方法而言,人们总是先去识别与实际预测目标序列相符合的一个随机模型,并估计出随机模型中的未知参数,再对随机模型进行考核,当确认该随机模型具有适用价值后,再在此基础上建立预测表达式进行预报。它利用了电力负荷变动的惯性特征和时间上的延续性,通过对历史数据时间序列的分析处理,确定其基本特征和变化规律,预测未来负荷。

2.4 负荷求导法

每天的负荷大小(高低)有差别,但其负荷的变化率是有一定的规律。只要找出一个适当函数来拟合每天的负荷曲线,对这个函数进行一次求导,即可得出一天的负荷变化率。虽然每天的负荷大小变化难以准确预测,但对负荷曲线求导后,得出的负荷变化率有一定的稳定性。因此,利用负荷的变化率来进行超短期负荷预测将会使精确度提高。负荷求导法预测的公式是:

(2-1-2)

式中对第i+1点的负荷预测值;

第i点的实际负荷值;

第i点的预测负荷变化率值。

2.5 专家系统法

专家系统预测法是对数据库里存放的过去几年甚至几十年的,每小时的负荷和天气数据进行分析,从而汇集有经验的负荷预测人员的知识,提取有关规则,按照一定的规则进行负荷预测。实践证明,精确的负荷预测不仅需要高新技术的支撑,同时也需要融合人类自身的经验和智慧。因此,就会需要专家系统这样的技术。专家系统法,是对人类的不可量化的经验进行转化的一种较好的方法。但专家系统分析本身就是一个耗时的过程,并且某些复杂的因素(如天气因素),即使知道其对负荷的影响,但要准确定量地确定他们对负荷地区的影响也是很难的。专家系统预测法适用于中、长期负荷预测。此法的优点是:1.能汇集多个专家的知识和经验,最大限度地利用专家的能力;2.占有的资料、信息多,考虑的因素也比较全面,有利于得出较为正确的结论。

2.6 外推法

根据负荷的变化趋势对未来负荷情况作出预测。电力负荷虽然具有随机性和不确定性,但在一定条件下,仍存在着明显的变化趋势,例如农业用电,在气候条件变化较小的冬季,日用电量相对稳定,表现为较平稳的变化趋势。

外推法有线性趋势预测法、对数趋势预测法、二次曲线趋势预测法、指数曲线趋势预测法。趋势外推法的优点是:只需要历史数据、所需的数据量较少。缺点是:如果负荷出现变动,会引起较大的误差。

2.7 人工神经网络法

人工神经网络理论最早出现于20世纪40年代,经过几十年的发展,已广泛的用于电力系统短期负荷预测。在现有的各种神经网络的计算方法中,由Ponelhert和Mcclelland提出的BP算法是应用得最多的一种。BP算法的模型为前向多层网络,由输入层、隐含层、输出层组成,每层都包含若干节点,同一层的节点间没有相互的连接,而仅仅在前后不同层之间有节点的连接。BP算法的学习过程由正向传播和反向传播组成,正向传播过程的输入样本从输入层经隐含层处理后传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望值,则转入反向传播,将误差信号沿原连接通路返回,通过修正各神经元的权系数,使误差信号减小,达到给定的精度,从而完成了其学习过程。这样,当在网络的输入端加入一新的信号时,就能从其输出端得到相应的结果。

3 预测算例

通过前述对各种预测方法的分析,采用神经网络法和外推法对山东某地区一个变电站的2005年8月8日负荷进行预测。在实际应用中,预测最小间隔为5min,预测长度为1h。目前15min预测间隔为最常用。负荷采样间隔为5分钟,一天24个小时为288个数据,预测为提前15分钟的预测,预测结果如下:

图1 基于BP神经网络的负荷预测曲线

预测的平均相对误差为2.3089%,本文在建立超短期负荷模型时,未考虑天气变化和突发事件对负荷的影响,这在一定程度上影响了预测的精度。当天气变化显著或者有突发事件时,这个预测模型的精度会变差。但总的来说,所得预测结果比较令人满意。

图2 外推法负荷预测曲线

预测的平均相对误差为2.3059%,与神经网络法预测结果相差不大。

4 结论

本文对各种负荷预测方法进行了分析,并且在短期及超短期负荷预测方面,针对于两种目前比较常用的负荷预测方法――人工神经网络法和负荷外推法进行了重点的仿真研究。得出:在超短期负荷预测方面两种方法得出结果相差并不是很大。负荷外推法方法简单,要求的历史数据较少,运算速度较快,可满足系统在线分析的实时要求,比较适合在工程中应用。人工神经网络法算法比较复杂,而且存在训练时间较长、收敛性等问题。但是在短期负荷预测方面(例如提前24小时的预测)神经网络法存在着比负荷外推法明显的优势。因此,在工程应用等方面线性外推法还是具有较强的实用性。

参考文献

[1]刘晨晖.电力系统负荷预报理论与方法[M].中国:哈尔滨工业大学出版社,1987年 .20-60.

[2]张峰 吴劲晖 张怡 胡若云.基于负荷趋势的新型超短期负荷预测法[J]. 电网技术,2005,vol.28 No.19

[3]吴熳红 杨继旺.几种电力负荷预测方法及其比较[J].广东电力,2001,vol.17 No.1

[4]陈霞 安伯义 陈广林.电力负荷预测理论与方法[J].农村电气化,2004.7

[5]吴劲晖 王冬明 黄良宝 孙维真.一种超短期负荷预测的新方法-负荷求导法[J]. 浙江电力,2000,6

[6]张国忠 熊伟 向求新 黄晓明 刘亚. 应用人工神经网络预测电力负荷[J].电力自动化设备,2002,22

[7]S.H.Ling Frank H.F.Leung H.K.Lam Peter K.S.Tam Short-Term Electric Load Forecasting Based on a Neural Fuzzy Networks[A]. IEEE Transactions on Industrial electronics vol.50 no.6

[8]闫承山 刘永奇.人工神经网络在华北电网负荷预测中的应用[J].电网技术,1998,22

[9] 马文晓 白晓民 沐连顺.基于人工神经网络和模糊推理的短期负荷预测方法[J].电网技术,2003,27

[10]D.C.Park M.A.El-Sharkawi R.J.Marks II L.E.Atlas and M.J.Damborg. Electric Load Forecasting Using An Artificial Neural Network [A].IEEE Transcaction on Power Systems vol.6 no.2 May 1991

[11]Lee K.Y.,Cha Y.T. Park J.H.,Short-term load forecasting using an artificial neutral network[J]. Power Systems, IEEE Transactions on , Volume: 7 , Issue: 1 , Feb. 1992

[12]姜勇.电力系统短期负荷预测的模糊神经网络方法[J]. 继电,2002,30(7)

[13]Shan Shao, Yaming Sun, Short-term load forecasting using fuzzy neural network. Advances in Power System Control, Operation and Management, 1997. Fourth International Conference on (Conf. Publ. No. 450) Vol. 1 Nov 1997

[14]杨洪明 白培林.基于遗传算法的人工神经网络负荷预报模型[J].湖南电力,2000 20

作者简介

陈晓东 男 硕士 工程师电力系统稳定 山东电机工程学会

第6篇:人工神经网络的缺点范文

关键词:食品安全与卫生管理 研究性学习 创新性实验 人工神经网络

在大学生研究性和创新性科研项目中,要改变由指导老师一步一步发指令由学生被动完成任务,还是科研小组同学主动学习、主动定方案(方向)、定任务后,再由指导老师和全组同学商讨,小组同学分别完成相应工作任务,再学习,再研讨,再实验…,直到项目完成。这是研究性和创新性项目培养和提高同学自主管理能力和科技创新能力非常关键的环节。在这个环节上,老师不再是“司令员”,而是科研小组中的普通一员。下面以“水培虾、南美白对虾、斑节对虾氨基酸紫外可见光谱人工神经网络定量测定及营养学分析”大学生科技创新项目为例,说明一些具体作法。

1.组织小组同学展开调研, 明确科研与生产实际相结合, 培养社会调查能力

“水培虾、南美白对虾、斑节对虾氨基酸紫外可见光谱人工神经网络定量测定及营养学分析”项目小组成员来自学校中三个专业不同年级的同学,自愿组合而成。首先在老师的主持下由小组同学选出2名学习好、责任心强、实践操作能力强的同学组成项目小组管理核心。然后小组负责同学则将同学分成二个调查组,分别到海产品养殖场和海产品销售市场展开调研。二个小组调查完毕,通过汇总与讨论,大家明确了目前舟山人工养殖虾体主要有三大代表品种:水培虾、斑节对虾和南美白对虾。这三种虾适应范围广,产量高,是目前我国东海养殖的主要特色品种。其营养丰富,口感鲜美,市场需求量大,经济价值较高,具有良好的市场前景。因此,必须依靠通过对这三种虾的优良品种的选育、饲料配料的组合和筛选及其营养价值的分析等工作进一步提高其质和量。而这些工作的开展必须进行氨基酸的测定。可见,虾体肌肉中氨基酸含量的测定具有十分重要的意义。于是同学们经充分讨论后认为:开展“虾体氨基酸检测”的创新性实验,不但具有重要的实际意义,而且可行性强。不但可加深同学们的专业基础知识,还可拓展同学们知识视野,培养科技创新能力。

2.组织同学学习相关背景知识, 提高自主学习能力, 加深对基础课程知识的理解

项目小组管理核心下一步则是组织科研小组成员复习《生物化学》、《营养学》、《食品分析与检验》等基础及专业课程,首先是进一步加深同学对虾体中氨基酸的认识。氨基酸是人体必不可少的营养成分之一,而有些氨基酸是不能在人体内自行合成必需要从食物中获取,如异亮氨酸、亮氨酸、甲硫氨酸(蛋氨酸)、赖氨酸、苏氨酸、苯丙氨酸和缬氨酸,它们称为必需氨基酸[1]。因此虾体中氨基酸的检测分析主要就是针对这些必需氨基酸。必需氨基酸的含量高,虾的营养价值就大,商业价值就高。而养殖对虾虾体中氨基酸含量的传统检测方法存在费用高、样品用量大、检测方法费时繁琐等问题,不适于养殖生产控制特别是虾体氨基酸含量的快速分析。结合《现代仪器分析》课程中的知识,同学们提出用最简单的紫外-可见光谱法结合人工神经网络用于三种对虾主要氨基酸(必需氨基酸和鲜味氨基酸)的不经分离定量测定。光谱数据在BP人工神经网络实现对虾肌肉中氨基酸定量分析的基础上[2], 进一步试验采用较新的具有较强自适应能力和较好预测效果的极限学习机(Extreme Learning Machine,ELM)神经网络模型完成定量分析和预测,尝试为对虾虾肉中氨基酸多组分分析提供一种不需贵重仪器的简易新方法。

3.组织同学自主检索查阅文献,学习人工神经网络方法,拓展知识视野

方向任务明确以后,项目小组管理核心则组织小组同学自主检索相关文献,自主学习相关知识,开拓知识视野,重点组织小组同学学习人工神经网络方法。经过项目小组全体成员的多次学习与探讨,大家都清楚的知道了人工神经网络现在已经是解决化学问题的一种重要的化学计量学方法。是模拟人脑神经元的工作原理来建立模型进行分类与预测的一种化学计量学手段[3]。目前,人工湖神经网络应用于氨基酸混合液测定中主要是误差反向传播 ( Back propagation,BP)人工神通网络(BP是由输入层, 输出层以及若干隐含层节点间互连而成的一种多层网络)。但它存在一些无法克服的缺点,如:训练速度慢;训练过程可能不稳定;容易陷入局部极小点,无法达到全局最小;而且可见-紫外光谱所含的波长数据点多,具有多重共线性,会造成建模时间长等问题。经过小组学习探讨和老师的指导,大家提出针对海产品对虾氨基酸溶液光谱测定中波长数据点多的问题,我们可以试用极限学习机完成对虾体肉中必需(主要)氨基酸含量测定并与BP神经网络等方法进行分析对比。进一步的学习与探讨,小组同学明确了极限学习机(Extreme Learning Machine,ELM)神经网络是南洋理工大学G. B. Huang 等人在2006年提出的一种人工神经网络模型训练新算法,与传统的误差反向传播 ( Back propagation,BP)人工神通网络方法相比,极限学习机有泛化性能好、训练学习速度快等优点[4]。

4.组织同学主动联系药品试剂市场, 锻炼社会人际交往能力

在购买所实验所需的试剂与材料方面,项目小组管理核心同学认识到,本项目所需主要仪器为紫外可见分光光度计和氨基酸分析仪,但实验试剂则不同于以往的实验课,老师配好实验用试剂后供同学直接使用。现在是需要通过小组同学自己去市场联系,同学自己购买,买来后还需同学自己配制,因此这是一个培养同学社会人际交往能力的好机会。项目小组管理核心则首先组织同学上网查找相关试剂的供应商的信息,然后让同学比较这几家商家的报价及其产品的可靠性,从中挑选出合乎条件的2-3家商家,最后由项目小组管理核心负责联系着2-3家商家,并与小组成员讨论比较后进行购买。

5.组织与分配小组同学各自完成相应的具体实验项目,培养实验实际操作能力

在仪器使用等方面老师则重点指导这几个同学,即他(她)们同时也就成为这个项目小组的“指导老师”。如由他(她)们负责实验试剂的配制或指导同学配制,负责指导同学进行仪器操作,负责分配或指导同学完成相应的具体实验项目,辅助或指导实验小组同学完成实验设备的具体配置等等。如以下取同龄期、同体长、同体重的南美白对虾、竹节虾(日本对虾)和水培虾称重,匀浆机匀浆10min,真空干燥箱在50℃下真空干燥,制成粉。分别称取水培虾粉、南美白对虾粉,竹节虾粉加盐酸水解24h这些实验过程,均在项目小组管理核心同学的安排下有条不紊地完成。

在指导老师的辅导下,项目小组管理核心组织小组同学分别取三种虾的水解液稀释成9个浓度,用L-8800型氨基酸分析仪分别测定三种虾体9个浓度水解液的氨基酸含量。用紫外-可见分光光度计分别对三种虾体9个浓度的水解液进行光谱扫描[5],获取一系列光谱数据。再取未知氨基酸浓度的三种虾体3个不同浓度的水解液同样进行光谱扫描获取光谱数据。然后用已知氨基酸浓度的光谱数据训练神经网络并对未知浓度虾水解液进行氨基酸含量预测。结果见图1和图2。通过对测定结果的分析进一步加深了小组同学对《现代仪器分析》课程中光谱扫描和吸收光谱曲线概念和几种人工神经网络模型的理解和认识。

6.老师和小组同学一起学习讨论人工神经网络方法,分析测定结果,培养科学分析能力

在对测定结果的分析中,项目小组全体同学分成3个学习小组,每个小组对照参考资料,根据所得测定数据结果与数据可视化图形(如图1、图2等),先进行分析讨论,有了初步的认识后,指导老师和全体小组成员在一起再进行充分的分析与探讨。最后大家得出结论:紫外-可见光谱数据结合三种人工神经网络(①误差反向传输神经网络,BP。②径向基函数神经网络,RBF。③极限学习机神经网络,EML)对氨基酸溶液中氨基酸浓度的测定,径向基函数神经网络(RBF)的预测结果比误差反向传输神经网络(BP)好,但极限学习机神经网络(EML)的预测效果要好于误差反向传输神经网络(BP)和径向基函数神经网络(RBF)。同时大家进一步认识到,氨基酸溶液(如虾肉水解液)中氨基酸的定量分析, 一般都是用比较昂贵的分析仪器如高效液相色谱仪等仪器来完成,而且操作复杂、费时、费劲。所以,如果是使用普通的紫外-可见光谱仪结合计算机数值方法来完成虾肉中的氨基酸测定,所用仪器简单普遍,且分析样品不经分离。推广开去,不但可用于对虾肌肉中氨基酸含量测定及品质评判,也可用于其他水产品和肉类食品中氨基酸含量的分析,即在食品质量分析方面有一定的意义[6]。

7.结论

从以上讨论分析可见,紫外-可见光谱结合人工神经网络方法测定氨基酸溶液中氨基酸浓度具有一定的科学研究价值和经济价值。

再说在本次研究性和创新性实验中,指导老师的指导工作着力于以下几个方面,首先是:辅导学生建一个工作能力较强的项目小组管理核心。有了这个项目小组管理核心,所以以下工作都是在项目小组管理核心的配合下顺利完成的。第一,指导学生完成实验相关背景知识和基础课程学习;第二,引导学生思考如何查阅检索所须文献,提高学生获取有效信息的能力。第三,引导学生独立购买所需实验试剂,提高学生社会交往能力。第四,指导学生自行完成实验试剂的配制,培养同学的动手操作能力。第五,参与小组讨论学习,帮助学生提高分析问题和解决问题的能力。

通过此次研究性学习,本科学生作为科研创新实验的主体,不仅加深了对基础课程知识的理解,还拓展了知识面(如人工神经网络、化学计量学等方面的知识)。不但提高了仪器操作方面的实际操作使用能力,还提高了计算机技术方面的能力(如人工神经网络建模、数值计算等等),从而激发了同学们的创新性思维和创新意识,全面提升了科技创新能力。

参考文献:

[1]高国全主编,生物化学[M],北京,人民卫生出版社,2008年4月第2版:116-117

[2]钟雷鸣,江王栋,石乐明等,六种氨基酸混合物溶液的紫外光谱的人工神经元网络定量分析研究[J],生物物理学报,1992,8(4):706-710

[3]许禄主编,化学计量学[M],北京,科学出版社,2004年2月第1版:88-120

[4]Guang-Bin Huang,,Hongming Zhou,Xiaojian Ding,et al,Extreme Learning Machine for Regression and Multiclass Classification,IEEE Transactions on Systems, Man,and Cybernetics-Part B:Cybernetics,2012,42(2):513-529

[5]李大东著,检验医学计算机数值方法[M],杭州,浙江大学出版社,2011年4月:43-46

第7篇:人工神经网络的缺点范文

关键词: FPGA; BP神经网络; 线性拟合; 非线性拟合; 自适应训练

中图分类号: TN702.2?34; TP183 文献标识码: A 文章编号: 1004?373X(2016)15?0115?04

Abstract: Using software for neural network has the disadvantages of low parallelism and slow speed, the hardware design resource utilization of the traditional neural network is high, and the network training is uncontrollable. To solve these problems, a new FPGA?based design method of back propagation (BP) neural network is proposed. The method can realize the Sigmoid excitation function through piecewise linear fitting and nonlinear fitting based on symmetry, and uses the finite state machine (FSM) to accomplish the training times adaption based on error. The Verilog HDL language is used to design the 1?3?1 BP neural network to approximate the function [y=cosx.] The resource occupancy of the network is 2 756 LEs, the training times are 1 583, the average relative error of the network test sample is 0.6%, and the maximum clock frequency is 82.3 MHz. The verification results show that the neural network designed with the method has the advantages of less resource occupancy, high accuracy and fast running speed, and can control the network training automatically.

Keywords: FPGA; BP neural network; linear fitting; nonlinear fitting; adaptive training

0 引 言

人工神经网络(ANNs)[1]通常都是采用基于软件的方法实现。但作为一个并行计算系统,软件实现的方法存在速度慢的缺点,而硬件方式具有高并行性的特点,适合于人工神经网络。FPGA作为一种通用的硬件设计平台,其内部分布式的资源与神经网络的结构非常契合,是一个实现神经网络硬件化设计的良好选择。

资源占用是FPGA设计的一个重要考量因素,而网络训练是神经网络功能实现的基础。已有的神经网络硬件设计工作在这两方面还存在巨大的空间。例如,薛维琴等利用FPGA实现了BP神经网络[2],该网络经过训练能够描述非线性函数,但没有提出BP神经网络的激励函数和训练控制模块的具体硬件实现方法。李利歌等提出了直接利用查找表实现神经网络激励函数的方法[3],但是查找表存在占用资源大,运行速度慢的缺点。张海燕等采用基于查找表的STAM算法实现神经网络激励函数[4],且文中也没有提到训练控制模块。Javier Valls等提出利用CORDIC算法实现神经网络的激励函数[5],资源利用率低,但是存在精度不足的问题。刘培龙利用分段拟合实现激励函数[6],但是激励函数资源占用较多。

基于这一现状,本文通过对Sigmoid函数基于对称性分段拟合以及基于误差的训练自适应技术,提出了一种新的神经网络FPGA设计方法。该方法设计的神经网络资源占用少,网络训练自适应,同时还具有精度高,运行速度快的优点。

1 BP神经网络的FPGA设计

根据BP神经网络的结构,本文将网络划分为神经元模块、激励函数模块、误差计算模块,权值更新模块、权值存储模块以及自适应网络训练模块。图1给出了不同功能模块之间的连接和训练过程。其中,权值存储模块和输入神经元将输入层的权值以及训练的样本输入到隐含层神经元进行乘累加运算,其结果输入到激励函数模块得到激励函数输出,该输出和隐含层的权值作为输出层神经元的输入得到本次训练结果。该结果再经过误差计算模块计算误差值和权值改变量。权值改变量在权值更新模块中得到新权值存入到权值存储模块。误差值输入到自适应网络训练模块判断网络训练是否达到最优。网络训练达到最优前,该过程循环,当网络训练达到最优,自适应训练模块控制网络停止训练。

系统中神经元模块、误差计算模块、权值更新模块按照BP网络算法规则可调用加、乘、乘累加等功能模块,权值存储模块可调用RAM模块。激励函数模块和自适应训练模块关乎系统资源占用及训练过程的实现,是本文BP神经网络FPGA设计的重点。

1.1 激励函数模块设计

激励函数模块是影响整个神经网络资源利用的主要因素之一,在保证误差足够小的前提下,激励函数模块资源占用越小越好。

式中含有指数运算,较难在FPGA 中直接实现。利用Sigmoid函数具有对称性以及较好的线性区域和非线性区域分界的特点,本文提出一种资源占用小、精度高的基于对称性分段拟合的激励函数硬件实现的方法。

考虑到Sigmoid函数的对称性,只需完成[x>0]的区域硬件实现,根据对称性即可求出[x0]区域,根据Sigmoid函数线性区域和非线性区域分界良好的特点,分别采用线性拟合和非线性拟合的方法分段逼近。具体而言,如图2所示,将整个激励函数模块分为预处理模块、函数逼近模块以及最终输出模块三个子模块。

1.1.1 预处理模块

激励函数的输入[x]为16位定点数,最高位为符号位,中间五位为整数部分,后十位为小数部分。当[x]输入到激励函数模块时,首先进行预处理。截取二进制输入[x]的最高位判断[x>0]或者[x0]时,[x=x,]将[x]输入到后续处理模块,若判断出[x

1.1.2 函数逼近模块

基于对输入[x]的预处理,此子模块只需要对[x>0]的情况做线性拟合和非线性拟合。分段逼近函数如表1所示。

1.1.3 最终输出模块

最终输出模块由预处理模块输出的控制信号控制。若[x>0,]则控制信号控制最终输出模块直接输出函数逼近模块中[x]对应的输出[fx;]若[x

1.1.4 激励函数模块分析

按照上述设计方法完成激励函数模块的设计后,对激励函数模块进行功能仿真和误差分析。从-8~8以0.001为间隔生成测试数据输入到激励函数模块,得到的ModelSim仿真结果如图3所示,其各区间绝对误差如表2所示。从中可以看出,各区间的误差值均很小且误差分布较为平均,体现出良好的逼近效果。

1.2 自适应训练模块设计

网络训练是神经网络功能实现的基础。神经网络随着训练的进行,权值逐渐改变,误差逐渐减小,但如果网络训练不能适时结束,造成过度训练,则网络性能会变差。然而对网络训练的控制在硬件上并不易设计,故很多工作未讨论这一点或简单的以固定周期来完成训练。本文提出了一种基于可容忍误差值的自适应网络训练硬件设计方法,可有效的自动控制神经网络训练过程。

分析神经网络的训练过程,每一次输入样本值都会在本次训练完成时得到一个误差值,当误差在可以容忍的范围内可以认为网络已经训练完成。认为在给定的可容忍误差值的情况下,如果连续两次整个样本集输入得到的误差绝对值都要比给定的可容忍误差值要小,则该神经网络训练已经达到最优。根据这个思想,提出利用有限状态机实现自适应网络训练。

如图4所示,有限状态机的状态数是样本集中样本数的两倍,状态机初始为零状态。当某一次训练得到的误差绝对值小于可容忍误差值时,状态机进入第一个状态。若紧邻的下一次训练得到的误差绝对值也小于可容忍误差值,状态机进入下一个状态,否则状态机状态回到第0个状态。当状态机跳转到最后一个状态时,网络训练完成,此时输出控制信号控制权值存储模块停止权值更新,提示信号提示训练完成。该模块的分析需要结合网络中的其他模块,故测试结果在下一节中给出。

2 验证和分析

2.1 验证平台

根据上述方法,设计了一个1?3?1三层BP神经网络验证其性能。验证平台为Altera公司的EP2C70F896C6。

以[y=cosx]函数为学习对象,从[0~2π]之间以[0.062 5π]为间隔选取33个样本组成样本集,随机选取其中25个作为训练样本,剩下8个作为测试样本。神经网络的初始权值和阈值的选取具有一定的随机性,根据网络需要逼近的函数数值大小,输入层到隐含层的初始权值矩阵[W1=[2.5,0.5,-0.3],]隐含层到输出层的初始权值矩阵[W2=[0.35,0.4,0.3],]隐含层阈值选为[0.2,0.3,0.4],输出层阈值选为[0.3]。隐含层的学习率设为0.4,输出层的学习率设为0.3,容忍误差设为0.01。

2.2 结果分析

ModelSim仿真得到的结果如图5所示,从图5中可以看出该BP神经网络的训练是自适应的。当网络训练到最优时,产生一个控制信号和一个提示信号以及网络训练的次数,此时权值存储器的值不再变化,训练完成。

25个训练样本集训练的平均误差为0.003,分析8个测试样本集的误差,如表3所示。从表3中可以看出,其误差与训练数据的误差大体相当且均很小。计算测试样本的平均相对误差为0.6%,小于1%,说明该方法实现的基于FPGA的BP神经网络精度较高。

将该网络下载至Altera公司EP2C70F896C6的FPGA中,其最高时钟频率为82.3 MHz,可见该方法具有运行速度快的优点。将该神经网络资源占用情况与已有相关工作的资源占用情况作对比,如表4所示。虽然其中各设计的规模和平台有所差异(如1 Slice≈4 LEs),但仍可估算出即便添加了自适应训练模块,本设计对资源的占用依然较低。

从表5中可以看到,当学习对象不同时,网络训练的次数也不同,实现了训练过程的自适应。由此亦可推至,若采用传统的预设固定次数的方式完成训练,则对于不同学习对象难免会造成训练不充分或过度训练的情况,从而影响网络的性能。因此,该表也进一步证明了该设计自适应训练的优越性。

3 结 论

本文以典型的BP神经网络为例,提出了一种自适应训练的神经网络FPGA设计方法。通过对Sigmoid激励函数基于对称性做分段拟合减少了资源占用,使用基于可容忍误差完成了网络训练自适应。该方法设计的神经网络具备训练可控、资源占用低、精度高的优点。此方法不仅适合于 BP网络,也可推广至采用Sigmoid函数及需要训练控制的其他类型的神经网络。

注:本文通讯作者为常胜。

参考文献

[1] 蒋宗礼.人工神经网络导论[M].北京:高等教育出版社,2001:15?16.

[2] 薛维琴,李莉华,戴明.基于FPGA的人工神经网络系统的实现方法[J].电子设计工程,2010,18(9):151?154.

[3] 李利歌,阎保定,侯忠.基于FPGA的神经网络硬件可重构实现[J].河南科技大学学报(自然科学版),2009,30(1):37?40.

[4] 张海燕,李欣,田书峰.基于BP神经网络的仿真线设计及其FPGA实现[J].电子与信息学报,2007,29(5):1267?1270.

[5] VALLS J, KUHLMANN M, PARHI K K. Evaluation of CORDIC algorithms for FPGA design [J]. Journal of VLSI signal processing, 2002, 32(3): 207?222.

第8篇:人工神经网络的缺点范文

[关键词] Spiking神经网络 学习模型 股市预测

一、引言

随着经济的增长,对于股市的预测将变得越来越重要,也成为经济理论研究中的一个重要课题。股票市场的变化有很多因素,是一个复杂的非线性系统,而人工神经网络能够从大量复杂的数据中找到数据间的内在联系,具有良好的自我学习和抗干扰能力,在股票预测领域中取得了显著的效果。本文应用一种更接近于生物神经系统的Spiking神经网络,采用基于粒子群算法的学习模型,构建了沪市上证综合指数的学习预测模型,并用实际数据进行了分析实验。

二、Spiking神经网络及其学习模型

Spike神经元模型是更接近生物神经元的一个数学模型,由Spike神经元构成的人工神经网络称为Spiking神经网络。在Spiking神经网络中,一个Spike神经元在t时刻接收来自于父突触神经元的多个post-synaptic potential(PSP)信号,不断改变自己的膜电压。当它的膜电压超过阈值时,产生一个spike,并通过突触连接向外发送PSP信号。用于描述PSP信号的spike响应函数定义为:

三、上证综合指数的预测

沪市上证综合指数是上海证券交易所编制的,以上海证券交易所挂牌上市的全部股票为计算范围,以发行量为权数综合,上证综指反映了上海证券交易市场的总体走势,所以对上证综指的预测具有重要的意义。文中选取了2006年6月~2007年7月共286个工作日的沪市上证综合指数作为研究的原始数据,利用滑动窗口技术,通过前6天收盘时的上证指数来预测第7天收盘时的上证指数。

我们构建了具有6个输入神经元、4个隐含层神经元和1个输出节点的前向全连接Spiking神经网络,并利用以上的Spiking神经网络学习模型进行测试。选取了原始数据中的前276个数据构成神经网络的训练集,后10个数据用于测试。在实验前,我们对原始数据进行归一化的处理转换为[0,1]之间的值。把归一化后的前6天收盘时的上证指数分别作为6个输入神经元的spike时间加入到Spiking神经网络中进行学习和计算,获得神经网络输出节点的spike时间,该时间对应于第7天的收盘指数。按本文式(3)计算获得Spiking神经网络的学习误差,通过粒子群算法不断调整神经网络的参数使误差最小化。获得了最优的Spiking神经网络后,用测试集的数据对其性能进行了测试。经Spiking神经网络学习预测后的上证指数变化如图。

结果表明,与传统BP算法相比,基于粒子群算法的Spiking神经网络具有较快的运算速度和逼近性能, 同时可以克服SpikeProp算法陷入局部最优解和对权值有约束的缺点,可以较好地处理股票类非线性数据的学习和预测。

四、结论

股票市场的不确定因素太多,是一个复杂的非线性系统,而神经网络具有自我学习的能力,能很好地解决不明确环境中的非线性应用问题。Spiking神经网络作为一种新型的动态的神经网络,其利用动态的spike时间进行信息编码和计算的特点与股票市场中动态的时间序列相吻合。文中对应用Spiking神经网络预测国内股票市场做了初步的探讨,获得了较好的拟合效果。进一步改进原始数据的处理方式,提高Spiking神经网络的自适应能力,将能得到更好的预测效果。

参考文献:

[1]Sander M:Bohte, Spiking Neural Networks [D].ISBN 90-6734-167-3, 2003

[2]Gerstner W, Kistler W. Spiking Neuron Models: Single Neurons, Populations, Plasticity [M]. Cambridge University Press, 2002

[3]韩文蕾王万诚:概率神经网络预测股票市场的涨跌[J].计算机应用与软件,2005,22(11):133~135

第9篇:人工神经网络的缺点范文

关键词: 边坡安全; 稳定性; 评价方法

中图分类号: U416.14 文献标识码: A 文章编号: 1009-8631(2012)07-0053-01

1 引言

边坡安全稳定问题一直是岩土工程的一个重要研究内容,而边坡稳定性评价结果的正确与否直接关系到边坡工程的成败。目前边坡稳定性评价方法多种多样,但由于边坡稳定受多方面因素影响,而各因素具有不确定性(模糊性、随机性、信息不完全性和未确定性)和复杂性,故传统的确定性分析方法如极限平衡理论用于边坡分析,结果不是十分理想。但不论是确定性分析如蒙特-卡洛模拟法、一次二阶矩法,还是不确定性方法如模糊数学、灰色理论、数量化理论和信息模型法等,其用于边坡稳定性评价的准确性与实际情况仍有差距。对于边坡稳定性评价方法的综合认识,早在1999年丁恩保教授等就已进行过分类,他们主要根据各种方法对边坡稳定性评价的量化程度为依据,分为定性分析法、定量分析法、非确定性分析法、物理模型法和现场监测分析法等五种。综合来看,目前边坡安全稳定评价方法主要集中在四个方面。

2 边坡稳定评价方法

2.1人工神经网络和遗传算法评价法

在人工神经网络方面,邢爱国等应用改进的BP神经网络模型对国道107线清连一级公路部分高危边坡进行稳定性评价研究。于子国等采用非线性理论研究边坡的变形破坏机理,建立稳定性评价模型,用遗传-神经网络从中获取稳定性评价和判断的知识进而构建系统,对各类边坡稳定状态做出评价。赵健将Kohonen神经网络应用于边坡稳定性分析,建立评价边坡稳定状态的网络模型。姜德义等结合重庆地区的地质条件和高速公路建设实践,分析影响重庆地区高速公路土质和岩质边坡稳定性的主要因素,运用人工神经网络方法,以重庆地区大量高速公路边坡实例为样本对其进行学习和预测。

综合来看,人工神经网络是依据人脑结构的基本特征发展起来的一种信息处理体系或计算体系,是对神经系统的数学抽象和粗略的逼近和模仿。研究表明,在岩土边坡工程系统分析领域内采用神经网络具有独特的优势,利用神经网络理论,可以尽可能多地将各种影响因素作为输入变量,建立这些定性或定量影响因素同边坡安全系数和变形量之间的高度非线性映射模型,然后用模型来预测和评价边坡的安全性。毛谦等将遗传算法引入三维边坡稳定分析中,用7个控制参数模拟生成滑裂面,再运用遗传算法来搜索滑坡最不利滑裂面,对于存在确定滑裂面的滑坡,将此滑裂面作为整体滑裂面计算其整体稳定安全系数,然后在整体稳定的基础上,运用遗传算法搜索滑坡内部最不利滑裂面,得出滑坡最小的稳定安全系数。

综合分析可知,遗传算法不受搜索空间限制性假设的约束(如连续性、导数存在等),克服了传统方法容易陷入局部极小值的缺点,从一群点开始搜索,能从离散的、多极值的和含有噪音的高维问题中以很大的概率找到全局最优解,且适用于大规模并行计算。

2.2范例推理评价法

在范例推理评价方面,刘沐宇等运用模糊相似优先概念,构造基于模糊相似优先的边坡范例检索模型,对每一个边坡稳定性的影响因素,分别建立边坡的目标范例与源范例之间的模糊相似优先关系,经过影响因素之间的两两比较,获得不同影响因素下边坡的目标范例与源范例之间的相似性序列,从而最终找出与目标范例最相似的源范例,实现边坡的稳定性评价。刘沐宇等建立基于神经网络的边坡范例检索模型,通过边坡范例的神经网络学习,建立当前边坡和边坡范例之间相似性计算关系,实现当前边坡的稳定性评价。高德彬等利用大量公路黄土路堑高边坡实例,构建基于范例推理的边坡稳定性预测模型,通过源范例和边坡范例之间的相似度计算,得到目标范例与源范例之间的相似性序列,找出与目标边坡范例最相似的源范例,实现黄土路堑高边坡的稳定性预测。

综合来看,范例推理方法以范例为基础,范例的获取比规则获取要容易,从而大大简化知识获取。对于边坡安全稳定性评价这样的复杂问题,其知识获取本身就是一件非常不容易的事情,故范例推理原理为边坡稳定性评价提供了一条可行的新途径。

2.3模糊综合评价法

在模糊综合评价方面,周军霞等针对影响公路边坡稳定性因素的模糊性和随机性,选择影响公路边坡稳定性的10个主要因素,并分为两个层次,利用模糊数学综合评判方法,采用专家方法和经验公式法赋予影响因素的隶属函数和隶属值,建立公路边坡稳定性分析的二级综合评判模型,得到公路边坡稳定性的预测结果。孟衡采用判断矩阵分析法确定评价因子的权重,用二级模糊评判对某工程实例进行计算分析,结果表明用该法确定权重简便,亦能较好反映边坡所处状态。欧国林等运用模糊数学方法提出模糊稳定系数的概念和描述方法,建立路基边坡稳定性分析的模糊综合评价模型,通过确定个体因素等级标准和权重得出模糊稳定系数,使路基边坡稳定分析更接近客观实际。

总体来看,模糊综合评价方法为多变量、多因素影响的边坡稳定性分析提供了一种行之有效的手段,用隶属函数代替确定论中非此即彼的特征函数来描述具有模糊性的影响因素,用模糊变换原理实现多因素、多层次的边坡稳定性分析与评价。其不足之处在于相关因素及各因素边界值的不易确定以及在隶属函数的确定和因素权重的分配上均含有相当多的人为主观因素。

2.4灰色系统评价法

在灰色系统评价方面,魏星等将复杂岩体边坡系统视为一个灰色系统,在综合分析岩体边坡影响因素基础上,采用表征边坡岩体稳定性的复合指标作为评判其稳定性的因素,给出一种基于复合指标的边坡岩体稳定性灰色系统类比预测模型。赵静波等提出以控制因素变化的阶段性来划分时间数据序列,建立阶段时间序列灰色预测模型,对边坡的发展变化情况进行预测。王利等提出一种基于卡尔曼滤波的GM预测模型,即先用卡尔曼滤波法对原始变形监测数据进行滤波处理,再建立GM模型进行灰色预测。何习平等针对单点模型背景值取值方法的不足,提出一种动态定权方法,建立加权多点灰色预测模型。

总体来讲,利用灰色理论分析方法,可在不完全的信息中,通过一定的数据处理,找出它们的关联性,确定边坡稳定性各影响因素的影响程度,进而利用多因素叠加分析评估边坡的稳定性。

参考文献: