前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络实验总结主题范文,仅供参考,欢迎阅读并收藏。
关键词:神经网络 入侵检测;自动变速率;随机优化算子
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2014)03-0614-03
随着互联网应用的发展,更现显了网络安全的重要性。入侵检测技术在安全防护中是一种主动防护技术,能及时地检测各种恶意入侵,并在网络系统受到危害时进行响应,因此在为安全防御体系中入侵检测系统占有重要的地位。但是在现实的应用中,入侵检测系统没有充分发挥其作用。这是因为,不断变化的入侵方式要求入侵检测模型必须具有分析大量数据的能力。无论这些数据是不完全的,是非结构化的,或者是含有噪音的。而且,有些攻击是由处于不同网络位置上的多个攻击者协作进行的,这就要求入侵检测模型又必须具备处理来自非线性数据源的大量数据的能力。神经网络具有联想记忆能力、自学习能力和模糊运算的能力。因此将神经网络应用入侵检测中,它不仅可以识别出曾见过的入侵,还可以识别出未曾见过的入侵。该文首先介绍了一种改进的神经网络算法,然后分析了该算法在入侵检测中的应用,并给出试验仿真结果。
1 BP神经网络与入侵检测
1.1 BP神经网络的特点与不足
BP神经网络是神经网络模型中应用最广泛一种。它基于成熟的BP算法,主要有以下几个特点:1)它能够实现自组织、自学习,根据给定的输入输出样本自动调整它的网络参数来模拟输入输出之间的非线性关系。2)在存储上采用分布式存储,所有的信息分布存储在每一个神经元中。3)它还可以实现并行处理,下一层的每个神经元可以根据接收到的上一层信息同时独立地计算。这些特点使其很适合应用于入侵检测技术,满足入侵检测的适应性、可靠性、安全性和高效性的要求。
但是传统的BP算法也存在着以下几个方面的不足:1)局部极小;2)学习算法收敛速度慢;3)隐含层节点选取缺乏理论;4)加入新的样本会影响已经学完的样本;5)每次输入样本特征的数目必须确定且相同。
1.2 入侵检测技术
通过对系统数据的分析,当发现有非授权的网络访问和攻击行为时,采取报警、切断入侵线路等措施来维护网络安全,这被就是入侵检测技术。采用此技术设计的系统称为入侵检测系统。根据采用的技术来说入侵检测系统应具有以下几个特性:1)监视用户及系统活动;2) 分析用户及系统活动;3) 异常行为模式分析;4) 识别已知的进攻活动模式并反映报警;5) 系统构造和弱点的审计,操作系统的审计跟踪管理;6) 评估重要的系统和数据文件的完整性,并识别用户违反安全策略的行为。
目前最常用的攻击手段有:拒绝服务、探测、非授权访问和非授权获得超级用户权限攻击。而且这些攻击手段在实际中还有很大的变异,因此给入侵检测带来了一定的难度。BP神经网络的自组织自学习能力,使得经过训练后的BP神经网络对以前观察到的入侵检测行为模式进行归纳总结,除了可以识别出已经观察到的攻击,还可以识别出由已知攻击变异出的新的攻击,甚至是全新的攻击。
2.3 改进的神经网络算法
人工神经网络在模式识别、非线性处理、信号检测等领域应用非常多,这是由于人工神经网络具有的良好的自适应和自组织性,高度的非线性特性以及大规模并行处理和分布式信息存储能力的特性。BP神经网络算法实质上是非线性优化问题的梯度算法,该算法在收敛性问题上存在限制与不足。即该算法学习的结果不能保证一定收敛到均方误差的全局最小点,也有可能落入局部极小点,使算法不收敛,导致陷入错误的工作模式。因此本文选择了改进的神经网络,改进主要有以下几点:
2)自动变速率学习法
传统的BP算法是以梯度为基础,采用LMS学习问题的最陡下降法,学习步长是一个固定不变的较小值,不利于网络的收敛。因此,选择了基于梯度方向来自动调节学习速率的方法。利用梯度确定学习的方向,由速率决定在梯度方向上学习的步长。因此,如果相邻两次的梯度方向相同则说明在该方向是有利收敛的方向,如果相邻两次的梯度方向相反则说明此处存在不稳定。因此,可以利用两次相对梯度变化来确定学习步长,当两次梯度方向相同时则增大学习步长,加快在该方向上的学习速度;而如果两次梯度方向相反那么减小学习步长,加快整个网络的收敛速度。这种方法的自适应速率调节公式如下:
2)引入遗忘因子
本文所采用的自适应变速率学习法是依据相邻两次梯度变化来确定学习步长的算法,但单纯的学习速率的变化还不能即完全地既保证收敛速度,又不至于引起振荡。因此考虑变相的学习速率的学习。即在权值的调节量上再加一项正比于前几次加权的量。权值调节量为:
我们将[τ]称为遗忘因子。遗忘因子项的引入就是对学习过程中等效的对学习速率进行微调的效果。遗忘因子起到了缓冲平滑的作用,使得调节向着底部的平均方向变化。
3)随机优化算子
虽然采用自动变速率学习法,并引入遗忘因子的神经网络算法可以对学习速率进行微调,但是仍存在着BP神经网络的限制与不足因此引入随机优化算子。也就是当网络的权值误差迭代一定的次数后,仍没有明显的收敛,或者系统误差函数的梯度连续几次发生改变,这说明网络进入了一个比较疲乏的状态,需要借助外界的推动力来激活网络。当发现上述的两种情况时,就产生与权值维数相同的随机数,并将随机数与权值直接相加,然后判断系统误差的变化。如果误差没有降低,那么就再继续产生随机数来修改权值,直到误差减少,再从新的权值开始继续BP算法。随机优化算子可以令搜索方向随机变化,从而摆脱局部极小点。
4)改进算法与传统算法比较
以200个训练样本为例,分别采用改进的BP神经网络和经典BP神经网络的方法进行学习、训练。两种算法的误差收敛对比曲线如图1所示。
3 采用改进算法的入侵检测仿真实验
入侵检测系统进行测试和评估需要标准的、可重现的并包含入侵的大量数据。本仿真实验选取DARPA数据集网络连接数据集作为实验数据。然后,对这些数据选三组特征值进行实验,并给出实验结果。
3.1 数据源的选取
该实验的数据采用DARPA 1988入侵检测评估数据库的数据。该数据有大量的连接数据记录。每个一记录代表一次网络连接,且每个记录均有41个特征值,其中各个特征的含义不同,大致可分为三类:1)表示网络连接内容特征;2)表示网络连接基本特征;3)表示网络连接流量特征。
模拟的入侵主要有以下四种类型:DOS 、 R2L、U2R、Probing,考虑到设计的实用性分别对三类特征值用神经网络分别进行训练和识别。实验选取了13000组数据进行仿真实验,其中3000组用于训练神经网络,10000组用于系统测试。
3.2 仿真实验结果
对三类特征组的训练集数据应用改进神经网络分别训练出三个神经网络,表示网络连接内容特征的神经网络,表示网络连接基本特征的神经网络以及表示网络连接流量的特征的神经网络在训练成功时的迭代步数分别为7056,386,3030。然后再对测试集数据进行测试,结果如下:
1)表示网络连接内容特征组,利用改进神经网络进行检测识别,结果如表1所示。
2)表示网络连接基本特征组,利用改进神经网络进行检测识别,结果如表2所示。
3)网络连接流量特征组,利用改进神经网络进行检测识别,结果如表3所示:
从表中数据可以看出对常见的四种攻击,不同的特征分组在改进神经网络的作用下检测各有优势。
4 结论
论文采用自动变速率学习法,利用遗忘因子进行微调,同时引入随机优化算子对BP神经网络进行了改进。改进神经网络的收敛速度比经典BP神经网络更快,同时稳定性也较好。并将该算法应用于入侵检测实验,实验结果显示改进后的算法具有较好的识别攻击的能力。
参考文献:
[1] 肖道举,毛辉.BP神经网络在入侵检测中的应用[J].华中科技大学学报,2003(5).
[2] 汪洁.基于神经网路的入侵检测系统的设计与实现[J].计算机应用与软件,2013(5).
关键词:人工神经网络 矿山 安全状态 评判能力
中图分类号:TD77;TP181 文献标识码:A 文章编号:1007-9416(2015)04-0206-01
通过改变神经网络训练样本等方式,对神经网络不同训练样本的反应能力进行对比分析,从而探讨人工神经网络对矿山安全程度评价的适应性。为了有效的提高人工神经网络对矿山安全程度评价的能力,可以通过改变神经网络的神经元数目以及初值赋值的方式来测试不同的结构,从而得出不同参数下神经网络对相同训练样本的评价结论,以便提高其评价能力,在矿山安全状态评判中充分发挥出人工神经网络的作用。
1 人工神经网络中的网络结构设计与原始数据的准备
本文中主要采取如1所示的神经网络结构,根据测试目的的差异性,其测试过程中神经网络的部分性能也就不同,但是对整个网络结构的性能不会改变。
这种神经网络的主体结构是单输入、三层式BP的网络结构,输出连接、目标连接、输入权重连接、偏置连接以及层权连接等是其主要的连接方式。各层神经元的分类包括:第一隐含层有8个正切S型神经元,第二隐含层有8个对数S型的神经元,输入层有4个元素,输出层有一个线性神经元。其网络函数主要包括训练函数、初始化函数、性能函数以及各网络层的层初始化函数。其训练函数需要采取TRAINLM回转方法来运算;初始化函数需要采取逐层初始化的方法运算;性能函数需要采取均方误差法来计算;各网络层的层初始化函数需要采取优化规则的方式计算,有的时候还需要采取INITWB的方式进行运算。各个权阈值的初始化需要采用RANDS方法来计算。在人工神经网络训练的原始样本数据以及期望值中,这些数据主要是用来评价地质因素对矿山安全影响程度的原始数据。当训练完成之后,需要对其各种数据进行仿真测试,以便评断这种人工神经网络结构在矿山安全状态中的应用价值与能力,并对其不足之处以及缺陷问题等进行分析,以便寻找出更加优化的方案,从而提高人工神经网络在矿山安全状态中的评判作用与能力。
2 人工神经网络对矿山安全状态评判能力的训练以及仿真测试
对矿山安全评价的方法较多,但是能够较好的应用于矿山安全评价的方法却很少,例如事故树分析法、概率风险评价法以及事件树分析法等,这些方法均由于基本事件的发生概率的确定方面存在一定的困难,从而导致运用于矿山过程中的安全评价效率不高。另外,在矿山安全状态评价的过程中,其安全检查表、专家评价方法等存在一定的缺点与不足,其在评价的过程中,主观性较强,受到个人意识的影响较大。综合指标评价法由于其指标间的逻辑关系,指标的权值与指标的量化等问题,从而导致该方法难以在矿山安全状态中进行准确的评价。只有能够更好的适应这种复杂的动态系统的安全评价方法,才能够将其更好的应用在矿山安全状态评价中[1]。
其中人工神经网络在处理无法使用简单规则或公式进行描述的大量的原始数据的问题时,以及在处理规律不清楚的问题时,其具有较大的优势。也正是由于这种方法能够对复杂的非线性动力学系统的适应,才能够使其在矿山安全状态评价中得到引进与推广。将人工神经网络对矿山安全状态评价能力的训练进行仿真实验,在每次实验检测之前,都需要对同一神经网络进行重新初始化,之后需要运用相同的训练样本数据对神经网络进行训练,以便达到训练要求后对网络进行仿真测试,训练性能函数的误差需要保持在10以内。其神经网络的训练过程是网络在初始权阈值的基础上,对其权阈值进行不断的修改,以便寻找出它们之间的某种联系,使得输入的整个训练样本集数据经过网络的运算之后,其输出与相应的目标数据差别能够满足性能函数的要求。因此,在人工网络对矿山安全状态进行评判的时候,即使所有数据与性能均符合要求,但是由于在训练的时候就被赋予了不同的权阈值,训练之后得到的权阈值的最终组合也会存在较大的差异。通过神经网络对矿山进行安全评判的目的在于运用神经网络总结分析数据,对矿井各个致灾的贡献率进行分析,进而对矿山的安装状态进行评判。从神经网络的角度来分析,通过运用网络的运算功能对训练样本的数据进行统计分析,并从中找出满足目标值以及性能要求的权阈值组合形式,从而通过仿真方式来评价矿山的安全状态。
3 结语
通过对人工神经网络在矿山安全状态的评判能力进行训练以及仿真测试后,发现人工神经网络与人类评判方法存在一定的差异性,在今后的发展过程中,还需要对人工神经网络在矿山安全状态中的评判能力进行不断的优化与改进,以便更好的适应矿山安全状态的评判,在矿山安全状态的评判中充分发挥出人工神经网络的作用,从而更好的确保矿山生产与经营的安全性。
随着科技的不断进步,国内外各领域专家学者相互努力共同打造了智能机器人。模糊神经网络理论通过自身所拥有的归纳等能力,有效地帮助了人们更好地控制机器人。使其具备自我学习和联想能力,通过蚁群算法优化的模糊神经网络理论能够更好地控制特种机器人,有效地应对工作中随机出现的变化问题。
关键词:
特种机器人;蚁群算法;人工智能控制;模糊神经网络
1创建机器人的数学模型
任何机械物体的运动都需要理论与实践的支持,而特种机器人的研究也是如此,对特种机器人进行操控就需要对它的各个运动构件的方位、位置、速度等建立一个合理有序的关系。而机器人的空间坐标、运动等可以通过数学模型来呈现。
1.1特种机器人的空间坐标
首先,描述特种机器人的空间坐标,可以用X,Y,Z轴方向的向量表示。其次,对于机器人的运动和操作,方位的准确明了非常关键。而特种机器人的方位也可用坐标系来表示。设一直角坐标系{B}与此刚体固接,坐标系{B}的三个主轴方向的单位矢量XB、YB、ZB相对于坐标系{A}的方向余弦组成的3×3矩阵称为ABR旋转矩阵:ABR=[AxBAyBAzB]=r11r12r13r21r22r23r31r32r33333333333333333333(1)式中,R的上标A和下标B表示R是{B}相对于{A}的关系;r为矢量矩阵的单位向量。而刚体{A}的位姿可通过上述所说的坐标系{B}在坐标系{A}中的各个方位和位置来阐述,进而{B}的原点根据其在坐标系{B}、{A}中的方位,分别表示了刚体在其中的位置和方向,式(2)表示{B}的位置矢量,用ABR和APBORG来描述坐标系{B},其中APBORG是确定坐标系{B}的位置矢量,建立公式(2):{B}={ABR,APBORG}(2)
1.2机器人运动方程
连杆坐标系、动力学方程、运动学方程都是操控机器人运动所需要的。特种机器人中的机械臂系统是一种涉及各杆、各关节、机械臂末端相对于绝对坐标的位姿、运动等的多刚体系统。其中,连杆坐标系的建立则为更好地操控机器人,使其高效长久地运动、工作做出了巨大的贡献,图1则为连杆坐标图。虽然建立了连杆坐标系,但是其中的杆与杆的关系则要建立一个齐次变换阵来连接。通过这个矩阵,机器人末端连杆在笛卡尔坐标系里的位置和位姿便可得出。
1.3机器人动力学方程
机械臂系统的运动学模型建立以后,还需建立动力学模型来控制。而动力学解决的问题是2种相对问题:若已知关节的施加力或力矩,求其速度、位移、加速度等;反之,则求力或矩阵。牛顿的欧拉方程等都是为了更好地操控特种机器人而建立的动力学。
2模糊神经网络理论研究
机器人系统功能多且复杂,对于各种生产运作过程中出现的一些问题很难控制。对此,模糊控制和神经网络相结合而成的模糊神经网络具备了解决一些问题的特别优势。模糊控制系统主要通过语言的描述控制机器人的运动,而语言描述能够充分地将专家的经验、知识转化为控制规则,模糊控制器由以下几个高功能的部分构成。
2.1神经网络理论
用于控制特种机器人的神经网络是根据人类大脑的思维模式和构造而设计,其中,神经元是大脑组织、信息处理的基本单位,而人工制作的神经网络则会根据企业、国家、个人的不同需求进行设计和分类,前馈网络和递归神经网络是其中的两大类。前馈网络不但层次感强,其常用的感知器、BP网络也能非常有针对性地解决一些问题;递归神经网络包含积分、反馈等功能,反馈机制是其在信息传输中的一大特点。
2.2模糊神经网络控制系统系统的输入及各种运作
实验证明:模糊系统与神经网络之间具有很多相似点,可以相互转化。模糊神经网络系统使其对数据的计算等更快并且更加正确,通过模糊控制也使其自身的容错力增强。模糊神经网络(FNN)模型的设计经过专家利用各种经验和知识的打造,能够更好地通过BP网络、建立样本等方式控制特种机器人的运作。
3蚁群算法优化训练的模糊神经网络
特种机器人控制蚂蚁算法是模仿生物界中蚁群通过交流、协作、共同搜寻获取实物活动的仿生优化算法。在蚂蚁工作的过程中,他们通过一种“信息素”交流。
3.1蚁群算法的本质
蚂蚁算法是通过分析、实践、探索蚂蚁群体活动得出的,是一种随机算法。蚂蚁算法分适应阶段和调解阶段,在这2个阶段中他们不断地优化自身的机构、积累需要的信息、寻求最佳解。蚂蚁算法中的人工蚂蚁不但有自组织性,还有协作、竞争的关系,在这过个程中,需要不断地协作、改进、更新。
3.2蚁群算法优化模糊神经网络
蚂蚁算法具有全局优化的特点,可以有效地训练FNN,避免了BP的缺陷。它在模糊控制系统和神经网络系统结合后,不但提高了整体优势,也增加了一些功能和特点。这些优化的改变,使某些工作的计算更加便捷。同时BP的缺陷及一些神经网络系统无法解决的问题,它也能很好地解决。而蚂蚁算法通过蚂蚁群体机智有效的协作,总结并融合了一些思想,通过这些思想,特种机器人能够自我选择方便、快捷、有效的工作路径[1]。蚂蚁算法为进一步控制特种机器人提供了更加合理有效的措施,也优化了各种运作系统。
3.3蚁群算法优化的结果
通过各种实验结果表明,蚂蚁算法优化的模糊神经网络系统更加稳定,也更加高效快速。通过实验比较发现:在普通的模糊神经网络中,把基本臂和期望主臂的轨迹长度比较后发现,被蚂蚁算法优化的模糊神经网络控制系统运行的轨迹更短效果更好更明显。
4结语
随着人类文明的发展,机械的运用与不断的创新随处可见,这个时代对特种机器人的需求也在不断增加。而国内外对特种机器人的研发也在不断地创新和投入,对此,涌现了大批的类型、功能不一的特种智能机器人。被蚂蚁算法优化过的系统很好地解决了一些问题,能够全面地优化各个方面,这种算法,为人类更好地发展特种机器人研究机器人做出了巨大的贡献。
参考文献:
Abstract: In order to further improve the ability of BP neural network fitting with complex functions, this paper further optimizes the genetic algorithm by changing the weights and threshold of BP neural network and applies this design model to the prediction system of vehicle sales. In order to compare its prediction effect with that of the traditional BP neural algorithm, this paper carries out the prediction simulation to compare the accuracies of the two. The simulation results show that the improved algorithm has better fitting ability and higher prediction precision for the data which has obvious linear correlation.
关键词:预测;神经网络;线性相关;遗传算法
Key words: prediction;neural network;linear correlation;genetic algorithm
中图分类号:F224 文献标识码:A 文章编号:1006-4311(2016)12-0074-04
0 引言
以时间序列预测汽车销量的方法在当今的预测汽车销售领域中占了绝大多数,比如我们所熟悉的有线性回归法、季节预测法[1]等等。线性回归法[2](如AR、MA、ARIMA模型等)能够体现销售量数据随时间变化的趋势,季节预测法能够有效地反映销售量随季节波动的特点。然而,除了汽车市场的内部影响因素之外,汽车销售量还受到市场环境变化等外部因素影响,如经济危机、限购政策、油价上涨、小排量购置税优惠政策等等[3]。在常见的预测模型中对非线性因素的处理方法存在着“自身的缺陷”,比如在外部因素引起市场一定的波动时,仅仅是靠时间序列模型的预测方法则很难做到精确。因此,在有效地收集、分析、掌握外部因素信息的基础上,将这些因素甄别和量化,反映到整个预测过程中,提高预测模型可使用的总体信息量,提高预测模型的预测质量,尤其在当市场环境有变化的情况之下,销售预测精确性将会获得较大的提高,并且更加趋近合理。
1 系统模型
1.1 系统分析
在不同的系统分析中,我们有时会采取不同的算法,每个算法都有各自的优势。遗传算法、BP神经网络和多元回归等算法也有着不同的优点[4],如遗传算法的全局寻优性, BP神经网络的优秀学习能力,从而避免了它们在各自单独使用时所存在的不足。我们把数据分为两个部分:线性相关和非线性相关,对这两部分采取相关性分析法进行处理。紧接着,充分利用BP神经网络与多元回归在处理数据方面的优势,分次处理数据的非线性和线性部分;最后,利用遗传算法所拥有的特性,即寻优特性,将已由BP神经网络和多元回归算法处理的数据整合在一起,最终的目的是使各项值得到进一步优化,如多元回归的权值、BP神经网络的连接权值以及阈值。
在这里,我们先暂定待处理的数据为DATA,DATA中包含的记录条数为U条。DATA的第k个记录含有M+N个自变量,记为X 其中:
k∈{1,2,…U},i∈{1,2,…M+N};1个因变量(期望值),记为Yk其中k∈{1,2,…U}。
1.2 相关性分析
当我们要判定如国民收入和居民储蓄存款或者身高和体重,这些变量之间的关系时,我们首先会去判定这两个变量或两个数据集合间是否存在线性相关时,这里就引出了我们所要用到的判定相关系数Pearson[5]。Pearson相关系数的作用最重要的是用来判定定距变量间的线性关系和两个数据集合是否在一条线上。某些情况下我们会用到Pearson简单相关系数r。其计算公式为:
我们根据所得r的数值来判断两者相关度的强弱。一般说来,当相关系数的绝对值越大或者相关系数越接近于1或-1的情况下,相关度是越来越强的;而相关系数越趋近于0,相关度就会变得越来越弱。
若相关系数r>0.6,认定自变量Xi与Y线性相关,否则为线性不相关。根据文献[6]可知,本文研究的BP神经网络中,输入数据Xi i∈{1,2,…N}与输出数据Y在Xi i∈{1,2…N}与Y线性相关,在Xi i∈{N+1,N+2…N+M}与Y线性不相关。
1.3 BP神经网络
输入层、输出层和隐含层[6]是BP神经网络的三个组成部分,其中输入层和输出层各一个,而对于隐含层,在理论上,它的数量是不会受到任何限制的,但BP神经网络在一般情况下仅设置一个或者两个隐含层。在这个神经网络中,输入信号经过作用函数的作用之后,在其信号传至隐层节点之时随即把它得到的输出信号传递到输出层节点上,同样经过处理后而得到的输出便是最终的结果。作用函数S型函数在本文中的节点之间会被用到,它的计算公式为:f(x)= 。
本文构建的神经网络模型如图1所示。
由图1可知,我们这个神经网络模型共有四层。模型的第一层X即是输入层,它是以非线性相关的Xi i∈{N+1,N+2…N+M}的数据作为其输入的;神经网络包括的两个隐含层分别是第二层J和第三层I;神经网络模型的输出层就是第四层BY。例如图1上的J层第1节点,当它和第I层的第2个节点连接时,权值的计算值则为W 。如若模型采用的节点作用函数为f(x)= ,则可以得到该节点的输出为Y =f( W Y -B )。该式中W 、Y 和B 分别表示某一节点与其上层节点之间的连接权值、上层各节点的输出值和节点的阈值。根据公式:E=(t-BY)*BY(1-BY),它表示的含义是网络误差的计算,在式中t的含义是输出的期望值。将网络误差与最大允许误差进行比较:
BP神经网络在模式匹配、模式分类、模式识别和预测分析等方面[7],性能优势十分明显。
虽然BP算法是网络结构中应用比较普遍的算法之一,而且BP算法在应用上也取得了一定的成功,但是BP算法本身还是存在着不可避免的局限性:
①在BP神经网络算法中,它为了不使加权值过大,通常选取较小的随机数(如0~0.2之间)作为初始权值,同时设置网络在初始阶段就处于S型函数的饱和区,就是在这样给定初值的范围内,有些取值也会使算法的结果值陷入局部极小,一旦有了某些局部极小点[8]的牵累,就会引起训练的振荡而达不到我们所想要的稳定,同样也会陷入局部极值的不利情况。
②在BP算法中,我们需要设置一些参数的初始值,以便网络训练得以进行。如初始权重值,隐层节点个数值,当我们在设置没有任何参考时,可能会致使网络训练的失败或者说执行的并不如我们所预料的结果那样,与理想有所差别。但是这些参数的选取过程又缺乏严格的理论依据,需要根据我们过往的经验以及一定的实验来选取,才可保证它的选取值合适与否。
③在BP算法中,它存在一个遗忘所学样本的趋势,就是在每当其输入一个的权重值时,会导致阈值不断地修改,所以前面已学的学习样本必然会受到后面每次所输入样本的影响。
2 一种BP神经网络和线性回归优化的遗传杂合算法
为了实现网络训练的过程并得到全局相应的最优化的解,我们提出一种基于BP神经网络和线性回归优化的遗传杂合算法。在文章的前面我们知道,传统的BP神经的学习过程存在一些不足,我们提出的这种算法会把BP神经网络和遗传算法结合起来,利用遗传算法的全局寻优特性,来实现网络的训练,得到全局相应的最优解。改进的算法模型如图2。
待处理数据Xi i∈{1,2…N}和Y,我们假定两者是呈线性相关的。首先对线性不相关数据进行BP神经网络处理输出为BY,BY与存在线性相关的数据进行多元线性回归。
模型误差:
2.1 改进算法模型的遗传优化
在生物进化机制的搜索方法中有自然选择和自然遗传,而本文改进的遗传算法就是基于这些内容的。现如今有一种算法正趋于发展成为自适应启发式概率性迭代式全局搜索算法[9]。某个优化问题的解集,也就是它的搜索空间,并且映射搜索空间为遗传空间。我们随机产生的一组初始解,在遗传算法中称作此初始解为群体,它所产生的后代中不断地传下去并且一代一代地进化,我们称之为遗传。我们找到收敛为最佳的染色体,即是最优解。
将以上改进的遗传优化算法运用到BP神经网络的权重、阈值以及回归系数上,可以达到优化这些参数的目的,使网络误差值最小。在本文的实验中,由生物种群的概念,我们视BP神经网络和回归系数的所有权值为一个种群。本文的实验是基于遗传代数1000、种群60所进行的遗传算法优化训练过程。即为图3所示过程。
2.2 算法详细流程
①样本值归一化处理。
对原始样本值X,Y按照公式X′= -1,Y′= -1归一化处理作为模型输入数据,归一化处理后数据在[-1,1]之间。式中X′、Y′为归一化后的数值,Ymin、Xmin为原始数据最小值,Ymax、Ymax为原始数据最大值。
②参数集。
将模型中待优化参数BP网络权重W 、阈值B 与回归系数?孜组成一个参数集C={W ,B ,?孜},C作为染色体,Ci为单个基因。
③编码。
编码方式中有一种称为实数编码的,它是指个体编码的长度与决策变量的个数相等,在合理具体的条件范围内,用一个实数表示某个体的每个基因值。该方法中用到的值是决策变量的真实值,因此我们又称它为:真值编码方法。考虑我们实验过程所需要的算法,这种编码方式对于我们的实验十分合适。
④初始化种群。
种群大小N=60,随机生成第一代个体C 其中t为代数t=1,i表示个体编号i∈{1,…, },C 表示第一代的第五个个体。
⑤个体适应度。
我们以f =Emax-E(C )为个体适应度函数,能够满足我们的要求。式中f 表示第t代的第i个个体的适应度计算值,Emax为最大系统误差,E(C )为C 个体的系统误差。
⑥选择操作。
在试验中我们需要知道选择概率值,所以由前公式f =Emax-E(C )和公式P = 两者结合便可以计算出选择概率。我们在pop(t)代中根据所计算得到的概率值随机的选择一部分个体染色体遗传到下一代,为pop(t+1)代。将选择出的个体染色体暂且称为一个中间代mespop(t),并将其作为下面遗传操作(交叉、变异)的对象。
⑦交叉算法。
我们先假设要交叉的两个父体对象分别为Pi=(p ,
⑧变异算法。
在选择交叉的遗传过程中,我们也需要考虑到遗传变异这一情况。所以我们采取了一种特殊的变异算法:边界变异。它在遗传的后代种群中选择中间代mespop(t)代,又在其中选择N对个体,当交叉概率为Pc时,以此概率值指导个体进行遗传变异。边界变异的取值方法的多样性也正是后代种群群体多样性的特点。其变异位的值往往是在它的边界上,因为在边界上,通常存在着许多约束优化的最优值,也就是其编码位取值范围的边界之一。在中间代mespop(t)完成交叉和变异所形成的下一代中pop(t+1)进行个体适应度值计算的操作。
3 仿真结果和分析
仿真实验中,分别采用多元线性回归、传统BP神经网络和本实验算法对多元线性方程、多元非线性方程、含有线性和非线性部分的方程进行拟合。
多元线性方程:
多元非线性方程:
含有线性和非线性部分的方程:
3.1 样本数据
样本输入数据是在考虑影响汽车销售多方面因素的前提下,如:经济危机、限购政策、油价上涨、小排量购置税优惠政策等,在Matlab平台下拟合而成。样本输入数据为xi∈[-1,1],样本总数为20,随机生成20组数据作为样本值(图4)。
选用第一行到第四行作为式(8)的输入函数值,如图5。
选用第一行到第二行作为式(9)的输入函数值,如图6。
选用第一行到第二行作为式(10)的输入函数值,如图7。
3.2 仿真结果
式(8)多元线性回归、BP神经网络、改进算法仿真结果(图8)。
式(9)多元线性回归、BP神经网络、改进算法仿真结果(图9)。
式(10)多元线性回归、BP神经网络、改进算法仿真结果(图10)。
多元线性回归、BP神经网络、改进算法拟合三种方程误差平方和如表1所示。
3.3 仿真结果分析
由结合改进算法的特点和对比分析所得到的实验结果,我们可以得到以下三点结论:①多元线性回归在拟合线性方程时所产生的误差比较小,而在拟合非线性方程时,产生的误差略大。②BP神经网络在拟合存在非线性数据时,误差较小,在拟合线性方程时存在明显的不足。③三种算法在拟合非线性和线性结合方程时,本实验的误差要比单纯拟合非线性方程小很多,与理论预期明显相悖。对于这种情况的原因,结合理论,本文总结出可能存在的两小点:1)数据的输入值范围在[-1,1],范围太小,对函数值得影响不显著;2)由于实验采用拟合函数的形式,函数关系内部过于简单。
4 结论
用改进算法拟合复杂函数的能力比单纯依靠线性回归和BP神经网络存在明显的优势。影响商品销售的因素有很多,各种因素对销售的影响也各不相同,传统的BP神经算法可以很好的预测效果。但是BP算法在处理那些同销售值存在较大相关性的因素时,不能突出它的优势。我们通过把影响销售较大的因素与其他因素直接加权相加得到销售值,最后通过遗传算法来优化权值。这也就是我们研究本文算法的目的之所在。
参考文献:
[1]张彦铎,李哲靖,鲁统伟.机器人世界杯足球锦标赛中多机器人对目标协同定位算法的改进[J].武汉工程大学学报,2013(02):69.
【关键词】电力负荷预测 模型 神经网络
能量的管理系统当中一个非常关键的部分就是电力负荷的预测,它对电力系统的运行和控制等工作发挥着非常重要的作用。怎么去提高预测工作所呈现的精准程度已经成为现在对负荷预测理论研究的重点所在。但是对于符合的预测是比较复杂的,利用传统解析模型基本上无法完成对负荷比较准确的预测。经过长时间科研工作者的实践经验总结,外部环境条件是对负荷产生影响的一个尤为重要的因素。为了得出环境条件对负荷影响的规律,保证电力供应能够保持一定的平衡,必须要将电力负荷的变化特征作为基础,继而定量分析它们具体的关系。
1 气候条件对电力负荷的影响
1.1 温度以及湿度
电网负荷产生的变化与外部环境中气温的高低有着密不可分的联系,能够产生正向的影响。而在气温比较适宜的情况之下,湿度对于人类身体产生的影响并不是特别的显著。在气温过高或者过低的时候,湿度的波动就会给人体热平衡以及温热感应形成较高的影响。当空气中的湿度处于一个较高的状态时,人们身体所向外生成的热辐射将会被空气中所含有的水蒸气所吸纳。当环境中的气温低于人体皮肤表面温度的时候,风可以使人散热过程的速度更快。大概是每秒的风速涨一米,人们的体感温度就会下降二到三摄氏度。
1.2 大气压
外部环境所呈现的大气压与电力的负荷在不同的季节当中都有一定的关系,不过目前关系的数据和形式还不能确定,有待进一步研究。
1.3 降水量
经过相关的研究证明,基本所有的降水过程都能对日用电量产生影响,引起下降的幅度一般为百分之三左右,最大幅度能够达到百分之十。不过,降水过程对负荷的影响具有延迟的特性。
上文所陈述的三种分析结论还是存在一定偏差的,这是由于负荷曲线的峰值、谷值以及一些其它形式的波动能够受到一些大型工厂以及企事业单位工作时间,以及公共设施使用状况等各方面因素的综合影响,上面所说的气象因素只是对总负荷形成影响的一个部分。在实际的应用当中应该将这些因素加以更为全面的考虑,避免对单个因素孤立的分析。
2 利用多模型方法实现建模以及预测
2.1 人工神经网络
它是在模仿生物神经网络功能的基础上而形成的一种模型。一般情况下,生物神经元能够受到传入刺激,继而自输出端传导至相关联的神经元之上,输出跟输入过程之间的变化呈现出非线性联系。神经网络则是由很多个简单的原件以及它的层次组织,采用大规模并行的连接形式所形成的,以生物神经网络相类似的形式来处置输入信息。对生物神经网络加以模仿建立起来的人工神经网络对于输入信号有着十分强大的处理能力。
很多神经元之间相互连接而形成一个大的网络,在这个网络中的一个神经元就可以实现对几个输入信号的接收,并且依据一定的规律将其转变为输出信号。由于神经网络中各神经元见有着比较复杂的一种关联,并且每一个神经元在对信号进行传递的时候都会显现出非线性的基本形式,因此输入和输出信号见可以建立起不同的关系,可以当成黑箱模型,用在对作用机理不明确的模型实现描述,不过输出跟输入间有客观、确定或者模糊规律的客体。因此人工神经网络已然在化工开发等领域得到了较大面积的应用。
人工神经网络所包含的各种层次的神经元主要是通过wkj以及wlk进行连接的。神经元所呈现的输出与权之间做出乘法运算就能得到下层神经元的输出。每一个隐层神经元的输出其实就是输出层所呈现的输入,它们都是被神经元的活化函数决定。
BP模型是NN模型中应用最为广泛的一种模型。BP神经网络主要是指将BP算法当做基础的一种多层神经的网络系统。BP神经网络通常都具有至少一个隐含层,隐含层中的神经元采用了sigmiod函数,而输出层则是应用purelin传递函数。在理论方面其实已然证明了有着当个隐含层的网络模型在隐含层神经元增长到一定数量的时候,能够从所有的精度去逼近不管哪个具备有限断点的非线性函数。而在结构上实现则要比增加隐含层更加简单,所以在电力负荷的预测工作当中利用BP网络的时候都是采用具有一层的隐含层。
2.2 运用多模型方法建模与预测
运用分层形式的多神经完了模型针对电力负荷的整体加以预测。底层通常是把电力负荷的基础样本以及相关的气象因素加以独立的构建神经网络的模型;顶层用的是因为气象因素而对电力负荷实现修正的具体结果。系统规模较为庞大,但各个子模型规模并不是很大,不过它的数量是比较多的。
3 实例分析
我们以某市的某个居民小区在2016年366天的用电数据为例,采样的周期是一个小时,一共获得了366组原始样本。与此同时将这个地区每天每个小时的温度、湿度、以及降水量等最为重要的气象影响因素进行细致的记录和分析。将全部数据都加以标准化,继而从366天中选择二百五十天的数据作为底层的基础样本,剩下的数据作为顶层测试样本。要选择一个确定的时间前连续的二十四小时中24个整点电力的负荷值,并且将温度、湿度以及降水量等当成底层子神经网络一至五的输入,一个整点作为输出。底层子网络应用三层的BP网络结构,这样就有二十四个输入的节点一级一个输出的节点,经过反复实验后,确定了网络隐含层的节点数是46、32、35、30、30。在这当中选取一组有着最为优秀性能的权和阈值作为实验最后的结果,再利用相关样本数据检验模型。结合预测结果能够分析出,以单个神经网络预测的基本模型无法达成对有些特殊状况加以可靠预测的目的。多模型神经网络预测的模型针对电力负荷的情况预测,能够得到精度较高的预测结果。
4 结束语
本文主要考虑了天气因素对于负荷生成的影响,并且探讨了利用多模型的神经元网络方式来设置电力负荷预测的模型。过实际例子的分析,与单模型方法相比,证明了多模型方法的实用性。因为电力负荷会随着季节的变化形成较大的不同,这一方面的内容还有待我们加以进一步的研究。
参考文献
[1]段j.基于能量管理系统的电力系统负荷预测[D].广州:华南理工大学,2009.
[2]陈华友.组合预测方法有效性理论及其应用[M].北京:科学出版社,2007.
【关键词】LSSM 字符识别
字符识别作为多种应用的基础与关键,如文本识别、车牌识别、证件识别等,对工业生产与商业应用具有重要意义。在实际应用中识别对象通常带有一定的噪声,因此要求识别系统具有一定的容噪能力及处理速度。
传统的字符识别的手段中主要有人工神经网络、模板匹配、特征识别、支持向量机等。人工神经网络属于比较成熟有效的工具,识别中使用最广泛的是BP神经网络,还有SOM、MLP、RBF等。BP为多层网络,通常需要提取字符特征进行训练,训练速度较慢,干扰比较敏感,且容易陷入局部最小点。
LSSM 应用于单层全互联网络,不需要对字符进行特征提取,节约了训练时间。记忆模式为网络能量的最小值。具有较快的收敛速度。
1 LSSM算法介绍
网络的输出将反馈至输入,形成动态系统并收敛于设计的渐进平衡点。LSSM是连续系统,其对应的差分方程可直接用于离散的Hopfield网络。
系统的差分方程:χ(t+1)=F(WX(t)+I) 。x为神经元状态,激励函数。W表示连接神经元的权值,I代表神经元的阈值。F()为激励函数,表达式如下所示:
LSSM设计步骤如下:
1).t={t1,t2,…,tN-1,tN},ti为记忆模式,1≤i≤N。
2).A={t1-tN,t2-tN,,tN-1-tN}\
3).A=USVT,K=rank(A)。
4).up={U1,U2,…,Uk},um={uK+1,uK+2,…,uN}},,。
5).Wt=Tp-τ×Tm,It=tN-Wt×tN
W=exp(h×Wt)
,
其中C1=exp(h)-1,C2=-[exp(-τ×h)-1]/τ, h为采样频率,τ为控制参数。
2 字符识别
本文采用ASCII码表中的阿拉伯数字、大小写英文字母,共62个模式。每个字符用8*8的图像表示,网络使用64个神经元,以{-1,1}作为记忆模式的神经元状态。
由于LSSM能处理连续值,我们正态分布的随机噪声加入记忆模式进行检验。实验中选择均值为0,方差变化的噪声序列。因此方差代表了噪声水平。当两次输入相同时停止迭代,得出收敛速度与噪声水平的关系。当输出与记忆模式完全相同视作回忆正确,得出错误率与噪声水平的关系。
在处理加噪输入之前,应先检验网络是否能够成功记住记忆模式。实验表明,LSSM能成功记住所有模式。用不同方差的的噪声向量加入记忆模式中,将其作为网络的输入进行识别。
所有记忆模式在在相同噪声水平下,进行50次实验最后取其错误率与收敛速度的均值,得到LSSM随噪声变化,网络识别效果的曲线。在噪声水平低于1的时候,LSSM能完全成功识别所有模式,并且迭代步数基本均小于20步。当噪声水平大于1,时,网络出现错误,且迭代步数上升。
在研究了LSSM识别相关字符后,再对比离散Hopfield网络的识别效果。在记忆62个模式之后,对‘0’、‘A’、‘a’的回忆情况如下,此时离散Hopfield已经不能正确记忆模式,网络失效。鉴于容量问题,无法使用离散Hopfield就本文提出的字符识别进行应用。
通过对比发现,LSSM用作联想记忆进行字符识别,容噪能力高、收敛速度快、识别正确率高,是十分成功的。在规模上相较于传统的BP神经网络、在容量上相较于离散Hopfield网络都有巨大的优势。
3 总结与展望
本文将LSSM应用于字符识别,对该系统进行了深入的分析,通过定量实验展示了其容噪能力、收敛速度,充分说明其优越性。单个字符的识别是模式识别的典型案例与本文识别的基础,因此LSSM在联想记忆的应用中将具有广阔的前景。
在将来的研究中,可以扩展LSSM的识别范围,同时对倾斜字符和缺失字符的处理进行研究。除此之外,对算法的研究,有助于拓展识别系统的硬件设计,使神经网络的处理能力在大规模并行处理器上得以施展。
参考文献
[1]牛慧娟,汪森霖.基于神经网络的带噪声英文字母和数字识别[J].研究与开发,2008.
[2]许新征,曾文华.基于自组织特征映射神经网络的数字模式识别[J].厦门大学学报,2005.
[3]Li J H,Michel A N,PorodW.Analysis and synthesis of a class of neural networks:linear systems operating on a closed hypercube[J].Circuits and Systems,IEEE Transactions on,1989, 36(11):1405-1422.
[4]Li J H,Michel A N,Porod W.Analysis and synthesis of a class of neural networks:Variable structure systems with infinite grain[J].Circuits and Systems,IEEE Transactions on,1989, 36(5):713-731.
关键词: 供应链绩效评价;模糊综合评估;粗糙集;BP神经网络
中图分类号:C93 文献标识码: A文章编号:1003-7217(2011)05-0119-06
一、引 言
在供应链条件下,各节点企业运作行为往往具有随机性和不确定性。动态供应链绩效评价是一个包含多个指标和输入输出的复杂评估系统,各绩效指标具有模糊性、不确定性,彼此之间存在非线性关联性。软计算[1-7]理论与方法是处理动态供应链绩效这样复杂的、具有大量不确定性和模糊性的评估系统的重要技术。在相当多的领域(自然科学、社会科学与工程技术)中,都涉及到对不完备信息和不确定因素的处理。从实际系统中采集到的数据常常包含着噪声、不精确甚至不完整,如果我们采用纯数学上的假设来消除或回避这种不确定性,效果往往不理想。但如果对这种信息使用恰当的方式进行处理,常常有助于实际系统问题的解决。
二、相关研究评述
多年来,研究人员一直在努力寻找科学地处理不完整性和不确定性的有效途径,实践证明,1965年Zadeh[8]创立的模糊集理论与1982年Pawlak[9]倡导的粗糙集理论是处理不确定性的两种很好的方法。事实上,除了上述两种方法外,基于概率统计方法的证据理论也是处理不确定性的一种有效方法。以上众多的方法都属于软计算[10-15](Soft Computing)的范畴。Zadeh教授提出了软计算的概念,软计算的主要工具包括粗糙集、模糊逻辑(Fuzzy Logic)、神经网络、概率推理(Probability Reasoning)、信任度网络(Belief Network)、遗传算法(Genetic Arithmetic)、混沌理论(Chaos)等。传统的计算方法,即所谓的硬计算(Hard Computing),使用精确、固定和不变的算法来表达和解决问题,软计算利用所允许的不精确性、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调。因此,软计算作为知识获取和智能信息处理的重要手段,在许多研究领域有着广泛而深入的应用。
(一)基于模糊综合评估的供应链绩效评价
模糊集理论是经典理论的推广,它认为元素总是以一定的程度属于某个集合, 也可能以不同的程度属于几个集合。经典理论中集合的边界是清晰的,而模糊集理论中集合的边界是不清晰的,对人们显示生活中大量使用的一些含义确定但不准确的语言表述,模糊数学可以较好地表达,因而可以自然地用于事物的评价。
在动态供应链绩效评价体系中,各绩效指标之间往往存在着复杂的因果关系,这些指标中既有定性指标也有定量指标,具有模糊和不确定的特点,模糊综合评估方法为处理这种不确定性提供了有力的工具,它能够尽可能地减少个人主观臆断所带来的危害,为合理评价决策提供科学的依据。作者在文献[16]中详细讨论了基于模糊综合分析的供应链绩效评价方法,并结合Markov链预测理论给出了供应链绩效未来的发展趋势。
(二)基于粗糙集约简的供应链绩效评价
Rough集理论是一种刻画含噪声、不完整、不精确、不相容的数学工具,它能有效分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律,是一种重要的软计算技术。其主要思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类原则。Rough 集理论是基于不可分辨的思想和知识简化的方法,从数据中推理逻辑规则作为知识系统模型。
如前所述,在供应链条件下,各节点企业运作策略具有动态可调节性,其运作行为具有随机性和不确定性,这就要求在对供应链绩效进行评价必须采用动态评价方法,同时对供应链在未来某一时刻的整体绩效进行预测。粗糙集及其约简理论是处理这种不确定性的重要技术。作者在文献[17]中基于粗糙集理论的绩效评价模型,建立了动态供应链绩效评价决策表,利用粗糙集约简方法得到了预测绩效评价结果的决策规则集,并把粗糙集约简和模糊综合评估技术相结合进行动态供应链绩效评价,显然地缩小了数据处理的规模,降低了模型的计算复杂度。
(三)基于神经网络的供应链绩效评价
神经网络可大规模地并行处理和分布式地存储信息,具有良好的自适应、自组织性以及很强的学习功能、联想功能和容错功能。与当今的冯诺依曼式计算机相比,更加接近人脑的信息处理模式,主要表现为能够处理连续的模拟信号。神经网络并行分布工作,各组成部分同时参与运算,单个神经元的动作速度不高,但总体的处理速度很快。神经网络信息存储分布于全网络各个权重变换之中,某些单元障碍并不影响信息的完整。传统计算机要求有准确的输入条件, 才能给出精确解。神经网络只要求部分条件,甚至对于包含有部分错误的输入,也能得出较好的解答,因此具有较好的容错性。
动态供应链绩效评价是一个包含多个指标输入输出的复杂评估系统,各绩效指标具有模糊性,彼此之间存在非线性关联性。针对这样一个复杂的评估系统,作者曾利用BP神经网络技术来找出供应链绩效评价系统输入-输出之间的非线性映射关系,从而对动态供应链绩效评价结果进行学习和预测。通过与粗糙集约简理论相结合,简化了BP神经网络的结构设计,减小了运算量。
(四)几种软计算方法的优缺点
软计算是一个方法的集合体,目前主要包括粗糙集、模糊逻辑、神经网络、概率推理、信任度网络、遗传算法以及混沌理论等。软计算方法已广泛应用于包括模式识别、数据挖掘、系统评价、故障诊断、专家系统等在内的诸多领域的不精确、不确定问题。软计算方法按照其特点各有优势。例如,模糊集可以通过对人类思维建模来给不确定性问题提供自然的解决机制;粗糙集在属性约简和规则抽取方面性能优良;神经网络对噪声具有强鲁棒性,分类精度高;遗传算法广泛用于优化搜索问题。 同时,以上软计算方法依照算法的不同有各自的局限性:模糊集过度依赖专家知识,遗传算法收敛速度慢、稳定性差,神经网络训练时间过长、知识解释性差,而粗糙集对数据中的噪声较敏感。本文为了克服单一方法的局限,试图通过集成两种或两种以上的软计算方法的软计算融合系统来解决供应链绩效评价的实际问题[6, 7]。
财经理论与实践(双月刊)2011年第5期2011年第5期(总第173期)郑 培,万 炜:基于智能信息处理的供应链绩效评价方法
(五)软计算融合技术在动态供应链绩效评价中的应用
作者详细研究了模糊综合分析、粗糙集理论、神经网络等软计算技术在动态供应链绩效评价中的应用方法。从文献[16-17]实验结果可以初步看出,通过把几种软计算技术融合起来应用于供应链绩效评价,就能够克服单一智能信息处理方法的缺陷,取得更好的效果。本文使用的几种软计算技术能在多个方面进行融合[6, 7]。
粗糙集和神经网络的融合。通过粗糙集的属性约简可以显著减少原始数据量,使神经网络训练时间缩短,从训练后的神经网络中抽取规则也可显著提高神经网络中知识可理解性;神经网络的强鲁棒性也可解决粗糙集处理数据中的噪声问题。
粗糙集理论和模糊集理论的融合。粗糙集理论和模糊集理论都是研究信息系统中知识不完善、不精确问题的方法,但粗糙集理论解决问题的出发点是信息系统中知识的不可分辨性,而模糊集理论则关注信息系统中知识的模糊性,两者在处理方法上各有特色。两者的结合可以更好地解决信息系统中不完善、不精确性知识的问题。
模糊集和神经网络的融合。模糊集和神经网络的融合主要有模糊神经网络和神经模糊系统。神经模糊系统以神经网络为主,结合模糊集理论,将神经网络作为实现模糊模型的工具,即在神经网络的框架下实现模糊系统或其一部分功能。从结构上看,一般是四层或五层的前向神经网络。模糊神经网络是神经网络的模糊化,即以模糊集、模糊逻辑为主,结合神经网络方法,利用神经网络的自组织性,达到柔性信息处理的目的。
三、基于智能信息处理的供应链绩效评价方法比较
(一)基本思路
在作者以前的研究里,曾应用模糊综合分析、粗糙集理论和BP神经网络等智能信息处理方法建立了多个供应链绩效评价模型,本文对这些评价模型的效果和优缺点进行了分析和总结。我们的基本思路是以某动态供应链为例,选取合适的绩效指标集,对得到的绩效指标按照评价模型的数据要求进行预处理,然后输入到不同的动态绩效评价模型中进行处理,对各个绩效评价模型进行解算。通过对模型输出的结果的比较和分析来归纳各个绩效评价模型的主要特点,并对评价模型的实际效果进行总结。
(二)数据预处理
如前所述,本文已经根据文献[15]提出的供应链五维平衡计分卡,选择了15个关键绩效指标作为动态供应链的绩效评价指标集C,C={F1, F2, F3, C1, C2, C3, P1, P2, P3, P4, L1, L2, L3, S1, S2}。在15个绩效指标中,既有定性指标,也有定量指标。由于BP神经网络只能处理数值向量,因此在这些绩效指标输入BP网络训练之前必须对它们进行预处理。在基于粗糙集理论的供应链绩效评价模型里,根据决策表信息约简的要求,需要对所有属性的取值进行离散化处理。这里对某动态联盟供应链绩效决策表条件属性采用表1的方法进行离散化处理。
假设根据历史经验或供应链行规,把供应链的绩效评价结果划分为G1、G2、G3、G4四个等级,分别对应供应链绩效评价为优、良、中、差的状态,其划分的依据如表1所示。
在基于模糊综合评估的供应链绩效评价模型里,表1将作为构造各绩效指标属于各类的隶属度函数的依据。
(三)实验结果比较与分析
实验的数据源仍采用文献[15]某供应链相关指标的调查结果,经调查得到该供应链在2007年1~12个月的绩效指标取值和绩效综合评价结果。本文已经详细讨论了对该供应链绩效采用基于BP网络训练和学习的过程,并结合粗糙集约简给出两者相结合的混合绩效评价方法及结果。
BP网络学习完毕后,就可以用来对下一评估时刻的供应链绩效进行预测。针对上述供应链,经调查得到该供应链在2008年前4个月的绩效指标取值结果,如表2所示。
将上述各绩效指标规一化后输入训练好的BP网络,得到相应的输出向量分别为(0.0023, 0.998, -0.002, 0.007)、(-0.008, 0.003, 0.988, -0.005)、(-0.008, 0.958, -0.008, -0.002)和(0.987, -0.010, -0.005, 0.005)。据此可判断该供应链在2008年1~4月的绩效综合评价结果分别为G2、G3、G2、G1。
进一步,针对表1所示的供应链绩效分级标准,可以通过Rough约简得到供应链绩效分级决策表的最佳约简,即供应链绩效评价的关键绩效指标集。通过约简得到供应链绩效评价的关键指标集为{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},这样这12个关键绩效指标就构成了BP网络的输入层节点。把表2所示的供应链在2008年1~4月的关键绩效指标量化结果输入训练好的BP网络,可求出其相应的绩效评价结果分别为G2、G3、G2、G1,与供应链绩效实际调查结果一致。
下面,针对同一供应链,分别采用基于粗糙集理论的动态供应链绩效评价模型、基于模糊综合评估的供应链绩效评价模型及两者的结合来得出供应链绩效评价结果,并进行方法间的比较。
在基于粗糙集理论的供应链绩效评价模型里,先对各绩效指标进行离散化处理,离散化后的该动态供应链绩效决策表如下。
对于表3所示的绩效评价决策表,利用约简算法对决策表进行属性约简,以便去掉决策表的冗余条件属性。进一步,利用归纳值约简算法对绩效决策表进行值约简,可以得到一系列用于供应链绩效评价的决策规则集。由于决策属性值被离散化为四个等级,亦即信息系统具有四个概念。针对这四个概念的最一般规则分别为:
根据上述关于决策属性取值的最一般规则,就可以对某一考察周期动态联盟的综合绩效评价结果作出判断。当条件属性集不完全满足规则前件时,可以选取关于各个概念的次一般(或可信度较高)的生成式规则对绩效作出综合评估。
把表2所示的该供应链在2008年前4个月的绩效指标离散化,然后针对上述供应链绩效评价决策规则进行匹配,可得这4个月供应链绩效综合评价结果分别为G3、G3、G2、G1。
接着,采用模糊综合评估方法来对同一供应链的绩效评价结果进行分析。首先建立模糊关系矩阵,单因素评价矩阵取各因素在评价集上的隶属度,各隶属度函数均取为二次函数。根据供应链绩效分类标准表1,建立F1属于各类的隶属度函数为:
同理,可分别建立其它绩效指标属于各类的隶属度函数,对应绩效评价指标集C的权向量取为:
W=(0.17,0.06,0.02,0.08,0.13,0.02,0.05,0.04,0.10,0.01,0.10,0.04,0.05,0.11,0.02)
于是,由模糊综合评估法可求出该供应链在2008年前4个月的绩效分别为G3、G3、G2、G1。
最后,采用结合了粗糙集约简和模糊综合评估的动态供应链绩效评价方法来得到该供应链绩效评价结果。首先借助于动态供应链绩效评价决策表对绩效评价指标进行约简和降维,通过Rough约简得到供应链绩效评价的关键绩效指标集为{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},根据供应链绩效分类标准表2分别建立上述关键绩效指标属于各类的隶属度函数,然后利用模糊评估方法对供应链绩效进行综合评价。根据该混合供应链绩效评价方法求出该供应链在2008年前4个月的绩效分别为G2、G3、G3、G1。
我们给出了采用上述五种基于智能信息处理的绩效评价方法得到的该供应链在2007年1月~2008年4月间绩效评价结果的变化趋势,如图1所示。其中,如图例所示圆圈、方块实线、下三角实线、粗标圆卷实线和带星虚线分别代表了对应月份由五种评估方法得到的供应链绩效评价结果。
图1 某供应链采用五种绩效综合评估方法得到的评价结果
从图1可以看出,采用五种不同的供应链绩效评价方法得到的结果略有差异。这一差异由多种原因引起,首先基于BP神经网络的绩效评价方法和基于粗糙集理论的绩效评价方法都是有监督的智能学习算法,即在对动态供应链绩效评价结果作出预测之前,都有个训练的过程,这需要大量的历史数据。而基于模糊综合评估的供应链绩效评价方法隶属度函数主要由绩效分级标准确定,并不“显式”地需要历史绩效结果。其次,许多基于智能信息处理的绩效评价模型都需要事先确定一些参数,如BP网络需要确定网络结构、学习速率、冲量因子;模糊综合评估需要确定指标权值和隶属度函数表示方法等。另外,不同的绩效评价模型对输入数据的要求各不相同,BP神经网络和模糊综合评估处理的是连续数据,粗糙集约简处理的是离散数据,而实际获得的绩效指标中既有定性指标,也有定量指标,这就需要在绩效指标输入模型之前进行预处理,预处理方法的不同导致模型输出有很大的差异。上述几种不同的基于智能信息处理的供应链绩效评价方法输出结果与供应链实际绩效基本相符,在实际使用时要根据情况灵活选择。
此外,实验结果也表明通过几种智能信息处理方法融合在动态供应链绩效评价中能取得更好的效果。通过粗糙集约简和模糊综合评估的融合,显然缩小了数据处理的规模,降低了评估模型的计算复杂度,同时克服了模糊评估过度依赖专家知识(领域知识)的缺点。通过粗糙集约简和BP神经网络的融合,降低BP网络的设计复杂度,克服了神经网络训练时间长、知识解释性较差的缺点。两种融合方法都保持了较高的准确度,在动态供应链绩效评价中更为有效。
本文的研究结果弥补了目前国内外动态供应链绩效评价中智能信息处理方法的融合理论研究少、应用不够深入的缺点,对实际供应链运作与管理中基于软计算的动态绩效评价模型和方法的选择与应用具有理论指导意义。
四、结 论
软计算作为知识获取和智能信息处理的重要手段,在供应链绩效评价领域有着良好的应用前景。越来越多的学者开始集成两种或两种以上的软计算方法的智能信息融合算法来克服单一方法的局限性。本文针对之前使用的模糊综合评估、粗糙集约简及BP神经网络等软计算方法在动态供应链绩效评价中的主要特点和效果进行了简要的比较和分析,指出了每种方法的优缺点。然而,由于每种智能信息处理方法存在着本质上的差异,对这些方法间的效果差异进行严格的比较存在理论上的困难。某种智能信息处理方法可能适用于某种供应链,而另一种智能信息处理方法则可能更适用于另一种供应链。因此,在实际使用时,要根据供应链具体情况灵活选择或融合多种智能信息处理方法以取得更好的效果。
参考文献:
[1]Anna, M. R. and Etienne, E. K. A comparative study of fuzzy rough sets[J]. Fuzzy Sets and System, 2002 ,126(2): 137-155.
[2]Nagatanit, Helbingd. Stability analysis and stabilization strategies for linear supply chains.[J].Physica A., 2004, 35 (3-4): 644-660.
[3]Mohamed. Q. A-RST: a generation of rough set theory[J]. Information Science, 2000 ,124(1-4): 301-316.
[4]Roman, W. S., Larry, H. Rough sets as a front end of neuraln-etworks texture classifiers[J]. Neurocomputing, 2001, 36: 85-102.
[5]Yahia, M. E., Mahmod R. and N. Sulaiman, et al. Rough neural expert systems[J]. Expert Systems with Applications. 2002, 18: 87-99.
[6]McKee, T. E., Terje, L. Genetic programming and rough sets: a hybrid approach to bankruptcy classification[J]. European Journal of Operational Research, 2002 ,138: 436-451.
[7]Bolch G., Greine, S., H. D. Meer, etc. Queuing networks and markov chains-modeling and performance evaluation with computer science applications (2nd edition)[M]. A John Wiley & Sons, Inc., publication, 2006.
[8]Zadeh L. A. Fuzzy sets[J]. Information and Control. 1965, 8 (3): 338-353.
[9]Pawlak, Z. Rough set-theoretical aspects of reasoning about data [M]. Boston: MA: Kluwer Academic Publishers, 1991.
[10]曹庆奎,阮俊虎.基于粗糙集-未确知测度的矿井通风系统合理性评价[J].科学决策,2009.5:89-94.
[11]刘敬学,陈曦. 基于神经网络的专家预测方法研究[J].科学决策,2009,11:78-81.
[12]Bhagwat and Sharma.Management of information system in SMEs: an exploratory study. [J].International Journal of Enterprise and Network Management. 2006,1(1): 99-125.
[13]Bititici et al..Implementation of performance measurement systems:private and public sectors[J]. Editorial, Production Planning and Control. 2005,16(2):99-100.
[14]郑培,黎建强. 基于BP神经网络的供应链绩效评价方法[J].运筹与管理,2010,19(2):26-32.
[15]宋莎莎,戴锋,卫保璐.基于模糊层次分析法和聚类分析的突发事件分级研究[J].科学决策,2010,10:68-72.
[16]郑培,黎建强. 基于模糊评估和马尔可夫预测的供应链动态平衡记分卡研究 [J]. 系统工程理论与实践,2008,4(4): 57-64.
[17]郑培,黎建强. 基于粗糙集理论的供应链动态绩效评估方法研究 [J]. 运筹与管理,2008,10(5):6-11.
[18]王俊峰,刘立东.基于博弈论的闭环供应链中三方协调研究[J].科学决策,2009,(3):33-37.
Supply Chain Performance Measurement Methods based on Intelligent Information Processing
ZHENG Pei 1, WAN Wei2
(College of Business Administration, Hunan University, Changsha Hunan 410082, China)
一、3G用户细分体系架构
用户细分是3G业务开发及市场营销的基础,用户细分能够使差异化成为可能,使运营商提供的3G产品和服务能够更有针对性。3G用户细分方法的选择直接决定了相关用户细分结果的准确性及实用性。对于3G用户细分的体系搭建的思路是: 采用3 个纬度进行用户的细分,首先按照用户价值纬度进行用户细分,然后再结合消费行为纬度和消费心理纬度细分用户群。在3G用户细分的体系架构中,3个纬度的用户细分依据、方法及应用价值如表1 所示。
二、客户识别分类模型
(一)数据抽取
本案例数据来源于某电信运营公司,该数据总量为26000条。每一条对应一个客户近六个月的统计信息。其中已知分类(2G、3G)的为18000条,未知分类8000 条。其中包括客户年龄,月平均消费额,月平均通话时长等属性250 个(包括客户类型)。本例利用26000条已知分类的数据进行分类模型的建立,随机抽取训练数据10000条,测试数据8000条。
(二)数据预处理
上述采集的数据有数据多、数据取值范围广和数据取值类型多样的特点,因此必须在建模前对数据进行预处理,如采集的样本数据存在一些属性值缺省或空值,如果不做处理,将直接影响后续算法的挖掘效果,严重时甚至得到错误的结果。数据预处理包含数据清洗、属性筛选、数据平衡、数据归一化和离散化五个步骤。数据清洗分为类型转换和缺失数据填补两部分;属性筛选分为人工筛选和通过相关系数分析实现属性选择两部分;由于作为训练的18000条数据只有少数是3G用户,这样会导致模型输出结果偏向判别为2G 客户,因此必须通过数据平衡实现2、3G用户数量达到1:1;为了提高BP 神经网络的性能,需要对数据进行归一化;对于决策树算法,需要对数据进行离散化,否则生产的决策树将会过于茂盛,以至于无法分析。
三、客户数据分类识别过程
本文分别采用BP 神经网络和决策树进行建模,实现对3G 客户的分类识别。本案例运用TipDM 数据挖掘在线建模平台中的性分析进行数据探索,再运用BP 神经网络和C4.5 决策树进行客户识别。(一)模型输入。本案例中,模型数据涉及客户年龄、月平均通话时长和月平均消费额等240多个属性(包含客户类型),模型输入需将客户识别样本属性表导入建模平台中即可。(二)仿真识别过程。建模仿真过程说明如下:1.登录TipDM 平台,在方案管理页面中,新建方案或者打开一个已建方案;2.切换到数据管理页面,上传经预处理后的专家样本数据文件;3.选择相关性分析功能,导入样本数据进行相关性分析;4.分别选择BP 神经网络算法和C4.5 决策树算法,进行模型构建;5.对比BP 神经网络和C4.5 决策树的建模结果,并选择最优算法;6.用最优法对测试样本进行3G 客户识别。(三)仿真结果分析。1.基于BP 神经网络的模型构建。由于神经网络算法输出结果受到训练次数影响,并伴随一定的随机性,多次实验得到的分类正确率如下表所示。
四、总结与建议
决策树与BP神经网络对于3G客户的识别正确率都接近80%,说明本用例建立的分类模型对3G客户的敏感度比较高,基本能识别出3G用户,能达到预期目标。但是只看3G客户的识别正确率是不科学的,还要看2G 客户的识别正确率和总体识别正确率。从总体正确率看,BP 神经网络的正确率仍然比决策树高近10%,BP神经网络无论是总体性能还是对局部分类的敏感度都表现不错,而决策树分类模型性能还有待提高。
虽然本例的客户识别未能达到百分百地准确,但从另外一个角度看,一味追求正确率并没有太多意义。因为本来运营商对各个用户的类别就已经作了登记,反而,我们或许能从客户的误识别中获得更多信息。
关键词:旋转机械;故障诊断;方法
DOI:10.16640/ki.37-1222/t.2017.10.026
随着诊断技术研究的深入,可以实现故障诊断的方法越来越多,既有对前人研究成果的完善,也有一些原创性的研究成果相继被提出,根据各类方法在实现方式上的不同,可以大致将其分为三类,第一种是通过建立合适的模型进行故障诊断,这种方法在实际的生产应用中,往往由于设备结构复杂,无法构建精准的模型,即便可以获得合适的参数模型,其耗资也会相当大,所以实际应用可行性不大。第二种方法是结合人工智能技术的专家系统,在实际应用中这种方法得到了一定的肯定,但仍然存在知识获取不全面、针对性太强、智能水平低等问题,使得故障诊断结果可靠性不强。而模式识别是故障诊断中应用最为广泛的方法,且目前很多学者都认为基于模式识别的故障诊断有很大的进步空间。
1 旋转机械故障特点
旋转机械故障的故障特点与其他类型的机械故障存在一定的区别,且是机械设备中最为常用的一类,所以有必要对其进行单独的深入研究。旋转机械故障是指有转子系统的机械设备在运行过程中出现异常的工作状态,比如不正常的噪声、异常大的振动、温度急剧升高,或者其他指标不正常。旋转机械的结构复杂,故障发生具有一定的阶段性,并且部分故障的发生有一个渐进的过程,在进行故障诊断时,必须综合考虑多项因素,使得进行准确故障诊断的难度较大。
2 旋转机械故障检测方法
2.1 模式识别
经过多年的发展,模式识别己是故障检测的重要理论基础之一。近十几年来,模式识别技术在机械设备故障诊断领域的应用己经非常普遍,每年都有相关的改进方法被。在机器人模仿人类思考能力的研究领域上,模式识别方法一直占据着十分重要地位,在机械故障诊断方法中模式识别也始终是一个先进且富有挑战的探索方向。
随着计算机技术的迅速发展,各国在旋转机械故障诊断方面都取得了很大的进步,摆脱了传统依靠技术工人经验判断的主观臆断和不准确性,特别是这几年,计算机技术的发展使得各种更加完善的算法运行更为迅速,进而推进了旋转机械故障诊断的发展。
美国是最先研究机械故障诊断技术的国家之一,其诊断技术在很多方面都属于世界先进水平,目前美国从事故障诊断研究的机构主要有电子能源研究机构、西屋电气、Bently和CSI等公司。其中西屋电气是最早应用计算机网络的,该公司自己开发的汽轮机故障诊断软件可以对远程对多台机组进行诊断。而Bently公司在转子的动力系统和故障的诊断机理方面比较领先。
我国在机械故障诊断方面的研究起步相对较晚,技术也较为落后。刚开始主要以学习研究国外相关理论为主。直到80年代初期才逐渐有了自己研发的技术,在这个阶段,大型设备的出现和各项相关技术的发展也刺激了国人对旋转机械故障诊断技术的重视,也推动了该技术的自主研发。随着国家和企业对这项技术领域的投入逐渐增大,许多学者开始涉足这个领域,并对其进行大量的探索和实验,加上与国际交流合作,我国也开发出了一些在线监测与故障诊断的软件,这也很大程度上减小了与国际上相关先进技术的差距,但事实上,我国研究水平总体还是比较落后,故障诊断技术的可靠性还需要不断提升。
2.2 人工神经网络理论
1940年左右,有关应用人工神经网络的理论开始出现,经过多年的发展,它己经被引入到许多领域,比如,智能机器的控制、神经网络计算机的研发、算法的优化、应用计算机进行图像处理、模式识别、连续续语音的识别、数据的压缩、信息处理等领域,在实践应用中取得了很好的效果,作为一项新的模式识别技术和信息处理办法,人工神经网络的应用前景十分可观。
目前,使用人工神经网络进行故障诊断的方法有很多,最常用方法是:多层感知器神经网络、BP神经网络、自组织Kohonen神经网络、和径向基函数RBF(Radial Bases Function)神经网络,也有学者将人工神经网络与各种其他方法相结合的实例。在使用人工神经网络进行故障处理时,首先检查采集到的故障信息数据,剔除多余或者不合理的异常数据,再对有效数据进行归一化处理,预处理工作完成后即可将数据输入到神经网络中进行训练学习和故障识别过程。
2002年,王守觉院士分析传统模式识别方法的缺点,认为传统的BP神经网络和RBF神经网络都是假设特征空间中包括了所有的模式类别,要实现模式识别只需要找到最佳的特征空间划分方法,但事实上,任何一个特征空间中不可能包含所有的模式类别,特征空间中必然存在模式空白区域,就像人类对某些事物表现为不认识一样。认识到这一点后,王守觉院士提出了“仿生模式识别”这一概念,与传统的基于特征空间最佳划分的方法相比,仿生模式识别最为突出的特点就是,能构造封闭的、复杂的几何形体对各类样本进行覆盖,从而达到模式识别的目的。
2.3 仿生模式识别
自从仿生模式识别这一概念被提出以来,许多学者对其进行了深入研究,并将其应用到了人脸识别、车牌识别、语音识别、字体识别等领域。并取得了良的识别效果,例如:陆飞在其硕士论文中重点对仿生模式识别中的几何模型进行了深入分析,并用超香肠神经网络作为仿生模式识别的实现方法应用到了人脸识别中,取得了良好的实验结果;刘焕云等人将仿生模式识别应用到目标识别和跟踪方面,编写了自适应目标算法,与传统方法相比,跟踪识别效果有显著的提升;王守觉院士自己也对仿生模式识别算法进行了一系列的优化,先后提出了超香肠神经网络和多权值神经网络识别实现方法,并在文献中将基于仿生模式识别的多权值神经网络应用到连续语音识别中,与目前认可度最高的基于隐马尔可夫模型(HMM)的识别方法进行比较,表现出了显著的优势。
目前有许多的编程软件都加入了神经网络的功能,其中MATLAB软件最为方便实用,并且易于操作。它除了拥有对各种图形和数据进行处理的强大功能,其开发公司一一美国的MathWorks公司一一还专门在软件中开发加入了神经网络工具箱,全面包含了人工神经网络中常用的激励函数,例如线性函数(purline函数),感知器函数((sigmoid函数)以及径向基函数(radbas函数),除了这些常用传递函数,还可以自定义相关的函数。各层网络之间的映射也有严格的设定,映射函数可自行设定。鉴于以上优点,本文采用MATLAB软件编写仿生模式识别的实现程序,以及机械故障信号的特征提取和网络测试。
参考文献: