前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的矩阵论在神经网络中的应用主题范文,仅供参考,欢迎阅读并收藏。
【关键词】自组织神经网络;智能建筑管理;BP神经网络
1 基于自组织神经网络技术原理
基于大规模自组织神经网络技术[1]是在自组织神经网络技术和专家系统的基础原理运用多层数据融合弥补了单循环数据在智能建筑工程管理分析数据处理的不足和逻辑的缺陷学科.多跳自组织神经网络是智能传感器采集数据训练样本仿真学习模型即自动增速各个自组织神经元连接权阀值与感知识别隐式分布在整个网络结构体系中实现自组织神经网络模式记忆与信息处理应用.
2 基于大规模自组织神经网络在智能建筑管理中研究
2.1 基于多跳自组织神经网络在造价预测研究
基于大规模自组织BP神经模型应用40个高层智能建筑工程样本训练并用工程实例进行验证高精确性;而用大规模自组织神经网络模拟与输入层和隐含层加入了偏置自组织神经元来促进学习训练样本数据中有噪声、干扰等会造成过度学习现象,同时采用遗传优化算法进行建筑结构优化.基于BP神经在智能建筑工程估价中的应用“特征提取器”的运算大量过去的工程资料中自动提取工程特征与预算资料的规律关系数据.
2.2 基于大规模自组织神经网络在工程管理绩效评价中的应用
运用大规模自组织BP神经模型对工程管理绩效评价问题进行研究建立综合考虑工期、质量、费用、安全四大控制指标的工程管理绩效评价模型[2].实践证明,基于BP神经网络在运算工程管理绩效评估模型有利于多跳自组织神经网络预测工程工期、质量、成本、安全与绩效之间复杂的非线性关系来提高管理绩效的评价数据.
2.3 基于遗传算法模型在建设工程评标结构优化应用
基于多层神经网络的工作原理是先将输入信号传输到下一层节点运算函数处理后再将该节点的输出信息向下一层节点传输到信号传输到输出层节点为止.同时运用遗传算法模型构造及算法设计进行方案优劣排序、换位矩阵以及能量函数构造、大规模自组织神经元之间连接和输出,并用实例说明了该方法的优越性和实用性与非线性.
2.4 基于BP神经网络模型在建设工程招投标管理应用研究
基于BP神经网络多层数据融合多跳自组织神经网络技术原理分析自动预测工程招投标的招标价格和风险因素分析以及竞标单位资格审查等方面的应用指出多跳自组织神经网络具有的高度并行处理和可完成复杂输入输出的非线性映射组合结构,不仅可以保证高的中标率,且可避免招标过程中不确定性因素的影响.运用大规模自组织神经网络的工程承包招投标报价的研究,提出了一个多因素确定高层智能建筑投标报价的大规模自组织模型影响报高率的诸多因素,并确定了其权值即确定了用BP神经网络实施黑箱操作的样本输入值和目标值再通过训练样本自主调整修正输入节点和输出节点间的联系得出符合各种情况要求的权值矩阵算法.
2.5 基于智能建筑算法模型研究
基于BP神经网络是以训练样本算法即误差反向传播算法即BP神经算法的学习过程分为信息的正向传播和误差的反向传播[1],其通过训练样本前一次迭代的权值和阈值来应用神经网络技术的第一层向后计算各层大规模自组织神经元的输出和最后层向前计算各层权值和阈值对总误差的梯度进而对前面各层的权值和阈值进行修改运算反复直到神经网络样本收敛 BP神经网络输入向量为
X=( )T;隐含层输出向量为Y=( )T;输出层的输出向量为O= )T;期望输出向量为 ;输入层到隐含层之间的权值矩阵 ,其中列向量 为隐含层第j个大规模自组织神经元对应的权向量;隐含层到输入层之间的权值矩阵 ,其中列向量 为输出层第k个大规模自组织神经元对应的权向量.各层信号之间的算法结构为:
以上式中的 均为S类型函数, 的导数方程为: (5)
神经网络输出与期望输出的均方误差为: (6)
则训练样本输出层和隐含层的权值调整量分别为:
式中: 为比例系数,在模型训练中代表学习速率.如果BP自组织神经网络有 个隐含层,各隐含层节点分别记为 ,各隐含层输出分别记为 ,则各层权值调整计算公式分别如下:
输出层
综合上述预测分析在BP神经学习算法运用各层权值调整公式均由学习速率、本层输出的误差信号和本层输入数字离散信号决定在训练样本学习的过程受决策环境复杂程度和训练样本的收敛性即需要增大样本量来提高网络技术所学知识的代表性应注意在收集某个问题领域的样本时,注意样本的全面性、代表性以及提高样本的精确性,增大抗干扰噪声,还可以采用其他方法收集多层训练样本数据.
3 结束语
自组织神经网络技术应用在智能建筑管理领域是在多层智能传感器等多种信息技术飞速发展的多学科交叉研究领域得到广泛应用.
参考文献:
[1]周小佳.电力系统可靠性神经网络模型及实现研究[D].博士学位论文,1997.
[2]胡保清等.神经网络在土木工程领域的应用[J].低温智能建筑,2004(2).
作者介绍:
关键词 神经网络模型;模糊综合评价;权重;水质评价
中图分类号:X824 文献标识码:A 文章编号:1671-7597(2014)07-0147-01
目前,水污染很严重,治理好水污染,改善环境,防止造成进一步的污染,已经成为了社会所研究的重点。因此,水质的评价成为了一项重要的研究热点,根据水质的相关的指标的特点,综合分析得到水质的状况,能够为政府采取合理的措施提供依据。目前,神经网络模型对水质进行评价已经成为了热点,神经网络的优点在于权重的确定方面,能够合理的确定各个指标的权重,但是在评价的模型上[1],神经网络用的层层分析模型,没有做够好的进行水质的评价,本文在神经网络中融合模糊综合评价模型,能够很好的对水质进行评价。
1 神经网络理论
人工神经网络(AnificialNeural Nemorks,ANN)是通利用数学模型的方法进行抽象和模拟,是一种模仿人脑结构和它的功能的非线性的信息处理系统。它主要是大量的单元相互连接而组成的网络结构,来实现大脑的感知和学习功能。神经网络拓扑结构可以分为前馈多层式网络模型、反馈递归式网络模型和随机型网络模型等。根据研究水质问题多因素权重问题以及神经网络的相关理论,前馈多层式网络中的反向传播神经网络(BP神经网络)具有良好的持久性以及适时预报性,因此在本文的评价模型中,我们都采用BP神经网络的结构方式[2]。
前馈神经网络分为了神经元分层排列,包含了输入层、隐含层和输出层三个层次结构,每个层次的神经元只能够接收前一个层次的神经元,层层对应。这是一种比较强有力的学习系统,它的结构相对而言较为简单,并且编程也比较容易,是一种静态的非线性映射,通过简单的非线性处理进行复合映射,能够得到更加复杂的处理能力。这些前馈网络学习,它们分类能力和模式识别的特点都要强于一般的反馈网络。典型的前馈网络有感知器网络和BP网络。水质评价模型中,一般采用的都是BP神经网络,能够很好的处理各个指标之间的关系特点,做到很好的评价,但是需要一个更好的模型结合神经网络确定权重的特点进行水质评价,能够收到更好的效果。
2 模糊综合评价的基本理论
模糊数学是利用数学方法进行研究与处理模糊现象的数学。模糊综合评价作为一门新的评价科学,是典型数学、统计数学之后的发展起来的一门新的数学学科,可以处理很多之前数学无法解决的问题。开始具有争议,经过一段时间,开始迅速发展,而且涉及的应用领域越来越广泛,已经遍及理、工、农、医及社会科学,充分体现了评价模型的优越之处。
模糊综合评价法是一种利用模糊数学为基础的综合评标方法。综合评价法利用模糊数学隶属度理论和模糊变换原理,根据给出的评价标准与实测值,考虑到被评价事物的各个相关因素,对其进行综合评价。对于模糊综合评价向量,即综合隶属度,可用如下公式:
A为输入,代表参加评价因子的权重经归一化处理得到的一个1×n阶矩阵;R为模糊变换装置,是通过单因素评判得到的隶属度向量,是一个n×m阶的模糊关系矩阵;B为输出,代表综合评判结果,是一个1×m阶矩阵[3]。
其中评价因子是m集合为:,分别为参与评价的n个评价因子。其中评价等级共m个等级,组成集合为:。
评判矩阵和隶属度的式子为:
3 神经网络和模糊综合评价结合算法
神经网络模型评价的精华在于权重的分析确定上,模糊综合评价模型的优点在于系统的评价模型,因此在评价的时候,只要将这两者的优点结合起来,就能够得到很好的效果,因此设计了以下算法模型,能够合理的对水质进行评价,为科学的采取污染防治措施提供依据。
Step1:网络初始化。根据系统输入输出序列(X,Y)确定网络输入层节点数p、隐含输入层节点数l,输出层节点数q,初始化输入层、隐含层和输出层神经元之间的连接权值α和β(α为初始权重,β为临界值,均随机设为较小的数)给定学习速率和神经元[4][5]。
Step2:输出计算。将已有的样本数值加在网络上,利用公式算出其输出值:
Step3:调整权系数。根据网络预测误差,按已知输出数据与上面算出的输出数据之差,调整权重系数,其中调整量为:其中:因为隐节点的输出内部抑制,利用反向推算可以得到:误差值从输出层反向推导得到。
Step4:对各层的权重系数进行调整后,得到调整后的权
重为:
BP神经网络利用梯度下降算法,通过迭代运算,不断调整mij的数值,当得到的输出误差小于所设定的阀值时,将认为获得的mijBP神经网络是合理的。而不断迭代的方法相当于对各类情况进行调整,具有一定的学习记忆特征。
基金项目
国家自然科学基金青年基金(11201485);徐州工程学院校青年项目(XKY2010201)。
参考文献
[1]刘起霞,李清波,邹剑峰.环境工程地质[M].郑州:黄河水利出版社,2001.
[2]孙会君,王新华.应用人工神经网络确定评价指标的权重[J].山东科技大学学报(自然科学版),2001,20(3):84-86.
[3]万金保,李媛媛.模糊综合评价法在鄱阳湖水质评价中的应用[J].上海环境科学,2007,26(05):215-218.
[4]金菊良,魏一鸣,丁晶.基于改进层次分析法的模糊综合评价模型[J].水利学报,2004(03):65-70.
[5]郭庆春,何振芳,李力,等.BP人工神经网络模型在太湖水污染指标预测中的应用[J].南方农业学报,2011,42(10).
关键词:服务冲突;TRIZ;冲突矩阵;BP网络
服务业的快速发展和人们生活水平的提高,使得服务质量成为企业在剧烈的市场竞争中取胜的关键因素。然而,目前很多服务企业的服务质量水平还远低于人们的期望。虽然企业在努力提高其服务质量,然而由于服务质量往往是由多个属性来共同刻画,人们努力改善服务的某方面的质量属性的同时却有可能降低了其另一方面的质量属性,这种现象被称为服务冲突 [1]。例如,对于网络在线游戏,游戏提供商需每周关闭游戏服务器维护系统,而这就必须强迫玩家与服务器连接中断,在这种情况下,要想保持顾客满意度,游戏提供商就要在保证在“等待时间”不变的情况下,提高产品的“易维修性”。因此,对于服务这项无形的“产品”,它内部属性之间的矛盾也是影响服务质量提高的重大障碍。
如何解决这种服务冲突,传统的是采用妥协、折中的方式,但这些方法只能避开矛盾,并没有解决矛盾。G.S.Altshuler等提出的TRIZ的冲突解决矩阵就是专门解决产品内部矛盾的比较成熟的方法,它能够解决工程领域产品之间的大部分矛盾[2]。本文借鉴TRIZ中冲突矩阵的思路,构建了一个基于BP神经网络的服务冲突消解模型。该模型允许企业根据实际情况增加新的参数及冲突解决方案,更针对性的解决服务企业冲突问题。
一、TRIZ理论及其在服务领域的应用
(一)TRIZ理论。TRIZ是俄文发明问题解决理论的缩写。前苏联G.S. Altshuler等研究人员在分析研究世界各国250万件专利的基础上、花费1500个人年的时间提出的包括ARIZ算法、物质--场分析法、冲突矩阵、预测、效应库等系列的TRIZ方法。其中冲突矩阵是TRIZ的核心工具之一,它由39个工程参数和40个发明原理构成。矩阵的行和列分别为39个改善和恶化的工程参数,矩阵元素Xi,j为第i个改善的参数和第j个恶化的参数所构成的冲突所对应的发明原理。TRIZ冲突矩阵是个对称矩阵,即Xi,j与Xj,i相同,Xi,i为空。表1为冲突矩阵示意图。
表1 冲突解决矩阵
(二)TRIZ在服务中的应用。TRIZ用独特的冲突矩阵来分析问题。在技术领域,冲突相对而言更清晰和更易于察觉。尽管服务产品不同于实体产品,冲突却不可避免地存在着,与技术领域不同的是,服务冲突更无形、更抽象[3]。例如,“标准化和顾客定制化”、“差异化和专一化”、“概括信息和详细信息”、“安全性和透明度”等等都是服务企业常见的冲突问题。
Berry和Lampo(2000)通过对大量服务案例的分析得出结论,可以由五种典型的方式来重新设计服务。它们是:自服务、直接服务、预先服务、捆绑服务、“有形”服务。可以看出,这五种服务设计模式和TRIZ40条发明创造原理中的某些原理非常类似。如自服务,对应原理-25自服务:使一物体通过附加功能产生自己服务于自己的功能;直接服务对应原理-2分离:将一个物体的“干扰”部分分离出去;预先服务对应原理-10预操作:在操作开始前,使物体局部或全部产生所需的变化;捆绑服务对应原理-5合并:在空间上将相似的物体连接在一起,使其完成并行的操作;“有形”服务对应原理-15动态化:使一个物体在操作的每个阶段自动调整,以达到优化的性能。
二、服务冲突矩阵的构建
(一)服务参数的提取。由于服务具有主观、互动、抽象的特点,并且具有与实体产品不同的特征(无形性、异质性、顾客参与、服务生产与消费同时等),因此,对于服务领域不能用TRIZ通用的工程参数来描述冲突。这里要做的是找出适用于服务领域的类似工程参数的服务属性。关于服务属性的选取,这里作必要的说明。
首先,通过分析借鉴其他学者对相关问题的研究。Brady和Cronin(2001)等学者研究提出了服务质量的三因素模型,认为服务质量由交互质量、实体环境质量和结果质量三个维度组成。Parasuraman,Zeithaml对几类不同的服务进行研究人士影响服务质量的有:可靠性、响应性、胜任力、接近性、礼貌性、沟通性、信赖性、安全性、了解性和有形性。梁文宾(2005)[3]在前人研究的基础上整理出了旅游业的21个服务属性并把这些属性与TRIZ的工程参数进行了配适。其次,由于服务属性有行业特点,不同的服务行业,服务属性可能有所不同,各个属性的重要性也会存在差异。因此,这里只给出一个一般的参考指标,实际应用时依据行业特点再作些调整。具体的服务参数如表2所示。
表2 服务参数指标体系
注:资料整理来源于文献
(二)服务冲突矩阵的构建。根据上面的21个服务参数,建立21*21服务冲突矩阵。其中矩阵行所代表的参数是需要改善的一方,列所描述的参数为可能引起恶化的一方。在冲突矩阵中,除了主对角线外,行与列的交叉点可能构成一对冲突,表3为服务冲突矩阵示意图。
表3 服务冲突矩阵
注:服务参数与工程参数的配适参考文献[2]。
服务冲突矩阵的应用过程为:根据实际存在的冲突,在22个服务参数中,确定需要改善及防治恶化的参数,在矩阵中找到其对应得行与列。例如,对于网络在线游戏,游戏提供商需要每周关闭游戏服务器维护系统,在这种情况下,要想保持顾客满意度,游戏提供商就要保证在“等待时间X14”不变的情况下,提高产品的“易维修性X17”,即行17与列14。其解决原理为有原理1-分割、原理10-预操作、原理-25自服务。原理1的具体解决方案为把维修分成几个部分进行,对游戏分部分独立维修,这样,当我们在部分维修的时候玩家也可以继续玩。具体40条解决原理见表4。
表4 发明原理在服务中的实例
注:资料整理来源于文献
该服务冲突矩阵参数是根据TRIZ冲突矩阵中的工程参数配适出来的,对于服务“产品”可能具有而实体产品却不具有的功能参数,该矩阵就无法描述。为更加全面的解决服务冲突问题,本文把建立一个基于BP神经网络的冲突消解模型,在模型中,企业能根据自身情况添加新的输入或输出节点数也就是增加新的参数或解决原理,来解决本企业的冲突问题。
三、基于BP神经网络的服务冲突消解模型
人工神经网络是由大量处理单元广泛互连而成的网络,是对人脑信息处理功能的模拟和延伸。目前,在神经网络的实际应用中,BP网络是最成熟、应用最广的一种前馈神经网络,它主要用于函数逼近、模式识别、分类和数据压缩。其结构由一个输入层、一个或多个隐含层、一个输出层组成,各层由若干个神经元(节点)构成,每一个节点的输出值与输入值得关系由作用函数和阀值决定,神经元可以实现输入和输出之间的任意非线性映射。
(一)BP网络模型的构建。(1)网络层数的配置。根据输入和输出的要求,选择网络的隐含层是非常重要的。理论分析证明,具有单隐层的前馈网可以映射所有连续函数。因此,本文选用三层BP神经网络,即由一个输入层,一个隐含层和一个输出层组成。(2)网络输入节点数的确定。由冲突矩阵可以看出,每个冲突既包括一对工程参数,又表明参数的改善与恶化情况。若直接按冲突矩阵来设置输入节点数,则需要21*21-21=402个输入节点;若仅用21个节点,又不能确定改善与恶化的服务参数,故引入一个判断输入节点X22.当其为0时,表示Xi改善,Xj恶化(Xi、Xj均为1,且i
传递函数:隐含层中的神经元和输出层神经元均采用正切S型传递函数(tansig)。学习周期:预设为1000个。学习目标:总均方误差MSE小于误差限1e-2。学习算法:选用有弹回的BP算法。初始连接权值和阀值:利用Matlab的函数init()产生初始连接权值和阀值。Init()采用nguyen-widrow初始化算法。
(二)网络样本的设计。网络的样本来自于服务领域已解决的问题。本文选取30个冲突案例作为数据样本集,其中25个作为训练样本,5个作为测试样本。
对于每一个样本案例,首先要将问题抽象对应为冲突矩阵中某一特定的冲突,解决的方法抽象对应为40条冲突解决原理中的一条。如,解决旅行社的“行前解约”问题给旅客带来的不满,需要顾及个别差异,若顾及个别差异就可能会拖延处理问题的时间。这样,需要改善的属性是“弹性”,而需维持不受影响的属性为“服务补救能力”。最终的解决方案是先将团员们分成独立个体,再派专人单独与旅客们针对其需要迅速解决问题,采用的原则是分割。按表5的过程就得到了一组学习样本。
表5 获取学习样本
(三)运行结果及分析。神经网络学习过程误差曲线如图1所示。从图中可以看出,网络训练到617步时训练误差达到期望误差,收敛效果良好。因此,网络选择的隐含层节点数,学习函数等网络参数比较适合。
图1 神经网络学习过程误差曲线
依据学习好的网络,只要将实际问题依据表5抽象化以后输入到网络中,就能得到相应的冲突解决原理。表6为测试样本的实际输出与理论输出的对照表,从表中可以看出样本的实际输出与理论输出很接近,误差很小,验证了该网络的可行性。
表6 测试样本输出对照表
结论:本文从服务“产品”内部矛盾影响服务质量的角度,借鉴TRIZ冲突矩阵的思路,在构建服务冲突矩阵的基础上,建立了基于BP神经网络的服务冲突消解模型。该模型不仅能解决原有的服务冲突问题,还允许企业添加新的参数和解决方案,增加新的实例,建立适合自己的网络冲突模型。然而,由于BP神经网络自身的局限,使得该模型在实际应用中也存在一些问题。例如,网络的稳定性和可塑性较差,当它遇到一个新模式时,会将已有的权值和阀值打乱,导致学习好的模式信息丢失。另外,隐含层的神经元个数设置多少合适,少量的学习样本结果是否具有一般性应用等问题,还需进一步研究。
参考文献:
关键词:甘蔗叶片;光谱反射率;叶绿素含量;PCA算法;BP神经网络
中图分类号:O657.3; TP722.4文献标识码:ADOI:10.3969/j.issn.10036199.2017.01.008
1引言
甘蔗是广西地区最重要的经济作物,新台糖22号甘蔗是广西蔗区种植面积最广的品种。但是与发达地区相比,广西的甘蔗生产水平相对较低,生产成本偏高,产品的国际竞争力不强。了解甘蔗的生长状况,建立与作物长势有关的作物生化指数(这里指的是叶绿素含量)的预测模型是精细农业研究的重要内容。叶片叶绿素含量植物的状态,而光谱为无损估算叶片叶绿素含量提供了[1-4]。
Gitelson等[5]通过对不同作物的冠层反射光谱进行研究,发现在波长550 nm和700 nm附近的光谱与叶绿素的含量相关性显著;Hansena and Schjoerring[6]通过比较预先假设的NDVI的两个长波段的预测模型,采用偏最小二乘法选择相关性最高的波段组合,结果发现用于估算叶片叶绿素含量的模型准确度高;赵春江、张金恒等[7-8]研究认为利用红边波段的反射光谱可以估算叶片叶绿素含量。
BP(Back Propagation)神经网络通常是指基于误差反向传播算法的多层前向神经网络。目前BP神经网络已成为近红外光谱定量分析中应用最广的非线性多元校正方法。刘建学等[9-12]基于BP神经网络建立了大米淀粉含量的预测模型;王艳斌[7]等针对不同馏程柴油的近红外光谱进行校正,认为人工神经网络具有较好的准确性和抗干扰性;张钦礼等[13]针对矿岩可爆性进行预测分析,建立了基于主成分析(Principal Component Analysis,PCA)和BP组合的矿岩可爆性分级评价模型,预测值与期望值之间的相对误差控制在6%以内;陈建宏等[14]建立了基于PCA和BP相结合的采矿方法优选模型了数据处理速度较慢的缺陷。王栋等[15]研究发现基于灰色关联和BP神经网络的汽车保有量预测模型具有较高的精度,最大相对误差为2.2%,平均相对误差为1.5%。
人工神经网络方法具有很强的非线性逼近能力,已经在近红外分析中得到广泛的应用。针对甘蔗作物光谱特性进行研究的文献少,研究基于PCA和BP神经网络算法,建立了甘蔗叶片叶绿素含量的预测模型。
2实验数据获取
该实验是在2015年5月26日,在广西大学农学院试验田进行。甘蔗品种选择新台糖22号(ROC22)。采用“3414”施肥方案,肥料选择尿素(N)、氯化钾(K)和钙镁磷肥(P)。此次试验是在每个小区,共42个样本。实验使用的是岛津紫外可见分光光度计UV-2600,其测量的测波长范围是220-1400 nm,分辨率为0.1 nm。可用于测量甘蔗叶片的反射光谱和叶绿素含量
a和Cb分别为叶绿素a、b的浓度,叶绿素浓度。A645与A663分别为645 nm与663 nm波长下的萃取液吸光度。3基于PCA和BP神经网络的叶绿素含量预测模型设计
本实验利用甘蔗叶片在可见光-近红外区域的反射率数据作为该模型的输入,光谱矩阵X,叶绿素的含量值作为其输出。本研究主要基于BP算法的思想建立预测叶绿素含量的模型。但是直接将光谱矩阵X作为神经元的输入,导致BP网的规模比较大,训练也较为复杂。我们首先利用PCA消除光谱数据之间的多重共线性,对原始光谱矩阵进行降维处理,提取出主成分。进一步确定最终主成分的数目,并将这些主成分作为BP网的输入。另外,根据BP神经网络理论,编写BP算法的程序,建立叶绿素含量的预测模型。
3.1PCA算法和BP神经网络算法的原理
PCA是对多变量数据进行统计处理的一种数据线性投影方法,它在尽可能保留原有信息的基础上将高维空间中的样本映射到较低维的主成分空间中。其基本思路是以一种最优的方法把相互相关的一组数据,通过正交变换使其变为一组相互无关的变量,以达到简化光谱矩阵,降低维数的目的。对于一个具有n个样本p个波长点光谱矩阵
以上测试结果表明:在一定的误差范围内,利用经过改进的BP神经网络模型能较好预测叶绿素含量。这主要是因为前5个主成分几乎原始光谱信息另外BP神经网络自身的结构特点也决定了其具有较好的预测能力。
4结语
本论文主要研究了处于分蘖初期的甘蔗叶片在可见-近红外波段的光谱特性对其叶绿素含量的预测能力。首先对光谱范围为400 nm~1000 nm的甘蔗叶片反射率进行了主成分分析,以尽可能地减少冗余信息;接下来,采用前5个主成分作为BP神经网络的输入,建立了叶绿素的预测模型。研究发现,采用PCA及BP神经网络算法相结合的方法建立的预测模型具有较强的预测能力(R2=0.8929,pvalue=0.0016)。但是,利用全波段的光谱信息来作为预测模型的输入,数据量较大,数据获取成本较高,增加了模型的复杂性及应用成本,不利于后期推广。另外,由于研究中用到的样本数据较少,该模型仍存在一定的不稳定因素,后期可通过增加训练样本数量集,进一步增加模型的鲁棒性。
参考文献
[1]THENKABAIL P S, SMITH R B, DE PAUW E. Hyperspectral vegetation indices and their relationships with agricultural crop characteristics[J]. Remote Sensing of Environment, 2001,71:158-182.
[2]FILELLA I, SERRANO I, SERRA J,et al.Evaluating wheat nitrogen status with canopy relfectance indices and discriminant analysis[J]. Crop Sci,1995,35:1400-1405.
[3]RICHARDSON A D, DUIGAN S P, BERLYN G P. An evaluation of noninvasive methods to estimate foliar chlorophyll content[J]. New Phytol,2002,153:185-194.
[4]李修华, 陈晓, 周永华,等. 不同施肥情况下甘蔗叶片光谱特性分析及其叶绿素含量预测[J].农业工程学报,2015,31:118-123.
[5]GITELSON A A, MERZLYAK M N J. PhotochemPhotobiol, Quantitative estimation of chlorophyll a using reflectance spectra: Experiments with autumn chestnut and maple leaves. J Photochem Photobiol,1994a,(B) 22:247-252.
[6]HANSENA P M.,SCHJOERRING J K. Reflectance measurement of canopy biomass and nitrogen status in wheat crops using normalized difference vegetation indices and partial least squares regression[J].Remote Sensing of Environment,2003,86: 542-553.
[7]赵春江,黄文江,王纪华,等.不同品种和肥水条件下冬小麦光谱红边参数研究[A]. 成像光谱技术与应用研讨会论文集[C]. 2002,69-73.
[8]张金恒,王珂,王人潮. 高光谱评价植被叶绿素含量的研究进展[J].上海交通大学学报, 2003, 21(4): 349-360.
[9]RIAR A. In: Bhullar GS, Bhullar NKA (eds) Agricultural Sustainability Progress and Prospects in Crop Research[J], 1st edn. Jamestown Road, London. 2013.
[10]CRAMARIUC R,NISIPARU L,TANASE G.Test for the electrostatic crop spraying as a method of treatment with vctra low volume,the modern problems of electrostatics with applications in environment protection[J].NATO ASI Seriea,1998,118:33-38,379-392.
[11]O红,李民赞,周志艳,等.玉米生长期叶片叶绿素含量检测研究.光谱学与光谱分析,2010,4: 1080-1083.
[12]APARICIO N,VILLEGAS D,CASADESUS J,et al.Spectral vegetation indices as non-destructive Curran PJ[J], Agronomy Journal,2000,92: 83-91.
[13]张钦礼,刘伟军,杨伟,等. 基于PCA和改进BP组合预测模型的矿岩可爆性研究[J]. 爆破, 2016,33(1):19-30.
[14]陈建宏, 刘浪, 周智勇, 等. 基于主成分分析与神经网络的采矿方法优选[J]. 中南大学学报:自然科学版,2010,41(5):1967-1974.
[15]王栋,邓北川. 山区高速公路直线段车速预测方法[J]. 交通科学与工程,2014,30(2):81-86.
关键词:电力系统;人工智能;模糊控制;神经网络
引言
伴随着社会的不断进步,用户对电能的要求也在不断提高:安全、可靠、优质、环保。电力系统在实际工作中也确实存在一些技术难题:首先,电力系统是一种复杂大系统,系统参数包含着诸多的不确定因素,并且具有很强的非线性;其次,电力系统应当具有较强的鲁棒性能,以克服系统中的扰动,而且系统对多目标寻优的控制方法要求也较高;最后,复杂系统是由多个子系统相互影响、关联组成,电力系统需要将多个局部的控制系统相互连接,综合控制。因此,这一系列尖端的技术难题需要应用更为先进的自动化控制技术即智能控制技术。
1智能控制技术
控制理论的不断发展,为人类带来了更加先进的自动化技术,使得人们设计的控制系统稳定、可靠、智能、高效。典型的智能控制技术包括:模糊控制、人工神经网络、专家系统、遗传算法等。
1.1模糊控制。模糊控制是基于模糊数学理论的一种控制方法。传统的控制理论能够解决模型明朗、确定的系统的控制问题。但当面对类似于电力系统的复杂、模型不确定、因素多的大系统传统的控制方法就无法高效地解决控制问题。为了克服上述问题,科研人员提出了用模糊数学的理论来解决一些复杂系统的控制问题。模糊控制是一种非线性的控制理论。它采用的是理论与实际相结合的方法解决实际的问题。一般模糊控制技术包含如下几个部分:定义变量、模糊化、知识库、逻辑判断及反模糊化。而其中的逻辑判断部分运用模糊逻辑、模糊推论方法进行分析,得到最优的模糊控制输出。
1.2人工神经网络。人工神经网络(ArtificialNeuralNetworks,简写为ANNs)也简称为神经网络(NNs),此类数学模型模仿动物神经网络的组成,进行分布式信息处理。通过调整系统内部的各个节点之间的联系,最终达到控制系统的目的。强鲁棒性、非线性特性、自组织自学习的能力和并行处理能力是人工神经网络基本特性,受到了人们的普遍关注。人工神经网络在工作前先对控制准则学习,减少系统工作过程中发生错误动作的概率。控制的准确性可以经过学习之后逐渐完善,提高系统正确动作的权值。
1.3专家系统。专家系统实际上是一个包含着某个专业领域内的大量人类专家知识的一种智能计算机程序系统。该系统通过程序模拟人类专家应用其丰富的知识经验进行分析、解决问题的过程,最终解决复杂的控制系统的问题。专家系统中的知识库是反映系统性能的主要部分,系统在解决问题时是通过模拟专家的思维来实现的。用户在使用过程中可以通过不断完善专家库来提高专家系统的性能。专家系统通过反复比对系统的输入信息,与专家系统中的知识库的规则进行匹配,最终找到能使数据库的内容与实际的目标的规则。在改善动态品质和提高远距离输电线路能力的问题上,卢强等人提出了利用最优励磁控制手段,研究成果指出:利用最优励磁控制方式,可以使大型机组取代古典励磁方式。
2智能控制技术在电力系统的应用
2.1模糊控制技术在继电保护领域的应用。电力系统中的继电保护装置具有这重要的意义,继电保护装置的可靠工作能使电力系统稳定、可靠、安全的运行。对继电保护装置的故障识别与诊断越来越严苛,电力系统中庞大复杂的故障现象,普通的识别系统无法准确及时地解决问题。因此,采用先进的人工智能技术进行电力系统的继电保护装置的故障识别与诊断的工作更加迫切。应用模糊控制技术监视电力系统中变压器的工作状态,根据变压器的参数的变化,结合已知的输入输出,利用模糊控制技术进行变压器的故障诊断。利用最小二乘法的原理将变压器的一些参数,例如电介质的损耗、泄漏电流、绝缘电阻、变压器的吸收比等参数作为模糊控制的输入。将这些输入参数通过一定的规则进行量化,作为模糊输入的矩阵,再将变压器的状态分为合格、不合格、故障等按照规则量化得到输出的模糊矩阵。参考其他一些实际经验中的数据作为扩展出来的输入输出矩阵,应用最小二乘法的迭代运算得到输入与输出的关系矩阵。应用得出的输入输出的关系矩阵就可以对一些变压器的试验信息进行分析,诊断。
2.2神经网络在电力系统故障诊断中的应用。在电力系统故障诊断的过程中,神经网络将系统的故障报警信息作为神经网络的输入量。神经网络的输出是电力系统故障诊断的结论。应先让神经网络进行学习,对其输入特定的故障报警,建立一个全面的故障报警样本库。通过样本库不断对神经网络系统进行训练,使得系统对不同的故障报警输入产生相应的权重,最终能够输出准确的故障诊断的结果。神经网络故障诊断技术不仅可以应用在电网的故障诊断方面,还可以用于电力设备的故障诊断、电力系统中的变压器的故障诊断等。神经网络的算法多种多样较为常用的有BP神经网络算法,迭代步长算法,以及变步长法等。在辐射型配电系统中采用BP神经网络,用ANN模拟各个地区不同电弧电阻下的故障情况,测量阻抗量应用BP神经网络判断电力系统出现的问题。该方法能够有效解决由于电弧引起的测量阻抗不准确,导致保护系统不能正常工作的问题。专家系统在电力变压器其的故障诊断的应用电力系统中已经有多个部分在控制过程中建立出了数学模型,但是依然存在一些复杂的、规律性不明显的系统无法抽象出具体的数学模型。这就需要专家系统解决相应的问题。专家控制系统在电力系统中多用于分辨系统的故障报警的状态,进行分析,提出故障的应急解决方案以及系统的恢复控制方案。专家系统中的知识库用于提供解决问题的知识,应用推理机使用该专家的知识库。知识库可以根据变压器的不同故障分为多个子系统,例如油位、负荷、温度等。推理机调用程序根据当前的状态,按照规定的规则调用系统的特定知识。推理机调用知识库中的数据时可以采用正向推理、反向推理、混合推理。经过反复的匹配直到找出故障的原因,故障原因可能是多个,将找出的多个原因组合为一个相互关联的矩阵。最终实现了经过专家系统做出的故障诊断分析。
3总结
人工智能技术是一项新颖先进的技术。在电力系统中应用人工智能技术是电力自动化发展的必然趋势。针对类似于电力系统的具有非线性、多参数、不确定因素多的复杂大系统,人工智能技术拥有更加优越的控制性能。模糊控制、神经网络、专家系统等控制理论已经渐渐的成熟,在生产生活的多个方面已经有了越来越多的应用。经过人工智能技术的不断完善,电力系统自动化的不断深入,人工智能对电力系统的控制会使电力系统运行更稳定、更经济,鲁棒性能更优越。
参考文献
[1]朱亮亮,王艳.基于人工智能的电力系统自动化控制[J].科技致富向导,2014,09:300.
[2]丘智蔚.基于人工智能的方法对智能电网进行安全改进[D].华南理工大学,2014.
[3]冯宗英.配电网状态估计及量测系统的鲁棒性配置研究[D].山东大学,2014.
【关键词】BP人工神经网络;车间调度;模拟退火算法;SA\LM混合算法
0 引言
车间调度指标工时达成率是评价车间调度优异程度的重要指标,它直接体现出车间设备的利用率、工人效率、库存大小,同时工时达成率的影响因素很多,如原料到位情况、设备健康状况、人员到岗状况、批次大小、加班情景等。车间调度问题是满足任务条件和约束要求的资源分配问题,是最困难的组合优化问题,解决车调度问题首先要建立准确的车间生产模型,模型的优异程度由预测输出指标的准确性决定,BP人工神经网络是建立预测模型寻求最优值的有效工具。
国内外学者对人工神经网络在调度问题及建立预测模型有相关研究。A.Azadeh、M.Jeihoonian等采用集成神经网络研究了双标准双级装配流水作业调度问题[1];Azadeh提出了采用复杂人工神经网络和模糊优化算法优化仿真模型来解决流水生产车间的调度问题[2];Golmohammadi, Davood等人采用神经网络模型开发的智能系统,研究表明零部件的批次大小比原材料的到位时间及延时时间对调度结果更有影响[3];A.Azadeh, A. Negahban采用混合人工神经网络仿真并优化随机生产的调度问题[4];Braglia 和 Grassi提出了最小化车间平均工时并最大限度延迟的车间调度混合模型,他们采用NawazCEnscoreCHam和多目标遗传局部搜索算法来解决问题[5];祝翠玲、蒋志方等基于BP神经网络建立空气质量预测模型,将空气污染源的数据输入到该模型中,可以准确预测出污染物的检测值[6];陈廉清,郭建亮等提出了基于BP神经网络和遗传算法构建表面粗糙度预测模型的开放式试验系统,该系统提高了外圆磨削产品表面粗糙度预测模型的收敛速度和预测精度[7];崔吉峰、乞建勋等提出了采用粒子群算法改进BP神经网络算法,建立了对能源需求的预测模型,作者首先利用灰色预测方法和自回归移动平均模型建立初步预测结果,再将该结果作为BP神经网络的输入,在此基础上进行训练和预测,将预测精度提高了5%左右[8];张喜忠作了基于神经网络预测模型的发动机异响信号提取的研究,丰富了发动机异响信号提取的新方法,拓宽了发动机故障诊断的应用范围[9];王德明、王莉提出了遗传算法和BP神经网络相结合的风场短期风速预测模型,该模型具有预测精度高、收敛速度快的优点[10];陈耀武、汪乐宇等提出了基于神经网络、模糊聚类分析和模式识别理论,建立组合式神经网络的短期电力负载预测模型,该模型能够准确预测普通工作日及节假日的电力负载[11]。
神经网络BP学习算法具有逼近非线性连续映射的能力,广泛应用与非线性系统的建模及控制领域。但是BP神经网络存在一些缺点,主要是收敛速度慢,往往收敛于局部极小值,数值稳定性差,学习率、动量项系数和初始权值等参数难以调整。本文提出采用LM和SA混合算法,弥补了神经网络的缺点,并通过调整神经网络数量,最终得到较准确的车间生产工时达成率预测模型。
1 研究方法及理论
1.1 人工神经网络研究方法
人工神经网络可以处理多元空间信息,成为模式识别、系统辨别、预测等功能的有力工具。人工神经网络的最主要的优点是不需要在训练之前明确定义近似函数。BP神经网络是最常用的神经网络,因为BP神经网络可以基于输入参数及输出参数计算出近似的仿真模型。基于人工神经网络的特性,它被广泛应用于寻找问题最优解。图1所示为BP人工神经网络解决问题的一般流程:
1)收集分析数据:收集大量数据,分析数据自身的相关性,找出主要参数作为输入。剔除数据中的奇异的,并将数据归一化用于训练神经网络。
2)选择网络类型与结构:根据问题的特点,选择神经网络为网络类型,并确定网络层数、每层节点数、初始权值、学习算法。其中隐含层的节点数选择比较麻烦,一般原则是在保证正确反应输入输出之间关系的基础上尽量少选隐含层节点数。
3)训练与验证:采用真实数据反复训练并验证神经网络直至得到合适的映射效果。在训练时初始权重可以随机产生,并且可取多组神经网络同时进行,通过取平均值来提高神经网络模型的准确性,该方法可以克服初始数据不充足的缺点。
4)对新数据实施预测,输出预测值。
1.2 SA\LM混合算法原理
人工神经网络中LM算法结合了高斯-牛顿法和最小梯度法的优点,包含了高斯-牛顿法的局部收敛性和梯度下降法的全局特性,它通过自适应调整阻尼因子达到局部收敛性,并且其迭代收敛速度高,可以补偿BP网络收敛速度慢的缺点[12],使其在很多非线性问题中得到稳定可靠解。但是初始值对LM算法的计算工程中具有很大的影响,若选取的初始值靠近真实值,在得到全局最优解的情景下减少运算时间,假设初始值的质量较差,优化结果会偏离全局最优解而得到局部最优解。通过两种方法可以解决该问题,一是采用尽量多的原始数据训练神经网络,使其具有较准确的预测能力,二是选择合理的优化算法与LM形成混合算法,消除其对初始值的高依赖性[13]。该研究对象为典型的离散生产型车间,无法获得所有的历史数据,第二种方式较合适。退火(SA)算法能够在算法执行过程中,基于较差初始函数值得到近似的最佳解决方案,这使得SA算法拥有在峰谷之间搜索找到全最小点的能力,无疑是最佳优化算法之一[14]。如图2所示为LM和SA混合算法在神经网络模型中的应用模式,首先基于有限的原始数据,采用SA算法训练神经网络预测模型,得到初始预测模型,将该模型中神经网络各层的权重矩阵及阀值作为LM算法的初始化参数,再次训练得到更优秀的神经网络预测模型。该混合算法能够捕捉并模拟车间排产员的经验知识和生产流程记录来形成制造过程中的系统知识,最终得到较优秀的车间调度模型。
2 人工神经网络结构
在50台加工系统组成的机加工车间中,有加工工人N人(工人充裕且有熟练度区分,其中有工序对应唯一工人),需要完成14个待加工零部件,每个工件都包含若干道工序,且工序流程一定。50台加工系统中包含车床组、铣床组、刨床组、钳床组、磨床组、焊接组,各组设备的加工能力一致, 以每个月该车间的工时达成率作为关键指标,工时达成率以实际完成工时与额定工时的比值为计算方式。车间调度员通过最佳的调度,并为各工序选配最佳资源,在满足设备加工能力及人员匹配的情况下获得最佳的工时达成率。
该调度问题有如下初始约束条件:1)任何设备无法同时加工超过两个工序;2)任意工件无法同时在多台设备上加工;3)工件必须严格按照工艺路线在指定机器上加工;4)除特定工序指定工人外忽略工人的熟练程度;5)工件的安装及拆卸时间已经包含在该工序的加工工时中;6)一般情况下有设备就有工人,除特殊情况工人处于充足状态;7)每个订单的14种原材料到位时间随机,遵循板材、管材、棒材的到位顺序。
根据该车间调度问题的特点,定义人工神经网络的结构。神经网络的输入参数为各零件的加工对象、可用设备、设备数量、分批大小、延迟值、工时、前置工序耗时、后置工序耗时等210个参数,输出参数既目标函数为工时达成率。根据输入、输出参数的量确定采用两层神经网络结构,既一层隐含层一层输出层,并且隐含层包含10个节点,可保证获得全局最优的情况下避免出现过计算。图3所示为人工神经网络的总体结构,经过多次试验验证,该神经网络中核心参数如下:
网络层阈值参数biasConnect= [1;1],隐含层与输出层均有阈值;
输入层关系参数inputConnect = [1;0],输入层与隐含层有权值连接,与输出层无关系;
网络层关系参数layerConnect = [0 0;1 0],隐含层与输出层神经元相连;
输出层关系参数outputConnect = [0 1],输出层的神经元产生网络输出;
网络传递函数layers{1}.transferFcn= 'tansig',隐含层与输出层的传递函数;
隐含层初始函数layers{1}.initFcn = 'initnw',隐含层初始化函数;
训练算法参数trainFcn = 'trainlm',LM基础算法;
网络初始化函数initFcn = 'initlay',网络初始化函数;
神经网络数量参数networks=20、50、100。
3 预测结果及分析
54套历史数据作为训练验证样本并不能完全覆盖所有情景,本研究提出采用多神经网络并行计算求平均值的方法提高模型准确性。为了得到最准确的预测模型,神经网络数量和训练算法是本研究中优化对象。神经网络的训练算法主要以LM算法和SA\LM混合算法为研究对象,神经网络数量以20、50、100为研究对象。取54套样本中的51套为训练验证样本,3套为预测模型的测试数据,通过对比工时达成率预测值与真实值的均方差来判断神经网络模型的优异程度。训练数据中每套数据的210个参数生成51*210的矩阵,它们形象地表现出每个调度的输入与输出,这些矩阵将成为LM算法和SA\LM混合算法神经网络的输入参数,经过计算生成各自的神经网络预测模型,最后用3套调度方案去测试准确性,表1中显示了神经网络数为20、50、100的LM算法和SA\LM混合算法神经网络预测模型的测试结果。
从表1中清晰地显示了两种算法及三种不同神经网络数预测模型的预测误差,神经网络数量从20-50-100的梯度选择中预测模型的准确性误差呈8.46%-8.28%-6.87%的下降趋势,经过试验确定在该项目中采用100个神经网络数,该方法有效缓解了初始数据不充足的缺陷。图4中显示LM算法和LM\SA混合算法预测误差对比,其中LM算法预测误差均值为8.92%,LM\SA混合算法将该误差缩小到6.82%,证明混合算法能够通过改善LM单一算法中初始权重值及阀值,最终得到更优异的预测模型。
4 结论及展望
采用BP人工神经网络能够建立较准确的生产车间调度模型,并且使用SA算法建立人工神经网络的初始权重矩阵及初始阀值,再以LM算法进行优化的混合算法是建立车间调度模型的最佳算法;对于初始数据不充足的问题,可采用多神经网络并行计算求平均值的方法来提高模型准确性。得到较优秀的车间调度模型后,通过优化延迟值、批次大小、设备数量等输入参数可获得全局最优的工时达成率,最终输出离散车间效率最高的调度方案,这是今后的研究重点。
【参考文献】
[1]A.Azadeh, M. Jeihoonian, B. Maleki Shoja, S.h. Seyedmahmoudi. “An Integrated Neural NetworkCsimulation Algorithm for Performance Optimisation of the Bi-criteria Two-stage Assembly Flow-shop Scheduling Problem with Stochastic Activities.” International Journal of Production Research 50.24(2012): 7271-7284[Z].
[2]Azadeh, Ali, Mohsen Moghaddam, Pegah Geranmayeh, Arash Naghavi. “A Flexible Artificial Neural NetworkCfuzzy Simulation Algorithm for Scheduling a Flow Shop with Multiple Processors.”The International Journal of Advanced Manufacturing Technology 50.5-8(2010): 699-715[Z].
[3]Golmohammadi, Davood. “A Neural Network Decision-making Model for Job-shop Scheduling.” International Journal of Production Research,51,17(2013): 5142-5157[Z].
[4]A.Azadeh, A. Negahban, M. Moghaddam. “A Hybrid Computer Simulation-artificial Neural Network Algorithm for Optimisation of Dispatching Rule Selection in Stochastic Job Shop Scheduling Problems.” International Journal of Production Research, 50, 2 (2011): 551-566[Z].
[5]Braglia, M. and Grassi, A., 2009. A new heuristic for the flowshop scheduling problem to minimize makespan and maximum tardiness. International Journal of Production Research, 47(1): 273-288[Z].
[6]祝翠玲,蒋志方,王强.基于B-P神经网络的环境空气质量预测模型[J]《计算机工程与应用,2007,22(43):223-227.
[7]陈廉清,郭建亮,杨勋,迟军,赵霞.基于进化神经网络的磨削粗糙度预测模型[J].计算机集成制造系统,2013,11(19):2855-2863.
[8]崔吉峰,乞建勋,杨尚东.基于粒子群改进BP神经网络的组合预测模型及其应用[J].中南大学学报,2009,1(40):190-194.
[9]张喜忠.基于神经网络预测模型的发动机异响信号提取研究[D].长春:吉林大学,2008.
[10]王德明,王莉,张广明.基于遗传BP神经网络的短期风速预测模型[J].浙江大学学报,2012,5(46):837-841.
[11]陈耀武,汪乐宇,龙洪玉.基于组合式神经网络的短期电力负荷预测模型[J].中国电机工程学报,2001,4(21):79-82.
[12]裴浩东.基于神经网络的稳态优化和控制研究[D].杭州:浙江大学,2001.
1机器人的键合图模型
研究对象是CyCab,该机器人是一个四轮驱动的双转向系统小车,重约350kg,可以达到最高5m/s的速度。本文的建模及参数辨识算法研究主要针对机器人的转向系统,如图1所示。转向系统由运动控制器、直流电机、减速器、皮带、油泵、油缸活塞和车轮构成。运动控制器驱动直流电机,带动减速器将能量通过皮带传送到油泵,油泵推动油缸活塞控制车轮转向。车轮的旋转角速度可以用电机上的编码器测量,增量式编码器装在减速器的末端转向系统中的电机、皮带和油泵传动机构键合图模型[6]如图2所示。系统由输入电压控制,图中TF是变换器,表征系统能量传递中势变量对势变量、流变量对流变量的变换关系;GY是回转器,表征能量传递中势变量与流变量之间的变换关系。k1是电机中流过的电流的系数,k2是电机转矩系数,k3是减速器系数,k4是皮带系数。电机内的摩擦力由两部分组成,R2V是粘性摩擦力,R2C表示库伦摩擦力;油泵的内摩擦力是R3C和R3V。R1是电阻,J1和J分别是电机和油泵的转动惯量,电机的电感忽式中:e5为回转器k2的流变量;e6为惯性元件J1的流变量;e7为电机内摩擦力R1的势变量;e8为变换器k3的势变量。
2参数辨识
2.1最小二乘法本文设计的模型可以表示为最小二乘法的思想就是寻找一个θ的估计值θ^,使得实际测量的Yi与由估计θ^确定的Y^i=Xiθ^之差的平方和最小。经典的递推最小二乘法为
2.2基于神经网络的参数辨识传统BP神经网络做参数辨识,存在初始权值难以合适选择、收敛速度慢、训练算法易陷入局部极小值等缺点。本文将最小二乘法辨识得到的参数值作为BP网络的初始权值,在网络训练上采用权值变速训练的方法,网络结构如图3所示。网络的权值矩阵分为两部分:辨识权值矩阵W,非辨识权值矩阵U和V。BP网络的权值调整可使网络输出不断地接近样本输出,为了加快网络收敛,使用最小二乘法辨识出的数据作为W的初值。在训练网络时,当系统的输出误差较大时,网络加大非辨识权值矩阵的调整力度,减小辨识权值矩阵的调整;当系统输出误差变小时,则加大对辨识权值矩阵调整。为了实现权值调整力度随着实时变化,引入权重因子μ,取sigmoid函数这样,在误差E很大的情况下,U、V调整量的权重因子会变得很大,W调整量的权重因子会变得很小,这时网络会主要调整U、V权值;相应地,在误差E很小的情况下,网络会主要调整W权值。适当的调整参数h可以改变权重调整的倾向。由以上理论可得到BP网络参数辨识具体步骤为:1)将所有的非辨识参数权值取随机数,利用公式(7)得到的最小二乘法辨识值赋给辨识参数矩阵;2)用实际系统的输入输出数据构成一个训练样本集,进行数据的归一化处理,将样本的数据输入到神经网络中,得到网络输出Y^;3)根据公式(9)计算误差E,由公式(10)计算权重因子,进而根据公式(11)对所有权值进行调整;4)返回执行3),当输出误差到达系统要求或训练次数大于指定值时,终止训练;5)将训练好的辨识参数权值转化为系统待辨识参数。
3实验结果
采集机器人正常工作时转向系统的角速度θ•1值、系统的输入电压vin值和加速度θ••1值,剔除野值,数据归一化后得到一组样本数据。从数据手册可查到k1=2.5V/A,k2=0.031527N•m/A,k3=4/70,则需要辨识的参数为J1,R2V和R2C。将系统的模型公式(6)变换为最小二乘法模型的标准形式,利用递推最小二乘法得到进而得到[R2V,R2C,J1]T的最小二乘法辨识值,将其作为神经网络训练的初值,角速度θ•1、电压vin和加速度θ••1作为系统的输入输出,利用第2.2节中的方法对[R2V,R2C,J1]T再次进行辨识。实验进行到14s左右,模型的辨识参数值趋于稳定,神经网络对[R2V,R2C,J1]T的辨识结果如图4所示,由最小二乘法和神经网络的辨识结果如表1所示。为了验证算法的有效性,将两种辨识方法得到的参数值代入模型方程中,得到角速度θ•1的两种估计值。两种算法得到的θ•1和传感器采集到的θ•1真实值的之间的比较结果如图5所示。
关键词:系统辨识 BP算法 线性网络 局部式反传网络 灵敏度
中图分类号:O241 文献标识码:A 文章编号:1007-3973(2012)012-089-03
1 引言
BP(Back-Propagation)神经网络是一种反向传播学习的非线性网络,以其具有自学习和自适应能力、泛化能力和优良的非线性映射能力,受到众多领域学者的关注。为了提高BP算法收敛速度,大量学者开展了有效的研究。文献[1]采用变步长的方法提高学习速率,而文献[2]通过加入动量项提高收敛速度。文献[3]提出的自适应调节学习率和动态调整S型激励函数相结合的改进BP算法也是一种有效地提高训练速度的方法之一。
考虑到BP神经网络结构的初始值不确定和不能灵活调整各层权值的缺点,本文在BP神经网络的基础上将线性网络和局部式反传网络结合给出一种混合式改进BP神经网络结构。
2 改进BP神经网络结构
2.1神经网络灵敏度定义
神经网络灵敏度是指神经网络系统辨识的过程中对各种信号的变化和扰动的调整能力。对第i 个样本,神经网络辨识器的灵敏度定义为:
其中:MSE为方差,|E|为网络输入、权值变化及被辨识系统变化引起的综合误差。yim是由信号的各种变化及扰动引起的网络输出变化。
2.2混合式BP神经网络分析
神经网络辨识的优劣很大程度上取决于网络初始值是否正好在理想值附近,由于标准的BP算法和前人的改进算法都是随机初始化BP神经网络的权值,这就使得神经网络建模初值不确定性增加,学习和训练的实时性下降。由于线性网络的训练不需要求激励函数的导数,全是线性运算,因此训练速度很快,又加上其能在理想值附近建模,使得BP神经网络的训练负担大大减轻,从而缩短了整个辨识网络的辨识时间。
传统BP神经网络是一种全反传式的前向网络,只要有误差反传信号,整个网络所有层的权值都会修改,会造成学习时间延长,并且当误差较小时,容易出现权值修改过量,影响精度。在关于神经网络灵敏度的研究中得知,神经网络隐含层与输出层的权值矩阵 的元素值的大小对网络输出影响大于输入层与隐含层之间的权值矩阵 以及各隐含层之间权值矩阵 。当网络结构变化或系统参数变化时,通过动态地控制BP神经网络各层特别是输出层权值修正,可以使网络输出的均方差MSE(yim)快速减小,从而使网络灵敏度 降低,达到提高辨识速率和精度的效果。
本文尝试先在BP神经网络之前加入一级线性网络,通过线性网络首先进行辨识的粗调,当在理想值附近建立粗略的线性模型后,再通过局部式反传BP神经网络学习,辨识之前线性网络无法建模的非线性部分。混合式改进BP神经网络结构如图1所示。
2.3混合式BP神经网络工作过程
首先对于图1中的线性网络部分,令网络输出为:
式(2)中:line(k)是线性网络的权值,b(k)是网络的阀值,x(k)为辨识网络的输入信号。
对于线性网络部分,神经元之间参数修改采用递推最小二乘法;其权值和阀值修改公式分别见式(3)和式(4)
对于图1中局部式反传BP神经网络部分,令网络输出为yn(k)。神经元之间权值修改采用引入动量项和变步长法的改进BP算法。该网络权值调整过程主要由综合误差决定,为方便取误差绝对值,本文采用误差的平方作为调整参考值。调节过程如下:
(1)当 时,由灵敏度定义的式(1)可知,灵敏度函数是综合误差|E|的反比例函数,此时灵敏度较小,故可按标准BP算法执行。
(2)当 时,协调器控制网络输出层的权值矩阵,调整wbij的大小,同时停止其他层权值的修正,使网络灵敏度 降低。
(3)当 时,协调器控制只允许靠近网络输入层的第一或二级隐含层权值修正,同时停止网络输出层的权值阵 和其他级隐层权值的修正。
然后将两个网络结合,令辨识网络总输出为:
训练采用的教师信号为网络实际输出与辨识输出的误差的均方值。
3 辨识结果研究
针对一个典型的非线性对象,通过仿真来研究结合线性网络的局部反传BP神经网络对非线性对象的建模能力,并与单独使用BP网络的建模效果进行比较,来说明所提方法对提高网络学习速率及精度的效果。
为了保证学习信号的多样性,网络辨识学习选用的输入信号样本前半部分为随机信号,后半部分为正弦信号。为了考察本文给出的混合型改进BP神经网络结构对被辨识对象参数改变和模型结构改变的适应能力,本文选取的辨识对象为如公式(6)所示的三个不同的三阶非线性对象,在K=250时刻对象模型中的常数2.5变为零,在K=500时刻对象模型的分子和分母均作了改变:
(6)
仿真采用的神经元结构采用图1的三层结构,在BP神经网络辨识之前先通过一层线性网络,采用基于BP算法的多层前向网络的结构 (表示一个三层网络,输入层,隐含层各有5个神经元,输出层有1个神经元)。激励函数采用Sigmoid函数 ,取初始学习率 ,动量项 =0.3。
结合线性网络的局部反传BP神经网络的辨识结果如图2,本文改进算法与标准BP算法和引入局部反馈算法的教师信号比较如图3所示,由于改进算法与标准算法的教师信号不在同一数量级上,将改进算法的教师信号另外画出,如图4所示。
(1)由图2可以看出改进网络结构后的辨识结果和实际输出吻合度很高。
(2)由图3可以看出,在相同的学习步数情况下,引入局部反馈改进算法相比于标准算法,学习时间短,且基本不受输入变化的影响,本文改进后网络结构对比引入局部反馈改进算法的辨识精度高,收敛速度快,而且能保持稳定。
(3)由图4可以看出,改进后的算法辨识效果明显,主要体现在初始误差就很小。在相同训练步数下,改进算法的均方误差在训练开始时就几乎维持在10-3附近,当训练结束时更是达到了10-4以上的精度。
4 结论
本文通过分析传统BP网络的缺点及其成因,在其基础上将线性网络和局部式反传网络结合成一种混合式BP神经网络。
(1)线性网络的引进增加了粗调环节,在继续保持BP神经网络非线性表达能力强的优点的前提下,得到了更快的收敛速度和更小的误差。
(2)引入局部反传网络,当网络结构变化或系统参数变化时,通过动态地控制网络各层权值修正,降低网络灵敏度,提高辨识精度,是一种训练BP网络的有效方法。
参考文献:
[1] 杨源杰,黄道.人工神经网络算法研究及应用[J].华东理工大学学报,2002,6(4):319-323.
[2] 郑高峰.带动量项的BP神经网络收敛性分析[D].大连:大连理工大学,2005.
[3] 孙娓娓,刘琼荪.BP神经网络的联合优化算法[J].计算机工程与应用,2009,45(12):50-54.
[4] 周荣,王福利.一种改进的神经元网络及学习算法[J].矿冶,1997,6(2):85-88.
关键词:高速公路;交通流预测;BP神经网络
中图分类号:TP393.0 文献标识码:A 文章编号:2095-2163(2015)04-
Highway Dynamic Traffic Flow Prediction based on BP Neural Network
DAI Hongbo,ZENG Xianhui
(College of Information Science and Technology,Donghua University,Shanghai 201620,China)
Abstract:This paper takes highway traffic fIow prediction as object of study,simplifies the highway macroscopic dynamic traffic flow model and establishes a BP neural network model to train and predict based on Matlab neural network toolbox. It models and predicts real data collection from traffic flow nearby JiaXing station. From the predicted results, this BP neural network model is proved to be highly reliable. It carries out that the simplified model of traffic flow is more concise, predictions can also describe a certain space and time of the site’s traffic situation through a point to an area.
Keywords: Highway; Traffic Flow Prediction; BP Neural Network
0 引 言
随着社会经济的发展和私家车保有量的逐年递增,出行车辆日渐增多,随之而来的交通拥堵,交通事故等问题即已成为困扰社情民生的重大事件。智能交通系统作为这一状况的有效解决手段,也已吸引了时下众多专家的关注和重视[1],其中的短时交通流则是交通控制、车辆导航等领域亟待解决的热点课题。近些年,鉴于神经网络具有的表示任意非线性关系和学习的能力,为此展开了基于人工神经网络预测模型的大量研究,且均已取得了令人满意的预测效果[2]。通过对各个模型的分析,指出了神经网络在智能交通领域的工具性应用潜力,而且在实时交通预测中,神经网络要比其它方法更具不可比拟的优越性。
1 建立流量预测模型
短时段交通流预测是指预测尺度不超过十五分钟的交通流[3]。交通流是由数以万计的出行者群体行为生成的,具有高度的时变性、非线性和不确定性。但就道路上某一特定观测点来说,对于短时段交通流,随着观测尺度的缩短,交通流受随机因素影响较大,其统计行为不是定常、周期或准周期的,多是表现为纯随机行为。
在交通流量预测研究中,Markos Papageorgiou 提出了一个比较有代表性的高速公路交通流宏观流体模型[4-5],其中主要描述了高速公路的交通流量、速度以及交通密度之间的相互关系,以此来反应交通流随道路空间的分布以及随时间变化的规律,从而准确描述短时间内的交通流的真实行为。
以交通流宏观流体模型为基础,本文提出了一个简化的交通流预测模型,如图1所示。该模型参考了对短时间交通流预测的思想,实现对高速公路站点短时间交通流预测。
图1 交通流预测模型
Fig.1 Traffic flow forecasting model
在对高速交通网络中的站点进行实时预测时,路网中当前和过去若干时段内的交通流信息是实时预测的数据基础。因此首先必须采集实时交通数据,建立得到动态的交通数据库。在数据处理分析时,结合上述交通流模型,通过一定的数据挖掘方法分析得到有效的数据。如模型中指出, 站点 上的交通流量与本站点前后若干个时段的交通流量有着必然的关联, 同时在预测站点路段的交通情况时,该站点上下游路段交通情况也是一个关键因素。 这样便可以利用预测站点前几个时段的交通流量数据以及上下游站点交通流量数据来预测特定站点交通流量, 上述简化的交通流预测模型所要阐述的基本概念就在这。
设站点 (代号为15,下同)为要预测的路段, 为预测路段当前时刻 的交通流量,而 为要预测的该路段下一时刻 的交通流量,并与该站点 、 时刻的交通流量有着必然的联系,同时上下游站点(13、14、17等) 时刻的交通流量也将会影响着站点15下一时刻的交通流量。于是 与该站点以及附近站点的交通流量存在某种函数关系,具体表达则如方程(1)所示。
(1)
根据实际采集到的交通流数据,结合上述模型,利用Matlab平台建立BP神经网络来训练学习方程(1),并实现短时间交通流预测。
2 BP神经网络的构建
经过研究可知,Matlab中的神经网络工具箱是进行神经网络系统分析与设计的有力工具。使用Matlab平台构造神经网络的预测过程通常可分为:数据预处理、网络构建、训练和网络预测[6]。
数据归一化就是将数据通过某种算法处理后,使得数据映射到[0,1]或者[-1,1]等范围内,并且再经相应变换,最终将有量纲的表达式转化为无量纲的表达式,其结果即将限制在一定范围内。这不仅利于数据的进一步处理,同时还可以保证程序运行时收敛速度加快。本文中数据处理采用的是线性函数归一化:
(2)
其中, 、 分别为归一化前后的值, 、 分别为样本的最大值和最小值。
神经网路的核心在于网络结构的设计,其重点在于网络层数以及各层节点数的确定[7-11]。理论已经证明,增加网络层数可以进一步降低误差提高精度,但同时也会使网络复杂,降低实时性,加大网络的训练时间;而误差精度则可以通过增加隐含层中的神经元节点数目来获得提高,就其训练效果的观察和调整均比增加层数更为容易,所以一般情况下需优先考虑增加隐层神经元数目。对神经元网络输入层与输出层来说,则需要研究实例中求解的问题、具体的表示方式来确定各自神经元数目,同时考虑尽可能地减小系统规模,系统的训练时间和复杂性。基于前述的交通流预测模型分析,联系方程(1)可知,可将 、 、 、 、 、 、 和 等八个数据作为输入层,将下一时刻流量 作为输出层。文献[7]指出,适当增加隐层中的神经元数目可以在更大程度上降低误差、提高精度,隐层神经元数目可选择为输入层神经元数目的平方,即 。经过实验反复验证,文中隐层节点取为20。综上所述设定,文中的BP神经网络模型如图2所示。
图2 交通流神经网络模型
Fig.2 Neural network model of Traffic flow
神经网络采用自适应学习的负梯度下降法实现交通流的学习和预测, 网络的响应函数选择Sigmoid 型激励函数[12],函数形式为 。
3 预测仿真与结果分析
数据使用的是浙江省某段高速公路2015年1月1日某几个站点的交通车辆收费数据,目的在于对其中一站点的车流量进行预测。从数据库中抽取浙江省嘉兴站点(代号15)当日的车流量数据以及短时间内车流量变化,具体如图3、图4所示。
图3 15站日间车流量变化
Fig.3 The curve of traffic flow dairy
图4 9-11时车流量变化
Fig.4 Curve of traffic flow hourly
由图3可以分析得出,一天中的交通流变化大致经过如下阶段:凌晨交通流,低谷期;早晨交通流,攀升期;中午交通流,平峰期;下午交通流,高峰期;晚上交通流,下降期。结合图3,且由图4可分析获知,在9~11点期间为车流量高峰期,短时间流量变化起伏很大,但总体维持在每分钟10~15辆左右。再次细致分析附近站点车流量变化趋势并与该站点比较发现,各临近站点车辆起伏变化相近,并且短时间内各站点之间车流量变化存在着某种相互影响的关联作用。于是,本文采取上述交通流预测模型来进行站点短时间内的车流量预测,该模型较其他宏观动态车流量模型更为简单,相应预测结果亦可反映当前附近站点范围内的车流量情况。
本论文重点即在结合当天该站点及附件站点车流量对本站日常车流量进行预测。训练数据选取附近六个站点日间车流量及结合本站车流量数据进行网络训练仿真。MATLAB仿真程序如下:
%首先导入已处理好的数据矩阵;
%矩阵p 输入矩阵,矩阵t为输入矩阵; [pn,minp,maxp,tn,mint,maxt]=premnmx(p,t);%对矩阵进行归一化;
net=newff(minmax(pn),[8,20,1],{'tansig','tansig','purelin'},'traingdx'); %建立net网络,输入节点为8,输出节点为1,隐层节点为20;
net.trainParam.show=50;
net.trainParam.lr=0.05;
net.trainParam.mc=0.9;
net.trainParam.epochs=10 000;
net.trainParam.goal=1e-3;
>> net=train(net,pn,tn);%网络创建,训练;
%pi为测试数据;
pin=tramnmx(pi,minp,maxp);%测试数据的归一化;
an=sim(net,pin);%测试
[a]=postmnmx(an,mint,maxt); %测试结果数据的反归一化,最终得到预测结果;
本文针对该站点日间9点~11点每分钟车流量展开仿真预测。训练时以9~11点时间段内120组数据进行训练,而用其后十分钟内的10组数据进行预测。9~11点车流量训练误差变化图如图5所示。
图5 车流量训练误差变化
Fig.5 Training error curve of traffic flow
预测样本结果如表1。
表1 预测样本结果比较分析
Tab.1 Compare and analysis with Predicted results
预测数据号 实际车流量 预测车流量 误差
1 13 13.440 6 3.39%
2 11 12.064 8 9.68%
3 18 15.259 5 15.23%
4 17 12.533 9 26.27%
5 13 15.418 7 18.61%
6 16 17.147 7.17%
7 12 12.360 2 3.00%
8 12 10.536 3 12.20%
9 11 9.834 3 10.60%
10 10 10.300 7 3.01%
表1 预测样本结果比较分析
Tab.1 Compare and analysis with Predicted results
由表1可知,预测车流量与实际车流量很接近,部分误差较大,但实际数值相差不大,车流量预测成功,基于BP神经网络的交通流预测模型具有很高的可靠度[12-16]。 然而上述预测却仍有不足,因存在不同道路、瞬时变化的交通状况的差异,作为神经网络输入的交通流量信息在选择上太过简单,实验结果单一,还应持续反复实验和多次比对探索。在交通流量预测中,如何选择与预测时段相关性强交通流量信息作为神经网络的输入对于预测精度的提高具有明确的必要性和重要性[17]。
4 结束语
本文在研究宏观动态交通流模型的基础上对其进行了简化,并针对某个站点的交通流随时间变化进行分析,同时结合了附近站点的交通流对其建立了基于BP神经网络的高速公路交通流预测。从预测结果中得知,基于BP神经网络交通流预测模型具有颇高的可靠度,该简化的交通流模型更为精确,预测结果亦可综合总体地描述该站点一定空间及时间范围内的交通流情况。
参考文献:
[1]张可,齐彤岩,刘冬梅,等.中国智能交通系统(ITS)体系框架研究进展[J].国家智能交通系统工程技术研究中心,2005(5):6-11.
[2]王进,史其信.神经网络模型在短期交通流预测领域应用综述[J]-河南科技大学学报(自然科学版),2005(2).23-25.
[3]朱中,杨兆升.实时交通流量人工神经网络预测模型[J].中国公路学报,1998,11(4):89-92.
[4] MARKOS P,JEAN-MARC B,SAIEHADJ H.ModeIing and reaI - time controI of traffic fIow on the southern part of bouIevard peripherigue in Paris[J].Transportation research,l990,24A(5): 345-359.
[5]撒元功,湖郁葱,徐建闽.高速公路动态交通流的神经网络模型[J].华南理工大学学报。2002,30(8):91-94.
[6]Simon Haykin. Neural networks:A comprehensive foundation[M].北京:清华大学出版社,2000.
[7]贾丹.基于神经网络的交通流的预测[J].锦州师范学院学报(自然科学版),2002,23(3).27-29.
[8]袁曾任.人工神经元网络及其应用[M].北京:清华大学出版社,1999 .
[9]许宏科,穆魏,焦家华.高速公路动态交通流模型及其参数的分段辨识[J].武汉理工大学学报(交通科学与工程版),2005,29(1):91-93.
[10]梁新荣,刘智勇,毛宗源.高速公路动态交通流 Elman 神经网络模型[J].交通运输工程学报,2006(9):50-56
[11]樊小红,贺昱曜,刘勇顺. 自动化高速公路交通流密度的反演变结构控制[J].计算机工程与应用,2008,44(12):244-248.
[12]温惠英,周玮明.基于S型函数预处理的RBF神经网络交通流量预测[J].交通信息与安全,2009(4):22-25.
[13] HERN?NDEZ P J A, GARCIA A M A. Trys-tram G. Neural networks for the heat and mass transfer prediction during drying of cassava and mango[J] ,2004(01).57-64.
[14]任雪莲,陈晓芬,马骏. 遗传神经网络在交通流预测中的应用[J].交通科技与经济 ,2009(4):10-12
[15]谭国真,丁浩.广义神经网络的研究及其在交通流预测中的应用.控制与决策,2002,17(B 11):777-780.