前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络遗传算法主题范文,仅供参考,欢迎阅读并收藏。
中图分类号:TM1文献标识码:A文章编号:1007-3973(2010)06-083-02
随着现代工业科技的发展,电力电子装置的应用越来越广泛,非线性和时变性电子装置大量投入到电网使得电力系统中的非线性负荷急剧增加,导致了配电网中电压和电流波形的严重失真,由此而产生了电网谐波污染问题,谐波的产生降低了电能质量,直接影响工业用电设备和居民用电设备的正常安全运行。另一方面随着科技的发展,各种精密仪器的投入使用对电能质量提出了更高的要求。谐波问题作为降低电能质量问题的核心内容对电力系统的安全经济运行带来了巨大的挑战 。
对谐波含量准确进行分析计算时保证谐波治理效果的重要前提,本文采用遗传算法改进神经网络算法进行谐波含量计算,其实时性和结果精确性都有较大提高。
1谐波含量计算问题
原始理想的电压和电流波形应该是标准的正弦波波形, 可以假设电源瞬时电压为
考虑到负载电流发生畸变,含有谐波分量,根据傅里叶级数将负载电流分解为:
其中,为基波有功电流;为基波无功电流;为高次谐波电流,可以将式(2)改写成权值模式:
对谐波含量的分析计算目标即为求出的值,其中体现高次谐波的含量 。实际电网中由于电力系统为三相系统,偶次谐波基本消除,因此只考虑奇次谐波,占总谐波含量97%以上的谐波集中在25次谐波以下,本文只分析25次以下(包括25次)奇次谐波含量,根据以上分析,式(4)可以简化成
其中 谐波分析即为求取式(5)中权值系数 的值。
2基于神经网络谐波检测算法
本系统采用单层感知器―误差修正学习法 。由式(5)可知,神经网络谐波权值计算可用如图1所示,作为网络的输入,为理论电流:
为实测电流值,也就是期望电流值,为期望电流值与网络实际输出之差,即误差信号:
误差信号为驱动控制信号,其目的是修正调节各次谐波权值,使网络输出一步一步接近期望输出 ,这一目标通过最小化性能指标来实现 ,性能指标定义如下:
权值修正法则如下:
其中表示第n个输入量第k+1表示第次迭代后结果,为学习率,为学习误差,为第n个输入向量。
综合以上分析可知,采用单层感知器-误差修正神经网络的谐波算法计算步骤如下:
(1)给定初始谐波权值
初始权值赋值可采用在规定区间内的随机赋值法,初值赋值区间为[-2,2]。
(2)给定当前输入
由前面分析可知为神经网络输入,输入量在不同的时刻t不同,因此必须建立查表机制来查询不同时刻的网络输入,用表示第n次迭代中第个输入量( 的顺序依次编号)。
(3)由权值和输入量计算网络输出值
(4)根据网络输出和期望输出计算学习误差,如式(7)所示。
(5)根据学习误差调节权值
其中表示第次迭代中第n个输入量的连接权值
(6)回到2继续进行下一次迭代计算
基于单层感知器-误差修正学习网络最大的优点就是迭代过程相对简单,最后系统能稳定收敛到目标范围。但系统的稳定性受系统反馈参数影响较大,学习率的选取对于系统重复学习过程中的稳定性和收敛性是非常重要的,的值过大,会加快收敛速度但误差过大,的值过小,学习速度过慢,也将影响系统实时响应速度。
3遗传算法改进神经网络算法
上一节中提到的单层感知器-误差修正神经网络是一种简单的寻优算法,但神经网络权值寻优算法存在全局搜索能力差的缺点,初始权值随机性过大影响网络的泛化能力,而遗传算法可以对复杂的,非线性的、多峰的不可微函数实现最优全局搜索,能有效利用历史信息来推测下一代更优质的寻优点集 。这样不断进化,最后收敛到一个最适应环境的个体上,进而得出问题的最优解。因此,可以先用遗传算法对初始权值进行优化,在大范围解空间定位出适用于优化目标的较好搜索空间,然后利用神经网络在这一个较小解空间进行局部寻优,这样既可以避免在寻优过程陷入局部最优,还可以加快算法收敛。据此本文将遗传算法与单层感知器-学习修正神经网络算法进行结合来优化谐波含量计算。遗传算法进化步骤如下 :
第一步:确定决策变量和约束条件
包括基波权值在内,一共有13组,总共有26个权值,谐波权值的范围一般在[-1,1],权值可能溢出,本文将权值范围扩大到[-2,2],即:
第二步:建立优化模型
优化目标为使得性能指标到合理范围
第三步:确定编码、解码方法
对于每一个权值其取值区间为[-2,2],由于遗传算法计算目的为搜索最优区间,而非最优解,因此将[-2,2]区间以0.2为单位分为20等份,计算最终目标只需求出最优解所在区间即可,可知每个权值从-2到2有21个取值可能,可用4位二进制编码串表示,一共有26个权值,按照的顺序需要104位二进制编码串来表示,这便构成了染色体编码方法。解码时先将104位的二进制编码串截成26段4位二进制编码串,每一段编码串表示一个权值编码,设某一段编码为,解码后表示权值实际值为,可知
第四步:确定个体评价方法
可知个体评价方法即为性能指标控制到合理范围。
第五步:设计遗传算子
选择运算选用比例选择算子;交叉运算使用单点交叉算子;编译运算使用基本位变异算子。
第六步:设定遗传算法运行参数
包括群体大小、终止代数、交叉概率和变异概率
结合前面神经网络算法的分析,可得出遗传算法改进神经网络算法计算谐波的总计算流程,如图2所示:
4MATLAB仿真分析
根据前面对算法的分析,使用MATLAB提供的神经网络和遗传算法工具性进行仿真处理 。设置遗传算法群体大小为80,终止代数为100,交叉概率为0.7,变异概率为0.001,神经网络算法学习率为0.1,使用遗传算法改进神经网络算法的训练样本曲线如图3所示,单独使用神经网络算法的训练样本曲线如图4所示:
由图3和图4可知,采用遗传算法改进神经网络算法进行谐波分析,在遗传算法完成100步迭代后适应度最高样本的训练误差已经降到,此后进行神经网络训练到160步后训练误差已经降到,相比单独使用神经网络算法,需要到350步训练误差才能到,可见采用遗传算法改进神经网络算法大大加快了迭代速度和计算结果的准确性。
5遗传算法改进神经网络算法的优点
使用遗传算法改进神经网络算法为谐波计算分析提出了新的解决思路,主要特点包括:(1)全局搜索能力强,算法精确度高 。(2)抗干扰能力强.。(3)自适应能力强。智能算法进行谐波分析作为一种新兴的谐波分析思路,但是由于智能算法对于训练样本的依耐性非常大,算法参数的设置对于整体计算精度和效率影响非常大,现场应用不够,因此还需作更为深入的探索研究。
注释:
吕润如. 电力系统高次谐波[M].北京:中国电力出版社,1998.
危韧勇,李志勇.基于人工神经元网络的电力系统谐波测量方法[J]. 电网技术,1999,23(12):20-23.
焦李成.神经网络计算[M].西安:西安电子科技大学出版社,1993.
危韧勇,李志勇,李群湛.一种基于ANN理论的谐波电流动态检测方法研究[J]. 铁道学报,2000,22(1):40-43.
陈国良,王熙法,庄镇泉,王东生.遗传算法及其应用[M].北京:人民邮电出版社,1999.
王小平,曹立民.遗传算法-理论、应用于软件实现[M].西安:西安交通大学出版社,2002.
[关键词] 神经网络; 煤矿突水; 优化设计; 遗传算法
1 引言
煤矿行业作为我国的一种重要的传统能源行业,在国民经济、人民生活等众多领域中起着举足轻重的作用。但现阶段我国的煤矿企业普遍存在着安全化的建设水品严重的滞后,在生产中,安全保障方法严重的不足,开挖的成本居高不下。而与其相对的是近些年来,遗传算法和神经网络技术的兴起,改变了传统安全监测的诸多不足之处,使得信息安全化技术渗透了人们生活的每个角落。在很多地方已经将引进遗传算法和神经网络技术这种重要的辅技术作为一种衡量公司运营好坏的标准。
而现阶段我国的煤矿企业基本上受制于安全化系统不发达,从而使得煤矿生产中的突水事故经常发生,同时,企业内部的各个应用之间也难以连通,不利于系统集成,致使系统内沟通繁琐。不止如此,缺乏有效的安全化技术也使得领导缺乏及时有效的数据用于推断预测企业的发展与行业的发展趋势。这些问题在一定程度上严重的制约了我国的煤矿行业发展,利用现有遗传算法和神经网络技术的煤矿监测技术完全可以大大改善这种现象。
因此,将遗传算法和神经网络的技术引入我们煤矿行业势在必行。而在预测煤矿突水事件的方案中可以有效的将信息资源集中到各个管理机构,从而推进煤矿行业的安全化进程,促进煤矿行业的发展。
2 神经网络在煤矿突水预测中的应用
神经网络是一种符号数值相结合以人工神经网络为核心建造的智能预测系统。其采用一种或多种神经网络算法来学习输入输出之间的关系,摒弃了传统产生式系统的结构和工作周期。该模型的建立过程,一是确定矿井突水的主要影响因素即确定输入层神经元的个数,如含水层条件、构造条件、岩性组合条件、开采条件以及岩性特征等因素;二是确定隐含层的层数和神经元的个数;三是确定输出层神经元的个数。对建立的模型进行训练和检验,准确率高达100%。在突水事故中因构造引起事故的主要控制因素是断裂构造。神经网络非线性特征可以实现数据输入和输出的任意映射,这使得它在许多领域得到了广泛的应用,如模式识别、函数逼近、数据压缩等领域。神经网络的学习过程按照有导师的方式进行网络学习训练,分为网络输入信号正向传播和误差信号反向传播两种形式。在正向传播中,输入数据从输入层经过隐含层逐步计算结果,将其传向输出层,网络的训练过程中输入模式的网络信息与输出层的各神经元输出值对应;在学习的过程中,若输出层得不到预先设定的期望输出,则网络按减小期望输出与实际输出的误差理论原则。
神经网络技术正由于其强大的数值处理能力,因而用于煤矿突水事件的设计,这种设计也是最近几年才开始使用,为生产提供了很好的科学方案设计。在使用了神经网络技术预测突水后,可以大大提高设计效率和质量,还保障了煤矿生产中的安全。基于神经网络技术的煤矿预测突水设计方案优化的目的是让施工中在最少的材料和最低成本的情况下,用最合理的技术完成要求的工作,最大程度的完成施工中不发生突水事件,把巷道内部的强度、刚度、稳定性能都 发挥出来。神经网络技术软件就是比人工系统多出了智能识别,自动的在系统内部生成机械的最有配置。
⑴ 非线性的优化设计法
非线性的优化设计是不同的约定的函数数值所产生的一种安全设计方案。系统在使用时,会自动生成约定之外的函数数值,这些数值直接用于机械的编程使用中,指导施工运行。这种非线性方案可以分为两种。一种是利用目标定位将一次积分和二次积分在相乘的情况下,再次加权,以得到相应的施工设计方案。这种方法具体有共轭替代法、变化模式阶层法以及多普勒开根号法。这些在神经网络技术的安全方案中正是由于稳定性能良好,计算较为简便,所以使用比较广泛。另外一种就是假定一个多元函数,将函数在定义域范围内缩减至有效值,把目标函数的第三种类型编程可分析区域加以利用。这种方法虽然比较简单,但是用于突水预测中却很少,最主要的原因是在转变编程中多次使用神经网络技术,导致系统的数据无法完全复制到程序中,施工所执行的命令和指令都是很片面,具体变现在工作断断续续,不能系统的完成整个工程的协调指令。
⑵ 线性优化设计法
在突水预测设计问题大多要使用线性函数,根据线性函数出来数据时又可以分为直接法和间接法。直接法通常有复杂图形静态变现法,在突水预测在运转中会遇到一些人为情况下无法处理的事情,这时利用神经网络技术所生成的处理技术,可以很好的在具体的点位固定目标,将安全设施指引到正确的位置。构造中,函数不断的迭代,自动加载出合适的运行模式,在一系列的数学计算后,得出线性解答,最终得到合理的解决方案。
间接法常见的有共轭函数法、增广矩阵变化法。它是将煤矿突水的线性优化问题转化成非线性优化问题,再通过非线性优化方法来求解,或者非线性优化问题转化成线性规划问题来处理。加运转的指令以坐标的形式发散出去,得到的目标函数在通过重复的验算,再次得到神经网络技术中所要求的优化方案。
3 遗传算法在煤矿突水预测中的应用
基于遗传算法技术的煤矿突水预测设计是在以往传统的机械设计理念上加上了更多的计算机数据编程,是一种更加科学的现代化手段。为在煤矿生产效率中也得到了很好的优化,也能使煤矿生产安全达到更好、更高的要求。接下来,我们将着重介绍在煤矿突水预测中使用安全技术优化方案中的遗传算法。
遗传算法,是20世纪70年代初期由美国密执根大学霍兰教授提出的一种为煤矿突水事故提供预测方法的一种提前预案。GA是一种在人为施工条件下非确定性的拟自然算法,这种算法是根据自然界仿照生物的固有进化规律,对一个大的群体进行随机抽样,观测其繁衍变化以及淘汰机制。其中就会有适者生存,不适者就会被淘汰,按照这样的规律不断重复,使整个群体在繁衍的素质上和种群的数量上都会有很大的提高,时间变长,这样的趋势会显现的更加明显,最终会以一种优化平衡的态势趋于平衡,并且保持最优配合比。遗传算法具有鲁棒性、自适应性、全局优化性和隐含并行性。
主要应用领域有:函数优化方面、机械的组合优化、机器概念学习、设备的控制方面、三维图型显示、机械设备故障诊断、人工生命、神经网络等最近几年中遗传算法在机械工程领域也开展了多方面的应用。本文中提到的煤矿突水预测技术下的设计优化就是选取这样的设计理念,在优势上有了很大的突显,主要表现在:
(1)煤矿整体结构优化设计:在煤矿生产中,多考虑到安全方面的因素,遗产法在结合突水施工行为后,针对多样的遗传算法中的弹性改变量、固定动态与波段概率等是不能够改变机械设备的运行模式,也就不能对煤矿施工安全有任何的优化过程。在提出了交叉适应变于线替改变的方法后,弹性改变量就会维持在一个平稳的状态,遗传算法中的频率会体现在设备的转动上,这种遗传算法为解决煤矿突水在工程使用中结构优化设计、多峰值函数求极值等问题提供了参考。
(2)可行性分析:在安全的整个框架系统中,模拟了固定模式中的运行,加上基于数据可视化技术下的运转方式,把整个系统的优化性再次提升,能够在加工材料和零件上的加工都有很好的保护作用,避免了很多机械设备在使用中对于不明施工环境变化导致的机械损坏,提出框架结构系统可靠性优化的遗传算法在安全设备升级优化都有积极的帮助。
(3)故障诊断:以网络权重和偏差的实数形式作为基因构成染色体向量,采用基因多点交叉和动态变异进行种群最优选择,提出了一种新的基于数据可视化技术的遗传算法,并在此基础上设计出一种基于遗传算法和有毒性气体分析的技术,使得煤矿机械设备会在满负荷工作时自动的对整个电路系统起到测试的作用。
尽管遗传算法在突水预测技术指导下已解决煤矿生产中了许多难题,但还存在许多不足之处,如算法本身的参数优化问题、如何避免过早收敛、如何改进计算机有效的工作时间和工作方法来提高算法的效率、遗传算法与其它优化算法的结合问题等。用遗传算法求解约线性和非线性优化问题时,一般采用共轭发散函数法,如何合理的选择共轭因子是算法的难点之所在。共轭因子取得过小时,可能造成整个发散函数的极小解不是原目标函数的极小解;共轭因子取得过大时,搜索过程增加困难,所以对煤矿突水预测技术中遗传算法中的一系列问题还有待于进一步研究、讨论。
4 结束语
遗传算法和神经网络在煤矿突水预测中的应用设计作为一项革命性的技术,在许多行业中都有着巨大的发展空间及应用价值。在煤矿企业安全化进程中引入遗传算法和神经网络技术有着明显的优势,它在简化管理,加强安全监控等方面具有不可比拟的优势,十分适合我国煤矿企业的发展。利用安全设备的优化方能能实现对煤矿突水事件的规避,使得煤矿行业能可持续发展。
[参考文献]
[1] 濮良贵. 机械零件[M]. 北京高等教育出版社,1982,5(13):23-26.
[2] 蒲 俊,吉家锋. 数据可视化技术数学手册[M]. 上海浦东电子出版社,2002,9(11):100-108.
论文摘要: 从现有安全设施来看,TDCS网络系统安全体系初步形成。但是,随着计算机网络的日益普及,各种安全威胁和计算机病毒也随之而来。现有的网络安全系统虽然起到一定的防护作用,但并不能完全解决整个骨干网络的系统安全问题。因此,拟采用基于遗传算法和神经网络的入侵检测技术,结合遗传算法和神经网络各自的优点,加强对TDCS网络的监视和防护。
1 TDCS网络安全状况
1.1 TDCS网络安全现状
TDCS(TrainOperation Dispatching Command System)是覆盖全路的列车调度指挥管理系统,分为铁道部、铁路局和车站三级建设,能及时、准确地为全路各级调度指挥管理人员提供现代化的调度指挥手段和平台,是铁路运输调度指挥现代化建设的标志。但是,随着计算机网络的日益普及,各种安全威胁和计算机病毒也随之而来,这就导致TDCS网络存在着安全隐患。
1.2 TDCS网络安全存在的问题
在TDCS网络中主要存在着以下几方面安全问题:1)间接来自于互联网的病毒威胁;2)操作系统的安全威胁;3)应用软件的安全威胁;4)计算机设置的安全隐患;5)实时监控能力弱。
2 TDCS网络安全防护
2.1 TDCS网络目前采取的安全防护措施
针对TDCS网络存在的安全问题,结合各种技术和方法,目前全路系统信息安全防护体系采取的措施有:
1)防火墙系统。防火墙技术是实现子网边界安全的重要技术。首先路由器将对网络层安全进行初步保证,但路由器的访问控制列表只能作为防火墙系统的一个重要补充,只能通过防火墙系统来实现复杂的安全控制。
2)身份认证系统。由于TDCS人员结构复杂,用户众多,安全意识参差不齐,所以用户的工作内容也不尽相同,对于如此重要的系统,目前采用的以静态密码为主的身份认证系统带来的安全威胁是非常严重的,会造成比较大的安全风险。为了解决此类安全隐患,实用动态口令对TDCS用户进行身份认证是非常必要的。
3)网络防病毒系统。根据对病毒来源的分析,TDCS网络防病毒系统主要体现在以下三个方面:第一,防病毒集中统一管理,就是在铁路局内部安装防病毒软件管理系统,对所有客户端防病毒软件进行统一管理;第二,服务器病毒防护,就是对各种服务器进行病毒扫描和清除;第三,桌面防毒防护,就是对各项桌面系统软件进行病毒扫描和清楚。
4)入侵检测系统。入侵检测的主要功能是控制对网络的非法控制,通过监视、限制通过网络的数据流,防止外对内、内对外的非法访问,隔离内部网和外部网,为监视TDCS局域网安全提供便利。
5)安全漏洞评估系统。
2.2 TDCS网络采用入侵检测进行防护的好处
通过以上介绍,我们不难发现,在TDCS网络安全体系中,入侵检测系统是唯一一个通过数据和行为模式判断其是否有效的系统。
形象地说,入侵检测系统就是网络摄像机,能够捕获并记录网络上的所有数据,同时它也是智能摄像机,能够分析网络数据并提炼出可疑的、异常的网络数据,它还是X光摄像机,能够穿透一些巧妙的伪装,抓住实际的内容。此外,它还是保安员的摄像机,能够对入侵行为自动地进行反击,如阻断连接。
在TDCS网络中引入入侵检测技术,主要是实现对网络的非法控制,通过监视、限制通过网络的数据流,给网络系统提供对外部攻击、内部攻击和误操作的安全保护,为监视TDCS局域网安全提供更多便利。
3 基于遗传算法和神经网络的入侵检测系统
3.1 传统的IDS存在的问题
1)准确性差。传统的统计方法需要依赖于一些假设,如审计数据(或用户行为)的分布符合高斯分布,实际上用户行为具有随机性,这些假设有时可能无效,从而导致较高的错误率。
2)灵活性差。传统的IDS对攻击特征的刻画只能是某些固定的序列,但现实中的入侵者利用的手段往往是有变化的,而要在入侵模式库中反映出所有可能的变化是不可能的。
3)适应性差。入侵者的攻击方法是在不断发展的,但传统的入侵检测系统无法有效地预测和识别新的攻击方法,使系统的适应性受到限制。
3.2 采用基于遗传算法的神经网络IDS的好处
将遗传算法全局搜索最优和传统神经网络局部寻优结合起来,取长补短,既可以减小遗传算法的搜索空间、提高搜索效率,又可以较容易地收敛到最优解,为求解多目标优化问题提供了新的策略。
4 结束语
目前在TDCS网络安全系统中采用的IDS一般都是基于神经网络技术的,由于神经网络的设计主要依据设计者的经验在大样本空间反复实验来进行选取,尚无理论上的指导,因此在神经网络的初始连接权以及网络结构的选择上具有很大的随机性,很难选取具有全局性的初始点,因而网络求得全局最优的可能性小。本文提出的技术很好的克服了这些缺点,较好地解决了问题。
参考文献:
[1]铁道部运输局,铁路列车调度指挥系统,北京:中国铁道出版社,2006.10.
[2]高丽,铁路站段计算机网络故障解决方法[J].铁路计算机应用,2006,13(9):13-16.
[3]周明孙、树栋,遗传算法原理及应用,北京:国防工业出版社,1999.
旅游市场趋势预测是旅游业发展战略和旅游规划与开发工作的重要基础依据,一直是旅游市场研究中最重要的内容之一。根据市场趋势预测的结果,旅游相关部门才可以制定合理的旅游规划,进行旅游资源的优化配置。旅游市场趋势预测是在对影响市场的诸因素进行系统调查和研究的基础上,运用科学的方法,对未来旅游市场的发展趋势以及有关的各种因素的变化,进行分析、预见、估计和判断。
近年来,旅游研究者对旅游市场趋势预测的方法进行了探索。目前主要有时间序列法、回归分析法、指数预测法、人工神经网络法。由于旅游市场的变化受到诸多因素的影响,导致旅游市场的趋势预测难度较大,但我们对预测精度的要求却越来越高。
本文是基于人工神经网络方法,提出使用遗传算法对人工神经网络进行优化,探索更精确、更适用于旅游市场预测现实状况的预测方法。
1 方法概述
人工神经网络是近年来的热点研究领域,是人类智能研究的重要组成部分,已经成为神经科学、计算机科学、认知科学、数学和物理学等多学科关注的热点。其应用领域包括:分类、预测、模式识别、信号处理和图像处理等,并继续向其他领域延伸。
1.1 BP神经网络
BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。
图中,X1,X2,…,Xn是BP神经网络的输入值,Y1,Y2,…,Ym是BP神经网络的预测值,wij和wjk为BP神经网络权值。从图可以看出,BP神经网络可以看成一个非线性函数,网络输入值和预测值分别为该函数的自变量和因变量。当输入节点数为n,输出节点数为m时,BP神经网络就表达了从n个自变量到m个因变量的函数映射关系。
1.2 遗传算法
遗传算法(Genetic Algorithms)是1962年由美国Michigan大学Holland教授提出的模拟自然界遗传机制和重托进货论而成的一种并行随机搜索最优化方法。它把自然界“优胜劣汰,适者生存”的生物进化原理引入优化参数形成的编码串联群体中,按照所选择的适应度函数并通过遗传中的选择、交叉和变异对个体进行筛选,使适应度值好的个体被保留,适应度差的个体被淘汰,新的群体既继承了上一代的信息,又优于上一代。这样反复循环,直至满足条件。
1.3 遗传算法优化BP神经网络的流程
遗传算法优化BP神经网络分为BP神经网络结构确定、遗传算法优化和BP神经网络预测3个部分。其中,BP神经网络结构确定部分根据按拟合函数输入输出参数个数确定BP神经网络结构,进而确定遗传算法个体的长度。遗传算法优化使用遗传算法优化BP神经网络的权值和阈值,种群中的每个个体都包含了一个网络所有权值和阈值,个体通过适应度函数计算个体适应度。遗传算法通过选择、交叉和变异操作找到最优适应度值对应个体。BP神经网络预测用遗传算法得到最优个体对网络初始权值和阈值赋值,网络经训练后预测函数输出。
遗传算法优化BP神经网络是用遗传算法来优化BP神经网络的初始权值和阈值,使优化后的BP神经网络能够更好地预测函数输出。遗传算法优化BP神经网络的要素包括种群初始化、适应度函数、选择操作、交叉操作和变异操作。
1)种群初始化
个体编码方法为实数编码,每个个体均为一个实数串,由输入层与隐含层连接权值、隐含层阈值、隐含层与输出层连接权值以及输出层阈值4部分组成。个体包含了神经网络全部权值和阈值,在网络结构已知的情况下,就可以构成一个结构、权值、阈值确定的神经网络。
2)适应度函数
2 实证分析
旅游客流量与当地旅游硬件及软件设施建设、各种交通设备的完善程度有着密切的关系。一个旅游地的交通设施完善程度决定了该景区的可进入性以及客源地到旅游地的时间距离,直接影响该景区游客量。此外,景区建设情况及旅游接待设施的建设情况决定着景区的吸引力。需要指出的是,由于信息传达的特性,游客数量对景区旅游相关条件改善的反应具有延迟性的特点。本文中,采用2000 年以来北京旅客周转量、人均GDP、全国交通、A级及以上景区个数、北京公共交通运营线路长度、北京市基础投资,预测北京市旅游人数。
通过查询中国国家统计局及北京市统计局相关资料,得到全国人均GDP、全国交通、北京市旅客周转量、北京市A级及以上景区个数、北京市公共交通运营线路长度、北京市基础投资数据,如表1所示。
根据遗传算法和BP 神经网络理论,在MATLAB 软件中编程实现基于遗传算法优化的BP神经网络进行预测。预测误差及真实值与预测值对比如图2、图3所示。
3 模型的评价
[关键词]模糊粒化;小波神经网络;股指区间预测
[DOI]101.3939/jcnkizgsc20162.71.1.3
1引言
随着股票市场的逐渐完善和发展,投资金融理财产品成为越来越多的家庭和个人的选择,股票就是其中重要的一种理财产品。近年来,人工神经网络是人工智能领域兴起的研究热点,并且凭借其优秀的非线性逼近和泛化能力在金融市场得到了广泛的应用。王文波等人进行了基于EMD 与神经网络的中国股票市场预测[1],任崇岭等人进行了基于小波神经网络的短时客流量预测研究[2],以上研究表明神经网络在股票市场上有较好的实际预测效果并获得了广泛的应用。潘晓明等人通过采用遗传算法的神经网络集成建立了一种股票市场预测模型。[3]刘沛汉等基于遗传算法优化进行了神经网络的光伏电站短期功率预测[4]等,上述研究结果表明遗传算法在优化神经网络进行预测,降低误差方面有显著作用。
传统神经网络预测多得到股指点的预测,但是股票市场随机性较大,投资者往往更希望得到股指在未来一段时间的波动区间作为投资参考。因此,文章通过将股指开盘数据模糊粒化,然后在小波神经网络基础上建立一种新型的股指区间预测模型,并使用遗传算法优化模型参数,获得更高的精度,预测未来一段时间内股指波动范围,为股市投资者提供投资参考。
2模型的建立
2.1信息粒化
1979年,LAzadeh教授提出了“信息粒化”(Information Granulation)的概念。信息粒化就是通过一定的划分准则,将原始数据中难以辨别,或者具有特定功能相似的数据聚集成多个集合,构成一个个信息粒,这种信息处理的方式称之为信息粒化。一般形式如下:
2.2基于遗传算法和BP学习的小波神经网络预测
2.2.1遗传算法的使用
遗传算法(Genetic Algorithm)是一种模拟生物进化机制的算法,具有较好的收敛性、极高鲁棒性和广泛适用性,可有效提高模型预测精度。因此,文章采用全局搜索能力较好的遗传算法优化网络参数,步骤如下。
2.2.2小波神经网络的建立
小波神经网络是在BP神经网络基础上,以小波基函数作为隐含层节点传递函数,信号前向传播的同时误差反向传播的神经网络。文章选取Morlet母小波基函数作为隐含层小波基函数:
采用梯度修正算法高模型的预测精度、使预测输出更接近期望输出,修正过程如下:
3实证分析
文章选择我国股票市场中的上证指数作为研究数据。文章选取201.4 年1.2月2.2 日至2016 年3 月16 日的300 个交易日的上证指数开盘数据进行预测,数据源于新浪财经。将300个开盘数据每4 天划分成一个数据粒,划分成75个数据块,隶属函数的参数即对应模糊上界,模糊中值和模糊下界。文章使用模糊下界和模糊上界作为股票指数所在的区间。
以股指分块数据的上界为例,选取前72个数据作为神经网络的训练集,后3个数据作为测试集。文章选取前6个数据作为小波神经网络的输入。隐含层节点的数目可根据经验公式[KF(]m+n[KF)]+α 计算,其中α 是取值0~10之间的常数,经过多次尝试隐含层节点为1.3时效果最好,输出层节点个数为1,文章的小波神经网络结构为6-1.3-1。
用遗传算法计算小波神经网络测初始状态,这里文章基于Matlab的Gatbx遗传算法工具箱进行编写。具体的参数设置为:①个体数目:50;②最大遗传代数:20;③变异概率:005;④交叉概率:08;⑤代沟:09。
采用梯度下降法训练小波神经网络,梯度下降训练具体参数如下:(1)小波神经网络权值学习速率η1=002;(2)小波基函数伸缩、平移因子学习速率η1=001;(3)小波神经网络最大迭代次数为600次。训练结果和训练误差如下。
利用训练好的小波神经网络得到2016年3月1日~3月16日的模糊上界的预测值。类似地,对上证指数模糊中间值以及模糊下界进行相同的处理方式,可以得到具体的股指预测区间为[2.73.6,2.889]、 [2.705,2.877]和[2.74.3,2.960]。2016年3月1日~2016年3月16日股指区间预测结果和实际股指图如下所示。
由上图可以看出,2016年3月1日―2016年3月16日一共1.2个交易日的数据几乎全部属于小波神经网络预测区间,并且模型预测区间波动较小,预测较为精确。模型可以较好地预测股票指数在没有重大政策影响的情况下的波动情况。
对于模型预测误差,本文采取均方根误差(RMSE),平均绝对百分比误差(MAPE),最大绝对误差百分比(MaxAPE)这三项指标来进行衡量。按照如下计算公式计算得到预测结果误差并得到计算结果:
4结语
文章提出了一种基于模糊粒化和遗传算法优化的小波神经网络股票指数区间预测模型。该模型通过对上证指数开盘数据进行模糊粒化,建立一个基于遗传算法优化的小波神经网络,并对未来几日的上证指数进行预测。实际结果表明,这一预测模型可以较好地预测未来4日上证指数的波动区间,并且具有较高的预测精度,可以作为股票投资者的一种投资参考,有效地规避风险,从而获取更大的收益。
参考文献:
[1]王文波,等基于EMD与神经网络的中国股票市场预测[J].系统工程理论与实践,2010,30(6):102.7-103.3.
[2]任崇岭,等基于小波神经网络的短时客流量预测研究[J].科学技术与工程,201.1,1.1(2.1):5099-5.103.
[3]潘晓明,等基于遗传算法神经网络集成股票市场预测研究[J].广西师范学院学报,2007,2.4(1):77-83.
[4]刘沛汉,等基于遗传算法优化神经网络的光伏电站短期功率预测[J].水电能源科学,2016,3.4(1):2.1.1-2.1.4.
为降低神经网络的冗余连接及不必要的计算代价,将量子免疫克隆算法应用于神经网络的优化过程,通过产生具有稀疏度的权值来优化神经网络结构。算法能够有效删除神经网络中的冗余连接和隐层节点,并同时提高神经网络的学习效率、函数逼近精度和泛化能力。该算法已应用于秦始皇帝陵博物院野外文物安防系统。经实际检验,算法提高了目标分类概率,降低了误报率。
关键词:神经网络;量子免疫克隆算法;目标分类;冗余连接;网络优化
中图分类号: TP273
文献标志码:A
Quantum-inspired clonal algorithm based method for optimizing neural networks
Abstract:
In order to reduce the redundant connections and unnecessary computing cost, quantum-inspired clonal algorithm was applied to optimize neural networks. By generating neural network weights which have certain sparse ratio, the algorithm not only effectively removed redundant neural network connections and hidden layer nodes, but also improved the learning efficiency of neural network, the approximation of function accuracy and generalization ability. This method had been applied to wild relics security system of Emperor Qinshihuangs mausoleum site museum, and the results show that the method can raise the probability of target classification and reduce the false alarm rate.
Key words:
neural network; quantum-inspired clonal algorithm; target classification; redundant connection; network optimization
0 引言
神经网络已经被广泛地应用于模式分类、函数逼近、信号预测等各种领域,是近年来的研究热点之一[1-2]。在应用过程中,研究人员发现,当神经网络的规模过大会产生连接数量冗余大、计算代价过高的问题,降低了大规模神经网络的实用性。针对此问题,研究人员提出了多种方法在保持神经网络的前提下优化神经网络的结构和参数权值。Leung等[3-4]改进了传统的遗传算法(Genetic Algorithm, GA)并将其应用于神经网络的结构和权值优化过程,利用遗传算法的快速收敛性来提高神经网络的学习速度,其缺点在于当目标函数维数过大时容易陷入局部最优。Xiao等[5]使用混合优点(Hybrid Good Point, HGP)优化前向神经网络的参数和结构,避免权值陷入局部最优,但其对网络结构的优化没有达到最优。Shu等[6]提出正交模拟褪火(Orthogonal Simulated Annealing, OSA)算法, 使用褪火算法和正交算法的优点来同时优化神经网络结构和参数,其算法收敛速度快、鲁棒性好,缺点则在于计算代价较大。杜文莉等[7]提出了使用量子差分进化(Cooperative Quantum Differential Evolution, CQGADE)算法来优化神经网络权值,使用量子遗传算法优化网络结构和隐层节点数,算法综合了量子遗传算法和量子差分算法的优点,收敛速度快,但其缺点在于需要同时协同两种算法的优化结果,算法复杂度较高,且容易陷入局部最优。Tsai等[8]提出混合田口遗传算法(Hybrid Taguchi Genetic Algorithm, HTGA),将传统的GA与Taguchi方法结合起来,使得算法具有鲁棒性好、收敛性快等优点,但其缺点在于获得最优解的计算代价较大。
量子免疫克隆算法[9-12](Quantum-inspired Immune Clonal Algorithm, QICA)也称为量子遗传算法(Quantum Genetic Algorithm, QGA),其将量子搜索机制和免疫算法克隆选择原理相结合,利用量子编码的叠加性和随机性构造抗体,利用遗传算法的克隆操作产生原始种群和克隆子群实现种群扩张,使搜索空间扩大,提高了局部搜索能力;同时借助全干扰交叉操作避免陷入局部最优。QICA采用了多状态量子比特编码方式和通用的量子旋转门操作, 引入动态调整旋转角机制和量子交叉[11]。QICA在组合优化问题中具有良好的表现。
针对上述问题,提出了使用量子克隆免疫算法对神经网络的结构和连接权值同时进行优化,通过产生具有一定稀疏度的连接权值对网络隐层数量和连接权值进行优化,提高了算法的效率和收敛速度,避免了算法陷入局部最优。
1 带开关权值的神经网络模型
在经典的神经网络理论中,网络结构在初始化后便不再变动,仅通过权值的变化来计算产生结果,这种算法增加了神经网络的结构复杂性,在实际应用中增加了计算结果的代价。Leung等[3-4]提出了带开关权值的神经网络,通过调整开关的通断就能调整神经网络的结构和连接数量,从而减少计算代价。带开关权值的神经网络模型如图1所示[7]。
2.2 权值计算及优化方法
根据量子克隆免疫理论,将神经网络权值计算及优化过程分为以下四个过程。
2.2.1 权值抗体初始化
量子克隆免疫算法是基于量子计算和遗传算法组成的,其抗体的编码方式采用量子比特编码。一个抗体中的量子位的状态是不确定的,可以为0或1,其状态表示为式(5):
3.1 算法复杂度分析
量子克隆免疫算法的实质是通过量子理论的随机特性提供丰富的种群数量,并通过使用遗传算法对种群进行淘汰和进化,因此其算法的复杂度等于种群生成算法的复杂度:假设神经网络有x个输入,其隐层节点数量为N,输出为y,则网络中的输入与隐层节点间的连接权值ω的数量为:x*N,隐层节点与输出层的连接权值v的数量为:N*y。种群生成需要对所有节点进行权值初始化,并将随机位置的n(nN)个节点的权值设置为0, 其算法复杂度为O(n2)。而克隆免疫算法在种群克隆及抗体选择过程中使用遗传算法,因此其算法的复杂度与传统遗传算法相同,其算法复杂度也为O(n2)。因此,使用量子免疫克隆的神经网络优化算法的复杂度为O(n2)。
3.2 非线性函数逼近
选取复杂交互非线性函数(Complicated Interaction Function,CIF):
其中0
选取样本700组,其中500组用于训练,其余200组用于检测性能。神经网络的初始隐层神经元设置为20个,初始网络结构为:2-20-1,初始连接权值为随机值。在此条件下验证不同稀疏度条件下对CIF的二维逼近效果如图3所示。
图3显示随着稀疏度的不断降低,神经网络的逼近能力有所减弱,逼近误差则逐渐增大。这主要是因为神经网络中的连接权值数量降低,造成神经网络的适应性差。具体逼近效果见表2。
从表2中可以看出,隐层节点数量直接影响着神经网络的性能。高稀疏度条件下的计算量大,但逼近精度高;低稀疏度条件下的计算量小,但逼近精度较差。实验表明当稀疏度大于0.6时,算法的逼近精度高于90%,优化后的网络具有较好的非线性逼近能力。当神经网络隐层节点数量低于12时逼近精度大幅下降,说明此时神经网络处理信息的能力也随之大幅减弱,隐层节点的最合适的数量为12~14个,这也符合文献[14]的实验结果。
图4为不同稀疏度下,算法适应度的收敛情况。可以看出量子克隆免疫算法具有很好的收敛特性,算法收敛速度很快,能够在很短的进化次数内收敛至极值,且稀疏度越低,神经网络的连接权值数量越少,算法收敛速度越低,最优适应度越差。
表3为相同条件下,不同算法的最优计算结果,包括目标分类的准确度、隐藏层节点数量等。可以看出,当稀疏度高于0.8时,本文算法收敛性和适应度均优于混沌粒子群(Chaotic Particle Swarm Optimization,CPSO)[15]、粒子群优化算法(Particle Swarm Optimization,PSO)[16]、混合田口遗传算法[Hybrid Taguchi-Genetic Algorithm,HTGA][8]等其他算法,说明算法具有很好的收敛速度、寻优精度和鲁棒性。
3.3 微地震信号目标分类
实验场地选择在秦始皇兵马俑博物馆内K9901号坑旁。所有传感器节点沿公路一侧直线部署,距离公路1m左右。可能产生地震波的活动物体包括人员行走、机动车和挖掘活动。将采集到的微地震信号进行滤波、分帧、特征提取等处理后输入至神经网络进行模式识别。
系统对传感器采集到的数据进行分帧,并使用功率谱二次分析[17]算法对其进行处理,最后将经过预处理的数据输入至神经网络对其进行分类。根据其活动特点,将输出目标分为三类:人员活动、挖掘活动以及机动车辆活动。传感器采集到的三类活动的经典波形如图5所示。
表6中给出了算法的最优计算结果,包括不同稀疏度条件下神经网络的隐藏层节点数量、最优适应度以及分类准确率等。可以看出,算法能够有效减少冗余的隐藏层节点数量,并降低节点连接数量。算法的稀疏度越高,其适应度越好,其分类的准确性越好,但稀疏度高带来的则是计算代价增大、计算复杂度增加。当稀疏度低于0.7时,算法的适应度变差,目标的识别率为90%,在实际应用过程中带来了误判率较高的问题,降低了实用性。因此在秦始皇帝陵博物院野外文物安防系统中使用了稀疏度为0.7的算法对模式识别的神经网络进行优化。
4 结语
本文提出了基于量子免疫克隆算法的神经网络优化算法,该算法在训练神经网络优化权值的同时删除了冗余连接和多余的隐层节点,实现了神经网络结构和网络权值的优化。通过经典非线性函数逼近和目标识别检验,算法能够有效地优化神经网络,提高神经网络的优化效率,减少计算复杂度。使用优化后的神经网络已经用于秦始皇帝陵博物院野外文物安防系统中。
参考文献:
[1] QIAO H, ZHOU Y,SHAO N, et al. Software reliability prediction based on learning vector quantization neutral network[J]. Journal of Computer Applications, 2012,32(05):1436-1438.)(乔辉,周雁舟,邵楠,等.基于学习向量量化神经网络的软件可靠性预测[J].计算机应用,2012,32(5):1436-1438.)
[2] PAN Y, DENG Y, ZHANG Q, et al. Deterministic prediction of wavelet neural network model and its application[J]. Journal of Computer Applications,2013, 33(4):1001-1005.(潘玉民,邓永红,张全柱,等.小波神经网络模型的确定性预测及应用[J].计算机应用,2013,33(4):1001-1005.)
[3] LEUNG H F,LAM H F, LING S F, et al. Tuning of the structure and parameters of neural network using an improved genetic algorithm[C]// Proceedings of the 27th Annual Conference of IEEE Industrial Electronics Society. Piscataway: IEEE,2001:25-30.
[4] LEUNG H F, LAM H F, LING S H, et al. Tuning of the structure and parameters of a neural network using an improved genetic algorithm[J]. IEEE Transactions on Neural Network,2003,14(1):79-88.
[5] XIAO C, CAI Z, WANG Y, et al. Tuning of the structure and parameters of a neural network using a good points set evolutionary strategy[C]// Proceedings of the 9th International Conference for Young Computer Scientists. Piscataway: IEEE, 2008:1749-1754.
[6] SHU L, HO S Y, HO S J. Tuning the structure and parameters of a neural network using an orthogonal simulated annealing algorithm[C]// Proceedings of the 2009 Joint Conferences on Pervasive Computing. Piscataway: IEEE,2009:789-792.
[7] DU W, ZHOU R, ZHOU L, et al. Cooperative quantum differential evolution algorithm based method for optimizing neural networks[J].Journal of Tsinghua University: Science and Technology, 2012,52(3):331-335.(杜文莉,周仁,赵亮,等. 基于量子差分进化算法的神经网络优化方法[J].清华大学学报:自然科学版,2012,52(3):331-335.)
[8] TSAI J, CHOU J, LIU T. Tuning the structure and parameters of a neural network by using hybrid Taguchi-genetic algorithm[J]. IEEE Transactions on Neural Network, 2006,17(1):69-80.
[9] LI Y, JIAO L. Quantum-inspired immune clonal algorithm and its application[C]// Proceedings of the 2007 International Symposium on Intelligent Signal Processing and Communication Systems. Piscataway: IEEE, 2007:670-673.
[10] JIAO L, LI Y, GONG M,et al. Quantum-inspired immune clonal algorithm for global optimization[J]. IEEE Transactions on Systems, Man and Cybernetics, Part B: Cybernetics, 2008,38(5):1234-1253.
[11] ZHOU C, QIAN F. Improvement of quantum genetic algorithm and its application[J]. Journal of Computer Applications, 2008,28(2):286-288.(周传华,钱峰.改进量子遗传算法及其应用[J].计算机应用, 2008,28(2):286-288)
[12] ZHOU Q, JIANG S, ZHAO X, et al. Improved quantum genetic algorithm and its application in test data generation[J]. Journal of Computer Applications,2012,32(2):557-560.(周绮,姜淑娟,赵雪峰,等.改进的量子遗传算法及其在测试数据生成中的应用[J].计算机应用,2012,32(2):557-560.)
[13] QIAO J,LEE Y G, SCOTT D S, et al. Self-organizing radial basis function network for real-time approximation of continuous-time dynamical systems[J]. IEEE Transactions on Neural Networks,2008,19(3):460-474.
[14] HAN H, QIAO J, BO Y, et al. On structure design for RBF neural network based on information strength[J]. Acta Automatica Sinica, 2012,38(7):1083-1090.(韩红桂,乔俊飞,薄迎春,等.基于信息强度的RBF神经网络结构设计研究[J].自动化学报, 2012,38(7):1083-1090.)
[15] ZHAO L. Fuzzy identification and neural networks learning based on cooperative PSO algorithm[D]. Shanghai: Shanghai Jiao Tong University,2008.(赵亮.基于协同PSO算法的模糊辨识与神经网络学习[D].上海:上海交通大学,2008.)
关键词:微地震;震源探测;遗传算法;BP人工神经网络法
中图分类号:P315 文献标识码:A
微地震属于一种小型地震,经常发生在地下矿井深部开采过程中的一种不可避免的现象。在20世纪80年代中期发展起来的微震探测技术源于声发射学和地震学,是区别于常规地震的地球物理勘探技术,根据声发射检测技术演化发展起来,主要应用于油气工业中。而探测可以导致微地震的地质活动,有着重大的现实意义和指导意义。
1 物探技术研究进展
20世纪70年代初期,为了确认开发井的目标和叙述辅助的断裂层,水力压裂微震探测技术始于地热领域。70年代末,美国Los Alamos国家实验室在Fenten山热干岩进行了3年的井下微震观测研究的现场实验,验证了水力裂缝的方位可以通过水力压裂时产生的水平微震来确定。90年代以后,荷兰飞利浦、加拿大金斯敦ESG组织、英国KEELE大学、日本JAPEX研究生中心等机构对于微震检测技术在油气工业中的应用提供了较多的理论与实验支撑。国内关于微震探测技术的研发相对较晚,但近年来,从基础理论研究和自主研发方面都取得了很大的成果。在基础理论研究方面,相继提出了瑞雷波频散曲线的正反演、遗传算法和局域搜索算法的联合反演、射线追踪法以及滤波技术等研究方法。在自主研发方面,主要有微震探测系统、基于三分量检波器的探测系统、遥测地震仪和基于Labview的微震探测系统等。
2 探测技术研究方法
2.1 射线追踪正演算法
本文主要通过基于射线法进行正演研究。射线法,可以利用不断更新的射线路径,对各种复杂的地质结构选择地震波在介质中的最佳运动轨迹。同时,迭代法可以通过结点的增减,来完成地震波传播路径的探测工作。综合微变网格法,经过设计得到复杂模型微震射线路径追踪法。
2.2 非线性反演算法
在探测过程中,非线性最优算法发展最为迅速,需要通过微震资料的反演来定位震源和了解速度场变化。非线性反演方法中应用最广泛的主要有遗传算法(GA,Genetic Algorithm)和人工神经网络法(ANN,Artificial Neural Network)方法中的BP神经网络。本文将GA算法和BP算法结合,通过联合反演方法讨论微震震源的定位反演。
2.2.1 遗传算法反演
遗传算法,是一种全局最优算法,可以结合定向和随机搜索方法,是模拟达尔文生物进化论的自然选择与遗传学机理的生物进化过程和机制的计算模型。1975年,J. Holland教授提出了遗传算法。目前,遗传算法发展完善,有着搜索过程多维化、简单化、适应性强以及全局性的特点。通过对遗传算法、加速收敛和正演参数的确定,明确介质模型参数的搜索范围,最后对遗传算法获取的反演数据进行处理。
2.2.2 BP神经网络算法反演
二十世纪80年代,人工神经网络的研究进入了一个新。它易于处理复杂非线性问题,具有持久性和适时预报性的特点,被广泛应用于多个领域。其中,BP人工神经网络(BP,Back Propagation),是目前应用最为广泛的人工神经网络模型之一,是一种按误差逆传播算法训练的多层前馈网络,是可以计算单个权值变化引起网络性能变化值的较为简单的方法,在地球物理勘测方面发挥了重大作用。BP神经网络反演方法的主要步骤分为两部分,分别为学习训练和迭代反演。
2.2.3 GA-BP联合反演方法
GA算法与BP算法的混合,可以结合全局最优算法和局部最优算法的优点,弥补对方的缺点,使其交叉变异率具备自学习、自适应等特征,并且能够快捷、有效的获取最优解,提供神经网络的预测能力。进行GA算法和BP算法的联合反演,二者需持续运行,并且按照一定的比例进行。图1为基于混合算法的微地震震源定位反演算法流程。
3 研究展望
发展基于遗传算法的全局混合优化算法已成为新的发展趋势。而对于非线性反演,尤其是面对地球物理资料联合反演,通过算法指挥由不同反演方法和迭代过程组织成系统,使之输出分辨率最优而方差最小的地球物理介质模型,是其非常重要的研究方向。
参考文献
[1]李琼,李勇,李正文,吴朝容.基于GA-BP理论的储层视裂缝密度地震非线性反演方法[J].地球物理学进展,2006,21(02):465-471.
种趋势。为了帮助用户动态择出最能满足用户需求的Web服务,本文提出一个基于Web Service 服务质量的预测建模,通过动态的预测Web服务下一阶段服务质量来帮助用户选择最优服务。
关键词 Web服务;QoS预测;建模
中图分类号TP39 文献标识码A 文章编号 1674-6708(2012)78-0193-02
1 背景
随着Web服务的发展,Web服务技术已从最初的理论实验阶段逐步走向了大规模的商业应用阶段(如亚马逊,微软等公司),这样的结果就是网络上出现了大量功能相同或相似的Web服务。而这些类似的Web服务,往往具有不同的诸如稳定性、响应时间、可靠性等非功能性属性。这也使得我们在选择这些Web服务时,就必须考虑他们的非功能性属性,即服务质量(QoS,Quality of Service)。用户在面对网络上海量的Web服务,特别是面对这些功能上相同或相似的候选服务时,如何动态地选择出最能满足用户需求的服务已经成为Web服务发现与选择以及组合领域中的一个核心问题。面对动态最优服务选择问题,在功能匹配前提上,考虑Web服务的服务质量是一个行之有效的解决途径。
我们根据Web服务质量来动态选择服务时,就必须对Web服务的服务质量进行准确的评估预测。我们知道,互联网具有不稳定性、网络延时,抖动等特性,因而Web服务的服务质量是动态变化的。现提出的一些Web服务质量评估方法在服务质量评估过程中没有充分考虑服务质量的动态变化,没有建立一个比较合适合对服务质量进行动态评估的评估机制,不能达到对服务的表现进行准确预测的效果。为了克服这一局限性,本文提出了一种利用遗传算法优化的BP神经网络对服务质量进行动态预测的评估方法。在此强调一下,本文中提出的预测评估是对服务质量中反映服务表现的动态客观属性(如响应时间,可靠性,可用性等)进行预测。
2 Web Service 服务质量预测模型
2.1 服务质量预测模型介绍
BP(Back Propagation)网络是由Rumelhart和McCelland为首的科学家小组于1986年提出的一种神经网络算法,具有信号向前传递,误差反向传播的特性。利用该特性结合使用大量的训练数据训练网络,即得到一个具有最优权值和阈值的神经网络。遗传算法是由J.Holland教授于1975年首先提出来的一种神经网络算法。它的最大特征就是模拟达尔文进化论的自然选择和遗传学机理,实现“优胜劣汰,适者生存”,从而得到优解。遗传算法的核心就是把“优胜劣汰,适者生存”的进化论理论应用到算法里面的具体参数当中。它将初始的群体进行编码,个体之间进行交叉和变异操作,然后按照适应度函数对群体中的个体进行筛选,实现优胜劣汰。
本文提出的预测模型就是遗传算法优化BP神经网络的预测模型。遗传算法优化的BP神经网络总体可以分为三步:第一步,利用BP神经网络来确定网络结构,确切来说是根据拟合函数的输入输出参数个数来确定BP神经网络结构,从而确定遗传算法中个体的编码长度;第二步,利用遗传算法来优化神经网络,即使用遗传算法来不断优化BP神经网络的权值和阈值,我们在编码时设置种群中的每个个体都包含了一个网络中所有的权值和阈值,个体通过适应度函数计算个体适应度值,遗传算法通过选择,交叉和编译操作找到最优适应度值的个体;最后是用前面得到的最优BP神经网络来做Web服务服务质量预测,以Web服务的历史QoS数据作为神经网络的输入,经过网络的计算得到我们所需的QoS预测值,为Web服务的选择提供依据。遗传算法优化BP神经网络算法流程如图1所示。
2.2 仿真实验
为了验证本文提出的Web Service服务质量预测算法,我们将采用由Zibin Zheng 和Michael R. Lyu提供的WS-DREAM dataset,这些数据是由他们以调研大量现实Web Service为基础采集而得,在Web服务QoS领域具有很大的说服力与权威性。我们将采用数据集中的响应时间(response time)来做本次仿真实验。在实验中,我们取dataset中id为1992的Web Service的响应时间实验数据,BP神经网络结构为:输入层2个节点,隐含层5个节点,输出层1个节点,共有2×5+5×1=15个权值,5+1=6个阈值,因此我们可以确定遗传算法中个体的编码长度为15+6=21.取id为1992的Web Service响应时间的前200个数据为训练数据,剩余作为测试数据。我们把训练数据预测误差绝对值和作为个体适应度值,个体适应度值越小,该个体越优。截取实验测试结果示图如图2。
3 结论
互联网具有不稳定性、网络延时,抖动等特性,因而Web服务的服务质量是动态变化的。这在一定程度上影响了我们基于服务质量来发现服务,选择服务和组合服务。本文正是在这种背景下,结合BP神经网络与遗传算法提出了一种基于服务质量预测的Web服务动态选择方法,并详细介绍了基于QoS预测服务质量预测模型,最后利用郑子彬提供的真实Web服务QoS数据做实验验证前面提出的算法。下一步工作将继续完善服务质量预测模型,并将该预测模型应用于我们973项目组自己开发一个Web服务平台之中。
参考文献
[1]Zibin Zheng, Hao Ma, Michael R.Lyu, Irwin King, "WSRec: A Collaborative Filtering based Web Service Recommender System", in Proceedings of the 7th IEEE International Conference on Web Services (ICWS2009), Los Angeles, CA, USA, July 6-10, 2009.
关键词:期货价格预测BP神经网络遗传算法
引言及文献综述
20世纪以来,我国期货市场得到了长足发展,但相对而言,由于我国期货市场仍处于低级阶段,市场操纵严重,投资者投资理念不科学等问题使市场风险事件不断发生,直接阻碍了中国期货市场走向成熟。诸多风险事件归根结蒂,就是期货价格的波动问题,故分析与预测期货价格变化趋势自然成为期货市场风险控制研究的重中之重,与此同时,了解期货价格走势也有助于帮助投资者降低风险、提高收益,实现金融市场的整体稳定与协调。
国外期货市场起步较早,在期货市场预测的研究和实践方面开展了大量有价值的工作,Shaikh A.Hamid,Zahid Iqba(2004)用神经网络预测标普500指数期货价格的波动;Shahriar Yousefi,Ilna Weinreich等(2005)提出一种基于小波变换的预测程序并用来对原油期货进行预测。在我国,学者们也试图通过计量模型对期货价格进行预测:张方杰、胡燕京(2005)的ARMA模型,王习涛(2005)的ARIMA模型,刘轶芳、迟国泰(2006)的GARCH―EWMA的期货价格预测模型、杨熙亮、朱东华、刘怡菲(2006)的BP神经网络模型等都在期货价格预测中得到应用。
总结国内外对期货价格的预测研究,可以发现对期货的预测存在一系列问题,比如:期货数据具有高噪声;各因素之间的相关性错综复杂;期货价格具有非线性特征等等。在这种情况下,人工神经网络方法就显示出其特有的优势,因此本文选择了BP网络模型作为期货短期预测的基本因果模型,并根据实际应用的需要做了创造性的改进。
实证分析
1.变量的选取及数据来源
本文选择大连商品交易所的大豆期货合约为研究对象,作为比较稳定的交易品种,它的走势一定程度上可以反映所在交易所的交易状况,对它的预测情况在一定程度上也可以反映对其交易所其他期货预测的可行性。综合考虑数据可得性、完整性等因素,本文选取2009年1月5日~10月29日的大豆期货主力A1001合约共200个交易数据作为训练数据,10月30日~11月12日的10个数据为测试数据。数据来源于大连商品交易所。
由于期货价格变化受许多因素的影响,为了尽可能提高预测的准确性,输入变量选择为当日开盘价、当日最高价、当天最低价、当日收盘价、结算价、当日成交量、成交金额以及当日持仓量,总共8个输入量。
2. BP神经网络模型的建立及实现
误差反传模型(BP神经网络模型)可任意逼近非线性函数,其运行过程分为信号的正向传播和误差的反向传播两阶段:第一阶段,将样本从输入层传入,经各隐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则转入第二阶段,将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,并以此来修正各单元权值。
根据kolmogorov定理,一个三层的BP神经网络足以完成任意的n维到m维的映射,即一般只需要采用一个隐层就足够。隐层节点个数本文采用试凑法确定为20个。为使提高训练精度,本文将初始学习率定为0.05,并采用自适应调节学习率功能,在以后的训练过程中根据训练误差来自动调节学习率。同时,本文选取连续可微的S型正切函数即tansig函数作为传导函数,该函数的可微分性与饱和非线性特性,增强了网络的非线性映射能力。
依据以上模型与参数设定,在matlab中予以实现,结果图1所示,从图中可以看出,对大豆期货价格预测的走势是大致相同的,但是整体误差较大。虽然利用自适应调节学习率来改善收敛情况,但梯度下降的BP算法仍存在较大的局限性。为了改善神经网络的权值调整,所以用遗传算法对BP神经网络进行优化。
3.模型的改进及实现
遗传算法是一种全局优化搜索算法,其基本思想是首先将问题求解表示成基因型,通过选择,交叉,变异从中选取适应环境的个体,求得问题最优解,有较好的全局搜索性能。将遗传算法运用到神经网络模型,实现了两者的优势互补,发挥了神经网络的广泛映射能力和遗传算法的全局搜索能力,也加快了网络的学习速度,综合提高了整个学习过程中模型的逼近能力和泛化能力。
在MATLAB中运行结果如图2所示,从中可以看出,加入遗传算法对权值和阈值进行优化以后的GA-BP模型结果能更好的贴近真实值,更准确的拟合。在本例中GA-BP模型的优势突出的表现在收敛速度快,周期短上面。相对于传统的BP算法减少了权值阈值初始化的随机性,GA-BP就可以大大缩短收敛时间。收敛情况如表1所示:
表中以前200次迭代为例,遗传算法可以将mse缩减到e-5数量级,而简单的BP神经网络却只能达到e-3,并且迭代的后期下降的幅度越来越不明显。
结论
基于BP神经网络模型进行实证分析,从预测的结果来看,预测值和实际值的走势是一致的,但预测值和实际值具有较大的偏差,这是由于BP神经网络自身存在的问题所导致的。
为解决BP神经网络模型不能精确预测的价格的问题,考虑到是由于BP算法调整权值的局限性,本文用遗传算法进行优化模型。利用遗传算法可以对权值进行全局搜索,避免了BP算法的局限性。从结果来看,预测值和实际值误差较小,能够精确的预测期货价格。