前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络的难点主题范文,仅供参考,欢迎阅读并收藏。
关键词:模糊控制;人工神经网络;人脸识别
中图分类号:TP18 文献标识码:A文章编号:1009-3044(2011)16-3904-03
随着人工智能技术的飞速发展,机器视觉已经成为当前人工智能研究领域的一大热点,很多国家的研究人员都开展了对机器视觉的研究,其中以机器视觉识别人脸最为困难,这主要是因为人的面部带有表情,不同的人具有不同的脸,而不同的脸具有不同的表情,不同的表情则具有不同的面部特征,如何让计算机通过机器视觉高效率的识别人脸,成为当前机器视觉和智能机器人关键技术领域的技术难题。
随着模糊逻辑控制算法和人工神经网络算法的发展,对于机器视觉识别人脸特征的算法也有了新的发展,目前多数研究算法所采用的人脸识别从实现技术上来说,主要可以分为以下几个类别:
1) 基于人脸几何特征进行的识别算法,该算法运算量较小,原理简单直观,但是识别率较低,适合应用于人群面部的分类,而不适宜于每一个人脸的识别。
2) 基于人脸特征的匹配识别算法,这种算法是预先构建常见的人脸特征以及人脸模板,构成人脸特征库,将被识别的人脸与特征库中的人脸进行逐一比对,从而实现人脸识别,该算法识别效率较高,但是应用有一定局限性,只能够识别预先设立的人脸特征库中的人脸模型,因此人脸特征库就成为该算法实现的技术关键。
3) 基于统计的人脸识别算法,该算法将人脸面部进行特征参数的划分,如两眼距离大小,五官之间距离等,通过构建统计特征参数模型实现对人脸模型的识别,该算法识别率较高,但是算法实现起来运算量比较大,且识别效率较低。
4) 基于模糊逻辑的人脸识别算法,这一类算法主要结合了模糊逻辑和神经网络能够自我训练学习的机制实现对人脸的识别,识别率较高,且算法运算量适中,但是算法的原理较难理解,且模糊逻辑控制规则的建立存在一定技术难度。
本论文主要结合模糊人工神经网络方法,将其应用于计算机人脸识别,以期从中能够找到有效可靠的人脸识别方法及其算法应用,并以此和广大同行分享。
1 模糊逻辑及人工神经网络在图像辨识中的应用可行性分析
1) 人脸识别的技术难点
由于计算机只能够认识0和1,任何数据,包括图像,都必须要转化为0和1才能够被计算机识别,这样就带来一个很复杂很棘手的问题:如何将成千上万的带有不同表情的人脸转变为数字信号并被计算机识别。由于人的面部带有表情,不同的人具有不同的脸,而不同的脸具有不同的表情,不同的表情则具有不同的面部特征,因此这些都成为了计算机识别人脸特征的技术难点,具体来说,人脸实现计算机识别的主要技术难度包括:
① 人脸表情:人有喜怒哀乐等不同表情,不同的表情具有不同的面部特征,因此如何分辨出不同表情下的人脸特征,这是首要的技术难点;
② 光线阴影的变换:由于人脸在不同光线照射下会产生阴影,而阴影敏感程度的不一也会增加计算机识别人脸特征的难度;
③ 其他因素:如人随着年龄的增长面部特征会发生些微变化,人脸部分因为装饰或者帽饰遮挡而增加识别难度,以及人脸侧面不同姿态也会对计算机识别带来技术难度。
2) 模糊人工神经网络在人脸辨识中的应用可行性
如上分析所示,计算机识别人脸,需要考虑的因素太多,并且每一种因素都不是线性化处理那么简单,为此,必须要引入新的处理技术及方法,实现计算机对人脸的高效识别。根据前人的研究表明,模糊人工神经网络算法是非常有效的识别算法。
模糊理论和神经网络技术是近年来人工智能研究较为活跃的两个领域。人工神经网络是模拟人脑结构的思维功能,具有较强的自学习和联想功能,人工干预少,精度较高,对专家知识的利用也较少。但缺点是它不能处理和描述模糊信息,不能很好利用已有的经验知识,特别是学习及问题的求解具有黑箱特性,其工作不具有可解释性,同时它对样本的要求较高;模糊系统相对于神经网络而言,具有推理过程容易理解、专家知识利用较好、对样本的要求较低等优点,但它同时又存在人工干预多、推理速度慢、精度较低等缺点,很难实现自适应学习的功能,而且如何自动生成和调整隶属度函数和模糊规则,也是一个棘手的问题。如果将二者有机地结合起来,可以起到互补的效果。
模糊逻辑控制的基本原理并非传统的是与不是的二维判断逻辑,而是对被控对象进行阈值的设计与划分,根据实际值在阈值领域内的变化相应的产生动态的判断逻辑,并将逻辑判断规则进行神经网络的自我学习,逐渐实现智能判断,最终实现准确的逻辑判断。相较于传统的线性判断规则,基于模糊规则的神经网络是高度复杂的非线性网络,同时由于其广阔的神经元分布并行运算,大大提高了复杂对象(如人脸)识别计算的效率,因此,将模糊神经网络算法应用于人脸的智能识别是完全可行的。
2 基于模糊人工神经网络的人脸识别方法研究
2.1 基于模糊神经网络的人脸识别分类器设计
1) 输入、输出层的设计:针对模糊神经网络层的输入层和输出层的特点,需要对识别分类器的输入、输出层进行设计。由于使用BP神经网络作为识别分类器时,数据源的维数决定输入层节点数量,结合到人脸的计算机识别,人脸识别分类器的输入输出层,应当由人脸特征数据库的类别数决定,如果人脸数据库的类别数为m,那么输入、输出层节点数也为m,由m个神经元进行分布式并行运算,能够极大提高人脸识别的输入和输出速度。
2) 隐藏层结点数的选择:由于一般的BP神经网络都是由3层BP网络构成:输入层,隐藏层和输出层,隐层的数量越多,BP神经网络越复杂,那么最终能够实现的运算精度就越高,识别率也就越高;但是随着隐层数量的增加,随之而来的一个突出的问题就是神经网络变的复杂了,神经网络自我训练和学习的时间变长,使得识别效率相对下降,因此提高精度和提高效率是应用模糊神经网络的一个不可避免的矛盾。在这里面向人脸识别的分类器的设计中,仍然采用传统的3层BP神经网络构建人脸识别分类器,只设计一层隐层,能够在保障识别精度的前提下有效的保障神经网络学习和训练的效率,增加人脸识别的正确率。
3) 初始值的选取:在设计了3层BP神经网络的基础上,需要确定神经网络的输入初始值。由于模糊神经网络是非线性的,不但具有线性网络的全部优点,同时还具有收敛速度快等特点,而初始值的选取在很大程度上影响神经网络的学习训练时间的长短,以及是否最终能够实现收敛输出得到最优值。如果初始值太大,那么对于初始值加权运算后的输出变化率趋向于零,从而使得神经网络自我学习训练趋向于停止,最终无法得到收敛的最优值;相反,我们总是希望初始值在经过每一次加权运算后的输出都接近于零,从而能够保证每一个参与运算的神经元都能够进行调节,最终实现快速的收敛。为此,这里将人脸识别的初始值设定在[0,0.2]之间,初始运算的权值设定在[0,0.1]之间,这样都不太大的输入初始值和权值初始值能够有效的保证神经网络快速的收敛并得到最优值。
如果收敛速度太慢,则需要重新设置权值和阈值。权值和阈值由单独文件保存,再一次进行训练时,直接从文件导出权值和阈值进行训练,不需要进行初始化,训练后的权值和阈值直接导入文件。
2.2 人脸识别的神经网络训练算法步骤
1) 神经网络的逐层设计步骤:神经网络需要按层进行设计,构建信号输入层、模糊层以及输出层,同时还要构建模糊化规则库,以构建神经网络模糊算法的完整输入输出条件。具体构建人脸识别的神经网络层可以按照下述步骤执行:
Step 1,构建信号输入层,以视觉摄像头为坐标原点构建人脸识别坐标系统,这里推荐采用极坐标系统构建识别坐标系,以人脸平面所处的角度与距离作为信号的输入层,按照坐标系的变换得到神经网络信号输入的距离差值和角度差值Δρ,Δθ,作为完整的输入信号。
Step 2,构建模糊化层,将上一层信号输入层传输过来的系统人脸识别信号Δρ与Δθ进行向量传输,将模糊化层中的每一个节点直接与输入信号向量的分量相连接,并进行信号矢量化传输;同时在传输的过程中,根据模糊化规则库的条件制约,对每一个信号向量的传输都使用模糊规则,具体可以采用如下的隶属度函数来进行模糊化处理:
(1)
其中c ij 和σij分别表示隶属函数的中心和宽度。
Step 3,构建信号输出层,将模糊化层经过模糊处理之后的信号进行清晰化运算,并作为最终结果输出。
关于模糊规则库的建立,目前所用的方法都是普遍所采用的匹配模糊规则,即计算每一个传输节点在模糊规则上的适用度,适用就进行模糊化规则匹配并进行模糊化处理,不适用则忽略该模糊规则并依次向下行寻找合适的模糊规则。当所有的,模糊规则构建好之后,需要对每条规则的适用度进行归一化运算,运算方法为:
(2)
2) 人脸的识别算法按如下步骤执行:
Step 1:一个样本向量被提交给网络中的每一个神经元;
Step 2:计算它们与输入样本的相似度di;
Step 3:由竞争函数计算出竞争获胜的神经元,若获胜神经元的相似度小于等于相似度门限值ν,则计算每个神经元的奖惩系数γi,否则添加新的神经元;
Step 4:根据学习算法更新神经元或将新添加的神经元的突触权值置为x;
Step 5:学习结束后,判断是否有错误聚类存在,有则删除。
其中,
(3)
di是第i个神经元的相似度值,β为惩罚度系数,ν为相似度的门限值。γ的计算方法是对一个输入样本x,若竞争获胜神经元k的相似度dk≤ν,则获胜神经元的γk为1,其它神经元的γi=-βdi/ν,i≠k;若dk >ν,则添加新的神经元并将其突触权值置为x。
实际上,网络训练的目的是为了提高本算法的权值实用域,即更加精确的实现对人脸特征的识别,从而提高算法的人脸识别率,当训练结束后,即可输出结果。
2.3 算法仿真测试
为了验证本论文所提出的人脸识别模糊神经网络算法的有效性和可靠性,对该算法进行仿真测试,同时为了凸显该算法的有效性,将该算法与传统的BP神经网络算法进行对比仿真测试。
该测试采集样本500张人脸图片,分辨率均为128×128,测试计算机配置为双核处理器,主频2.1GHz,测试软件平台为Matlab,分别构建BP神经网络分类器与本算法的神经网络分类器,对500幅人脸图片进行算法识别测试。
如表1所示,为传统BP神经网络算法和本论文算法的仿真测试结果对比表格。
从表1所示的算法检测对比结果可以发现:传统的算法也具有人脸特征的识别,但是相较于本论文所提出的改进后的算法,本论文提出的算法具有更高的人脸特征识别率,这表明了本算法具有更好的鲁棒性,神经网络模糊算法的执行上效率更高,因而本算法是具有实用价值的,是值得推广和借鉴的。
3 结束语
传统的图像识别技术,很多是基于大规模计算的基础之上的,在运算量和运算精度之间存在着不可调和的矛盾。因人工神经网络技术其分布式信息存储和大规模自适应并行处理满足了对大数据量目标图像的实时处理要求,其高容错性又允许大量目标图像出现背景模糊和局部残缺。相对于其他方法而言,利用神经网络来解决人脸图像识别问题,神经网络对问题的先验知识要求较少,可以实现对特征空间较为复杂的划分,适用于高速并行处理系统来实现。正是这些优点决定了模糊神经网络被广泛应用于包括人脸在内的图像识别。本论文对模糊神经网络在人脸图像识别中的应用进行了算法优化设计,对于进一步提高模糊神经网络的研究与应用具有一定借鉴意义。
参考文献:
[1] 石幸利.人工神经网络的发展及其应用[J].重庆科技学院学报:自然科学版,2006(2):99-101.
[2] 胡小锋,赵辉.Visral C++/MATLAB图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.
[3] 战国科.基于人工神经网络的图像识别方法研究[D].北京:中国计量科学研究院,2007.
[4] 王丽华.基于神经网络的图像识别系统的研究[D].北京:中国石油大学,2008.
[5] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.
[6] 金忠.人脸图像特征抽取与维数研究[D].南京:南京理工大学,1999.
关键词:神经网络;数控;自适应
中图分类号:TP273.2 文I标识码:A 文章编号:1007-9416(2017)04-0008-01
1 引言
在大型机械设备的数控加工中,特别是航空机械设备,会有很多复杂的曲面机械加工,利用传统的数控加工,往往选取保守的切削参数,这样就限制了数控加工的加工效率。传统的数控加工的加工参数主要是根据最大切削余量来确定的,一般在整个加工过程中保持不变,给进速率为了保护数控机床和刀具,一般选取也是比较保守速率偏低,这就使得数控机床的加工效率大打折扣,不能发挥高端数控机床的高效能力。如何充分利用数控机床加工高效特点,提高数控机床加工精度和降成本,是目前一个比较有研究价值的课题。
针对以上问题,本文设计了一种利用径向基神经网络建立切削参数和切削负荷的数学模型,通过神经网络不断修正参数,自适应控制系统自动调整各个加工参数,从而达到最大限度自适应进行各类机械零部件的机械加工,大幅提高了数控机床的加工效率和加工质量。
2 径向基神经网络介绍
神经网络具有智能性,能够自我进行学习,学习过程就是不断调节权值和阈值的计算过程,神经网络中的特定信息主要有神经网络海量的神经元之间的连接权值进行表述,由于神经元数量众多,当神经网络受损后也可以报至神经网络的正确输出,这种计算方式能够大大提高系统的鲁棒性和容错性。神经网络主要有BP神经网络和径向基神经网络。径向基神经网络常常用在模式识别方面,具有收敛速度快和逼近效果好的优点,它是一种三层前向型神经网络。
径向基神经网络是根据海量样本数据来进行隐含层神经元径向基激活函数的选择的,基于函数逼近理论,选择合理的隐含层单元个数和作用函数,把非线性的问题映射成线性的问题,进行了系统简化处理。径向基神经网络在进行训练时,需要设计神经网络的网络结构和求解相关的多个参数。这种神经网络的结构主要包括网络的输入、输出个数,隐含层节点数量。主要参数有径向基函数的中心值、函数宽度、权值等。
3 系统设计
我们设计的自适应系统终极目的是以尽可能大的切削速度来进行机械零部件加工,利用试切进行自适应学习,试切主要是在批量加工零部件之前,先试加工小量的零部件进行神经网络的自我学习,在加工学习阶段,数控加工系统监测整个数控机床加工的负载变化情况,把数控加工的每次走刀达到的最大负荷进行全部记录保存。
径向基函数神经网络包括三个层级:输入层、隐层和输出层。隐层由一个径向基函数组成,和每个隐层节点相关的参数为网络中心向量和半径。为了简化计算工作量,我们这里选取高斯函数作为径向基函数。径向基神经网络训练方法如下:输入层到隐层用无导师的聚类算法来训练,常用的是K-均值算法和模糊聚类两种算法,来计算神经网络的中心向量和半径,隐层和输出层的权值调整采用有导师指导算法来计算权重向量值。
数控加工过程中,切削负荷的传递主要包括切削力的产生、切削负荷的传递、机电转换三个方面。电机系统与切削力之间的关系公式:
其中:SN为额定滑差,V1为同步转速,K为电机到刀具的传动比,R为刀具半径,m1为定子相数,r为转子电阻,F为刀刃受到的切削阻力,IN为主轴电流。
通过电机与切削力负荷之间的公式,进行径向基神经网络离线建模,利用电流传感器在线实时监测电机电流信号的变化和在线实时测定实际工况,然后采集实时电流信息,利用自适应控制系统提取出切削负荷的特征信息,进而判定当前切削负荷的变化情况,然后比较当前的切削负荷与公称负荷值,通过实时对走刀给进修调率不断进行调整,保证在整个切削过程中,给数控加工提供连续的、可靠的、稳定的、自动的给进速率。
径向基神经网络的输出是数控机床的主轴电流信息,它包括了三部分内容:切削力部分、机床本体特征部分、外部环境干扰部分。在此需要把信号进行过滤,去除机床本体特征部分和外部环境干扰部分,提取出干净的主轴电机有效负荷特征电流信息。
经过实际验证,本文设计的数控自适应加工系统加工效率比传统数控加工方法提高17%,该系统具有一定的实用价值。
4 结语
本文针对机械设备传统数控加工的加工效率低和加工精度差弊端,设计了一种基于径向基神经网络的数控加工自适应加工系统,该系统能够根据切削的实时工况信息,利用神经网络进行训练,自动调整负荷的特征电流,进而改变切削给进速率,该系统能够较好的从切削参数映射切削负荷,经过实际验证,该系统能够大幅提高数控加工效率。
参考文献
【关键词】 类风湿关节炎;证候;BP神经网络;非线性建模
证候是一个非线性复杂系统,中医证候的诊断过程,实质上是由临床收集到的各种症状,通过分析归纳,获得证型诊断的过程,这个过程,可以看作是一个从观察指标到证型诊断的非线性映射过程,用非线性数学模型可以充分模拟。基于黑箱结构的人工神经网络(Artificial Neural Networks,ANN)具有强大的非线性拟合能力,能够任意精度逼近非线性函数,因此,我们将其用于类风湿关节炎(rehumatoid arthritis,RA)证候的非线性建模研究。
1 临床资料
本研究采用中国中医科学院望京医院提供的765例RA临床证候资料。参考《中药新药临床研究指导原则(试行)》[1]、文献整理结果及专家经验,制定临床观察表。共观察183个症状、体征,每个症状按无、轻、中、重分别记为0、1、2、3分;并同时给出肝肾不足证、寒湿阻络证、瘀血阻络证、气血两虚证、痰瘀阻络证、阴虚内热证、热毒蕴结证、寒热错杂证、脾肾阳虚证等10个基本证型的诊断。从上述病例中抽取临床症状和证型诊断构成样本集合,作为神经网络的学习和测试样本。在神经网络的训练过程中,症状向量作为神经网络的输入向量,证型诊断分别对应网络的输出向量。
2 研究方法
2.1 数据预处理及病例分组
先对所有数据进行归一化处理,使处理后的输入输出信息均在(0,1)区间。对上述数据进行主成分分析,主成分的选择标准定为95%。数据经过主成分分析,前98个主成分的贡献率涵盖了总共183个指标的95.035%的信息,故我们取前98个主成分作为进一步分析的指标。通过主成分分析,输入向量从183个减至98个。可见原始数据有很大的冗余。
将765例样本随机分为A、B、C 3组,每组255例。依次选取其中两组作为训练集,另一组作为测试集,共循环3次。
2.2 建立基于共轭梯度下降算法的类风湿关节炎证候BP网络模型
2.2.1 类风湿关节炎证候BP神经网络的结构
在MATLAB7.0环境下,建立基于共轭梯度下降算法的三层前向BP神经网络模型。该模型包括输入层、隐层和输出层,其中输入层包含183个输入神经元;隐层有2个,各包含100个神经元;输出层包含10个输出神经元。两个隐层之间通过正切S型传递函数(tansig)连接,隐层与输出层之间用对数S型传递函数(logsig)连接。设定该网络的系统误差小于0.01,最大迭代次数500次。
2.2.2 类风湿关节炎证候BP网络的输出方式
将具有肝肾不足证、寒湿阻络证、瘀血阻络证、气血两虚证、痰瘀阻络证、阴虚内热证、热毒蕴结证、寒热错杂证、脾肾阳虚证等10种证型诊断样本的期望输出值分别定为(0,1,0,0,0,0,0,0, 0,0),……,(0,0,0,0,0,0,0,0,0,1)。预测整合输出值为(0, 0.2,0.4,0.6,0.8,1),这6个数值分别对应原始输出值的(0-0.1,0.1-0.3,0.3-0.5,0.5-0.7,0.7-0.9,0.9-1)区间的数值。整合输出值≤0.4为诊断不成立,≥0.6为诊断成立。
2.2.3 基于共轭梯度下降算法的类风湿关节炎证候BP神经网络模型的训练
网络参数的初始值取为[-0.5,+0.5]上均匀分布的随机数,利用train函数对网络进行训练,第1次训练经过89次迭代以后,网络的系统误差降至0.009 450 59;第2次训练经过56次迭代后,网络的系统误差降至0.009 423 47;第3次训练经过58次迭代以后,网络的系统误差降至0.009 174 36。上述数值均小于规定的最小误差0.01,提示网络趋于稳定,网络性能达标,训练自动停止。
2.2.4 类风湿关节炎证候BP神经网络模型的测试
该网络模型的权值趋稳,训练结束后,分3次分别对1/3测试样本做检验。规定单证阳性诊断的符合情况为单证特异性;所有单证诊断的符合情况为单证准确率;病例的全部证型诊断符合情况为诊断准确率。即:单证特异性(%)=预测输出所有单证阳性符合例数/期望输出所有单证阳性例数×100%;单证准确率(%)=预测输出所有单证符合例数/期望输出所有单证例数×100%;诊断准确率(%)=预测输出符合例数/所有病例数×100%。其中,以整合输出值的大小排序,主证为证候的前2位证类,兼证为第3位证类,第3位以后的证类忽略不计。
3 结果
测试结果显示:3次测试的平均单证特异性为81.31%,平均单证准确率为95.70%,平均诊断准确率为90.72%。结果见表1。表1 RA证候BP神经网络模型测试结果与临床诊断结果的比较(略)
4 讨论
ANN的一个显著特征是它能够通过自动学习来解决问题,对样本的学习过程,即为对网络中神经元间的联系强度(即权重系数)逐步确定的过程,通过对样本的学习,可以学会识别自变量与应变量间的复杂的非线性关系。经过充分学习后的ANN获取了样本的特征规则,并将这些规则以数字的形式分布存贮在网络的连接权中,从而构成了系统的非线性映射模型。用ANN建模,可将过程或对象看成一个“黑箱”,只要测得输入输出数据,就可以建立相应的模型,不必象传统的系统辨识那样把过程或对象分为线性系统还是非线性系统,也不必对过程或对象内部进行分析,这对未知过程的系统辨识是十分方便的。
中医证候体系具有复杂系统的非线性、开放性、层次性、涌现性和高维性特征,是一个多维多阶多变量的非线性复杂系统[2-3]。中医学辨证施治过程,实质上是对大量数据信息作出处理,提取规律的过程。如何从中医学大量现象学描述中寻找其内在规律,是证的规范化研究之热点和难点。以往多采用统计学方法,但效果不够理想。ANN作为一种智能信息处理系统,能够充分逼近任意复杂的非线性关系,获得样本数据的规则,较好避免数据处理中可能掺杂的主观因素,客观如实地反映研究对象[4],因此,可以将其用于中医证候的非线性建模研究。
我们在MATLAB7.0环境下,对一组RA临床证候资料建立了基于共轭梯度算法的BP神经网络证候模型,并用3倍交叉验证的方法进行测试,结果显示:该模型具有很好的诊断、预测能力。说明ANN能够充分模拟症状与证型诊断之间的非线性映射关系。这是目前在不打开人体黑箱的前提下,建立非线性证候模型、反映证候的内在规律和特征的有效方法。
BP神经网络有一个明显的缺点是收敛速度非常慢,为此,我们基于共轭梯度学习算法,采用trainscg函数改进train函数,从而加快了神经网络的收敛速度。我们建立的RA证候网络模型3次训练的迭代次数分别为89、56、58,说明通过改进的BP神经网络具有很好的收敛性能。
另外,针对临床证候资料多存在兼夹证以及各证型之间有主次之分的情况,我们首先将模型的输出采用1个输出节点对应1种证型的方式,比如,RA证候模型共有10个证型,我们将包含10个证型的输出采用(0,1,0,0,1,0,0,0,0,0)的方式,其中,括号内每一个数值代表一种证型,“0”表示诊断不成立,“1”表示诊断成立,这样就可以诊断兼夹证了;然后,我们将整合输出值整理成(0,0.2,0.4,0.6,0.8,1)等6个等级的方式,这6个数值分别对应原始输出值的(0-0.1,0.1-0.3,0.3-0.5, 0.5-0.7,0.7-0.9,0.9-1)区间的数值,并规定整合输出值≤0.4为诊断不成立,≥0.6为诊断成立,这样就进一步根据整合输出值的大小直接判断有几个兼夹证以及各证型的主次地位了。可见,我们建立的RA证候网络模型不仅能够利用神经网络的自主学习能力从大量的样本中抽提出比较全面的证候内在规律,具有良好的诊断、预测能力,而且操作简便,真正实现了证候诊断的智能化。ANN技术是中医证候非线性建模的可行性方法。
虽然我们已经证实了ANN用于证候非线性建模的可行性,但是,以目前的技术,还无法从网络的联接权中抽提出网络通过自动学习所获得的证候规律,今后可以围绕这个关键问题继续开展研究。另外,证候的诊断信息具有模糊性特征,用模糊神经网络理论应更能够逼近证候的全貌,我们曾经试图用模糊神经网络进行证候的非线性建模研究,但是,目前的模糊神经网络还无法处理证候的兼夹问题,模糊神经网络的输出结果只能是多类中的一类,因此,我们暂时未作。今后我们将围绕这方面展开深入研究,力争建立证候的模糊神经网络模型。
总之,一门学科只有不断地吸纳先进的思想与技术,在继承的基础上发展创新,才能真正具有生命力。中医证候复杂系统研究,呼唤非线性科学、人工神经网络、计算数学、模糊数学、信息工程、医学工程、复杂性科学等多种边缘学科、交叉学科理论和技术方法的介入,理论上的探讨和不断切实可行的实践探索并行,才能使中医证候规范研究从量的积累上升到质的飞跃。
参考文献
[1] .中药新药临床研究指导原则(试行)[S].北京:中国医药科技出版社,2002.115-119.
[2] 白云静,申洪波,孟庆刚,等.基于复杂性科学的中医学发展取向与方略[J].中国中医药信息杂志,2005,12(1):2-5.
[3] 白云静,申洪波,孟庆刚,等.中医证候复杂性特征及证候研究思路探析[J].中国中医药信息杂志,2004,11(9):754-756.
[4] 白云静,申洪波,孟庆刚,等.中医证候研究的人工神经网络方法探析[J].中医药学刊,2004,22(12):2221-2223.
3 结果
测试结果显示:3次测试的平均单证特异性为81.31%,平均单证准确率为95.70%,平均诊断准确率为90.72%。结果见表1。表1 RA证候BP神经网络模型测试结果与临床诊断结果的比较(略)
4 讨论
ANN的一个显著特征是它能够通过自动学习来解决问题,对样本的学习过程,即为对网络中神经元间的联系强度(即权重系数)逐步确定的过程,通过对样本的学习,可以学会识别自变量与应变量间的复杂的非线性关系。经过充分学习后的ANN获取了样本的特征规则,并将这些规则以数字的形式分布存贮在网络的连接权中,从而构成了系统的非线性映射模型。用ANN建模,可将过程或对象看成一个“黑箱”,只要测得输入输出数据,就可以建立相应的模型,不必象传统的系统辨识那样把过程或对象分为线性系统还是非线性系统,也不必对过程或对象内部进行分析,这对未知过程的系统辨识是十分方便的。
中医证候体系具有复杂系统的非线性、开放性、层次性、涌现性和高维性特征,是一个多维多阶多变量的非线性复杂系统[2-3]。中医学辨证施治过程,实质上是对大量数据信息作出处理,提取规律的过程。如何从中医学大量现象学描述中寻找其内在规律,是证的规范化研究之热点和难点。以往多采用统计学方法,但效果不够理想。ANN作为一种智能信息处理系统,能够充分逼近任意复杂的非线性关系,获得样本数据的规则,较好避免数据处理中可能掺杂的主观因素,客观如实地反映研究对象[4],因此,可以将其用于中医证候的非线性建模研究。
我们在MATLAB7.0环境下,对一组RA临床证候资料建立了基于共轭梯度算法的BP神经网络证候模型,并用3倍交叉验证的方法进行测试,结果显示:该模型具有很好的诊断、预测能力。说明ANN能够充分模拟症状与证型诊断之间的非线性映射关系。这是目前在不打开人体黑箱的前提下,建立非线性证候模型、反映证候的内在规律和特征的有效方法。
BP神经网络有一个明显的缺点是收敛速度非常慢,为此,我们基于共轭梯度学习算法,采用trainscg函数改进train函数,从而加快了神经网络的收敛速度。我们建立的RA证候网络模型3次训练的迭代次数分别为89、56、58,说明通过改进的BP神经网络具有很好的收敛性能。
另外,针对临床证候资料多存在兼夹证以及各证型之间有主次之分的情况,我们首先将模型的输出采用1个输出节点对应1种证型的方式,比如,RA证候模型共有10个证型,我们将包含10个证型的输出采用(0,1,0,0,1,0,0,0,0,0)的方式,其中,括号内每一个数值代表一种证型,“0”表示诊断不成立,“1”表示诊断成立,这样就可以诊断兼夹证了;然后,我们将整合输出值整理成(0,0.2,0.4,0.6,0.8,1)等6个等级的方式,这6个数值分别对应原始输出值的(0-0.1,0.1-0.3,0.3-0.5, 0.5-0.7,0.7-0.9,0.9-1)区间的数值,并规定整合输出值≤0.4为诊断不成立,≥0.6为诊断成立,这样就进一步根据整合输出值的大小直接判断有几个兼夹证以及各证型的主次地位了。可见,我们建立的RA证候网络模型不仅能够利用神经网络的自主学习能力从大量的样本中抽提出比较全面的证候内在规律,具有良好的诊断、预测能力,而且操作简便,真正实现了证候诊断的智能化。ANN技术是中医证候非线性建模的可行性方法。
虽然我们已经证实了ANN用于证候非线性建模的可行性,但是,以目前的技术,还无法从网络的联接权中抽提出网络通过自动学习所获得的证候规律,今后可以围绕这个关键问题继续开展研究。另外,证候的诊断信息具有模糊性特征,用模糊神经网络理论应更能够逼近证候的全貌,我们曾经试图用模糊神经网络进行证候的非线性建模研究,但是,目前的模糊神经网络还无法处理证候的兼夹问题,模糊神经网络的输出结果只能是多类中的一类,因此,我们暂时未作。今后我们将围绕这方面展开深入研究,力争建立证候的模糊神经网络模型。
总之,一门学科只有不断地吸纳先进的思想与技术,在继承的基础上发展创新,才能真正具有生命力。中医证候复杂系统研究,呼唤非线性科学、人工神经网络、计算数学、模糊数学、信息工程、医学工程、复杂性科学等多种边缘学科、交叉学科理论和技术方法的介入,理论上的探讨和不断切实可行的实践探索并行,才能使中医证候规范研究从量的积累上升到质的飞跃。
参考文献
[1] .中药新药临床研究指导原则(试行)[S].北京:中国医药科技出版社,2002.115-119.
[2] 白云静,申洪波,孟庆刚,等.基于复杂性科学的中医学发展取向与方略[J].中国中医药信息杂志,2005,12(1):2-5.
关键词 深度神经网络 图像分类 车型识别 预测
中图分类号:TP317.4 文献标识码:A
0 引言
所谓的深度学习是根据具有多层结构的人工神经网络所提出。在具体的深度学习中,主要借助模拟神经系统中的层次结构,来进行数据结构特征的反映,一般来说,细节用低层次进行表示,抽象数据结构则用高层次来表示,利用这种方式,能够进行数据挖掘学习,满足学习要求。在传统的车型识别发展中,主要涉及到的技术包括模式识别、特征选择和提取以及检测分割等方面内容,在技术发展中,存在的难点主要涉及到如何将完整的目标车辆区域进行分割,这是项基础工作,也是难点所在。这结合实际需求,对于不同拍摄角度下的汽车图片,包括皮卡车、SUV、面包车以及小轿车进行车型识别,其目标质量分割质量则是最为关键的技术,直接影响到最后的判断效果。所以,应该重视进行具有代表性特征的选择处理,并相应转化成有效的参数过程。在获取特征参数后,则应该结合项目要求来选择合理的分类器,这样才能保障识别的准确率。结合汽车车型识别问题的要求,这里网络输入则是原始图像,利用神经网络优势,原始数据经过卷积层、完全连接层以及Softmax 层的培训学习,通过这种深度神经网络来进行分析处理,免于上述存在难度的图像分割、手工提取等过程。
1数据集
这里的车型识别目标的数据集主要包括皮卡车、SUV、面包车以及小轿车等四种类型。其中,训练集和测试集分别包括1025张和368张原始图片。此数据集中,包括不同摄像角度中的汽车图像照片,具有背景复杂、图像大小不统一,车辆在图片中所占比例具有较大差异性等方面问题,这些都在一定程度上造成车型识别的难度上升。
在预处理中,为了保证网络输入的一致性,对于原始图像进行调整处理为256?56?尺寸。在此基础上,对于图像RGB三个通道的均值进行计算,并进行均值标准化的处理。在具体的网络训练测试的过程中,主要则是选取224?24? 的样本作为输入。
2网络结构探讨
结合文献所提出的深度神经网络VGG16的优势,我们将其应用在汽车车型识别问题中。VGG16网络具有较强的优势,主要包括5个堆栈式的卷积神经网络ConvNet,以及3个完全连接层以及1个Softmax层,由此可见,其属于“网络中的网络”架构。在每个每个ConvNet中,还有多个卷积层所构成,然后紧跟随着Max-Pooling层。在进行卷积以及池化处理的基础上,进行三层完全连接处理,同时,Softmax层的输入则是最后一个完全连接曾的输出,在这基础上,实现车型分类的要求。结合实际需求,将非线性的ReLU层加入该网络中,这样就会让ReLU来处理卷积层和完全连接层的输出,保证训练时间有效降低。另外,还将一种正则化Dropout方式应用在网络中,避免出现完全连接层中的过拟合问题。
另一个神经网络Alexnet,结构稍微简单一些,主要包括5卷积层、3个完全连接层、Softmax层等几部分,在进行部分卷积层处理后,在进行Max- Pooling层处理。在此网络中,同样采用非线性的ReLU层,所采用难度重叠池化方式,也能有效保证尽量降低过拟合的问题。
3实验结果分析
结合上述分析的深度神经网络VGG16和AlexNet的基础上,进行Gaffe框架的搭设,为了保证运算效率,建立在GeForce GTX TITAN X CPU的工作站中。经过统计,单一网路训练大约为2小时,一张图片测试大约为0.2秒。在应用上述网络测试、训练之外,在分类过程中,还应用了经典的分类算法KNN。经过实验分析,可以看出,VGG16网络能够具有比较好的分类结果,能够实现准确率为97.3%,而AlexNet网络准确率达到为93.0%,KNN算法不能有效处理较为复杂背景的图片,分类准确率仅为52.3%。在具体的案例中,分析VGG16网络错误分类的情况,面包车具有完全正确的分类效果。在错误分类的SUV车型中,究其原因,主要包括:车颜色有两部分组成,红色部分则和皮卡车车型相同;车型结构太类似于皮卡车;背景中加入其他车型,这样会造成分类结果不准确。如果图片中仅仅包括车头的情况,在进行车型识别中也存在较大的难度,不同车型从前面角度进行观察,并没有太大的差异化,这点应该明确指出。
4结语
这里采用深度学习方法,结合先进的深度神经网络,以及功能强大的计算机工作站,对于四类汽车进行识别实验研究。经过试验表明,VGG16网络具有最好的分类效果,传统的经典分类算法往往仅为其准确率的一半左右。所以,可以看出深度神经网络具有强大的学习能力,能够在图像分类问题中表现出很大优势,应该不断优化深度神经网络的结构,以便其适用于更多的图像分类要求。
参考文献
[1] Hinton G E, Osindero S, Teh Y W.A Fast Learning Algorithm For Deep Belief Nets[J]. Neural Computation, 2006, 18(7):1527-1554.
关键词:八角茴香(Illicium verum Hook.f.);红外光谱;反向传播人工网络;鉴定
中图分类号:R931.5 文献标识码:A 文章编号:0439-8114(2013)18-4497-02
八角茴香(Illicium verum Hook. f.)为木兰科常绿乔木八角的干燥成熟果实,又名大茴香、大料等[1,2]。八角茴香性味辛、甘、温,具有温中散寒、理气止痛的功效,常用于治疗胃寒疼痛、呕逆食少、寒性腰痛等[3]。近期常在市场上发现八角伪品——同属植物果实,因此建立八角的品质鉴定标准十分必要[4-7]。人工神经网络(Artificial neural network,ANN),简称为神经网络,是利用大量简单的处理单元广泛连接组成的复杂网络,可模仿人脑神经网络结构和功能的一种信息处理系统。目前应用较多的是反向传播人工神经网络(Back-propagation,BP-ANN),该系统采用误差逆传播算法,即多层误差修正梯度下降法离线学习,按离散时间方式运行,该算法通过最小化代价函数实现由输入到输出的映射[8-11]。本试验通过人工神经网络系统对48个不同批次、不同产地八角样品的红外光谱分析,找到八角茴香和伪八角间的差异,以期为八角茴香的快速鉴定提供借鉴和参考。
1 材料与方法
1.1 材料
PE1730型傅里叶变换红外光谱仪,配备DTGS检测器。
48份八角样品,采购于张家口市某市场,经河北北方学院药物研究所鉴定。
1.2 方法
1.2.1 样品测定 样品经烤箱烘干,机器粉碎,过60目筛,备用。称取1~2 mg样品,研细,加入100~200 mg溴化钾,压制为0.1 mm透明薄片后,上机测定。测定条件:光谱分辨率4 cm-1,测量范围4 000~400 cm-1,环境温度22 ℃左右。样品在测试前扫描背景,扫描30次,取30次测量值的平均值。
1.2.2 方法学验证 同一样品供试片连续测定5次,验证方法的精密度;同一份样品分别取样5次进行压片测定,验证方法的重现性;取同一样品片放入干燥器内保存,分别放置0、1、2、4、6、12、24 h 后测定,验证方法的稳定性。
1.2.3 数据的采集和处理 采用误差反向传播算法的神经网络(BP-ANN)建立八角样品的分类模型。神经网络的输入层单元为44,输出层单元为1个,以1.0代表八角茴香,0.0代表伪八角。对隐含层单元优化选择。采用Matlab的appcoef函数进行一维小波变换,压缩光谱。然后使用Trainbpx(快速BP算法)进行网络训练和建模。为了验证神经网络建立的分类模型,采用交叉验证方法。使用n中取1的方法选取检验样本,即每次选取一个样本作为检验样本,其余样本作为训练样本。每个样品作为检验样本1次,作为了训练集样本n-1次。预测结果的判定阈值设为0.5,即当输出值大于0.5判为八角茴香,当输出值小于0.5判为伪八角。
2 结果与分析
2.1 方法学结果
八角样品的红外光谱分析结果表明,同一样品连续测定5次后以及不同时间测定后,其光谱图一致,同一样品分别取样5次后,测定图谱的相对标准偏差为0.1%。结果表明,本方法具有较好的精密度、重现性和稳定性。
2.2 八角的红外光谱分析
比较八角样品的红外光谱(图1)可知,八角红外谱图在3 000~1 600 cm-1间差异较大,以该区域作为后续分析对象。为减少光谱变量,提高神经网络的训练速度,对该区域光谱进行小波变换压缩。其光谱变量点由原来的700个减少为44个。为方便比较样品光谱图,对所测数据归一化处理,得到的红外光谱图能较好反映出不同产地不同年限八角的光谱差别。故采用含44个变量的归一化八角红外光谱作为神经网络分析数据。
2.3 隐含层结点的影响
隐含层的结点数决定着BP网络的复杂性。因此把隐含层个数从1到8逐一比较(图2)。随着隐含层结点数的变化,BP-ANN网络的识别正确率也在变化。当隐含层结点数为1时,识别正确率最低,为85.42%;当隐含层结点数为5时,识别正确率最高,达到91.67%。因此,最佳隐含层结点数为5。
2.4 动量因子的影响
动量因子和学习速率是影响BP神经网络训练速率和收敛度的2个重要因素。根据分析结果(图3),本试验确定最合适的动量因子为0.5。调节动量因子,找到最高的识别正确率,但是如果动量因子过大,BP网络就不能收敛。
由4图可知,BP-ANN仅有4个八角样品识别错误,其他44个样品鉴定正确。BP-ANN技术的识别正确率达到91.67%。
3 结论
通过对48个八角样品的测试和鉴别可知,采集不同品种的八角样品图谱相似性较高,根据谱图差异并通过BP-ANN技术可区分八角茴香和伪八角。目前,作为药食两用的八角尚无统一质量标准,这是制约八角的药用开发的重要因素。鉴定八角中是否掺杂其他低劣成分,甚至有害成分,将是今后快速鉴定技术的攻关难点,红外光谱法作为无损分析方法,较之常规鉴定方法[3-6],更直接和快速,因此开发这类无损鉴定方法,在中药鉴伪方面具有较大的应用价值。
参考文献:
[1] 崔爱民,王桂兰,付 静.八角茴香与其伪品的鉴别[J].时珍国医国药,2001,12(6):513.
[2] 王庆瑞.中国植物志(五十一卷)[M].北京:科学出版社,1991.
[3] 国家药典委员会. 中华人民共和国药典[S]. 北京: 中国医药科技出版社,2010.
[4] 胡 岩,段天璇,曹 枫,等.八角科植物果皮化学成分的LC-MS图谱特征及其在分类和药材鉴别上的意义[J].中国中药杂志,2010,35(14):1836-1839.
[5] 李 峰,宋晓玲,刘亚鲁.八角茴香及其混伪品的鉴别[J].山东中医杂志,2011,30(10):739-740.
[6] 蔡 鹏,彭正松.八角茴香及其混伪品的比较研究[J].广西农业科学,2006,37(6):713-718.
[7] 刘蓬勃,朱世纬,孙素琴.傅里叶变换红外光谱法无损快速鉴别八角茴香及其伪品[J].中药材,2001,24(11):802-803.
[8] 袁曾任.人工神经元网络及其应用[M].北京: 清华大学出版社,1999.
[9] 王永骥,涂 健.神经元网络控制[M].北京:机械工业出版社,1998.
人工神经网络(Aartificial Neural Network,下简称ANN)是模拟生物神经元的结构而提出的一种信息处理方法。早在1943年,已由心理学家Warren S.Mcculloch和数学家Walth H.Pitts提出神经元数学模型,后被冷落了一段时间,80年代又迅猛兴起[1]。ANN之所以受到人们的普遍关注,是由于它具有本质的非线形特征、并行处理能力、强鲁棒性以及自组织自学习的能力。其中研究得最为成熟的是误差的反传模型算法(BP算法,Back Propagation),它的网络结构及算法直观、简单,在工业领域中应用较多。
经训练的ANN适用于利用分析振动数据对机器进行监控和故障检测,预测某些部件的疲劳寿命[2]。非线形神经网络补偿和鲁棒控制综合方法的应用(其鲁棒控制利用了变结构控制或滑动模控制),在实时工业控制执行程序中较为有效[3]。人工神经网络(ANN)和模糊逻辑(Fuzzy Logic)的综合,实现了电动机故障检测的启发式推理。对非线形问题,可通过ANN的BP算法学习正常运行例子调整内部权值来准确求解[4]。
因此,对于电力系统这个存在着大量非线性的复杂大系统来讲,ANN理论在电力系统中的应用具有很大的潜力,目前已涉及到如暂态,动稳分析,负荷预报,机组最优组合,警报处理与故障诊断,配电网线损计算,发电规划,经济运行及电力系统控制等方面[5]。
本文介绍了一种基于人工神经网络(ANN)理论的保护原理。
1 人工神经网络理论概述
BP算法是一种监控学习技巧,它通过比较输出单元的真实输出和希望值之间的差别,调整网络路径的权值,以使下一次在相同的输入下,网络的输出接近于希望值。图1是人工神经Ui的结构模型,图中Ui为神经元内部状态,Qi为门槛值,Yi为输出信号,Xi(i=1,2,…,n)为神经元接收信号。该模型可表示为:
式中
Wji——连接权值。
BP算法的神经网络图形如图2所示,设网络的输入模块为p,令其作用下网络输出单元j的输出为Opj。如果输出的希望值是Tpj,则其误差为Dpj=Tpj-Opj。若输入模块的第i个单元输入为Ipi,则就输入模块p而言,输入接点I与输出接点j之间的权值变化量为:
ΔWpji=zDpjIpi
式中,z是某一个常数。当反复迭代该式时,便可使实际值收敛于目标值[6]。其中隐含层既有输入网线,又有输出网线,每一个箭头都有一定的权值。
在神经网络投运前,就应用大量的数据,包括正常运行的、不正常运行的,作为其训练内容,以一定的输入和期望的输出通过BP算法去不断修改网络的权值。在投运后,还可根据现场的特定情况进行现场学习,以扩充ANN内存知识量。从算法原理看,并行处理能力和非线性功能是BP算法的一大优点。
2 神经网络型继电保护
神经网络理论的保护装置,可判别更复杂的模式,其因果关系是更复杂的、非线性的、模糊的、动态的和非平稳随机的。它是神经网络(ANN)与专家系统(ES)融为一体的神经网络专家系统,其中,ANN是数值的、联想的、自组织的、仿生的方式,ES是认知的和启发式的。
如图3所示,装置可直接取线路及其周边的模拟量、数字量,经模式特征变换输入给神经网络,根据以前学习过的训练材料,对数据进行推理、分析评价、输出。专家系统对运行过程控制和训练,按最优方式收集数据或由分析过程再收集控制,对输出结果进行评估,判别其正确性、一致性,作出最终判决,经变换输出,去执行机构。即使是新型保护,也会存在着某些功能模块不正确动作的可能,这时可以过后人为干预扩展专家系统数据库或由专家系统作出判别,作为训练样本训练ANN的这部分功能模块,改变其某些网线的权值,以使下次相同情况下减少不正确动作的可能。
下面是一个简单的ANN线路保护例子。当电力系统故障时,输电线路各相、各序电压、电流也随之发生变化,特别是故障后故障相的相电压和相电流,以及接地系统在接地故障的零序电流的变化有明显的代表性。比如选输入层神经元个数为14个,分别是Uar,Uai,Ubr,Ubi,UcrUci,Iai,Ibr,Ibi,Icr,Ici,Ior,Ioi(下标r和i分别代表实部与虚部),选定输出层神经元个数为5个:YA(A相),YB(B相),YC(C相),YO(接地),YF(方向),各输出值为1,代表选中;输出值为0,代表没选中(YF为0代表反向)。这5个输出完全满足线路方向保护的需求(没考虑正向超越),隐含层神经元数目为2N+1(N为输入层神经元数目)。训练样本集包含14个输入变量和5个输出变量,而测试样本集中的样本则只有14个输入变量。选图4的双侧电源系统作研究对象,输电线路、系统的等值正、零序参数如图4所示。
考虑的故障类型包括单相接地(K1),两相短路(K2),两相接地(K1—1),三相短路(K3)。
对图4所示的500 kV双侧电源系统的各种运行方式和故障情况建立训练样本。
在正常状态下,令h∠δ=(EM)/(EN),h=1,δ
随负荷变化,取为-60°,-50°,-40°,-30°,-20°,-10°,0°,10°,20°,30°,40°,50°,60°,有13个样本。故障情况下,δ取值为-60°,-30°,0°,30°,60°,故障点选反向出口(-0 km),正向出口(+0 km),线路中部(150 km),线末(300 km)。接地电阻Rg取值0 Ω,50 Ω,100 Ω,150 Ω,200 Ω,相间电阻Rp取值0 Ω,25 Ω,50 Ω,则共有5×4×(5+3+5×3+3)=520个样本。每个样本的5个输出都有一组期望的输出值,以此作为训练样本。而实际运行、故障时,保护所测到的电流、电压极少直接与样本相同,此时就需要用到模糊理论,规定某个输出节点。如YA(A相)在某一取值范围时,则被选中。
文献[1]认为全波数据窗建立的神经网络在准确性方面优于利用半波数据窗建立的神经网络,因此保护应选用全波数据窗。
ANN保护装置出厂后,还可以在投运单位如网调、省调实验室内进行学习,学习内容针对该省的保护的特别要求进行(如反措)。到现场,还可根据该站的干扰情况进行反误动、反拒动学习,特别是一些常出现波形间断的变电站内的高频保护。
3 结论
本文基于现代控制技术提出了人工神经网络理论的保护构想。神经网络软件的反应速度比纯数字计算软件快几十倍以上,这样,在相同的动作时间下,可以大大提高保护运算次数,以实现在时间上即次数上提高冗余度。
一套完整的ANN保护是需要有很多输入量的,如果对某套保护来说,区内、区外故障时其输入信号几乎相同,则很难以此作为训练样本训练保护,而每套保护都增多输入量,必然会使保护、二次接线复杂化。变电站综合自动化也许是解决该问题的一个较好方法,各套保护通过总线联网,交换信息,充分利用ANN的并行处理功能,每套保护均对其它线路信息进行加工,以此综合得出动作判据。每套保护可把每次录得的数据文件,加上对其动作正确性与否的判断,作为本身的训练内容,因为即使有时人工分析也不能区分哪些数据特征能使保护不正确动作,特别是高频模拟量。
神经网络的硬件芯片现在仍很昂贵,但技术成熟时,应利用硬件实现现在的软件功能。另外,神经网络的并行处理和信息分布存储机制还不十分清楚,如何选择的网络结构还没有充分的理论依据。所有这些都有待于对神经网络基本理论进行深入的研究,以形成完善的理论体系,创造出更适合于实际应用的新型网络及学习算法[5]。
参考文献
1 陈炳华.采用模式识别(智能型)的保护装置的设想.中国电机工程学会第五届全国继电保护学术会议,[会址不详],1993
2 Robert E.Uhrig.Application of Artificial Neural Networks in Industrial Technology.IEEE Trans,1994,10(3).(1):371~377
3 Lee T H,Wang Q C,Tan W K.A Framework for Robust Neural Network-Based Control of Nonlinear Servomechannisms.IEEE Trans,1993,3(2).(3):190~197
4 Chow Mo-Yuen.The Advantage of Machine Fault Detection Using Artificial Neural Networks and Fuzzy Logic Technology.IEEE Trans,1992,5(6).(2):1078~1085
关键词:单体型;单体型装配;SNP
中图分类号:R394 文献标识码:A 文章编号:1007-9416(2017)01-0124-01
生物信息学是一个新兴学科。它以计算机为工具对生物信息进行存储,检索和分析,探究生命的奥秘。我们知道,每个人都是独立的个体。没有完全相同的两个人。但是从基因序列的角度来看,不同的个体有很高的相似度,因为碱基对有99%是相同的。换句话说,仅有1%的碱基对的不同决定了遗传上的人与人的不同。例如,不同个体之间头发,鼻子,眼睛的不同等等。
每个生物都具有基因组,绝大部分的基因组都是由DNA组成,当然个别基因组也可由RNA组成。DNA和RNA是有核苷酸组成的多聚分子。每个核苷酸包含一个单糖,一个磷酸基团,和一个碱基。碱基共四总,A,G,C,T,碱基配对原则A与T配对,G与C配对。一个基因是位于某条染色体的某个位置上的核苷酸序列,其中蕴含着某种特定的功能产物(如蛋白质)的编码。基因不仅可以通过复制把遗传信息鞯莞下一代,还可以使遗传信息得到表达。染色体中基因组序列中单个碱基的差异称为单核苷酸多态性(SNP),单核苷酸多态性是人类基因突变中最常见的一种。双倍体生物的两条同源染色体几乎完全相同,每一条染色体上或染色体的某一区域上的所有SNP位点对应的等位基因构成的碱基序列构成一条单体型。那么装配单体型,对于分析SNP在人群中的分布和规律,发现与疾病相关的基因与多态位点就显得尤为重要了。
1 单体型装配问题[1]
单体型装配问题针对的是染色体上的大量SNP数据,通过适当的方法,将其装配成一对单体型。由于染色体都的成对出现的。那么,如何将SNP片段分成适当的两个集合,并且从每个集合按照一定的原则装配出一条单体型就是一个难点。另外,我们通过实验得到的小的SNP片段存在一些瑕疵,例如某些点数据的缺失,某些点通过实验得到的数据是错误的等等。因此,这些未知的因素使得我们装配单体型的难度变大了。单体型装配问题目前主要有三类:最少错误纠正(MEC)模型,最少片段去除模型,最少SNP去除模型。针对以上三种模型求解的主要方法,目前研究比较多的是启发式算法,这类算法优点是运用时间少,可以较快的找到问题的最优解。缺点就是找到的是最优解,不一定是准确解。由于得到的数据本身就有一定的瑕疵,因此由数据求解出的准确解也不一定是最初问题的准确解。因此,我们一般认为在求解大规模计算中求出问题的最优解就是可以接受的了,事实证明,最优解和准确解误差不大,可以接受。
2 启发式算法研究
2.1 基于遗传算法的启发式算法[2]
遗传算法是Goldberg在1989年提出的,是一个非常有用的启发式算法,已经在很多领域包括计算生物学如蛋白质结构预测,启动子序列识别,多序列比对等问题中成功应用。2005年王瑞省博士将遗传算法引入单体型重构问题,针对的是最少错误模型(MEC模型)。通过构造个体空间,设计适应度函数,选择算子,设计基于遗传算法的启发式算法,为了验证算法的有效性,通过ACE(血管紧缩转移酶)基因数据集,DALY数据集进行验证,结果显示,设计的遗传算法适合解决规格较大的问题。但是针对SNP错误率较高的时候,重构率效果不是很好。
2.2 基于粒子群算法的启发式算法[3]
粒子群算法(PSO)最早是由心理学研究学者Kennedy博士和从事计算智能研究的Eberhart博士于1995年提出来的一种智能算法。两位学者通过观察鸟类捕食的过程,从中受到启发,进而提出的一种算法。后来逐渐应用到优化问题当中,像车间调度,路由选择,以及整数规划问题,并且取得较好的效果。2006年钱伟懿将粒子群算法引入单体型重构问题。针对MEC模型,提出了基于改进粒子群算法的启发式算法。它在原始粒子群算法中增加了记忆功能,提高了搜索速度。并将其应用到ACE基因数据集进行验证算法的有效性。同时与王瑞省的遗传算法进行了比较,表明算法的优越性,尤其是在SNP错误率较高的时候,基于粒子群算法的启发式算法重构率更高。
2.3 基于前馈神经网络的启发式算法[4]
前馈神经网络,简称前馈网络,是人工神经网络的一种。1986年,Rumelhart,Hinton和Williams等完整而简明提出来的。在此种神经网络中,各神经元从输入层开始,接收前一级输入,并输入到下一级,直至输出层。整个网络中无反馈,可用一个有向无环图表示。前馈神经网络是最早被提出的人工神经网络,也是最简单的人工神经网络类型。2008年章祥荪等将前馈神经网络引入到单体型重构问题。针对带基因型信息的最少错误纠正(MEC/GI)模型,提出了基于前馈神经网络的启发式算法。对于MEC/GI问题由三层神经元组成。对于m个SNP片段,n个SNP位点的例子,网络有m个输入神经元,两个隐含神经元和一个输出神经元。为了验证算法的有效性,对ACE基因数据和DALY数据集进行了测试,结果显示算法非常有效,重构率比前面2种算法又有了提高。
3 展望
本文针对单体型装配问题的求解方法,给出了3种主要的启发式算法。分别是基于遗传算法的启发式算法,基于粒子群算法的启发式算法,基于前馈神经网络算法的启发式算法。生物信息的奥秘是永无止境的,单体型在揭示人类奥秘中扮演着重要的角色。然而,人们对单体型的研究还处于起步阶段,它激励着科研工作者努力去探索未知的秘密。
参考文献
[1]杨英杰.单体型装配问题研究现状[J].铜仁学院学报,2011(2):135-138.
[2]Rui-Sheng Wang, Ling-Yun Wu, Zhen-Ping Li, et al. Haplotype construction from SNP fragments by minimum error correction[J].Bioinformatics,2005,21(10):2456-2462.
针对水电机组振动故障耦合因素多、故障模式复杂等问题,提出了一种基于量子自适应粒子群优化BP神经网络(QAPSO-BP)的故障诊断模型。在QAPSO-BP算法中,利用量子计算中的叠加态特性和概率表达特性,增加了种群的多样性;根据各粒子的位置与速度信息,实现惯性因子的自适应调节;为避免陷入局部最优,在算法中加入变异操作;并以此来训练BP神经网络,实现网络的参数优化,进而构建了机组的振动故障诊断模型。仿真实例表明,与粒子群优化BP网络(PSO-BP)法和BP网络法相比,该算法具有较高的诊断准确度,适用于水电机组振动故障的模式识别。
关键词:
BP神经网络;量子自适应粒子群优化算法;水电机组;振动;故障诊断
水电机组的振动包含水力、机械和电磁3个方面,异常振动可能会破坏机组的结构。据统计,水电机组约有80%的故障都会在振动信号中有所反映[1]。因此,从水电机组的振动信号入手,进而建立相应的模型已成为诊断机组故障的重要手段。鉴于水电机组发生振动故障的原因复杂多样,涉及电气、机械以及水力等多方面的因素,且故障成因与征兆之间呈现复杂的非线性,其故障的模式识别方法就成为研究的热点及难点[2]。近年来,针对水电机组振动故障诊断技术的研究,相关人员开展了大量工作,成果显著。如易辉等[3]采用基于相关向量机(RelevanceVectorMachine,RVM)的水电机组故障诊断方法,并根据训练样本的分布情况来自动选取决策结构,提高了诊断的速度和准确性。张孝远等[4]考虑到故障样本存在着交叠区域,提出了基于粗糙集与一对一多类支持向量机结合的诊断方法。贾嵘等[5]采用粒子群算法(ParticleSwarmOptimi-zation,PSO)优化支持向量机(SupportVectorMachine,SVM)的故障诊断模型,取得了较好地分类效果。郭鹏程等[6]通过小波分解对水电机组的振动信号波形进行去噪提纯,并建立了基于改进BP神经网络的故障诊断模型。显然,相关研究主要侧重于采用支持向量机、神经网络以及诸如粒子群等优化算法用于水电机组的振动故障诊断中,但对基于量子粒子群优化算法(QuantumParticleSwarmOptimization,QPSO)的机组振动故障诊断技术尚未见报道。PSO算法是美国Kennedy和Eber-hart受鸟类捕食行为的启发,于1995年提出的一种智能优化算法。作为一种重要的优化工具,粒子群优化算法已在组合优化、系统辨识和神经网络训练等领域得到广泛应用[7-9]。但是,同其它优化算法一样,PSO算法也表现出易陷入局部最优等问题,这也推动了改进PSO算法的研究,而量子粒子群优化算法[10]就是从量子力学角度提出的一种改进模型。它认为粒子具有量子的行为,能够在整个可行解空间进行搜索,故而具有较强的全局寻优能力,已成功应用于风电功率预测及碳酸盐岩流体识别等领域[11-12]。因此,本文受文献[13]的启发,提出了一种基于量子自适应粒子群优化BP神经网络(QuantumAdaptiveParticleSwarmOptimizedBPNeuralNetwork,QAPSO-BP)的水电机组振动故障诊断模型。首先由量子自适应粒子群算法优化BP神经网络的权、阈值参数,再由优化后的BP网络进行故障诊断,最终实现了水电机组振动故障集与征兆集之间的有效映射。
1PSO算法基本原理
在D维搜索空间中有m个粒子组成一个种群,其中第通过计算适应度函数值,使粒子按照下式来实现速度和位置的更新。
2量子自适应粒子群优化算法(QAPSO)
2.1量子编码QAPSO采用量子位的概率幅对粒子的当前位置进行编码,其编码方案为:由此可见,种群中每个粒子的位置xiα和xiβ与优化问题的两个解对应起来,从而扩展了算法的遍历能力。
2.2状态评估对粒子i,由下式来估计与其它粒子的平均距离及平均速率。
2.3参数自适应调节惯性因子ω的选取对算法的搜索能力影响很大。在QAPSO算法中,根据粒子的飞行轨迹差异按式(9)来自适应调整惯性因子。在搜索初期,由式(8)可知,平均轨迹差异的进化因子fc=1,此时ω=0.9。通过赋予ω一个较大值,有利于提高算法的全局寻优能力。而在后期阶段,赋予一个较小的ω,以增强算法的局部搜索能力。随着算法搜索的进行,ω按照S型函数递减,避免了线性递减粒子群算法不能适应非线性变化特性的缺陷,从而实现QAPSO算法在全局收敛与局部搜索能力之间的平衡。
2.4变异操作为了增加种群的多样性,克服粒子的集聚现象,通过所预设的变异概率,对全局最优粒子的量子位采用量子非门进行变异操作,以避免算法陷入局部最优。其操作过程如下。
2.5QAPSO-BP算法实现步骤QAPSO-BP算法的实现步骤如下[14]:步骤1:确定BP神经网络的拓扑结构。步骤2:初始化量子自适应粒子群,包含粒子数、空间维数及最大迭代次数等,随机生成粒子速度,根据式(3)生成粒子位置的初始编码。步骤3:构建BP神经网络,将各粒子位置向量所对应的量子态0〉和1〉的概率幅表示为BP网络初始连接权、阈值的解集合。步骤4:状态更新。根据式(4)~(7)计算粒子的平均轨迹差异,根据式(8)、(9)调整惯性因子,根据式(1)、(2)更新粒子的速度和位置。步骤5:适应度评估。若粒子当前位置优于自身所记忆的最优位置,则更新个体最优位置;若当前个体历史最优位置优于目前所搜索到的全局最优位置,则替换成全局最优位置。步骤6:变异操作,根据式(10)进行变异操作。步骤7:循环操作。返回步骤4循环计算,若满足收敛条件或所预设的最大迭代次数,则确定BP神经网络的最佳参数,转向下一步骤。步骤8:利用优化后的BP神经网络对水电机组进行振动故障诊断。
3水电机组振动故障诊断
3.1水电机组的振动故障分析水电机组是一个复杂的动力系统,其故障多以振动的形式表现出来。根据振动的来源不同,可分为水力振动、机械振动和电磁振动3大类[15]。水力振动:水力振动是由水力和机械相互作用而产生的,主要包含:水力不平衡、导叶和轮叶开口不均、尾水管压力脉动、尾水管偏心涡带、转轮叶片的卡门涡流、转轮叶片断裂、间隙射流等。机械振动:机械振动主要是由于机组本身结构性缺陷、或在运行过程中机组部件受损而产生的。主要有:转动部分质量不平衡、轴线不对中、动静碰磨、轴承瓦间隙大、导轴承缺陷、联结螺丝松动等。电磁振动:电磁振动是由磁通密度分布不均以及磁拉力不平衡等原因产生的。主要包含:绕组匝间短路、定转子间气隙不匀、转子不圆、定子铁芯松动、负载不平衡等。然而,以上3类振动因素又相互作用。比如,当水电机组受水力因素的影响而导致转动部分振动时,会造成定转子间气隙不均匀,进而产生不对称磁拉力,反过来又将阻尼或加剧机组转动部分的振动。由此可见,水电机组振动是水力、机械、电磁共同作用的结果,且多为多故障并发,致使机组振动信号具有高度的非线性。而量子自适应粒子群优化BP神经网络算法,既具有量子计算的高度并行性优势,又保留了神经网络的非线性映射能力,可有效应用于水电机组的振动故障诊断中。此外,由于水电机组振动的振频既有引起设备振动的中低频,又有因水力因素所产生的涡带振动等压力脉动频率,故而机组振动信号的频率范围较广。鉴于水电机组的振动故障类别与一定的频率成分相对应,如不平衡故障的一阶转频能量较大、而不对中故障主要对应于二阶转频能量等。因此,可通过频谱分析来提取机组故障数据的频率特征。同时,由于传统的频谱分析方法无法对水电机组的振动信号进行有效的分析和处理,故采用小波分析进行振动信号的降噪处理,以去除噪声信号所在的频段,并对降噪后的小波系数进行重构,最终提取出机组振动故障的特征参数。
3.2应用实例一以贵州索风营水电厂机组故障数据[16]为例进行验证分析。鉴于频谱分析能够很好地揭示机组振动故障的特征,以对不同的振动故障加以区分。而变工况试验一般是进行定水头、变转速试验,根据转速的不同来选取不同的工况点,进而确定水力、机械、电磁3类振源的影响大小[17]。因此,这两种方法在水电机组的振动故障诊断中较常采用。本文选取水电机组振动频谱和变工况试验中的9个特征向量:0.18~0.2f0、1/6~1/2f0、1f0、2f0、3f0(f0为基频)、50Hz或100Hz频率、振动与转速关系、振动与负荷的关系以及振动与励磁电流的关系为量子自适应粒子群优化BP神经网络的输入参数,分别用I1~I9表示。对应的5种故障类型:转子不对中、转子不平衡、动静碰摩、尾水管偏心涡带和磁极不均匀作为QAPSO-BP模型的输出参数,并依次用向量[001]、[010]、[011]、[100]及[101]分别表示,其样本数据见表1。其中样本1~3为转子不对中故障,4~6为转子不平衡故障,7~8为动静碰摩故障,9~11为尾水管偏心涡带故障,余下2个样本为磁极不均匀故障。选择样本3、6、10为算法的测试数据,其余的为训练样本。在利用QAPSO-BP算法进行故障诊断时,主要参数设置为:网络结构9-12-3,种群规模20,迭代次数30,加速因子c1=c2=2,变异概率pm=0.05。经过多次试验,得出QAPSO-BP和PSO-BP算法的最佳适应度函数及网络训练误差曲线分别见图1和图2。从图1可知,QAPSO算法在迭代8次左右时,已搜索到全局最优解,远小于PSO算法的29次,寻优速度较快。同时,由于适应度函数选取为网络输出均方误差的倒数,适应度值越大说明输出误差越小。而QAP-SO算法的最大适应度值约为175,高出PSO的59.1%。对于图2,QAPSO-BP算法在经过8次优化后,网络训练误差即达到了设定的目标值10-5,而PSO-BP算法需要34次才实现。综合以上可见,无论是在收敛精度还是收敛速度方面,QAPSO算法都比PSO有着较大的提高。这是因为QAPSO算法通过将量子计算与PSO融合,提高了种群的遍历性;引入惯性因子自适应调整及变异操作,可以使粒子跳出局部极值点,从而提高了算法的全局寻优能力及优化效率。将训练好的QAPSO-BP模型对3组测试样本进行故障诊断,并与PSO-BP算法、BP神经网络的输出进行比较,对比结果见表2。显然,根据所预设的网络输出向量,QAPSO-BP算法及PSO-BP算法的诊断结果完全正确,而BP网络误将不平衡故障定位为不对中故障。同时,经计算可知,对于QAPSO-BP算法,其输出结果的平均绝对误差为1.05%,低于PSO-BP算法和BP神经网络的相应值2.54%与21.7%。由此可见,基于QAPSO-BP的水电机组振动故障诊断算法,其诊断结果的准确性较高。
3.3应用实例二为了进一步验证该算法在水电机组振动故障诊断中的优势,采用文献[18]数据进行分析。该文献以振动信号频谱分量的幅值作为特征向量,对应故障分为不对中、不平衡和涡带偏心3种,其样本数据见表3。利用前12组数据对QAPSO-BP模型进行训练,并定义网络输出:[001]、[010]和[100]与3种故障对应。在这里,同样采用应用实例一中的3种算法进行诊断结果的对比,则对后3组测试样本的网络输出见表4。可见,尽管表4中3种算法的诊断结果与机组振动故障的实际类型一致,但是QAPSO-BP模型的输出结果更接近于所定义的网络输出值,其平均绝对误差仅为2.34%,明显低于另2种算法的4.30%和8.38%,从而说明了基于QAPSO-BP算法的机组振动故障诊断结果具有一定的普遍性。
4结论
(1)针对粒子群优化算法易陷入局部最优等问题,将量子计算和PSO结合起来,组成量子自适应粒子群优化算法。采用量子位概率幅的编码机制,扩展了解空间的遍历性。根据种群中各粒子的位置与速度信息,对惯性因子进行自适应调节,实现了QAPSO算法在全局收敛与局部搜索能力之间的平衡。为了便于搜索最优解,用量子非门进行变异操作,提高了种群的多样性。(2)利用QAPSO算法优化BP神经网络的初始权、阈值参数,进而构建了水电机组的振动故障诊断模型,并通过两个实例进行验证。结果表明,QAPSO-BP算法具有较佳的全局寻优能力及优化效率,能够较好地拟合机组征兆域与故障域之间的复杂非线性映射关系,适用于水电机组的振动故障诊断。
参考文献
[1]张彼德,田源,邹江平,等.基于Choquet模糊积分的水电机组振动故障诊断[J].振动与冲击,2013,32(12):61-66.ZHANGBi-de,TIANYuan,ZOUJiang-ping,etal.VibrationfaultdiagnosisofaHydro-generatingunitbasedonchoquetfuzzyintegration[J].JournalofVibrationandShock,2013,32(12):61-66.
[2]ZhangXiao-yuan,ZhouJian-zhong,GuoJun,etal.Vibrantfaultdiagnosisforhydroelectricgeneratorunitswithanewcombinationofroughsetsandsupportvectormachine[J].ExpertSystemsWithApplications,2012,39(3):2621-2628.
[3]易辉,梅磊,李丽娟,等.基于多分类相关向量机的水电机组振动故障诊断[J].中国电机工程学报,2014,34(17):2843-2850.YIHui,MEILei,LILi-juan,etal.Vibrationfaultdiagnosisforhydroelectricgeneratingunitsusingthemulti-classrelevancevectormachine[J].ProceedingsoftheCSEE,2014,34(17):2843-2850.
[4]张孝远,周建中,王常青,等.考虑样本交叠的水电机组振动故障诊断[J].电力系统保护与控制,2012,40(3):8-14.ZHANGXiao-yuan,ZHOUJian-zhong,WANGChang-qing,etal.Vibrantfaultdiagnosisforhydroelectricgeneratorunitconsideringoverlappingfaultpatterns[J].PowerSystemProtectionandControl,2012,40(3):8-14.
[5]贾嵘,洪刚,武桦,等.基于IPSO优化LSSVM的水轮发电机组振动故障诊断[J].水利学报,2011,42(3):373-378.JIARong,HONGGang,WUHua,etal.VibrationfaultdiagnosisofhydroelectricgeneratingunitbyLeastSquaresSupportVectorMachinebasedonImprovedParticleSwarmOptimization[J].ShuiliXuebao,2011,42(3):373-378.
[6]郭鹏程,孙龙刚,李辉,等.基于多重分形谱和改进BP神经网络的水电机组振动故障诊断研究[J].水力发电学报,2014,33(3):299-305.GUOPeng-cheng,SUNLong-gang,LIHui,etal.Vibrationfaultdiagnosisofhydropowerunitbasedonmulti-fractalspectrumandimprovedBPneuralnetwork[J].JournalofHydroelectricEngineering,2014,33(3):299-305.
[7]李鑫,王少萍.基于卡箍优化布局的飞机液压管路减振分析[J].振动与冲击,2013,32(1):14-20.LIXin,WANGShao-ping.Vibrationcontrolanalysisforhydraulicpipelinesinanaircraftbasedonoptimizedclamplayout[J].JournalofVibrationandShock,2013,32(1):14-20.
[8]张海鹏,韩端锋,郭春雨.改进PSO训练的BPNN方法的舰船主尺度建模[J].哈尔滨工程大学学报,2012,33(7):806-810.ZHANGHai-peng,HANDuan-feng,GUOChun-yu.ModelingoftheprincipaldimensionsoflargevesselsbasedonaBPNNtrainedbyanimprovedPSO[J].JournalofHarbinEngineeringUniversity,2012,33(7):806-810.
[9]张晓辉,董兴华.含风电场多目标低碳电力系统动态经济调度研究[J].电网技术,2013,37(1):24-31.ZHANGXiao-hui,DONGXing-hua.Researchonmulti-objectiveschedulingforlow-carbonpowersystemwithwindfarms[J].PowerSystemTechnology,2013,37(1):24-31.
[10]LinLiang-kui,XuHui,XuDan,etal.QPSO-basedalgorithmofCSOjointinfraredsuper-resolutionandtrajectoryestimation[J].JournalofSystemsEngineeringandElectronics,2011,22(3):405-411.
[11]陈道君,龚庆武,金朝意,等.基于自适应扰动量子粒子群算法参数优化的支持向量回归机短期风电功率预测[J].电网技术,2013,37(4):974-980.CHENDao-jun,GONGQing-wu,JINZhao-yi,etal.Short-termwindpowerpredictionbasedonsupportvectorregressionmachineoptimizedbyadaptivedisturbancequantum-behavedparticleswarmoptimization[J].PowerSystemTechnology,2013,37(4):974-980.
[12]刘立峰,孙赞东,韩剑发,等.量子粒子群模糊神经网络碳酸盐岩流体识别方法研究[J].地球物理学报,2014,57(3):991-1000.LIULi-feng,SUNZan-dong,HANJian-fa,etal.Acarbonatefluididentificationmethodbasedonquantumparticleswarmfuzzyneuralnetwork[J].ChineseJournalofGeophysics,2014,57(3):991-1000.
[13]郭通,兰巨龙,李玉峰,等.基于量子自适应粒子群优化径向基函数神经网络的网络流量预测[J].电子与信息学报,2013,35(9):2220-2226.GUOTong,LANJu-long,LIYu-feng,etal.Networktrafficpredictionwithradialbasisfunctionneuralnetworkbasedonquantumadaptiveparticleswarmoptimization[J].JournalofElectronics&InformationTechnology,2013,35(9):2220-2226.
[14]陈义雄,梁昔明,黄亚飞.基于佳点集构造的改进量子粒子群优化算法[J].中南大学学报:自然科学版,2013,44(4):1409-1414.CHENYi-xiong,LIANGXi-ming,HUANGYa-fei.Improvedquantumparticleswarmoptimizationbasedongood-pointset[J].JournalofCentralSouthUniversity:ScienceandTechnology,2013,44(4):1409-1414.
[15]卢娜,肖志怀,符向前.基于蚁群初始化小波网络的水电机组振动故障诊断[J].水力发电学报,2014,33(2):251-258.LUNa,XIAOZhi-huai,FUXiang-qian.VibrationfaultdiagnosisofhydroelectricgeneratingunitbasedonACO-initializedwaveletnetwork[J].JournalofHydroelectricEngineering,2014,33(2):251-258.
[16]李超顺,周建中,肖剑,等.基于引力搜索核聚类算法的水电机组振动故障诊断[J].中国电机工程学报,2013,33(2):98-104.LIChao-shun,ZHOUJian-zhong,XIAOJian,etal.Vibrationfaultdiagnosisofhydroelectricgeneratingunitusinggravitationalsearchbasedkernelclusteringmethod[J].ProceedingsoftheCSEE,2013,33(2):98-104.
[17]肖剑,周建中,张孝远,等.基于Levy-ABC优化SVM的水电机组故障诊断方法[J].振动、测试与诊断,2013,33(5):839-844.XIAOJian,ZHOUJian-zhong,ZHANGXiao-yuan,etal.FaultdiagnosisforHydroelectricGeneratorUnitBasedonLevyFlight-ArtificialBeeColonyandSupportVectorMachine[J].JournalofVibration,Measurement&Diagnosis,2013,33(5):839-844.
摘要:电价预测是电力市场中的一个重要研究课题。支持向量机(SVM)已被广泛应用于这一领域。然而,电力市场电价的高波动性和随机性等特征给支持向量机核函数的选择带来了挑战。本文在选择不同核函数的基础上,分别建立了两个电力价格预测模型,并用真实电力市场价格数据对两个模型进行了验证。实验结果表明,与其他支持向量机预测研究相比,本文精心选择的SVM核函数对短期电价预测具有较好性能。
关键词: 电力市场;预测;支持向量机;核函数
A Comparison of Kernel Functions of Support Vector Machine for Electricity Price Forecasting
ZHAI Hong-yan1,ZENG Jin-ming2 ,ZENG Ji-xia1
(1.Guangzhou City Polytechnic,Guangzhou 510405,China;
2.China Southern Power Grid Co., LTD, Guangzhou Power Supply Bureau, Guangzhou 510030, China)
ABSTRACT: Accurate forecasting of spot price is an essential issue in electricity market. Support Vector machines (SVM) has been widely adopted to deal with this issue. However, the high fluctuation and randomness features of electricity market present a number of challenges for the choosing of kernel functions for SVM. In this paper, by using different kernel functions, two SVM models for electricity price forecast have been developed. Case studies, adopting data from an actual electricity market, have been performed and the results are presented. In addition, comparisons with results from other SVM forecasting studies have shown that the performance of SVM models could be improved by choosing a tailored kernel function.
KEYWORDS:power market; forecasting; SVM; kernel functions
1 引言
电价预测是近几年发展起来的一个新的研究方向,现实的迫切需要使电价预测成为研究热点[1]。电价预测是指在考虑市场供求关系、市场参与者的市场力、电力成本、以及电力市场体制结构、社会经济形势等重要因素影响的条件下,利用数学工具对历史数据进行分析和研究,探索事物之间的内在联系和发展变化规律,在满足一定精度和速度的情况下,对未来电力市场中的电力交易价格进行预测[2]。目前,世界范围内已在展开电力行业的市场化改革,我国也正在进行大区电力市场的试点。在市场环境下,电力如普通商品一样进行交易,电力价格成为电力市场中的基本要素。市场参与者均以不断变化的市场电价作为参考进行电能交易和结算,电价直接影响着参与者的收益。然而,电力市场中电价具有较高的波动性和随机性,这给电力交易的收益带来了风险,市场中的各方均希望能够准确预测将来一段时间的电价,以选择资深交易策略和估算效益。
短期电价预测是电价预测的重要组成部分,它主要用于预测未来几小时、1天至几天的电价。准确的短期电价预测将有助于发电商最优报价策略的选择,从而最大化其利润,使购电方的动态成本控制成为可能,同时也为监管部门的实时监管提供了重要的科学依据,保证电力市场的正常运行。目前,短期电价预测主要有四种方法:1.时间序列法。时间序列模型已被广泛应用于短期负荷预测中。时间序列方法的主要难点在于如何选择恰当的模型。在时间序列分析中,选用何种因子和用何种表达式有时只是一种推测,影响电价的因子的多样性和某些因子的不可测,使得时间序列分析在某些情况下受到限制,预测的精度较低。2.神经网络(ANN)预测法。神经网络对大量非结构性、非精确性规律具有自适应功能,能够有效处理多变量和非线性问题,从而成为目前国内外专家学者研究得比较多的一种电价预测方法[2]。应用神经网络模型进行预测时,研究的重点大多在于如何构成预测样本,如何构成输入层数据等。由于模型的网络结构的选取大多凭借经验,或者采用试凑法,即取测试集预测误差相对较小时的数值,因此神经网络存在难以确定合理的网络结构和容易收敛到局部最优解等问题,使得神经网络在预测精度和收敛性方面存在一定的限制。3.基于小波理论的预测方法。小波理论是在傅里叶分析基础上发展起来的一种信号处理方法,小波变换能将各种交织在一起的不同频率混合信号分解成不同频带上的块信号,然后在各个时频区域分别进行观察和处理,在时域和频域都具有良好的分辨能力。小波神经网络与BP神经网络相比,预测精度和收敛性方面都有明显的提高。但是在用辅助式小波神经网络进行预测时,需注意小波基和分解尺度的选择,同时处理好小波变换过程中的边界问题,否则即使各个子序列预测得再准确,总体的预测效果也不会很好。而在用嵌套式小波神经网络进行预测时,需注意小波基的数量和网络初始参数的选择,选择不当会导致网络收敛速度缓慢甚至出现不收敛。4.组合预测方法[2]。鉴于单一预测方法的一些弊端,有些学者开始对组合预测方法进行探索,当前的主要思路是直接从电价预测机理的角度将单一预测模型进行组合,即先对各种已有的单一预测方法优缺点进行分析,然后通过将两种或者多种方法进行组合,扬长避短,从而建立最优的组合预测模型[2]。但是我们应该意识到:并非任意两个或者多个数学方法的组合就一定能取得更好的预测结果,这需要实践检验其预测效果,才能评价某种新的数学方法的应用前景。
作为一种重要的数据挖掘算法[3-4],支持向量机(Support Vector Machines, SVMs) 正被广泛应用于短期电价预测[5]。支持向量机的性能与其核函数(kernel function)的选择密切相关。本文针对支持向量机核函数选择进行了一系列实验,探讨在单一环境下支持向量机核函数的表现性能。
本文的后续结构组织如下:第2节对支持向量机及其原理进行介绍;第3节描述实验配置以及数据;第4节对实验结果进行分析;最后,进行实验结果总结与讨论,并对后续工作的开展进行展望。
2 支持向量机