前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数学建模的预测方法主题范文,仅供参考,欢迎阅读并收藏。
[关键词]明胶 浓度 软测量技术 建模方法
中图分类号:TP274 文献标识码:A 文章编号:1009-914X(2016)24-0132-01
胶液浓度的确定是明胶生产过程中的一个重要工作,直接影响着明胶提胶工序的顺利开展,为此,必须针对胶液浓度控制进行有效研究,确定工艺参数。目前,我国的明胶生产企业受到生产线自动化程度、受检测设备等方面的限制一直未有比较可靠的检测方法。鉴于这种情况,本文提出了一种基于软测量技术的胶液浓度测量模型,实现对明胶胶液浓度在线测量。本文对软测量技术概念入手,简述了明胶浓度软测量建模及参数优化。
一、软测量技术
软测量技术又被称为软仪表技术,其中心思想是利用易测过程变量来估计难测变量。易测变量常被称为辅助变量或二次变量(Secondary Variable)。例如在工业生产过程中易获得的流量、压力、温度等参数,难以测量的过程变量被称为主导变量(Primary Variable)[1],通常在条件限制下不能在线监测或者检测成本较高。利用软测量技术,就是依据主导变量和辅助变量之间的数学模型(软测量模型),通过各种数学计算和估计方法,用计算机软件来实现待测量过程变量的测量。
二、软测量的建模方法
建立软测量模型是软测量技术的核心部分,建模方法可分为机理建模、回归分析、状态估计、模式识别、人工神经网络、模糊数学、过程层析成像、相关分析和现代非线性信息处理技术等。
1.基于机理的软测量建模方法
基于机理的建模,就是从过程对象的内在物理或化学的研究出发,通过物料平衡和动量平衡等原理,找出主导变量和辅助变量之间的关系,建立机理模型来实现对主导变量的软测量。通过机理分析建立的软测量模型,只要把主导和辅助变量作相应的调整就可以活得新的模型。对于较简单的工业过程,可以采用解析法建模。而对于复杂过程,特别是输入变量变化范围较大的情况下,则采用仿真方法。
2.基于线性回归分析软测量建模理论
回归分析是统计数学的一个重要分支,在实验数据处理中又称为“曲线拟和”。回归分析可分为多种形式按因变量和自变量之间是否存在线性关系可分为线性回归和非线性回归按自变量的个数又可分为一元回归和多元回归。回归分析作为一种经典的建模方法,它是通过机理分析建立模型结构,然后通过收集大量过程参数运用统计方法估计模型参数。典型的回归建模方法首推经典的最小二乘法。为了避免矩阵求逆运算可以采用递推最小二乘法,为了防止数据饱和还可以采用带遗忘因子的最小二乘法。另外,主元分析和主元回归都是统计学中较为成熟的方法。基于回归分析的软测量的简单实用,但在建模和校正过程中需要大量的样本,而且对样本数据的误差较为敏感。虽然如此,基于线性回归的技术仍然是目前应用最多的软测量技术,市场上一些成熟的软测量商品软件都是以此为基础的。
3.人工神经网络法
人工神经网络,适用于解决高度非线性以及严重不确定性系统的控制问题,是当前工业领域中的热点。使用该方法的建立模型不需要具备过程对象的先验知识,可以根据输入输出数据直接建模,将辅助变量和主导变量分别作为人工神经网络的输入和输出,通过网络的学习来估测主导变量。人工神经元网络的基本原理是模仿人类脑神经活动的一种人工智能技术,给一些样本,通过自学习可以掌握样本规律,在输入新的数据和状态信息时,可用进行自动推理和控制。
4.基于模糊数学的方法
模糊数学是研究和处理模糊性现象的一种数学理论和方法,具有模仿人脑逻辑的特点,可以处理复杂系统,因此在软测量技术中也得到了大量应用。基于模糊数学的方法建立的软测量模型是一种知识性模型。该种软测量方法很适合应用于复杂工业过程中被测对象呈现亦此亦彼的不确定性,难以用常规数学定量描述的场合。实际应用中,可以采用模糊技术和其他人工智能技术相结合的建模方法,取长补短以提高软测量模型的预测效果。例如由模糊数学和人工神经网络结合构成的模糊神经网络,模糊数学和模式识别一起构成模糊模式识别等。模糊控制器依照人工操作思维程序来工作。首先,把测量的输出进行模糊化,变为模糊语言变量,由模糊控制规则进行模糊决策,再把模糊决策量清晰化转变为精确量去控制被控过程。
5.多模型的软测量建模方法
连接多个模型以改进模型预测能力的方法是由于年提出的。多摸型建模就是把多个子模型对未知样品的预测结合起来,这种建模方法与传统的单建模方法不同。传统单建模方法的一般过程为在反复分析测量数据过程中,建立一系列的预测模型,最后,从中选出一个预测性能最好的模型来预测未知样品。多模型数据建模则是通过某种方法建立多个子模型,并把多个成员模型对未知样品的预测用某种方法结合起来,形成一个共识的结果,以提高模型的预测精度和可靠性。多模型的模型结构如图1所示:
该方法在时间序列分析中得到较广泛的研究,近年来在神经网络的研究中也备受关注。当用系统输入输出数据建立非线性对象的神经网络模型时,采用单个神经网络建立的模型往往只是系统的一种近似模型,而且不同网络在不同输入空间中的预测性能会有所不同。而且多个神经网络通过一定方式将这些单个网络进行连接,构成对象的整个输入空间模型,模型的预测精确度得到了增强。
三、 软测量模型的参数优化
在本次研究中,仅针对LSSVM的软测量模型的主要参数是正则化参数c和和核参数α进行优化,并力求选择最佳的参数组行优化处理,让模型的泛化能力和精确度更好。合是一个最佳模型的选择问题,在很大程度上决定了模型的学习和泛化能力。采用留一交验证法选择最优模型参数费时费力,在本次研究中采用采用粒子群算法和K均值聚类算法相结合对模型参数进行优化。经过优化后,模型的精度和泛化能力均有显著提升。
参考文献:
关键词:风电功率;短期预测;多层RBF神经元网络;风能;风电场
中图分类号:TM74
文献标识码:A
文章编号:1009-2374(2012)30-0018-03
1 概述
随着大规模风电场的兴起,风能越来越多地被应用到发电行业,加强对风电功率预测的研究具有迫切性和重要性,目前提出的预测方法有统计方法、时间序列分析法、空间相关性法、模糊逻辑法、灰色预测法、人工神经网络法等。
本文提出多层RBF网络。该网络是在一层网络的基础上用第二层网络去拟合残差函数,得到三层网络,它的拟合精度又提高了。如此进行下去,就得到一个高精度的多层径向基函数网络,其在非线性建模特别是非线性时间序列和混沌时间序列的建模和预测上有重要意义。相对于单层RBF网络的预测有更高的精度。
2 基本理论
2.1 单层RBF神经网络
RBF神经网络是一种性能良好的前向神经网络。RBF神经网络的典型结构如下,不失一般性,假设输出层只有一个结点,这种结构很容易扩展到多输出结点的情形。输入层到隐层为权值1的固定连接。隐含层由一组径向基函数构成,其中对应的中心向量和宽度是RBF的参数。一般隐含层各结点都采用相同的径向基函数,径向基函数有多种形式,通常取高斯函数。隐层的输出在输出层线性加权组合,形成神经网络的输出。
2.2 多层RBF神经元网络
多层径向基函数的原理是在一层网络的基础上用第二层网络去拟合残差函数,得到三层网络,如此进行下去,就得到一个高精度的多层径向基函数网络,高精度的函数逼近网络在非线性建模,特别是非线性时间序列和混沌时间序列的建模和预测上有重要意义。
于是得到了一个模型,其中用最小二乘法决定加权系数得到。重复这一步骤得到一个多层径向基网络。最后,根据适当的判别准则可以决定增加几层最为合适。
3 模型的建立及求解
3.1 单层RBF神经网络
4 结语
建立了以风电输出功率数据为样本的单层RBF及多层RBF神经元网络模型的预测,并用实际数据作了大量实验预测,检验了模型的精确性。多层RBF网络具有比单层RBF网络更好的样本预测性能,需要指出的是,多层径向基函数网络的聚类学习法仍有一些待解决的问题,如网络隐层神经元数目的选择问题、参数优化的计算量大等,对于该预测方法还要作进一步的完善。
参考文献
[1] 方江晓,周辉,黄梅.基于统计局类分析的短期风电功率预测[J].电力系统保护与控制,2011,39(11):67-78.
[2] Torres J L,Garcia A,Blas M D,et a1.Forecast of Hourly Average Wind Speed with ARMA Models in Navarre(Spain)[J].Solar Energy,2005,79(5):65-77.
[3] 李文良,卫志农,孙国强.基于改进空间相关法和径向基神经网路的风电场短期风速分时预测模型[J].电力自动化设备,2009,29(6):89-92.
[4] Alexiadis M,Dokopoulos P,Sahsamanoglou H,et a1.Short term forecasting of wind speed and related electrical power[J].Solar Energy,1998,63(1):61-68.
[5] Barbounis T G,Theocharis J B.A locally Wuetta,Pakistan 1997(01)recurrent fuzzy neural network with application to the wind speed prediction using spatial correlation[J].Neurocomputing,2007,70(7/9):15、25-42.
[6] 李俊芳,张步涵,谢光龙.基于灰色预测模型的风速-风电功率预测研究[J].电力系统保护与控制,2010,38(19):112-120.
[7] Barbounis T G,Theocharis J B,Alexiadis M C,et a1.Long-term Wind Speed and Power Forecasting Using Local Recurrent Neural Network Models[J].Transactions on Energy Conversion,2006,21(1):273-284.
关键词:煤矿;瓦斯涌出量;预测方法
中图分类号:TD712.5 文献标识码:A 文章编号:1007-9599 (2011) 21-0000-01
China Coal Mine Gas Emission Projections Methods
Liu Yang,Shi Qingjun,Li Jing,Ma Huibin,Liu Desheng,Zhang Zhongwu
(Institute of Electronic Technology Information,Jiamusi University,Jiamusi 154007,China)
Abstract:This paper describes the current status of China's coal mine safety and gas emission projections of six methods,analysis forecasting methods and principles of the applicable conditions,and compare the performance of forecasting methods.
Keywords:Coal;Gas emission;Prediction way
我国是世界上最大的煤炭生产国和消费国。由于我国95%的煤矿开采是地下作业,而且煤层大多瓦斯含量大,透气性差,地质构造复杂,所以经常发生瓦斯安全事故,关于瓦斯灾害的防治一直是煤矿安全工作的重点。
为了避免煤矿的瓦斯事故,必须对矿井瓦斯进行实时定的监测和有效的预测。目前我国所有高瓦斯、煤与瓦斯突出和87.5%的低瓦斯矿井都安装了瓦斯监测监控系统,能够对瓦斯的涌出量进行实时监测,但现有的技术是以瓦斯的监测为主,无法提前预测预报。如果能在瓦斯浓度超限的早期进行有效的预测,提前预报,就可以适时、合理地采取措施,预防瓦斯事故的发生,为矿井的安全和人员的生命安全提供可靠的保障。
一、瓦斯涌出量预测方法
(一)矿山统计法。矿山统计法[1]是根据对生产矿井不同开采深度的相对瓦斯涌出量的实测资料,进行统计分析,找出相对瓦斯涌出量随工作面煤层推进位置煤层标高的规律,来预测延伸水平或相邻矿井的瓦斯涌出量。利用矿山统计法时必须对采掘工作面的风量、瓦斯浓度、煤层深度、采煤方法等参数进行采集和统计,而且预测区域与已采区域的瓦斯地质情况和开采技术条件与新区域愈相似,预测的可靠性和精度愈高。当开采条件或地质条件发生改变时,即使在同一矿井,也不能对深部区域进行预测。
(二)分源预测法。分源预测法[2]是根据煤层瓦斯含量与矿井瓦斯涌出源的关系,利用瓦斯涌出源的瓦斯涌出规律,结合煤层的赋存条件和开采技术条件,通过对回采工作面和掘进工作面瓦斯涌出量的进行计算,达到预测采区和矿井瓦斯涌出量的目的。
分源预测法适用无瓦斯涌出量历史资料的预测,例如新建矿井、生产矿井水平延深、新设计采区以及采掘工作面的瓦斯涌出量预测。但分源预测法的一些参数是根据经验和采区现场实测得到,例如:在利用钻孔瓦斯含量法时,如何选择最具有代表性钻孔和钻孔瓦斯含量的检测的精度都会影响预测效果,而且采用的计算公式是经验公式,具有一定的局限性,预测结果有时误差比较大。
(三)瓦斯地质数学模型法。采用瓦斯地质统计法建立回采面绝对瓦斯涌出量与煤层瓦斯含量的关系式,并以此对矿井未采区的瓦斯涌出量进行了预测.
瓦斯地质数学模型法是通过对瓦斯地质规律研究,分析瓦斯涌出量的变化规律,筛选影响瓦斯涌出量变化的主要地质因素(如:地质构造、煤层构造和水文地质等因素),其中宽缓褶曲、煤层埋藏深度、水动力条件等对瓦斯涌出量影响较为显著[3],在此基础上,根据矿井已采地区的瓦斯涌出量实测资料,综合考虑包括开采方法和开采深度在内的多种影响因素,采用一定的数学方法,建立预测瓦斯涌出量的多变量数学模型,对矿井未采区域的瓦斯涌出量进行预测。
(四)基于灰色系统理论的预测法。灰色系统是指既含有已知的,又含未知的或非确知信息的系统。矿井瓦斯涌出是受自然的地质因素和开采方式等人为因素影响,而且各因素间的关系是动态的、模糊的,灰色模型正好能反映瓦斯涌出外延明确、内涵不明确系统的内在变化规律。利用灰色系统灾变理论建立的GM(1,1)预测模型,实现矿井瓦斯涌出量的预测。为了减少原始瓦斯涌出量受到的外界的干扰,在GM(1,1)模型中引入实用缓冲算子,改进的预测模型有相对误差小和预测数据稳定性好等优点。
(五)基于神经网络的预测法。人工神经网络是模仿人脑神经网络行为特征,进行分布式并行信息处理的算法数学模型。人工神经网络通过分析输入输出数据之间的内在规律,利用这些规律构建预测模型。根据输入数据类型将基于人工神经网络的瓦斯涌出量预测分为两种:①选择对瓦斯涌出影响较大因素(如煤层瓦斯体积分数、煤层倾角、工作面长度、推进速度等)作为输入,②选择瓦斯涌出量历史数据本身作为输入。利用人工神经网络构建预测模型需要有足够的具有代表性的数据作为样本。
(六)基于混沌时序分析的预测法。矿井瓦斯涌出量的大小受多种因素影响,且错综复杂,表现为既非确定的,也非完全随机,具有混沌特性。基于混沌分析的预测法通过分析瓦斯涌出量时间序列本身规律,恢复混沌吸引子特性,重构与原动力系统等价的相空间,在相空间中构建预测模型,实现瓦斯涌出量的动态预测,而且在预测步长、预测精度和稳定性等方面都表现出良好的性能。
二、瓦斯涌出量预测方法的比较
从目前实际应用情况来看,矿山统计法和分源预测法为目前我国煤矿主要采用的方法,并且写入2006年的安全生产行业标准《矿井瓦斯涌出量预测方法》。瓦斯地质数学模型法,现场有一定的应用。而灰色系统预测法、神经网络预测法和混沌时序分析由于计算过程复杂,必须借助计算机的编程,所以目前现场很少采用,目前还在探索研究阶段。
从预测方式情况来看,矿山统计法、分源预测法和瓦斯地质数学模型法为静态预测或以点代面的预测,预测结果不能真实反映具有动态行为的采掘工作面生产过程中的瓦斯涌出实际情形,预测的时效性、可靠性较差。基于灰色系统理论的预测法、神经网络预测法和混沌时序分析预测方法为动态预测,灰色系统预测在多因素情况下会遇到精确建模与求解困难的问题;神经网络预测方法存在输入神经元参数选择的主观性、部分参数难于精确获取的问题,以及在小样本下泛化能力低,预测能力下降等缺点;混沌时间序列预测避免了建模的主观性和经验性,根据现有的瓦斯涌出量时间序列本身所计算出来的规律进行预测,具有较好的预测精度和可信度。
三、展望
由于目前人们没有完全掌握瓦斯涌出机理,因此对瓦斯涌出量的预测仍然是一个长期研究的课题,在深入研究影响瓦斯涌出的因素外,利用现有的瓦斯监控系统,逐渐发展具有动态预测能力的模型,以适应有动态行为的采掘工作面的瓦斯涌出,使瓦斯涌出量的预测具有实时性、精确性和稳定性,为煤矿的安全生产提供重要保障。
参考文献:
[1]赵鹏伟.矿山统计法预测综放工作面瓦斯涌出量[J].机械管理开发,2006,3:18-19
[2]鲁义,王曙勋,蔡云龙.分源预测法在整合矿井瓦斯涌出量预测的应用[J].山西焦煤科技,2011,8:27-31
[3]龙威成,吴义军,李川.黄陵二号煤矿瓦斯地质规律及涌出量预测[J].河南理工大学学报,2011,5:516-520
【关键词】 中长期电力负荷预测;组合预测;非负性;归一化;偏最小二乘回归
引言
中长期负荷预测是电网规划的基出,其精度的高低直接影响电网规划的质量。中长期负荷预测方法大体可归结为回归分析[1,2]、时间序列[3,4]和人工智能方法[5,6]三类。虽然中长期负荷预测方法[1-3]众多,但是,由于影响中长期负荷预测的直接因素或间接因素较多,随机性大,且众多影响因素的关联性较大,单一预测模型不能在任何时刻充分反映数据的变化,预测精度也很难满足预测需要。组合预测能够较好地解决单一模型的缺点,借鉴单一预测模型的优点,比单个预测模型更系统、更全面。组合预测由于比单方法预测更有效、能提高模型的拟合精度和预测能力,因此,长期以来一直是国内外预测界研究的热点课题,并在世界各国范围内得到广泛应用。分析现有的组合预测模型[5-7],发现预测的核心问题是:基于何种误差评判准则如何求取加权系数。国内外学者提出以下方法:最小方差方法,最小二乘方法,基于不同误差准则和范数的方法等。现有的各种组合预测方法因组合权重受到归一化条件和非负性条件的约束,在某些情况下不能使组合预测结果优于单一预测方法。因此有必要研究新的组合预测方法,本文所研究的基于偏最小二乘回归的组合预测模型,不以求取组合权重为切入点,而是利用偏最小二乘回归强大的拟合和解释能力,对单一预测模型进行拟合,抛开了组合权重非负性和归一化的限制,与传统的组合预测方法有较大的差别。
1、现有组合预测模型分析
现有组合预测模型的重点是如何求取组合权重向量,设k种单一预测方法的组合权重向量为W,并且WT=[w1 w2…wk],则W需满足归一化约束条件和非负性约束条件[8]
eTW=1(1)
W≥0 (2)
其中,eT=[1,1…1]。
电力系统的负荷变化是受多种因素影响的。在实际的负荷预测系统中,需要用有限的几个算法模拟大量的系统负荷变化规律进行预测。它们的预测结果向量不可避免地存在一定的“同向特征”,即单一预测模型的结果均小于或均大于真实值,下面讨论单一预测模型的结果均小于真实值的情况。
设根据历史数据分别使用k种模型对未来时段1≤t≤m进行预测,已知未来时段的真实值序列为: x=[x1 x2…xm]T,设其中第q个预测模型的预测序列为xq=[x1q x2q…xmq]T,并且xq
X=[x1 x2…xk]=x11 x12 … x1k
x21 x22 … x2k
xml xm2… xmk (3)
设xt=max{xt1,xt2,…,xtk},其中,t=(1,2,…,m),则可得向量 为最接近真实值序列xmax=[x1 x2…xm]T的结果。而组合预测的结果为:
xzh=XWT=∑kq=1wqx1q
∑kq=1wqx2q
∑kq=1wqxmq≤∑kq=1wqx1
∑kq=1wqx2
∑kq=1wqxm=x1∑kq=1wq
x2∑kq=1wq
xm∑kq=1wq (4)
=x1
x2
xm=xmax
可见,由于组合权重受到非负性条件和归一化条件的限制,所以在单一预测模型的结果均小于真实值的情况下,组合预测不能得到最优的拟合效果。对单一预测模型的结果均大于真实值的情况,类似上述分析可得到相同的结论。
针对上面的问题,文献[9]尝试了权重取负值的情况,但仍需进一步的探讨。本文另辟蹊径,抛开了组合权重非负性和归一化的限制,利用偏最小二乘回归强大的拟合和解释能力,对单一预测模型进行拟合,从而实现准确的组合预测。
2、偏最小二乘回归分析方法的数学模型
2.1 建模步骤
偏最小二乘回归是一种新的多元统计数据分析方法,是主成分分析、典型相关分析及多元线性回归分析的有机结合[10]。较传统的回归分析、主成分回归具有更大的优势,从而使模型精度、稳健性、实用性都得到提高[11]。其建模步骤如下:
(1)设已知因变量y和k个自变量x1、x2、…、xk,样本数为n,形成自变量矩阵X=[x1 x2……xk]n×k和因变量矩阵Y=[y]n×1。将X与Y进行标准化处理,得到标准化后的自变量E0和因变量矩阵F0。标准化处理是为了公式表达的方便和减少运算误差。
x*ij=xij-jsj
y*i=yi-sy
E0=(x*ij)n×k
F0=(y*i)n×1 (5)
其中,i=1,2,…,n;j=1,2,…,k,xij表示自变量矩阵X中第j个变量xj的第i个样本值;j表示自变量矩阵X中第j个变量xj的均值;sj表示xj的标准差;yi表示因变量y的第i个样本值;表示y的均值;sy表示y的标准差;x*ij表示xij标准化后的数值;y*i表示yi标准化后的数值。
(2) 提取第一个主成分
w1=ET0F0 ET0F0 =1∑kj=1r2(xj,y)r(x1,y)
r(xk,y) (6)
t1=E0w11∑kj=1r2(xj,y) (7)
[r(x1,y)E01+r(x2,y)E02+…+r(xk,y)E0k]
p1=ET0t1 t1 2 (8)
E1=E0-t1pT1 (9)
其中,E0j(j=1,2,…,k)表示E0的第j列;r(xj,y)( j=1,2,…,k)表示xj与y的相关系数。p1表示E0对t1的回归系数;E1表示回归方程的残差矩阵。
(3)重复建模步骤(2),以E1取代E0,以F1取代F0,用同样的方法得到w2=ET1F0 ET1F0 ;由于E1不再是标准化矩阵,所以有
w2=ET1F0 ET1F0 =1∑kj=1cov2(E1j,y)cov(E11,y)
cov(E1k,y) (10)
t2=E1w2 (11)
p2=ET1t2 t2 2 (12)
E2=E1-t2pT2 (13)
式中,cov(E1j,y) 表示E1j与y的协方差。
依此类推,从第(4)步开始,可用交叉有效性确定偏最小二乘回归中成分的提取个数,并停止迭代。
在得到成分t1、t2、…、tm(m<A,A=rank(X))后,实施F0关于t1、t2、…、tm的回归,即
F0=r1t1+r2t2+…+rmtm (14)
由于th(h=1,2,…,m)均为E0的线性组合,所以
th=Eh-1wh=E0Πh-1j=1(I-wjpTj)wh=E0w*h (15)
记w*h=Πh-1j=1(I-wjpTj)wh,其中I为单位矩阵,所以
F0=r1E0w*1+…+rmE0w*m=E0(r1w*1+…+rw*m) (16)
若记x*j=E0j,y*=F0,aj=∑mh=1rhw*hj(j=1,2,…,k),则标准化变量y*关于x*j的回归方程为
y*=a1x*1+a2x*2+…+akx*k (17)
最后,通过标准化的逆过程,可得到y关于xj回归方程为
y=β1x1+β2x2+…+βkxk (18)
式中,βi(i=1,2…,k)表示y关于xj回归系数。
2.2 交叉有效性分析
由上面的分析可知,偏最小二乘回归方程一般不需要选用全部成分进行回归建模,究竟选择多少个成分为宜,可通过增加一个新的成分后,能否对模型的预测功能有明显的改进来确定。记yi为原始数据,t1、t2、…、tm是在偏最小二乘回归过程中提取的成分。yhi是使用全部样本点并取h个成分t1、t2、…、th回归建模后,第i个样本点的拟合值。yh(-i)是在建模时删去样本点i,取h个成分t1、t2、…、th回归建模后,再用此模型计算的yi的拟合值,记
Sh=∑ni=1(yi-yhi)2 (19)
Ph=∑ni=1(yi-yh(-i))2 (20)
Q2h=1-PhSh-1 (21)
一般认为当Q2h≥0.0975时,增加成分th的贡献是显著的[2,10]。
3、基于偏最小二乘回归的组合预测模型
假定历史时段为1≤t≤n(拟合时段),根据原始序列y=[y1 y2…yn]T,分别使用k种模型对未来时段n+1≤t≤n+m进行预测,设其中第q个预测模型为y=fk(Sq,Xq,t),它对原始序列的拟合序列为xq=[x1q x2q…xnq]T,预测序列为xq=[x(n+1)q x(n+2)q…x(n+m)q]T,其中,q=1,2,…,k,Sq、Xq分别为第q个预测模型的参数向量和相关因素向量。
由此,可以得到拟合值矩阵为:
x=[x1 x2…xk]=x11 x12 … x1k
x21 x22 … x2k
xnl xn2… xnk (22)
预测值矩阵为:
X=[x1 x2…xk]=x(n+1) x(n+1)2 … x(n+1)k
x(n+2)1 x(n+2)2 … x(n+2)k
x(n+m)1 x(n+m)2… x(n+m)k (23)
将k种单一预测模型所得的拟合值作为k个自变量,将原始序列作为因变量,即拟合值矩阵X作为偏最小二乘回归的自变量矩阵,原始序列y作为偏最小二乘回归的因变量矩阵,按照第2节的建模步骤进行偏最小二乘回归分析(主成分提取、交叉有效性分析),求得y关于xq(q=1,2,…,k)的回归方程,然后将预测值矩阵x代入上述回归方程,即可得到未来时段n+1≤t≤n+m的预测值。此预测值是通过对k种单一模型预测值的拟合所得,即基于偏最小二乘回归的组合预测结果。
由上述分析可知,基于偏最小二乘回归的组合预测模型没有从求取组合权重入手,而是将单一预测值作为自变量,真实值作为因变量,利用偏最小二乘回归强大的拟合和解释能力,进行回归建模,完全不受组合权重非负性和归一化的限制,因此理论上能够得到更优的组合预测结果。
4、实例验证及分析
用某地区1991~2005年的年用电量进行算例分析,其中,用1991~2000年的数据进行建模,用2001~2005年的数据进行检验。计算时,采用动平均法、灰色预测法和指数平滑法3种单一预测模型,并用方差倒数加权法和本文所提方法分别进行组合预测,预测结果。
由表1可以看出,3种单一预测模型在检验阶段的预测值均比真实值小,用传统的组合预测模型进行预测,因为组合权重受到非负性及归一化的限制,组合预测的结果一定介于单一预测方法结果的最小值和最大值之间,所以也一定小于真实值,如表1中的方差倒数加权法。而基于偏最小二乘回归的组合预测模型则完全不受组合权重非负性及归一化的限制,利用偏最小回归分析和预测样本提取的主成分对各个单一预测方法进行精确拟合,所得结果不再均小于或大于单一预测模型的结果,而更接近于真实值。如表1所示,基于偏最小二乘回归的组合预测模型,无论是在拟合阶段,还是在检验阶段,其结果均比方差倒数加权法和3种单一预测模型精确。
5、结论
本文对中长期电力负荷组合预测进行研究,提出了基于偏最小二乘回归的组合预测模型,利用偏最小回归分析方法对各种单一预测模型进行精确拟合,该模型不以求取组合权重为切入点,较之传统的组合预测方法,不受组合权重非负性和归一化的约束,该模型的预测结果可以最大限度的接近真实值,实际算例表明了该模型的准确性和有效性。基于偏最小二乘回归的组合预测模型对中长期电力负荷预测工作有重要参考价值。
参考文献
1 毛李帆,江岳春,姚建刚,等.采用正交信号修正法与偏最小二乘回归的中长期负荷预测[J].中国电机工程学,2009,29(6):82-88.
MAO Li-fan,JIANG Yue-chun,YAO Jian-gang,et al. Medium and Long Term Load Forecasting Based on Orthogonal Signal Correction and Partial Least-squares Regression[J]. Proceedings of the CSEE,2009,29(6):82-88.
2 毛李帆,江岳春,龙瑞华,等.基于偏最小二乘回归分析的中长期电力负荷预测[J]. 电网技术,2008,32(19):71-76.
MAO Li-fan,JIANG Yue-chun,LONG Rui-hua,et al. Medium-and Long-Term Load Forecasting Based on Partial Least Squares Regression Analysis[J]. Power System Technology, 2008,32(19):71-76.
3 陈昊.基于非高斯分布GARCH模型的负荷预测[J]. 电力自动化设备,2008,28(7):65-68.
CHEN Hao. Load forecast based on GARCH model with non-Gaussian distribution[J]. Electric Power Automation Equipment, 2008,32(19):71-76.
4 张俊芳,吴伊昂,吴军基.基于灰色理论负荷预测的应用研究[J].电力自动化设备,2004,24(5):24-27.
ZHANG Jun-fang,WU Yi-ang,WU Jun-ji. Application of gray system theory in load forecasting[J]. Electric Power Automation Equipment, 2004,24(5):24-27.
5 王捷,吴国忠,李艳昌.蚁群灰色神经网络组合模型在电力负荷预测中的应用[J]. 电力系统保护与控制,2009,37(3):48-52.
WANG Jie,WU Guo-zhong,LI Yan-chang.Application of ant colony gray neural network combined forecasting model in load forecasting[J]. Power System Protection and Control,2009,37(3):48-52.
关键词:沉降预测;沉降量级小;灰色GM(1,1)模型;全最小一乘法。
0 前言:
目前常用的沉降预测方法较多,但研究表明,每种预测方法均有一定的适用范围,如双曲线法对于典型断面的理想数据预测效果较好,而对于量级小,波动大的观测数据的适用性较差;三点法(固结度对数配合法)预测误差较小,对数据段选取的依赖性小,对异常数据的敏感性强,但对沉降曲线收敛后波动太敏感,适用性差;Asoaka法预测误差一般较小,但其在预测过程钱对原始数据的平滑处理过程影响了预测误差的稳定性;指数曲线法对沉降变形数据的单调性有严格的要求,局部数据的小幅起伏变化都可能导致无法进行预测计算。
而现在高层、超高层建筑物,尤其高速铁路对于沉降控制很高,沉降量级一般较小,沉降数据波动大,如武广高铁桥涵和隧道沉降变形小于5mm,同时观测数据出现跳跃或连续几个观测数据变化趋势与常规相反的情况较多[[1] 陈善雄.高速铁路沉降变形观测评估理论与实践[M].中国铁道出版社,2010,3.]。针对这些情况,目前高速铁路对桥涵和隧道进行沉降预测及评估时,目前通用的办法就是根据相应的地质条件、地基或桩基处理方式及目前发生沉降量直接判定是否满足沉降评估的要求,但判定条件很难把握,至今仍无法统一,故一种专门针对变形量级小,数据波动相对大的沉降预测方法具有十分重要的现实意义。
1 灰色GM(1,1)模型
灰色系统是一种综合运用数学方法对信息不完全的系统进行预测、预报的理论和方法。灰色预测的思路是:把随时间变化的随机正的数据列。通过适当的方式累加,使之变成非负递增的数据列,用适当的方式逼近,以此曲线作为预测模型,对系统进行预测[[2] 宋来中.高速铁路线下工程沉降评估方法[J].中国港湾建设,2010,12(6):35-36.]2。
目前常用的有GM(1,1)、GM(1,N)模型,其中GM(1,N)模型适合于建立系统的状态模型,为高阶系统提供基础,不适合预测用,预测模型应选用单个变量的模型即预测量本身数据模型(GM(1,1)模型)[[3] 陈启华.灰色GM(1,1)模型在高铁线下工程沉降变形预测中的应用[J].地理空间信息,2012,6(3):141-142.][3]。GM(1,1)模型通过使用某t时刻前的观测值,完成t时刻后状态量的预报工作。
设原始非负序列为
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}, (1)
其一次累加生成序列为
X(1)={x(1)(1),x(1)(2),…,x(1)(n)},
其中x(1)(k)=(i),i=1,2,…,n
均值生成序列为
Z(1)={z(1)(1),z(1)(2),…,z(1)(n)}, (2)
其中z(1)(k)=( x(1)(k)+ x(1)(k-1)),k =2,3,…,n;
我们称
x(0)(k)+a z(1)(k)=b (3)
为灰色GM(1,1)模型的基本形式。
对X(1)建立一阶线性微分方程模型
(4)
称为GM(1,1)模型的白化形式。
若为参数列且
,
则GM(1,1)模型x(0)(k)+a z(1)(k)=b的最小二乘估计参数列满足:
(5)
其参数估计值可计算得出。
微分方程式(4)的解也称为时间响应函数:
GM(1,1)灰色微分方程x(0)(k)+a z(1)(k)=b的时间响应序列为
(6)
原始数据的拟合值为:
(7)
2 全最小一乘估计准则下的灰色GM(1,1)模型
2.1 全最小一乘准则参数估计理论
设有1组样本观测值(x1,y1),(x2,y2),…,(xn,yn),若将它们展绘到平面上且位于一狭长区域内,那么,可以在某种准则下用直线方程 (y=ax+b)来拟合它们,最小一乘准则是指样本观测值到回归直线y=ax+b的纵向距离ε的绝对值之和为最小,即:
全最小一乘准则是在最小一乘准则的基础上认为每个偏差值的权重均为,则全最小一乘准则数学表达式为:
(8)
根据文献[[4] 朱春浩.最小一乘法与最小二乘法:历史与差异[J]. 统计与决策,2007,(6):128.
][4]表明,全最小一乘有效地减少了回归方程系数对异常数据的敏感性,在稳健性方面明显优于最小二乘准则,而最小二乘的一个缺点,是它受特异值点数据的影响较大。
2.2 全最小一乘估计准则下灰色GM(1,1)模型的建立和求解
1)模型建立。根据GM(1,1)模型x(0)(k)+a z(1)(k)=b,结合全最小一乘准则即式(8)得全最小一乘准则下的灰色GM(1,1)模型为:
(9)
2)模型求解。由于全最小一乘问题所最小化的目标函数Q(a,b)是非线性且不光滑的[[5] 吴可法.关于加权全最小一乘的探讨[J]. 应用数学学报,2002,7(3):439-447.
][5],因此通常计算参数 a、b时,需要将其先转换为线性规划模型后进行计算[[6] 李杰.全最小一乘的灰色模型在变形监测中的应用[J]. 地理空间信息,2012,12(6):136-138.
][6]。
本文用LINGO软件对参数a,b进行求解。LINGO的主要功能是求解大型线性、非线性和整数规划问题,在解决含有大量变量和约束条件的非线性规划问题时具有编程语言简单,使用方式灵活,适用性强的优点[[7] 桑杨阳.非线性规划建模与LINGO软件的编程应用[J]. 脑知识与技术,2012,4(10)][7]。得到参数a,b的值后,利用式(6)、(7)计算预测值。
2.3 模型适用范围
1)由于上述GM(1,1)模型是一阶微分方程,沉降不宜包括次固结沉降(即不适用于路基沉降预测),主要适用桥梁、隧道等结构物的沉降预测,若要包含次固结沉降应取二阶或更高阶次的微分方程。
2)由文献[[8] 刘思峰,邓聚龙.GM(1,1)模型的适用范围[J].系统工程理论与实践,2000,(5):121-124.][8]可以知道,一般当|a|
3)由于该GM(1,1)模型的参数估计采用全最小一乘准则,故观测数据中的异常值对模型预测影响较小。更适合总体沉降量较小,但后期数据波动较明显的沉降预测。
2.4 模型的检验
相对误差:
平均相对误差: (10)
精度: (11)
通常使用平均相对误差、精度和关联度来检验模型精度。其级别见表1[][7]。
表1 模型精度级别分类表
级别 平均相对误差/% 精度/% 关联度
一级 1 99 0.90
二级 5 95 0.80
三级 10 90 0.70
四级 20 80 0.60
3 模型的可靠性验证
3.1 无异常值的情况
针对该模型的特点,本文选取某隧道的沉降变形监测数据,为客观反映隧道的沉降变形情况,我们布设了若干断面,每个断面布设2个观测点,通过二等精密水准并联测到测区2个水准点,采用往返测。目前已经观测21期,观测频次为2周/次,我们对1S1观测点的累计沉降量进行处理,用前17期观测成果来建立GM(1,1)预测模型,用后4期的观测成果进行预测检核。1S1观测点的累计沉降量见表:
表2 点1S1累计沉降量统计表/mm
期次 沉降量 期次 沉降量 期次 沉降量
1 0.00 8 1.10 15 1.84
2 0.55 9 1.31 16 1.55
3 1.37 10 1.57 17 1.84
4 1.14 11 1.31 18 1.75
5 0.48 12 1.62 19 2.15
6 0.89 13 1.93 20 1.88
7 1.39 14 1.51 21 2.03
根据上节介绍的建模原理,利用观测点1S1前17期观测数据(用第2期数据作为模型的起始数据)和LINGO软件的计算和分析功能,进行建模计算分析,得到参数估计值为,则该点的GM(1,1)模型的时间响应序列为:
对前17期数据进行拟合,并对后4期数据进行预测。
同时用双曲线预测模型,对该点数据进行拟合预测。
两种模型下的拟合和预测结果见表3、表4,并且通过图1可以直观的看出GM(1,1)与双曲线模型的预测结果比较接近:
表3 实测值与拟合预测值较差
期次 实测值 GM(1,1) 双曲线 期次 实测值 GM(1,1) 双曲线
拟合值 较差 拟合值 较差 拟合值 较差 拟合值 较差
1 0.00 0.00 0.00 0.00 0.00 12 1.62 1.54 0.08 1.53 0.09
2 0.55 0.55 0.00 0.36 0.20 13 1.93 1.60 0.33 1.57 0.36
3 1.37 1.09 0.28 0.59 0.78 14 1.51 1.67 0.15 1.65 0.14
4 1.14 1.13 0.01 0.78 0.36 15 1.84 1.73 0.11 1.72 0.12
5 0.48 1.17 0.70 0.93 0.45 16 1.55 1.80 0.26 1.77 0.23
6 0.89 1.22 0.33 1.06 0.16 17 1.84 1.87 0.04 1.82 0.01
7 1.39 1.27 0.12 1.16 0.23 期次 实测值 预测值 较差 预测值 较差
8 1.10 1.32 0.22 1.27 0.17 18 1.75 1.95 0.19 1.87 0.11
9 1.31 1.37 0.06 1.35 0.04 19 2.15 2.02 0.13 1.89 0.26
10 1.57 1.43 0.14 1.42 0.15 20 1.88 2.10 0.23 1.93 0.05
11 1.31 1.48 0.17 1.48 0.17 21 2.03 2.19 0.16 1.96 0.07
图1 实测与拟合预测图
关键词:GM(1,1)模型;等维新息模型;沉降;预测
中图分类号:TD175文献标识码:A
[WT]文章编号:1672-1098(2011)02-0071-04
收稿日期:2011-02-22
作者简介:潘宇(1986-),男,江苏常熟人,在读硕士,研究方向为变形监测与数据处理。
[JZ(〗[WT3BZ]Application of Equal-dimension and New-information Model in Mining Headframe Base Settlement
PAN Yu, JIANG Xiao-lei, YANG Tai, WANG Lie-ping
(School of Surveying and Mapping, Anhui University of Science and Technology, Huainan Anhui 232001, China)
Abstract:In order to do the settlement prediction for the mining headframe base, the method of modeling for grey forecasting theory and the evaluation of the model precision were introduced in this passage. Characteristics of analysis on the settlement data by using the equal-dimension and new-information model were also expounded. Taken the settlement monitoring for a coal-mining headframe base as an example, prediction of the land subsidence trend was done by using the equal-dimension and new-information model. Through analyzing the best dimension of the equal-dimension and new-information model, the better prediction results have been got. At last, the model which has practical value has been got.
Key words:GM(1,1) model; equal-dimension and new-information model; settlement ; prediction.
应用数学建模的方法进行预测是变形监测分析和预测的有效方法。当观测数据序列较长时,各种数学建模方法均可获得满意的预测结果,但当数据序列较短时,由于信息贫乏,规律性弱,使得预测存在较大难度。灰色模型在短数据序列预测方面具有一定的优越性。本文采用等维新信息模型进行预测,预测值与实测值进行比较,验证预测的可行性。
1 灰色模型
11 模型的建立
12 GM(1,1)模型的精度
13 等维新息模型
2) 模型的选取。
进行预测前,先要确定模型的维数,可通过数值试验来确定[6]。为此,选取Z1点13期高程数据作为原始数列,选取维数分别为4~12维(模型维数至少为4)时,求出对应的灰色模型残差和残差中误差(见表3~表4)。
维数456789101112
残差中误差/mm010029016018015017022010010
从表3~表4的结果可看出,当Z1点高程原始数列维数不断增大时,其预测精度并没有提高,反而降低了。这说明,等维新息模型存在最佳维数,且维数并非愈大愈好,所以要合理选择最佳的维数。从数值试验的结果中可看出,Z1点高程原始数列维数为4维时,其精度最高,预测效果相对较好,可用于预测,因此选取模型维数为4维,通过后验差检验(C=013,P=1),模型精度等级为1级(好)。值得注意的是,对于不同的数据序列,选取的维数也是不同的,具体问题要具体分析。
3) 等维新信息模型预测成果。
从Z1点实测值与预测值比较(见表5)、比较效果图(见图1)可以看出预测值与实测值很接近,预测值的残差非常小,预测效果良好。
1. 实测值;2. 预测值
利用灰色系统对井架基础其余各监测点进行分析,高程数据如表2所示;通过模型维数比较,选取模型维数均为4维,分别建立等维新息模型,其实测值与预测值比较如图2~图4所示。
期数
1. 实测值;2. 预测值
期数
1. 实测值;2. 预测值
期数
1. 实测值;2. 预测值
通过对井架基础监测点建立GM(1,1)等维新息模型进行分析,预测值与实测值非常接近,预测效果好,取得了良好的建模效果,具有很大的实用价值。
4) 模型精度等级评定。根据后验差法进行计算检验,得出各点的精度等级评定(见表6)。
3 结论
1) 等维新息模型有最佳维数区域,维数并非愈大愈好;
2) 灰色等维新息模型预测矿井井架基础沉降变形,能动态的反映出系统的时变特性,精度高,效果好;
3) 等维新息GM(1,1)模型既能反映观测点随时间推移的动态变化情况,又能反映受未来各种因素干扰后沉降的最新变化趋势,具有较好的实用价值。
参考文献:
[1] 黄声享,尹晖,蒋征.变形监测数据处理[M].武汉:武汉大学出版社,2003:113-114.
[2] 邓聚龙.灰色系统基本方法[M].武汉:华中科技大学出版社,2005:96-104.
[3] 岳建平,田林亚.变形监测技术与应用[M].北京:国防工业出版社,2007:131-132.
[4] 王利,张双成,李亚红.动态灰色预测模型在大坝变形监测及其预报中的应用研究[J].西安科技大学学报,2005,25(3):328-332.
关键词:ARMA模型;平滑;时间序列;预测
中图分类号:F127 文献标识码:A 文章编号:1001-828X(2012)03-0-01
ARMA模型预测方法是很常用的一种预测方法。但是这个模型要求被预测的模型是平稳的,如果是非平稳的就需要通过差分之后变成平稳,然后再用ARMA模型进行估计,也就是ARIMA模型。
张小斐和田金方在《基于ARIMA模型的短时序预测模型研究与应用》一文中,对数据个数较少的时间序列介绍了一种建模方法――平滑ARIMA模型法:设原始时间序列为,首先利用确定型时间序列预测中的简均方法对原始序列做平滑技术处理:
然后与原始时间序列融合得到一新的时间序列:
新的时间序列的时期长度接近原始序列的两倍,并且保持了原序列的平稳性。
本文基于贵州省1950至2011年CPI(居民消费价格指数)的年度环比数据,分别对原始序列{CPI},还有经过平滑后的与原始数据相融合得到的新序列{XCPI}进行预测。
首先对两个变量进行平稳性检验,即ADF检验。检验结果如下:
通过ADF单位根检验发现两个变量都是平稳的,因此我们可以对上面两个序列建立ARMA模型。根据序列的自相关和偏自相关图,来确定ARMA模型的AR阶数和MA阶数。首先看一下两个变量的自相关和偏自相关函数图(如图1)。
通过观察图1,可以看出,偏自相关系数和自相关系数都表现出一阶截尾的特征,因此拟采用ARMA(1,1),ARMA(1,0),ARMA(0,1)中的一个模型进行估计。经过模型估计,根据AIC取值越小越好的原则,我们最终选择ARMA(1,0)模型进行预测。
由图2,可以观察到,偏自相关函数大概是在10阶的时候表现出截尾特征,自相关函数一阶截尾。因此我们拟采用ARMA(10,1)模型,由于偏自相关函数3,5,7,9阶都落到了置信区间外,因此在估计ARMA模型时把这些项去掉了。同时结合AIC准则和变量的显著性,去掉一些变量,从而使模型实现简化的目的,最终确定的预测模型为ARMA(1,1)。
ARMA(1,0)模型估计结果见表1,ARMA(1,1)模型估计结果见表2。
由这两种模型估计结果,作出{CPI}、{XCPI}的方程残差的自相关和偏自相关图。
从图3、图4看,已经没有了明显的自相关和偏自相关现象。说明选择的ARMA(1,0)模型和ARMA(1,1)模型效果都比较好。
下面采用静态预测法,分别用ARMA模型和平滑ARMA模型预测2009年,2010年,2011年的CPI环比值。但必须注意:由于静态预测法需要知道前面数据的实际值,而在利用平滑ARMA模型预测2009年的CPI时,2008年半的实际值是不知道的,所以应该先预测2008年半的数据,然后用2008年半的预测值的2倍减去2008年的实际值得到2009年的预测值。其他预测年份依次类推,如果没有注意到这一点的话会导致预测结果出奇的好,但实际上却是错误的。记ARMA模型预测结果为预测值1,平滑ARMA模型预测结果为预测值2。预测结果如下表:
比较两种方法的预测效果,平滑ARMA模型的预测效果并没有一般的ARMA模型好,而且预测的时间越长平滑ARMA模型预测效果比一般ARMA模型越差。但是平滑ARMA模型还是有一定的优势,因为对于比较短的时间序列如果通过这个平滑方法可以增加样本个数,从而使得本来不能够进行ARMA预测的序列可以用ARMA模型预测。
参考文献:
[1]高铁梅.计量经济学分析方法与建模Eviews应用及实例[M].北京:清华大学出版社,2009.
[2]郝香芝,李少颖.我国GDP时间序列的模型建立与预测[J].统计与决策,2007(23).
[3]王振龙.应用时间序列分析[M].北京:中国统计出版社,2010.
[4]易丹辉.数据分析与Eviews应用[M].北京:中国统计出版社,2008.
(平顶山学院计算机科学与技术学院,河南平顶山467002)
摘要:使用模糊层次分析法对支持向量机的两个参数进行寻优,并用寻找到的最优参数训练支持向量机,建立网络参数模型。首先使用模糊层次分析法对支持向量机两个参数进行寻优,然后用寻找到的最优参数训练支持向量机,最后建立预测模型,预测网络流量。实验结果表明,该方法不但可以较好地跟踪网络流量变化趋势,使网络流量的预测值与实际值非常接近,而且预测误差变化范围波动小,是一种有效且预测精度高的网络参数模型。
关键词 :网络参数模型;支持向量机;灰色模型;参数优化
中图分类号:TN309-34;TN915.06 文献标识码:A 文章编号:1004-373X(2015)12-0023-02
收稿日期:2014-12-08
0 引言
网络流量的预测与建模对于大规模网络资源管理、规划设计、用户行为等方面具有重要意义。传统网络流量预测方法主要基于线性建模,预测误差较大,很难准确反映网络流量复杂变化特点[1-2]。众多实验证明,网络流量存在如下特点如非平稳性、混沌性、时变性等,是一个具有高度的不确定性的复杂系统,需要采用非线性混沌理论对网络流量预测进行建模。目前基于非线性理论的典型模型包括神经网络预测模型、小波预测模型、灰色模型、支持向量机(Support Vector Machine,SVM)预测模型等[3-4]。
SVM 是一种针对高维数、小样本的机器学习方法,泛化性能优异,被公认为是较好的非线性预测方法。大量研究表明SVM 预测效果优于其他非线性模型,这主要得益于预测模型泛化能力强,避免了“维数灾难”,并且能够寻找到全局最优解,因此得到了广泛的应用[5]。但是SVM 预测性能与网络流量的训练样本关系密切,并且当前确定训练样本的输出和输入矩阵采取的方法主要是人为判断,选取训练样本缺乏理论指导,容易产生过拟合现象[6]。
当前已有一些研究人员针对SVM预测模型的缺点进行了改进研究。研究主要包括对预测模型SVM参数选择的优化和对SVM 预测模型自身的改进两个方面;其中SVM模型中参数的选择对预测效果起着非常关键的作用[7]。目前SVM参数选择主要采用智能优化算法,例如遗传算法(Genetic Algorithm,GA)、人工鱼群算法(Artificial Fish Algorithm,AFA)、粒子群优化(ParticleSwarm Optimization,PSO)算法。例如,王瑞雪研究了一种通过GAFA(全局人工鱼群算法)优化SVR 模型的网络流量预测方法,但是AFA 优化的SVR 预网络流量预测方法,结果不稳定[8]。曾伟等研究了采用粒子群优化算法优化SVM 预测模型,研究表明提高了SVM 模型的预测精度,但预测的稳定性依然不高,并且容易陷入局部极值[9]。Lu Wei Jia等采用遗传算法优化SVM预测模型,由于遗传算法的固有缺点,效果也不尽理想[10]。针对当前网络流量非线性时变、混沌等特点,本文研究对SVM 预测模型进行改进,使用模糊层次分析法对SVM进行参数寻优,并用寻找到的最优参数训练SVM,建立预测模型。
1 支持向量机参数选择问题
设给定样本集{(x1,y1),-,(xi ,yi),-,(xn ,yn )} 。其中xi∈ Rn 表示输入变量;yi∈{+1, -1} 为输出变量,分两类问题;n 为学习样本数。φ(x) 为非线性映射函数,最优分类超平面构造如下[11-13]:
对非线性分类问题,引入核函数k(xi ,xj ) 将式(1)变换为:
为简化SVM 参数优化,选择径向基函数(RBF)(只需确定一个参数σ )作为SVM 的核函数。因此要获取性能优越的SVM,需要选取最合适的σ 和C ,因此SVM参数优化的数学模型为:
SVM参数优化目标函数定义为SVM预测模型预测网络流量的正确率(G),SVM预测模型参数的优化问题描述如下:
约束条件为:
式(6)是一个两个参数组合优化问题。
2 模糊层次分析法优化SVM 参数
2.1 采用层次分析法确定σ 和C 参数权重
首先利用层次分析法[13]确定σ 和C 参数的权重,首先构造判断矩阵C = (cij )n × n ,其中cij 表示因素i 和因素j相对相标的重要性程度值,且cij > 0 ;cij = cji ;当i=j 时,则cij = 1 。各参数的相对权重Wi为:
2.2 建立模糊判断矩阵
采用德尔菲法对各参数进行评分,计分范围在(0,1)区间内,且参数得分总和为“1”。根据σ 和C 参数的特点,采用清晰集合构造模糊集确定隶属度。设A1,A2 ,…,An 为n 个任意清晰集合,集合的并集如下:
模糊集合(k n)Bk , 其中k = 1,2,-,n。用k n 与集合Bk 相乘得到,其隶属度函数如下:
2.3 定义模糊关系矩阵R
构造模糊映射f:U F(V ) , ui f (ui) =(ri1,ri2 ,-rim )∈ F(V ) 。F(V ) 是V 上的模糊集全体。令Ri ={ri1,ri2 ,-,rim},i = 1,2,-,n ,模糊关系矩阵R 定义如下:
利用公式求出各参数评估矩阵:
2.4 参数评估流程
综合上述可知,基于模糊层次分析法的SVM 参数评估流程如图1所示。
按照图1 中的首先构建评估指标体系,对σ和C 参数进行分析,并结合实际情况建立判断举证,对各评估参数进行综合评估,最后输出参数选择结果。
3 结语
本文对SVM预测模型进行改进,使用模糊层次分析法对SVM的两个参数进行寻优,并用寻找到的最优参数训练SVM,建立预测模型,预测网络流量。实验表明,该方法是一种预测精度高、有效的网络流量预测方法。
作者简介:王启明(1980—),男,河南鲁山人,讲师,硕士。研究方向为软件工程算法和物联网。
参考文献
[1] XU Shuo-na,ZENG Bi-qing. Network traffic prediction model based on auto - regressive moving average [J]. Journal of Net-works,2014,9(3):653-659.
[2] QIU J,XIA J B,WU J X. Research and development of net-work traffic prediction model [J]. Computer Engineering and De-sign,2012,33(3):865-869.
[3] XIONG Nan,LIU Bai-feng. Online network traffic prediction Based on adaptive particle swarm optimization LSSVM [J]. Jour-nal of computer applications and software,2013,30(9):21-24.[4] FANG J,ZHOU Q,WU X,et al. Network traffic prediction model based on Catfish - PSO - SVM [J]. Journal of Networks,2013,8(11):110-114.
[5] JIALLG Jun, PAPAVASSILIOU Symeon. Enhancing network traffic prediction and anomaly detection via statistical network traffic separation and combination strategies [J]. Computer Com-munications,2006,29(10):1627-1638.
[6] CHANG Bao-bong,TSAI Hsiu Fen. Improving network traffic analysis by foreseeing data-packet-flow with hybrid fuzzy based model prediction [J]. Expert Systems with Applications 2009,36(3):6960-6965.
[7] JIANG Ming,WU Chun-ming,HU Da-min. Comparative study on time series of network traffic prediction model [J]. Journal of Electronics,2009,5(11):2353-2359.
[8] WANG Rui-xue,LIU yuan. GAFSA network traffic prediction model to optimize the SVR study [J]. Computer Application Re-search,2013,30(3):856-860.
[9] ZENG Wei. Many children population PSO to optimize the SVM network traffic prediction [J]. Journal of Beijing Jiaotong University:Natural science Edition,2013,37(5):62-66.
[10] LU,Wei-Jia. Parameters of network traffic prediction model jointly optimized by genetic algorithm [J]. Journal of Net-works,2014,9(3):695-702.
[11] XU Bo,GUAN Qing,CHEN Ke. Multi-agent coalition forma-tion based on quantum - behaved particle swarm optimization [J]. Journal of Information & Computational Science,2010,7(5):1059-1064.
【关键词】 蜂蜜; 近红外; 果糖; 葡萄糖; 特征波长
difference analysis and optimization study for determination of fructose and glucose by near infrared spectroscopytu zhen-hua,zhu da-zhou,ji bao-ping,meng chao-ying,wang lin-ge,qing zhao-shen*(college of food science and nutritional engineering,china agricultural university,beijing 100083)(national engineering research center for information technology in agriculture,beijing 100097) (college of information and electrical engineering,china agricultural university,beijing 100083)abstract a total of 101 honey samples that originated from 20 different unifloral honey and other multifloral honey samples were collected from china.ft-nir spectrometer were applied to determinate the content of fructose and glucose of honey with two different modes:transflectance (800-2500 nm,2 mm optical path length) and transmittance (800-1370 nm,20 mm optical path length).it was found that the prediction accuracy of fructose and glucose had significant difference with the two modes.in order to analyze the reason of this difference,support vector machine (svm) was used to analyze the non-linear information,and genetic algorithm (ga) was used to analyze the characteristic wavelengths.the result indicated that the detection difference of fructose and glucose was originated from their different characteristic wavelengths.through the optimization of detection method,it was found that for the determination of glucose,short wavelength and long optical path length should be used,on the other side,the whole wavelength region and short wavelength,with selecting the characteristic wavelength to avoid the disturb of water can also be used.for the determination of fructose,whole wavelength region and short optical path length should be used.linear regression methods such as plsr could obtain good results,and non-linear methods such as svm did not improve the model performance.
keywords honey; near infrared spectrometry; fructose; glucose; characteristic wavelengths
1 引言
蜂蜜中含有糖类、水分、矿物质、维生素、蛋白质、氨基酸乙酰胆碱、生物类黄酮等180余种不同物质成分。WWw.133229.COM糖类物质是蜂蜜的基本成分,占70%~80%。其中,主要成分是葡萄糖和果糖,约占总糖分的85%~95%;其次是蔗糖,一般不超过5%。除此之外,蜂蜜中还含有少量如麦芽糖、乳糖、棉子糖、松三糖等20余种双糖和多糖。果糖和葡萄糖的含量最高,分别约占蜂蜜质量的38%和31%〖1〗。
近红外光谱技术〖2〗具有快速、简便、无样品预处理、无损伤等特点,并结合化学计量学方法提取光谱有效信息进行样品定性或定量分析被应用到很多领域。文献〖3,4〗研究了近红外透反射法对于蜂蜜中果糖、葡萄糖含量检测的可行性,并取得了较好的效果,可以有效解决现有高效液相色谱法检测中耗时、繁琐的问题。对于果糖、葡萄糖这两种在蜂蜜中含量最高、化学结构相似的单糖类物质,不同学者研究采用了不同光谱区间、光程等采集参数来探索其快速检测的可行性。qiu等〖3〗利用1 mm光程、400~2500 nm波段近红外光谱建立果糖和葡萄糖pls模型,预测集决定系数(r2)分别为0.97和0.91。garcra等〖4〗利用2 mm光程、400~2500 nm波段近红外光谱建立果糖和葡萄糖pls模型,预测集决定系数(r2)分别为0.98和0.95。上述研究结果表明, 运用近红外光谱技术可以对蜂蜜中的果糖和葡萄糖含量进行快速检测,但仅集中于某种采集方式下线性定量模型的研究,尚未见对其非线性问题的研究。同时对于由于不同采集方式和参数下这两种单糖预测精度的差异性问题及其预测条件的优化问题也缺乏深入研究。本研究通过比较光谱区间、光程等采集参数,采用偏最小二乘回归线性建模支持向量机非线性建模、采用遗传算法分析蜂蜜中果糖和葡萄糖的特征波长等分析近红外光谱法检测蜂蜜中果糖和葡萄糖含量的差异性问题,优化其最佳检测方案,以提高近红外光谱法检测蜂蜜中果糖和葡萄糖含量的预测精度,并为其在不同实际运用条件下提供可行的检测方案。
2 实验部分
2.1 蜂蜜样品的采集
本研究分别采集了四川、江苏、山西、山东、浙江、福建、河南、吉林、河北、安徽、河北、广西、陕西、辽宁、天津、北京等蜂蜜著名产地的蜂蜜样品,不仅充分代表国内样品品种和产地的特性,也代表了我国蜂蜜的主要出口品种的特征。
本研究的蜂蜜品种也具有很好的代表性,共收集洋槐、琵琶、枣花、五味子、益母草、紫云英、荆条、党参、荔枝、椴树、枸杞、、桂花、玫瑰花、山茶、油菜、柑橘、白刺花、罗布麻、丹参20种单植物源蜂蜜(unifloral honey),以及混合植物源蜂蜜(multifloral honey)共101个蜂蜜样品。
2.2 光谱采集仪器及方法
本实验采用了常见的傅立叶型近红外光谱仪的两种不同采集方式(样品池透射、光纤透反射)来采集蜂蜜的近红外光谱。
光谱采集在环境温度可控的实验室内(温度控制为26 ℃)进行。每次测试前都必须先预热仪器30 min。同时,由于部分蜂蜜存在结晶现象,在实验前对结晶蜂蜜样品采用40 ℃水浴中加热,直至结晶完全溶化,再降至室温(26 ℃)。
光谱采集均采用bruker isf/28n型傅立叶型近红外光谱仪(bruker公司),具体采集方法如下:蜂蜜的傅立叶透射光谱采集,附件:石英透射样品池,光程:20 mm,扫描谱区:3600~12500 cm-1,分辨率:8 cm-1,扫描次数:32次;蜂蜜的傅立叶光纤透反射光谱。附件:石英液体透反射光纤探头;光程:2 mm(间距为1 mm);扫描谱区:3600~12500 cm-1;分辨率: 8 cm-1;扫描次数:32次。均采集空气为背景。
2.3 蜂蜜果糖和葡萄糖含量的测定
果糖的结构简式ch2oh(choh)3(co)ch2oh,其水溶液又称“左旋糖”;葡萄糖的结构简式ch2oh(choh)4cho,其水溶液又称“右旋糖”。葡萄糖与果糖互为同分异构体,葡萄糖是多羟基醛(醛糖),果糖是多羟基酮(酮糖)。国家标准中规定,蜂蜜中果糖和葡萄糖的含量必须≥60%〖5〗*
本实验中蜂蜜的果糖和葡萄糖含量按照国标gb/t 18932.22-2003(蜂蜜中果糖、葡萄糖、蔗糖、麦芽糖含量的测定方法-液相色谱示差折光检测法)测定。
2.4 支持向量机及特征波长选择算法
支持向量机(support vector machines,svm)是一种新型的非线性近红外建模方法,svm是建立在结构风险最小化(structural risk minimization)原则基础上的,因而从理论上保证了其在小样本拟合时也能具有较好的泛化能力。最小二乘支持向量机(ls-svm)是一种经典svm的改进方法,以求解一组线性方程代替经典svm中较复杂的二次优化问题,降低了计算复杂性,加快了求解速度。构建ls-svm模型需确定两个重要模型参数:γ和核函数参数(本实验采用径向基核函数,模型参数为σ2),采用二步格点搜索法(grid searching technique)和留一法交叉验证法(leave one-out cross validation)相结合,对这两个模型参数进行全局寻优〖6〗匝盗芳徊嫜橹の蟛罹礁rmsecv)为参数选择指标。
针对近红外光谱采样点数较多的特点,为防止发生过拟合现象,本研究采用反复遗传算法(iterative ga-pls)〖7~9〗 选择特征波长。对包含2205个波长点的波长段,去除最后5个点,将每11个连续波长点取平均值作为一个新变量,总计200个新变量,经过5次重复遗传算法后,将原始波长点挑选出来再进行遗传算法。其算法的具体参数设定为:初始群体大小为30,最大繁殖代数100,交叉概率0.5,变异概率0.01。
2.5 回归模型评价指标
由于每次测量的蜂蜜光谱总体能量不同,光谱间差异较大。为了消除由于仪器每次测量所带来的能量差异,本研究在数据分析和数学建模前,分别对校正集和预测集光谱进行标准化(auto-scaling)处理,然后利用偏最小二乘回归法(plsr)对数据进行多元统计分析。应用非线性迭代偏最小二乘(nipals)算法求取偏最小二乘因子。校正模型的最佳因子个数(#lv)由舍一交互验证法(loocv)的预测残差平方和(press)来确定。数据预处理和建模过程中的所有计算均由自编的matlab 7.0程序完成。校正模型的性能通过相关系数(r)评价其相关性,校正误差均方根(rmsec)作为校正集的评估标准,预测误差均方根(rmsep)反映模型对未知样本的预测效果。
相对标准偏差rsd反映模型对某一组分的总体测定效果,即测定精度。它包括校正相对标准偏差rsdc和预测相对标准偏差rsdp,具体表示分别为:
rsdc(%)=100×rmsec/ymc(1)
rsdp(%)=100×rmsep/ymp(2)
式中: ymc,ymp分别为样品校正集和预测集真值的平均数。一般来说,r 越接近1,rsd越小,表明校正模型的校正精度和测定精度越高,而小的rsd比大的r 更为重要。
3 结果与讨论
3.1 蜂蜜果糖和葡萄糖的pls模型差异
本实验采集了近红外谱区谱区3600~12500 cm-1的信息。对于傅立叶2 mm透反射光谱,由于检测器检测范围的原因,在3600~4000 cm-1波段的光谱噪声较大,因此在下面的研究中截取了波段为4000~12500 cm-1(800~2500nm)波段的光谱为研究对象。而傅立叶20 mm透射光谱图谱在1370 nm后光谱严重溢出,因此采用800~1370 nm波段的光谱为使用光谱。图1分别为波段截取后的101个蜂蜜样本采用傅立叶光谱仪采集的光程为2 mm光纤透反射光谱及光程为20 mm透射光谱。
图1 蜂蜜的傅立叶光纤透反射光谱图(a)和傅立叶透射光谱图(b)(略)
fig.1 fourier transform(ft) transflectance spectra(a) and ft transmittance spectra(b) of honey samples
首先,对测得的101个样品的果糖、葡萄糖含量进行异常值筛选,先剔除8个果糖异常的样品和1个葡萄糖异常的样品,然后利用外在学生化残差-杠杆值图〖10〗剔除剩余样品中的异常样本。为了更好地体现模型的稳定性,本实验首先根据蜂蜜各成分的分布,按照校验集与预测集之比为2∶1,3∶1,7∶3,4∶1和5∶3的5种比例,采用k-s法〖11〗进行了样品集的选择,然后分别建立模型。研究结果表明,不同比例分组后模型表现了较好的稳定性。〖jp2〗挑选出所建立的果糖和葡萄糖模型中较有代表性的分组方式,作为不同采集方式的模型效果比较时的代表,被挑选出的代表性分组后的样品统计数据见表1。
表1 蜂蜜样品参考值的统计特征(略)
table 1 statistic major components of calibration and prediction sets of honey
为检测蜂蜜中果糖和葡萄糖含量,建立了800~2500 nm波段、光程为2 mm透反射光谱和800~1370 nm波段、光程为20 mm透射光谱的pls模型,模型结果见表2。通过pls建模结果可以看出,在800~2500 mm这个近红外全谱区建立的线性定量模型,果糖相关系数(r)为0.9311,预测相对误差(rsdp)为5.45%;葡萄糖相关系数(r)为0.8291,预测相对误差(rsdp)为8.81%。同时,在800~1370 nm这个近红外短波区建立的定量pls模型,果糖相关系数(r)为0.9297,预测相对误差(rsdp)为6.38%;葡萄糖相关系数(r)为0.8907,预测相对误差(rsdp)为7.87%。由此可见,采用全谱区、短光程光谱建模葡萄糖的预测精度低于果糖,而在短波区利用长光程光谱建立的模型相对于全谱区葡萄糖的预测精度有一定提高,而果糖预测精度反而有一定下降。因此,在利用近红外光谱技术检测蜂蜜中葡萄糖成分含量时应尽量采集短波区、长光程的光谱; 而对于果糖,则应尽量采集全谱区、短光程的光谱。
表2 蜂蜜近红外模型结果(略)
table 2 results of the nir spectra of honey
msec:root mean square error of calibration; rmser:root mean square error of prediction.
3.2 基于ls-svm的果糖和葡萄糖模型优化研究
在比较不采集方式对蜂蜜中果糖和葡萄糖建立近红外线性定量预测模型效果后,采用ls-svm建立蜂蜜中果糖和葡萄糖的非线性模型。本研究中,果糖γ和σ2的搜索范围分别为1~500和0.1~1000,寻优过程与结果:最优γ和σ2分别为124.7491和237.5784。葡萄糖γ和σ2的搜索范围分别为1~500和0.1~1000,寻优过程与结果:最优γ和σ2分别为320.9671和170.5475。由表2可见,利用ls-svm建立800~2500 mm谱区建立果糖的非线性定量模型的预测结果为:果糖相关系数(r)为0.9264,预测相对误差(rsdp)为5.5%;葡萄糖相关系数(r)为0.8364,预测相对误差(rsdp)为9.11%。这与用pls线性定量模的效果基本相同。可见,果糖和葡萄糖在蜂蜜中含量较高,其信息受背景影响较小。因此,采用常用线性定量建模方法plsr就可以得到其很好的预测模型。
3.3 蜂蜜中果糖和葡萄糖特征波长的提取及近红外检测差异性分析
利用反复的遗传算法(iterative ga-pls)在全谱范围内选取了蜂蜜中果糖和葡萄糖的特征波长。经过遗传算法的计算,得到蜂蜜中果糖的特征波长集中在1845~1846 nm,1892~1893 nm,1949~1951 nm,1964~1967 nm和2225~2230 nm这几个波段; 葡萄糖的特征波长集中在832~833 nm,878~879 nm,1209~1211 nm,1234~1236 nm,1245 nm,1634~1639 nm,1790 nm,1854~1858 nm和2184~2190 nm这些波段。经过遗传算法后用pls建模的模型结果见表2。从表2可以看到,经过特征波长选择后果糖模型的预测精度较原始波长基本没有变化。模型预测相对误差(rsdp)由5.45%上升到5.57%,r由0.9311下降到0.9300。而葡萄糖的的预测精度较原始波长下有较大程度的提高,模型预测相对误差(rsdp)由8.81%下降到6.59%,r由0.8231提高到0.9041。
从图1a所示的蜂蜜光谱图可见,蜂蜜在近红外谱区的光谱图主要吸收峰位于1450, 1940, 2100, 2280和2350 nm,这些吸收峰中1450和1940 nm主要是由于水的吸收所导致。其中1450 nm为oh的伸缩振动的一级倍频〖12〗,而940 nm为oh的伸缩振动的二级倍频〖12〗。这2个波长点是水的吸收峰,由于水的吸收很强(特别是蜂蜜中含水量约为17%),因此蜂蜜光谱图吸收蜂很大。而同样作为水的吸收峰的1190 nm处,由于本研究采用的透反射光程较短(2 mm),因此在短波区吸收不强烈。
葡萄糖和果糖的分子式相同,不同之处在于两者分子结构中羟基的位置不同,这个差异可能导致两者在近红外区的吸收特性不同。从遗传算法挑选出的特征波长可以看出,果糖的特征波长大多分布在1800 nm 以上的波段,而葡萄糖在1100 nm以下也有明显的特征波长。比较表2中透反射模型和透射模型可以发现,在采用傅立叶透反射方式采集全谱(800~2500 nm)建立模型时,由于采用光程较短(2 mm),因此在短波区得到的信息较弱,易被水等背景干扰因素影响,使得模型的预测精度受到影响,但对果糖和葡萄糖模型的影响程度不同。其中果糖的预测效果较好,rsdp为5.45%;而葡萄糖预测误差较大,rsdp为8.81%。当采用傅立叶透射方式采集800~1370 nm范围内较长光程的光谱时,葡萄糖模型的预测精度明显提高(rsdp为7.87%),并且与果糖模型的差异变小(果糖的rsdp为6.38%)。因此,对于蜂蜜中成分、结构都非常相似的两种糖分,在利用近红外光谱技术检测时应采用不同的技术方案。对于蜂蜜中的葡萄糖,应尽量采集短波区、长光程的光谱,或者对全谱区、短光程的光谱,进行特征波长的优化提取,从而改善其预测精度;而对于果糖,则应尽量采集全谱区、短光程的光谱。
对于蜂蜜中成分、结构都非常相似的葡萄糖和果糖,在利用近红外光谱技术检测时应该采用不同的技术方案。对于蜂蜜中的葡萄糖,应尽量采集短波区、长光程的光谱,或者对全谱区、短光程的光谱,进行特征波长的优化提取,从而改善其预测精度;而对于果糖,则应尽量采集全谱区、短光程的光谱。同时,通过对各种检测方案及建模算法的优化,预测结果仍然是果糖优于葡萄糖。除了特征波段分布不同外,可能还存在着更深层次的原因,有待于进一步研究。
【参考文献】
1 white j w,riethof m l,subers m h,kushnir i.technical bulletin 1261,u.s.department of agrioulture washington d c,1962,1261:1~42
2 dull g,birth g s,smittle d a,leffler r g.journal of food science, 1989,54(2):393~395
3 qiu p y,ding h b,tang y k,xu r j.journal of agricultural and food chemistry,1999,47(7):2760~2765
4 garcia-alvarez j f,huidobro m h,rodriguez-otero j l.journal of agricultural and food chemistry, 2000,48(11):5154~5158
5 gb 18796-2005, honey(蜂蜜).national standards of the people’s republic of china(中华人民共和国国家标准)
6 yu ke(虞科), cheng yi-yu(程翼宇).chinese j.anal.chem.(分析化学), 2006, 34(4):561~564