前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络预测方法主题范文,仅供参考,欢迎阅读并收藏。
doi:10.3969/j.issn.1673 - 0194.2016.20.096
[中图分类号]C921 [文献标识码]A [文章编号]1673-0194(2016)20-0-02
0 引 言
人口总数又称总人口数,是指一定时点、一定地域范围内有生命活动的个人的总和。它不分性别,不分年龄,不分民族,只要是有独立的生命活动就包含在人口总数之内。人口总数是人口统计中最基本的指标。标准人口总数,对于了解国情国力,制订人口计划和经济、社会发展计划,进行人口科学研究,都有十分重要的意义。传统预测人口的方法主要有常微分方程方法、逻辑方法和动态预测法,这些方法对人口预测都有一定的作用,但采用这些方法,都需要对数据进行模型假设,在实际情况中,模型往往都是非线性的,如果只是在简单的模型假设下进行数据分析,结果往往是不准确的,达不到理想的预测结果。而神经网络对于复杂的、非线性的数据有曲线拟合能力。基于BP神经网络的时间序列预测方法,只需将历年人口总数输入,通过抑制和激活神经网络节点,自动决定影响性能的参数及其影响程度,自动形成模型,无需进行模型假设,本文就是利用该方法对我国人口总数进行预测。
1 BP神经网络
BP网络(Back Propagation),是1986年由Rumelhart和McCelland为首的科学家小组提出的,它是一种按照误差逆向传播算法,来训练的多层前馈的学习网络,网络中的各个神经元之间的连接强度靠权值的大小来实现。权值的大小随着网络对训练样本的增加、学习不断地调整改变,优化各个神经元之间的连接强度,不断提高整个网络对训练样本特征的反应灵敏度和精确度。BP神经网络的最大优点在于能够在短时间内学习和贮存大量输入输出模式映射,不需要知道这些映射关系的数学表达式,通过训练样本反向传播调节网络的权值和阀值,来达到网络的误差平方和最小的目的。BP网络是目前应用最广泛的神经网络模型之一,其结构如图1所示。
2.1 人口总数数据采集
本文实验中所用人口数据取自《中国统计年鉴2015》,选取1970-2010年我国人口总数,应用插值模型拟合,并推出2011-2014年人口的预测值,与2011-2014年实际人口数作对比,实验所用人口总数数据如表1所示。
2.2 人口结果预测数据
采用MATLAB工具箱实现BP神经网络模型,实验结果如图2、图3、图4、图5所示。1970-2010年实际人口与预测人口误差百分比如图2所示,1970-2010年实际人口与预测人口数据如图3所示。
2011-2014年人口误差百分比如图4所示,2011-2014年实际人口总数与误差人口总数数据如图5所示。
从图4中可以看出,用BP神经网络预测人口总数误差值小于1.05%;从图5可以看出,预测2015年中国人口总数为138 883万人,2016年人口总数为139 547万人,2017年人口总数为140 188万人。依据国家统计局所公布数据,2015年末中国人口总数已达到137 463万人,与预计结果误差为1.03%。
3 结 语
本文按照《中国统计年鉴2015》中的人口总数数据,利用BP神经网络,通过MATLAB软件对1970-2010年中国人口总数数据进行拟合,并对2011-2014年中国人口总数预测,然后与这4年中国人口实际数据进行比较。实验结果表明,使用该方法的预测结果和实际值误差很小,精确度较高,模型简单易行,为中国人口总数预测提供了简单快速且准确的分析方法,有一定的实际应用价值。
主要参考文献
[1]杜国明.人口数据空间化方法与实践[M].北京:中国农业出版社,2008.
[2]宋健.人口控制与人口预测[M].北京:人民出版社,1981.
[3]程国建.神经计算与生长自组织网络[M].西安:西安交通大学出版社,2008.
[4]中华人民共和国国家统计局.中国统计年鉴[M].北京:中国统计出版社,2015.
[5]刘琳h.基于PCA-BP神经网络的铁路客运量预测模型研究[J]. 综合运输. 2016(08).
[6]要亚斌,李淑琴,黄宇.基于神经网络的热工系统辨识方法研究[J]. 计算机仿真,2016(8).
[7]付克兰,李辉,张霞.BP神经网络预测模型及应用[J]. 信息与电脑理论版, 2016(11).
[8]季渊,陈文栋,冉峰,张金艺,David LILJA. 具有二维状态转移结构的随机逻辑及其在神经网络中的应用[J]. 电子与信息学报. 2016(8).
关键词:脱硫脱硝;BP神经网络;反向传播;预测
中图分类号:X73文献标识码:A文章编号:16749944(2014)07021303
1技术背景
煤炭燃烧产生的烟气中,含有大量的氮硫氧化物,这些氧化物直接排放到空气中,会导致酸雨等自然灾害的发生。因此,各国都在积极研究烟气脱硫脱硝技术。目前最新的技术是采用臭氧的强氧化性对烟气中的NO进行处理,使之溶解于水,降低烟气中的氮硫氧化物。
现有的技术对于臭氧的添加采用的是PID控制,此控制技术经过多年的发展,已经相对成熟。其控制设备简单,控制思路清晰,但在控制过程中也存在很多问题,比如对于大惯性环节控制滞后,震荡过度等问题。在添加臭氧的过程中,通过检测烟气输入端的氮硫氧化物的摩尔量,利用反应方程式计算理想状态下需要的臭氧摩尔量,然后再通过检测通入碱性废水中和前的NOx,SO2的浓度,完成PID调节,改变臭氧的添加量。
在添加的过程中,因为影响臭氧添加量的各个因素之间是非线性的,所以无法进行单一的线性补偿,导致臭氧添加量过大或者过少。过大会造成添加臭氧的浪费,过小会使烟气反应不完全,导致烟气排放不达标,所以本发明的目的就是根据历史数据对臭氧的需求量建立预测模型,通过数据的分析,预测臭氧的消耗量,以达到减少浪费或者减少烟气不达标的情况。
人工神经网络是利用计算机模拟人脑的结构和功能的一门新学科[1],能够利用自身的优良处理性能,解决高度非线性和严重不确定性系统的复杂问题,在此适合进行对臭氧需求量进行预测,所以提出建立一个三层BP神经网络预测模型,使用改进的算法进行训练,并对烟气脱硫脱硝中臭氧需求量的预测的方法[2]。
2BP网络及动量梯度下降算法
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出的,一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,并且无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input layer)、隐含层(hide layer)和输出层(output layer)。
网络学习规则又称为 学习规则,对于给定的一组训练模式,不断用一个个训练模式重复前向传播和误差反向传播过程,各个训练模式都满足要求时,则说明BP网络已学习好了。从网络学习的角度来看,网络状态前向更新及误差信号传播过程中,信息的传播是双向的,但是不意味着网络层与层之间的结构也是双向的。
BP神经网络能够以任意精度逼近任何非线性连续函,使得其特别适合于求解内部机制复杂的问题,即BP神经网络具有较强的非线性映射能力;其次BP神经网络具有高度自学习和自适应的能力。还有泛化能力,即BP神经网络具有将学习成果应用于新知识的能力。容错能力:BP神经网络具有一定的容错能力,即使系统在受到局部损伤时还是可以正常工作(图1)。
从(2)式可看出,如果比例系数μ=0,则为高斯-牛顿法;如果μ取值很大,则LM算法接近梯度下降法,每迭代成功一步,则μ减小一些,这样在接近误差目标的时候,逐渐与高斯-牛顿法相似[4]。高斯-牛顿法在接近误差的最小值的时候,计算速度更快,精度也更高。由于LM算法利用了近似的二阶导数信息,它比梯度下降法快得多,实践证明,采用LM算法可以较原来的梯度下降法提高速度几十甚至上百倍。另外由于[JT(w)J(w)+μw]是正定的,所以(2)式的解总是存在的,从这个意义上说,LM算法也优于高斯-牛顿法,因为对于高斯-牛顿法来说,JTJ是否满秩还是个潜在的问题。
在实际的操作中,μ是一个试探性的参数,对于给定的μ,如果求得的 能使误差指标函数 降低,则E(w)降低;反之,则μ增加。用(2)式修改一次权值和阈值时需要求n阶的代数方程(n为网络中权值数目)。LM算法的计算复杂度为O(n3/6),若n很大,则计算量和存储量都非常大。然而,每次迭代效率的显著提高,可大大改善其整体性能,特别是在精度要求高的时候[5]。
3臭氧脱硫脱硝需求量的预测
以BP神经网络模型为原始模型,建立一个三层BP神经网络预测模型,使用改进的算法进行训练,并对烟气脱硫脱硝中臭氧需求量的预测[6],主要步骤分析为以下几个方面。
(1)根据生产工艺流程,臭氧将难溶于水的NOx,SO2等氮硫氧化物氧化成易溶于水的高价氧化物,通过碱性废水进行中和,同时脱硫脱硝的目的。通过分析可知,影响臭氧需求量的主要因素是:烟气的流速,反应前烟气中氧气的浓度,反应中管道内的平均氧气浓度,反应管道中臭氧与SO2的摩尔比,臭氧与NOx的摩尔比,气体在反应管道中的停留时间,碱性废水吸收液的温度,碱性废水吸收液中碱离子的浓度和烟气的温度等因素。在此,选取以上影响因素作为BP神经网络模型的输入变量,通入的臭氧的流速作为输出变量。
在建立BP神经网络模型过程中,隐含层节点数对BP神经网络预测精度有较大的影响,节点数太少,网络不能很好地学习,需要增加训练次数,训练的精度也受影响;节点数太多,训练时间增加,网络容易过拟合[7,8]。最佳隐含层节点数的选择可参考如下公式。
4结语
改进的BP网络预测模型,对同时脱硫脱硝臭氧需求量进行预测,训练算法采用动态自适应学习率的梯度下降算法,能够更快的进行训练,预测误差也较小,预测值有很好的利用价值;通过对臭氧需求量的预测,能够实时的根据工况自动改变臭氧的添加量,既能满足脱硫脱硝的技术要求,同时也可以降低臭氧的需求量,降低企业成本,提高公司效益。本文只是设计了方法,结果需要经过试验进行验证,并进行改进。
参考文献:
[1] 吴昌设.基于人工神经网络的电网日负荷预测研究[D].杭州:浙江大学,2011.
[2] 姜成科.基于遗传算法的神经网络在大坝变形预报中的应用 [D].大连:大连理工大学,2008.
[3] 刘晓悦,姚乐乐,聚类分析在超短期电力负荷中的应用[J].河北联合大学学报:自然科学版,2013,35(3):74~80.
[4] 沙瑞华.基于神经网络的水电机组动载识别研究[D].大连:大连理工大学,2005.
[5] 黄豪彩,杨冠鲁.基于LM算法的神经网络系统辨识[J].组合机床与自动化加工技术,2003(2):6~8.
[6] 冯居易,郭晔.基于LM算法的石油期货价格预测研究[J].技术经济与管理研究,2009(5):19~21.
[7] 项灏,张俊.一种改进的量子遗传模拟退火算法及其在神经网络智能故障诊断中的应用[J].机床与液压,2012.40(13):196~200.
【摘要】 目的: 探讨矽肺纤维化同生物活性介质之间的关系。方法: 利用Delphi语言编制了BP人工神经网络模型计算机程序,建立并分析了矽肺胶原纤维预测的数学模型。结果: 选定网络隐含层节点为9,初始权值阈值约为(-0.2,0.2),最大相对误差为4%,最小相对误差为0.2%。 结论: 应用神经网络具有较好的预测效果,可为临床医学研究提供一个很好的研究思路。
【关键词】 BP神经网络; 生物活性介质; 矽肺; 胶原纤维; 预测
矽肺是尘肺中最严重的一种类型,是由于长期吸入超过一定浓度的含有游离二氧化硅的粉尘,肺内发生广泛的结节性纤维化。矽肺纤维化的预测困难,诊断滞后。目前,矽肺的发病机理仍然不完全清楚,尚无有效的早期诊断(筛检)方法,也无早期诊断的特异性指标和特异性的治疗药物和方法。一经传统的后前位胸大片确诊,肺部病变已经无法逆转。因此,寻找早期诊断(筛检)特异性的生物介质组合,对预防、治疗乃至最终消除矽肺具有重要意义。矽肺的发病与细胞因子(Cytokine,CK)网络调控有密切联系,高宏生等用系统生物学的方法论证了细胞因子对矽肺纤维化的网络调控关系[1,2],论证了细胞因子复杂非线性致炎致纤维化的网络调控假说。王世鑫等用判别方程的方法,通过诊断肺纤维化正确率。矽肺纤维化与不同活性介质、基因表达等多种因素密切相关[3],因此预计是一个多目标决策问题。传统的预测方法是用多元线性回归来进行预测,统计者千方百计的想找出决策目标和各因素之间找出一个线性的公式关系,试图想用一个严格的数学模型公式表达出相应的关系。实际上,具有良好的非线性的神经网络可以预测矽肺纤维化结果。本研究图基于神经网络的方法预测生物活性介质网络调控的矽肺纤维化。
1 神经网络的基本理论
人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新型信息处理体系。通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能。从本质上讲,人工神经网络是一种大规模并行的非线性动力系统。它具有许多引人注目的特点:大规模的复杂系统,有大量可供调节的参数;高度并行的处理机制,具有高速运算的能力;高度冗余的组织方式等。
在预测领域中应用最广泛的还是BP网络。BP网络的学习算法是一种误差反向传播式网络权值训练方法。实质就象最小二乘法一样,BP算法是在样本空间中耦合这样一个曲面,即使所有的样本点均在这个曲面上,若这样的曲面不存在,就找到离样本点的距离之和最小的曲面作为近似解。
BP网络的学习过程包括:正向传播和反向传播。当正向传播时,输入信息从输入层经隐单元处理,后传向输出层,每一层神经元的状态只影响下一层的神经元的状态。如果在输出层得不到希望的输出,则转入反向传播,将误差信号沿原来的神经连接通路返回。返回过程中,逐一修改各层神经元连接的权值。这种过程不断迭代,最后使得信号误差达到允许的误差范围之内。如图1所示为3层神经网络结构图。
输入层
隐含层
输出层
图1 神经网络结构
设3层BP神经网络,输入向量为X=(x1,x2,…xn)T ;隐层输出向量为Y=(y1,y2,…ym)T ,输出层向量为O=(o1,o2,…ol)T ,期望输出向量为d=(d1,d2,…dl)T 。
对于输出层,有ok =f(net),netk=m j=0wjkyj ,k=1,2,…l
对于隐层,有yj =f(net),netj=n i=0vijxi ,k=1,2,…m
f(x)=1 1+e-x ,BP学习算法权值调整计算公式为:
Δwjk=η(dk-ok)ok(1-ok)yj
Δvij=η(l k=1δ0k wjk)yj(1-yj)xi
δ0k =(dk-ok)ok(1-ok)
η∈(0,1)
2 应用实例
2.1 矽肺预测的影响因素
大量研究表明,肺泡巨噬细胞和肺泡上皮细胞在肺组织炎症反应及纤维化病变的启动、发展过程中起到最为关键的作用,主要是通过分泌细胞因子、炎性介质等生物活性物质,发挥直接或间接的生物学作用。这些CK包括:白介素(interleukin,IL)、肿瘤坏死因子(tumor necrosis factor ,TNF)、转化生长因子(transforming growth factor,TGF)等。根据分泌细胞因子不同将Th 细胞分为Th1 和Th2 两种类型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干扰素-γ(Interferon-γ,IFN-γ)等,主要介导细胞免疫应答,与炎症有关,具有抗纤维化作用,可抑制成纤维细胞的增殖及纤维的生成。Th2主要分泌白介素-4 (interleukin-4,IL-4)、白介素-5 (interleukin-5,IL-5)、白介素-10 (interleukin-10,IL-10)、白介素-13(interleukin-13,IL-13)、单核细胞趋化蛋白-1 (monocyte chemoattractant protein-1,MCP-1)等,而Th2主要介导体液免疫反应,可促进成纤维细胞的增生,导致胶原蛋白合成增加,并抑制胶原蛋白的降解,最终导致细胞外的基质蛋白沉积和纤维生成。Th1 型和Th2 型免疫应答之间存在着交互的负反馈作用,维持着正常的免疫平衡。其负反馈调节通常就是靠产生的细胞因子起作用的,即一型CK可以下调另一型CK的功能。Th1/Th2型CK失衡可导致机体对损伤的异常反应。总之,矽肺病人存在CK网络的平衡紊乱,其错综复杂的调控机制可能参与矽肺的发生和发展[6~9],如图2所示。
图2 细胞因子网络调控图
2.2 矽肺预测的BP网络模型的设计
本研究运用神经网络的模型方法,对矽肺预测进行设计,得出其预测模型。
2.2.1 输入层、隐含层、输出层的设计
矽肺纤维化输入层的确定:根据meta分析和微分方程网络模型确定生物活性介质为输入层。
转贴于
对于矽肺预测,应当依据其关键要素来确定输入层各因素,在神经网络模型中,输入层可以选定白介素(interleukin,IL)、肿瘤坏死因子(tumor necrosis factor ,TNF)、转化生长因子(transforming growth factor,TGF)等。根据分泌细胞因子不同将Th 细胞分为Th1 和Th2 两种类型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干扰素-γ(Interferon-γ,IFN-γ)作为输入层,输入单元数为8,隐含层节点的确定参考下面单元计算公式:
c=n+m+a
其中c 为隐层单元数,n为输入神经元个数,m 为输出神经元个数,a 为1~10之间的常数。本研究中,隐层单元数计算如下:
8+2+1≤c≤8+2+10
即:4.33≤c≤13.33
根据c 的计算值,由小到大改变节点数训练并检验其精度,当节点数的增加误差不进一步减小时,其临界值即为应采用的值。最后,经过网络的实际训练结果比较,选定网络隐含层节点为9,此时网络能较快地收敛至所要求的精度。
2.2.2 初始权值的确定
在神经网络模型中,初始权值选取对于输出结果是否最接近实际,及是否能够收敛、学习时间的长短等关系很大。初始权值太大,使得加权之后的输入和N落在了网络模型的s型激活函数的饱和期中,从而会导致φ′(·)非常小,而由于当 φ′(·)0时,则有δ0,使得Δwji 0,最终使得调节过程没有什么效果。所以权值及阈值的初始值应选为均匀分布的小数经验值,约为(-2.4/F,2.4/F)之间,其中F为所连单元的输入层节点数。本模型输入端节点数为11,所以初始值约为(-0.2,0.2),可随机选取[4]。
2.2.3 目标值及学习步长的选取
对矽肺预测之前,应先根据影响矽肺预测的因素进行综合预测。在实际操作时,还应结合经验值。若Sigmoid函数选取反对称函数——双曲正切函数,综合评估指标的目标值D的范围也应在[-1,1]之间,也即是综合指标的无量纲数值在[0,1]之间。通常输出单元的局部梯度比输入端的大,所以输出单元的学习的步长应比输入单元小一些[5]。
通过以上分析可得网络模型结构如图3。利用Delphi语言编制了BP人工神经网络模型计算机程序进行训练集样本训练,训练输入节点数为8,表1为矽肺预测输入训练样本和检测样本,当误差给定E=0.00005,学习步长为0.1,经200次训练,网络精度达到要求,如表2和图4所示。表1 矽肺预测输入训练样本和检测样本表2 训练样本训练次数网络误差
样本经200次训练后,网络误差满足精度要求,隐含单元到各输入单元的权值和阈值及输出单元到各隐含单元的权值和阈值调整为表3和表4所示。
由于矽肺预测神经网络模型经训练后,网络精度已经达到要求,可以用检验样本检测预测效果,如表5所示。
从预测结果看,最大相对误差为4.0%,最小相对误差为0.2%,预测效果非常明显,该网络的检验性能稳定,可以很好的对矽肺进行预测。表3 隐含单元到各输入单元的权值和阈值表4 输出单元到各隐含单元的权值和阈值表5 检验样本及矽肺预测结果
3 讨论
本研究通过采用神经网络的方法,探讨矽肺纤维化同生物活性介质之间的关系,并建立了矽肺纤维化的影响因素和Ⅰ型胶原、Ⅲ型胶原的BP神经网络,从预测效果看,能够较准确的预测矽肺纤维化。但还应当看到神经网络应用到预测还有许多不尽如意的问题,主要的弱点之一是它是一种黑盒方法,无法表达和分析被预测系统的输入与输出间的关系,因此,也难于对所得结果作任何解释,对任何求得数据做统计检验; 二是采用神经网络作预测时,没有一个便于选定最合适的神经网络结构的标准方法,只能花大量时间采用凑试法,从许多次实验中找出“最合适”的一种。本研究在矽肺预测上运用神经网络建模上进行了初步的探讨,对网络模型的拓展性、收敛性等问题还有待于进一步的研究 。
参考文献
1 高宏生, 伍瑞昌, 张双德, 等. 基于meta分析和微分方程模型的肺纤维化细胞因子调控网络研究. 军事医学科学院院刊,2008,32(3):312~316.
2 高宏生,杨霞,丁朋,等. 应用meta分析肺纤维化TNF-α的时空变化. 武警医学院学报,2008,17(8):561~562.
3 刘萍 王世鑫 陈蕾,等. 矽肺患者血清克拉拉细胞蛋白和表面活性蛋白D的改变. 中华劳动卫生职业病杂志, 2007, 25(01):18~21.
4 韩力群.人工神经网络理论、设计及应用.化学工业出版社,2001.
5 何海龙,王青海,王精业.神经网络在装备保障性评估中的应用. 系统工程理论与实践,2003,9:111~116.
6 Kohonen T.Self-Organization and Associative Memory. Berlin Heidelberg:Springer-Verlag,1984.
7 Lapedes A,Farber.Nonlinear signal processing using neural networks :prediction and system modelling[R].Technical Report LA-UR-87-2662,Los Alam os National Laboratory.Los Alamos.NM,1987.
8 Wang CH, Mo LR, Lin RC, et al. Artificial neural network model is superior to logistic regression model in predicting treatment outcomes of interferon-based combination therapy in patients with chronic hepatitis C.Intervirology,2008,51(1):14~20.
9 Kato H, Kanematsu M, Zhang X,et al. Computer-aided diagnosis of hepatic fibrosis: preliminary evaluation of MRI texture analysis using the finite difference method and an artificial neural network.AJR Am J Roentgenol, 2007,189(1):117~122.
10 Piscaglia F, Cucchetti A, Benlloch S,et al. Prediction of significant fibrosis in hepatitis C virus infected liver transplant recipients by artificial neural network analysis of clinical factors. J Gastroenterol Hepatol, 2006,18(12):1255~1261.
关键词:负荷预测;神经网络;唐山电网;电力系统;电力负荷
中图分类号:TM714文献标识码:A文章编号:1009-2374 (2010)13-0124-02
一、预测意义
唐山是具有百年历史的沿海重工业城市,是河北省经济中心,同时也是中国经济发展前景最好的城市之一。特别是最近几年,随着国家产业结构与河北战略布局的调整,重大项目纷纷在唐山兴建,预计在未来几年唐山地区经济仍将快速增长。根据唐山电网用电情况统计数据,唐山电网2001年用电量158.266亿千瓦时,2008年用电量538.509亿千瓦时,平均年增长17.9%。综合考虑唐山地区经济发展与用电量增长因素,预计未来几年唐山电网电力负荷将保持较高的增长。中长期电力负荷预测是电力系统规划的基础,它在电力系统规划、新发电厂和发配电系统的建立过程中起到重要的指导作用。为了满足唐山电网负荷不断增长的需要,增加供电可靠性,对该地区进行科学合理的电力系统规划势在必行。因此,对唐山电网中长期的电力负荷进行预测具有重要意义。
二、预测方法选择
目前,电力负荷预测的研究已经十分成熟,许多方法和模型被引用到电力负荷预测中,其中比较常用的预测方法有以下几种:回归分析法、时间序列法、指数平滑法、神经网络法、灰色模型法、优选组合预测法、小波分析预测技术等。以上负荷预测的方法都有自身的优缺点以及适用范围。电力系统专家经过长期负荷预测实践,建议中长期电力负荷预测使用时间序列法与灰色模型法。由于未来几年唐山市将投产几个重大项目,唐山电网负荷将呈现不规则的跳跃式增长。因此,按照常规的预测方法对唐山电网的用电负荷进行预测将无法获得较满意的数据拟合度。神经网络算法能够实现较复杂的非线性映射,对大量的非结构性、非准确性规律具有自适应能力,应用于电力系统负荷预测,能够得到比传统预测方法更好的效果。因此,本文尝试使用神经网络算法预测唐山电网的用电负荷。
三、预测模型的建立
(一)确定神经网络输入量
输入层是神经网络结构的第一层次,该层次输入量的确定关系到神经网络训练的效率。特征量取得太少,则不能起到区分判断作用;取得太多则影响网络的训练速度。因此,合理地选择输入量,能提高网络的训练速度和预测精度。为了简化模型的结构,提高预测的精度,本文综合考虑中长期电力负荷预测的相关因素以及唐山电网的用电特点,确定以下五种影响电力负荷的经济因素作为神经网络的输入量即:“唐山地区的生产总值(GDP);第一产业用电量占总用电量的比重;第二产业用电量占总用电量的比重;第三产业用电量占总用电量的比重;生活用电量占总用电量的比重。”
(二)构造神经网络结构
本文应用的神经网络是由输入层、输出层和隐含层三层网络结构构成。理论研究已证明对于任何在闭区间上连续的函数,只要隐含层神经元数目足够多,就可以用只含一个隐含层的网络结构以任意精度来逼近,所以本文隐含层只取一层。第一层为输入层,神经网络的输入神经元为五种影响唐山电网用电负荷的经济因素,因此该层的神经元个数为5个;第二层是隐含层,隐含层神经元数根据下式求得:
或或h=lg2n (1)
其中k为样本数,n为输入层神经元数,m为输出神经元数,h为隐含层神经元数,a为1~10之间的常数。第三层是输出层,因为输出结果只有一个指标即唐山电网某年的用电量,所以输出神经元的个数是1。从而确定本文的神经网络结构为5×3×1。
(三)神经网络的训练算法
由于标准BP算法中,人为凭经验选取学习率和动量因子,往往会对网络学习速度产生较大影响,甚至会因为学习率选取不当而导致学习中发生振荡而不能收敛,这些缺点将影响整个预测的精度。本文采用改进的批处理式Vogl快速算法,进行网络训练。在网络训练过程中根据训练的实际情况自适应改变学习率η及动量因子α的大小:当前的误差梯度修正正确,则增大学习率,加入动量项;否则减少学习率,甩掉动量项。这样初始η值就可以相对随意的选取,避免上述缺点。自适应改变η及α的修正公式如下:
(2)
上式中ΔE=E(J)-E(J-1),表示神经网络前后相邻两次学习过程中误差函数的变化量。φ略大于1,β略小于1。E (J)为神经网络第J次训练过程中的误差函数:
(3)
式中:pt',和Ot分别表示神经网络对应于第t个输入向量的期望输出和实际输出。
(四)预测实施
唐山电网2001~2008年用电量、生产总值以及各产业用电占比情况的历史数据见表1:
表12001~2008年唐山电网用电情况统计
年份 生产总值
/万元 用电量
/亿千瓦时 一产用电
/% 二产用电
/% 三产用电
/% 生活用电
/%
2001年 9150473 158.266 3.8 83.4 5.5 7.2
2002年 9993543 180.420 3.3 84.6 5.5 6.6
2003年 11022878 233.638 2.2 87.7 4.8 5.3
2004年 17616311 290.260 1.7 89.1 4.5 4.7
2005年 20276374 358.800 2.4 89.1 4.0 4.5
2006年 23621410 432.752 2.1 89.3 4.2 4.5
2007年 27794190 520.020 1.3 90.5 4.1 4.1
2008年 36132447 538.509 1.2 90.0 4.4 4.4
根据2001~2008年唐山电网用电量的历史数据,分别使用时间序列法、灰色预测模型与神经网络算法对唐山电网的用电量进行预测。使用2001~2006年的历史数据预测2007年、2008年的用电量,并将预测结果与真实数据做对比,以分析三种预测方法的误差。通过
Matlab软件计算,三种预测方法的预测结果及误差情况,见表2:
表2用电量预测值及误差表
序号 年份 用电量 灰色模型 时间序列法 神经网络
预测值 误差 预测值 误差 预测值 误差
1 2007年 520.020 501.1 3.64% 487.9 6.41% 531.7 2.25%
2 2008年 538.509 512.4 4.85% 503.9 6.75% 559.4 3.88%
通过上表我们可以看出以上三种预测方法的误差除了时间序列法的误差较高外,都在允许的范围内。灰色模型与神经网络算法都可以较准确的预测出唐山电网的用电量。相比而言,神经网络算法预测对于历史数据的拟合度更高,神经网络算法更适用于唐山电网中长期的电力负荷预测。因此,本文使用神经网络算法对唐山电网未来五年的用电负荷进行预测,通过Matlab软件计算,预测结果见表3:
表3唐山电网用电负荷预测
序号 年份 年用电量(亿千瓦时) 年最大负荷(MW)
1 2009 584.282 7637.677
2 2010 625.182 8172.314
3 2011 665.819 8703.514
4 2012 725.077 9478.127
5 2013 781.633 10217.42
四、结论
本文研究了神经网络算法在唐山电网中长期电力负荷预测中的应用。研究结果表明,应用神经网络算法比时间序列法、灰色模型有更高的预测精度,神经网络算法可以较准确的预测唐山电网中长期的电力负荷。
参考文献
[1]于之虹,郭志忠.数据挖掘与电力系统[J].电网技术,2001,25(8).
关键词: 灰色系统模型,神经网络,电信业务预测
中图分类号:TN92 文献标识码:B
1 引言
电信业务预测是通信网络分阶段建设规划的前提条件,同时也是规划期内电信业务量和投资预估的必要条件之一。预测方法的选择直接关系到预测结果的精确程度。传统的预测方法很多,如趋势外推法,成长曲线法等,但这些预测方法预测结果均为平滑的曲线,无法直观描述出电信业务随季节及其他外部环境引起的波动。因此,神经网络法便给传统预测方法进行了很好的补充。近年来神经网络算法逐渐得到预测科学工作者的重视,已经在预测领域中得到了广泛的应用,神经网络预测法是一种由多个神经元以某种规则连接而形成的层次网络结构,其基本原理是这些神经元之间“相互协作”,它有许多优点,对环境因素引起的波动性具有良好的适应性;对非线性输入输出关系的学习更具有优越性,其描述问题的能力很强。但是传统的神经网络算法(如BP神经网络)是一种基于误差函数梯度下降的学习方法,学习过程收敛速度较慢;其次,有些神经网络训练开始时初始权值是随机给定的,这对网络的训练效果也会有极大影响,甚至导致网络陷入局部最小点。
灰色系统理论是一种研究少数据,贫信息、不确定性问题的新方法,它以部分信息已知、部分信息未知的“小样本”、“贫信息”不确定系统为研究对象,通过对“部分”已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。
2 灰色神经网络模型结构及算法
3 数据来源及实证结果
对于移动通信运营商来说,VLR用户数(拜访位置寄存器)随节假日的波动很大,尤其是人口输入/输出城市,节假日大量外来人口的返乡/外出,会给当地运营商的核心网及无线载频处理能力带来较大的考验,因此,合理准确的预测出该地市未来VLR用户数可以很大程度上帮助运营商为用户数的变化做好系统的扩容准备工作。对于某个运营商的VLR用户数,影响其变化的因素很多,比如节假日,季节性因素,人均通信消费指数,当地的移动电话普及率,该运营商收费用户数、品牌影响力,终端价格,竞争对手、市场特征等,本人根据各因素对VLR用户数影响程度的大小,从中选取了该运营商收费用户数、节假日、当地移动电话普及率、品牌影响力、竞争对手5个最重要的因素来预测某地市移动运营商的VLR用户数。
该论文中,本人选取该地市的过去3年(36个月)的VLR用户数进行验证,首先取前30个月的数据作为训练样本,通过灰色神经网络学习100次后预测最后6个月的数据与实际VLR用户数做比较,如图4所示。
从上图可以看出,灰色系统模型预测结果与实际值相比,误差在10%以内,并很好的反应了VLR用户的波动性,因此可以说明灰色系统模型比较适合小样本预测问题,在实际预测中,若与传统预测方法相结合,并合理加权,预测准确度将更高。
4 结束语
本文为其他神经网络模型所存在易于陷入局部最优解等缺陷而提出了基于灰色基础模型的神经网络算法,并利用所设计的灰色系统模型神经网络算法,选择我国某地市的移动公司VLR用户数作为数据样本,对该公司的VLR用户数进行预测,并对比其他神经网络模型,实证结果表明,灰色系统模型神经网络算法,相对其他神经网络而言,其预测效率和准确率大大得到提高,在电信业务预测方面具有较好的应用前景。
参考文献:
[1]WANG Q, STOCKTON D J, BAGULEY P. Using neural networks in cost model development process [C].Proc of the 16th National Conf on Manufacturing Research, UK:Professional Engineering, 2000
[2]SMITH A E, MASON A K. Cost estimation predictive modeling: regression versus neural [J].Engineering Economist, 1997
[3]何 芳 陈 收:基于扩展卡尔曼滤波的神经网络学习算法在股票预测中的应用[J].系统工程,2003
[4]史峰:MATLAB 神经网络30个案例分析,北京航空航天大学出版社,2010.4
[5]Jatomder N D. Gupta, Sexton R S. Comparing back-propagation with a genetic algorithm for neural network training[J].Omega,1999,
中图分类号: TP273 文献标志码:A
Gas emission prediction model of hybrid pi.sigma fuzzy neural network
PAN Yu.min*, ZHAO Li.yong, ZHANG Quan.zhu
College of Electronic Information Engineering, North China Institute of Science and Technology, Beijing 101601, China
Abstract:
A gas emission prediction model built by using reasoning method of hybrid pi.sigma fuzzy neural networks is proposed. The model adopts Gaussian function as a Fuzzy membership function, and the membership functions and conclusions parameters of the model can be adjusted online dynamically. Compared with the neural network prediction model, the method has characteristics of clear physical meaning, clear principle, fast convergence, high prediction accuracy and so on, the simulation results show the effectiveness of the method. In order to facilitate the practical application, we develope a Graphical User Interface (GUI) application interface in the Matlab environment. To solve the problems of unstable prediction results of neural network, to set training accuracy, the contradiction between training accuracy and prediction accuracy, and evaluation of generalization ability of the neural network in prediction process, experimental research is carring out, and the conclusions are given.
A gas emission prediction model built by using reasoning method of hybrid pi.sigma fuzzy neural networks was proposed. The model adopted Gaussian function as a Fuzzy membership function, and the membership functions and conclusions parameters of the model can be adjusted online dynamically. Compared with the neural network prediction model, the method has characteristics of clear physical meaning, clear principle, fast convergence, high prediction accuracy and so on, and the simulation results show the effectiveness of the method. In order to facilitate the practical application, we developed a Graphical User Interface (GUI) application interface in the Matlab environment. To solve the problems of unstable prediction results of neural network, to set training accuracy, the contradiction between training accuracy and prediction accuracy, and evaluation of generalization ability of the neural network in prediction process, experimental research was carried out, and the conclusions were given.
A gas emission prediction model established by using reasoning method of hybrid pi.sigma fuzzy neural networks was proposed. The model adopted Gaussian function as a fuzzy membership function, and the membership functions and conclusions parameters of the model could be adjusted online dynamically. Compared with the neural network prediction model, the method has characteristics of clear physical meaning, clear principle, fast convergence, high prediction accuracy and so on. The gas emission data of a coal mine simulation results show that the prediction has a high accuracy, fast convergence and the prediction results can be repeated, it is proved that the method is effective. In order to facilitate the practical application, the authors developed a Graphical User Interface (GUI) application interface in the Matlab environment, and gave the method and prediction results. The experiments also show that, for the data, the generalization ability of the model is best when the training accuracy is set 0.001, and the training accuracy and the prediction accuracy of the model do not have positive relationship.Key words:
hybrid pi.sigma neural fuzzy network; gas emission; prediction; Graphical User Interface (GUI)
0 引言
瓦斯事故是煤矿安全生产中最主要的地质灾害,也是制约煤碳生产可持续发展的“瓶颈”。预防与监控瓦斯事故历来受到世界各主要采煤国的高度重视,也是国内外学者广泛关注的重要课题,实现从源头上治理瓦斯灾害,准确预测瓦斯涌出量是解决问题的关键之一。
瓦斯涌出量是一个非常复杂的地质参数,它受许多因素的影响,如地质构造、煤层厚度、煤体结构、埋藏深度等自然因素,以及与开采技术相关,这些因素本身是随机变量,各因素之间相互制约、互为因果。因此,瓦斯涌出量实际上是一个多变量、时变、灰色、高度非线性及复杂的动力学系统,通常很难精确预测。瓦斯涌出量的大小不仅反映不同煤层的危险程度,同时也是决定开发新井、新采区、新工作面规模、通风、安全技术水平的重要指标以及煤层气资源评价的基础[1]。
对瓦斯涌出量的预测研究,以前苏联、波兰、德国、英国、法国等起步较早;我国在这方面的研究最早的是煤炭科学研究总院抚顺分院。目前,瓦斯涌出量的预测方法主要有:矿山统计法、瓦斯含量法、分源预测法、类比法、瓦斯地质法、数学模型法、速度
预测法[2],这些方法属于线性预测法。近年来,出现了灰色系统预测、模糊综合评判法、神经网络预测等非线性预测方法,其中以神经网络预测方法尤为突出,近年来获得了广泛应用,取得了一系列研究成果[1-3,12]。
目前神经网络预测方法主要是以BP(Back.Propagation)和径向基函数(Radical Basis Function,RBF)神经网络为主。其显著特点是仅借助于样本数据, 即可实现由Rn空间(n为网络输入节点数)到Rm空间(m为输出节点数)的高度非线性映射,而且这种映射可以由足够的训练样本来保证。神经网络不依赖精确的数学模型,容错性和鲁棒性强,有很强的非线性函数逼近能力,为瓦斯涌出量这一高度非线性的预测提供了一个全新的途径。
但是,在采用神经网络设计瓦斯涌出量预测模型时也存在如下几个问题:
1)网络结构设计尚无统一的理论依据;
2)预测结果通常为随机值;
3)机理缺乏透明度;
4)初始参数确定问题;
5)过度拟合现象;
6)局部极小问题。
其中大多数问题需要在实验过程中加以确定,采用试凑法,从多次实验中找出“最合适”的一种。由于影响神经网络预测能力的参数很多,上述方法未必能找到真正意义上的最合适的预测模型结构和参数。为此,本文提出了一种采用混合pi.sigma模糊神经网络的瓦斯涌出量预测的新方法,并开发了仿真预测可视化应用界面。
1 混合pi.sigma模糊神经网络
神经―模糊建模预测是近年来基于模糊集理论发展起来的一种新的预测方法。最新研究表明,将人工神经网络和模糊逻辑推理相结合构成的自适应神经―模糊推理系统具有收敛速度快、拟合能力强、预测精度高、网络训练结果确定等优势,这些恰好是研究和建立煤与瓦斯突出危险性预测方法追求的目标。
模糊逻辑和神经网络具有很强的互补性,它们都是对同一参考系――人脑智能的模拟,因此具有自然的内在联系,类似“人脑”的软硬件。神经网络中引入模糊逻辑可使网络具有逻辑推理能力, 彼此优势互补,物理意义和推理过程清晰。
针对多维模糊推理中的推理规则庞大的问题,学者Takagi和Sugeno提出了一种新的模糊推理模型,即T.S模型[5]。该模型模糊规则中“if”部分与扎德规则中的“if”部分相似,但是其“then”部分是精确函数,通常是输入变量的多项式。T.S模型可用少量的模糊规则生成较复杂的非线性函数,这在处理多变量系统时能有效地减少模糊规则个数,因而具有较大的优越性。由于T.S模型结论参数是线性函数而非模糊数,在实际系统中结论部分不能直接从专家经验和操作数据中得到,必须通过一定的算法进行训练。因此,模型参数的辨识成为建立T.S型模糊系统的主要问题。
2.3 网络泛化能力
为了评价网络的预测性能,采用泛化能力进行描述。泛化能力是指神经网络学习算法对新样本的适应能力,其目的是学习隐含在数据样本中的规律,经过训练后的网络对非训练样本也能给出合理的输出,该能力称为泛化能力。
泛化能力是评价网络预测性能的重要指标。需要指出的是,并非训练的次数越多或者设置的训练精度越高,就越能得出正确的预测结果。通常在网络的训练初期是学习数据的变化趋势,随着训练次数的增加主要记忆样本数值,因此过拟合状态时对于非训练样本的泛化能力反而变差。
此外,预测的准确性与外部输入样本数据有很大关系,如果样本数据不具有典型性和呈现一定的规律性,预测将失去意义。
泛化能力是衡量预测值与实测值差别的变量,采用平均相对变动值(Average Relative Variance,ARV)表示,ARV等价于网络泛化能力。ARV越小,网络的泛化能力越强,其表达式[14]为 :
ARV=∑Ni=1[x(i)-x^(i)]2∑Ni=1[x(i)-x(i)]2 (16)
其中:N是比较数据的个数,x(i)为实测数据,x(i)为实测数据的平均值,x^(i)为预测值。ARV越小,泛化能力越强。上述预测时的ARV=4.2658e-004,表明该预测模型有很强的泛化能力。
3 Matlab/GUI界面开发
目前,可视化界面开发以VC、VB多见,而利用Matlab/GUI进行界面开发的很少。相对VC、VB,Matlab软件在复杂的数值分析、矩阵运算、信号及图像处理等方面具有显著优势。在瓦斯涌出量预测时需要处理大量的数据,同时利用Matlab编写的程序更易于嵌入Matlab/GUI界面,而且具有方便、快捷和灵活的特点。
为便于实际工程应用,按照上述混合pi.sigma模糊神经网络原理,在Matlab/GUI环境中开发了仿真系统界面,如图3所示。Matlab/GUI界面使用M文件和GUIDE融合制作可视化GUI仿真预测系统界面[15]。
该仿真界面可以全面显示网络训练、预测及网络参数等信息,使用者不需要知道代码的具体内容,只要了解操作步骤即可很方便地操作界面,界面直观友好。该系统支持三种方式导入数据: 1) *.mat文件数据;2) * .txt数据; 3) *.exl格式的数据。
操作流程:1)导入数据,选择训练样本和检测样本数;2)选择合适的网络参数;3)点击“网络训练”按钮,将显示训练曲线、预测结果图形;4)点击“预测结果”按钮会显示底部数据,点击“Close”按钮关闭系统。
4 结语
本文提出了一种新型瓦斯涌出量混合pi.sigma模糊神经网络预测模型,该模型具有物理意义清楚、原理和结构透明、网络训练速度快、预测精度高、预测结果非随机等特点,并且隶属函数和结论参数可在线调整,可充分发挥模糊逻辑和神经网络各自的优势,仿真结果证明了所建模型的有效性。笔者对常规模糊神经网络同时进行了实验比较,本文提出的方案明显优于一般模糊神经网络。通过开发Matlab/GUI界面,使仿真过程立体化,更接近工程实际应用,具有直观、可视化等特点,因此本文提出的预测模型具有一定的实际应用前景。参考文献:
[1]
唐朝伟, 何国田, 徐昌彪, 等. 神经网络在采煤工作面瓦斯涌出量预测中的应用[J]. 计算机应用, 2007,27(12): 202-204.
[2]
王景山, 宋金栋, 张聪, 等. 矿井瓦斯涌出量预测方法综述[J]. 能源技术与管理,2008(4): 49-51.
[3]
朱红青, 常文杰, 张彬. 回采工作面瓦斯涌出BP 神经网络分源预测模型及应用[J].煤炭学报, 2007, 32(5):504-508.
[4]
杨新, 张陶红, 余刚, 等. 基于ANFIS的选矿产品成本预测模型[J]. 系统仿真学报,2007,19(24):5688-5691.
[5]
傅惠, 许伦辉, 胡刚, 等. 基于Sugeno型神经模糊系统的交通流状态预测算法[J]. 控制理论与应用,2010, 27(12):1637-1640.
[6]
杨奎河, 王宝树, 赵玲玲. 模糊神经网络在非线性短期负荷预测中的应用[J]. 控制理论与应用,2004,21(5):791-794.
[7]
王士同. 神经模糊系统及其应用[M].北京:北京航空航天大学出版社,1998: 210-245.
[8]
刘金锟. 智能控制[M]. 北京:电子工业出版社,2009: 162-164.
[9]
金耀初, 蒋静坪. 一种模糊神经网络及其应用[J]. 浙江大学学报,1995,29(3): 340-347.
[10]
修杰, 夏长亮, 王世宇. 开关磁阻电机的pi.sigma模糊神经网络建模[J]. 电工技术学报,2009,24(8):46-51.
[11]
彭晓波, 桂卫华, 李勇刚, 等. 动态T.S递归模糊神经网络及其应用[J].系统仿真学报,2009,21(18) :5636-5644.
[12]
曲.采煤工作面瓦斯涌出量预测的神经网络模型[J].中国安全科学学报, 1999,9(2):42-45.
[13]
刘思峰, 谢乃明. 灰色系统理论及其应用[M]. 北京: 科学出版社,2008: 48-52.
[14]
CHOLEWO T, ZURADA J M. Sequential network construction for time series prediction[C]// Proceedings of the IEEE International Joint Conference on Neural Networks. Houston:IEEE, 1997: 2034-2039.
关键词:新疆;棉花产量;神经网络;预测
中图分类号:F32 文献标识码:A
收录日期:2012年9月5日
我国是纺织服装业大国,棉花的稳定供给对我国棉纺业意义重大。2011年新疆棉花种植面积2,393.9万亩,产量289.8万吨,连续19年保持面积、单产、总产、调出量全国第一。棉花产业发展的稳定与否,不仅关系到国家棉花安全和棉纺工业稳定发展,也关系到新疆农村经济发展和社会的稳定。而棉花产业的稳定发展,离不开棉花产量的预测。分析与预测新疆棉花产量,不仅可以了解新疆棉花产量的走势,而且有助于统筹安排新疆棉花的种植、消费、出口等相关事宜,从而稳定棉花市场的供求,同时兼顾棉农的利益。
棉花属于纯经济作物,受市场价格变化影响很大,因此棉花种植面积具有很大波动性,同时气候变化对于棉花产量的影响至关重要。因此,相比粮食作物来说,棉花产量的预测具有较大难度。
时间序列预测和灰色系统GM(1,1) 等模型均是假设所有的影响因素都蕴含在单一历史序列中,主要依靠总产量数据建立预测模型,需要的数据较少,比较容易操作;适合于具有长期趋势的序列,对于波动比较剧烈的序列预测效果较差。目前,对新疆棉花产量预测的研究大部分都是此类。
回归分析预测和神经网络预测属于因果关系预测,假定一个因素的变动是由另一个或几个变量引起的,通过掌握自变量的变动可以知道因变量的变动趋势。要求占有尽可能多的资料,而对数列的波动趋势没有特别要求。回归分析需要假设关系的数量模型形式,然后用最小二乘法拟合,而神经网络则不需要假设数量关系的形式,通过反复多次的学习和训练达到模拟变量关系的目的。本文拟选用BP神经网络对棉花总产量进行预测。
一、建立人工神经网络模型的方法
关键词:短时交通流预测;时空相关分析;BP神经网络;时间延迟
中图分类号:TP391.9 文献标识码:A 文章编号:1007-9416(2017)03-0046-05
Abstract:Aiming at the shortage of traffic flow prediction based on single cross-section, the interaction of the adjacent cross-sections in the high speed road network is studied. Then according on the analysis of the spatial-temporal characteristics,a short-time traffic flow forecasting model based on the multiple cross-sections was established .The model is extended to the prediction model based on a single cross-section,and temporal-spatial characteristics of high speed traffic flow and time delay characteristics of space interaction are considered and they determine the input dimension of the forecasting model.Finally, BP neural network is the forecasting tool to estimate the prediction results.The experimental results show that the prediction model has higher prediction accuracy compared with the traditional single cross-section prediction model and improved the real-time performance and reliability of traffic flow prediction.It is of great significance to improve the traffic efficiency of high speed road.
Key Words:short-term traffic flow forecasting; spatio-temporal correlation analysis; BP neural network ; time delay
1 引言
高速公路作橐恢制毡榍抑匾的交通方式在客货运输中发挥着重要的作用,实时有效的交通预测信息可以诱导出行者的行为、解决或缓解交通拥堵等问题[1]。由于高速公路基本路段的交通流是非间断交通流,上下游间交通状态相互影响,上下游交通流参数分布具有一定相似性和延迟性,即整个路网是一个相互关联、相互影响的系统。对交通流进行预测时,如果只考虑单一断面的交通流数据,当出现车祸、天气恶劣等偶然因素时,交通流的波动性变大,预测的准确性会降低[2]。目前国内外学者逐渐将交通流的时空关联性用于短时交通流预测中,Wu 等[3]采用时空随机效应模型对城市路网交通流量进行预测,不仅考虑了目标路段的历史交通参数,还考虑了多个参考路段的交通参数;Min等[4]利用时空关联性对实时路交通流进行预测;邱世崇等[5]提出了一种基于时空特性分析和数据融合的预测方法,利用最小二乘动态加权融合算法将基于时间序列数据预测结果和空间回归估计预测结果进行融合输出最终结果;丁闪闪等[6]提出了一种基于时空关联和 BP_ Adaboost 的短时交通参数预测方法,先利用主成分分析对多个影响因素进行预处理,再采用Adaboost 算法对 BP 神经网络进行优化。以上对路网时空相关性的考虑在一定程度上提高了预测精度,但往往忽略相邻断面空间相互作用的延迟性。
交通流短时预测预测方法主要分为两类:第1类是基于传统数理统计理论的方法,主要包括时间序列预测法、历史均值预测法、卡尔曼滤波法[7]等;第2类是基于知识发现的智能模型,主要包括神经网络预测、非参数回归预测、支持向量机[8]等。第1类预测方法优点是方法模型简单,缺点是随着预测周期的缩短,交通流序列的非线性和随机性增强,预测精度减小[9]。第2类预测方法可以充分逼近任意复杂的非线性和随机性序列[10],对短时交通预测具有很好的效果。其中,BP神经网络是应用最广泛的模型网络,具有很好的非线性逼近能力[11]。
本文首先通过时空相关分析得到与待预测断面相关性较大的历史时段和相关断面,然后对相关断面和对应的时间延迟进行重构,构建BP神经网络预测模型。与传统方法相比,该模型考虑了上下游相邻断面序列的时间延迟,融合了断面交通流的时空特性及BP神经网络的非线性拟合优势,提高了短时交通流的预测精度。
2 交通流序列的相关性度量
交通流序列包含了交通流的特征和运行规律,利用R/S分析来研究时间序列的长程相关性以及空间互相关系数来对空间断面间交通流的相互作用进行分析。
2.1 R/S分析
R/S分析主要是通过计算Hurst指数来判断时间序列是否具有长程相关性[12]。Hurst指数的计算过程如下:设时间序列为,则t个时间序列数据的均值为
(1) 由此求得累计偏差
(2)
(3)
标准差
(4)
由公式(1)-(4)算出R/S,根据式(5)通过最小二乘法算出Hurst指数。
(5)
其中Hurst指数的取值范围为。
2.2 互相关系数
互相关系数经常用于研究复杂网络各单元间的内在相互作用关系[13]。对研究断面和的交通流时间序列和,互相关系数)计算公式为:
(6)
为交通流时间序列和基于的互协方差,计算公式为:
(7)
交通流时间序列、的均值为、和标准差为、。其中:
(8)
(9)
式中:为时滞参数[14],是指两个序列之间的时间间隔,反映了两序列的产生在时间上的先后关系。高速公路基本路段上游观测点的车辆按照一定速度行驶,经过一定的空间长度后达到下游观测点,时滞参数即为交通流从上游传递到下游所涉及的时间上的延迟[15],也称为偏移时间。
3 交通流时空相关分析
时空相关分析研究空间中的对象随时间变化的关系,反映了时空数据在时间和空间上的相互作用关系,本文利用四川省高速交通流断面数据进行分析和验证。
3.1 时间相关分析
对高速路交通流时间序列进行R/S分析,采样时间为15min,采样点分别为96个(1天)、480个(5天)、960个(10天),分别计算出Hurst指数为0.69-0.88,见表1,均大于0.5小于1,说明交通流序列具有长程相关性,这表明该交通流时间序列具有分形特性,即交通流序列未来变化趋势与历史变化趋势成正相关,意味着上一时刻交通流的状态影响当前r刻和下一时刻交通流的状态,这也决定了交通流的预测要使用历史时段的数据。
3.2 空间互相关分析
高速路交通流不仅随时间变化,同时也受到空间因素的影响。现阶段对交通流空间变化特性的分析和描述认为,交通流互相关性大小是空间距离的函数,随着断面间距离的增加,空间互相关性逐渐减小,对于同一路网,两确定断面间的空间互相关性随着交通负荷的增大而增大。作为计算互相关系数大小的重要参数,时滞参数的大小同样与空间距离有关。图为研究断面流量互相关系数及时滞参数与断面间空间距离的关系。可以看出,互相关系数随空间距离增加逐渐减小,减小至一定值时趋于平稳。时滞参数在0~100Km范围内随断面间距增大而增大,间距超过100Km以后,在1~2间波动,主要原因是断面间距过大,空间相互作用的影响变小。如图1所示。
同时,两断面交通流序列的互相关系数大小也会随着时滞参数变化而变化。任选两上下游断面,从图2可以看出,两断面的互相关系数随时滞的增大而减小,在时达到最大,在时互相关系数未达到最大,主要原因是两断面间的空间距离不能使交通流变化的相互作用立即体现。
4 基于BP神经网络的交通流预测模型
根据时空相关分析结果可以找出与待测断面时间相关性较大的历史数据以及空间上相关性较大的几个相关相邻断面,但是相邻断面间的空间相互作用是非线性的,所以建立预测模型时选取BP神经网络作为预测工具。BP神经网络是一种单向传播的多层前馈网络,包括输入层、隐含层和输出层,BP神经网络的基本思想是输入信号经隐含层和输出层的非线性函数作用后输出,且通过调整输入值、输出值和权值对神经网络进行训练可以以任意精度逼近任意非线性函数。目前BP神经网络因其结构简单、可操作性强、自适应能力强等优点已被广泛用于模式识别、预测、函数拟合等领域。
4.1 预测模型的建立
该预测模型可简述为:利用BP神经网络建立待预测断面与相关断面的历史数据建立历史值与预测值的映射关系,由于时滞参数的存在,相关断面的流量序列数据要按照对应的时滞进行重构。如图3所示。
具体算法流程如下:
步骤1:确定待预测断面与相关断面
确定待预测断面,根据时空特性分析确定与待预测断面时空相关性较大的m 个相关断面以及断面与两流量序列的时滞。
步骤2:获取断面数据
获取待预测断面当前时刻t及t之前的r个时刻的交通流量以及相关断面在时刻和时刻对应的流量序列(即断面经时滞对的交通流产生影响)。
步骤3:明确训练样本与预测样本
确定训练样本和预测样本,其中,训练输入为:
训练输出为断面当前时刻t的流量值。预测输入为:
步骤4:数据预处理
对输入输出数据进行归一化处理,设和分别为为训练样本的最小值,为归一化后的交通值,通过公式(10)使训练样本转换到[0,1]区间。
(10)
步骤5:训练网络及预测
利用训练集对BP网络进行训练,训练结束后将预测集输入训练好的网络,得到预测输出后进行反归一化就可得到待预测断面t+1时刻的流量。
4.2 预测模型的实现
本文采用的是MATLAB提供的神经网络工具箱,预测模型为一个三层前向型BP神经网络,输入层和输出层的节点数分别由输入向量和输出向量的维数决定,若输入向量为m维数据,则根据Kolmogorov定理,隐含层的节点可为2m+1个。要注意的是,不同的隐含层节点数会影响预测的精度,所以我们需要找到最佳的隐含层节点数。首先,使用MATLAB中的mapminmax函数对输入输出数据归一化处理,然后使用newff函数来初始化神经网络以及traindgm算法来训练网络,训练网络时需要不断调整迭代次数或调整预测精度,直至使预测误差降到最小,最后,用sim函数对BP网络进行预测输出以及预测结果进行反归一化处理。
4.3 误差结果及分析
为了衡量神经网络预测结果,使用以下几个性能指标:
平均绝对百分误差():
(11)
均方根误差():
(12)
式中:为预测值,为真实值。
4.4 实例仿真
选择四川省某一断面为待预测断面,通过时空特性分析找出与该断面相相关性较大的4个相关断面以及分别对应的时滞。
本文选择2013年5月6日至2013年5月20日待预测断面的流量序列以及4个相关断面的流量序列为训练集,其中流量数据的采样时间为15min,选择2013年5月21日待预测断面的流量序列以及4个相关断面的流量序列为预测集。利用训练集对BP神经网络进行训练后,用预测集对待预测断面2013年5月21日的流量进行预测。其中,BP神经网络的输入层节点为8个,输出层节点为1个,隐含层节点数为18个,训练次数为10000次,训练精度为0.001,学习率为0.01。为了对比分析,分别进行基于交通流时间相关性、空间互相关性以及时空信息的BP神经网络模型进行预测,采用相同的网络Y构。三种模型的预测结果如图4所示。
从图中可以看出,基于时空特性分析和BP神经网络的短时交通流预测精度明显比只基于交通流时间相关性、空间互相关性的BP神经网络模型精度高。三种预测方法的性能指标比较见表2。
5 结语
本文通过对高速路交通流时间特性和空间特性的分析,深入分析了上下游断面间空间相互作用的延迟性,构建了基于多断面的BP神经网络预测方法。通过实例仿真结果及误差分析可知,该预测模型比只采用单一断面数据的交通预测方法提高了精度,验证了基于多断面的时空预测方法的有效性。
参考文献
[1]崔立成.基于多断面信息的城市道路网交通流预测方法研究[D].大连:大连海事大学图书馆,2012.
[2]Lin S L,Huang H Q,Zhu D Q, et al. The application of space-time ARIMA model on traffic flow forecasting[C]//Machine Learning and Cybernetics, 2009 International Conference on.IEEE, 2009, 6: 3408-3412.
[3]WU Y J,CHEN F,LU C T,SMITH B L,CHEN Y.Traffic flow prediction for urban network using spatio-temporal random effects model. 91st Annual Meeting of the Transportation Research Board . 2012
[4]Min W,Wynter L.Real-time rode traffic prediction with spatio-temporal correlation[J]. Transportation Research Part C: Emerging Technologies. 2011, 19(4): 606-616.
[5]邱世崇,陆百川,马庆禄.基于时空特性分析和数据融合 的交通流预测[J].武汉理工大学学报( 信息与管理工程版),2015,37(2):156-160,178.
[6]丁闪闪,王维锋,季锦章,等.基于时空关联和BP_Adaboost的短时交通参数预测[J].公路交通科技,2016,05: 98-104.
[7]杨兆升,邴其春,周熙阳,等.基于时间序列相似性搜索的 交通流短时预测方法[J].交通信息安全,2014,06:22-26+43.
[8]姚智胜,邵春福,熊志华,等.基于主成分分析和支持向量机的道路网短时交通流量预测[J].吉林大学学报(工学版),2008,01: 48-52.
[9]郭伟,姚丹亚,付毅,等.区域交通流特征提取与交通状态评估方法研究[J].公路交通科技,2005(7):101-104.
[10]Messai N., Thomas P., El Moudni A. et al. Feed-forward and RTRL neural networks for the macroscopic traffic flow prediction and monitoring: the potential of each other[M]. 2003: 199-204.
[11]王秋平,舒勤,黄宏光.关于交通流量数据预测建模研究[J].计算机仿真,2016,02:194-197+464.
[12]贺国光,冯蔚东.基于R/S分析研究交通流的长程相关性[J].系统工程学报,2004,02:166-169.
[13]赵婷婷,张毅,周,等.城市路网交通流的空间相关性[J].清华大学学报:自然科学版,2011,51(3):313-317.
[关键词] 光伏系统;发电量预测;模糊神经网络
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 13. 077
[中图分类号] TM615 [文献标识码] A [文章编号] 1673 - 0194(2017)13- 0180- 04
0 引 言
目前光伏发电量预测的方法主要有神经网络法、灰色预测法、多元线性分析法这三种方法,通过对这三种预测模型进行比较,发现多元线性回归和灰色理论虽然方法较为简单,但是预测误差也较大,而神经网络法预测则可以比较准确但是预测过程较为繁杂。在基于神经网络的预测中,多是以传统的BP神经网络为基础模型,在此基础上采用一些新的方法对BP网络加以改进。例如在BP网络的学习过程中采用Fletcher-Reeves共轭梯度算法,可以提高学习率,部分地简化了预测过程,但输入量过多,且预测的局限性较大。
在对比了众多方法的优缺点之后,发现BP神经网络普遍存在中间隐层数难以确定、输入数据量过多,且学习时间过长等劣势。因此本文提出了一种基于模糊神经网络的预测模型,所选取的输入量是和当天的发电量相关程度比较大的当天的平均气温以及当天的总日照量,模糊神经网络的结构是由大量的先验知识而设计出来的。在不影响预测精度的情况下,为了降低整个网络的复杂程度,对整个网络的模糊化层中的隶属度函数及去模糊化层的输出函数都做了适当的变化,解决了传统神经网络收敛速度慢的问题,从而使整个神经网络结构简洁,训练速度较快,且预测精度较高。
1 模糊神经网络
模糊神经网络是在神经网络和模糊系统的基础上发展起来的,在模糊神经网络出现之前,神经网络与模糊系统都已有了多年的研究历史,都有着较完备的理论基础。
模糊神经网络是一种将模糊逻辑推理的知识性结构和神经网络的自学习能力结合起来的一种局部逼近网络,融合弥补了神经网络在数据处理方面的不足和模糊逻辑在学习方面的缺陷,是一个集语言计算、逻辑推理、分布式处理和非线性动力学过程为一身的系统。因此,它具有处理不确定信息的模糊推理能力和依据样本数据进行学习的能力。模糊神经网络主要利用神经网络结构来实现模糊推理,从而使神经网络的权值具有在模糊逻辑中推理参数的物理意义。
常见的模糊神经网络有基于Mamdani推理的和基于Takgai-Sugeno推理的这两种模糊神经网络。基于Mamdani推理的模糊神经网络多用于模糊逻辑控制器、模糊逻辑决策系统、模糊逻辑辨识系统等方面;基于Takgai-Sugeno推理的模糊神经网络则是一种非线性模型,宜于表达复杂系统的动态特性。光伏系统的发电量由于受日照量、温度、湿度、材料转换率等多方面因素的影响,因此,光伏系统的输出是一个不稳定的非线性变化的动态工程,所以本文所采用的就是基于Takgai-Sugeno推理的模糊神经网络(简称TS模糊神经网络)。
2 TS模糊神经网络
2.1 TS模糊逻辑
在TS模糊逻辑系统中,模糊规则有着如下的特殊形式:
R(1):if x1 is F1l,…,if xnis Fnl then
y l=P0l+P1lx1+…+Pnlxn
3 预测模型的建立
3.1 输入量的确定
光伏电池之所以能发电,是由于当阳光照射到半导体材料的太阳能电池板上时,光能被吸收在太阳能电池内,并且产生电子(-)和空穴(+),而负价的电子多向n型聚集,正价的空穴多向p型聚集,因此,将太阳能电池的正面和背面接上电极与灯泡等负荷连接,就能产生流。因此,日照量是影响光伏发电发电量的重要因素之一,所以日照量应作为输入量之一。此外光伏发电的发电量还受温度、湿度、安装角度、材料转换率等众多因素的影响,在这众多因素中,温度对光伏发电量的影响是较大的,因此将温度作为另一个输入量输入到预测模型中。
本文的输入量为日照量与温度组成的一个2×1的列向量,因为本文所预测的是晴天一整日的发电量(单位kW・h/日),因此,日照量取一整日的日照量(单位kW・h/日),温度取一整日的平均温度(单位℃)。若输入向量用x表示,一整天的日照量用h表示,温度用t表示,则输入量可表示为下面的形式:
x=[h,t]T
3.2 TS型模糊神经网络结构与初始参数的确定
本文是针对全年晴天的当天发电量做出预测的,所以按季节划分将全年的数据划分成了春、夏、冬,由于秋天的日照量与温度和春天的接近,所以在本文中并没有单独列出秋季,而是只按春、夏、冬三季的数据来建模预测。
由已有的先验知识,可将数据按照春、夏、冬三季进行划分,所以模糊神经网络的规则层的隐层节点数也就为三,由于规则层已经确定,故可以知道模糊化层与去模糊化层的隐层节点数均为三个,因此可知本文的模糊神经网络的预测模型结构如图2所示。
3.3 TS型模糊神经网络学习算法
设有输入、输出样本为{(xl,dl),l=1,2,…,L},在这里L表示训练样本的数量,为输入向量,在本文中表示由当天日照量与当天平均温度组成的一个2×1的列向量。将网络误差E设为:
E=■(yl-dl)2-||y-d|22
其中,y=[y1,y2,…,yL]T,表示神经网络的实际输出;d=[d1,d2,…dL]T,表示神经网络的期望输出;||.|2表示向量的2范数。
本文中,在不影响结果的前提下,为了降低神经网络学习算法的复杂度,故将隶属度函数变为:
ωij=exp-■(bij(xil-cij))2
将神经网络的输出函数变为:
yl =■ωij=(p0j+p1jx1l+…+pnjxnl)
因为本文是在MATLAB中进行编程预测,所以将各种数据都表示成矩阵的形式,通过对矩阵的处理,使模糊神经网络的理解难度和操作难度都大大降低,因此,规定X=[x1,x2,…,xL]表示输入样本组成的n×L维矩阵;Ω=[ω1,ω2,…,ωL]表示输入样本X的隶属度函数值ωl j所组成的m×L维矩阵;P=[p0,p1,…,pn]表示线性系数pi j所组成的m×(n+1)维矩阵;C=[c1,c2,…,cm]表示中心ci j所组成的n×m维矩阵;B=[b1,b2,…,bm]表示中心宽度bi j所组成的n×m维矩阵。
在训练神经网络时,首先计算隶属度函数值ωl j所组成的矩阵Ω=[ω1,ω2,…,ωL],在此基础上计算神经网络的输出y及相应的误差E;然后计算误差E对系数矩阵P,B,C的偏导数,根据梯度下降法更新P,B,C;最后利用P,B,C来更新Ω,E等参数。如果未达到退出条件,则继续迭代,达到了,则退出整个迭代过程,最终,就可以完成整个模糊神经网络的训练。在MATLAB中矩阵P和B的初始值可以由normrnd函数随机生成,而矩阵C则可以由kmeans函数得到相应的初始聚类中心,通过训练数据的学习过程,得到一个符合要求的模糊神经网络。
4 预测模型的训练与结果分析
为了使模糊神经网络的训练有较高的精度,需要大量的数据对模型进行评估训练,本次模拟采用了120组数据进行预测,其中90组作为训练样本,30组作为测试样本,所用的数据均是随机模拟5kW光伏逆变器日发电量数据, 在训练过程中,共取了90组数据来训练,因此L=90;而规则数共有3条,因此这里m=3;而输入的是有温度与日照量组成的两行一列的列向量,因此n=2;为了使训练结果更加精确化,这里O置的最大迭代步数为1 000,迭代步长为0.001,图3是训练预测结果与实际结果的折线图。
在图中,实线表示预测输出,用“+”表示实际输出,而用虚线表示实际输出与预测输出之间的差值,从图中可以明显看出训练好的模糊神经网络符合要求。随后,再将用于测试的数据带入已训练好的模糊神经网络中,结果如图4所示。
图4是用于测试的数据的实际输出与预测输出的比较,“+”表示实际输出,实线表示预测输出,虚线表示实际输出与预测输出的差值。从预测的结果来看,相较于传统的预测方法来说,本文所提出的模糊神经网络的预测方法,不论是在预测精度上还是在训练收敛速度上,都有一定程度的提高,虽说本文的原始数据并非实测数据,但是本文所用的数据皆是参考了大量资料之后拟合出的数据,所以有实际参考价值。
5 结 语
为了提高光伏并网系统的稳定性与安全性,本文提出了一种基于模糊神经网络的电量预测模型。根据光伏系统的发电原理与大量的研究资料,确定了以每一天的日照量与平均温度为整个系统的输入量,来对这一整天的光伏系统的发电量做出预测,并且根据已有的先验知识与相关理论,确定了本文所用的模糊神经网络的结构。再通过拟合的符合实际的数据来训练整个模型,最后通过一组测试数据来测试本预测模型是否达到要求。实验结果表明,本模型能较为准确地预测出光伏发电系统一整天的发电量,具有一定的工程应用价值。
主要参考文献