前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络回归算法主题范文,仅供参考,欢迎阅读并收藏。
【关键词】粒子群算法;神经网络模型;股票预测
一、引言
广义回归神经网络(简称GRNN神经网络)是一种基于非线性回归理论的前馈式神经网络模型,具有局部非线性逼近能力强、收敛速度快等特点,是股票预测中常用的神经网络预测之一.由于平滑因子对网络的性能影响比较大,需要不断尝试才能获得最佳值.本文采用粒子群算法优化GRNN神经网络,通过自动调整连接权值及平滑因子,使结果达到最优,建立了PSO-GRNN神经网络模型,对我国三支热门股票上海电力(代码:600021)、中信证券(代码:600030)和中国石化(代码:600028)进行预测.
二、基于粒子群算法的GRNN神经网络及其应用
(一)粒子群算法
粒子群算法(PSO算法)是由Kennedy和Eberhart提出的,通过模拟鸟群飞行觅食过程中的协作行为,使群体达到最优.首先初始化一群随机粒子,其中第i个粒子在D维解空间的位置和速度分别表示为Li=(li1,li2,…,liD),Vi=(vi1,vi2,…,viD),通过迭代搜索产生粒子最优解.每一次迭代,粒子从初始到当前迭代次数搜索产生的最优解为粒子的个体极值Pbest,粒子种群当前的最优解,即所有粒子的最优位置,称为全局极值gbest.第i个粒子通过两个极值更新自己第d维(1≤d≤D)的位置lid和速度vid.
步骤1初始化.确定各个参数并随机初始化种群中粒子的位置和速度,并设定位置的范围[-Lmax,Lmax],速度的范围[-Vmax,Vmax].将每个粒子的Pbest设置为当前位置,gbest值设置为初始群体中适应值最好的粒子位置.
步骤2判断粒子是否达到个体极值.如果满足,转步骤5;否则,转步骤3.
步骤3更新粒子的位置和速度.
步骤4更新粒子的Pbest值和gbest值.对每个粒子,如果适应值小于Pbest的适应值,则Pbest设置为当前位置;如果粒子适应值小于gbest的适应值,则gbest设置为当前位置,转步骤2.
步骤5记录gbest,算法结束.
(二)基于PSO的GRNN神经网络算法
步骤1提取目标输入矢量,并做归一化处理,利用公式计算.xj(i)=xj(i)1max(xj(k)),k=1,2,…,N,式中,xj(i)表示第j个神经元的第i个输入值,N表示有N个训练样本.
步骤2随机初始化种群,设定种群规模为20,初始化粒子速度和位置,设定位置的范围[-Lmax,Lmax]和速度的范围[-Vmax,Vmax].
步骤3将粒子群中每一个体的分量映射为GRNN神经网络的参数,构成一个GRNN神经网络,对每一个GRNN神经网络输入训练样本进行训练,并计算每一个粒子在训练集上的均方误差和作为适应度值.均方误差公式如下:fi=e=11n∑n1i=1(yij-ij)2.其中,N为训练样本容量,yij表示训练样本实际值,ij表示预测模型的输出值.
步骤4根据每一个体的适应度值砥兰勖扛隽W拥乃阉魑恢茫计算当前每个粒子的个体极值和种群全局极值.
步骤5判断是否满足条件.如果达到最大迭代次数或均方误差达到最初设定值,则结束粒子搜索.否则转到步骤3,重复迭代优化,更新粒子速度和位置.
步骤6输出最优粒子位置,将每一个个体的分量映射为GRNN神经网络的平滑因子和权值,对神经网络的输入样本进行预测.
步骤7算法结束.
三、利用MATLAB工具实现结果
为了确保PSO-GRNN神经网络预测的精确度,我们选择了3组训练数据,每组数据都是从2012年3月29日到2012年4月16日的250天的收盘指数.PSO-GRNN神经网络模型中动量因子取α=0.05,β=0.55.粒子种群规模为20,粒子维数为12,学习因子c1=c2=2,惯性权值的初始值0=0.9,最大迭代次数为250次.为了检验神经网络的泛化能力,我们引入三种评价指标:
均方根误差:MSE=11n∑n1i=1(yi-i)2.
平均绝对误差:MAE=11n∑n1i=1|yi-i|.
平均绝对百分比误差:MAPE=11n∑n1i=1|yi-i|1|yi|×100%.
其中,yi表示训练样本实际值,i表示预测模型的输出值.平均绝对误差(MAE)和平均绝对百分比误差(MAPE)都是衡量预测结果偏离实际的指标,MAE(或者MAPE)值越大,预测误差越大;均方根误差(MSE)能较好地预测效果,MSE值越小,预测效果越好.
经过PSO-GRNN模型和GRNN模型对所选三组数据的训练,两种模型对比结果见下表.在模型样本相同,初始因子相同的情况下,PSO-GRNN模型对样本的预测精度明显优于GRNN模型,泛化能力更强.
关键词:BP神经网络算法;货运量;预测模型;实证分析
中图分类号:F252 文献标识码:A
交通运输系统是国民经济大系统中的一个子系统,运输需求同时受到来自系统内部和系统外部因素的影响,同时又反作用于国民经济系统[1]。其中,货运量是反映运输生产成果,体现运输系统为国民经济服务数量的重要指标[2],它作为衡量一个国家或地区经济发展的重要经济指标,愈加受到人们的重视,如何正确、有效地根据相关影响因素做出货运量预测,对于物流产业的发展具有至关重要的作用。
货运量预测具有较大的复杂性和非线性等特点[3],进行货运量预测的方法很多,常用的方法包括时间序列法、回归分析法和灰色系统法等,这些方法都集中在对其因果关系回归模型和时间序列模型的分析上,所建立的模型不能全面和本质地反映所预测动态数据的内在结构和复杂特性,从而丢失了信息[4]。人工神经网络具有良好的曲线拟合能力、学习能力、抗干扰能力[4-5],采用BP神经网络方法,建立货运量预测模型,具有更好的说服力。
近几年来,在国家政策的大力扶持和倾斜下,整个新疆的经济社会发展都步入了快车道。经济社会的快速发展,对相应的物流能力提出了更高的要求。现有的南疆兵团物流企业已经难以满足其经济快速高效发展的需要,日益成为制约南疆兵团经济快速发展的瓶颈。科学合理地预测南疆兵团物流企业的货运量以对其物流能力进行客观评价,对于优化配置南疆兵团有限的物流资源,实现南疆兵团物流企业的可持续发展,具有重要的现实意义和实践价值。
1 BP神经网络算法与模型
近年来,全球性的神经网络研究热潮再度兴起,不仅仅是因为神经科学本身取得了巨大的进展,更主要的原因在于发展新型计算机和人工智能新途径的迫切需要。迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制。另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径[6],它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注。
目前,已发展了几十种神经网络, 例如Hopficld模型、Feldmann等的连接型网络模型、Hinton等的玻尔茨曼机模型,以及Rumelhart等的多层感知机模型和Kohonen的自组织网络模型,等等[6]。神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于20世纪50年代,但一直进展不大。直到1985年,Rumelhart等人提出了误差反向传递学习,即BP算法[7],实现了Minsky的多层网络设想,如图1所示。
BP算法不仅有输入层节点、输出层节点,还可有一个或多个隐含层节点。对于输入信号,要先向前传播到隐含层节点,经作用函数激励后,再把隐含层节点的输出信号传播到输出节点,最后给出输出结果。节点的作用激励函数通常选取S型函数,如:
式中Q为调整激励函数形式的Sigmoid参数。该算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。每一层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出,则转入反向传播,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。
从上述BP算法可以看出,BP模型把一组样本的I/O问题变为一个非线性优化[8],是优化中最普通的梯度下降法。如果把神经网络的看成输入到输出的映射,则这个映射是一个高度非线性映射。
设计一个神经网络专家模型的构成和学习算法的选择,一般来说,是根据所研究领域及要解决的问题确定的[6]。通过对所研究问题的大量历史资料数据的分析及目前的神经网络理论发展水平,建立合适的模型,并针对所选的模型采用相应的学习算法,在网络学习过程中,不断地调整网络参数,直到输出结果满足要求为止。
2 货运量预测模型与实证分析
基于上述BP神经网络算法与模型,结合新疆兵团各师物流实际,构建南疆兵团各师货运量的预测模型,采用Matlab软件编制程序(见附录),将2006~2010年间的各师货运量数据[9]代入Matlab程序中,以对南疆兵团各师货运量加以预测。下面对Matlab中神经网络训练函数的训练步数、收敛精度及误差加以比较,通过反复训练来确定最佳的BP神经网络训练函数[8],以此来确定最优的货运量BP神经网络模型。
通过运行程序,得到训练均方误差曲线图如图2:
由图2可看出,误差训练值接近10e-2,而目标训练值为10e-7,说明经过2 000次步长训练,均方误差逐渐趋于目标值,训练结果非常小,结果较满意。同时,得到训练梯度及有效性检查曲线图如图3:
由图3可得出,训练梯度为0.00021324,检查错误几乎为0,说明经过2 000次步长训练,在这期间训练梯度变化不大,且错误趋于0,进一步说明预测结果较好。与此同时,得到训练回归曲线图如图4。
由图4可得到,目标训练值R=0.99983,趋于1,说明回归训练效果较好,预测精度较高,而同时回归曲线近似趋于一线性函数,其训练起点和终点(图中黑点)与源数据(白圆点)都很好的分布在曲线两侧,由此可见,运用BP神经网络仿真的效果十分理想,训练后的BP网络能很好地逼近给定的目标函数,据此表明训练效果很好。由此可见,所建模型与实际吻合度较高,模型结果具有可信度和说服力。
3 结果分析
通过运行BP神经网络程序,求得2006~2010年南疆兵团各师货运量的的预测值,将之与实际值放在一起进行比较,汇编结果如表1。
由表1可以看出,南疆兵团各师货运量持续上升,而且增加幅度逐年加快。事实上,近年来随着新疆经济社会的快速发展,南疆兵团各师的货运量呈现一个较大程度的逐年递增,这一点是符合客观事实的。
通过南疆兵团各师货运量的预测值和实际值的比较分析,发现预测值与实际值之间相对误差较小,位于0.8%~7.8%之间,平均相对误差约为4.45%,误差达到通常的精度要求10e-2,计算精度较高。由此可见,通过BP神经网络算法建立的南疆兵团各师货运量预测模型,所得结果符合计算精度要求,而且泛化能力较好,模拟结果比较可靠,与实际吻合度较高。
4 结 论
本文通过对近几年南疆兵团各师货运量的分析,合理地设计了BP神经网络结构;同时,通过比较Matlab中神经网络训练函数的训练步数、收敛精度及误差,反复训练并确定了最佳的BP神经网络训练函数;并以2006~2010年南疆兵团各师货运量数据为基准,建立南疆兵团各师货运量的预测模型,采用Matlab提供的神经网络工具箱编程求解,得到相应的南疆兵团各师货运量的预测值,通过实际值与预测值的比较,发现二者之间的相对误差较小,所得结果具有较好的说服力和可信度。
本文的研究结果,对于南疆兵团地区优化配置物流资源,引导地方政府决策提供理论依据,具有重要的现实意义和实践价值。人工神经网络具有良好的曲线拟合能力、学习能力、抗干扰能力,采用BP神经网络算法,建立相应的预测模型,所得结果因与实际吻合度较高,而具有较好的可信度。BP神经网络算法,可以广泛地应用于复杂经济系统的评价与预测工作。文中所采用的建模思想方法,还可以广泛地应用于其他复杂经济系统的建模工作,具有一定的普遍性,有着良好的应用推广价值。
参考文献:
[1] 王振军. 交通运输系统工程[M]. 南京:东南大学出版社,2008:13-17.
[2] 张艳云,艾力·斯木吐拉. BP神经网在新疆货运量预测中的应用[J]. 运输与物流,2011(17):144-147.
[3] 许银甲. 公路货运量预测的系统动力学模型构建[J]. 交通科技与经济,2007,9(6):95-97.
[4] 赵闯,刘凯. 基于广义回归神经网络的货运量预测[J]. 铁道学报,2004,26(1):12-15.
[5] 徐优丽. 基于神经网络的物流需求预测[J]. 浙江树人大学学报,2008(1):56-58.
[6] 飞思科技产品研发中心. MATLAB6.5辅助神经网络分析与设计[M]. 北京:中国统计出版社,2003:64-69.
[7] 高宁,邵陆寿. 基于MATLAB的BP神经网络在农作物预报中的应用[J]. 计算机与农业,2003(7):16-18.
【关键词】传感器;智能化;神经网络;自补偿
【基金项目】论文受到成都信息工程大学校级项目KYTZ201521,Y2013062,Y2015015以及“传感器与检测技术”精品课程建设项目的资助。
一、引言
现代传感器技术是在传统传感器技术的基础上发展而来,广泛结合了信息处理技术、通信技术及微电子技术等[1],将传感器提升至 “系统”级别。
开设现代传感器技术课程,需要在具备经典传感器知识的基础之上,进一步掌握智能传感器的相关知识,了解集成电路工艺、统计学习理论和现代信号处理技术等[2]。该课程的内容涉及智能传感器系统的硬件构成,智能化功能的软件实现方法,以及多元回归分析法、神经网络技术和支持向量机技术等数据挖掘方法。学生可以通过自主设计型实验加深对智能传感器的理解。而智能传感器的软件实现和数据挖掘方法的仿真都具备充分的灵活性,学生可以结合PC机在课堂上和课后进行实验研究[3]。
二、自主设计实验
现代传感器技术的课程介绍了新型智能传感器的概念、构成方式及具有的功能,重点在于智能传感器的集成化和智能化实现方法。
智能传感器集成化的实现涉及微电子技术等相关内容,对于非微电子专业的学生来说很难具备此方面的扎实基础,不易开展自主设计型实验。并且此部分内容的相关实验对硬件要求较高,不利于在不同专业和高校的推广。
智能传感器智能化的实现方式多样,有硬件实现,也有软件实现。软件实现方法包括神经网络技术、支持向量机技术、粒子群算法和小波分析等数据挖掘方法中的智能算法。这些智能算法的仿真工具众多,算法设计灵活且多样,可以让学生在完成课程实验的同时,通过自主设计进一步发掘算法的优化方法,加深对知识的理解。
本论文将举例说明现代传感器技术课程在智能传感器智能化实现方面的自主设计实验的开设方法。
例如,开设题为“基于神经网络方法的传感器温度自补偿模块设计”实验。对于会受温度影响的传感器,要降低工作环境温度的影响,就需要设计自补偿模块,补偿的方法有多种,这里选用神经网络方法。首先,学生需要选定实验对象,即传感器,比如某款压阻式压力传感器,然后获取不同温度状态下传感器静态标定数据,根据标定数据制作样本,输入到神经网络。学生可以根据需要选择不同的神经网络,比如BP神经网络和RBF神经网络等[4]。实验编程时可于利用现有的工具箱进行辅助编程,也可以完全自行编程。
以上实验只考虑了温度这一个干扰量的影响。通常影响传感器的不止一个干扰量,还可能存在两个或多个干扰量的影响。神经网络方法可以用来降低两个或者是多个干扰量的影响。此外,学生还可以用支持向量机技术来设计智能化软件模块,用于降低多个干扰量的影响。例如,可开设题为“基于支持向量机方法的降低多个干扰量影响的传感器智能模块设计”。该实验的过程是先选定存在交叉敏感的传感器作为实验对象,进行多维标定实验获取样本数据,再利用支持向量机方法建立数据融合模型,从而消除或是降低多个干扰量的影响。支持向量机的功能包括分类和回归等,因此学生还可以结合其分类的功能设计其他传感器智能模块。
学生在进行智能算法的课程实验时,可以选择自带工具箱中丰富的仿真工具,也可以自行编程实现算法。本论文采用Matlab软件为仿真工具实现算法。
三、实验示例
(一)基于神经网络方法的传感器温度自补偿模块设计
本实验选定压阻式压力传感器作为实验对象,目标如下。
1.基于神经网络技术设计温度补偿模块,消除工作环境温度对传感器的影响。
2.实验过程需对多个样本进行实验,提高补偿模块的适应性,即在满足压力量程的情况下对不同的工作温度进行补偿。
3.温度补偿模块的设计可以使用多种神经网络方法,并进行对比,得到消除温度影响最好的方法。
实验步骤如下。
1.二维标定实验
用标定实验来获取原始实验数据。由于实验条件和实验时间的限制,有些学生无法进行此步骤。学生也可以通过教材或者相关论文来获取原始数据,但是必须在实验报告中注明数据的来源。
2.数据预处理与样本制作
用上一步中获取的原始数据来制作样本。通常先将原始数据进行归一化处理,用归一化之后的数据制作样本。神经网络的样本包括训练样本和测试样本。
3.训练神经网络
将训练样本输入到编好的神经网络算法,可以是BP神经网络和RBF神经网络等,得到训练后的模型。
4.测试神经网络
用测试样本检验训练好的神经网络模型。如果得到的效果不好,可以适当地调整神经网络的参数,改善补偿效果。
5.更换训练样本和测试样本后重复第三和第四个步骤
不同样本得到的结果往往差异较大,实验中需要更换训练样本和测试样本后进行多次重褪笛椋用以提高神经网络模型的适应性。
6.换一种神经网络方法重复第五个步骤
同一样本采用不同的神经网络方法可能得到不同的补偿结果,实验中可以尝试对比不同的神经网络方法,或者通过优化神经网络的方法改善补偿效果。
(二)基于支持向量机方法的降低多个干扰量影响的传感器智能模块设计
本实验的目标如下。
1.利用支持向量机的处理分类和回归问题的功能,对传感器交叉敏感的数据进行分析,用以抑制交叉敏感现象。
2.尝试修改支持向量机的程序,例如更换核函数或改变分类策略,得到不同的测试结果。
3.制备多组样本数据,对不同的样本数据进行测试,用以检验算法的适应性。
实验步骤如下。
1.样本数据制作
根据确定的实验对象,采集或制备样本数据。制作好的样本数据将分为训练样本和测试样本两部分。训练样本与测试样本的格式保持一致。
2.算法设计
利用支持向量回归(Support Vector Regression,SVR)或支持向量分类(Support Vector Classification,SVC)算法,处理样本数据。利用多种策略测试算法优劣。
例如在支持向量分类算法中,有两种处理多分类问题的策略, 一种是“一对一(one agaist one, 1A1)”, 另一种是“一对多(one agaist all, 1AA)”。实验中可测试不同策略的算法。支持向量机可选取多种核函数,包括线性核函数、多项式核函数和径向基(Radial Basis Function,RBF)核函数等。目前尚缺乏一种选取核函数的标准方法。实验中可以通过更换核函数来测试它们的不同效果,用以选取最优的方案。
可以采用不同的支持向量机工具箱,例如SVM and Kernel Methods Matlab Toolbox工具箱,或者自行编程。
在算法设计的过程中,通过对训练样本进行训练和对测试样本进行测试,得到每一次的结果。同一算法必须经过多个训练样本和测试样本的检验。更换算法策略后,再重复以上步骤。
3.效果评价
用抑制交叉敏感的结果对比最初的传感器数据,对算法效果进行综合评价。
(三)实验方案
结合以上实例,可以设计出自主实验的方案,具体如下:自行查阅资料进行神经网络分析法和支持向量机法的设计,两种算法选择其一即可。
实验步骤如下:(1)安装matlab软件;(2)熟悉matlab软件的使用方法;(3)查阅资料进行项目设计;(4)选取神经网络分析法和支持向量机法之一进行项目设计;(5)根据设计要求编写算法,并仿真;(6)对算法效果进行综合评价。
需要注意的是,利用神经网络分析法和支持向量机法在智能传感器系统的智能化功能实现方法上进行项目设计的时候,数据来源要有出处,应用范围要明确。
四、结论
现代传感器技术课程通过开设自主设计型实验可以提高学生的学习兴趣,加深学生对知识的理解。该课程涉及的神经网络技术、支持向量机技术、主成分分析和小波分析等方法可以较为灵活地开设自主设计实验,加强学生的动手能力。本论文以“基于神经网络方法的传感器温度自补偿模块设计”实验为例说明了自主设计实验的方案。实验采用Matlab软件设计,方案可行。
【参考文献】
[1] 张鹏,吴东艳,张凌志.项目教学法与传感器课程改革探索[J]. 中国电力教育,2014(05):78-79.
[2] 王兴君,毛敏.智能传感器课程建O及教学研究[J]. 电子测试,2016(07):172-173.
关键词:logistic回归 BP神经网络 上市公司 信用风险
在经济全球化的趋势下,信用将成为主要的交易方式,金融危机的爆发更是显示出信用风险管理和信用风险分类的重要性。从20世纪60年代至70年代的统计学方法,20世纪80年代的专家系统到90年代的神经网络,各种信用风险评级方法层出不穷。在我国,信用风险的度量和管理较为落后,金融机构没有完善有效的评级方法和体系,目前所应用的方法主要是粗略的定性方法,如综合利用宏观经济与行业风险、所有权及治理结构、信用风险及其管理、市场风险及其管理、资金来源/流动性、盈利能力等进行“加权”加分,信用风险的度量模式显得比较单一,所以对于信用风险分类方法是学术界和实务界必须解决的课题之一。
一、文献综述
(一)国外文献Logistic模型最早是由Martin (1977)用来预测公司的破产及违约概率。他从1970年至1977年间大约5700家美联储成员银行中界定出58家困境银行,并从25个财务指标中选取总资产净利润率等8 个财务比率,用来预测公司的破产及违约概率,建立了Logistic回归模型,根据银行、投资者的风险偏好设定风险警界线,以此对分析对象进行风险定位和决策。同时还将Z-Score模型,ZETA模型和Logistic模型的预测能力进行了比较,结果发现Logistic回归模型优于Z- Score模型和ZETA模型。Madalla (1983) 则采用Logistic模型区别违约与非违约贷款申请人,其研究结果表明,当违约概率p>0.551时是风险贷款;当p
(二)国内文献 在国内的研究文献中,齐治平(2002)从我国沪、深两交易所选取164 家上市公司,然后随机分成两组,运用线性判别模型、Logistic 回归模型以及含有二次项和交叉项的Logistic 模型对数据样本提前两年进行预测。结果发现,含有二次项和交叉项的Logistic模型对前一年数据的预测准确率最高。吴世农(2003)使用剖面分析、单变量分析、线性概率模型(LPM)、Fisher二类线性判定、Logistic模型等统计方法对财务困境公司进行预测研究,其中Logistic模型对前一年数据的预测准确率达到93.53%,Fisher判别分析法和LPM的准确率都为89.93%。庞素琳(2003)利用多层感知器分别对我国2000年106家上市公司进行信用评级,信用评价准确率高达98.11%。本文即是从上市公司的财务指标入手,通过logistic回归分析和BP神经网络,构建衡量企业信用状况的模型,并通过实证研究考察模型的适用性,对比两者信用风险分类的准确度。
二、研究设计
(一)样本选取和数据来源本研究选取沪深两市A股市场上2005年至2007年三年中部分被进行特别处理的118家ST公司和126家非ST公司,数据主要来源于CSMAR深圳国泰安信息技术有限公司提供的财务指标数据,将118家ST公司的财务数据和126家非ST公司的财务数据划分为训练样本和测试样本。样本集选取如(表1)所示。
(二)变量选取本文采取的财务数据在参考了已有文献以及考虑到实际数据可得性的基础上,选取了能够反映短期还款能力,长期还款能力,盈利能力和营运能力4方面共12个财务指标。指标变量名称及自变量符号具体见表。因变量为0-1变量,信用级别高的设置为1,信用级别低的设置为0。在做logistic回归的时候会进一步运用向后筛选法剔除方差贡献率不大的指标变量。具体如(表2)所示。
(三)模型设定
(1)Logistic回归模型:
(2)多层次前向神经网络。本文所应用的是一种称为前向网络的特殊神经网络结构。本研究应用Rumehhart于1986年提出的如下函数:Ii=wijxj+?准,xi=fi=其中,Ii为神经元i的层输入,xi为神经元的输出,wij为神经元间的连接权,?准为神经元i的偏置。每一条连接弧都被赋予一定的数值来表示连接弧的连接强度,正的权值表示影响的增加,负的权值表示影响的减弱。在前向网络中,神经元间前向连接,同层神经元互不连接,信息只能向着一个方向传播。前向网络的连接模式是用权值向量W来表示的。在网络中,权值向量决定着网络如何对环境中的任意输入作出反应典型的学习算法是搜索权值以找到最适合给定样本的权值。在本研究中应用的是多层前向网络的BP算法,其主要作用是知识获取和推理,采用有导师学习的训练形式,提供输入矢量集的同时提供输出矢量集,通过反向传播学习算法,调整网络的连接权值,以使网络输出在最小均方差意义下,尽量向期望输出接近,通过修改各层神经元的连接权值,使误差减小,然后转入正向传播过程,反复循环,直至误差小于给定的值为止。本文建立的BP神经网络图(见图1)。本文建立财务困境神经网络预警模型主要考虑以下两方面的问题:一是确定网络结构;二是学习参数的调整。首先考虑网络结构的确定。网络结构主要包括连接方式、网络层次数和各层结点数。网络的连接方式代表了网络的拓扑结构,Lippmann(1987)证明在一定条件下,一个三层的BP神经网络可以用任意精度去逼近任意映射关系,而且经过实验发现,与一个隐层相比,用两个隐层的网络训练并无助于提高预测的准确。因此在本研究中采用单隐层的BP网络。各隐含层节点数的选择并无确定的法则,只能结合实验并根据一些经验法则:隐层节点数不能是各层中节点数最少的,也不是最多的;较好的隐层节点数介于输入节点和输出节点数之和的50%~75%之间;隐层节点数的理论上限由其训练样本数据所限定。
三、实证结果分析
(一)logistic模型的参数估计及结果常规的线性判别模型计算得到的Z值只是个抽象的概念,无法从经济学上进行解释,Logistic回归分析解决了这个问题,其前提假设符合经济现实和金融数据的分布规律,残差项小要求服从止态分布。本文运用SPSS自带的Wald向后逐步选择法筛选变量,提高模型的判别性能,从全变量模型开始,逐步提出对残差平方和贡献最小的变量,具体的回归结果见(表2)。以2005年为例,根据SPSS计算结果中的参数表,估计Logistics模型的判别方程,(表3)反映了最大似然迭代记录(显示最后的迭代过程),(表4)反映了参数估计结果。步骤9是经过9步变量筛选后最后保留在模型中的变量。从各个系数的Wald值及伴随概率p来看,最终选定的5个指标变量具有最高的解释能力。综上,2005年公司分类的logistic模型为:p=。从(表5)步骤1及步骤9的分类结果看出,剔除不显著变量之后,分类准确率并未大幅下降,可以认为最终的模型能通过检验。(表6)显示了最终的Logistic模型参数估计结果。(表7)显示了模型分类准确率。
(二)BP神经网络的参数估计及结果首先对输入输出样本进行数据处理,消除影响预测结果的噪声,神经网络输入的变量要求规范在[-1,1](若使用tanh函数)或[0,1](若使用logistic函数)之间。本文对输入数据进行标准化处理,采用以下方法:X=。X为规范后的变量,x为每个变量的实际值,x1为每个变量的最小值,x2为每个变量的最大值。Matlab中相应的函数为[output_X,PS]=mapminmax(X,output_min,outpt_max)由于实际财务困境评价往往非常复杂,企业财务状况的好坏与财务比率的关系常常是非线性的,而神经网络作为一种非线形建模过程,并不依赖判别模型的假设,能找出输入与输出的内在联系,因此本文决定尝试使用神经网络技术进行信用状况的分类研究,分为训练集和测试集两组对神经网络进行训练,过程如下:第一,输入层和输出层神经元数目的确定。第一层为输入层,采用判别分析得出的模型变量为输入变量,共有12个结点,每个结点代表相应的财务比率。第三层为输出层,用一个结点表示,训练导师值为0代表信用级别“差”的公司,1代表信用级别“好”的公司。第二,隐含层数和隐结点个数的确定。本文选择单隐层的前馈BP网络;通过学习逐步增加隐神经元数,训练反复调整。最后定为10个隐结点。第三,用训练集的数据训练这个神经网络,使不同的输入向量得到相应的输出值,当误差降到一个指定的范围内时,神经网络所持有的那组权数值就是网络通过自学习得到的权数值,即完成了神经网络的自学习过程。第四,输入待评价的样本(本文直接在输入矩阵中划分为训练),让训练好的神经网络输出企业财务状况的标志(0或1),即实现神经网络的模式分类。神经网络的初始权重由Matlab随机产生的。训练算法采用专用于模式分类的trainscg方法,各种训练参数见(表8)。由此看出,算法逐步收敛,最终达到误差标准见(表9)。
(三)两种模型比较分析 本文对Logistic和BP神经网络分别对我国上市公司的信用状况给予两类模式的评级,最终发现,Logistic和BP神经网络在我国市场上的分类效果相当(见表10)。主流观点认为,人工神经网络具有良好的模式识别能力,可以克服统计等方法的限制,因为它具有良好的容错能力,对数据的分布要求不严格,具备处理资料遗漏或是错误的能力。最为可贵的一点是人工神经网络具有学习能力,可以随时依据新准备的数据资料进行自我学习、训练、调整其内部的储存权重参数以应对多变的企业运作环境。但是本文得出的结果是:传统的Logistic方法和神经网络方法的分类效果相当。现代人工智能方法并未表现出理论上的优势。可能的原因是:网络不稳定,训练样本的仿真准确率很高,但对测试样本的仿真准确率会降低;解释性差,网络最终确定后,每个神经元的权值和阈值虽然已知,但不能很好地分析各个指标对结果的影响程度,对现实问题中的经营管理也就不能起到很好的借鉴作用;网络的输入个数与隐层节点个数的确定没有理论指导,只能通过经验确定。
四、结论
本文选取2005年至2007年部分被进行特别处理的118家ST公司和126家非ST公司,以其财务指标为样本,进行Logistic回归和BP神经网络分类,对这两种信用风险评判模型在中国市场做了实证研究。结果发现:两种模型均适用于中国上市公司两模式分类(ST和非ST公司),而BP神经网络在我国市场上并未体现其分类的优势,分类准确度和Logistic相当。即使如此,本文证实了Logistic和BP神经网络模型对于我国上市公司的评级还是有效的,能够为投资者的科学决策提供建设性的指导意见,使投资者理智地回避风险和获取收益。同时,该判别模型也有利于准确评价一个企业的信用状况,从而为银行等放贷机构提供决策依据。
参考文献:
[1]吴世农、卢贤义:《我国上市公司财务困境的预测模型研究》,《经济研究》2001年第6期。
[2]齐治平、余妙志:《Logistic模型在上市公司财务状况评价中的应用》,《东北财经大学学报》2002年第1期。
[3]庞素琳、王燕鸣、罗育中:《多层感知器信用评价模型及预警研究》,《数学实践与认识》2003年第9期。
关键词:智能传感器;回归分析法;人工神经网络;遗传算法;模拟退火算法
中图分类号:TP212.6 文献标识码:A 文章编号:2095-1302(2017)02-00-03
0 引 言
随着研究技术的不断深入及数字化和虚拟仪器的快速发展,科技与发展更多的成为时代主旋律。在这个信息化时代,人们的社会活动将主要依靠对各种信息资源的有效利用。为适应社会的进步,满足人们的日常需求,传感器渐渐成形,且越来越多的深入到现代科技和生活中。
传感器是指对系统特性和性能指标起决定作用的一种仪器。如果把计算机比喻为处理和识别信息的“大脑”,把通信系统比喻为传递信息的“神经系统”,那么传感器就是感知和获取信息的“感觉器官”。传感器能够感受或响应规定的被测量并按照一定的规律转换为某种可用输出信号的器件和装置,通常由敏感元件和转换元件组成[1]。它是人们获取自然领域中信息的主要途径与工具,是现代科学的中枢神经系统,是信息系统的源头,是现代科技的前沿技术,发展迅猛。传感器技术同计算机技术与通信技术一起被称为信息技术的三大支柱,许多国家已将其与通信技术和计算机技术放置于同等重要的位置。
现代传感器技术具有巨大的应用潜力,广泛的开发空间和广阔的发展前景。从最初的传统传感器逐渐发展为现在的智能传感器。智能传感器系统的实现是在传感器技术、计算机技术、信号处理、网络控制等技术的基础上发展起来的,并随这些技术的发展而发展。为了更大程度发挥传感器的性能,并提高传感器的精度,将多种传感器与回归方法、人工神经网络等计算智能方法和数据融合等信息处理方法相结合,广泛应用于越来越复杂的检测中,同时还实现了自校准等功能。
1 传感器技术的发展
传感器技术诞生于20世纪中期,与当时的计算机技术和数字控制技术相比,传感技术的发展呈落后趋势,不少先进成果仍停留在实验研究阶段,并没有投入到实际生产与应用中。然而,随着各国相关信息化产业的迅猛发展,以日本和欧美等国家地区为代表的传感器研发及其相关技术产业的发展已在国际市场中逐步占据了较为重要的地位[2]。
我国早在20世纪60年代开始涉足传感器制造业,由于技术基础薄弱,研发水平不高,大多引用国外的芯片进行改造和加工,自主研发的产品较少。经过从“六五”到“九五”的国家攻关,我国在传感器研究开发、设计、制造、可靠性改进等方面获得较为明显的进步,初步建立了传感器研究、开发、生产和应用的综合体系。
一个传统的传感器测量一个物理、生物或者化学参数,例如位移、加速度、压力、温度、湿度、氧气或一氧化碳含量可将其转换成一个电压或电流信号[3]。传统意义上的传感器的技术发展趋势主要有以下两方面:
(1)传感器本身的基础研究,即研究新型传感器;
(2)和电子技术、计算机技术及通信技术组合在一起的传感器系统的研究,即将新材料、新工艺与多种技术相结合,并向集成化、智能化及网络化方向发展。
2 智能传感器概述
2.1 智能传感器定义
智能传感器在本质上应定义为基于人工智能理论,利用微处理器实现智能处理功能的传感器[4]。它不仅可以对信号进行检测、分析、处理,也在一定程度上具备了人类的记忆、思维、交流能力,它集传统传感器与微处理器于一体并赋予其智能化功能。所谓的智能包括三个层次,即生物智能、人工智能和计算机智能。
(1)生物智能由人脑的物理化学过程体现出来,其物质基础是有机物;
(2)人工智能则是非生物的,基础是人类的知识和传感器测量得到的数据;
(3)计算智能是由计算机软件和现代数学计算方法实现的,其基础是数值方法和传感器测量得到的数据。
2.2 智能传感器的优点与功能
相比传统传感器,智能传感器主要有以下基本功能:
(1)具有自校准和故障自诊断功能;
(2)具有数据存储、逻辑判断和信息处理功能;
(3)具有组态功能,使用灵活;
(4)具有双向通信和标准化数字输出功能;
(5)人―机对话功能。
智能传感器具有灵敏度和测量精度高、量程宽、可靠性与稳定性高、信噪比与分辨率高、自适应性强、性价比高等优点,已被广泛应用于航天、国防、科技、生产等各领域中。
2.3 智能算法及其在智能传感器中的应用
某些传感器的特性可以预先用数学模型表示,但很多传感器特性却无法明确表达。在这种情况下,与其通过经验对电路网络作复杂的调整,不如对传感器特性作数学描述。就目前研究而言,基于计算智能方法的智能信息处理主要包括回归方法、人工神经网络、进化计算、模糊逻辑等计算智能方法和小波分析、数据融合等信息处理方法。各种智能算法具有以下共同特点:
(1)具有不确定性,因为大多考虑了随机因素,不少计算过程实际是在计算机上做随机过程的模拟;
(2)大多具有自适应机制的动力体系或随机动力体系,有时在计算过程中体系结构还在进行不断的调整;
(3)不具有特殊性,针对通用的一般目标而设计;
(4)不少算法在低维或简单的情况下显得“笨”,但到了高维复杂情形中就具有很强的适应性[5]。
高敏[6]等建立了二位回归方程,应用回归分析设计了硬件系统,实现了对电流传感器的实时温度补偿。史丽萍[7]等利用最小二乘法和切比雪夫不等式对传感器数据进行回归分析,得出了@两种方法误差较小且分布均匀,可被应用于传感器测试的结论。赵敏[8]等在设定温度下对传感器进行数据输入,并标定输出数据,采用神经网络算法对输出数据进行分析,得出了神经网络算法可对标定的温度数据和非标定的数据进行处理的结论。郝云芳[9]等运用遗传算法对传感器自校正方程中的待定常数进行计算,可准确反映出传感器的设计和实际信息的测定要求。陈华根[10]等对模拟退火算法的定位原理和定位应用进行了分析,得出模拟退火算法可以较好地应用于GPS定位的结论。
2.3.1 回归分析法
回归分析是以概率论与数理统计为基础,主要对随机现象统计资料进行分析和推断,用来确定两种或两种以上变量间相互依赖的定量关系,是数理统计中常用的方法之一。按照设计自变量的多少,可以分为一元回归和多元回归分析;按照自变量和因变量之间的关系类型,可以分为线性回归分析和非线性回归分析。
在一元线性回归中,假定因变量y是随机变量,自变量x是可以精确观察或严格控制的一般变量,建立回归方程y=β0+β1x+ε,其中β0、β1为回归系数,ε为随机变量,也称为剩余误差。一元线性回归问题的主要问题是依据(x,y)的n组观测数据(xi,yi)(i=1,2,…,n)给出回归系数β0、β1的估计值b0、b1,同时对β1做统计检验,以便指出这些估计的可靠程度,并在此基础上进行预测与控制等。
多元线性回归分析主要有以下几个主要步骤:
(1)根据研究的目的和内容确定被解释变量和解释变量,正确选择分析变量是得出正确结论的前提和基础;
(2)模型的设定,模型设定根据研究的对象与相应的理论加以确定;
(3)参数估计;
(4)模型的检验和修正;
(5)模型的运用。
回归分析方法可以与智能传感器数学模型结合使用,以传感器测得的输入值或输出值作为拟合多项式的自变量,通过建立包括待消除的非目标参量在内的函数解析式,来消除非目标参量对传感器的影响,这样就可对数据进行需要的处理,实现非线性补偿[11]。高敏等[6]在测温系统中,用温度传感器对霍尔电流传感器的工作温度进行实时监测,用二维回归分析法建立起被测电流、霍尔电流传感器输出电压和其工作温度三者之间的函数关系,并存储于单片机中,结合电路实现对该电流传感器的实时补偿,构成一个具有温度补偿功能的电流传感测试系统,在一定程度上提高了传感器的测量精度和自适应能力。同时,在一个受限的测试系统中,与其对电路网络做复杂的调整,不如对传感器特性做数学描述,如回归分析等[7]。
2.3.2 人工神经网络
人工神经网络起源于生物学上的重大发现,是由简单的处理单元(神经元)大量并行分布而组成的处理机。它使用大量神经元处理信息,而神经元按层次结构的形式组织,每层神经元以加权的方式与其它层神经元联接,采用并行结构和并行处理机制,因而网络具有很强的容错性以及自学习、自组织及自适应能力,能够模拟复杂的非线性映射,具有多种典型的人工神经网络拓扑结构。在BP神经网络中,信息是前向传播的,而误差是反向传播的,即误差的调整过程是从最后的输出层依次向之前各层逐渐进行。神经网络的这些特性和强大的非线性处理能力,恰好满足了多传感器数据融合技术处理的要求,故近年来得到了较快的发展和一定应用[8,12]。
BP神经网络被用于传感器技术中,对多传感器数据进行融合,在一定程度上提高了传感器的稳定性和准确性[13]。有时为了满足不同的测量需要,也提出了多种改进基于BP 神经网络的校正方法。例如用于检测瓦斯浓度的瓦斯传感器,其输入与输出之间存在着较严重的非线性,实际应用中一般采用分段线性化校正的方法,这在一些检测精度要求较高的场合中往往达不到实际需求,因此必须进行高精度的线性化校正。刘刚[14]提出了一种基于改进型BP神经网络的瓦斯传感器的非线性校正方法,利用神经网络良好的非线性映射能力,通过实验数据训练神经网络,使网络逐步调节层间的连接权,逼近反非线性函数,利用该函数传感器可实现按非线性特性输出系统的被测量值。在位移传感系统中,为了提高精度与稳定性,有效抑制温度漂移,可以把位移传感器的输出与温度传感器的输出进行数据融合。朱海梅[15]提出一种基于RBF网络(径向基函数神经网络)的多传感器数据融合方法,把位移传感器和温度传感器的输出送入融合中心,通过RBF网络的学习训练,得到稳定的位移输出。
2.3.3 遗传算法
遗传算法是一种概率性自适应迭代寻优过程。它从某一随机产生的或是特定的初始群体(父体)出发,按照一定的操作规则,如选择、交叉、变异等,不断进行迭代计算,并根据不同个体的适应度保留优良淘汰次品,即便所定义的适应值函数是不连续的、非规则的,也能引导搜索过程向最优解逼近。
目前,最小二乘法作为一种较为成熟的软件校正,为了克服它得不到全局最优解且有可能造成矩阵方程出现病态而破坏其方法有效性的特点[16],郝云芳等[9]把遗传算法应用于拟合传感器的特性方程,求解智能传感器自校正系统中的待定常数值,它可以很好地解决当噪音存在时,传统自校正系统求解过程中方程遇到矩阵的病态问题,从而实现传感器特性的线性化。对于输入输出关系是本质非线性的传感器,沈毅等[17]提出了一种基于人工神经网络的纸浆浓度传感器非线性估计和动态标定方法,钱光耀等[18]采用混合遗传算法模型拟合其输出特性,这些均表明,当环境条件发生变化时,只要测量几组数据对,该方法可自动重新训练网络,获得新的多项式系数,实现浓度传感器的非线性估计和在线动态标定。
在理想情况下,多传感器、多目标静态数据关联选用遗传算法也是可行的,很有应用前景。王宁等[19]采用多传感器对数目未知的目标进行检测,并通过遗传算法来解决静态数据关联问题,且关联成功率较高。因此,遗传算法是一种能在复杂空间中进行鲁棒搜索的方法,可以解决许多传统优化方法难以解决的问题。
2.3.4 模拟退火算法
模拟退火算法是模拟物理热力学中固体退火原理的一种全局优化算法。在对固体退火过程研究的启示下,以组合优化问题和固体退火过程之间存在的相似性为基础,把Metropolis接受试蛞入优化过程中,通过恰当控制被称为温度参数的下降过程实现模拟退火,从而得到全局的近似最优解,该算法适用于解大型组合优化问题的技术。
模拟退火的实质是进行两次循环运算,内循环是在同一温度下的多次扰动产生不同模型状态,并按照Metropolis概率接受准则接收新模型,因此内循环以模型扰动次数控制。外循环包括温度下降的模拟退火、算法迭代次数的递增和算法停止的条件,因此外循环基本是由迭代次数控制的[10]。
模拟退火算法的应用广泛,而无线传感器网络在国防、环境监测、空间探索、医疗卫生、精细农业、交通管理、制造业、反恐抗灾等领域具有广阔的应用前景[20]。有学者巧妙地将二者结合使用,取得了良好的效果。李玉增等[21]提出一种新的无线传感器网络节点定位算法,并通过仿真验证了该算法具有良好的效果。赵仕俊等[22]在对无线传感器网络定位的基础上采用模拟退火算法作为后期优化,提高了定位精度,且设计简单、计算量小,适用性较好。在压力传感器的测控系统中,为了消除非目标参量对压力传感器输入―输出特性的影响,樊晓宇等[23]采用遗传模拟退火算法对压力传感器非线性特性进行了改善,实现了智能抑制干扰和温度补偿,因此其可靠性好、测量精度高。
3 结 语
智能传感器已广泛应用于电子产品加工、精密仪器制造、高科技产品生产等行业,例如机器人的研发就与高科技传感器密不可分,智能传感器可以收集周围环境信息并发送指令给机器人,从而控制它的活动;在工业生产领域,智能传感器可控制商品的各类指标,以提高产品质量;在医学领域,传感器已被应用于各类医学仪器中,用以测量人体血液、内脏、骨骼、神经等各方面的指标,为医生确诊提供依据,使广大患者受益,提高人们的健康水平;在日常生活中,各种由智能传感器制造的先进家用电器不断问世,更加方便了人们的生活。当代智能传感器技术正在向着虚拟化、网络化、信息化方面发展,并与计算机技术和芯片技术紧密结合,应用于各个方面,目前研发适用于各种特殊条件下的智能传感器将仍是学术界一项重要的任务。
参考文献
[1]孙宝元,杨宝清.传感器及其应用手册[M].北京:机械工业出版社,2004:307-374.
[2]李建壮,杨彦涛.传感器技术的应用与发展趋势展望[J].中国科技信息,2011 (17):120,126.
[3] Lee K. Sensor Networking and Interface Stardardization [C].In:Proceedings of the Instrumentation and Measurement Conference (IMTC) 2001,Budapest,Hungary,May 21-23,2001:147-152.
[4]孙圣和.现代传感器发展方向[J].电子测量与仪器学报,2009,23 (1):1-10.
[5]何金田,刘晓文.智能传感器原理,设计与应用[M].北京:电子工业出版社,2012.
[6]高敏,卢文科,孙仁涛.基于二维回归分析法的霍尔电流传感器温度补偿[J].电子测量与仪器学报,2009,23(2):100-104.
[7]史丽萍,孙宝元,于浩洋.多项式回归分析在传感器测试中的应用[J].河北工业大学学报,2003,32(3):41-44.
[8]赵敏,潘卫明,杨灿军.基于神经网络的数据融合技术在谐振式密度传感器中的运用[J].传感技术学报, 2000,13(3):187-192.
[9]郝云芳,冯晓明,黄天禄.遗传算法在传感器非线性自校正中的应用[J].传感器技术,2003,22(6):56-57,61.
[10]华根,李丽华,许惠平.模拟退火定位算法研究[J].同济大学学报(自然科学版),2005,33(9):1240-1243.
[11]杜西亮,孙慧明.多项式回归在智能传感器线性化中的应用[J].传感技术学报,2005,18(1):212-214.
[12]蔡兵.基于神经网络的半导体压力传感器数据融合技术[J].湖北文理学院学报,2002,23(2): 16-18.
[13]张荷芳,薛静云.压力传感器温度补偿的BP神经网络算法[J].西安工业大学学报,2013,33(2):163-167.
[14]刘刚.基于改进型BP神经网络的瓦斯传感器的非线性校正[J].电气自动化,2007,29(3):61-63.
[15]朱海梅.神经网络数据融合在位移传感系统中的应用[J].南京师范大学学报(工程技术版),2006,6(1):28-32.
[16]陈国良.遗传算法及应用[M].北京:国防工业出版社,1995:12-30.
[17]沈毅,张建秋,王世忠,等.纸浆浓度传感器非线性估计和动态标定的一种新方法[J].仪器仪表学报,1997,18(1):1-6,13.
[18]钱光耀,赵光兴,韩华明.基于混合遗传算法的浓度传感器的非线性估计和动态标定[J].中国仪器仪表,2006 (9):44-47.
[19]王宁,郭立,金大胜,等.遗传算法在多传感器多目标静态数据关联中的应用[J].数据采集与处理,1999,14(1):18-21.
[20] Akyildiz LF, Su WL, Sankarasubramaniam Y, et al.A survey on sensor networks[J].IEEE Communications Magazine, 2002,40(8): 102-114.
[21]李玉增,张雪凡,施惠昌,等.模拟退火算法在无线传感器网络定位中的应用[J].通信技术,2009,42(1):211-213.
关键词:LM-BP网络;粮食产量;预测
中图分类号:S11+4;TP183 文献标识码:A 文章编号:0439-8114(2012)23-5479-03
Forecasting Corn Production Based on LM-BP Neural Network
GUO Qing-chun1,3,4,HE Zhen-fang2,4,LI Li3
(1. Teaching Affairs Office, Shaanxi Radio & TV University, Xi’an 710068, China; 2. Cold and Arid Regions Environmental and Engineering Research Institute, Chinese Academy of Sciences, Lanzhou 730000, China; 3. Institute of Earth Environment Research, Chinese Academy of Sciences, Xi’an 710075, China; 4. Graduate University, Chinese Academy of Sciences, Beijing 100049, China)
Abstract: A corn production porecasting method based on improved LM-BP was proposed. According to measurement and agricultural significance principle, 9 factors of grain-sown area, fertilizer input, effective grain irrigated area, stricken area, rural electricity consumption, total agriculture mechanism power, the population engaged in agriculture, rural residents family productive assets, the average net income of rural households were extracted as the network input; corn production was extracted as the network output. The LM algorithm could minimize the error, and the modeling results were evaluated with the correlation coefficients, relative error, etc. For training sample set, the correlation coefficient between the simulated value and the actual value was 0.996, the average relative error was 0.47%; for testing sample set, the correlation coefficient between the forecasted value and the actual value was 0.994, the average relative error was 0.56%. The results showed that the improved LM-BP model could improve simulation precision and stability of the model. This method is effective and feasible for corn production prediction.
Key words: LM-BP network; corn production; forecast
粮食产量预测是复杂的农学和统计学问题,受自然环境、政策、资源投入等多因素的影响。国内外的相关研究中,不少学者构建了许多很有价值的理论假说和预测模型,主要有4类:投入产出模型、遥感技术预测模型、气候生产力模型及多元回归和因子分析模型,这些模型从不同角度对粮食产量预测进行了研究[1,2]。但这些模型多数采用传统的统计预测技术,如时间序列统计模型、定性与推断技术、因果关系方法。而粮食产量是受不确定性因素影响的,是一个复杂的非线性系统。
人工神经网络具有很强的处理大规模复杂非线性系统的能力。近年来,许多学者已将人工神经网络成功地应用于实际问题的预测中,取得了令人满意的结果[3-12]。为此,采用改进算法的神经网络建立了粮食产量预测系统,结果表明,基于改进算法的BP神经网络预测模型具有良好的预测精度、训练时间短、收敛速度快等特点。
1 仿真试验数据
1.1 预测因子的选择
根据能够计量及具有农学意义的原则,结合农业专家的意见,通过前期大量的影响因子分析[13-15],选取1994-2009年的粮食总产量为输出因子,初步选取粮食作物播种面积、化肥施用量、粮食作物有效灌溉面积、受灾面积、农村用电量、农业机械总动力、从事农业的人口、农村居民家庭生产性固定资产原值、农村居民家庭平均纯收入9个因子作为输入因子构筑模型,原始数据来源于2010年《中国统计年鉴》。
1.2 网络输入的初始化
为了消除不同因子之间由于量纲和数值大小的差异而造成的误差,以及由于输入数值过大造成溢出,首先需要对数据进行标准化处理,即把输入数据转化为[0,1]或[-1,1]的数。通过公式y=(x-min(x))/(max(x)-min(x))对粮食产量进行处理,得到了符合网络要求的数据。减少了识别数据的动态范围,使预测成功的可能性得以提高。然后将数据分成两部分:网络的训练样本集(前11年的数据)和检测样本集(后5年的数据)。
2 预测仿真模型的建立
BP网络是误差反向传播(Back Propagation)人工神经网络的简称,是目前计算方法比较成熟、应用比较广泛、效果比较好、模拟生态经济系统的神经网络模型,但传统BP网络存在学习过程收敛慢,局部极小、鲁棒性不好、网络性能差等缺点。为了改进算法,引入Levenberg-Marquardt优化算法,其基本思路是使其每次迭代不再沿着单一的负梯度方向,而是允许误差沿着恶化的方向进行搜索,同时通过在最速梯度下降法和高斯-牛顿法之间自适应调整来优化网络权值,使网络能够有效收敛,大大提高网络的收敛速度和泛化能力,它能够降低网络对误差曲面局部细节的敏感性,有效抑制网络陷入局部极小。
Levenberg-Marquardt算法实际上是梯度下降法和拟牛顿法的结合,该算法期望在不计算Hessian矩阵的情况下获得高阶的训练速度,其公式表达为XK+1=XK-[JTJ+μI]-1JTe,其中,JT为雅克比矩阵,e是网络误差向量。如果μ=0的话,就变成采用近似Hessian矩阵的拟牛顿法;如果μ很大,即成为小步长的梯度下降法,由于牛顿法在误差极小点附近通常能够收敛得更快更准确,因此算法的目的就是尽快转换为牛顿法。如果某次迭代成功,误差性能函数减小,那么就减小μ值,而如果迭代失败,就增加μ值。如此可以使得误差性能函数随着迭代的进行而下降到极小值。Matlab工具箱提供了Trainlm 函数Levenberg-Marquardt算法的计算。
网络结构的选择是应用BP网络成功与否的关键因素之一,一个规模过大的神经网络容易造成网络容错性能下降、网络结构复杂、泛化能力较差等缺陷;而规模过小的神经网络往往对训练样本的学习较为困难,学习过程可能不收敛,影响网络的表现能力,降低网络应用的精度。理论研究表明,只要具有足够的隐层神经元,3层人工神经网络可以无限地逼近任何时间序列和函数,因此这里采用含有一个隐含层的3层神经网络结构。隐含层神经元数的选择较为复杂,它关系到整个BP网络的精确度和学习效率,但目前,它的选取尚无一般的指导原则,只能根据一些经验法则或通过试验来确定,如Hecht-Nielsen提出的“2N+1”法,由输入矩阵可以确定输入层节点数为9,根据“2N+1”这一经验,可确定隐含层节点数为19;输出层节点数为1,这样就构成了一个9-19-1的BP神经网络模型,其中,训练函数为Trainlm,输入层到隐含层以及隐含层到输出层的传递函数分别为Logsig和Purelm,最大训练次数Epochs为50 000次;训练误差精度Goal为0.001;训练时间间隔Show为5,学习步长Lc为0.5,动量因子Me为0.95,其他参数均选用缺省值。
3 仿真结果
取1994-2004年的11个实际产量作为训练样本集,将2005-2009年的5个实际产量作为预测效果检测样本集。将1994-2004年9个指标的原始数据作为BP神经网络的输入样本,粮食产量实际值作为输出样本,然后对网络进行训练,可得相应结点的权值与阈值,将2005-2009年9个指标的原始数据(检测样本)作为网络的仿真输入,得到最终预测结果,表1是1994-2009年中国粮食实际产量和神经网络方法模拟值对比分析结果。
从表1可以看出,训练样本集中拟合精度平均相对误差为0.47%,最大值为2004年的1.13%,模拟值和实际值的相关系数为0.996;检测样本集中,BP神经网络预测模型得到的预测值和实际值具有较好的拟合效果,平均相对误差为0.56%,最大相对误差为1.11%,最小相对误差仅为0.04%,模拟值和实际值的相关系数为0.994;2005-2009年的粮食产量预测值的相对误差均较小。这种改进后的方法比较有效,利用该算法获得的预测数据结果较好。
总之,由以上分析结果可以看出,无论是拟合精度还是预测5个独立样本,BP神经网络模型的精度都比较高。但从预测结果也可以看出,BP网络模型方法预测的平均相对误差为0.56%,平均预测精度仍有待提高。
4 小结与讨论
针对中国粮食产量预测问题,将BP神经网络应用于国家粮食安全预警系统中,采用1994-2004年的中国粮食产量和影响因子的历史数据建立模型,利用2005-2009年的数据检验模型,研究得出以下结论。
1)由于常规统计模型难以满足粮食产量的预测要求,提出的改进BP算法较好地解决了神经网络收敛慢和易陷入局部极小值的问题,通过建立预测模型,运用该改进方法对中国粮食产量进行了预测,实例证明,运用基于Levenberg-Marquardt算法的改进BP神经网络,无论从训练结果精度上还是在收敛性能上都表现出较好的效果,说明运用该方法来预测粮食产量是完全可行的,弥补了传统BP算法的不足,提高了预测精度,加快了收敛速度,而且具有很好的外延性。
2)BP神经网络模型的预测精度高,预测值和实际产量的拟合性好。BP神经网络法允许原始的随机数据或数据中含有较多的噪声,这是它区别于其他模型的最大优势,因而任何能用传统的模型分析或统计方法解决的问题,BP神经网络能处理得更好。在进行粮食产量预测时,BP神经网络法是一种非常理想的预测方法,但是在构造神经网络的预测模型时,要注意正确选择影响因素,不要漏掉对预测对象有重大影响的因素。
由于粮食产量受各种因素的影响,波动性较大,除了受到上述9种因素的影响外,在很大程度上还受国家宏观政策、作物品种、耕作技术等因素的影响,如何更全面地将难以量化的因素也纳入模型中进行考虑分析,从而不断地改进预测模型、提高预测精度,是需要进一步研究的工作。
参考文献:
[1] 和文超,师学义,邓青云,等.土地利用规划修编中粮食产量预测方法比较[J].农业工程学报,2011,27(12):348-352.
[2] 周永生,肖玉欢,黄润生. 基于多元线性回归的广西粮食产量预测[J]. 南方农业学报,2011,42(9):1165-1167.
[3] 王巧华,文友先.基于BP神经网络的鸡蛋大小分级方法研究[J].湖北农业科学,2005(1):97-99.
[4] 于平福,陆宇明,韦莉萍,等.基于小波广义回归神经网络的粮食产量预测模型[J].湖北农业科学,2011,50(10):2135-2137.
[5] 李红平,魏振方,郭卫霞.小麦白粉病的数学模型预测[J].湖北农业科学,2011,50(17):3611-3613.
[6] 李 艳,刘 军.农产品价格预测系统设计与实现[J].湖北农业科学,2011,50(14):2976-2978.
[7] 黄 华,黎未然.人工神经网络在柚皮总黄酮提取中的应用[J].湖北农业科学,2011,50(10):2088-2091.
[8] 汪东升,李小昱,李 鹏,等.基于小波和神经网络的柴油机失火故障检测[J].湖北农业科学,2011,50(15):3181-3183.
[9] 梁 丹,李小昱,李培武,等.近红外光谱法对食用植物油品种的快速鉴别[J].湖北农业科学,2011,50(16):3383-3385.
[10] 吴泽鑫,李小昱,王 为,等. 基于近红外光谱的番茄农药残留无损检测方法研究[J].湖北农业科学,2010,49(4):961-963.
[11] 章 英.基于收购质量的烤烟烟叶无损检测技术研究综述[J].湖北农业科学,2011,50(7):1297-1300.
[12] 李 哲,李干琼,董晓霞,等.农产品市场价格短期预测研究进展[J]. 湖北农业科学,2011,50(17):3666-3675.
[13] 宰松梅,温 季,仵 峰,等.基于灰色关联分析的辽宁省粮食产量预测模型[J].节水灌溉,2011(5):64-66.
1.1光谱噪声去除由于实验条件如光谱仪硬件和环境光等因素影响,采集的原始光谱数据会包含噪声,需要采用光谱预处理的方法把这些噪声去除,同时保留有用光谱信息。采用SG平滑算法,经验模态分解(empiricalmodedecomposition,EMD)算法和小波分析(wavelettransform,WT)去噪算法等对光谱进行处理,并对三种去噪算法进行比较。
1.2潜在变量(LatentVariable,LV)在利用PLS方法建立模型时,非常关键的一点是所选取的对于建模最优的LV个数,LV和主成分分析中主成分类似,第一个LV贡献率最大,第二个次之,以此类推。如果选取的LV个数偏少,则无法全面代表样本的光谱特性,造成模型精度下降,影响模型的预测效果。而如果选取的LV个数过多,则会带入模型的噪声,干扰建模效果。
1.3建模分析方法用三种建模方法,分别是偏最小二乘回归(partialleastsquares,PLS),BP神经网络(backpropagationneuralnet-work,BPNN)和偏最小二乘支持向量机(leastsquaresupportvectormachine,LS-SVM)。采用PLS建模方法时,基于全谱作为模型输入,使用BP神经网络和LS-SVM建模时,把PLS回归模型得到的LV作为输入,进行对比分析。神经网络由一个输入层、一个或多个隐含层和一个输出层构成。BP神经网络是一种非线性的建模方法,广泛应用于光谱建模分析中[12]。LS-SVM是在经典支持向量机算法基础上作了进一步改进,能够同时进行线性和非线性建模分析,是解决多元建模的一种快速方法。
1.4定量模型评价标准定量模型的评价指标主要有决定系数和均方根误差(rootmeansquareerror,RMSE)。建模集决定系数用R2表示,预测集决定系数用r2表示。决定系数越接近于1,表示模型相关性越好,预测效果更好。一般来说,RMSE越小说明模型的误差越小,模型精度越高。建模集均方根误差用RMSEC表示,预测集均方根误差RMSEP表示。
2结果和讨论
2.1UV/Vis光谱图及COD浓度的统计分析图1为甲鱼养殖水样本的UV/Vis原始光谱曲线,从图中可以看出各个水样的光谱曲线的趋势相类似,没有呈现显著性差异,由于水体中硝酸盐、有机酸、腐殖质等物质对紫外光的强烈吸收,在波段200~260nm区域的吸收度明显高于其他区域。试验水体样本COD值统计结果如表1所示,模型的建模集和预测集COD值覆盖了较大范围,有助于建立准确、稳定和具有代表性的模型。
2.2基于全波长的PLS模型为了更好的分析三种消噪算法检测水体COD含量的性能,将对不同预处理方法获取的评价指标相比较,基于全谱的PLS模型的计算结果如表2所示。由表2可知,小波算法去除噪声后的光谱PLS模型取得了最佳结果,建模集的R2为0.79,RMSEC为15.89mg•L-1,预测集的r2为0.78,RMSEP为15.92mg•L-1。SG平滑和EMD算法虽然部分去除了噪声,但建模效果并没有得到相应提高。故后面建模分析在WT分析基础上进行。
2.3LV一般选取最优LV个数的标准观察RMSEP值随LV个数变化情况,如图3所示,当LV个数较少时,RMSEP值较大,随着LV个数的增加,RMSEP随之减小,当LV个数增加到6时,RMSEP的值保持稳定,LV个数继续增加,RM-SEP值也没有随着增加。取前6个LVs作为偏最小二乘支持向量积的输入建立模型。从贡献率角度解释,PLS建模得到的6个LVs分别作为LS-SVM的输入,之所以取前6个是因为这样几乎可以100%表达原始光谱有用信息,如表3所示,且降低了模型复杂度,提高模型运行速度和精度。
2.4BP神经网络模型根据前文得到的结果,将表3中选出的LVs作为BP神经网络模型输入,BP神经网络模型的计算结果如表4所示。分析表4可知,将6个LVs作为LS-SVM模型输入的结果,其建模集的R2为0.82,RMSEC为15.77mg•L-1,预测集的r2为0.81,RMSEP为16.67mg•L-1。
2.5基于LVs输入的LS-SVM模型LS-SVM模型预测结果如表5所示。采用LVs作为LSSVM模型输入,得到的结果优于基于BP神经网络模型。其建模集的R2为0.83,RMSEC为14.78mg•L-1,预测集的r2为0.82,RMSEP为14.82mg•L-1。
2.6PLS,BP神经网络和LS-SVM模型比较PLS,BPNN和LS-SVM建模方法的结果比较如图3所示,Cal表示模型的建模集(calibration),Pre表示模型的预测集(prediction)。不难发现,在LS-SVM模型和BP神经网络模型中,基于LV作为模型输入-建立的LS-SVM模型取得了最优的效果,BP神经网络模型的预测效果较优,且LS-SVM模型和BP神经网络模型都优于全波长的PLS模型结果。
3结语
关键词:回弹-超声-拔出综合法;混凝土;强度;检测
Abstract: in the theoretical analysis and test research, it established concrete rebound-ultrasound-pulled out of the synthesis detection artificial neural network model. Comparing the traditional regression algorithm, the artificial neural network model of concrete strength has higher precision.
Keywords: rebound-ultrasound-pull out the synthesis; Concrete; Strength; detection
中图分类号: TU528 文献标识码:A 文章编号:
1 引言
混凝土的强度可采用无损检测的方法进行推定,如采用回弹法、声速法、拔出法或综合法。综合法由于采用多项物理参数,能较全面地反映构成混凝土强度的各种因素,并且还能够抵消部分影响强度与物理量相关关系的因素,因而它比单一物理量的无损检测方法具有更高的准确性和可靠性[1]。通过试验研究和工程实践积累的检测数据,建立了混凝土强度回弹-超声-拔出综合法神经网络模型。
2 试验设计
2.1 试件制作
设计C15、C20、C25、C30、C35、C40六个强度等级、三个龄期的混凝土,共制作标准养护100×100×100mm立方体试件180组用于回弹法、超声法检测,制作标准养护200×200×200mm立方体试件180组用于拔出法检测,同时制作相同组数的自然养护试件。试件均采用机械搅拌、机械振捣。
2.2 混凝土配合比及原材料基本性能
混凝土配合比及设计参数见表1。
表1 混凝土配合比及设计参数统计表
3 回弹-超声-拔出综合法人工神经网络的设计与模型建立
3.1网络设计与说明
3.1.1输入和输出层的设计
人工神经网络的输入、输出层数是完全根据使用者的要求来设计,问题确定下来,输入输出层也就确定了。
3.1.2隐含层单元的选择
隐含层单元个数的选择是一个十分复杂的问题,目前尚没有很好的解析表达式,隐含层单元的个数与问题的要求、输入输出单元的数量、训练样本的数量等都有直接关系。当隐含层单元的数量太少时会导致网络的容错性能降低,即训练不出理想的结果。但隐含层单元个数太多又往往会造成网络的训练时间过长,且网络的输出误差也不一定最小,因此目前主要依靠理论和经验确立合适的计算网络[2]。下面公式作为选择隐含层单元数的参考:
式中:n1为隐含层单元数,m为输出层单元数,n为输入层单元数,a为1-10之间的常数。
3.1.3初始值的选取
对于系统是非线性的,初始值对于学习是否达到局部最小和是否能够收敛的关系很大,一个重要的要求是希望初始权在输入累加时使每个神经元的状态接近于零,这样可以保证开始时不落到那些平坦区域上。权一般取随机数,而且要求比较小,这样可以保证每个神经元一开始都在它们转换函数变化最大的地方进行[3]。
3.1.4数据的归一化处理
由于输入数据的密集性,数据之间的差别太小,如超声值;同时由于采集的各数据单位不一致,直接将数据输入神经网络进行训练会引起混淆。因此,必须对输入数据和输出数据进行归一化处理(Normalization Processing),使得输入层的输入值介于[-1,1]之间,而输出层的输出值介于[0,1]之间。
神经网络训练结束后,在神经网络进行混凝土强度推测阶段(即仿真阶段),需要对数据进行反归一化处理。
3.2网络算法改进
3.2.1附加冲量(动量)法
附加冲量法修正网络参数时,不仅考虑误差函数的梯度下降,而且考虑误差曲面的变化趋势。没有附加冲量作用时,网络可能陷入局部极小或进入误差曲面平坦区,而附加冲量则有可能使网络跳出局部极小或滑过平坦区[4]。
3.2.2自适应学习速率
正确选择学习速率不是一件容易的事情,通常对训练初期合适的学习速率,随着训练的进行会变得不合适,因为误差曲面是非常复杂的。为了解决这一问题,设法让网络具有这样一种功能,根据自身的训练情况自动调整学习速率,即采用自适应学习速率[5]。
3.2.3 S型函数输出限幅算法
网络的连接权和阀值的调节量都与中间层输出b有关,当bj=0或b=l时,vji=0或wji=0或θj=0,即当bj=0或bj=1时,不能对网络的权值和阀值进行调整。
3.3 网络训练和模型的建立
混凝土强度回弹-超声-拔出综合法神经
网络训练如图1示。经过训练,网络模型如
图2所示。
建立的神经网络的训练函数为Trainlm。
输入层数是3,即回弹值、超声值、拔出力;
输出层数是1,即混凝土立方体抗压强度。
隐含层是1层,单元数是5。初始学习速率
0.05,冲量系数0.9,允许学习次数3000,
学习样本数168,计算样本数15,初始权值和阈值为[-0.01,0.01]区间的随机数,输入层的输入值介于[-1,1]之间,输出层的输出值介于[0,1]之间。网络检测样本见表2所示。
4 人工神经网络与回归算法推测混凝土强度对比
4.1回归模型选择
根据试验数据情况拟选三种回归公式,通过回归指标综合评价这三种回归公式,然后选取既能反映混凝土实际工作状况又较为简单的回归公式作为综合法的测强公式 。
拟选用以下几种回归公式模型[6,7]:
幂函数方程 :
线性方程:
指数方程:
式中;—混凝土强度计算值(MPa);F—拔出力(kN);N—回弹值;V—超声速度(km/s);A、B、C、D—回归系数
4.2 综合法检测回归公式及试验结果分析
本次试验通过对576组150×150×150mm试块和90根750×200×200mm小梁180组进行拔出、回弹、超声检测。对试验数据利用Matlab进行回归分析,得到如下回归方程和相应的回归指标,见表3。
表3几种回归方程比较
一、BP神经网络方法
1.BP算法
BP算法是一个监督训练多层神经网络的算法,每一个训练范例在网络中经过两遍传递计算:一遍向前传播计算,从输入层开始,传递各层并经过处理产生一个输出,并等到一个该实际输出和所需输出之差的差错矢量。一遍向后传播计算,从输出层至输入层,利用差错矢量对权值进行逐层修改。
BP网络是一种单向传播的多层前向网络,其结构如图所示。BP网络是一种具有三层或三层以上的神经网络,包括输入层、中间层(隐层)和输出层。当学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,在输出层的各神经元获得网络的输入响应。接下来,按照减少目标输出与实际误差方向,从输出层经过各中间层逐层修正各连接权值,最后回到输入层。随着这种误差的逆传播修正不断的进行,网络对输入模式影响的正确率不断上升。图1BP网络结构
2.改进的BP算法
在实际应用中,BP算法很难胜任,因此出现了多种改进算法,Levenberg-Marquardt算法是其中的一种,采用Levenberg-Marquardt可以使训练速度和训练成功率大大提高,对中小型神经网络训练而言,Levenberg-Marquardt算法是最好的训练算法]。
Levenberg-Marquardt算法的基本思想是使其每次迭代不再沿单一的负梯度方向,而是允许误差沿着恶化的方向进行搜索,同时通过在最速梯度下降法和高斯-牛顿法之间自适应调整来优化网络权值,使网络能够有效收敛,大大提高了网络的收敛速度和泛化能力。Levenberg-Marquardt算法的权值调整公式为:
e-误差向量
J-雅可比矩阵
μ一个标量
二、最小二乘支持向量机算法
1.支持向量机原理
支持向量机是在统计学习理论基础之上提出的一种新的非常有发展前景的机器学习方法。支持向量机是对结构风险最小化原则的近似,支持向量机方法根据有限的样本信息在模型的复杂度和学习能力之间寻求最佳折衷,以期获得最好的推广能力。
支持向量机的学习,就是寻找一个参数向量,通常该向量在某种约束下使某个代价函数最小(或最大)。支持向量机理论中的代价函数是凸二次函数,约束条件是线性函数,所以支持向量机训练问题实际上是求解一个凸二次规划问题。
2.最小二乘支持向量机原理
最小二乘支持向量机(LS-SVM)是标准支持向量机的一种扩展。它的损失函数直接定义为误差平方和,将优化中的不等式约束转化为等式约束,由此将二次规划问题转化为线性方程组求解,降低了计算复杂性,加快了求解速度。支持向量回归机根据训练样本 构造回归函数。
这样非线性估计函数转化为高维特征空间的线性估计函数。利用结构风险最小化原则,寻找w,b就是最小化。
其中
控制模型的复杂度,c是正规化参数,控制对超出误差样本的惩罚程度。
为误差控制函数,也即
不敏感损失函数。最小二乘支持向量机在优化目标失函数为误差
的二次项,故优化问题为:
式中, 为松弛因子。用拉格朗日法求解这个优化问题:
其中:
是拉格朗日乘子。根据最优化条件:
置各变量偏导数为0
得到方程:
其中:
最后用最小二乘法求出 与 ,得到非线性预测模型:
三、方法比对结果
结合油气井生产历史、地质评价结果以及油气田开发动态综合分析,确定用于选井选层决策的参数。表1 决策参数表
选了重复压裂井,进行预测,表2列出两种方法得到的测试结果对比。表2 两种模型测试结果对比
从表中可以看出,在研究样本数量相对有限的情况下,最小二乘支持向量机算法在精度上明显优于改进的BP神经网络。
四、结论及建议
本文介绍了重复压裂选井选层的经验方法,详细讨论了改进的BP神经网络和最小二乘支持向量机两种定量判断的选井选层的数学方法,分别叙述了各自的原理,建立了预测模型,通过实例测试和比较。
1.得出以下主要结论:
1.1Levenberg-Marquard算法虽然可以实现神经网络的快速训练,但局部最优问题、过拟合、网络结构选择等问题依然存在,神经网络方法的预测效果不够理想。
1.2支持向量机从理论上解决了神经网络固有的局部最优、过拟合等问题,从预测效果看,最小二乘支持向量机预测方法的预测精度高于BP人工神经网络预测法。所以,最小二乘支持向量机方法可以作为神经网络法的替代方法。
2.主要建议