前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络隐含层数的确定主题范文,仅供参考,欢迎阅读并收藏。
根据对江苏地区农村住宅建筑节能的分析,并通过统计大量文献中对农村住宅建筑节能指标的描述,可将江苏地区农村住宅建筑节能评价指标归纳为建筑外形设计、围护结构、设备节能、新能源的利用这四个主要方面进行评价。对这四个指标做进一步分解,可以得出19个子指标,
2江苏地区农村住宅建筑节能的综合评价方法
2.1信息熵方法对建筑节能评价指标的筛选
为了从已经构建的初始评价指标中提取主要评价指标,可以采用信息熵法剔除其中对评价影响不大的指标。具体操作步骤及方法如下:第一步:将初始的指标矩阵进行标准化处理。假定所选的评估对象有N个,初始的指标有M个,则可以构建N×M阶的矩阵,定义为矩阵A。按照式(1)进行标准化后的矩阵为A′。a′ij=(1)第二步:熵值的求取。令pj表示熵值,则,Πij=pj=-ΠijlnΠij(2)第三步:熵权的确定。Wj表示求出的熵权的大小,则,Wj=(3)第四步:确定某个评价指标的具体权重。权重值用Qj表示,则,Qj=(4)第五步:将第三步求出的熵权与第四步求出的具体权重进行结合,剔除冗余指标,确保评价的稳定性。
2.2BP神经网络方法对农村住宅建筑节能的综合评价
BP神经网络可以用于逼近任意的一个非线性的函数,同时具有超强的自适应以及存储能力。采用BP神经进行评价时,其运行的主要思想就是将搜集到数据输入到该系统中,然后系统进行自我训练,拟合各指标间的最优关系,并自动记忆、存储所选指标对综合评价对象的影响权值,继而对类似对象做出客观的评价。在进行BP神经网络训练之前需要构建BP神经网络结构,主要需要以下参数。
(1)BP神经网络的节点数与层数的确定BP神经网络结构的确定需先确定输入、输出层节点数、隐含层的层数以及隐含层节点。输入层节点数为指标个数,输出层节点数为建筑节能综合评价指标。在规模不大的情况下,常采用一个隐含层。隐含层节点数可根据式(5)确定。Ny=(5)其中,Ny表示隐含层节点数;Ni表示输入层节点数;No表示输出层节点数;NP表示训练样本个数。
(2)BP神经网络相关参数的确定确定BP神经网络结构后,需要确定网络函数的选取、初始权重的确定、期望误差、学习速率、训练次数等相关参数。
3江苏农村住宅建筑节能的综合评价
首先对初始建立的评价指标进行筛选,剔除其中可能对评价结果有干扰的影响因素。聘请10位专家对初始的评价指标进行打分,然后依据信息熵方法进行处理,最终得出的综合评价指标包括b11、b12、b13、b14、b21、b22、b23、b24、b25、b31、b32、b33、b41、b45、b46这15个评价指标。采用三层BP神经网络模型,即输入层、隐含层、输出层各一层,输入节点数为选定的评价指标数15,根据式(5)确定隐含层的节点数为7,输出节点数为1。函数采用Sigmoid函数,初始权值为[0,1]区间的较小的数,误差期望为0.01,学习速率为0.001,训练次数为10000次。笔者选取了江苏省某地区的6个农村住宅建筑作为评价对象,以其中的5个作为训练样本。数据主要是通过调查得到并做归一化处理,聘请相关专家对这几个样本进行综合评分,用t表示。经过训练,将第六个样本作为评价对象,采用该模型进行综合评价,各指标的初始值见表3。采用经训练后的BP神经网络模型进行综合评价,得出的最终评价结果为0.932,这与通过专家打分法得出的评价值0.927相比,误差为0.005,相对误差为0.5%。这充分说明采用BP神经网络模型进行综合评价是可行的,且其评价的精度比较高。
4结语
[关键词]人工神经网络;旅游物流;需求预测
[DOI]1013939/jcnkizgsc201538051
1引言
旅游物流对广西地区经济的发展至关重要,准确把握、预测旅游物流需求有助于有关部门制定合理的旅游物流规划、促进国民经济可持续发展、提高居民生活水平。国内学者通过一定的方法和模型确定了影响旅游物流能力的关键要素,为旅游物流需求的预测提供了一定的理论基础,而在物流需求预测方面也提出了很多如时间序列模型、灰色预测、回归分析等具有创新性和实践意义的方法。由于旅游物流具有的独特性和负责性使得这些模型及分析方法在前提条件、适用范围和侧重点的选取方面具有一定的困难,因此在实际应用中各有利弊。人工神经网络可以将定量或定性的信息等势的分布贮存于网络内的各神经元,有很强的鲁棒性和容错性,通过建立基于人工神经网络的预测模型,利用Braincell软件进行计算以期达到精确预测旅游物流需求的目的。
2旅游物流的需求界定
经过多年的发展,关于旅游物流需求的定义至今仍没有一个令各方满意的结论。物流服务贯穿了整个旅游活动过程中,旅游物流可以看作为了使旅游消费者获得更好地满足感和旅游体验,与旅游相关的主体提供让旅游消费者更为畅通流动的旅游服务,与此相应的旅游物流的能力指提供的旅游服务内容以及相关主体使用物流设施对旅游物流活动进行计划、组织、协调和控制的能力,到旅游物流的具体环节,可以从涉及旅游者的吃、住、行、购、游、娱等方面界定旅游相关主体运用物流设施为游客提供旅游服务的能力。文中对旅游物流需求的预测可以从往年的旅游物流能力方面进行预测,通过准确的预测旅游物流需求可以较好地规划未来年份旅游业发展方向,对物流设施和设备进行准确的投入,减少资源的浪费及设施投入不足的状况。
旅游物流能力是指旅游服务主体向旅游消费者从“吃、住、行、购、游、娱”6个方面提供服务的能力,旅游物流需求可根据这6方面来选取指标,但是旅游物流需求预测的准确性不仅受到旅游物流的独特性的制约,还受到一些客观性条件的影响。如物流统计制度不健全,目前,我国仍没有建立系统全面的物流统计制度,更没有涉及旅游物流领域;物流统计没有涉及物流活动的全过程;物流统计指标过于单一。此外,国内只有基本的货物运输量和货物周转量统计,其他与物流相关的指标没有公开的统计资料,也没有权威的统计方法和基础数据,致使物流需求预测不能通过直接指标来衡量需求规模的大小。
3基于神经网络的旅游物流需求预测模型的建立
神经网络具有非线性、曲线拟合能力、学习能力和抗干扰能力,是一种通用的非线性函数逼近工具。通过对BP神经网络的训练,特别适用于构造非线性预测函数,而且精度可达到预定的要求。
31预测领域中的BP神经网络模型简介
BP神经网络通过正向输入,反向传播误差不断迭代的学习过程,直到误差减到可以接受的程度。一般包括输入层、隐含层和输出层的单隐含层网络就能以任意精度表示并揭示任何连续函数所蕴含的非线性关系。其中:
(1)工作信号正向传播。输入信号从输入层经过隐含层,传向输出层,在输出端产生输出信号,这是工作信号的正向传播。在信号的正向传播过程中网络的权值是固定不变的,上一层神经元的只影响下一层神经元的状态,即正向影响。如果在输出层不能得到期望的输出,则转入误差信号反向传播。
(2)误差信号反向传播。网络的实际的输出与所期望的输出之间差值即为误差信号,误差信号由输出端开始逐层向前传播,即误差信号的反向传播。在误差信号反向传播中,神经网络的权值根据误差的反馈进行调节。通过不断地对权值的修正,使实际输出更加接近期望输出。
(3)预测神经网络流程。通过了解工作信号与误差信号的传播方向,可以清楚地了解预测神经网络的工作流程。预测开始时神经网络读入样本、权值,通过计算输入层的输入得出结果传递到输出层,在输出层进行计算,最后在计算输出值与期望值的误差。若误差小于确定值则计算结束,若误差大于确定值则继续回到前两层进行权值调整,把调整后的权值重新输入到模型中,直到误差小于设定的确定值。
本文应用Braincell神经网络软件来实现神经网络的计算与分析。
32BrainCell软件及实现
321BrainCell 神经网络基本原理
BrainCell 神经网络采用误差反向传播学习算法,算法从两个方面(信号的前向传播和误差的反向传播)反复进行迭代学习,与神经网络预测模式基本原理相同。
322BrainCell 神经网络实现步骤
(1)数据的预处理和后处理。为方便的计算减少误差,保证数据同一量纲,需要将数据归一化为区域[0,1]之间数据。在实际的预测模型中当数据接近0或1的时候训练效果会明显下降。因此,为了避免数据落入最大饱和区,保持数据的原有特征,根据经验将数据规范到[015,085]来进行修正。模型中采用反归一化处理输出数据。
(2)网络层数目的确定。由Kolmogorov定理可知,含有一个神经元隐含层的三层神经网络可以从任意精度逼近一个从输入到输出的映射关系,因此在Braincell神经网络中采用含有单隐层的三层神经网络[2]。
(3)网络节点的确定。输入层节点的多少与评价指标个数是相对应的。
(4)网络训练。假设训练样例是形式(x,y),其中x为输入向量,y为输出值。N为输入节点数,M为输出层节点数。从单位i到单位j的输入表示xij,单位i 到单位j的权值表示Wij。一是创建具有N 个输入单位,M 个输出单位的BrainCell 神经网络;二是用随机数(0 或1)初始化某些数字变量网络权值Wij;三是对于第k个训练样例(a,b),把入跟着网络前向传播,并计算网络中每个单元x的输出Qx,使误差沿着反向传播;四是对于每个输出单元u,计算它的误差项;五是对于每个隐含单元h,计算它的误差项;六是利用误差项更新调整每个网络权值;七是重复三到六点,直到完成指定的迭代次数或者是其误差值达到可接受的范围。
33神经网络的旅游物流需求预测模型的建立
331模型中数据指标确定
目前我国仍没有健全的物流统计制度,因此实际工作中收集旅游物流需求数据十分困难。这里采用间接指标法――利用与旅游物流需求相关的经济指标来建立旅游物流需求的经济指标体系,通过数学的方法进行总结与推导,确定旅游物流需求模型。
旅游物流需求是一种派生需求,这种需求的大小与其本身发展有着密切的关系。从宏观层面上考虑主要有内外两部分因素:旅游业自身发展的状况及外部环境的影响。从微观层面来说,旅游业自身发展的状况是旅游物流需求的关键因素。旅游业产值越高,旅游物流需求增长随之增加,反之亦然。由此,本文选取旅游总收入和接待人数作为预测旅游物流需求的指标。其次,影响旅游物流的其他关键因素就是旅游行业本身所投入的设施、人员、公路铁路旅客周转量等因素。根据旅游物流能力的理解从“吃、住、行、购、游、娱”等方面进行指标的选取,如“吃、住”方面使用餐饮住宿从业人数、星级饭店数目衡量;“行”使用公路、铁路旅客的周转量来衡量等;“游”则使用旅行社从业人数等方面来衡量。这些因素都对行业的产值有较大的影响。因此,在模型中可将这些相关经济指标作为旅游物流需求规模的影响因素。由此可选择如下输入层指标:星级饭店数X1、接待入境旅游者平均每人消费额X2、餐饮住宿业从业人数X3、旅行社从业人数X4、铁路旅客周转量X5、公路旅客周转量X6、旅游部门游船年末实有船数X7,旅游部门旅游客车年末实有数X8,共有8个。而把旅游业的年收入Y1与年接待入境旅游者人数Y2作为物流需求预测的目标。
332数据来源
本文选取的数据资料来源于广西壮族自治区历年统计年鉴、中国统计年鉴、中国旅游年鉴,如表1所示。根据样本数据选取原则,将2005年和2012年的数据作为网络测试样本,最后用训练好的神经网络预测2014―2016年的物流需求规模。
333广西旅游物流需求的BP人工神经网络模型
(1)样本数据的归一化处理。选取X1,X2,X3,X4,X5,X6,X7,X8作为广西旅游物流需求预测BP人工神经网络模型的输入,Y1,Y2为BP网络的输出。根据BP 的本身特点,对输入层数据进行归一化时,采用如下公式:y=log[JB((]x[JB))]/10。对输出层数据则使用归反一化处理,公式如下:P=log[JB((]tT[JB))]/10。
(2)网络节点的确定。根据构建好的评价指标体系,可以确定输入层的节点数为8,输出层的指标数为2。
(3)网络训练。以traindx作为训练函数,利用matlab计算。可知在最大训练次数为200次,目标误差为001,学习率设置为003,误差曲线收敛于目标001,进过45次迭代后,网络达到目标要求,训练误差图见下图。
训练误差图
通过设置的数据,使用Braincell软件对数据进行训练,选取全部数据作为样本数据组,2010―2013年的样本作为将预测样本,输入模型可得2010―2013年的预测值见表2。
据表3可以看出,预测效果较好,一般来说,对于经济指标的预测,误差能够控制在3%以内就算比较准确。因此,基于与旅游物流相关的其他经济数据来建立BP神经网络模型预测旅游物流需求有一定的实用价值。
4结论
根据人工神经网络理论建立的旅游物流需求预测模型,通过Braincell神经网络的自学习特征,运用traindx函数进行训练,在训练过程中对权值进行不断修正,误差比率控制合适的在范围内,使网络的实际输出向量逐渐地接近期望的输出值。最后把仿真的预测结果与真实量进行初步比较分析,得出的结果能够证明使用神经网络模型对旅游物流的预测精度较高。因此可以得出以下的结论:用BP神经网络建立模型,可以准确地把与旅游物流相关的经济数据与目标本身的需求量进行结合,可得到较为精准的旅游物流需求预测值。由此可以推断,人工神经网络作为高度的非线性体系,能够对经济系统中个变量之间的非线性关系进行高精度的预测,将其运用在物流领域中的应用具有更加广阔的发展潜力。
参考文献:
[1]王新利,赵琨基于神经网络的农产品物流需求预测研究[J].农业技术经济,2010(2):64-66
[2]秦立公,韦金荣等基于BrainCell 的B2B 电子商务供应链协同绩效评价体系[J].中国集体经济,2014(15):112-113
[3]张圣楠,郭文义,等基于MATLAB的BP神经网络的设计与训练[J].内蒙古科技与经济,2005(17):96-98
[4]熊勋人工神经网络在环境质量评价和预测中的应用研究[D].武汉:华中科技大学,2009
[5]白平,陈菊红基于旅游物流能力的西部旅游发展研究[J].新疆大学学报,2013(41):16-17
[6]秦立公,王东,等旅游景区物流能力优化研究[J].现代商业,2010(24):47
1模型介绍
1.1BP神经网络预测模型神经网络是由大量简单的神经元相互连接构成的复杂网络系统,其对非线性系统具有很强的模拟能力。BP神经网络即误差反向传播网络是目前应用最为广泛的网络算法,学习过程由信息的正向传递与误差的反向传播2个过程组成,3层(输入层、隐含层、输出层)的前向BP神经网络可以任意精度逼近任意非线性函数,且运用神经网络只需建立输入和输出之间的网络关系就可对目标值进行模拟预测,所以用BP神经网络对大型机电设备备件需求进行预测是十分有效的。研究采用3层网络模式对大型机电设备备件需求进行模拟预测,这里选择为n个样本的输入点,对应1个输出值。其网络拓扑结构如图1所示。BP神经网络预测模型参数(如隐含层数,最大训练次数,学习精度,隐节点数,初始权值、阈值等)的确定要靠网络训练来实现。实现算法的软件载体为MAT2LAB6.5.1。训练步骤可表述如下:1)样本数据和测试数据进行归一化。使用归一化函数PREMNMX;2)取-1~1间的随机数作为初始的权值和阀值并给定精度ε,有ε>0;3)对n个训练样本顺序输入神经网络,计算;4)计算E(n)的值,并与给定精度ε比较,若E(n)<ε则停止训练,否则继续;5)比较连续两次的误差值,调整学习率δ。输入层与隐含层、隐含层与输出层的权数与阀值分别调整为:已知输出层的神经元Y,对Y反归一化(反归一化函数POSTMNMX),即得到预测的需求数据。
1.2马尔科夫链预测模型马尔科夫链是一种特殊的随机过程(马尔科夫过程),其可以根据系统当前时刻的状态推求下一时刻的状态概率分布,进而得到下一时刻的状态。其基本原理是:按照某个系统的发展,时间可离散为n=0,1,2,3,对每个系统的状态可用随机变量表示,并且对应一定的概率,称为状态概率。当马尔科夫过程由某一时刻状态转移到另一时刻状态时,在这个转移过程中存在着概率的转移,称为转移概率。马尔科夫链预测的理论基础是马尔科夫过程。对其运动变化的分析,主要是通过研究链内有限个马尔科夫过程的状态及其相互关系,进而预测链的未来发展状况。马尔科夫链预测的结果为一取值范围,适合于对随机波动性较大的预测问题进行修正描述。马尔科夫链预测模型可表示为。
1.3基于马尔科夫链修正的BP神经网络预测模型BP神经网络的优势在于短期预测,缺点在于其对长期预测和波动较大数据序列的拟合较差。神经网络模型具有局部逼近的特性和较强的非线性映射能力,能够很好地模拟具有较强非线性变化特点的大型机电设备备件需求预测问题,其缺点在于收敛速度慢、训练时间长且易陷入局部极小问题。马尔科夫链预测的对象是一个随机变化的动态系统,且能够缩小预测区间,对长期预测和随机波动较大数据序列的预测效果较好。但是采用马尔科夫链预测时,要求预测对象具有平移过程。因此,采用马尔科夫链修正BP神经网络,形成基于马尔科夫链修正的组合BP神经网络预测模型,不仅能揭示数据序列的发展变化总趋势,又能得到预测区间的状态变化规律,提高模型的预测精度。根据BP神经网络的预测结果,选取适当的标准(这里采用预测结果的相对误差)将预测数据序列划分为若干个状态区间;计算其一步转移矩阵,求得一步转移概率矩阵;确定预测的状态向量,代入(5)即可求得基于马尔科夫链修正的预测值。马尔科夫链修正的BP神经网络预测模型流程如图2所示。将所提及的预测方法应用于某风力发电设备的供应商。选择该供应商在2011年5月至2012年12月某型号风力发电设备相关的备件需求的时间序列数据作为研究对象。
2实例验证
2.1BP神经网络备件需求预测在对样本试验前,首先将样本分成独立的两部分训练集和测试集。其中训练集用来估计模型,确定神经网络的大概层次和节点数的大致范围,以2011年5月至2012年5月的需求数据作为分析对象。测试集则检验最终选择的组合模型的性能,以2012年6月至2012年12月的需求数据为验证对象。BP神经网络中相关参数设置为:输入层为5个结点、隐含层为1层(包含10个结点)、输出层为1个结点,即表示在滚动预测中n=5,k=1;最大训练次数为1000次,最大循环间隔数为50次;训练收敛误差为0.001。经计算,BP神经网络预测值见表1。
2.2马尔科夫链修正误差残值根据实际值与BP网络预测值之间相对误差的大小和分布密度,将其划分为4个状态,见表2。根据表2可以确定训练样本相对误差所处的状态,结果见表2。根据表1和表2,由式(5)和式(6)可以计算出一步状态转移矩阵为:根据表1和表2,由式(5)和式(6)可以计算出一步状态转移矩阵为。由表1中各年的状态划分结果确定对应的状态向量,结合P(1)代入式(5),得基于马尔科夫链修正的BP神经网络预测模型的预测结果表3所示。从修正结果可以看出,马尔科夫修正BP神经网络模型可以提高预测精度,使得修正值更接近于实际值。
3结论
关键词:Elman神经网络;松散回潮;出口含水率;预测
中图分类号 S572 文献标识码 A 文章编号 1007-7731(2016)08-118-03
1 引言
在卷烟制造过程中,制叶丝的过程含水率控制是制丝生产中的关键参数,在烘丝前的含水率控制主要通过松散回潮工序中加水比例调节。不同的加水比例下松散回潮机的出口片烟含水率不同,最终将导致烘丝入口叶丝含水率的差异。因此,调节松散回潮加水比例控制松散回潮出口含水率在制丝过程中具有重要意义。董伟等[1]采用PID反馈控制修正加水量,曹正良[2]将反馈控制改进为前馈控制方式,二者均从控制的角度出发,优化控制算法,调节加水比例。李秀芳等[3-5]则采用过程参数优化的方式,通过过程参数优化,调节加水比例。以上2种方法均对松散回潮机出口片烟含水率的调节作出了一定优化,但2种方法均从内部角度考虑,而忽略了环境温湿度等外部条件对出口片烟含水率的影响。
为此,本研究通过对历史生产数据的分析,采用基于双隐含层的Elman神经网络建立松散回潮机加水比例预测模型,然后再获取当前环境温湿度下,通过大量模拟加水比例输入,找出相应输出中与设定出口含水率设定值最接近的加水比例作为生产过程参考加水比例,利用该加水比例进行生产,保障出口片烟含水率与设定值的误差得到改善。
2 Elman神经网络算法
Elman神经网络是J.L. Elman于1990年首先提出来一种典型的局部回归网络[6]。Elman网络是一个具有局部记忆单元和局部反馈连接的前向神经网络。Elman神经网络的网络结构如图1所示,由输入层、中间层(隐含层)、承接层和输出层构成,其中输入层、中间层和输出层和传统BP神经网络相同,但Elman神经网络多了一个承接层,用于保存上次输入后中间层的状态连同输出数据[7-9]。增加承接层后,Elman网络比传统BP神经网络具有更复杂的动力学特性,因而具有更强的计算能力,稳定性也优于BP神经网络。隐层的传递函数仍为某种非线性函数,一般为Sigmoid函数,输出层为线性函数,承接层也为线性函数[10]。
3 基于双隐含层Elman神经网络的松散回潮出口含水率控制预测模型
3.1 网络参数选择 以松散回潮加水比例、相应环境温湿度为输入,出口烟叶含水率为输出,设定训练目标0.05,训练速度0.01,最大训练步数100,以Sigmoid函数为传递函数,进行神经网络训练。对于Elman神经网络的神经元个数及隐含层个数的确定,首先通过对不同神经元个数分别进行10次运行,结果如表1,选取10次运行对应的决定系数平均值作为评价标准,从结果可知选取8个隐含节点的测试集决定系数平均值最大。再对不同层数的隐含层各进行10次运行,结果如表2,同样采用10次运行对应的决定系数平均值作为评价标准,从结果可知选取2个隐含层的测试集决定系数平均值最大。
3.2 模型预测效果检验 采用该神经网络对松散回潮机出口烟叶含水率进行预测,预测结果如图3。由图3可知,采用该神经网络模型预测120个样本的松散回潮机出口烟叶含水率预测曲线和实际数据曲线吻合度较高。且从误差数据计算可知,预测误差为0.149%。所有预测结果误差均控制在0.5%以内,准确预测(误差在±0.3%)比例为89.171%,能满足松散回潮工序出口含水率为(设定值±0.5)%的允差要求。
3.3 与多元回归分析拟合模型相比较 图4为采用多元回归分析方法建立的松散回潮机出口片烟含水率线性模型,用于预测的效果。预测误差为0.268%,大于本文方法的0.149%,存在个别预测误差大于0.5%,且准确预测比例为77.5%低于本方法的89.171%。
3.4 松散回潮加水比例预估方法 建立松散回潮出口含水率预测模型后,由于神经网络模型为非显性模型,因此可以考虑采用逼近法,不断尝试不同加水比例输入,比较输出与设定值的误差,取满足要求的加水比例作为加水比例预测结果即可,方法如图5。
4 结论
采用基于Elman神经网络模型建立松散回潮机出口片烟含水率预测模型,该方法建立的预测模型预测效果优于传统多元回归分析建立线性模型的预测效果。再通过逼近法给出了当前环境温湿度下,指定松散回潮机出口含水率所对应的加水比例预测值。采用该方法所确定的松散回潮加水比例生产,提高了松散回潮机片烟出口含水率的控制效果。
参考文献
[1]董伟,李坤,王健,等.HAUNI松散回潮滚筒含水率控制系统的改进[J].烟草科技,2012(11):20-22.
[2]曹正良.片烟松散回潮含水率控制方式的改进[C]//2010年中国烟草学会工业专业委员会烟草工艺学术研讨会论文集,2010.
[3]李秀芳.烟片松散回潮关键工艺参数过程控制系统的优化设计[J].中国烟草学报,2015(3):34-41.
[4]俞仁皓,宋家海,王建,等.松散回潮工序回风温度PID控制参数的优化[J].烟草科技,2010(7):8-10.
[5]赵国庆,米强,钟青,等.因素筛选试验在松散回潮和筛分加料工序质量评价中的应用[J].烟草科技,2007(11):24-27.
[6]王俊松.基于Elman神经网络的网络流量建模及预测[J].计算机工程,2009,35(9):190-191.
[7]钱家忠,吕纯,赵卫东,等.Elman与BP神经网络在矿井水源判别中的应用[J].系统工程理论与实践,2010,30(1):145-150.
[8]周云龙,陈飞,刘川,等.基于图像处理和Elman神经网络的气液两相流流型识别[J].中国电机工程学报,2007,27(29):108-112.
[9]王宏伟,杨先一,金文标,等.基于Elman网络的时延预测及其改进[J].计算机工程与应用,2008,44(6):136-138.
[10]范燕,申东日,陈义俊,等.基于改进Elman神经网络的非线性预测控制[J].河南科技大学学报(自然科学版),2007,28(1):41-45.
【关键词】数据挖掘 异常数据挖掘 人工智能
1 引言
人工智能用于异常数据检测的方法很多,传统的如基于统计(statistical-based)的方法、基于距离(distance-based)的方法 [1]、基于密度(density-based)的方法[2],基于聚类的方法[3]等。但这么传统的异常数据检测方法仍然存在着一些缺陷与不足。基于统计的数据检测方法要求预先知道被检测数据的分布情况,基于距离的方法中距离函数与参数的选择存在较大的困难,基于密度的数据检测方法方法时间复杂度较高,这些问题极大地限制了异常数据挖掘算法在现实中的应用。本文重点论述人工智能方法用于异常数据挖掘的发展史,分析和比较各自的优缺点。
2 常用于异常数据挖掘的几种人工智能方法的分析
2.1 神经网络方法
神经网络模型主要由三层结构组成,主要包括输入层、隐含层和输出层。第一层为输入层,输入层的节点代表多个预测变量,输出层的节点代表多个目标变量,位于输入层和输出层之间的是隐含层,神经网络模型的复杂度取决于隐含层的层数和节点数。每一层的节点都允许有多个。神经网络模型主要用于解决回归和分类两类问题,其结构图如下图所示。
从上图可得,节点X1,X2,X3作为神经元的输入,代表多个预测变量,它可以是来自神经网络的信息,也可以是另一个神经元的输出;W1,W2,……,Wn是神经元的权值,表示各个神经元的连接强度。通过神经网络模型的结构图可知,该方法的实现过程:首先将每个训练样本的各属性取值同时赋给第1层即输入层;各属性值再结合各自的权重赋给第2层(隐含层的第1层),第1层隐含层再结合各自的权重输出又作为下一隐含层的输入,最后一层的隐含层节点带权输出赋给输出层单元,输出层最终给出各个训练样本的预测输出。
2.2 蚁群聚类算法
在数据挖掘中,聚类是一个活跃的研究领域,涉及的范围较广。许多计算机学者们通过模仿生物行为提出一系列解决问题的新颖方法。蚂蚁搜索模式样本所归属的聚类中心的概率计算公式如式(1)。
(1)
其中,α,β为参数,初始聚类中心为随机选取的k个模式样本点。τ(i,j)为样本Xj到聚类中心mj之问的信息素i=1,2, …,n,j=1,2, …,k ;η(i,j)为启发函数,其表达式如式(2)所示。
(2)
其中,dj为模式样本Xj到聚类中心mj的欧氏距离为(i=1,2, …,n,j=1,2, …,k)。
蚂蚁搜索整个模式样本空间,形成一个聚类结果后,聚类中心mj各分量的值为该类Cj中模式样本各属性的均值,计算公式如(3)。
(3)
2.3 基于知识粒度的异常数据挖掘算法
粒计算是人工智能领域新发展起来的一个研究方向,该方法针对不确定性信息进行处理。它主要包括三种模型,分别是粗糙集模型、模糊集模型与商空间模型。该方法的基本思想是利用不同粒度上的信息进行问题求解。该理论在多个领域得到了广泛的应用,如数据挖掘、决策支持与分析和机器学习等。知识粒度为异常数据挖掘处理不确定性数据提供一种新的解决方法。基于知识粒度的异常数据挖掘算法,该算法不需要预先知道数据的分布情况,并且采用知识粒度度量各个对象间的距离与异常度时,能有效挖掘出异常数据。
3 各方法的比较
通过以上各种方法的分析,各种方法具有各自的优点以及不足之处。基于聚类的数据挖掘方法侧重与于聚类的问题,该问题极大地限制了该算法在实际生活中的应用。神经网络方法用于数据挖掘,是人工智能中较早应用于数据挖掘领域的方法之一,能够较好的进行异常数据的挖掘,但是该方法的层数的确定比较困难,同时该方法的时间复杂度比较高;蚁群聚类算法是在聚类算法的基础上改进推广而得,能够达到异常数据检测的目的,但该算法的收敛速度慢,而且算法存在随机移动而延长聚类时间。
4 结束语
异常数据挖掘研究是一个有价值的研究问题,近年来引起越来越多的学者关注和研究,从而使得异常数据挖掘算法取得了新的进展,在生态系统分析、公共卫生、气象预报、金融领域、客户分类、网络入侵检测、药物研究等方面得到了广泛的应用。希望本论文中的方法可以给读者提供更多异常数据挖掘方面的思路,并且能够很好的将人工智能中的方法运用异常数据挖掘中,克服各种方法不足,让人们能够更好的应用。
参考文献
[1]Knorr E. Alothms for Mining Distance based Outliers in Large Datasets[C] //Very Large Databases(VLDB’98). New York: Proc of Int Conf, 1998: 392-403.
[2]Breunig M M, Kriegel H P. Sander, LOF: Identifying Density-Based Local Outliers[C]// ACM SIGMODC onference Proceedings. [S.I]:[s.n.],2000.
[3]王鑫等.数据挖掘中聚类方法比较研材[D].济南:山东师范大学管理学院,2006.
[4]魏海坤,徐嗣鑫,宋文忠.神经网络的泛华理论和泛化方法[J].自动化学报, 2001,27(6):806-814.
[5]庞胜利,吴瑰丽.人工神经网络在大型桥梁健康监测系统中应用研究[J].石家庄铁道学院学报,2002,15(2):63-65.
[6]金微. 蚁群聚类算法分析[J].计算机光盘软件与应用,2011,(13):199, 202.
[7]陈玉明,吴克寿,孙金华.基于知识粒度的异常数据挖掘算法[J].计算机工程与应用,2012, 48(4):118-121.
[8]苗夺谦,王国胤,刘清等.粒计算:过去、现在与展望[M].北京:科学出版社, 2007.
[9]苗夺谦,范世栋.知识的粒度计算及其应用[J].系统工程理论与实践,2002, 22(1):48-56.
【关键词】 数据挖掘 信用风险 决策树 支持向量机
一、引言
我国上市公司是整个国民经济整体的一个有机组成部分,甚至可以说是整个国民经济的核心所在。至2008年底,沪深两市的股票总市值在缩水62.9%的情况下仍达到12.13万亿,占GDP的48.6%。从这些数据可以看出,上市公司在我国经济中占有主体地位,因此,上市公司的优劣存亡将关系到整个国民经济的发展。然而,我国上市公司所积累的信用风险已经非常巨大,在深交所的诚信档案里仅主板市场就列出了20页的违规通报批评和处分决定。就国有企业而言,信用危机依然存在,突出的表现就是恶意拖欠逃债现象。企业信用风险状况直接关系到我国金融市场的健康发展和国民经济的持续稳定。可见,对上市公司信用风险的管理是非常必要和迫在眉睫的,而上市公司信用风险评估模型的建立是防范信用风险的重要手段。因此,研究上市公司信用风险评估这一课题,已经成为我国目前经济生活中亟待解决的一个重要问题。
目前许多定量技术和支持工具、软件已付诸商业应用,继传统的比例分析之后,统计方法得到了广泛的应用,如判别分析和Logistic回归等。信用等级评估是通过对企业或个人的某些单一财务指标进行加权平均确定的,该方法最大的缺陷在于指标和加权值的确定带有很大的主观性,使得评估结果和实际状况有很大的出入。因此,需要引入科学方法来确定有效评估指标,并建立准确的定量模型来解决信用等级评估的问题。近年来,信息技术得到了迅速发展,如数据挖掘技术等能从海量数据中智能发现有用的规则和知识,再加上我国上市公司信息披露制度的不断完善,使得我们的研究能够得到的数据资料也不断的增多,这些有利条件的出现使得我们对基于数据挖掘的上市公司信用风险评估模型的研究有了数据基础和技术基础。
二、基于数据挖掘的信用风险评估模型比较综述
1、决策树
决策树方法于20世纪60年代起源于对概念学习建模;20世纪70年代后期Quinlan发明用信息增益作为启发策略的ID3算法,从样本中学习构造专家系统;1993年Quinlan在ID3算法基础上研究出了改进的决策树归纳包(C4.5),这是目前被普遍采用的数据分类方法。其思想是一个类似于流程图的树结构,其中每个内部结点表示在一个属性熵的测试,每个分支代表一个测试输出,而每个树叶节点代表类或类分布。决策树通过把实例从根节点排列到某个叶子节点来分类实例,叶子节点即为实例所属的分类,树上每个节点说明了对实例的某个属性的测试,节点的每个后继分支对应于该属性的一个可能值。决策树分类模型之所以被广泛应用于信用风险评估,主要是因为决策树具有以下优点:(1)与神经网络或贝叶斯分类等其他分类模型相比,决策树的分类原理简单易懂,很容易被使用人员理解和接受。在决策树分类过程中,一般不需要人为设定参数,更适合于知识发现的要求;(2)决策树的学习算法具有建立速度快、计算量相对不是很大、可以处理连续值和离散值属性;(3)决策树能使用信息原理对大量样本的属性进行信息量分析,计算各属性的信息量,找出反映类别的重要属性(可以清晰的显示哪些属性对分类比较重要);(4)决策树分类方法与其他分类模型相比,易于生成可理解的规则。决策树方法对记录数越大的数据库,它的效果越明显,这就是它显著的优点。
研究表明,一般情况下,树越小则树的预测能力越强。要构造尽可能小的决策树,关键在于选择恰当属性。而属性选择依赖于各种对例子子集的不纯度度量方法。其中,基于数据挖掘中决策树C4.5算法的分析框架建立的上市公司信用风险评估模型,对数据分布无任何要求,应用于上市公司信用风险评估的效果比较好,因此具有良好的发展前景,值得我们深入研究。
2、神经网络
BP网是面向映射变换的神经网络中应用最广泛的一种,其结构如图1所示。典型的BP网有三个层次:输入层、隐含层和输出层,相邻层次神经元间采用全互连形式,同层神经元间则不相连。其思路是:当给网络提供一个输入模式时,该模式由输入层传到隐含,经隐含层神经元作用函数处理后传送到输出层,再经由输出层神经元作用函数处理后产生一个输出模式。如果输出模式与期望的输出模式有误差,就从输出层反向将误差逐层传送到输入层,把误差“分摊”给各神经元并修改连接权,使网络实现从输入模式到输出模式的正确映射。对于一组训练模式,可以逐个用训练模式作为输入,反复进行误差检测和反向传播过程,直到不出现误差为止。这时,BP网完成了学习阶段,具备所需的模式分类(识别)能力。
20世纪80年代末,西方发达国家将人工智能引入银行业,协助银行进行贷款决策,这其中,尤其以人工神经网络最为突出,其在企业财务分析中显示了巨大的优势和潜力。而在我国,无论是用统计方法还是用神经网络技术来研究信用风险,目前都尚处于起步阶段。王春峰等(1999)用神经网络技术进行商业银行信用风险评估;郝丽萍等(2001)研究了商业银行信贷风险分析的人工神经网络模型;柳炳祥、盛昭翰(2003)利用粗神经网络对企业财务危机进行了分析;庞素琳等(2003)利用BP算法对我国某商业银行2001年120家贷款企业进行3类模式(“信用好”、“信用一般”、“信用差”)分类,分类准确率达到83.34%;张德栋、张强(2004)建立了基于BP神经网络的企业信用3层神经网络评估模型,实验结果证明,该模型用于企业信用评估,减少了企业信用评估传统的定性方法中权重确定的人为因素,评估正确率达到了92.12%;王凯、黄世祥(2007)建立起基于BP神经网络的行业间信用评估模型,并代入2003年度全国农业和工业的部分行业数据进行实证。
神经网络由于其自身优势已经在各个领域得到了广泛的应用,近几年来,经济学和管理学方面的学者将其运用到经济领域,特别是在信用风险评估方面取得了很好的成效。尤其BP神经网络在商业银行信用风险评估上应用的可行性,其优点主要体现在:(1)BP神经网络模型具有高速信息处理能力。信用风险评价是一个非常复杂的系统,简单的信用风险打分模型不能很好地表述这种关系,同时结果与实际也有较大的差别。而神经网络是由大量的神经元广泛互连而成的系统,并行处理能力很强,得到的模型能对实际作出很好的预测。(2)BP神经网络模型具有很强的不确定性信息处理能力。由于神经网络中神经元个数众多以及整个网络存储信息容量巨大,使得它具有很强的对不确定性信息的处理能力。而信用风险本身就有一种不确定性,信用风险评价指标体系涉及指标众多,这些变量本身就具有一种动态性和不稳定性。运用BP神经网络模型进行预测可以很好地解决这种不确定性。(3)BP神经网络模型是一个具有高度非线性的系统。神经网络同现行的计算机不同,它是一种非线性的处理单元,因此神经网络是一种具有高度非线性的系统。在信用风险评估运用上,它突破了传统信用风险评估方法以线性处理为基础的局限性,能更有效、更精确地处理复杂信息。但是,神经网络也存在明显的不足。首先,当神经网络的输入维数高时,隐含规则呈几何级数增加,致使网络结构庞大,同时神经网络学习速率固定,存在局部最小点问题,因此网络收敛速度慢,需要很长的训练时间,甚至可能发生网络瘫痪;其次,网络结构复杂,导致网络的输入节点单元数、隐含层数的确定缺乏理论依据。尽管存在一些遗憾,神经网络方法作为一门崭新的信息处理科学方法仍然吸引着众多领域的研究者。
3、支持向量机
支持向量机(Support Vector Machine,SVM)是根据统计学习理论得出的一种新的机器学习算法,它用结构风险最小化原则替代经验风险最小化原则,较好地解决了小样本学习问题,是一种通用的前馈网络类型。支持向量机的实现是通过某种事先选择的非线性映射(核函数)将输入向量映射到一个高维特征空间,在这个空间中构造最优分类超平面。使用SVM进行数据集分类工作的过程首先是通过预先选定的一些非线性映射将输入空间映射到高维特征空间,它使得在高维属性空间中有可能对训练数据实现超平面的分割,避免了在原输入空间中进行非线性曲面分割计算。SVM数据集形成的分类函数具有这样的性质:它是一组以支持向量为参数的非线性函数的线性组合,因此分类函数的表达式仅和支持向量的数量有关,而独立于空间的维度。
随着机器学习理论的不断发展,支持向量机作为一种专门针对小样本学习的算法被引入到了信用风险评估中。在我国,张秋水、罗林开等(2006)通过SVM与传统的多元线性回归(Multi Linear Regression,MLR)和Logit分析(Logit Analysis,LA)的实证对比和模型分析,得出SVM在20组测试样本集上的平均误判率是最低的,显著优于MLR,也优于LA。吴冲等(2009)建立了基于模糊积分的支持向量机集成方法,该方法综合考虑了子支持向量机的输出重要性并与单个支持向量机和最多投票原则的支持向量机集成进行比较,实证结果表明,该方法具有更高的分类精度。与BP神经网络相比,SVM方法的优缺点是:(1)模型的准确率。SVM是通过解一个凸二次规划来得出结果的,因此找到的解是全局最优解,且精度高,利用支持向量机进行上市公司信用风险评估,根据有限的训练样本,建立了非线性映射关系,解决了维数问题,这种算法具有简单、准确率高的优点,很适合推广。(2)泛化能力。SVM通过结构风险最小化原则实现了经验风险和置信范围的良好折衷,避免了过拟合现象,而人工神经网络是基于经验风险最小化原理。(3)模型的适用性。SVM方法通过对不同的核函数和参数的选择,可以优化评估结果,不同的核函数可以满足不同的需求,模型的适用范围更广。(4)对数据要求。SVM可以避免小样本和“维数灾难”问题,对有限数量和维数较高的样本评估精度较高;而BP神经网络模型由于数据较少,易产生过拟合现象,因而使用范围受限制。(5)核函数也需要人为的确定,尚未有理论证明决定应选择的核函数。
三、结束语
随着信息技术的发展,数据挖掘方法被广泛应用于金融、经济领域,在信用风险方面也受到越来越多的重视。在我国,对上市企业的信用风险评估还是一个很具有挑战性的领域,不仅体现在其信用风险变化的复杂性,还在于评估所面临的巨大工作量。上市企业的信用状况是构成整个社会体系不可缺少的重要部分,因此,解决其信用风险评估问题的首要任务是要建立简单可操作的模型,并充分发挥计算机处理信息等的优势作用。
(注:本文系华东交通大学校立科研基金资助课题《基于数据挖掘的上市公司信用风险评估模型研究》的部分研究成果,课题编号:09GD02。)
【参考文献】
[1] Qualian JR,C4.5: Programs for Machine Learning [J],San Mateo, CA:Morgan Kaufmann Publishers,1993.
[2] Virongrong Tesprasit,Paisarn Charoenpornsawat ,Virach Sornlertlamvanich,A Context-Sensitive Homograph Disambiguation in Thai Text-to-Speech Synthesis,Proceedings ofHuman Language Technology Conference,2003.
[3] 周松林、吴铭:沪深两市总市值全年缩水62.9%[J].金融界,2009(1).
[4] 王春峰、万海晖、张维:基于神经网络技术的商业银行信用风险评估[J].系统工程理论与实践,1999(9).
[5] 郝丽萍、胡欣悦、李丽:商业银行信贷风险分析的人工神经网络模型研究[J].系统工程理论与实践,2001(5).
[6] 柳炳祥、盛昭翰:基于粗神经网络的企业危机预警系统设计[J].信息与控制,2003(1).
[7] 庞素琳、王燕鸣、黎荣舟:基于BP算法的信用风险评价模型研究[J].数学的实践与认识,2003(8).
[8] 张德栋、张强,基于神经网络的企业信用评估模型[J].北京理工大学学报,2004(11).
[9] 王凯、黄世祥:基于BP神经网络的行业间中小企业信用评估模型及应用[J].数学的实践与认识,2007(24).
关键词 基本药物 采购行为 BP神经网络
中图分类号:F713.54 文献标识码:A 文章编号:1006-1533(2013)05-0047-05
2009年国家基本药物制度实施后,国家将执行基本药物集中采购作为实施基本药物制度的评价标准之一,于是各省将原有的药品集中采购分为基本药物和非基本药物两类。2010年11月,国务院《建立和规范政府办基层医疗卫生机构基本药物采购机制的指导意见》,旨在对现阶段较为无序的药品采购行为进行规范,推行科学合理的采购模式,对基本药物采购方面的研究开始得到关注。
现行采购模式是省集中采购平台通过统计各基层医院上报的用药需求之后,再统筹面向中标企业进行集中采购。但是,作为基本药物集中招标采购体系中继招标过程之后的重要环节,采购过程并未得到足够的重视,基于基本药物采购行为的微观研究的理论和文献更是少之又少。在缺乏科学理论和方法支持下的采购决策,容易受主观如采购主体寻租以及客观如厂商合谋等因素干扰而不稳定,这种不稳定带来的滞后效应会掣肘社区卫生服务中心对基本药物的需求预测,继而带来后续基本药物的供需矛盾。除此之外,采购量错误统计或填写不够准确的偶然误差将会进一步加剧这个矛盾。基本药物集中招标采购体系下的基本药物采购在执行过程中有必要加强监督管理和调控。因此,寻找合理与灵活的理论和方法来保证基本药物的采购决策行为的稳定性就成为关注点。
由于BP (Back Propagation)神经网络模型尚未在基本药物招标采购体系中进行相关的理论研究和应用探索,未能发挥其在其他领域中发挥出的功效。本文针对这一环节进行探索,拟在建立BP 神经网络模型的基础上,统计分析社区卫生服务机构的药品使用等特征后,将BP神经网络模型运用到社区医疗机构的需求预测中来,使采购主体在决策时能有更多的支持信息,实现采购数量科学化,从而保证社区医疗机构对基本药物的供应充足,以期从这一环节上减轻民众对基本药物的获取负担,使整个基本药物的供应实现资源优化配置,也可为基本药物集中采购的理论和方法提供借鉴和参考。
1 BP神经网络预测功能的研究
由于人工神经网络是非线性、非局域性和非定常性的复杂网络系统,具有并行分布的信息处理结构和自适应的脑模式的信息处理的本质与能力,它可以通过“自学习”或“训练”掌握大量的知识,完成特定的工作。人工神经网络对建立预测模型十分有效,它能从数据样本中自动学习以前的经验而无需复杂的查询和表述过程,并自动地逼近那些最佳的数据蕴含的规律,它在时间序列预测方面,尤其是高复杂度的非线性时间序列方面明显优于传统的预测方法。在预测方面,目前应用最广泛且较为成功的是前向神经网络。
1.1 BP神经网络基本理论
BP神经网络也称误差反向传播神经网络,为有监督的学习,是梯度下降法在多层前馈网络中的应用。它有一个输入层、一个输出层、一个或多个隐含层。每一层上包含若干个节点,每个节点代表一个神经元。同一层上的各节点之间无连接关系,相邻层采取全互连。信息从输入层开始在各层之间单向传播,依次经过各隐含层,最后到达输出层。
BP算法的学习过程是一个反复迭代的过程,由正向传播和反向传播组成。其算法的基本思想是根据网络输出层的误差,从输出层开始反过来调整网络的权值和阀值,最后使得输出的均方误差最小。经过对一定数量样本进行反馈学习后,网络所持的权值便是网络通过自适应学习得到的正确的内部表示。这时将待识别样本的特征数据输入训练好的网络,则网络就可以对样本的属性进行自动推理和识别。在非线性建模方法中,神经网络理论证明了在选择适当的隐层数及相应的神经元数目下,前馈神经网络能以任意精度逼近任意非线性函数[1]。
1.2 BP神经网络在预测领域的实现
由于BP学习算法本质上是一个非线性优化问题,网络模型的确立分为两个阶段:学习阶段和检验阶段。学习阶段是通过对历史资料的学习,使己有的模式以权系数的方式存储于网络之中,这实质上是一个拟合的过程;检验阶段是将已有历史数据输入网络之中,检验网络输出与实测值的误差是否达到一定的精度要求,如果满足要求,则BP网络可以被用于预测。采用BP网络学习方法进行模拟分析,构造BP网络的基本步骤是:
1) 确定BP网络的输入向量、输出向量的维数和隐含层数及节点数;
2) 确定隐含层传递函数和输出层传递函数关系;
3) 将网络学习样本划分为学习段和检验段;
4) 训练网络,拟合学习段时间序列,使其误差平方和达到最小;
5) 用检验段数据检验训练好的网络模型,利用该模型对未来进行预测。
1.3 BP神经网络在医药行业的应用
BP神经网络在医药行业的应用包括药品采购资金管理、医疗器材需求和药品销售预测3个方面。据文献报道[2-3],出于降低库存,提高管理有效性和运作灵活性的目的,运用BP神经网络对研究对象的历史数据进行分析,得出预测值,并与经验性的实际值进行对比,发现基于BP神经网络进行预测,可以有效节约采购和生产安排的不稳定性,降低库存,从而节约成本,提高效益。
2 BP神经网络在湖北省基本药物采购量预测中的应用
2011年3月13日,湖北省政府办公厅印发《湖北省基层医疗卫生机构基本药物集中采购管理办法(试行)》,标志着该省建立和规范基本药物统一招标采购新机制的出台[4]。在该办法中,实行以省为单位集中采购、统一配送,与药品生产企业签订购销合同,一次完成采购全过程,最大限度地降低采购成本,促进基本药物生产和供应。
2.1 湖北省基本药物采购量预测模型的建立
2.1.1 研究对象及数据准备
湖北省每月采购的基本药物品种有1 000种之多,从理论上来说,为了更好地估计湖北省的基本药物采购量的预测值,需要将每种药物根据其历史采购量来建立预测模型,如此一来会带来巨大的工作量。因此,应选择使用频率比较高、采购比较频繁、使用特点具有相似性的一大类药物品种来进行研究。综合对湖北省每月采购通报的分析,选定药物大类为抗生素类。样本纳入标准为统计期内的采购时间是连续的,并且属于同一大类的不同规格。
本文建模对象及数据见表1。
2.1.2 基本药物采购量神经网络预测模型的实现
在进行神经网络预测之前,为避免原始数据过大造成网络麻痹,要对原始数据进行归一化处理,对于预测值,由于变化幅度较大,也不宜直接作为神经网络的输出。对于单极型Sigmoid函数来说,应用如下归一化处理公式对样本数据进行归一化处理:
2.2 实证检验
湖北省基本药物采购量神经网络模型就是利用神经网络的非线性特性去逼近一个时间序列或一个时间序列的变形,通过神经网络清晰的逻辑关系,利用过去时刻的值去表达未来时刻的值。本文以湖北省部分基本药物品种采购量为数据,以月度基本药物采购量为预测目标,用上述的建模方法建立月度基本药物采购量预测模型。
第一步,建立预测模型,对归一化的数据用MATLAB中提供的函数进行学习(图1),学习程序如下:
net=newff(minmax(P), [8 1], {'tansig', 'purelin'}, 'traingdx', 'learngdm');
net.trainparam.epochs=10 000;
net.trainparam.goal=0.005;
net.trainparam.show=500;
[net, tr]=train(net, P, T);
首先,我们设定的隐层节点数为8,目标误差为0.005,学习率设置为0.01,网络经过222次迭代之后达到了指定精度,误差为0.004 966 8。再分别设定隐层节点数为:6,8,12,15,20;目标误差不变,仍为0.005,学习结果如表2所示。
结合学习次数和误差的比较,可以得出在隐层节点数设为15时,学习效果较好。
由17个月样本药品的采购量数据P为训练值,以第17个月的采购量为目标值,进行训练。由于2012年12月的采购量未知,如果要预测第18个月采购量则无法用实际的数据进行检验。因此在预测值调整为第17个月的采购量数据。测试程序如下:B=sim(net, T)。
误差为[0.024 9, -0.118 5, -0.170 7, -0.242 2, -0.040 5, 0.143 9, -0.047 5, 0.078 3, -0.066 6, -0.057 3, -0.036 6, 0.003 2, -0.043 6, -0.009 9, 0.020 5, -0.031 0, -0.016 8, 0.057 3, -0.025 1, 0.018 0, 0.036 4, -0.218 0, -0.159 0, -0.112 9, -0.014 81, -0.120 8, 0.134 9, -0.043 6]。误差均在可接受的范围内,认可数据已得到很好的训练,具备较好的仿真能力。
学习的误差基本上在我们可以接受的范围内,其学习效果如图2所示。通过前面己经验证,该网络的学习能力以及预测能力有很大的优越性。
2.3 预测结果分析
通过反归一化公式:得到第17个月即2012年11月各药品的采购值。将2012年11月的实际采购量与实证检验建立模型后所得到的预测中结果进行比较,结果见表3。
从表3中我们可以看出,除了个别品种误差较大以外,如注射用苯唑西林钠为530.21%、硫酸奈替米星注射液为52.60%,阿莫西林胶囊为42.89%,BP神经网络模型对基本药物的采购量的预测误差率大多数在10%以下,经Excel数据分析工具中成对双样本均值t检验分析,结果见表4。
因为P > 0.05,故预测值与实际值均值差异无统计学意义。
模型预测结果是比较令人满意的。由于在本次研究中药品采购量的变化是在时间序列上面进行的,所采取的预测方法是单步预测,每月的药物采购量还要受很多因素影响,不可能做到预测结果与实际的数据完全一致。除此之外,基本药物制度实施的时间并不长,在湖北省基本药物集中采购平台上所获取采购量的数据时间范围也不长,所以个别药品误差的较大偏倚也在预料之中。
根据计算得出的结果,可以很好地预测一个月或几个月内内湖北省的基本药物采购量,相关基本药物生产企业可以根据预测结果做好生产计划安排和原料采购等工作,提高企业生产运作效率和经济效益;基本医疗机构可以根据情况调整药物储备和使用量,以使基本药物的利用率和可及性都能得到很好的保障。
3 总结与展望
本文对湖北省2011年5月-2012年11月抗生素大类的部分基本药物品种的采购量预测进行了定量分析,主要采用了BP神经网络法进行预测的实证研究,不仅简化了网络结构,而且提高了预测精度。结果比较理想,说明本文所建立的基于BP神经网络预测模型具有较好的预测能力和推广潜力。
1) 采购决策行为是由主观因素及客观因素相互影响共同构成,具有动态性和复杂性等特点。人工神经网络作为高度非线性体系,能够对影响采购行为的各变量之间的非线性关系进行高精度的逼近,从而实现预测功能。
2) 实证表明,人工神经网络虽然存在不足,但其优势还是显而易见的。人工神经网络是一个高度自动化的系统,只要有基本药物的历史采购量,通过神经网络的训练和仿真,达到满意精度后即可输出特定时间点的采购量,为基本药物采购决策提供科学的信息支持。但由于影响基本药物采购的各因素并不明了,难以对基药采购量的波动情况进行解释,无法提供有意义的干预措施。
3) 由于社区卫生服务机构长期以来缺乏对药品使用数据的收集,在对其药品需求分析时没有足够多的信息予以支持,所以在对BP神经网络的推广应用中,需要保证社区医疗机构对药品使用数据的收集、整理与统计,从而增加预测的准确性。
4) 加强有关基本药物采购分析的理论研究。基本药物不同于一般商品,其供需关系虽然较为稳定,但是在现存医患信息极不对称的情况下,由于诱导需求、道德风险等问题造成劣品驱逐良品的现象,而对基本药物的可及性和供需带来不必要的风险。现行的有关基本药物采购理论还需进一步完善。
5) 对基本药物采购量分析方法的探索。本文运用BP神经网络在基本药物采购量短期预测上面进行一次有益的探索,结论虽然具备理论指导意义和实际应用价值。但是由于BP神经网络无法探知对变量造成波动的影响因素,若从现实意义进行指导,还需要结合其他的分析方法如多元回归分析、主成分分析等方法来相互补充,扬长避短。
参考文献
[1] 王维, 贺京同, 张建勋, 等. 人工神经网络在非线性经济预测中的应用[J]. 系统工程学报, 2000, 15(2): 202-207.
[2] 刘卫红, 崔振霞. 基于BP神经网络的药品采购资金管理研究[J]. 中国乡镇企业会计, 2012, 20(1): 70-71.
[3] 张俊才, 黄万杰. BP神经网络在医疗器材需求预测中的应用[J]. 医疗卫生装备, 2004, 25(4): 8-9.
关键词:小额信贷;信用风险;BP神经网络
中图分类号:F830.51 文献标识码:A 文章编号:1009-9107(2012)02-0078-06
引言
农户小额信贷是指农村信用社基于农户的信誉,在核定的额度和期限内向农户发放的不需抵押、担保的贷款。1993年,中国社科院农村发展研究所将小额信贷项目第一次借鉴到中国,我国政府给予了大力支持。自2000年开始,为加大支农力度,缓解农户贷款难问题,在中国人民银行推动下,农村信用社作为正规金融机构全面试行并推广农户小额信贷。据有关数据显示,截至2009年3月末,全国农户小额信用贷款余额2518.6亿元,同比增长17.5%,增速同比增加1.9个百分点;农户联保贷款余额为2006.3亿元,同比增长33.6%,增速同比增加13.4个百分点。农户小额信贷在解决农户贷款难问题、促进农民增收、支持农村经济发展等方面发挥了重要作用。
然而,由于农民控制风险能力有限,农村信用基础薄弱,农户小额信贷不需抵押、担保的特点使得农村信用社在小额信贷实施过程中面临较大的信用风险。农户违约现象时有发生,导致农户小额信用贷款的不良率居高不下,影响农村信用社的整体贷款质量,阻碍了农村信用社的健康发展和小额信贷的可持续发展。银监会监管部主任杨家才在“2009中国农村金融论坛”上指出,目前涉农贷款不良率是7.4%,工业贷款不良率是2.29%,大企业贷款不良率是1.15%,中小企业贷款不良率是4.5%,涉农贷款的不良率大大高于其他类贷款。另有资料显示,截至2009年初,庐江农村信用合作联社农户小额信用贷款余额1941万元,不良贷款金额719.8万元,不良率达37.1%。因此,有效控制农户信用风险、提高信贷质量已成为农村信用社面临的重要任务。
目前,农户小额信用贷款采取“等级管理,分级定额,随用随贷,余额控制,周转使用”的管理办法。在农户资信等级评定时,一般是通过信贷员、村委会的主观意见或使用评分表打分来确定。这些方法虽简单易行,但主观性大且执行过程不规范,没有借助量化的数学模型,容易导致农户信用状况评价不准,不能完全满足农村信用社信用风险管理的需要。本研究尝试利用BP神经网络建立农户信用风险评估模型,以此来识别农户在小额信贷中的信用风险,严把贷款出口关,提高农户小额信贷质量,促进小额信贷的可持续发展。
一、BP神经网络介绍
人工神经网络(Artificial Neural Network,简称ANN),是一种旨在模仿人脑结构及其功能的脑式智能信息处理系统,是由大量处理单元相互连接构成的高度并行的非线性系统,具有高度的非线性映射能力,良好的容错性和联想记忆功能,自适应能力较强。神经网络特有的这些性能,加之其对数据分布没有严格要求,也无需详细描述自变量和因变量间的函数关系,并且分类精度较高,使其在信用风险分析领域得到广泛应用。神经网络对信用风险的评估是通过其分类功能实现的,即先找出一组对信用分类有影响的因素作为网络输入,再通过有教师或无教师训练建立信用风险评估模型,当输入新样本时该模型即可对其信用风险进行判别分类。
Rumelhart和Mc Celland于1986年对具有非线性连续变换函数的多层感知器的误差反向传播(Error Back Proragation,BP)算法进行了详尽的分析,实现了多层感知器的设想。采用BP算法的多层感知器是至今为止应用最广泛的神经网络,通常将其称为BP网络。BP网络是一种单向传播的多层前馈网络,由输入层、隐含层和输出层组成,一个三层的BP网络可完成由任意n维输入空间到m维输出空间的非线性映射。BP算法的思想是,学习过程由信息的正向传递和误差的反向传播这两个过程组成。在正向传递过程中,输入样本信息从输入层经隐含层逐层计算后传向输出层,若输出层实际输出和期望输出不符,则计算输出层误差值,然后转入误差的反向传播阶段。在误差反向传播过程中,输出误差经隐含层向输入层逐层反传,并将误差摊分给各层所有单元,各层单元的误差就作为修正其权值的依据。这种不断调整权值的过程,即是网络的训练学习过程。当达到规定的误差或一定的训练次数,训练结束。其网络结构如下图1所示。
二、实证研究
(一)样本选择与分组
本研究所用样本来自2009年陕西省杨凌区3家农村信用社提供的资料。按照五级分类标准,逾期3个月以上的贷款为不良贷款,本研究也按此标准来确定农户是否违约。在样本选择过程中考虑到样本类别的均衡,尽量使违约类样本数量和不违约类样本数量大致相等,在按时还贷的农户中随机挑选了112户,在未按时还贷的违约农户中随机挑选了106户,总计218户。删除24个部分数据有缺失值的不合格样本后,最终确定有效样本为194个,其中不违约样本有102个,违约样本92个。
BP神经网络分为训练和工作两个阶段,网络模型性能的好坏主要看其是否具有较好的泛化能力,即对新样本正确处理的能力。一般将总样本随机分成训练集样本和测试集样本两部分,对模型泛化能力的测试应当用测试集样本数据进行检验。有的资料认为训练集样本规模一般应达到有效样本的75%-80%,本研究将194个样本分成训练样本和测试样本两组:利用SPSSl6.0软件在102个不违约样本中随机抽取78个,在违约样本中随机抽取72个,将这150个样本数据作为训练样本集,而将其余的24个不违约样本和20个违约样本共44个样本作为测试样本集。
(二)指标确定
本研究初始选取的指标来自农村信用社农户小额信用贷款资信等级评定表和农户借款申请书等档案,选取了户主年龄、户主性别、家庭人口数、家庭劳动力数、耕地面积、农业收入、非农收入、年总支出、信用社入股金额、房屋价值、机械价值、其他资产价值、贷款数额、贷款用途、贷款月利率共15个指标。在以上指标中,户主的性别和借款用途两个变量是语言变量,需要转换为离散的数值量。在本研究中,户主的性别为男时赋值为0,性别为女时赋值为1;当贷款用途为用于种植业、养殖业等农业基本生产时赋值为1,用于加工、运输、经商等个体经营时赋值为2,用于生活用品、建房、治病、上学等一般消费时赋值为3。
为了选择对违约农户和非违约农户区分能力最
强的指标变量以及消除变量间的多重共线性问题,对以上所选取的15个指标用SPSSl6.0软件分别进行正态性检验、参数及非参数检验和指标变量之间的多重共线性检验。
1.正态性检验。在进行样本差异性检验之前,采用单样本K-S检验即Kolmogorov-Smirnov检验法,对每一个变量分别进行正态性检验。检验结果表明,在0.05的显著性水平下,变量户主年龄的概率P值为0.179,大于0.05,而其余14个变量的概率P值均为0,说明除变量户主年龄服从正态分布以外,另外14个变量都不服从正态分布。
2.差异性检验。两独立样本T检验。两独立样本T检验的前提是样本来自的总体应服从或近似服从正态分布,本研究对服从正态分布的变量户主年龄采用两独立样本T检验。T检验结果的F统计量观察值的概率P值为0.098,大于显著性水平0.05,认为两总体方差无显著差异;对应的T统计量观察值的概率P值为0.027小于0.05,认为两总体均值存在显著差异。
两独立样本K-S检验。对除变量户主年龄外的其他不服从正态分布的变量采用两独立样本K-s检验。在K-s检验结果中,耕地面积、农业收入、非农收入、年总支出、房屋价值、贷款数额、贷款用途几个变量的概率P值小于0.05,认为这几个变量在两总体的分布间存在显著差异,其他几个变量在两总体间则不存在显著差异。因此可以认为户主年龄、耕地面积、农业收入、非农收入、年总支出、房屋价值、贷款数额、贷款用途这8个变量在违约组和非违约组之间的差异显著,在模型建立过程中可只保留差异显著的8个变量,而将其他7个变量予以易II除。
3.共线性检验。BP神经网络具有很强的非线性映射能力和自适应能力,输入变量之间是否存在共线性问题对网络的处理结果影响不大,但为使网络的训练效果更佳,本文使用方差扩大因子法进行变量问的多重共线性检验。VIF值越大,多重共线性问题就越严重,一般认为VIF值不应大于5,但也可适当放宽标准至不大于10。当VIF值大于10时,可认为变量之间存在严重的共线性。检验结果显示,变量非农收入的方差扩大因子VIF值最大,但也仅为2.974,小于5,表明所选择的8个变量之间并不存在多重共线性问题,可以将这8个变量直接作为建立BP网络模型的输入变量。
(三)数据处理
为消除数据量纲和变量自身变化大小的影响,加快网络训练的收敛速度,在模型建立之前,采用最小一最大标准化法对变量进行归一化即标准化处理,将网络的输入、输出数据限制在[0,1],从而使各输入分量在网络训练开始时处于同等重要的地位。计算公式如下:
(四)BP神经网络信用风险评估模型的实现
1.BP网络结构设计。(1)隐含层确定。单隐层BP网络能完成由任意n维到m维的映射,与一个隐层相比,采用两个隐层并无助于改善网络性能,但随隐层层数的增加,训练时间将急剧增加,且在训练过程中往往容易陷入局部最小误差而无法收敛。通过调节网络隐层神经元数目可提高其误差精度,且训练效果也比增加层数更明显。因此本研究以一个隐层建立单隐层的三层BP神经网络。(2)输入层和输出层确定。输入参数的合理与否对网络的性能有重要影响。选择输入量的基本原则一是变量对输出有较大影响且能够提取或检测,二是各变量之间互不相关或相关性很小。输入层节点数目取决于输入数据的维数。通过前述指标筛选,最终有8个指标对农户是否违约影响较大且变量间不存在相关性,可以作为建立BP网络模型的输入变量,因此本研究确定BP网络输入层的神经元个数为8个。输出层的选择相对容易,其节点数取决于输出数据类型和表示该类型所需数据的大小两个方面。当BP网络用于模式分类问题时,可用二进制数表示输出结果,其节点数可根据待分类类别数确定。本研究将农户信用风险分为违约和不违约两类,因此可定义1个输出节点,用1表示违约类农户,0表示不违约类农户。(3)隐层节点数的确定。隐层节点数太少,网络提取样本信息的能力差,将不足以反映训练集的样本规律。若隐层节点数太多,又可能会提取出样本中非规律性的内容如噪声等,造成“过度吻合”,降低网络的泛化能力,另外还会增加网络的训练时间。对于隐层节点数的确定,至今没有准确的理论和规则,需要的往往是更多的经验。在具体设计时,可先根据经验公式初步确定隐含层节点数,然后通过对不同节点数的网络进行训练对比,再最终确定节点数。本研究采用公式作为计算隐层节点数的参考公式,得出隐节点数为17个。在网络训练过程中不断改变隐层节点数,通过比较不同隐节点数下网络的训练误差精度及对两类样本的判别准确率,在满足网络的训练误差精度的前提下,选取判别准确率最高时的节点数作为网络模型最终的隐层节点数。经过多次测试,最终确定隐层的节点数为14,由此构成了一个8-14-1型的BP神经网络模型,在满足误差精度的情况下,此时模型对两类样本的判别准确率最高。(4)传递函数的选取。BP网络常用的传递函数有对数S型logsig函数、双曲正切S型tansig函数和线性函数purelin。由于BP神经网络的非线性映射能力是通过S型传递函数所体现的,所以隐层一般采用S型传递函数,而输出层传递函数可以采用s型或线性。当用s型传递函数作为输出层的传递函数时,其非线性逼近速度快于线性传递函数。本研究将隐层传递函数确定为tansig函数,从而将隐层输出值控制在(-1,+1)之间;因为网络的输出值为0或1,所以输出层传递函数采用iogsig函数。(5)训练函数的确定。对网络的训练本研究采用L-M改进算法和批处理的训练模式。L-M改进算法的收敛速度最快,并且适用于中小型网络。对于L-M算法,MATLAB神经网络工具箱提供了批处理模式下的训练函数trainlm。本研究将选择trainlm作为网络的训练函数。
2.训练参数设置。(1)学习率。学习率决定网络每一次训练中所产生的权值变化量,其选择合理性是网络稳定的关键,太大可能导致系统不稳定,太小会导致收敛速度慢、训练时间过长,不过能保证收敛于某个极小值。一般情况下,倾向于选取较小的学习速率以保证网络系统的稳定性,其选取范围通常在0.01-0.8之间。当前都是根据经验来选择,并没有合理的解释与推导。可以通过观察网络训练的误差变化曲线来判断选取的学习率是否合理.曲线下降较快说明学习率比较合适,若出现较大的振荡则说明学习率偏大。经过反复测试,本研究最终确定学习率为0.4。(2)训练次数。训练次数将直接影响网络的准确性和泛化能力,次数过小不能完成训练所设定的目标误差,次数过大则容易造成“过度学习”现象,使得网络在对测试样本进行仿真测试时的准确度不高。本研究将最大训练次数确定为10000,当训练时间超过该设定时,学习过程自动终
止。(3)训练目标误差。MATLAB中默认目标误差为0,但实际情况中训练样本集很难达到。本研究输出值设为0和1两种情况,属于二分类问题,对训练精度要求不是特别高,将目标误差设为0.001。
3.网络训练。在网络训练时需要注意的是将两类样本交叉输入,因为集中输入同一类样本将使网络在训练时只建立与该类样本相适应的映射关系,而集中输入另一类样本时,网络权值的调整又转向新的映射关系而否定前面训练的结果。当网络的隐含层节点数为14时,网络根据训练样本进行训练的误差变化曲线图如图2所示。
BP网络模型对训练集样本的判别分类准确率达到100%,判定结果如表l所示。
4.网络测试。在训练误差达到要求后,根据测试集样本的网络模型输出与期望输出的误差,判断网络的泛化性能。当网络的隐含层节点为14时,测试集样本的网络模型输出见表2。
BP网络模型对测试集样本的分类准确率如表3所示。
通过测试样本集网络输出结果表2可以看出,1号、5号、10号、11号、29号、30号及31号样本的网络输出结果与期望输出不符,判别分类出现错误。通过对测试样本的判别分类表3可以看出,BP网络模型对违约样本分类识别的正确率达到了90%,对不违约样本分类识别正确率为79.17%,整体的分类识别正确率为84.09%,取得了较好的评估结果,证明了所建BP网络模型的精确性和有效性。
本研究将违约类农户误判为非违约类农户称为第一类错误,将非违约类农户误判为违约类农户称为第二类错误。显然,对于金融机构来说,第一类错误的危害性远比第二类错误严重,犯第二类错误顶多是没有将贷款发放出去而损失一笔利息收入,而犯第一类错误则会造成贷出的款项无法收回而形成果账。Ahman曾经得出这样一个研究结论,犯第一类错误造成的损失是第二类错误造成的损失的20倍至60倍。因此,应尽量避免第一类错误的发生。本研究所建立的BP网络模型对违约类样本识别的准确率达到90%,犯第一类错误的概率仅为10%,能够较好的避免第一类错误的发生,因而可认为是一个较好的信用风险评估模型,可以将其作为农村信用社识别农户信用风险的工具。
三、结论及政策建议
(一)结论
随着小额信贷的发展,如何有效控制农户信用风险、提高信贷质量以促进小额信贷的可持续发展已成为农信社面临首要任务。农户小额信贷信用风险的评估研究对于完善农户小额信贷业务,实现小额信贷的可持续发展有着重要的意义。
1.本文利用陕西省杨凌区3家农村信用社提供的数据资料,借助SPSSl6.0软件对样本数据分别进行正态性检验、参数及非参数检验和多重共线性检验,选择出对违约农户和非违约农户区分能力最强的指标变量,消除变量间的多重共线性问题,在信息量不减少的情况下减少变量的个数,从而减少了神经网络模型的输入单元个数,降低网络模型的复杂程度,提高了训练速度。
2.利用MATLAB7.0软件对农户小额信贷信用风险进行实证研究,建立了8-14-1结构的BP神经网络模型。模型对训练集样本的识别正确率达100%,对测试样本集违约类农户的识别正确率达90%,总正确率达84.09%,虽然网络模型对测试样本集未违约类农户的识别准确率只有79.17%,但农村信用社在一定程度上可以容忍此类错误发生所带来的机会损失。因而,BP网络模型能够为农村信用社识别和预测农户信用风险提供较好的依据。
3.BP神经网络是一种非参数模型,具有较强的非线性映射能力、容错能力和鲁棒性,对数据的分布要求不严格,分类精度较高,并且可以很容易地继承现有领域知识,不断接受新样本、新经验对模型进行调整。另外,BP神经网络模型中的权重通过网络对样本训练形成,不需要对各项指标确定权重,克服了由人工评价带来的主观性及模糊随机性的影响,保证了结果的准确性和客观性。
(二)政策建议
关键词:BP算法;经营状况;指标体系;评价模型
中图分类号:F27文献标志码:A文章编号:1673-291X(2010)31-0036-03
前言
企业的经营状况越来越多受到投资者的关注,它也是企业经济活动中的很重要的问题,因此如何做企业的经营状况评价问题也就是企业面临的一个十分重要的问题。只有真正建立起适应企业经济发展的评价模型,才能使企业在激烈的市场竞争中立于不败之地。
常用的评价模型很多,主要有统计方法和神经网络方法等。统计方法如层次分析法评价模型[1]、模糊综合评价模型[2]、Logistic回归模型[3]、Bayes判别信用评价模型[4]、因子分析法[5]、聚类分析法[6~7]和主成分分析法等,虽然这些方法已得到了广泛的应用,但他们或多或少存在着一些欠缺:有些模型只能应用于线性场合,对于非线性场合不适用;有些模型对于数据的分布要求很严格;有些模型的建立依赖于个人经验,有些模型难以应用于多因素场合。统计方法需要描述自变量与因变量之间的函数关系,当状况较为复杂,用统计方法不易解决的时候,神经网络可以成功的解决这一类问题。由于人工神经网络具有并行处理、鲁棒性和自组织等特点而被广泛应用[8~9]。下面采用BP神经网络建立企业经营状况评价模型。
一、网络设计与训练
将中国2008年的64家公司作为训练样本,其中经营正常的公司有39家,经营差的公司有25家,测试样本采用2009年的17家公司,其中经营正常的公司9家,经营差的公司有8家。
1.网络层数的确定
构造一个2层的BP网络来解决本节提出的两类模式分类问题。
2.输入维数、输出层节点的确定
对两类模式分类问题,财务指标选取4个财务指标x1=每股收益, x2=每股净资产,x3 =净资产收益率, x4=主营利润增长率, 用“0” 代表经营差的企业,用“1” 代表经营正常的企业.所以输入维数为4,输出层选取1个节点。
3.隐层节点的确定
一般状况下,隐含层的结点数较难确定,因而采用试凑法。在能正确反映、实现输入输出映射的基础上,尽量选取较少的隐层结点数,从而使网络模型尽可能的简单。为了使数据更加精准,先将数据进行归一化处理,隐层分别选取节点为3,4,5,利用上述训练样本对网络进行训练。当隐层选取3个节点时,训练误差变化曲线(如图1);当隐层选取4个节点时,训练误差变化曲线(如图2);当隐层选取5个节点时,训练误差变化曲线(如图3)。
图1
图 2
图 3
从训练误差曲线图可以看出,当隐层选取3个节点时,当训练到第11步时,训练误差达到0.001,当隐层选取4个节点时,当训练到第5~6步时,训练误差达到0.001,当隐层选取5个节点时,当训练到第10~11步时,训练误差达到0.001,因而,当隐节点为4时,所需要的训练步骤最少,所以隐层节点选为4。
二、基于BP神经网络的经营状况评价模型
当隐层节点选为4时,各层的连接权值和阈值分别为:
w=3.33852.09120.1425- 0.3756- 0.1848 2.27941.5118- 2.85743.0057- 2.4902 0.5163- 0.4217- 1.0658 - 2.3104 - 0.8535 - 2.9116
B1=- 3.9598 1.3199 1.3199- 3.9598
V=[- 1.6817 2.9964 2.2098 3.8302] B2=- 3.6774
则由此得到BP神经网络的信用评价模型为:
y=gVjgXjixi+B1j+B2
其中:第一个g为logsig函数,第二个g为logsig函数,Vj为输出权值,Wj为输入权值,B1为输入阈值,B2为输出阈值。
三、网络的仿真
1.训练样本的网络仿真
利用所建立的信用评价模型对64个训练样本(经营差的企业25个,序号为1-25,经营正常的企业39个,序号为26-64)进行两类模式分类。仿真结果(见表1),从表1可以看出有25个网络输出值接近于0,序号为1-25,有39个网络输出值接近于1,序号为26-64,这表明在训练样本中经营正常的企业的正确识别个数为39,经营差的企业正确识别个数为25(见表2),因此该评价模型对训练样本的正确识别率达到100%。
2.测试样本的网络仿真
推广能力是衡量神经网络性能好坏的重要标志,因而,为了检验网络的推广能力,将2009年第一季度的17家上市公司作为测试样本,经营差的企业有8家,经营正常的企业有9家,测试样本的网络输出结果如下(见表3):
从表3可以看出序号为1-8的网络输出值接近于0(0.9924),所以经营正常的企业正确识别了9家,从表4可以看出,该评价模型对测试样本的正确识别率也达到了100%。
总结
采用中国2008年的64家上市公司和2009年的17家公司的财务数据,考虑上市公司经营状况的4 个主要财务指标:每股收益、每股净资产、净资产收益率、主营利润增长率。通过matlab 软件,利用2008年的64家公司的数据建立了基于BP算法的经营状况评价模型,并利用该模型对2009年的17家公司的经营状况进行了评价。仿真结果表明,训练后的网络模型对训练样本和测试样本的正确识别率为100%。因此,基于BP算法的经营状况评价模型能够正确的对两类模式进行分类,具有潜在的应用价值。
参考文献:
[1]汪勇,魏巍.电子商务网站的层次分析法评价模型构建[J].湖北大学学报,2010,(1):50-61.
[2]林斌,吴贵生,王剑.地方政府投融资管理体制发展趋势探析――基于模糊综合评价法[J].运筹与管理,2010,(l):139-144.
[3]陈立文,孟苓阁.房地产上市公司Logistic预警模型研究[J].价值工程,2010,(8):34-36.
[4]林杰新,罗伟其,庞素琳.Bayes判别信用评价模型及其应用研究[J].统计与决策,2005,(1):22-25.[5]毛春元,张月,黄萍.基于因子分析法的小康社会综合评价模型[J].淮海工学院学报,2010,(1):67-70.
[6]巩芳,常青,白布赫,等.基于聚类分析的内蒙古草原生态经济系统综合评价[J].内蒙古大学学报:哲学社会科学版,2010,(2):27-32.
[7]高新才,魏丽莉.中国区域城乡协调发展评价模型与案例分析[J].西北师大学报,2010,(1):91-96.
[8]朱国强,刘厚泉.基于聚类的神经网络分类模型研究[J].微计算机信息,2008,(3):223-224.
[9]柳平,赵岩,王军.基于非线性特征提取的EEG信号支持向量分类器[J].汕头大学学报,2009,(1):69-74.
An Evaluation Model of Enterprises’s Business Status Based on BP Algorithm
WANG Xiao-dong1,XUE Hong-zhi2,YANG Wen1
(1. School of Science, Xi’an Polytechnic University,Xi’an 710048,China;2. School of Science, Chang’an University Xi’an 710064,China)