前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的人工神经网络的意义主题范文,仅供参考,欢迎阅读并收藏。
【摘要】 人工神经网络由于其具有高度的自适应性、非线性、善于处理复杂关系的特点,在许多研究领域得到了广泛应用,并取得了令人瞩目的成就。对其目前在医学研究领域中的应用做一简单综述。
【关键词】 人工神经网络; 应用
人工神经网络(Artificial Neural Network,ANN)方法自从本世纪40年代被提出以来,许多从事人工智能、计算机科学、信息科学的科学家都在对它进行研究,已在军事、医疗、航天、自动控制、金融等许多领域取得了成功的应用。目前出现了许多模仿动物和人的智能形式与功能的某个方面的神经网络,例如,Grossberg提出的自适应共振理论(Adaptive Resonance Theory,ART),T-Kohenen的自组织特征映射网络(Self-Organizing feature Map,SOM),径向基函数网络(Radial Basis Function,RBF),Hopfield网等。进入90年代以后,由于计算机技术和信息技术的发展,以及各种算法的不断提出,神经网络的研究逐渐深化,应用面也逐步扩大,本研究对常用的神经网络方法及其在医学领域中的应用做一简单综述。
1 自组织特征映射网络(self-organizing feature map,SOM)在基因表达数据分析中的应用
1.1 方法介绍
脑神经学的研究表明,人脑中大量的神经元处于空间的不同区域,有着不同的功能,各自敏感着各自的输入信息模式的不同特征。芬兰赫尔辛基大学神经网络专家T.Kohonen根据大脑神经系统的这一特性,于1981年提出了自组织特征映射网络,它模拟人的大脑,利用竞争学习的方式进行网络学习,具有很强的自组织、自适应学习能力,鲁棒性和容错能力,其理论及应用发展很快,目前已在信息处理、模式识别、图像处理、语音识别、机器人控制、数据挖掘等方面都有成功应用的实例。
Kohonen网络由输入层和竞争层组成,网络结构见图1。输入层由N个神经元组成,竞争层由M个输出神经元组成,输入层与竞争层各神经元之间实现全互连接,竞争层之间实行侧向连接。设输入向量为x=(x1,…,xd)T ,输出神经元j对应的权重向量为wj=(wj1,…,wjd)T ,对每一输出神经元计算输入向量x 和权重向量wj 间的距离,据此利用竞争学习规则对权向量进行调节。在网络的竞争层,各神经元竞争对输入模式的响应机会,最后仅一个神经元成为胜利者,并对与获胜神经元有关的各权重朝着更有利于它竞争的方向调整,这样在每个获胜神经元附近形成一个“聚类区”,学习的结果使聚类区内各神经元的权重向量保持与输入向量逼近的趋势,从而使具有相近特性的输入向量聚集在一起,这种自组织聚类过程是系统自主、无教师示教的聚类方法,能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变。网络通过对输入模式的学习,网络竞争层神经元相互竞争,自适应地形成对输入模式的不同响应,模拟大脑信息处理的聚类功能、自组织、自学习功能,实现用低维目标空间的点去表示高维原始空间的点,其工作原理和聚类算法及改进方法参见相关文献[1]。
1.2 应用
基因芯片技术的应用使得人们可以从基因水平探讨疾病的病因及预后,而基因芯片产生的数据具有高维度(变量多)、样本量小、高噪声的特点,样本量远小于变量数,如何从海量的数据中挖掘信息或知识成为重大课题。聚类分析是数据挖掘中的一类重要技术,传统方法主要有系统聚类、k-means聚类等,但在处理复杂非线性关系及变量间的交互作用时效果较差,受异常值影响较大。近年来神经网络技术法成为聚类领域的研究热点,其中自组织特征映射网络由于其良好的自适应性,其算法对基因表达数据的聚类有较高的稳定性和智能性,尤其在处理基因表达中有缺失数据及原始空间到目标空间存在非线性映射结构时有较好的体现,适用于复杂的多维数据的模式识别和特征分类等探索性分析,同时可实现聚类过程和结果的可视化[2]。目前Kohonen网络已被成功用到许多基因表达数据的分析中,Jihua Huang等[3]设计6×6的网络对酵母细胞周期数据进行分析,总正确率为67.7%;曹晖等[4]将其算法改进后用在酵母菌基因表达数据中,总正确率高达84.73%,有较高的聚类效能;邓庆山[5]将该模型与K平均值聚类方法结合用于公开的结肠基因表达数据集和白血病基因表达数据集,聚类的准确率分别为94.12%和90.32%。目前Kohonen网络在医学领域中主要应用前景有:① 发现与疾病相关的新的未知基因,对目标基因进一步研究,提高诊断的正确率,并对药物的开发研究提供重要的线索;② 对肿瘤组织的基因表达谱数据聚类,以期发现新的、未知的疾病亚型(肿瘤亚型),以便提出更加有针对性的治疗方案,为从分子水平对疾病分型、诊断、预后等提供依据;③ 发现与已知基因有相似功能的基因,为推断未知基因的可能功能提供线索。
2 BP神经网络在医学研究中的应用
2.1 BP神经网络在疾病辅助诊断中的应用
2.1.1 方法介绍
BP神经网络是目前应用最多的神经网络,一般由一个输入层(input layer)、一个输出层(output layer)、一个或几个中间层(隐层)组成。每一层可包含一个或多个神经元,其中每一层的每个神经元和前一层相连接,同一层之间没有连接。输入层神经元传递输入信息到第一隐层或直接传到输出层,隐层的神经元对输入层的信息加权求和,加一个常数后,经传递函数运算后传到下一个隐层(或输出层),常用的传递函数是logistic函数,即Φh=1/(1+exp(-z)) ,输出层神经元对前一层的输入信息加权求和经传递函数Φ0 (线性或logistic函数或门限函数)运算后输出,BP神经网络一般采用BP算法训练网络,关于BP算法及改进可参考相关文献[1]。
人工神经网络具有强大的非线性映射能力,含一个隐层的网络可以实现从输入到输出间的任意非线性映射,是典型的非线性数学模型,建立BP神经网络模型的一般步骤为:① BP网训练集、校验集、测试集的确定;② 输入数据的预处理:使输入变量的取值落在0到1的范围内,如果是无序分类变量,以哑变量的形式赋值;③ 神经网络模型的建立及训练:学习率、传递函数、隐层数、隐单元数的选择,注意防止过度拟合。一般使用灵敏度、特异度、阳性预测值、阴性预测值、ROC曲线对模型的预测性能进行评价。
2.1.2 应用
BP神经网络已广泛用于临床辅助诊断中,白云静等[6]用于中医证候的非线性建模,建立了RA证侯BP网络模型和DN证侯BP网络模型,结果显示平均诊断准确率分别为90.72%、92.21%,具有较高的诊断、预测能力。曹志峰[7]采用PROBEN1中的甲状腺疾病数据库用于甲状腺疾病(甲亢、甲减、正常)的诊断,结果显示训练样本的正确识别率为99.3% ,测试样本的正确识别率为98.2%,提示对临床诊断甲状腺疾病提供有益的帮助;还有学者用于急性心肌梗塞、甲状腺功能紊乱、乳腺癌、前列腺癌、宫颈癌、肺癌、卵巢癌、急性肺梗塞等的辅助诊断等[8]。
2.2 BP神经网络在生存分析中的应用
2.2.1 方法介绍
传统的生存分析方法有非参数、半参数、参数模型,参数模型主要有指数回归模型、Weibull回归模型,都要求对基线风险做一定的假设,但实际资料常常不符合条件,生存分析中应用最为广泛的半参数模型:Cox比例风险模型,但它要求满足比例风险的假定,在很多情况下也难以满足。基于神经网络的生存分析模型可以克服这些困难,可以探测复杂的非线性效应,复杂的交互效应,模型中协变量的效应可以随时间变化,对数据的分布不做要求。目前一些策略被用到神经网络预测方法中分析含有删失的生存数据,主要有Faraggi-Simon(1995)法、Liestol-Andersen-Andersen(1994) 法、改良uckley-James(1979)法等。
BP神经网络建立生存分析模型常用的方法有[9]:连续时间模型(continuous time models)与离散时间模型(discrete time models)。常用的Faraggi和Simon[10]提出的连续时间模型扩展了Cox回归模型,允许非线性函数代替通常的协变量的线性组合,这种方法既保持了Cox回归模型的比例风险的特点,又提供了处理复杂非线性关系、交互作用能力的好方法。
离散时间模型常用的模型有:① 输出层为单个结点:模型的输出层只有一个神经元结点,是最简单的神经网络模型,生存时间被分成两个区间,当研究者仅仅对某一时间点的预后感兴趣时,例如预测癌症患者的5年生存情况,如欲预测多个时间点,则需建立多个神经网络模型(每个模型对应一个时间区间);② 输出层为多个结点:生存时间被分成几个离散的区间,估计某个时间区间事件发生的概率,Liestol法是常用的离散时间模型。还有研究者在建立多个时间区间模型时将时间也做为一个输入变量,也有学者将神经网络纳入Bayes方法的研究框架。
一般采用灵敏度、特异度、一致性指数C(Concordance index)作为预测准确性的评价指标,神经网络在生存分析中的应用主要在于[11]:个体患者预后的预测,研究预后因子的重要性,研究预后因子的相互作用,对于预测变量的影响力强弱及解释性,还有待进一步探讨。
2.2.2 应用
国外Ruth M.Ripley等[9]将7种不同的神经网络生存分析模型(3种离散时间模型,4种连续时间模型)用于1335例乳腺癌患者复发概率的预测,并对其精确性、灵敏度、特异度等预测性能指标进行比较,结果证明神经网络方法能成功用于生存分析问题,可以提取预后因子所蕴涵的最大可能的信息。Anny Xiang等[12]采用Monte Carlo模拟研究方法,在9种实验条件下(不同的输入结点、删失比例、样本含量等)对Faraggi-Simon法、Liestol-Andersen-Andersen法、改良Buckley-James法处理右删失生存数据的性能与Cox回归作比较,研究结果提示神经网络方法可以作为分析右删失数据的一个有效的方法。D.J.Groves[13]等将Cox回归与神经网络方法对儿童急性淋巴母细胞白血病的预后进行了比较,Lucila Ohno-Machado等[14]建立输出层为4个结点的离散时间神经网络模型做为AIDS预后研究的工具,并使用ROC曲线下面积、灵敏度、特异度、阳性预测值、阴性预测值对不同时间区间的预测性能做了评价。国内用于生存分析方面的研究还较少,黄德生[15]等利用BP神经网络建立time-coded model和single-time point model用于肺鳞癌预后预测,贺佳[16]等把BP网络用于预测肝癌患者术后无瘤生存期,也有学者对AIDS、恶性肿瘤的预后做了相关的研究。
2.3 BP神经网络在其它方面的应用
近年来BP神经网络在疾病筛查中的的应用引起学者的关注,例如在乳腺癌、宫颈癌、糖尿病的筛查都有成功的应用[17]。神经网络在法医学研究领域具有实用性和广泛的应用前景,法医学家将其用在死亡时间推断、死因分析、个体识别和毒物分析等研究中[18]。在药学研究中也有一定的应用,例如在定量药物设计、药物分析、药动/药效学研究中,都有成功的应用案例,相秉仁等[19]对其做了详细的综述。曹显庆[20]等还将神经网络用于ECG、EEG等信号的识别和处理、医学图像分析中,取得了较好的结果。
人工神经网络是在研究生物神经网络的基础上建立的模型,迄今为止有代表性的网络模型已达数10种,人工神经网络不需要精确的数学模型,没有任何对变量的假设要求,能通过模拟人的智能行为处理复杂的、不确定的、非线性问题。在医学研究领域,变量间关系往往非常复杂,为了探测变量间的复杂模式,神经网络正逐渐变成分析数据的流行工具。目前国际上已出现许多著名的神经网络专业杂志:Neural Network,Neural Computation,IEEE Transaction on Neural Networks等,同时已有许多商业化的神经网络开发软件,如Matlab软件, S-plus软件,SNNS(Stuttgart Neural Network Simulator)等,高版本SAS系统中的Enterprise Miner应用模块中也可以建立神经网络模型,随着计算机技术的进一步发展,人工神经网络在医学领域的应用前景也会更加广阔。
【参考文献】
1 余雪丽,主编.神经网络与实例学习.中国铁道出版社,1996.
2 白耀辉,陈明.利用自组织特征映射神经网络进行可视化聚类.计算机仿真,2006,23(1):180~183.
3 Jinua Huang,Hiroshi Shimizu,Suteaki Shioya.Clustering gene expression pattern and extracting relationship in gene network based on artificial neural networks.Journal of bioscience and bioengineering,2003,96(5):421~428.
4 曹晖,席斌,米红.一种新聚类算法在基因表达数据分析中的应用.计算机工程与应用,2007,43(18):234~238.
5 邓庆山.聚类分析在基因表达数据上的应用研究.计算机工程与应用,2005,41(35):210~212.
6 白云静,申洪波,孟庆刚,等.基于人工神经网络的中医证侯非线性建模研究.中国中医药信息杂志,2007,14(7):3~4.
7 曹志峰. BP 神经网络在临床诊断中的应用与探讨.实用医技杂志,2005,12(9):2656~2657.
8 William G Baxt. Application of artificial neural networks to clinical medicine. The Lancet,1995,346(8983):1135~1138.
9 Ruth M.Ripley,Adrian L.Harris,Lionel Tarassenko.Non-linear survival analysis using neural networks. Statistics in medicine,2004,23(5):825~842.
10 David Faraggi,Richard Simon.A neural network model for survival data. Statistics in medicine,1995,14(1):73~82.
11 高蔚,聂绍发,施侣元,等.神经网络在生存分析中的应用进展.中国卫生统计,2006,23(4):358~360.
12 Anny Xiang,Pablo Lapuerta, Alex Ryutov.Comparison of the performance of neural network methods and Cox regression for censored survival data.Computational statistics & data analysis,2000,34(2):243~257.
13 D.J.Groves,S.W.Smye,S.E.Kinsey.A comparison of Cox regression and neural networks for risk stratification in case of acute lymphoblastic leukaemia in children.Neural computing & applications,1999,8(3):257~264.
14 Lucila Ohno-Machado.A comparison of cox proportional hazards and artificial neural network models for medicial prognosis.Comput Biol Med,1997,27(1):55~65.
15 黄德生,周宝森,刘延龄,等.BP人工神经网络用于肺鳞癌预后预测.中国卫生统计,2000,17(6):337~340.
16 贺佳,张智坚,贺宪民.肝癌术后无瘤生存期的人工神经网络预测.数理统计与管理,2002,21(4):14~16.
17 黎衍云,李锐,张胜年.人工神经网络及其在疾病筛查中的应用前景.环境与职业医学,2006,23(1):71~73.
18 汪岚,刘良.人工神经网络的法医学应用.中国法医学杂志,2005,20(3):161~163.
Abstract: The paper evaluated urban land use efficiency for Liaoyang city by using the model of BP neural network and indexes system during 2000~2009. The BP neural network was applied and trained by training data after having dealed the evaluation indexes with dimensionless mode. The results indicated that land use efficiency index of Liaoyang city is rising.
关键词: 土地利用效益;BP神经网络;辽阳市
Key words: land use efficiency;BP neural network;Liaoyang city
中图分类号:F293.2 文献标识码:A文章编号:1006-4311(2011)18-0007-02
0引言
城市土地是城市形成和发展的基础,是城市社会、经济、政治、文化等各项活动载体,城市土地资源利用的合理性,直接关系到城市的可持续发展[1]。当前,我国正努力建设资源节约型社会,提倡节约集约利用稀缺的土地资源,迫切需要实现城市土地的高效利用,防止城市土地的无序、摊大饼式扩张。城市土地利用效益是指城市土地在数量、质量的空间和时间上安排、使用和优化,从而给整个城市带来的经济、社会、生态、和环境效益的总和[2]。本文从经济、社会、生态效益三个方面构建城市土地利用效益评价指标体系,采用人工神经网络模型,对辽阳市2000~2009年的城市土地利用效益进行定量评价,以期为辽阳市城市土地资源的高效利用和科学管理及相关政策的制定提供借鉴。
1研究区概况
辽阳市位于辽宁中部,南邻鞍山,北依沈阳,东临本溪,西与辽河油田接壤,地处东经122°35′04″~123°41′00″;北纬40°42′19″~41°36′32″。全市土地总面积4731平方公里,总人口185万,其中市区面积574平方公里,城市建成区面积92平方公里。
2评价指标体系的建立
在指标体系构建过程中应该遵循科学性、系统性、相对完备性以及可操作性等原则[3-4],根据研究区域实际状况,从经济效益、社会效益、生态效益三个方面,选取具有代表性的指标构成城市土地利用效益评价指标体系。
3人工神经网络评价模型的建立
3.1 BP神经网络的原理BP网络模型是一种基于反向传播学习算法的多层网络模型,其基本思路是把网络学习时输出层出现的与“事实”不符的误差,归结为连接层中各节点间连接权及阈值的“过错”,通过把输出层节点的误差逐层向输入层逆向传播,以“分摊”给各连接节点,从而可算出各连接节点的参考误差,并据此对各连接权进行相应的调整,使网络适应要求的映射[5]。
3.2 城市土地利用效益的人工神经网络模型评价采用三层BP神经网络模型,借助MATLAB R14的神经网络工具箱函数实现模型评价。第一层为输入层,共有14个节点,即为评判城市土地利用效益的14个指标。由于评价指标的量纲不同,且数据变化范围较大,不便于分析和计算。因此,对各评价指标值进行无量纲化处理,即每一指标数据除以各自指标中的最大值,将数据划归在[0,1]范围之内。本文以隶属度函数对各指标进行标准化,归一化后得到采用模糊数学表示的隶属函数,并且采用隶属度的概念表示每一项指标。
网络层数确定由1个输入层、1个输出层和1个隐含层组成。对于隐含层节点数的确定比较复杂,对于节点采用Sigmoid型节点的多层前馈神经网络,只要有足够多的隐节点,它们都能把所需要的输入信号变成线形独立的隐节点增广向量。在实际操作过程中,根据经验选取节点数为12个。学习参数的确定采用参数η(学习速率),α(动量系数)自适应调整的方法。
根据辽宁省统计年鉴、辽阳市统计年鉴,本文采用2000-2009年的大连、沈阳、鞍山等6城市的数据,对其作为样本对网络进行训练,用辽阳市2000-2009年数据作为测试样本,得到网络计算结果(见图1)。通过对计算结果与已有训练成果进行分析来研究神经网络模型的模拟精度,最后网络的终止参数为:经过1478次训练后,网络的性能就达到了要求。得出辽阳市2000~2009年城市土地利用效益程度分别0.3621、0.3647、0.3905、0.4003、0.4250、0.4574、0.5360、
0.6141、0.7578、0.8235。
4评价结果分析
4.1 评价结果等级划分运用特尔菲法,经过三轮专家征询、统计、分析,将辽阳市土地利用效益水平划分为4个等级:低度效益(0~0.35),一般效益(0.35~0.50),较高效益(0.50~0.80),高度效益(0.80~1),城市土地利用效益评价分级成果见表2。
4.2 评价结果分析从辽阳市城市土地利用效益水平评价结果可知,2000年到2005年处于一般水平,2006-2008年土地利用效益处于较高水平,2009年土地利用效益处于高度水平。研究期内辽阳市的土地利用整体效益水平呈上升趋势,从2000年的0.3621增加到2009年的0.8235,增长速度较快,年均增长率为14.2%。
对照指标体系,从三大评价指标来看,经济效益水平变化幅度比较明显,呈大幅度上升趋势,而社会效益和生态效益水平变化比较缓慢。经济的快速发展对土地利用是把双刃剑,科学的发展方式可以促进土地利用效益的整体提高,反之,则使土地利用效益整体降低。通过以上分析可看出辽阳市城市土地利用效益的提升主要是由于经济效益的高速发展,而社会效益和生态效益没有显著地变化,然而经济效益、社会效益和生态效益是城市发展中不可或缺的三项重要指标,不可过分地依赖某个因素,而应注意三者之间的相互联系和相互制约,更多地考虑三方面协调发展,共同促进土地利用效益的提高。因此,在今后辽阳市的发展中,要在经济快速增长的同时,更加注重城市土地利用的结构调整,使社会、经济、生态等各项指标稳步提高,最终提升土地利用的整体效益。
5结语
城市土地利用效益评价具有模糊性、非线性等特点。一般的评价方法很难同时考虑到这几个方面。BP人工神经网络利用其非线性映射能力,能够实现对其识别和映射。在利用该模型时只需要将网络训练好,就可以用来进行大批量的数据处理,而且评价结果客观、合理。
参考文献:
[1]刘喜广,刘朝晖.城市土地利用效益评价研究[J].华中农业大学学报(社会科学版),2005(4):91~95.
[2]申海元,陈瑛,张彩云.西安市土地利用综合效益研究[J].土壤通报,2009,40(2):209-213.
[3]陈静,付梅臣,陶金等.唐山市土地利用效益评价及驱动机制[J].资源与产业,2010,12(2):60-63.
本文主要介绍了人工神经网络的概念,并对几种具体的神经网络进行介绍,从它们的提出时间、网络结构和适用范围几个方面来深入讲解。
【关键词】神经网络 感知器网络 径向基网络 反馈神经网络
1 引言
人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新型信息处理体系。它实际上是一个由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统,通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能,利用这一特性,可以设计处具有类似大脑某些功能的智能系统来处理各种信息,解决不同问题。下面对几种具体的神经网络进行介绍。
2 感知器网络
感知器是由美国学者Rosenblatt在1957年首次提出的,感知器可谓是最早的人工神经网络。感知器具有分层结构,信息从输入层进入网络,逐层向前传递到输出层。感知器是神经网络用来进行模式识别的一种最简单模型,属于前向神经网络类型。
2.1 单层感知器
单层感知器是指只有一层处理单元的感知器,它的结构与功能都非常简单,通过读网络权值的训练,可以使感知器对一组输入矢量的响应达到元素为0或1的目标输出,从而实现对输入矢量分类的目的,目前在解决实际问题时很少被采用,但由于它在神经网络研究中具有重要意义,是研究其他网络的基础,而且较易学习和理解,适合于作为学习神经网络的起点。
2.2 多层感知器
多层感知器是对单层感知器的推广,它能够成功解决单层感知器所不能解决的非线性可分问题,在输入层与输出层之间引入隐层作为输入模式的“内部表示”,即可将单层感知器变成多层感知器。
3 线性神经网络
线性神经网络类似于感知器,但是线性
神经网络的激活函数是线性的,而不是硬限转移函数。因此线性神经网络的输出可以使任意值,而感知器的输出不是0就是1。线性神经网络最早的典型代表就是在1963年由美国斯坦福大学教授Berhard Windrow提出的自适应线性元件网络,它是一个由输入层和输出层构成的单层前馈性网络。自适应线性神经网络的学习算法比感知器的学习算法的收敛速度和精度都有较大的提高,自适应线性神经网络主要用于函数逼近、信号预测、系统辨识、模式识别和控制等领域。
4 BP神经网络
BP神经网络是1986年由以Rumelhart和McCelland为首的科学家小组提出的,是一种按误差逆传播算法训练的多层前馈网络,在人工神经网络的实际应用中,80%~90%的人工神经网络模型采用BP网络或者它的变化形式,它也是前向网络的核心部分,体现了人工神经网络最精华的部分,BP神经网络由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经过一步处理后完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者达到预先设定的学习次数为止。
BP网络主要应用于以下方面:
(1)函数逼近:用输入矢量和相应的输出矢量训练一个网络逼近一个函数。
(2)模式识别:用一个特定的输出矢量将它与输入矢量联系起来。
(3)分类:对输入矢量以所定义的合适方式进行分类。
(4)数据压缩:减少输出矢量维数以便于传输或存储。
5 反馈神经网络
美国加州理工学院物理学家J.J.Hopfield教授于1982年发表了对神经网络发展颇具影响的论文,提出一种单层反馈神经网络,后来人们将这种反馈网络称作Hopfield网。在多输入/多输出的动态系统中,控制对象特性复杂,传统方法难以描述复杂的系统。为控制对象建立模型可以减少直接进行实验带来的负面影响,所以模型显得尤为重要。但是,前馈神经网络从结构上说属于一种静态网络,其输入、输出向量之间是简单的非线性函数映射关系。实际应用中系统过程大多是动态的,前馈神经网络辨识就暴露出明显的不足,用前馈神经网络只是非线性对应网络,无反馈记忆环节,因此,利用反馈神经网络的动态特性就可以克服前馈神经网络的缺点,使神经网络更加接近系统的实际过程。
Hopfield神经网络的应用:
(1)在数字识别方面。
(2)高校科研能力评价。
(3)应用于联想记忆的MATLAB程序。
6 径向基神经网络
径向基RBF网络是一个3层的网络,除了输入、输出层之间外仅有一个隐层。隐层中的转换函数是局部响应的高斯函数,而其他前向网络,转换函数一般都是全局响应函数。由于这样的差异,要实现同样的功能,RBF需要更多的神经元,这就是RBF网络不能取代标准前向型络的原因。但是RBF网络的训练时间更短,它对函数的逼近时最优的,可以以任意精度逼近任意连续函数。隐层中的神经元越多,逼近越精确。
径向基网络的应用:
(1)用于曲线拟合的RBF网络。
(2)径向基网络实现非线性函数回归。
7 自组织神经网络
自组织竞争型神经网络是一种无教师监督学习,具有自组织功能的神经网络,网络通过自身的训练。能自动对输入模式进行分类,一般由输入层和竞争层够曾。两层之间各神经元实现双向连接,而且网络没有隐含层。有时竞争层之间还存在着横向连接。
常用自组织网络有一下几种:
(1)自组织特征映射网络。
(2)学习矢量量化网络。
(3)自适应共振理论模型。
(4)对偶传播网络。
参考文献
[1]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.
[2]周品.神经网络设计与应用[M].北京:清华大学出版社,2013.
作者简介
孔令文(1989-),男,黑龙江省齐齐哈尔市人。现为西南林业大学机械与交通学院在读研究生。研究方向为计算机仿真。
Abstract: The technology of affecting the output accuracy of artificial neural network model has affected widespread ettention,and influence researches of sample quality to neural network output accuracy are very few,and the majority of these researcher about neural network structure. This paper analyses the influence of the sample to the output of artificial neural network,having important significance to improve accuracy of neural network output.
关键词: 人工神经网络;局部影响;BP神经网络;算法
Key words: artificial neural networks;local influence;BP neural network;algorithm
中图分类号:TP393.092 文献标识码:A文章编号:1006-4311(2010)07-0144-02
0引言
神经网络应用到预测有许多问题需要解决, 其中最为突出的问题就是没有一个确定的最合适的神经网络结构的标准方法,由于影响神经网络预测能力的参数很多,本文针对最为常用的BP神经网络,对影响神经网络预测精度的样本质量进行了详细分析和研究, 并在此基础上,给出优化样本后的具体例子。
1样本质量对网络的影响
用于神经网络的样本分为训练样本和测试样本,训练样本的质量在一定程度上决定着预测精度。首先,训练样本和待预测样本的均值存在较大差异, 预测误差会随着长时间的训练而增大。其次,训练误差会随着训练样本和待预测样本均值间差异的增大而增大。再次,训练误差会随着训练样本和待预测样本方差间差异的增大而增大[1]。下面是文献[1]对样本质量分析的方法。
文献[1]的人工神经网络预测误差为e=em+et+er,其中,e为预测误差;em为模型误差,它由所建回归模型与实际系统的差异引起的;et为最终的训练误差;er为人工神经网络训练和预测过程中引入的随机误差。et和er的存在是不可避免的,而em为:em=ef+ed,式中ef为实际输出值与预测输出值之间的误差,它反映了样本质量;为由不正确的嵌入维数引起的误差, 它可通过选择合适的输入神经元数来消除。
为了评价训练样本质量,根据ef提出“一致度”的指标。文献[1]定义了伪距离DCTP-D,但计算伪距离是相当复杂的,难于实现对样本质量的分析和应用。下面用协方差比统计量分析训练样本对预测精度的影响。
设训练样本为θ,是神经网络的输出,i是从θ中剔除第i个数据点的神经网络输出。则剔除第i个数据点的协方差比统计量CR=cv()cv()表明了剔除第个数据点对神经网络输出精度的影响,从精度方面刻画了第i个数据点的重要程度。CRi-1的值越大,对预测精度(神经网络输出)的影响越大。在使用PB神经网络预测时先对训练样本进行筛选,剔除对网络输出结果影响小的样本点。
样本精简:矩阵初等行变换能保持矩阵列向量之间的线性关系,利用这个结论我们可以用来进行样本数据的精简,这样精简后的样本数据能够保持各属性字段之间的线性关系。神经网络的训练实际上是一个通过给定样本实时调整网络连接权重的过程,样本预处理的结果对于网络训练的收敛性起到关键的作用。
2实例分析
本文采用麻省理工大学林肯实验室的测试数据KDDCUP99,它是专门用来进行入侵检测评估的。我们采用数据集上的一个子集10%作为实验数据源,它一共包含有494021条网络连接,其中正常连接97277 条,异常连接396744条。
下面我们针对DOS攻击类型数据(DOS攻击类型编码为“0 0 0 1”)进行分析。
设A为样本数据矩阵,其中每一行向量表示一条样本数据,则该行向量含34个数据,假设有a条样本,则A为a行34列矩阵;由于每条样本数据输入网络后都会有一条对应的输出,加上本实例为DOS攻击类型以编码“0 0 0 1”表示,则期望输出矩阵B为a行4列矩阵(暂时先不考虑阈值,只考虑权重问题)。本文BP神经网络的输入节点数为34个,隐含层节点数为15个,输出层节点数为4个虽然神经网络的连接权重可以用一个实数串进行表示,但在进行网络的训练时,还需要将实数串分为两部分,设输入层到隐含层的连接权重矩阵为W1,则W1为34行15列矩阵;同理,隐含层到输出层的连接权重矩阵W2为15行4列矩阵。于是我们可以得到公式(1)。
AWW=B(1)
如式(2)所示,A和B是系数矩阵 ,C是增广矩阵。经过带约束初等行变换后如式(3)所示。
C=[AB](2)
C=[AB]A′B′C D(3)
式(3)中,C、D为零矩阵,经过处理以后,由原先的A对应输出B变成了现在的A′对应输出B′,通过这样的处理,我们就可以将大样本变为小样本,从而使计算更加快速,样本数据更加精简。 为了能使样本应用于本文提出的分类检测器同步检测模型,我们将样本数据先进行归类合并,分别构造出DOS、PROBE、U2R、R2L四大类攻击样本数据集,这样四个检测器分别检测四大类攻击。为了降低可疑攻击数,即四大攻击类型数据集之间的重叠记录数要少。精度过大会增加计算量,从而会降低学习速度;精度过小,会使记录重叠数增加,从而造成可疑攻击数增加,影响训练结果。
对训练样本用上述方法进行优化后,利用矩阵初等行变换能保持矩阵列向量之间的线性关系这个结论,我们可以进一步对样本数据的精简,这样精简后的样本数据能够保持各属性字段之间的线性关系。神经网络的训练实际上是一个通过给定样本实时调整网络连接权重的过程,样本预处理的结果对于网络训练的收敛性起到关键的作用。
3结论
(1)分析神经网络进行非线性预测多变量预测的优越性以及神经网络用于预测的缺点所在。
(2)提出了影响网络预测能力的五个重要参数:样本质量、样本归一化、输人层节点数、隐层节点数及网络训练允许误差目标值。
(3)在一定允许训练误差的情况下,研究了无个参数对网络预测精度的影响,发现存在一个最优的样本、输入层节点数和隐层节点数,这样的网络具有较强的预测能力。
(4)本文用遗传算法构造了同时优化影响神经网络预测精度的参数(输入层节点数、隐层节点数及样本允许训练误差)的算法, 得到了较优的网络预测模型最后, 用算例验证了本文分析结果的正确性。
参考文献:
[1]陈果.神经网络模型的预测精度影响因素分析[J].北京: 模式识别与人工智能,2005,18(5):528-533.
[2]蒋林,陈涛,屈梁生.训练样本质量对人工神经网络性能的影响[J].北京:中国机械工程,1979,8(2):50-53.
[3]李敏强,徐博艺,寇纪淞.遗传算法与神经网络的结合[J].北京:系统工程理论与实践,1999(2).
[4]吴怀宇,宋玉阶.非线性回归分析中的神经网络方法[J].武汉:武汉冶金科技大学学报,1998,21(1):90-93.
关键词:人工神经网络;概算;BP
中图分类号:TP183文献标识码: A
一、人工神经网络应用于建设项目概算的重要意义
(一)人工神经网络
人工神经网络就是由许多神经元互连在一起所组成的神经结构,把神经元之间相互作用的关系进行数学模型化就可以得到神经网络模型。人工神经网络是一种非常复杂的非线性的动态分析系统。它模拟人脑的神经功能分层由单个神经元非线性地、复杂地组合成一个网络系统。当某一问题的求解过程可描述为若干个有一定内在联系,又无法用解析法表达其内在关系的各个输入因子与输出因子的关系时,将输入、输出因子作为样本进入神经元网络结构,网络系统会对各个输入、输出因子的因果关系作一番认识和学习,建立起各神经元之间的连接强度(即权值)阀值。这样学习后生成的人工神经元网络系统,仿佛具有了人脑解决这一问题的技能。当输入一组新的参数它可以给出这个领域专家认为应该输出的数值。
(二)建设项目概算应用神经网络的必要性
电网建设工程造价是组成电网的各分项工程的价格总和,而各分项工程的价格则取决于其工程量的大小和单价的高低。以往工程造价的计算是由造价编制人员算出各分项工程量,分别乘以其单价。由于组成电网的分项工程数量多,工程量的计算非常繁琐,计算时间占造价计算总时间的90%以上,所以计算结果容易出现误差。这表明造价计算的重点和难点在于工程量的计算。
一个有丰富经验的造价师,根据工程类型、特征及其相关情况,参照以往经验和工程数据资料,就能大致概算出造价,而无需进行大量繁杂计算,而且经验越丰富,资料积累越多,格算的造价就越准确,模仿这种大脑思维模式,正是人工神经网络所擅长的。神经网络模型通用性、适应性强,它不但不排斥新样本,相反它会随着样本数的不断增加而提高自身的概括能力和预测能力,这正好满足了建立造价信息系统的要求--动态地、自适应地从众多已完工程中提取有用信息,进行预测并辅助决策,由于电网工程的单件性,一般不存在两个完全一样的工程,但许多工程之间存在着某种程度的相似性,造价估计分析的基本原理就是建立在电网工程的相似性基础上,对于某个欲估工程,首先从分析电网类型和工程特征入手,再从数目众多的同类已竣工的工程中找出与预估项目最相似的若干个工程,然后利用这些相似电网项目的造价资料作为原始数据进行推理,最后得到拟建电网的造价及其他有关数据。
二、BP网络
(一)BP网络算法
神经网络在目前已有几十种不同的模型,在人们提出的几十种神经网络模型中,人们较多用的是Hopfield网络、BP网络、Kohonen网络和ART(白适应共振理论)网络。其中BP网络是反向传播(BackPropagation)网络,它是一种多层前向网络,采用最小均方差学习方式,这是一种最广泛应用的网络。
BP算法的学习过程是由正向传播和反向传播两个过程组成。在正传播过程中,输入信息从输入层经隐含层逐层传递、处理,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望输出,则转入反向传播过程,将误差信号沿原来的连接通路返回,通过修改各层间连结权的值,逐次地向输入层传播,再经过正向传播过程,两个过程的反复运用使得误差不断减小至满足要求。其模型可以表示为:
单隐层BP网络有三部分组成:输入层,输入向量:
X=(x1x2,...,x1,...,xn)T
隐含层:
输出层:
期望输出向量为:
d=(d1,d2,...,dk...,dl)T
输入层到隐含层之间的权值矩阵用V表示:V=(v1,v2,...,vj,vm)T
隐含层到输出层之间的权值矩阵用W表示:W=(w1,w2,...,wk,...,wl)T
转移函数采用tansig函数:
F(n)=2/(1+exp(-2*))-1
准则函数(误差):
权值的调整量:�
;
反向传播计算公式,可得如下权系数学习规律:
(二)BP神经网络的利弊分析及相关建议
BP算法样本训练失败的可能性较大,原因有以下几点:
(1)从数学角度看,BP算法为一种局部搜索的优化方法,但它要解决的问题是求解复杂非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;
(2)网络的逼近、推广能力完全取决于学习样本的典型性。而对学习样本的选取并组成训练集则是相当困难的问题。
(3)难以解决应用问题的实例规模和网络规模间的矛盾。实例规模与网络规模总是存在着很大差异,网络容量也是有着自己的局限性,当实例规模超出网络容量时,BP算法会失败。
基于前文所给出的BP网络技术存在的利弊现象,结合工程造价实际情况,个人认为,其弊端的解决方法可以概括为以下几点:
(1)由于BP网络技术在执行较为复杂的目标函数时会出现“崩溃”现象,即算法低效,函数图象错乱、超过网络容量等等。所以造价人员在选择需要用BP算法概算的工程时应该注意工程的复杂性,对于那些过于庞大、复杂的工程不宜采用BP算法,以免出现系统错乱。对于较为简单、较为精简的工程则可用BP算法进行工程造价的概算。同时,也应注意实例造价概算工程的规模与网络实际承载规模的大小,对于网络承载范围之内的,才宜采用BP算法。
(2)样本数据的采集非常重要。BP算法的网络预测能力是与训练能力呈正比的。因此,首先需要确定分解项目,分解项目应选择那些最能体现一个工程特征并且最能决定这个工程造价的关键因素,这样才能正确定位这个工程的造价。其次,选择的已建工程一定是要与待估工程有着较高的相似度。此处,可以进行相似度估测,查看已建工程每个分项的隶属度与待估工程隶属度的差异,差异过大的样本应予以舍去。
(3)针对BP算法的“过拟合”现象,造价中需要注意的是选择的样本数量不宜过大。以防BP算法网络学习了细节却丢失了最重要的骨架――样本内部的规律,从而不能得出满意的结果。
三、基于人工神经网络的送电线路工程造价概算
(一)送电线路工程造价估算模型建立
送电线路工程的造价受多个因素的相互影响,考虑下列因素作为影响着工程价格的主要因素,把它们列为神经网络的输入单元,如图l所示。设在某一电压等级下的送电线路,考虑某种地形、气象条件、架线回路、杆塔类型等基本因素的影响,把实际工程项目投资划分为工地运输、土石方工程、基础工程、杆塔工程、架线工程、附件工程等6个部分。根据测算出的每公里建筑安装费用,再加上其它费用与资金成本,得出每公里的单位静态投资造价,将这些指标作为神经网络的输出单元。
图1 图2
(二)工神经网络模型的建立和设计
BP网络模型结构的选择主要涉及到输入层、输出层、隐含层神经元数目的确定、学习算法的确定等。
1、神经元数目的确立
输人层:由上面送电线路工程概算体系结构的分析,按影响因素层次,可得到13项主要指标,也即是下面的输入神经元。
输出层:输出节点对应于评价结果,在笔者建立的模型中,产生了7个相关指标,分别代表着本体工程的6项投资金额和单位投资金额,因此选择7个输出神经元节点。
隐含层:隐含层神经元单元数的选择与输入输出单元的多少都有直接关系。
在实际操作中,可参考下面经验公式(1)确定。
n1=(1)
其中,m为输出神经元数;拓为输入神经元数;a为1~10间的常数,形成的人工神经网络示意图见图2。
2、输入输出向量
(1)输入向量
1)地形因秦
送电线路地形可能由5种地形组合而成,所讨论的某地区基本是丘陵和山地组成,因此选择它们作为2个输入神经元,以所占线路的百分比表示。
2)线型因素
主要包括导线和地线型号的选择,参考限额设计指标与实际采用的导线型号,对于110 kV线路,有LGJ―150/20、LGJ―185/25、LGJ一240/35、LGJ一300/35四种类型,依次选择上述导线类型,将对应量化值为1、2、3和4。在地线型号选择中,选取GJ一35、GJ一50,对于量化值为1和2,导线和地线型号量化值作为2个输入神经元。
3)平均档距
反映相邻杆塔问的距离作为1个输入神经元。
4)杆塔数目
铁塔数目和水泥杆数目对于造价影响重大,选择铁塔数和水泥杆数为2个输入神经元。
5)运距
它包括人力运距和汽车运距两部分,作为2个输入神经元。
6)土石方量
1个输入神经元。
7)金具
它包括挂线金具和拉线金具两部分,作为2个输入神经元。
8)绝缘子
1个输入神经元。
(2)输出向量
工地运输、土石方工程、基础工程、杆塔工程、架线工程、附件工程、单位静态投资。
参考文献
人工神经网络(ANN)又称连接机制模型(ConnectionModel)或并行分布处理模型(ParallalDistributedModel)。作为人工智能的研究方法,目前已广泛应用于自然科学的各个领域,应用计算机程序来模拟这种特殊的数学模型并应用于实际流域的洪水预报研究中,无疑是一种新的尝试和有益探索。岳城水库是海河流域南运河水系漳河上的一座大型控制性工程,入库洪水突发性强,水猛多沙,为确保下游河北、河南、山东、天津广大平原地区和京广铁路的安全,对水库入库洪水进行精确预报,及时采取预泄和分洪措施显得极其重要,因此,用人工神经网络模型模拟预报水库的入库洪水过程,有重要参考和借鉴意义。
2.BP网络的构建
人工神经网络是一个高度复杂的非线性动力学系统,它有大量的简单处理单元(神经元)广泛连接而成,他对人脑的功能作了某种简化、抽象和模拟,具有很强的非线性映射能力,其中对多层前向神经网络bp模型的研究相对成熟,应用最为广泛,其模型结果如图:
结构中,输入层、隐层和输出层神经元的个数根据具体情况设定,其中隐层层数不一,不失一般性对输出层中只含有一个神经元的三层前向神经网络分析如下:假设输入层中有个神经元,隐层中有个神经元,输出层神经元的输出,即整个网络的输出为Y,网络中输入层的输入分别为,,…,则隐层神经元的输入分别是:
(i=1,2,…m)(2.1)
在上式中,为隐层神经元i与输入层神经元j的连接权,为隐层神经元的阈值,选择函数作为隐层神经元的激发函数,则隐层神经元的输出为:
(i=1,2,…m)(2.2)
输出神经元的激发函数取为线性函数,输出层神经元的输出及整个网络的输出为:
(2.3)
其中,Vi为输出层神经元与隐层神经元i的连接权。定义由、、组成的向量为网络的连接权向量(ij,i,i)。设有学习样本(,,…;)(=1,2…,p;p为样本数)。对某样本(,,…;)在给出网络向量后,可以通过公式(1.1)~(1.3)计算出网络的输出值,对于样本
定义网络的输出误差为:(2.4)
定义误差函数为:(2.5)
(ij,i,i)随机给出,计算式(2.5)定义的误差值较大,网络计算精度不高,在确定网络结构后,通过调整(ij,i,i)的值,以逐步降低误差,以提高网络的计算精度,下面给出根据误差信息调整(ij,i,i)的具体计算过程。
在反向传播算法中,是沿着误差函数随(ij,i,i)变化的负梯度方向对进行休整。设的修正值为:(2.6)
式中:为第n次迭代计算时连接权的修正值;为前一次迭代计算时计算所得的连接权修正值;为学习率,取0~1间的数;为动量因子,一般取接近1的数。将式(1.4)和(1.5)代入式(1.6)中,有(2.7)
定义=(,,),则:
(2.8)
(2.9)
(2.10)
采用迭代式对修正计算,得到新的连接权向量。对于所有的学习样本均按照样本排列顺序进行上述计算过程,然后固定的值,对于p个样本分别进行正向计算,从而求出学习样本的能量函数值:
(2.11)
这样结束了一个轮次的迭代过程,当满足某一精度要求时,就停止迭代计算,所得(ij,i,i)即为最终模型参数,否则就要进行新一轮的计算。
3.BP算法的VB程序实现
因程序代码太多,不再给出。网络学习程序界面如下图2:
4.洪水预报网络模型构建
4.1资料收集
岳城水库的入库水文站为观台水文站,该站上游有清漳河匡门口水文站和浊漳河天桥段水文站,距观台分别为66km和64km。上游匡门口、天桥段与下游观台的区间流域面积为1488km2,见流域水系图3。资料采用年鉴1962、1976、1977、1988年四次洪水和相应年份的区间时段降雨量共118组调查数据作为模型的学习训练样本,另取1971年和1982年两次大洪水作为模型的检验数据。
4.2预报模型构建
网络模型采用输出层中有一个神经元的三层前向人工神经网络,洪水预报模型的输出节点为岳城水库的入库站观台水文站的时刻的流量,即网络。考虑河道洪水演进时间和区间流域的产汇流时间,分别取清漳河匡门口站和天桥断以及流域平均降雨量、作为模型的输入节点值;隐层神经元节点数和输入层节点数相同取为4。
模型参数优化:计算中,学习率越大,学习速度会越快,但是过大时会引起振荡效应;动量因子取得过大可能导致发散,过小则收敛速度太慢。据有关文献介绍,取,算法收敛速度较快。本次计算取,;网络中的初始值取(0.1~0.1)之间的随机数(由VB程序产生)。
样本的归一化处理:为了有效利用型函数的特性,以保证网络神经元的非线性作用,对于数值型的学习样本要进行归一化处理。对样本(p=1,2,…p)定义,,归一化处理计算就是按照公式:
(4.1)
将样本转化为0~1之间的数据。对于网络的输出数据还应进行还原计算恢复实际值,公式为:
(4.2)
使用VB程序对网络模型进行训练学习,经102135次学习后,网络输出能量函数值为3.2×10-3,此时得到模型最优参数如表1。
表1模型参数表
序号
11.625608-2.361247-3.2047142.846384-2.718568-1.185164-1.029736
20.138017-0.041076-0.6707810.8445030.936162-2.7469741.546362
31.770369-6.0486571.1342710.7454760.58331-3.0635082.5033320.250.9
4-0.8183131.471144-1.4842650.875319-1.995911-2.6673082.075974
5-1.9730730.30147122.993124-0.160362-3.290356-1.59743-0.627028
5.模型检验
应用以上该区洪水预报的神经网络模型参数分别对1982年、1971年的两次洪水进行检验预测,相应洪水过程趋势线见图4图5。
表2预报考评指标表
序号序号
1982.10.0311982年前20h0.69
1982.20.00811982年后80h0.07
1982.30.040.51982年总过程0.19
1982.40.0421971年前11h0.7
19710.0611971年后50h0.12
aver0.0361.11971年总过程0.23
注:1.1982.1表示1982年大洪水的第一次洪峰,其它类同。
2.1982年前20h表示1982年大洪水的涨洪段前20h,其它类同。
图41971年预测洪水与实测洪水过程线图51982年预测洪水与实测洪水过程线
检验标准:
1)洪峰流量预报误,经计算、皆小于0.1,据《水库洪水调度考评规定SL224-98》,考评等极为良好(见表2)。
2)峰现时间预报误差,经计算考评等极为一般,其中一次良好。
3)洪水过程预报考评指标,从预报数据分析,两次洪水过程的预报考评0.23,,根据规范属一般,从洪水过程检验指标可分析主要是因为模型对涨洪期低量洪水预报精度不高造成,但峰值附近及后期预报精度较高,可作为洪水预报的一项行之有效的方案。
6.结论
岳城水库入库洪水过程的神经网络预测模型运行稳定,对峰高量大洪水预报较为准确,根据规范规定可作为水库自动测报系统的有益补充,为水库的防洪调度提供较为可靠的依据。
参考文献:
[1]焦李成.神经网络的应用与实现.西安:西安电子科技大学出版社,1993
[2]李春好等.人工神经网络bp算法的数据处理方法及应用.系统工程理论与实践,1997,17(8)
[3]赵林明等.多层前向人工神经网络.郑州:黄河水利出版社,1999
[4]丁晶等.人工神经前馈(bp)网络模型用作过渡期径流预测的探讨.水电站设计,1997,13
1.1集先进性、实用性和前沿性为一体的教学内容改革对国内外优秀的人工智能教材[2-6]的内容进行整合,建立人工智能的知识体系,并提取人工智能课程的知识要点,确定集先进性、实用性和前沿性为一体的教学内容。人工智能的核心思想是研究人类智能活动规律和模拟人类智能行为的理论、方法和技术,因此人工智能应围绕“智能”这个中心。由于智能本身的复杂性,难以用单一的理论与方法来描述,因此可以通过建立人工智能的不同层次来刻画智能这个主题。人工智能的主要内容可按图1所示划分为最底层、抽象层、逻辑层和应用层这4个不同层次。在最底层,神经网络与演化计算辅助感知以及与物理世界的交互。抽象层反映知识在智能中的角色和创建,围绕问题求解对知识进行抽象、表示与理解。逻辑层提出学习、规划、推理、挖掘的模型与方式。应用层构造智能化智能体以及具有一定智能的人工系统。将人工智能划分为这4个层次可确定人工智能课程的教学内容,并保证教学内容的循序渐进。
1.2基于人工智能知识体系的教学案例库建设根据所确定的教学内容、知识重点和知识难点,从国内外经典教材、科研项目、研发设计、生产建设以及国内外人工智能网站等多种途径,收集案例素材,加以整理,撰写各知识要点的教学案例及其内容。表1给出基于人工智能知识体系的教学案例示例。
2人工智能课程教学案例的详细设计
在教学案例具体设计时应包括章节、知识重点、知识难点、案例名称、案例内容、案例分析过程、案例教学手段、思考/讨论内容等案例规范,分别从以下单一案例、一题多解案例和综合应用案例3种情况进行讨论。
2.1单一案例设计以人工智能课程中神经网络课堂教学内容为例,介绍基于知识点的单一案例的设计。神经网络在模式识别、图像处理、组合优化、自动控制、信息处理和机器人学等领域具有广泛的应用,是人工智能课程的主要内容之一。教学内容主要包括介绍人工神经网络的由来、特性、结构、模型和算法,以及神经网络的表示和推理。这些内容是神经网络的基础知识。其重点在于人工神经网络的结构、模型和算法。难点是人工神经网络的结构和算法。从教学要求上,通过对该章节内容的学习,使学生掌握人工神经网络的结构、模型和算法,了解人工神经网络的由来和特性,一般性地了解神经网络的表示和推理方法。采用课件PPT和演示手段,由简单到复杂,在学生掌握人工神经网络的基本原理和方法之后,再讲解反向传播BP算法,然后运用“手写体如何识别”案例,引导学生学习理解人工神经网络的核心思想及其应用方法。从国外教材中整理和设计该案例,同时应包括以下规范内容。章节:神经网络。知识重点:神经网络。知识难点:人工神经网络的结构、表示、学习算法和推理。案例名称:手写体如何识别。案例内容:用训练样本集训练一个神经网络使其推广到先前训练所得结果,正确分类先前未见过的数据。案例分析过程:①训练数字识别神经网络的样本位图;②反向传播BP算法;③神经网络的表示;④使用误差反向传播算法训练的神经网络的泛化能力;⑤一个神经网络训练完毕后,将网络中的权值保存起来供实际应用。案例教学手段:手写体识别的神经网络演示。思考/讨论内容:①训练改进与权值调整改进;②过学习/过拟合现象,即在一个数据集上训练时间过长,导致网络过拟合于训练数据,对未出现过的新数据没有推广性。
2.2一题多解案例设计一题多解案例有助于学生把相关知识点联系起来,形成相互关联的知识网络。以人工智能课程中知识及其表示教学内容为例,介绍一题多解案例的设计。知识及其表示是人工智能课程三大内容(知识表示、知识推理、知识应用)之一。教学内容主要包括知识表示的各种方法。其重点在于状态空间、问题归约、谓词逻辑、语义网络等知识表示方法。难点是知识表示方法的区别及其应用。从教学要求上,通过对该章节内容的学习,使学生掌握利用状态空间法、问题归约法、谓词演算法、语义网络法来描述和解决应用问题,重点掌握几种主要知识表示方法之间的差别,并对如何选择知识表示方法有一般性的了解。通过讲解和讨论“猴子和香蕉问题”案例,来表示抽象概念。该案例从国内外教材中进行整理和设计,同时包括以下规范内容。章节:知识及其表示。知识重点:状态空间法、问题归约法、谓词逻辑法、语义网络法等。知识难点:知识表示方法的区别及其应用。案例名称:分别用状态空间表示法与谓词逻辑法表示猴子和香蕉问题。案例内容:房间内有一只机器猴、一个箱子和一束香蕉。香蕉挂在天花板下方,但猴子的高度不足以碰到它。猴子如何摘到香蕉?如何采用多种知识表示方法表示和求解该问题?案例分析过程:①状态空间法的解题过程。用n元表列表示该问题的状态;定义问题的操作算符;定义初始状态变换为目标状态的操作序列;画出该问题的状态空间图。②谓词逻辑法的解题过程。定义问题的常量;定义问题的谓词;根据问题描述用谓词公式表示问题的初始状态、中间状态和目标状态。案例教学手段:猴子和香蕉问题的演示。思考/讨论内容:①选择知识表示方法时,应考虑哪些主要因素?②如何综合运用多种知识表示方法获得最有效的问题解决方案?
2.3综合应用案例设计与单一案例、一题多解案例相比,综合应用案例能更加有效地启发学生全方位地思考和探索问题的解决方法。以机器人行动规划模拟为例,介绍人工智能综合应用案例的设计,该案例包括以下规范内容。章节:人工智能综合应用。知识重点:人工智能的研究方向和应用领域。知识难点:人工智能的技术集成。案例名称:机器人行动规划模拟。案例内容:综合应用行为规划、知识表示方法、机器人学、神经网络、人工智能语言等多种人工智能技术与方法,对机器人行动规划问题进行描述和可视化。案例分析过程:①机器人行为规划问题求解。采用状态归约法与分层规划技术,将机器人须完成的总任务分解为若干依序排列的子任务;依据任务进程,确定若干关键性的中间状态,将状态对应为进程子规划的目标;确定规划的执行与操作控制,以及机器人过程控制与环境约束。②基于谓词逻辑表示的机器人行为规划设计。定义表达状态的谓词逻辑;用谓词逻辑描述问题的初始状态、问题的目标状态以及机器人行动规划过程的中间状态;定义操作的约束条件和行为动作。③机器人控制系统。定义机器人平台的控制体系结构,包括反应式控制、包容结构以及其他控制系统等。④基于神经网络的模式识别。采用神经网络方法以及BP算法对桌面茶壶、杯子等物体进行识别,提取物体图形特征。⑤机器人程序设计语言。运用人工智能语言实现机器人行动规划行为的可视化。案例教学手段:机器人行动规划的模拟演示。思考/讨论内容:人工智能将会怎样发展?应该在哪些方面进一步开展研究?
3案例教学环节和过程的具体实施细节
人工智能案例教学的实施面向笔者所在学院软件工程专业三年级本科生展开。具体实施细节如下。(1)教学内容的先进性、实用性和前沿性。引进和整合国外著名人工智能教材内容,保证课程内容具有先进性。同时将前沿人工智能的研究成果与技术有机地融入课程案例教学之中。(2)案例教学的创新教学模式。在教师的引导下,将案例中涉及的人工智能内容推广到对人工智能的一般性认识。案例的教学过程,成为认识人工智能、初步运用人工智能的理论与方法分析和解决实际应用问题的过程,使学生具备运用人工智能知识解决实际问题的意识和初步能力。在课程教学中,打破国内常规教学方式,建立和实施开放式案例教学模式。采用动画课件、录像教学、实物演示、网络教学等多种多媒体教学手段,以及集中讲授与专题讨论相结合的教学方式将理论、方法、技术、算法以及实现有机结合,感性认识与理性认识相结合,理论与实际相结合,极大地激发学生自主和创新性学习的热情。(3)“课堂教学—实践活动—现实应用”的有机融合。在案例教学过程中,从传统教学观以学会为中心转化为创新应用型教学观以创新为中心,以及从传统教学的以课堂教学为中心转化为以课堂教学与实践活动并重为中心,构造具体问题场景以及设计教学案例在情境中的现实应用,加深学生对教学内容的理解,同时提高学生的思考能力和实际综合应用能力。
4结语
[关键词]神经网络;钢铁企业;质量预测
[DOI]10.13939/ki.zgsc.2015.11.041
1 数据挖掘在钢铁企业质量预测中的应用
在钢铁企业质量预测工作中,使用数据挖掘技术可以以钢铁企业的产品质量目标以及产品生产中存在的问题为依据来探索大量的钢铁产品生产业务数据,并对钢铁产品生产中存在的规律进行总结,然后通过模型化来指导钢铁企业开展实际的钢铁产品生产工作。数据挖掘过程所处理的数据具有随机性、模糊性、不完全性以及量大的特点,但是通过数据挖掘技术所得到的信息却是人们并不熟悉但是对钢铁产品生产具有较高价值的信息数据以及知识。利用数据挖掘所获取的信息能够作为钢铁企业开展信息管理、信息查询、生产过程控制以及决策工作的重要依据。
从钢铁企业质量预测中对数据挖掘的应用步骤来看,主要步骤体现为以下几个方面:一是钢铁企业中钢铁产品生产数据的准备工作。数据挖掘技术所处理的内容是经过长期积累并存储于数据库中的信息数据,虽然数据挖掘一般都是对大量数据进行处理,但是这些原始数据却并不适合使用数据挖掘技术开展直接挖掘,这要求钢铁企业能够对这些信息数据做出整理与准备,如对这些数据进行缩减、转换、净化以及挑选等,这种准备工作对于提高数据挖掘的效率以及质量具有重要意义,换而言之,钢铁企业在数据准备方面所做出的工作是否合格直接影响着数据挖掘的速度、准确性以及得出信息的价值;二是构建模型。在钢铁企业质量预测中应用数据挖掘技术,必须要面临构建模型这一重点工作与难点工作。在这项工作中,钢铁企业需要对数据挖掘的算法以及模式模型做出合理的选择,尤其是数据挖掘算法的挑选十分重要。在此基础上,数据挖掘可以根据钢铁企业质量预测目标来使用所确定的数据挖掘算法参数对前期准备完成的数据进行分析,从而形成可以作为知识与规律的模式模型;三是对模式模型做出解释与评估。在钢铁企业质量预测工作中,当利用数据挖掘完成模型构建后,还需要制定严格的模型评估标准,并以这些评价标准为依据来对所构建的模式模型做出评估,从而有针对性地取出无效的模式模型,并选择一种在理解难度方面具有优势的模式模型来做出解释;四是对模型做出巩固与运用。在钢铁企业质量预测工作中,需要对数据挖掘所构建的模式模型知识做出统一检查,并对知识中存在的冲突与矛盾做出剔除。然后可以利用数据分析方法来对数据挖掘所得到的知识开展二次处理,以便让数据体现出形象化、可视化以及专业化的特点。
在应用数据挖掘开展钢铁企业质量预测的工作中,并不能通过一次数据挖掘就完成相关工作,而应当对整个过程进行反复循环,并做出反馈与完善。虽然数据挖掘技术能够很好地得出钢铁企业质量预测结果,但是需要注意的是,数据发掘仅仅是一项可以应用于钢铁企业质量预测中的工具,而并不是万灵药,虽然良好的应用能够减少钢铁企业生产中的质量问题,但是如果不能做出良好应用,则会导致钢铁企业在质量预测方面投入不必要的人力与财力。
2 人工神经网络在钢铁企业质量预测中的应用
人工神经网络是以人脑组织原理与活动原理为依据构造数据驱动型非线性映射模型,通过对这种模型的运用,可以对因果关系做出映射。将人工神经网络引用于钢铁企业质量预测中,可以从钢铁企业产品生产的历史信息内进行学习,并发现钢铁企业质量规律,从而对钢铁企业质量做出准确预测。相对于数学模型而言,人工网络模型具有更广的处理范围,并且具有自组织、自适应、容错鲁棒等特性,因此对于复杂数据的处理往往具有良好的表现。人工神经网络在钢铁企业质量预测中的应用为钢铁企业质量预测提供了一种新的办法与途径,在利用人工神经网络开展钢铁企业质量预测的过程中,可以将影响钢铁企业质量的各类要素进行输入并构建包含不确定性影响的模型,在钢铁企业质量预测中十分适用。
当前钢铁企业质量预测目标是对影响钢铁企业生产质量的因素做出预测并对这些因素做出改进,同时预测在钢铁企业生产过程中是否仍旧会产生质量问题。如果判定钢铁企业生产仍旧会产生质量问题,则要求钢铁企业寻找问题产生的原因与对策,并在解决问题之后开展生产以生产出具有更高质量的产品。在其他方面,人工神经网络还可以预测钢铁企业生产工艺改变对生产质量的影响等。由此可见,人工神经网络在钢铁企业质量预测中具有重要的应用价值。人工神经网络在钢铁质量预测中的应用,会让钢铁质量预测工作的理念以及技术都产生一种变革,并在对传统质量预测方法做出突破的基础上解决钢铁企业传统质量预测中存在的缺陷,从而为钢铁企业生产质量预测模式体现出实用化的特点以及钢铁企业生产现代化的发展发挥推动作用。但是同时,人工神经网络在钢铁企业质量预测中的应用也具有一定缺陷,这些缺陷主要体现在人工神经网络所得出的知识是分散于系统内部的,通过对人工神经网络的使用,在使原始数据在归纳法基础上利用学习算法来完成内部知识库的构建,然而单个的神经元并不进行信息数据的存储,这导致了知识具有不明确的表达以及具有很大的正视难度,同时也无法做出有效的解释。
3 BP人工神经网络在钢铁企业质量预测中的应用
在钢铁企业应用神经网络开展质量预测工作的过程中,需要认识到人工神经网络具有多样化的特点,因此需要钢铁企业以实际问题为依据来对网络类型做出选取。在一些情况中,钢铁企业需要根据历史产品质量数据来获得质量特性信息,从而为质量预测与分析工作提供依据。能够对质量模型产生影响的因素较多,并且也没有一个专门的数学解析式来用于钢铁企业质量预测的计算,因此这属于一个具有复杂性特点的非线性问题。对于这类问题,钢铁企业可以使用BP网络模型来进行解决,这种模型的优势在于具备较强的非线性映射能力。在钢铁企业质量预测工作应用BP网络的实践中,大部分的神经网络模型都是使用BP网络或者BP网络的变化形式,其作用在于数据压缩、函数逼近、模式识别以及分类。在这种网络的应用中,只要具备隐层以及隐层单元数的数量够多,BP网络就能够在不构建数学解析式模型的基础上向任意非线性映射关系进行逼近。则主要是因为只要以原始的钢铁企业生产数据为依据,并利用学习与训练就可以找出原始数据与有价值数据之间的联系,由此可见,这种方法在钢铁企业质量预测中具有良好的适应性。另外,BP网络所采用的学习算法具有稳定的工作状态、严谨的结构以及清晰的思路,并且良好的容错能力也能够在连接改动甚至损坏的情况下不会出现系统崩溃的情况。但是BP网络所使用的学习方法具有过慢的收敛速度,因此需要在数据分析中做出千次迭代,因此,很多BP网络在一些系统中并不具备适应性。总之,BP在包括钢铁企业在内的许多工程领域都得到了运用,随着BP网络的不断完善,BP网络在钢铁企业质量预测中也将发挥出越来越重要的作用。
参考文献:
[1]张维维,赵成林,李广帮,等.BP神经网络技术在钢铁工业中的应用[J].鞍钢技术,2010(4).
[2]陈蕴博,左秀荣,王淼辉,等.人工神经网络在钢铁材料研究中的应用[J].材料导报,2009(7).
[3]张永敢,蔡瑞英.基于BFGS算法的BP网络在烧结终点预报中的应用[J].微计算机信息,2008(34).
Abstract: The river is particularly important in the city's drainage system. In this paper, BP neural network is used to construct the river water level forecasting model from the macroscopic aspect. Through the model predicted value, it is displayed in the three-dimensional system to achieve the spatial distribution of disaster points in the city's waterlogged river. The advantages of the model: access to less data, high precision, can be a good simulation of rainstorm conditions in Kunming Panlongjiang Youguanqiao water level. The research results of this paper are helpful to the study of urban waterlogging.
关键词: 三维系统;BP;城市内涝;MATLAB;预测模型
Key words: three-dimensional system;BP;urban waterlogging;MATLAB;prediction model
中图分类号:TV85 文献标识码:A 文章编号:1006-4311(2017)14-0181-03
0 引言
近年来,城市内涝问题困扰着很多城市,城市河道漫堤对城市的内涝影响较大,城市综合流域排水模型系统(INFOWORKS ICM)现在正被中国大部分市政规划部门应用于城市内涝模拟评价中。INFOWORKS ICM要能精确地模拟城市内涝的演进过程,河道水位数据必不可少。河道灾害点在三维系统中的空间分布对城市防涝,防灾预案的制定、灾害点地下管线的规划有着重要意义。
1 人工神经网络模型的构建
宏观的研究河道水位前人已经做过很多成功的案例。在过去的二十年里,国际上许多学者开展了人工神经网络在城市内涝防治中的相关研究。利用人工神经网络技术对城市洪水,区域洪灾,城市防涝进行了很多研究[1,2]。在预测方面Yen-Ming Chiang,et.al,L.See,et.al,通过一些实验证实人工神经网络在实时洪水预测方面的能力[3,4]。Masoud Bakhtyari Kia等人选择一片示范区域,将该区域的七个不同GIS图层作为神经网络的入条件,将一个河道淹没区空间分布作为输出结果,模拟结果很好地反应了洪水淹没情况[9]。人工神经网络是一种与人类神经系统的信息处理相似的技术。神经网络包括很多种,最常用的一种为BP神经网络,它具有非常强的非线性映射能力,是一种前向网络。怎样获取精度较高的内河河道水位及在其灾害点的三维可视化空间分布,对科学地分析城市内涝具有一定意义。
1.1 数据的收集
本研究采用了大量GIS类型数据,首先采集了盘龙江沿岸1:500地形以及影像数据,同时经过2个月的采集收集了盘龙江沿岸220个排水口数据,这些排水口在雨季都向盘龙江排出雨水,对盘龙江雨天的河道水位造成一定影响,排水口的普查情况在GIS系统中的分布图如图1。
降雨水位数据选取了:金殿水库站、茨坝站、松华乡站、鼓楼站、双龙乡站,对昆明市盘龙江昆明水文站油管桥段影响较大的几个降雨观测站(见图2)。
收集了从7月18日13时到7月19日23时的降雨数据,数据覆盖了整个洪水的淹没过程, ANDREW P. DUNCAN等(2012)使用气象雷达和降雨数据建立神经网络模型实现了实时洪水预测[5,6,7],运用降雨数据模拟洪水具有合理性和可行性。水位数据为盘龙江昆明水文站油管桥的监测数据,数据时间跨度为从7月18日13时到7月19日23时的每小时水位数据。
1.2 模型的建立
本文建立以下BP人工神经网络模型,模型结构如图3。
神经网络的建模过程主要包括:数据前处理、选择充分的模式输入、确定适当的网络拓扑结构以及参数初始化和模型检验。本文所用的训练函数:BP网络的学习算法选择trainlm Levenberg-Marquardt反向传播算法训练函数,传输函数隐含层为tan-sigmoid、输出层为purelin为线性函数,purelin(X)函数比较简单,输出就等于输入。
经过多次反复的试错加减隐含层神经元个数,对比他们的学习结果得到最佳的隐含层节点数为10,学习因子为0.04,目标误差为1e-6,最大迭代次数设置为5000次,训练的结果不错。
1.3 模型的运行结果
加入排水知识的管线数据后,神经网络预测模型的河道水位与实际河道水位的对比如图4。从图4可以看出神经网络预测模型可以很好地模拟河道水位[8,9]。
通过建立BP人工神经网络模型,实现人工神经网络模型与城市河道系统的耦合,对输入条件进行了网络自学习、模拟和训练,通过上述工作,对昆明市主城区盘龙江昆明水文站2013年7月19日前后35小时内暴雨水位进行预测,研究结果表明,上述方法能够很好地模拟河道水位变化情况,模拟结果在内涝水位时间分布上与历史记录基本趋同,因此本研究能够为预测城市内河水位过程提供帮助。
2 三维系统
StampGIS是国际领先的具有完全自主知识产权的大型3D GIS平台软件,其在精细化大场景渲染、真实美观的可视化效果、地上地下一体化、海量空间数据管理、三维数据全要素实时在线更新和三维地下管线自动化生成等方面具有核心技术竞争优势,支持倾斜摄影测量数据、支持BIM数据、分布式部署、物联网集成和云计算架构,可无缝聚合ArcGIS、天地图等第三方服务。平台采用开放的软件架构体系,可实现开发环境(SDK)与运行环境(RunTime)的统一,并提供丰富的二次开发接口(COM)。
StampGIS系列软件及三维数据生产工艺已广泛应用于数字城市、城乡规划、市政管线、数字营房、高速公路、城市交通和数字矿山等领域,在StampGIS中表达河道水位灾害点的分布较为直观。本文通过神经网络预测的河道水位点,比较现实河堤数据,来判断河道是否漫堤,即是否为灾害点。加入河道水位点的三维空间分布如图6。当城市进入暴雨期时,水位监测点的水位高程超过河堤高程,即为城市内河的在灾害点。
3 结束语
本文从神经网络模型入手,运用BP神经网络的预测功能来预测河道的水位数据,结合河堤数据从而判断盘龙江沿岸的灾害点。再结合三维信息系统软件制作水位灾害点的分布图,使得理论研究的成果能够直观地表现出来。本文限于盘龙江沿岸水位点数据,水位点只获取了油管桥一点。后期可以根据需要制作河道水位淹没点专题地图,使其成果应用于昆明的实际生活。我国由于城市排水管网水力模型的构建起步较晚,基础数据的不足及普查数据的精度问题使得建立模型的精确度不高,模拟效果不理想。在城市内涝研究中人工神经网络需要的数据少,预测精确度高,它的引入可以解决宏观的河道水位预测。但人工神经网络自身还存在一些不完善的地方需要进一步研究进行完善。相信神经网络与三维系统的结合可以很好地服务于城市内涝研究。
参考文献:
[1]A. Breinholt, P. A. Santacoloma , P. S. Mikkelsen , H. Madsen , M. Grum 3, M.K. Nielsen. Evaluation framework for control of integrated urban drainage systems[C].11th International Conference on Urban Drainage, Edinburgh, Scotland, UK: 2008.
[2]Jeng-Chung Chen, Shu-Kuang Ning, Ho-Wen Chen and Ching-Sung Shu. Flooding probability of urban area estimated by decisiontree and artificial neural networks[J]. Journal of Hydroinformatics, 2008(10):57-67.
[3]Yen-Ming Chiang, Li-Chiu Chang, Meng-Jung Tsai, Yi-Fung Wang, and Fi-John Chang. Dynamic neural networks for real-time water level predictions of sewerage systems-covering gauged and ungauged sites[J]. Hydrol. Earth Syst. Sci., 2010(14):1309-1319.
[4]L. See, S. Corne, M. Dougherty, S. Openshaw. Some Initial Experiments with Neural Network Models of Flood Forecasting on the River Ouse[J]. GeoComputation '97 & SIRC '97, 1997:15-22.
[5]Masoud Bakhtyari Kia,Saied Pirasteh,Biswajeet Pradhan,Ahmad Rodzi Mahmud,Wan Nor Azmin Sulaiman,Abbas Moradi. An artificial neural network model for flood simulation using GIS:Johor River Basin, Malaysia [J]. Environ Earth Sci, 2011:DOI 10.1007/s12665-011-1504-z.
[6]ANDREW P. DUNCAN, ALBERT S. CHEN, EDWARD C. KEEDWELL, SLOBODAN DJORDJEVI & DRAGAN A. SAVI. Urban flood prediction in real-time from weather radar and rainfall data using artificial neural networks [J]. IAHS Red Book, 2012:1-6.
[7]T必波,张伶俐,陈艳.BP神经网络在洪流预报中的应用[J].重庆工学院学报,2008,22(7):117-128.