前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络算法的优缺点主题范文,仅供参考,欢迎阅读并收藏。
关键词:切削数据库;数据寻优算法;实例推理;粒子群算法;神经网络算法
中图分类号:TG506 文献标志码:A 文章编号:1007-2683(2013)01-0001-06
0.引言
近年来,随着数控机床及切削刀具技术的不断发展,切削数据在机械制造领域中越来越显示出其重要性,并且已经成为一种极为重要的资源。
数据库是集中、保存和管理某一领域内所有这些信息的集合,是管理信息系统的核心。切削数据库是切削加工技术与计算机技术相结合的产物。切削数据库最初只是管理加工中出现的切削数据,随着神经网络算法、粒子群算法等优化算法的应用,切削数据库中添加了优化切削数据和切削数据的智能化评价等功能,使得切削数据库系统得到了很大的发展并已受到各相关行业的高度重视。选择合理的优化算法建立切削数据库,可以合理地选择切削参数,对提高生产率、降低生产成本有着非常重要的意义。对于解决某一类问题,可以通过多种算法来实现但并不是每一种算法都能找到最优解,需要根据每个算法自身的优缺点、适合的领域、优化方式等来选择合适的算法,从而使寻优路径达到最短,优化效果达到最好。但是传统的优化算法也存在一定的弊端,为此提出了算法的改进算法,在很大程度上增强了算法的寻优能力。
1.数据获取技术在切削数据库中的应用
1.1神经网络推理技术
神经网络算法是指模拟生物的神经结构以及其处理信息的方式来进行计算的一种算法。神经网络可以处理例外及不正常的输入数据,这对于很多系统都很重要。黄传真等研究的汽车覆盖件模具钢高速切削数据库将分别基于MATLAB神经网络和基于指数函数的刀具磨损预报模型的拟合误差相比较,优选出基于MATLAB神经网络的刀具磨损预报模型,并将.NET框架和MATLAB环境引入到刀具磨损集成预报系统中,实现了模具钢精加工过程中对刀具磨损的在线预报,实现了对高速切削加工技术的合理应用。
为了实现神经网络模型的智能寻优,将其与蚁群算法相结合使用,用蚁群算法的启发式寻优和全局优化的特点来训练神经网络的权值即用蚁群算法来训练神经网络,最终解决寻优问题。如詹晓娟等研究的基于蚁群神经网络铣削数据库系统就是利用蚁群算法优化神经网络的方法,使系统在切削参数的选择具有一定的智力水平,实现了切削参数的合理选择。这种智能寻优的方法不仅避免了以往算法收敛速度慢易陷入局部最优等缺陷,提高了系统的运行速度和运算效率,还能够通过自学习提高自身决策能力,使决策结果更趋合理。
神经网络在解决非线性映射问题如切削用量选择上可达到良好的效果,在机械工程领域具有很高的利用价值。但是当前的神经网络仍普遍存在收敛速度慢、计算量大、训练时间长和不可解释等缺点。
1.2动力学仿真优化技术
切削参数数据库的数据主要来源于切削手册、生产实践和切削实验,传统来源的切削参数难以完全满足切削加工的要求。为了存储优化型仿真切削数据,保证切削加工稳定性,赵海洋等在平台下开发了基于B/S数据库结构的动力学仿真优化型切削数据库系统。该系统通过动力学仿真优化方式获取优化型切削参数,实现了高速加工过程中的稳定高效切削。
将动力学仿真优化技术引入到切削数据库及其应用系统中,不仅能使系统具有良好的结构和可扩展性,还能提供工艺人员合理的切削参数,大大减少了以往试切所带来的经济和时间上的浪费,从而提高了生产效率,降低了生产成本。
1.3实例推理技术
1982年Schank通过研究人和机器学习的动态存储理论,提出了基于实例的推理(case-based reason-ing,CBR)其本质是利用旧问题的解决方案来解决新问题,并且具有自学习功能,CBR原理如图1所示。
利用实例推理技术,将其与规则推理相结合使用,把以往取得的经验应用于新问题的解决上,减少知识获取的工作量,不仅可以为建立切削参数数据库提供一个有效可行的方法,还可以为新的工件加工问题提供参考解决方案,对切削技术的推广应用具有非常重要的意义。
CBR是一种人工智能的推理方法,广泛应用于问题求解领域,在一定程度上突破了知识获取的瓶颈问题。由于CBR中实例都是以往问题的优化结果,因此其本身就包含了大量的设计经验知识,不仅避免了在获取知识上的时间的浪费,而且设计结果的实用性也很强。CBR为快速设计新的工艺提供了依据。
2.切削数据优化算法分析对比
2.1多目标优化算法的比较
从古老的时代开始,人们就力求在解决一个问题的众多方案中寻求一种最优方案,因此实际中优化问题大多数是多目标优化问题,它也是一类普遍存在的问题。基于群体智能进化的群体智能优化算法在解决多目标优化问题上提高了人们解决和处理优化问题的能力。但是粒子群算法等群体智能优化算法在解决多目标优化问题时有着各自的优缺点,需要对它们进行比较以选择合适的算法。表1是几种智能优化算法的比较。
通过表1中几种算法的对比可以看出,每种优化算法都有自己独特的优缺点,但是在处理高维复杂问题时都出现易陷入局部最优、收敛效果不好的问题。粒子群算法和遗传算法都属于全局优化算法,利用目标函数来衡量个体的优劣程度,粒子群算法计算复杂度比遗传算法低,可以短时间内找到最优解,但粒子群算法在搜索性能上好于混洗蛙跳算法。可以将几种算法结合使用或者对某种算法进行改进,弥补以往算法的缺点,从而达到更好的解决多目标优化问题的目的。
2.2知识获取的推理方式比较
规则推理、人工神经网络、实例推理、模糊逻辑、遗传算法和混合推理等智能推理方法被普遍应用在工程中。实例推理作为基于规则推理技术的一个重要补充,已受到人们越来越广泛的关注。但目前比较常用的智能推理方法有规则推理、神经网络和实例推理,它们在解决不同问题上表现出各自的优缺点,如表2所示。
根据表2列出的3种智能推理方式的比较可以看出,在总体上来看实例推理表现最好,但在解决复杂知识获取问题上仍表现出明显的不足。针对这一问题研究人员将实例推理、规则推理、人工神经网络三者结合,产生了各种各样的混合推理,这些推理不仅结合了它们各自的优点,而且很大程度上克服了单个方法的缺点,可
以很好的解决复杂问题,如高速切削数据库系统的建立就是采用规则推理和实例相结合的混合推理方式,通过这一方式使该系统的数据采集和知识更新变得简单易行。
2.3数据查询优化算法比较
随着现代切削数据库规模的不断扩大,高效率的信息提取技术逐渐成为人们研究的热点。高效的查询被用来体现一个系统性能的好坏,查询的效率也就成为了评价切削数据库系统的重要指标。提高查询效率是建立一个系统首要解决的问题之一,因此对作为有效手段的查询优化的研究就显得尤为重要。但是一个较好的优化算法,并不是通用和万能的,根据不同的环境不同的优化算法适用于不同的的问题及用户。目前常用的数据查寻优化算法有启发式搜索算法又称为A算法,它是在贪婪算法的基础上提出的一种基于人工智能理论的改进算法;基于Agent的分布式查询优化算法,它结合了分布式人工智能与切削数据库管理系统两个领域;遗传算法,它是模拟生物在环境中遗传和进化过程而形成得一种自适应的全局优化概率搜索算法;全局查询优化算法如模拟退火算法、快速分解模拟退火等,能够找出全局最优解;等联结操作结果估算模型,它是一种改进算法,能保证优化方法在一定条件下生成的任意两个相邻的操作次序是最优的;分裂大表算法即将大表分成若干个子表和一个索引表,将子表放在不同的逻辑设备上,各子表的名称和分裂条件存放在索引表里来提高查询速度;神经网络技术的异构数据库集成,它可以通过将全局查询快速地分解为各个子查询,来进行优化操作;多元连接查询优化算法,针对远程网和局域网这两种不同的网络,提出了最小生成树算法和改进的最小生成树算法两种全局优化算法,反复使用此算法可使预先估计的总代价最小;分布式查询优化算法,它的核心是SDD-1查询优化算法,该算法在一定程度上可以使整个网络上的传输量保持最小。对数据库进行查询时,可供选择查询优化算法很多,需要根据一定的标准来评价各算法是否适用于此环境,以提高效率的目的。为此研究人员提出了评价算法的4个标准:一是否适用于大数据量;二是否能应付异构数据库的要求;三是局部优化还是全局优化;四是算法的效率是否满足大数据量、高复杂性的要求。表3是几种数据查询优化算法的比较。
由表3可知,对数据库进行查询时,对查询优化算法的选择需要考虑很多因素,不能通过一个固定的原则来评价优化算法的优劣,需要根据当时的系统环境来选择合适的优化算法,这样才能充分利用算法的优点。
3.数据寻优算法的改进
目前许多数据优化算法被广泛应用在机械加工领域,在一定程度上达到了数据寻优的目的,提高了系统的寻优能力,但是面临一些复杂的问题时一些算法表现出收敛速度慢、陷入局优等问题,为了解决这一问题,对一些算法提出了改进,下面介绍了几种算法的改进算法。
3.1变形遗传算法
变形遗传算法是从简单遗传算法发展而来的,是对其运算因子的扩展和补充。简单遗传算法存在许多的不足之处,变形遗传算法在此基础上进行了一些改进:改进编码方式,改进初始群体的生成方式,改进适应度函数的定义方式,改进选择算子操作方式,改进变异算子操作方式,改进算法终止条件。这些算法增强了变形遗传算法搜索过程的方向性,从而增强了算法搜索寻优的方向性。图2为切削用量优化的变形遗传算法的流程图。
变形遗传算法有两个优点:一是具有局部的随机搜索能力;二是可维持群体多样性,防止出现未成熟收敛现象,从而使收敛概率达到大值。
3.2改进的粒子群算法
粒子群优化算法在函数优化等领域蕴涵了广阔的应用前景,利用粒子群优化参数原理(如图3),并与局部搜索算法混合,可以提高了算法在局部区域内进行精细搜索的能力。寻找到最优化的加工参数。目前针对粒子群算法存在的问题,已提出了多种粒子群算法改进算法,并且这些改进的算法广泛应用于函数优化,神经网络训练,模式分类等领域。其中一种改进的粒子群算法是针对粒子群算法在求解高维函数时易陷入局部最优的问题提出的,该算法通过对粒子的速度和位置更新公式进行改进,使粒子在其最优位置的基础上进行位置更新,从而增强算法的寻优能力。如图4为改进的粒子群算法流程图。
另外两种典型的粒子群算法的改进算法为:①全局邻域模式和局部邻域模式粒子群优化算法,前者收敛速度快,但易陷入局部极小值;后者收敛速度慢,但能在较大程度上避开局部极小值;②混沌粒子群优化算法,它不但具有混沌的随机性、遍历性、规律性等特性,还能引导粒子及其组成的群落搜索全局最优解。
3.3协同优化算法的改进
协同优化算法(eollaborati Veoptimization,CO)是多学科设计优化方法中应用最广、效果最好的算法,但是在应用中存在计算困难的问题,根据这一问题提出了改进的协同优化算法一ICO(Improvedeollaborati Veoptimization)多学科设计优化方法。
ICO多学科设计优化方法保持了CO算法模块化和学科自治性的优点,以新的表达方式来克服CO算法的计算困难。ICO算法利用快速启动方法提高了计算速度,使得ICO算法比标准CO算法更加稳定、可靠,计算效率明显提高。以往协同粒子群算法不能保证全局收敛,易产生伪最优值的问题,根据这一问题提出改进的协同粒子群优化算法,它将混沌理论引入协同粒子群算法中,改善了协同粒子群算法的性能,使其具备了求解高维优化问题的优越性。但是IC0算法还需要在大型复杂工程系统设计优化中进行应用、检验及进一步完善。
Matherton提出Kriging数学理论之后,Kriging技术在许多领域得到应用,研究人员以此为基础并基于统计学理论提出了Kriging模型,Kriging模型被视为一种最优的线性无偏估计。对于计算量大的问题可以利用基于Kriging模型的改进协同优化算法(Kriging-CO算法)来提高系统的优化效率,该改进算法的原理如图5所示。Kriging-CO算法适用于解决共享变量多、子模型复杂的问题,应用该算法减少迭代次数,提高运算效率。
虽然一些改进算法弥补了以往算法一些不足,但切削数据库技术的发展越来越快,对切削数据库性能的要求越来越高,出现的问题也会越来越多,因此对算法的研究也必须更加深入。
4.结语
关键词: 供应链绩效评价;模糊综合评估;粗糙集;BP神经网络
中图分类号:C93 文献标识码: A文章编号:1003-7217(2011)05-0119-06
一、引 言
在供应链条件下,各节点企业运作行为往往具有随机性和不确定性。动态供应链绩效评价是一个包含多个指标和输入输出的复杂评估系统,各绩效指标具有模糊性、不确定性,彼此之间存在非线性关联性。软计算[1-7]理论与方法是处理动态供应链绩效这样复杂的、具有大量不确定性和模糊性的评估系统的重要技术。在相当多的领域(自然科学、社会科学与工程技术)中,都涉及到对不完备信息和不确定因素的处理。从实际系统中采集到的数据常常包含着噪声、不精确甚至不完整,如果我们采用纯数学上的假设来消除或回避这种不确定性,效果往往不理想。但如果对这种信息使用恰当的方式进行处理,常常有助于实际系统问题的解决。
二、相关研究评述
多年来,研究人员一直在努力寻找科学地处理不完整性和不确定性的有效途径,实践证明,1965年Zadeh[8]创立的模糊集理论与1982年Pawlak[9]倡导的粗糙集理论是处理不确定性的两种很好的方法。事实上,除了上述两种方法外,基于概率统计方法的证据理论也是处理不确定性的一种有效方法。以上众多的方法都属于软计算[10-15](Soft Computing)的范畴。Zadeh教授提出了软计算的概念,软计算的主要工具包括粗糙集、模糊逻辑(Fuzzy Logic)、神经网络、概率推理(Probability Reasoning)、信任度网络(Belief Network)、遗传算法(Genetic Arithmetic)、混沌理论(Chaos)等。传统的计算方法,即所谓的硬计算(Hard Computing),使用精确、固定和不变的算法来表达和解决问题,软计算利用所允许的不精确性、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调。因此,软计算作为知识获取和智能信息处理的重要手段,在许多研究领域有着广泛而深入的应用。
(一)基于模糊综合评估的供应链绩效评价
模糊集理论是经典理论的推广,它认为元素总是以一定的程度属于某个集合, 也可能以不同的程度属于几个集合。经典理论中集合的边界是清晰的,而模糊集理论中集合的边界是不清晰的,对人们显示生活中大量使用的一些含义确定但不准确的语言表述,模糊数学可以较好地表达,因而可以自然地用于事物的评价。
在动态供应链绩效评价体系中,各绩效指标之间往往存在着复杂的因果关系,这些指标中既有定性指标也有定量指标,具有模糊和不确定的特点,模糊综合评估方法为处理这种不确定性提供了有力的工具,它能够尽可能地减少个人主观臆断所带来的危害,为合理评价决策提供科学的依据。作者在文献[16]中详细讨论了基于模糊综合分析的供应链绩效评价方法,并结合Markov链预测理论给出了供应链绩效未来的发展趋势。
(二)基于粗糙集约简的供应链绩效评价
Rough集理论是一种刻画含噪声、不完整、不精确、不相容的数学工具,它能有效分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律,是一种重要的软计算技术。其主要思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类原则。Rough 集理论是基于不可分辨的思想和知识简化的方法,从数据中推理逻辑规则作为知识系统模型。
如前所述,在供应链条件下,各节点企业运作策略具有动态可调节性,其运作行为具有随机性和不确定性,这就要求在对供应链绩效进行评价必须采用动态评价方法,同时对供应链在未来某一时刻的整体绩效进行预测。粗糙集及其约简理论是处理这种不确定性的重要技术。作者在文献[17]中基于粗糙集理论的绩效评价模型,建立了动态供应链绩效评价决策表,利用粗糙集约简方法得到了预测绩效评价结果的决策规则集,并把粗糙集约简和模糊综合评估技术相结合进行动态供应链绩效评价,显然地缩小了数据处理的规模,降低了模型的计算复杂度。
(三)基于神经网络的供应链绩效评价
神经网络可大规模地并行处理和分布式地存储信息,具有良好的自适应、自组织性以及很强的学习功能、联想功能和容错功能。与当今的冯诺依曼式计算机相比,更加接近人脑的信息处理模式,主要表现为能够处理连续的模拟信号。神经网络并行分布工作,各组成部分同时参与运算,单个神经元的动作速度不高,但总体的处理速度很快。神经网络信息存储分布于全网络各个权重变换之中,某些单元障碍并不影响信息的完整。传统计算机要求有准确的输入条件, 才能给出精确解。神经网络只要求部分条件,甚至对于包含有部分错误的输入,也能得出较好的解答,因此具有较好的容错性。
动态供应链绩效评价是一个包含多个指标输入输出的复杂评估系统,各绩效指标具有模糊性,彼此之间存在非线性关联性。针对这样一个复杂的评估系统,作者曾利用BP神经网络技术来找出供应链绩效评价系统输入-输出之间的非线性映射关系,从而对动态供应链绩效评价结果进行学习和预测。通过与粗糙集约简理论相结合,简化了BP神经网络的结构设计,减小了运算量。
(四)几种软计算方法的优缺点
软计算是一个方法的集合体,目前主要包括粗糙集、模糊逻辑、神经网络、概率推理、信任度网络、遗传算法以及混沌理论等。软计算方法已广泛应用于包括模式识别、数据挖掘、系统评价、故障诊断、专家系统等在内的诸多领域的不精确、不确定问题。软计算方法按照其特点各有优势。例如,模糊集可以通过对人类思维建模来给不确定性问题提供自然的解决机制;粗糙集在属性约简和规则抽取方面性能优良;神经网络对噪声具有强鲁棒性,分类精度高;遗传算法广泛用于优化搜索问题。 同时,以上软计算方法依照算法的不同有各自的局限性:模糊集过度依赖专家知识,遗传算法收敛速度慢、稳定性差,神经网络训练时间过长、知识解释性差,而粗糙集对数据中的噪声较敏感。本文为了克服单一方法的局限,试图通过集成两种或两种以上的软计算方法的软计算融合系统来解决供应链绩效评价的实际问题[6, 7]。
财经理论与实践(双月刊)2011年第5期2011年第5期(总第173期)郑 培,万 炜:基于智能信息处理的供应链绩效评价方法
(五)软计算融合技术在动态供应链绩效评价中的应用
作者详细研究了模糊综合分析、粗糙集理论、神经网络等软计算技术在动态供应链绩效评价中的应用方法。从文献[16-17]实验结果可以初步看出,通过把几种软计算技术融合起来应用于供应链绩效评价,就能够克服单一智能信息处理方法的缺陷,取得更好的效果。本文使用的几种软计算技术能在多个方面进行融合[6, 7]。
粗糙集和神经网络的融合。通过粗糙集的属性约简可以显著减少原始数据量,使神经网络训练时间缩短,从训练后的神经网络中抽取规则也可显著提高神经网络中知识可理解性;神经网络的强鲁棒性也可解决粗糙集处理数据中的噪声问题。
粗糙集理论和模糊集理论的融合。粗糙集理论和模糊集理论都是研究信息系统中知识不完善、不精确问题的方法,但粗糙集理论解决问题的出发点是信息系统中知识的不可分辨性,而模糊集理论则关注信息系统中知识的模糊性,两者在处理方法上各有特色。两者的结合可以更好地解决信息系统中不完善、不精确性知识的问题。
模糊集和神经网络的融合。模糊集和神经网络的融合主要有模糊神经网络和神经模糊系统。神经模糊系统以神经网络为主,结合模糊集理论,将神经网络作为实现模糊模型的工具,即在神经网络的框架下实现模糊系统或其一部分功能。从结构上看,一般是四层或五层的前向神经网络。模糊神经网络是神经网络的模糊化,即以模糊集、模糊逻辑为主,结合神经网络方法,利用神经网络的自组织性,达到柔性信息处理的目的。
三、基于智能信息处理的供应链绩效评价方法比较
(一)基本思路
在作者以前的研究里,曾应用模糊综合分析、粗糙集理论和BP神经网络等智能信息处理方法建立了多个供应链绩效评价模型,本文对这些评价模型的效果和优缺点进行了分析和总结。我们的基本思路是以某动态供应链为例,选取合适的绩效指标集,对得到的绩效指标按照评价模型的数据要求进行预处理,然后输入到不同的动态绩效评价模型中进行处理,对各个绩效评价模型进行解算。通过对模型输出的结果的比较和分析来归纳各个绩效评价模型的主要特点,并对评价模型的实际效果进行总结。
(二)数据预处理
如前所述,本文已经根据文献[15]提出的供应链五维平衡计分卡,选择了15个关键绩效指标作为动态供应链的绩效评价指标集C,C={F1, F2, F3, C1, C2, C3, P1, P2, P3, P4, L1, L2, L3, S1, S2}。在15个绩效指标中,既有定性指标,也有定量指标。由于BP神经网络只能处理数值向量,因此在这些绩效指标输入BP网络训练之前必须对它们进行预处理。在基于粗糙集理论的供应链绩效评价模型里,根据决策表信息约简的要求,需要对所有属性的取值进行离散化处理。这里对某动态联盟供应链绩效决策表条件属性采用表1的方法进行离散化处理。
假设根据历史经验或供应链行规,把供应链的绩效评价结果划分为G1、G2、G3、G4四个等级,分别对应供应链绩效评价为优、良、中、差的状态,其划分的依据如表1所示。
在基于模糊综合评估的供应链绩效评价模型里,表1将作为构造各绩效指标属于各类的隶属度函数的依据。
(三)实验结果比较与分析
实验的数据源仍采用文献[15]某供应链相关指标的调查结果,经调查得到该供应链在2007年1~12个月的绩效指标取值和绩效综合评价结果。本文已经详细讨论了对该供应链绩效采用基于BP网络训练和学习的过程,并结合粗糙集约简给出两者相结合的混合绩效评价方法及结果。
BP网络学习完毕后,就可以用来对下一评估时刻的供应链绩效进行预测。针对上述供应链,经调查得到该供应链在2008年前4个月的绩效指标取值结果,如表2所示。
将上述各绩效指标规一化后输入训练好的BP网络,得到相应的输出向量分别为(0.0023, 0.998, -0.002, 0.007)、(-0.008, 0.003, 0.988, -0.005)、(-0.008, 0.958, -0.008, -0.002)和(0.987, -0.010, -0.005, 0.005)。据此可判断该供应链在2008年1~4月的绩效综合评价结果分别为G2、G3、G2、G1。
进一步,针对表1所示的供应链绩效分级标准,可以通过Rough约简得到供应链绩效分级决策表的最佳约简,即供应链绩效评价的关键绩效指标集。通过约简得到供应链绩效评价的关键指标集为{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},这样这12个关键绩效指标就构成了BP网络的输入层节点。把表2所示的供应链在2008年1~4月的关键绩效指标量化结果输入训练好的BP网络,可求出其相应的绩效评价结果分别为G2、G3、G2、G1,与供应链绩效实际调查结果一致。
下面,针对同一供应链,分别采用基于粗糙集理论的动态供应链绩效评价模型、基于模糊综合评估的供应链绩效评价模型及两者的结合来得出供应链绩效评价结果,并进行方法间的比较。
在基于粗糙集理论的供应链绩效评价模型里,先对各绩效指标进行离散化处理,离散化后的该动态供应链绩效决策表如下。
对于表3所示的绩效评价决策表,利用约简算法对决策表进行属性约简,以便去掉决策表的冗余条件属性。进一步,利用归纳值约简算法对绩效决策表进行值约简,可以得到一系列用于供应链绩效评价的决策规则集。由于决策属性值被离散化为四个等级,亦即信息系统具有四个概念。针对这四个概念的最一般规则分别为:
根据上述关于决策属性取值的最一般规则,就可以对某一考察周期动态联盟的综合绩效评价结果作出判断。当条件属性集不完全满足规则前件时,可以选取关于各个概念的次一般(或可信度较高)的生成式规则对绩效作出综合评估。
把表2所示的该供应链在2008年前4个月的绩效指标离散化,然后针对上述供应链绩效评价决策规则进行匹配,可得这4个月供应链绩效综合评价结果分别为G3、G3、G2、G1。
接着,采用模糊综合评估方法来对同一供应链的绩效评价结果进行分析。首先建立模糊关系矩阵,单因素评价矩阵取各因素在评价集上的隶属度,各隶属度函数均取为二次函数。根据供应链绩效分类标准表1,建立F1属于各类的隶属度函数为:
同理,可分别建立其它绩效指标属于各类的隶属度函数,对应绩效评价指标集C的权向量取为:
W=(0.17,0.06,0.02,0.08,0.13,0.02,0.05,0.04,0.10,0.01,0.10,0.04,0.05,0.11,0.02)
于是,由模糊综合评估法可求出该供应链在2008年前4个月的绩效分别为G3、G3、G2、G1。
最后,采用结合了粗糙集约简和模糊综合评估的动态供应链绩效评价方法来得到该供应链绩效评价结果。首先借助于动态供应链绩效评价决策表对绩效评价指标进行约简和降维,通过Rough约简得到供应链绩效评价的关键绩效指标集为{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},根据供应链绩效分类标准表2分别建立上述关键绩效指标属于各类的隶属度函数,然后利用模糊评估方法对供应链绩效进行综合评价。根据该混合供应链绩效评价方法求出该供应链在2008年前4个月的绩效分别为G2、G3、G3、G1。
我们给出了采用上述五种基于智能信息处理的绩效评价方法得到的该供应链在2007年1月~2008年4月间绩效评价结果的变化趋势,如图1所示。其中,如图例所示圆圈、方块实线、下三角实线、粗标圆卷实线和带星虚线分别代表了对应月份由五种评估方法得到的供应链绩效评价结果。
图1 某供应链采用五种绩效综合评估方法得到的评价结果
从图1可以看出,采用五种不同的供应链绩效评价方法得到的结果略有差异。这一差异由多种原因引起,首先基于BP神经网络的绩效评价方法和基于粗糙集理论的绩效评价方法都是有监督的智能学习算法,即在对动态供应链绩效评价结果作出预测之前,都有个训练的过程,这需要大量的历史数据。而基于模糊综合评估的供应链绩效评价方法隶属度函数主要由绩效分级标准确定,并不“显式”地需要历史绩效结果。其次,许多基于智能信息处理的绩效评价模型都需要事先确定一些参数,如BP网络需要确定网络结构、学习速率、冲量因子;模糊综合评估需要确定指标权值和隶属度函数表示方法等。另外,不同的绩效评价模型对输入数据的要求各不相同,BP神经网络和模糊综合评估处理的是连续数据,粗糙集约简处理的是离散数据,而实际获得的绩效指标中既有定性指标,也有定量指标,这就需要在绩效指标输入模型之前进行预处理,预处理方法的不同导致模型输出有很大的差异。上述几种不同的基于智能信息处理的供应链绩效评价方法输出结果与供应链实际绩效基本相符,在实际使用时要根据情况灵活选择。
此外,实验结果也表明通过几种智能信息处理方法融合在动态供应链绩效评价中能取得更好的效果。通过粗糙集约简和模糊综合评估的融合,显然缩小了数据处理的规模,降低了评估模型的计算复杂度,同时克服了模糊评估过度依赖专家知识(领域知识)的缺点。通过粗糙集约简和BP神经网络的融合,降低BP网络的设计复杂度,克服了神经网络训练时间长、知识解释性较差的缺点。两种融合方法都保持了较高的准确度,在动态供应链绩效评价中更为有效。
本文的研究结果弥补了目前国内外动态供应链绩效评价中智能信息处理方法的融合理论研究少、应用不够深入的缺点,对实际供应链运作与管理中基于软计算的动态绩效评价模型和方法的选择与应用具有理论指导意义。
四、结 论
软计算作为知识获取和智能信息处理的重要手段,在供应链绩效评价领域有着良好的应用前景。越来越多的学者开始集成两种或两种以上的软计算方法的智能信息融合算法来克服单一方法的局限性。本文针对之前使用的模糊综合评估、粗糙集约简及BP神经网络等软计算方法在动态供应链绩效评价中的主要特点和效果进行了简要的比较和分析,指出了每种方法的优缺点。然而,由于每种智能信息处理方法存在着本质上的差异,对这些方法间的效果差异进行严格的比较存在理论上的困难。某种智能信息处理方法可能适用于某种供应链,而另一种智能信息处理方法则可能更适用于另一种供应链。因此,在实际使用时,要根据供应链具体情况灵活选择或融合多种智能信息处理方法以取得更好的效果。
参考文献:
[1]Anna, M. R. and Etienne, E. K. A comparative study of fuzzy rough sets[J]. Fuzzy Sets and System, 2002 ,126(2): 137-155.
[2]Nagatanit, Helbingd. Stability analysis and stabilization strategies for linear supply chains.[J].Physica A., 2004, 35 (3-4): 644-660.
[3]Mohamed. Q. A-RST: a generation of rough set theory[J]. Information Science, 2000 ,124(1-4): 301-316.
[4]Roman, W. S., Larry, H. Rough sets as a front end of neuraln-etworks texture classifiers[J]. Neurocomputing, 2001, 36: 85-102.
[5]Yahia, M. E., Mahmod R. and N. Sulaiman, et al. Rough neural expert systems[J]. Expert Systems with Applications. 2002, 18: 87-99.
[6]McKee, T. E., Terje, L. Genetic programming and rough sets: a hybrid approach to bankruptcy classification[J]. European Journal of Operational Research, 2002 ,138: 436-451.
[7]Bolch G., Greine, S., H. D. Meer, etc. Queuing networks and markov chains-modeling and performance evaluation with computer science applications (2nd edition)[M]. A John Wiley & Sons, Inc., publication, 2006.
[8]Zadeh L. A. Fuzzy sets[J]. Information and Control. 1965, 8 (3): 338-353.
[9]Pawlak, Z. Rough set-theoretical aspects of reasoning about data [M]. Boston: MA: Kluwer Academic Publishers, 1991.
[10]曹庆奎,阮俊虎.基于粗糙集-未确知测度的矿井通风系统合理性评价[J].科学决策,2009.5:89-94.
[11]刘敬学,陈曦. 基于神经网络的专家预测方法研究[J].科学决策,2009,11:78-81.
[12]Bhagwat and Sharma.Management of information system in SMEs: an exploratory study. [J].International Journal of Enterprise and Network Management. 2006,1(1): 99-125.
[13]Bititici et al..Implementation of performance measurement systems:private and public sectors[J]. Editorial, Production Planning and Control. 2005,16(2):99-100.
[14]郑培,黎建强. 基于BP神经网络的供应链绩效评价方法[J].运筹与管理,2010,19(2):26-32.
[15]宋莎莎,戴锋,卫保璐.基于模糊层次分析法和聚类分析的突发事件分级研究[J].科学决策,2010,10:68-72.
[16]郑培,黎建强. 基于模糊评估和马尔可夫预测的供应链动态平衡记分卡研究 [J]. 系统工程理论与实践,2008,4(4): 57-64.
[17]郑培,黎建强. 基于粗糙集理论的供应链动态绩效评估方法研究 [J]. 运筹与管理,2008,10(5):6-11.
[18]王俊峰,刘立东.基于博弈论的闭环供应链中三方协调研究[J].科学决策,2009,(3):33-37.
Supply Chain Performance Measurement Methods based on Intelligent Information Processing
ZHENG Pei 1, WAN Wei2
(College of Business Administration, Hunan University, Changsha Hunan 410082, China)
关键字:预测模型
一.时间序列分析法
(一)原理
ARMA模型被广泛的应用于时间序列的分析和预测。ARMA(p,q)模型中包括了p自回归项和q滑动平均项,它是自回归模型(AR模型)和滑动平均模型(MA模型)的一般形式,下面就分别介绍AR模型,MA模型和ARMA模型。
(1)自回归AR(P)模型
AR模型即自回归模型,满足: 其中 是模型的参数,c是常数项, 是误差项,E( )=0,E( )= ,E( )=0,t=s。为了简化,常省去常数项c。为了保持AR模型的稳定性,对于模型的参数常有些限制条件,如误差项 是均值为0方差为 的白噪声。
(2)滑动平均MA(q)模型
MA模型既滑动平均模型,满足: ,其中 ,i=1,…,q是模型的参数, ,i=1,…,q是误差项。满足以上方程的时间序列{ }是q―阶滑动平均过程,记为MA(q)。
(3)自回归滑动平均ARMA(p,q)模型
ARMA(p,q)模型中包含了p自回归项和q滑动平均项,它是自回归模型(ARMA模型)和滑动平均模型(MA模型)的一般形式,ARMA(p,q)模型可以表示为 = + ,其中 ,…, 是模型的参数, 是常数项, 是误差项。如果q=0,则ARMA模型就简化成AR模型,如果p=0,则ARMA模型就简化成MA模型。
由此可以看出AR(p),MA(q),ARMA(p,q)模型之间存在着深刻的联系。
(二)模型评价
时间序列预测法期限是短期,中期预测。主要适用于经济预测,商业预测,需求预测,库存预测等。时间序列分析预测法是根据市场过去的变化趋势未来的发展,它的前提是假定事物的过去会同样延续到未来。事物的现实是历史发展的结果,而事物的未来又是显示的延伸,事物的过去和未来是有联系的。优点是简单易行,便于掌握,能够充分运用原时间序列的各项数据,计算速度快。采用组合的时间序列或者把时间序列和其他模型组合效果更好。缺点是不能反映事物的内在联系,不能分析两个因素的相关关系。当遇到外界发生较大变化往往会有较大偏差。
二.神经网络(BP)预测模型
(一)原理
BP网络是采用Widrow―Hoff学习算法和非线性可转移函数的多层网络。典型的BP算法采用梯度下降法,也就是Widrow―Hoff算法。现在有许多基本的优化算法,例如变尺度算法和牛顿算法。BP神经网络包括一下单元:①处理单元(神经元),级神经网络的基本组成部分。输入层的处理单元只是将输入值转入相邻的联接权重,隐层和输出层的处理单元将它们的输出值求和并根据转移函数计算输出值。②联接权重。它将神经网络中的处理单元联系起来,其值随各处理单元的联接程度而变化。③层。神经网络一般具有输入层x、隐层y和输入层o。④阈值。其值可为恒值或可变值,它可使网络能更自由地获取所要描述的函数关系。⑤转移函数F。它是将输入的数据转化为输出的处理单元,通常为非线性函数。
(二)模型评价
BP神经网络模型适用于中长期的预测。优点:逼近效果好,计算速度快。不需要建立数学模型,精度高。具有强非线性拟合能力。缺点是无法表达和分析被预测系统的输入和输出间的关系,预测人员无法参与预测过程,收敛速度慢,难以处理海量数据,得到的网络容错能力差,算法不完备。
三.灰色预测模型
灰色系统理论以“部分信息已知,部分信息未知”的“小样本”,“贫信息”不确定型系统的研究对象。
(一)原理
灰色系统有多种模型。n阶h个变量的灰色模型几座GM(n,h)。预测模型中,最常用的是GM(1,1)模型。GM(1,1)模型的微分方式为
d+a其中t表示时间序号;a,u表示原始数据
灰色模型的基本思路可以概括为以下几点:
(1)建立模型常用数据有以下几种:1.科学实验数据;2.经验数据;3.生产数据;4.决策数据。
(2)序列生成数据是建立灰色模型的基础数据。
(3)一般非负序列累加生成后,得到准光滑序列。对于满足光滑条件的序列,即可建立GM微分模型。
(4)模型精度可以通过不同的会输生成方式。数据的取舍,序列的调整,修正以及不同级别的残差GM模型补充得到提高。
(5)灰色系统理论采用残差大小检验,关联度检验,后严查检验三种方法检验,判断模型的精度。
(二)模型评价
核心体系是灰色模型,即对原始数据作累加生成得到近似的指数规律再进行建模的模型方法。优点是不需要很多的数据,一般只需要4个数据就够了,能解决历史数据少。序列的完整性及可靠性低的问题。运算简便,易于检验。具有不考虑分布规律和变化趋势的特点。缺点是只适合用与中长期的预测,只适合指数增长的预测,数据波动性大对预测精度有较大影响,预测结果较差。
以上三种预测模型有各自的优缺点,针对数据的特点,有针对性的选择合适的预测模型。有时也可以结合模型的优点进行组合应用。
参考文献
[1]陈蓉 话务量分析和多种预测模型的比较研究
[2]朱峰 浅谈数学建模中预测方法 --- 高校讲坛
Abstract: Neural network is widely applied for character recognition. Through the analysis of the problems, this paper recognizes character by the application of improved BP neural network, so as to improve recognition rate. This method has high recognition rate, fast speed, strong practicability, and can be applied to various high noise environment.
关键词: 神经网络;图像预处理;特征提取;字符识别
Key words: neural network;image preprocessing;feature extraction;character recognition
中图分类号:TP301.6 文献标识码:A 文章编号:1006-4311(2014)10-0206-02
0 引言
字符识别是指采用扫描仪、数码相机等输入设备,把英文字母、数字、条形码等特殊字符的图形文件输入计算机,由识别软件对图片信息上的字符信息进行识别并变换成可编辑文档的识别技术。主要有光学字符识别(Optical
Character Recognition,OCR)、图像字符识别(Image Character Recognition,ICR)和智能字符识别(Intelligent Character Recognition,ICR),实际上这三种自动识别技术的基本原理大致相同。
1 常用字符识别方法
字符识别方法基本上都是为了区分结构识别、统计识别以及两者相结合的三大类方法,这三大类方法都包含具体的识别方法。
1.1 结构识别 结构识别是早期字符识别的研究的主要方法,我们也可以称之为句法结构识别。其思想是提取含有一定规律的结构信息,作为识别的依据。识别过程类似一个逻辑推理过程。结构识别的优点在于对字符变化的适应性强,区分相似字符能力强。但是在实际获取字符图像的过程中,由于存在着很多扭曲、倾斜等因素,就导致不能够准确地提取结构特征,后面的识别过程就成了无源之水。此外,结构识别的算法描述也较为复杂,匹配过程的复杂度也很高,因此,我们原有的句法识别就受到新的挑战。
1.2 统计识别 统计决策论的发展相对较早而且成熟,是为了提取待识别字符的一组统计特征,然后按照一定的准则进行决策函数的分类判决的。而统计识别是将字符点阵看作是一个能够经过大量统计数据得到的整体,是以后所用的特征都需要经过的。统计特征主要是以抗干扰能力强为主要特点,以实现匹配与分类的算法简单,且容易实现的。不足之处在于细分能力较弱,区分相似字的能力差一些。
1.3 结构识别与统计识别相结合 上述方法各有优缺点,而随着研究的深入,这些方法逐渐得到融合。网格化特征就是结合的产物。特征的统计以网格为单位,即使个别点的统计有误差也不会造成大的影响,增强了特征的抗干扰性。这种方法正得到日益广泛的应用。
字符的结构特征直接反映了字符的特有属性,而用字符的统计特征进行字符识别则是利用了计算机软件善于处理数字的特点。虽然近几年流行的神经网络方法主要采用的是局部特征,但其分类机理也与传统的统计识别方法相类似,优点是灵活性强。
2 字符识别流程
字符识别技术在当今社会的许多领域都有着广泛的商业应用前景。常见应用有条码识别、车牌识别、盲人的辅助阅读设备和邮包自动分检等。本文以车牌识别为例说明字符识别的应用以及识别流程。车牌识别系统的工作流程如图1所示。
经过字符分割后,得到可以进行字符识别的图像。本文采用神经网络方法进行字符识别,识别的具体过程如图2所示。
3 基于改进型BP神经网络的字符识别算法
3.1 BP神经网络简介 神经网络最早的研究是20世纪40年代,由心理学家Mcculloch和数学家Pitts合作提出的,由此拉开了神经网络研究的序幕。人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。人工神经网络可以应用于字符识别、人脸识别等领域。
随着神经网络的威力逐渐显现以及付诸应用的现实性,大量的学者对此进行了深入研究,出现了多种神经网络,如径向基神经网络和Hopfield网络等。1986年科学家Rumelhart和McCelland提出了BP(Back Propagation)神经网络,是一种按误差逆传播算法训练的多层前馈网络,是目前在字符识别中应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络的结构如图3所示。从左至右分别是输入层、隐含层和输出层。
从图3可以看出,某一层的输出就是下一层的输入,即:am+1=fm+1(Wm+1am+bm+1),m=0,1,…M-1……
这里,M为神经网络的层数。第一层的神经元的输入为a0=p,最后一层神经元的输出是a=aM,即为整个神经网络的输出。BP神经网络虽然在字符识别领域有着重要的应用价值,但其存在如下问题:①进行字符识别时存在局部极小值问题;②算法通常需要迭代几千步甚至更多,收敛速度慢;③隐含层和隐含层节点的数量难以确定。要解决上述问题,就需对BP神经网络算法进行改进。
3.2 基于改进型BP神经网络的字符识别
3.2.1 图像预处理 在字符图像采集、输入的过程中由于受到多种噪声的干扰,会使图像质量下降,为字符识别工作带来困难,因此需要对初始图像进行必要的预处理。图像预处理的具体步骤如下:①选取合适的阈值进行图像二值化;②灰度变换增强对比度,改善视觉效果;③选取合适的方法去除噪声,常用的有中值滤波、均值滤波、高通滤波等方法;④图像分割,即将图像中的字符独立的分割出来。
3.2.2 字符特征值的提取 如果直接采用分割后的字符进行对比,那么需要对比的信息量很大,程序运行的时间也会大大增加。所以需要对分割后的字符进行特征提取,本文使用了类似九宫格的方法进行特征提取,即在字符图像的水平方向上将图像均匀分成三部分,在每一部分用一条水平方向的扫描线从左至右穿过字符,进行查找;垂直方向上原理相同,扫描线从上到下穿过字符,进行查找。取这六条线上的特征作为字符图像的特征,这样就得到了每个字符的六个特征值。
3.2.3 改进型BP神经网络 针对BP神经网络的局限性,为了避免落入局部极小值点,提高网络训练的精度和速度,对其算法进行了改进,常用的方法有:①优化初始权重。由于BP网络的误差曲面存在多个局部最小点和算法采用误差梯度下降的方法调整网络权重,因此导致了网络的训练结果极容易落入局部极小点。所以,网络的初始权重对网络的最终训练结果影响非常大,它是影响网络最终能否达到需求精度的重要因素之一。②调整自适应学习率。学习率η也称步长,在标准的算法中为常数。BP算法的收敛特性和收敛速度很大程度上取决于学习率,对于不同的问题,其取值范围也会不同。η取值过大可以加快学习速度,但会导致学习过程不收敛;η取值过小,则迭代次数明显增加,导致学习速度过慢。为了加速收敛的过程,可以自适应改变学习速率。③附加动量法。动量法是指在反向传播的基础上,在每个权值调整值上加上一项正比于前次权值变化的值,并根据反向传播法来产生新的权值变化。
本文为了简单起见,采用附加动量法只对数字和英文字母进行字符识别,利用梯度下降法,使权值沿函数的负梯度方向改变。提高了学习速度,增加了算法的可靠性。
带有附加动量项的权值调节公式为:
Wij(k+1)=Wij(k)+η[(1-α)D(k)+αD(k-1)]
其中,α是附加的动量项,取值范围为0
3.2.4 设计改进型BP神经网络进行字符识别 本系统采用了两个BP网络来进行数字和字母的识别。BP神经网络的建立主要是三个层的神经元数目的确定。①输入层节点数。此节点个数即为图像预处理后所输出的特征的维数。本系统输入层节点数为24×48。②隐含层节点数。确定隐含层节点数的基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐含层节点数。本系统的两个神经网络,可以根据输出层神经元的多少来确定其个数,即输出层神经元越多,其隐含层神经元个数也越多。③输出层节点数。用于识别数字的BP网络,由于只有10个数字,所以采用了8421码进行编码,输出层的神经元数目为4。而识别26个字母的BP网络,其输出层的神经元数目为5。待识别的字符图像和训练好网络后识别的结果分别如图4和图5所示。
4 结束语
在字符识别的过程中,每一步都会有不同程度的误差,本文神经网络经验证后识别率可达95.1%,平均识别时间为0.6s。影响识别成功率的主要因素是训练样本的数量和训练次数,要保证一定数量以上的训练样本和训练次数,以保证识别率。另外,神经网络的层数和各层神经元的个数,对神经网络算法的运行速度和识别率也有着直接的影响,其数量越多,识别率越高,但也制约着识别速度,因此,如何处理好两者关系很重要。
参考文献:
[1]关学忠,刘勇智.基于数字图像处理的车牌定位及字符分割方法[J].装备制造,2010(01).
[2]武桐.基于图像匹配的汉字识别系统研究与实现[D].上海:上海交通大学,2010.
关键词:神经网络;模式;分类
中图分类号:TP183文献标识码:A文章编号:1009-3044(2009)04-0922-02
The Research of the Classification of Model with Neural Network
GUO Xiao-yan
(Gansu Agriculture University, Information & Science Technology College, Lanzhou 730070, China)
Abstract: The problems of classification of model with neural network can be solved by the help oftutors information, and also be solved by the help of clustering without the tutors information.This article analyzes andcompares several neural network models being used for classification of model,reach a conclusionthat inparticular situation different models of neural network can bechoiced , and if nessesary aintegratedway can be used.
Key words: neural network; classification; model
传统的分类方法对于同类相聚,异类分离比较有优势,但客观世界中许多事物在样本空间中的区域分割曲面非常复杂,相近的样本可能属于不同的类,而远离的样本可能属于同一类1。模式是对某些感兴趣的客体的定量描述或结构描述,模式类是具有某些共同特征的模式的集合。模式分类可分为两种类型,分类和聚类,分类是在类别知识等导师信息的指导下,将待识别的输入模式分配到各自的模式类中去。聚类是无导师的分类方法,它是将相似的模式样本划归为一类,而将不相似的分离开,实现了模式样本类内相似性和类间分离性。通过聚类,可以发现原始样本的分布特性。
神经网络对外界的输入样本具有很强的识别能力,可以发现输入样本自身的联系和规律以及输入样本和期望输出之间的非线性规律,因此在模式分类方面具有传统分类方法无法比拟的优点。人工神经网络在模式分类方面提出了大量了网络模型,发现了许多学习算法。
1 无导师分类机制
对于无导师的模式分类只从输入样本入手,通过分析与比较,找到输入样本的特征和内在规律,从而将具有相似性的样本聚为一类。
1.1 SOM网
SOM 网属于自组织映射神经网络,SOM神经网络接收外界的输入模式时,会分为不同的对应区域,各区域对不同的输入模式会有不同的响应特征,利用这个特征可以对输入模式进行分类。
算法思想:
它的学习规则是“胜者为王”。找出和输入向量最为相似的竞争层神经元(即获胜神经元),在一个以该神经元为中心的邻域内对本区域内的所有神经元的权值进行不同程度的调整,调整的原则是由远及近,由兴奋变为抑制,权值调整的结果是使竞争层的特定神经元变得对输入层的某些样本敏感,从而达到分类的目的。
算法步骤:
1) 找出获胜神经元
对于每一个输入模式向量 X,竞争层的所有神经元对应的内星权向量Wj(j=1,2,…,m)均与X进行比较,将与X最为相似的神经元判为获胜神经元。其权值记为Wj*。相似性量度为X和W的欧氏距离或夹角余弦。
■
m是竞争层神经元个数。
d=||X-Wj*||=min||X-Wj*||(j=1,2,…,n)
d为输入向量X离获胜神经元的距离
2) 找出一个Wj*的一个邻域Sj,对于Sj内的所有权值进行调整。
3) 权值调整
Wj(t+1)=Wj(t)+α[X-Wj(t)]
α为学习率,随着t的增加,α的值在不断地减小。
权值的调整是使得获胜结点更加接近输入样本,从而使竞争层的每一个神经元变为一个聚类中心。当向网络输入一个模式时,竞争层中哪个神经元获胜使输出为1,当前输入就归为哪类。
通过聚类进行模式划分的方法还有模糊聚类,K-均值聚类,HCM,最近邻聚类(NN算法)等,这些算法的最主要优点就是不需要导师信号,这对于一些无法得到导师信号的模式分类情况来说是有优势的。
2 有导师分类机制
基于无导师的聚类算法只考虑输入样本,而没有考虑输入样本所对应的输出、这就使得这样的分类不是最优的。
2.1 BP神经网络
BP神经网络利用导师信号和输入样本来训练网络的权值,从而找到从输入样本到导师信号(期望输出)之间的非经性变幻规律来修整权值,经过测试样本和期望输出的多次训练来使成熟的网络稳定,当有新的输入时,就可根据此规律对它样本进行正确的分类。
BP神经网络的算法思想是:输入样本自输入层传入,由各隐层处理后,传向输出层,这属于正向传播;如果输出与期望输出(导师信号)不符,得到误差值,输出误差通过隐层向输入层逐反向传播,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号成为修正各单元权值的依据。
2.1.1 BP神经网络的描述1(图2)
1) 正向传播
对于有单个隐层单元的BP神经网络而言
隐层输出:
■
输出层:
■
l 为输出层神经元的个数m为隐层神经元的个数n为输入层神经元的个数
f(x)可采用单极性的Sigmoid函数:
■
2)反向修正权值
输出误差E定义如下:
■
其中d为导师信号(期望输出),o为实际输出
进一步展开至输入层,有:
■
权值修正:
■
η是学习率,可以控制学习的时间和快慢。
在BP神经网络中,利用导师信号和神经网络的输出得到总误差E,调整权值时,按误差梯度下降的原则进行。利用BP神经网络进行分类时,可以利用导师信息先规定类别信息,再利用输入样本和类别信息得出E,从而反向调整ω,ν值,如果网络的总误差小于一个特定的值,可认为网络训练结束,得到最终的ω,ν值。对于新的样本,此训练好的网络便可进行正确分类。
3 径向基函数神经网络
利用BP网络进行分类时,完全没有考虑输入样本的特征,只利用导师信息进行权值的修正,因此学习时间很长,分类的精度也不是非常高,错分的情况很多。通常,输入样本本身具有某种规律性,利用现有样本的自身规律加上导师信号的限制,可以大大提高分类的精度,同时可以缩短学习的时间。径向基函数网络就是基于这种思想。
用径向基函数作为隐单元的“基”,构成隐含层空间。隐含层对输入向量进行变换,将低维空间的模式变到高维空间中,使低维空间中的不可分问题在高维空间中变得可分。
算法思想:
1)找到分类中心向量,也称基向量,(一般用K-均值法,动态聚类法等),假定分类中心向量个数为 个,这也就决定隐层神经元的个数。
2)算出输入样本到各个分类中心向量的距离d,利用基函数f(x),自变量为d,得到隐层输出,只有离分类中心最近的向量得到较大的输出。
■
p是输入样本个数,j是聚类中心的个数,k是样本和聚类中心向量的维数。
■
3)最后通过隐层到输出层的线性变换得到最终的输出,则:
■
学习算法:
1)利用无导师机制选取分类中心向量;
2)利用有导师信号修正隐层到输出层的权值,权值的修正仍用类似BP神经网络的梯度下降算法。
径向基函数网络对于输入层向隐层的变换是非线性的,而隐层到输出层变换进线性的,在确定中心结点时,可采用无导师的聚类机制,当修正隐层到输出层的权值时可采用有导师机制,此两种方法结合即可发现输入样本中的内在规律,又可利用导师信号进行约束从而提高分类的精度和缩短学习的时间。
3 结论
利用神经网络进行分类时,如果可以得到导师信号,可采用径向基神经网络,或BP神经网络,径向基神经网络收缩速度快,不容易陷入局部极小值,在解决分类时和般优越于BP神经网络,如果无法得到导师信号,则可采用自组织神经网络SOM网络,通常SOM也可以用在径向基神经网络的选用中心向量问题上。
参考文献:
[1] 韩力群.人工神经网络理论、设计及应用[M].2版.北京:化学工业出版社,2007.
关键词:模拟电路;故障诊断;模糊数学;BP网络;模糊BP网络
0引言
电路故障是指在规定的条件下,电路工作时它的一个或几个性能参数不能保持在要求的上、下限之间,其结构、组件、元器件等出现性能减退、老化、破损、断裂、击穿等现象,丧失了在规定条件和环境下完成所需功能的能力。
长期以来,学界对模拟电路工作特点的研究已相当深入,但对于故障诊断方法的研究却困难较大,这是由于模拟电路本身的特性决定的:1)输入激励和输出响应都是连续量,模拟电路中的故障模型复杂,量化难度大;2)模拟电路信号量程宽,不管电压、电流的量程还是频率都可达十几个数量级,测量难度大;3)模拟电路中的元器件参数具有容差,导致电路的故障状态的模糊性,而无法准确定位;4)模拟电路中存在广泛的反馈回路和非线性问题,使计算的难度更加复杂。因此,学界提出了许多模型和方法来完成对某些符合特定条件的模拟电路的故障诊断。其中神经网络法的使用就相当普遍,在硬和软故障诊断中都有应用,因为神经网络的技术优势针对模拟电路故障诊断有较好的适用性,这主要体现在:1)神经网络的大规模并行处理特点,大大提高了诊断效率;2)自适应与自组织能力使神经网络在学习和训练中改变权重值,发展出新的功能。同时,模糊数学也与神经网络相结合,这是利用了模糊数学对待诊断模拟元器件的故障不确定性进行量化处理,能够有效克服模拟电路元器件因为容差、非线性及噪声造成的电路参数模糊性。
本文的研究目的就是分别利用单纯BP神经网络和模糊BP神经网络的方法建立模拟电路故障诊断模型,利用电路仿真收集电路不同工作状态下的关键点电压,代入诊断模型并得到诊断结果。根据各网络的结果分析比较各诊断模型的优缺点,找出模糊数学对改进模拟电路故障诊断模型的具体表现。
1模糊神经网络的故障诊断模型
1.1典型模糊神经网络诊断模型介绍
图1显示的是一个典型的模糊神经网络模型,该模型由原始知识获取(Fundamental Knowledge Acquire,FKA)、特征参数处理(Characteristic Parameter Produce,CDP)、知识提取(Knowledge Extracted,KE)、经验知识库(Experience Knowledge Base,EKB)、学习样本集(Learning Sample Set,LSS)和模糊神经网络(Fuzzy Neural Networks,FNN)共6个模块共同组成,其工作流程是:
图1 典型模糊神经网络诊断模型
1)原始知识获取模块通过对电路工作原理进行分析,模拟或仿真各类故障发生时输入和输出参数,从而获取原始知识(X,Y),将其传入知识提取模块中供系统学习,所得经验集存入经验知识库中;
2)将原始知识和已经存放在经验知识库中的经验知识(初始库可为空)一起输入学习样本组织模块中,进行学习样本的构建,合成训练样本集为(X1,Y1);
3)将(X1,Y1)输入到模糊神经网络模块,学习训练,并在达到指定精度后停止;
4)将从模拟电路中获得的实测参数Xc输入至特征参数提取模块中,完成数据分析和处理,输出特征参数数据Xc';
5)将特征参数数据输入到学习收敛后的模糊神经网络中,进行诊断推理,得出诊断结果Yc';
6)将得到的实测数据集(Xc',Yc')输入学习样本组织模块,动态增强模糊神经网络的自适应能力;
7)将得到的实测数据集(Xc',Yc')输入知识提取模块,进行分析和处理,如能提取出经验知识,则归入经验知识库中[1]。
1.2模糊神经网络结构
模糊神经网络的结构应该包括4层,如图2所示。
模糊层的作用是将输入量进行模糊化。每一个模糊层节点对应一个该论域中的模糊子集和隶属函数。该层接收精确数值输入,经过模糊化计算得出对应的隶属度并输出。
图2 模糊神经网络结构图
输入层、隐含层和输出层共同构成一个完整的神经网络。输入层不具有运算功能,它只是将所感知的输入值精确传递到神经网络中;隐含层的作用相当于特征检测器,提取输入模式中包含的有效特征信息,使输出层所处理的模式是线性可分的,该层节点是模糊神经元,与输入层间的连接权值是随机设定的固定值;输出层节点也是模糊神经元,与隐含层之间采用全连接方式,其连接权值是可调的,作用是输出用模糊量表示的结果[2]。
1.3输入层、输出层和隐含层节点数确定
输入层的个数代表了电路故障诊断的关键测试点的个数N1,输出点为电路所具有的潜在故障模式种类数N3。
根据输入层和输出层的个数,隐含层节点数N2的确定有以下4种经验公式[3]:
(1)
(为0~10之间的常数)(2)
(为0~10之间的常数)(3)
(4)
2模糊数学和神经网络的算法介绍
2.1模糊数学和隶属度函数
模糊数学的作用是对测试点测得的电压信号进行特征提取——模糊化处理。因为在模拟电路测试中,参数值会随着故障原因的不同和故障阶段不同而发生变化,所以在进行数据处理时常用方法是使用精确事实规则。即用正态分布函数作为隶属度函数表示“大约为a”的模糊概念,此外还有如三角分布和梯形分布等[4]。在使用中,正态分布使用较多,其中的a是该测试点的理想状态工作点,b为该测试点在各种可能状态下的工作电压均方差。
2.2BP神经网络与算法
图3BP神经网络模型结构图
反向传播网络(Back-Propagation Network,简称BP网络),是一种有隐含层的多层前馈网络。每一层均有一个或多个神经元节点,信息从输入层依次经各隐含层向输出层传递,层间的连接关系强弱由连接权值W来表征。BP算法是一种监督的学习,基本原理是梯度最速下降法,中心思想是调整权值使网络总误差最小。通过连续不断地在相对于误差函数斜率下降的方向上计算网络权值和偏差值的变化而逐渐逼近目标的。每一次权值和偏差的变化都与网络的误差的影响成正比,并以反向传播的方式传递到每一层。BP网络模型结构如图3所示。
以BP神经网络模型结构图为例进行BP算法推导,其输入为P,输入神经元有r个,隐含层内有s1个神经元,激活函数为F1,输入层内有s2个神经元,对应的激活函数为F2,输出为A,目标矢量为T。
1)隐含层输出:(i=1,2,…,s1)(5)
2)输出层输出: (k=1,2,…,s2) (6)
3)定义误差函数:(7)
4)输入层的权值变化量:(8)
其中:
同理可得:(9)
5)隐含层权值变化有: (10)
其中:
同理: (11)
BP网络经常使用的是S型的对数、正切激活函数或线性函数[5]。
3电路故障诊断算法验证
图4 共集-共射电路的直流通路图
例:如图4所示的直流通路图,电阻的标称值如图中所注。利用Multism软件在直流状态下进行多次Monte Carlo分析仿真该电路[6],并考虑电阻的容差影响,取40个样本作为模糊神经网络的训练样本,另取5个样本为测试样本。设电阻R1~R5的容差值为-5%~5%。测试点选为A、B、C、D和E五点,所测电压值为VA、VB、VC、VD和VE。
表1 部分电路实验样本原始数据
表2 测试样本原始数据
表1列举了40组电路实验样本原始数据的11组,包含了该电路在11种工作状态下的五个关键点电压值,所以N1=5,N2=11,隐含层的节点数可以依据公式2.3确定为12个,其中a为5。
表2则列举了5组测试样本的原始数据。
步骤一:数据模糊化
根据用正态分布函数作为隶属度函数表示“大约为a”模糊概念的思路,可以分别得到各测试点上电压隶属度函数的参数值。
a1=5.57、a2=4.97、a3=4.9、a4=5.7和a5=5.69以及b1=4.3729、b2=4.4817、b3=3.9091、b4=4.2870和b5=3.7944。
由各测试点的隶属度函数可得到网络的训练样本见表3。
表3 神经网络部分输入、输出训练样本
步骤二:将训练样本输入神经网络进行训练
将全部40个原始值和模糊化值的输入样本和对应的输出样本分别输入BP神经网络中进行训练。
步骤三:将测试样本输入神经网络进行检测
将全部5个原始值和模糊化值的输入样本和对应的输出样本分别输入已经训练好的BP神经网络中,输出诊断结果见表4。
表4 输出诊断结果
表4中的数据是经过故障诊断后得到的结果,在此只是各随机选用了一组数据加以比较说明。通过对故障诊断的试验观察和结果的比较可以作出以下分析。
1)模糊化数据能够有效减少神经网络的收敛次数。如在BP网络诊断中,使用模糊化数据的迭代次数由886减少到263次,收敛速度明显加快;
2)模糊化数据能够有效提高神经网络训练的效果。通过表4中数据的对比可以发现对于相同的神经网络,经过模糊化数据的训练,其准确性更高。这主要表现在电路所对应的状态结果普遍高于未经模糊化数据训练的网络得出的结果;同时,其他状态对应的机率更低,皆低于0.1,且更多值为0,说明数据模糊化能使神经网络的诊断结果更集中,正确率更高,有效性更加明显。
4结论
通过分别采用BP网络和模糊BP网络建立了电路故障诊断模型,对电路相同工作状态参数的诊断结果进行比较,得出了模糊数学对提高电路故障诊断模型精度和有效性效果明显的结论。模糊数学和神经网路理论的组合有效地提高了模拟电路故障诊断模型的收敛速度,提高了故障诊断的工作效率,还提高了诊断的准确性,有效性得到了充分显示。
参考文献
[1] 吕律,魏蛟龙.基于模糊神经网络的板级电路故障诊断研究[J].计算机与数字工程,2003(3):21-23.
[2] 李国勇.智能预测控制及其MATLAB实现[M].北京:电子工业出版社,2010.
[3] MATLAB中文论坛.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.
[4] 朱大奇.电子设备故障诊断原理与实践[M].北京:电子工业出版社,2004.
关键词:数字PID;超调控制
中图分类号:TP273 文献标识码:A 文章编号:1674-7712 (2013) 24-0000-01
PID控制因其具有结构简单、稳定性好、可靠性高等优点,而被广泛应用在工业控制领域。但是,现代的工业控制过程中,许多被控对象机理复杂,具有严重的非线性、时变不确定性和纯滞后性,采用传统PID控制不能达到理想的控制效果,这种情况下,智能PID控制应运而生。
一、传统PID控制
(一)控制原理
PID控制规律是比例(P)、积分(I)和微分(D)控制,根据系统的产生误差,利用比例(P)、积分(I)和微分(D)算法,计算出控制调节量进行控制的。
(二)PID控制的特点
1.比例(P)控制
比例(P)控制是最基本、也是最简单的控制方式,控制器的输出信号成比例反映输入信号。只要系统有误差,控制器就会起控制作用,减小系统的稳态误差。比例系数KP决定比例控制的强弱,增大KP能提高系统开环增益,提高系统的控制精度,但是KP过大,又会降低系统的相对稳定性,甚至导致闭环系统不稳定。
2.积分(I)控制
积分(I)控制的输出与输入误差的积分成正比关系。对于有差系统,要消除稳态误差,就必须在控制器中加入积分项,积分项随着时间的增加而加大,使系统的稳态误差进一步减小,直到为0,消除稳态误差。通常,积分(I)控制的主要作用使系统没有稳态误差,但是积分作用会产生相位滞后,因此如果积分作用太强,会使被控系统的稳定性变差。
3.微分(D)控制
微分(D)控制的输出与输入误差的微分成正比关系。微分(D)控制能够反映误差的变化率,只要系统有误差,而且误差随时间变化时,控制器对误差进行微分,提前抑制误差,避免被控系统产生过大的超调量。但是对于无变化或是变化缓慢的控制对象,微分(D)控制不起作用。
由于比例(P)控制、积分(I)控制和微分(D)控制都有优缺点,因此,在工业控制系统中,多采用组合控制―PI、PD或是PID控制。控制器根据被控对象的特性,调整PID的三个参数,使系统达到满意的控制效果。
(三)控制算法介绍
计算机PID控制系统中使用数字PID控制器。目前经常使用的有位置式PID控制算法、增量式PID控制算法。(1)位置式PID控制算法。该算法的优点是原理简单、使用方便;不足是对e(k)的累加增大了计算机的存储量和运算的工作量;u(k)的直接输出易造成执行机构的大幅度变化。(2)增量式PID控制算法。该算法的优点是:只计算增量,计算精度对控制量的影响较小;不对偏差累加,不易引起积分饱和;得出的是控制量的增量,误动作影响小;易于实现手动到自动的无冲击切换。缺点是有静态误差、积分截断效应大、溢出影响大。
二、智能PID控制
传统PID控制算法简单,调整参数方便,且具有一定的控制精度,所以在生产实际中,有95%以上的工业控制使用PID控制。但是,随着工业控制系统的越来越复杂,传统PID控制器的弊端也越来越明显。比如,传统PID控制只有用在时不变系统时,才能达到满意的效果;对于非线性或是不确定性系统,则可能致使系统性能变差甚至造成系统的不稳定。因此,工程技术人员在使用传统PID控制的同时,也对其进行了多种改进,其中,智能PID控制器就是众多控制系统中较为典型的新一代控制器。
智能PID控制是以传统PID控制为核心,应用智能控制技术研发的新型控制器。具备两者的优点,既具有传统PID控制器结构简单、可靠性高和整定方便的特点,又具备智能控制系统自学习、自适应、自组织的功能,能够在线调增PID控制器的三个参数,以适应过程参数变化。
智能PID控制根据智能技术的类别主要分为三类:专家PID控制、模糊PID控制、神经网络PID控制。下面主要介绍一下几种智能PID控制器的特点。
(一)专家PID控制
专家PID控制的实质是通过人工智能技术组织和利用被控对象和传统PID控制规律的专家知识,求得被控系统尽可能的实用化和优化。专家PID控制采用传统PID控制形式,根据专家知识和经验,在线调整PID三个参数,使响应曲线达到某种最佳响应曲线。专家PID控制具有良好的控制特性,能应付控制过程中出现的不确定性。但是,专家PID控制,进行实时自适应控制的依据是专家知识或是大量经验。因此,获取专家知识和总结实验经验尤为重要,是设计控制器的重点也是难点。
(二)模糊PID控制
模糊PID控制器优点是不需要被控对象的数学模型,而是依据现有的控制系统知识,运用模糊控制方法建立控制决策表,由该表决定控制量的大小。模糊PID控制既具备模糊控制灵活和适应性强的特点,又具备传统PID控制器结构简单、精度高的优点。模糊PID控制系统的控制效果在于如何建立模糊控制器规则和确保模糊关系的真实性,但是建立模糊规则通常带有主观性,这就一定会影响到系统的动态特性,因此,一些学者在模糊控制器设计中增加自学习的功能,使系统能够自我完善。
(三)神经网络PID控制
基于神经网络的PID控制与模糊PID控制和专家PID控制不同,是直接利用神经网络作为控制器。神经网络作为在线估计器,控制信号由常规控制器发出。首先,神经网络通过学习算法进行离线学习,然后介入控制系统,间接地调整PID参数,给出最佳控制规律下的PID控制器的参数,同时,继续自学习,根据受控对象不断变化调整神经网络的权系数,获得最理想的控制效果。
不论是何种智能控制PID控制方式都是基于传统PID控制基本原理,将智能控制技术与传统PID控制结合,直接或间接地动态整定PID参数,使控制达到更优的效果。
三、结束语
智能控制理论研究的深入,必将带动智能PID控制器的研发,从而完善PID控制性能,提高控制效果。
参考文献:
[1]石辛民,郝整清.模糊控制及其Matlab仿真[M].北京:清华大学出版社,2008.
关键词:发动机;智能故障诊断;人工神经网络
中图分类号:U472.4 文献标识码:A 文章编号:1006-8937(2013)06-0006-02
发动机是汽车的动力源,是一个复杂的系统,其与汽车的一些基本技术性能都有着直接或间接的联系。由于工作条件不稳定,部分零件运行环境恶劣,汽车发动机故障在汽车全部故障占据着一个较大的比重,而发动机一旦发生故障不仅会影响自身性能,还会对汽车其他结构性能带来影响,造成较大的损失,严重时还可能造成人身伤亡,因此对发动机故障的及时诊断和排除十分重要。智能故障诊断技术是伴随着安全生产要求的不断提高和计算机技术、智能技术等现代先进技术的发展而产生发展起来的,其被应用于机械设备的故障诊断中,极大地提高了故障诊断水平,对保证机械安全可靠性有着十分重要的意义。随着汽车制造技术的发展,发动机的结构也越来越复杂,其故障的准确判断也更为困难,在此形势下,利用智能故障诊断技术开发汽车发动机智能故障诊断系统对减少汽车安全事故发生率,降低损失有着十分重要的现实意义。
1 智能故障诊断
故障诊断是指在实际工作中针对系统、设备运行过程中的异常情况,利用各种检查和检测的方法,对系统和设备进行检测,查看系统或设备是否存在故障,并进一步确定出故障所在部位的过程,智能故障诊断是借助智能技术,根据系统设备运行中的技术参数和物理现象等对系统、设备的运行情况进行判断,并根据故障的特征对故障信息作出评估,进而判断出故障发生的原因和部位的一种故障诊断方法。
智能故障诊断主要有故障检测与诊断和故障容错控制两个部分,其系统主要包括人机接口、知识库和数据库、机器学习、诊断信息获取、诊断推理以及解释机构等几主要的功能模块,其一般结构如图1所示。
在实际工作的过程中,通过建立系统设备运行的技术参数和物理现象等知识库和数据库,利用机器学习模型对其进行样本训练和学习,在获取系统设备运行的信息后,诊断模块根据训练学习的相关知识对信息作出诊断,并将诊断的过程和结果通过解释机构模块反映给用户,从而帮助用户了解诊断对象的具体运及故障情况,及时处理故障,保障系统和设备正常运行。
2 汽车发动机智能故障诊断
2.1 汽车发动机智能故障诊断方法
汽车发动机结构的复杂化使得发动机故障诊断更困难,开发智能故障诊断系统也成为其发展的必然要求。汽车发动机智能故障诊断技术主要有基于人工智能的故障诊断和基于数学模型的故障诊断两种,具体划分起来有基于数学模型、基于参数估计、基于信号处理、基于知识、基于实例、基于模糊理论和基于神经网络的故障诊断等多种方法。
在智能化故障诊断系统中,其智能化的水平与机器学习能力的关系十分密切,通常机器学习的能力越强,其智能故障诊断的能力也就越高。因此选择合理的数学模型对系统进行训练十分重要。
2.2 基于神经网络的汽车发动机智能故障诊断系统
人工神经网络是一种应用类似大脑神经突触联结的结构进行信息处理的数学模型,是由大量的节点(神经元)和之间相互联接构成的一种运算模型,其是基于现代神经科学的研究成果建立起的非线性、非局限性、非常定性和非凸性的自适应信息处理系统,能通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。具有部分神经元损坏时不影响系统整体性能、输入信息模糊、残缺或变形时能通过联系恢复完整记忆,对不完整的信息进行正确的识别,给出次优的逼近解,是机器学习较为常用的一种数学模型。人工神经网络又有着MLP(Multi-layer Perceptron,多层感知器)模型、Hopfield模型、BP(Back-propagation Network)模型等多种不同的模型,其中以BP网络模型应用最为广泛。利用人工神经网络模型建立的汽车发动机故障诊断系统结构如图2所示。
BP网络是一种按照误差逆传播算法训练的多层前馈网络,其结构包括输入层、隐层和输出层三层,其不需要事前揭示输入—输出模式映射关系的数学模型即能学习和存贮大量的映射关系,使用的最速下降法能通过反向传播来调整网络权值和阀值,使网络误差平方和最小,但并不能保证误差平面的全局最小值,另外还存在着网络收敛速度较慢,训练时间长,学习和记忆不稳定等问题,而由于遗传算法具有全局搜索的特性,切搜索不依赖梯度信息,也不需要求解函数可微,能够较好地补充BP网络的不足,因此可以利用其对系统进行优化。
汽车发动机的故障诊断主要是依据发动机的振动信号进行的,在实际应用的过程中,可以信号的特值和速度作为神经网络的输入单元,输出单元为发动机的工况代码,通过调入学习特征向量和教师向量,利用遗传算法对网络结构和权值进行优化,利用函数对网络进行训练计算出网络输出后,完成输入层到输出层单元的映射,进而完成智能诊断,其智能诊断的流程如图3所示。
3 结 语
发动机是汽车的核心部件,其运行的安全可靠与否直接影响着汽车的正常安全使用,因此,利用智能诊断诊断技术建立起汽车发动机智能故障诊断系统根据发动机的振动信号,分析、诊断发动机故障,有着十分重要的现实意义。汽车发动机智能故障诊断有多种方法,各种方法都有着各自的优缺点,在实际应用过程中,应当综合利用各种智能技术,对其进行不断的优化,提高其智能诊断能力,充分发挥出智能诊断技术的优点,以保障汽车的正常可靠使用。
参考文献:
[1] 徐斌.基于智能诊断技术的发动机故障排查研究进展[J].重庆电子工程职业学院学报,2012,(1).
[2] 廖中文,杨旭志.汽车发动机故障诊断系统的虚拟样机硬件研发[J].汽车维修与保养,2012,(4).
[3] 刘福伟.神经网络技术及其在发动机故障诊断中的应用[J].工程机械与维修,2006,(6).
关键词:沉降预测;曲线拟合;灰色预测;神经网路.
1 引言
高速公路软土地基路段的建设过程中,软土地基的复杂性,为了控制施工进度,指导后期的施工组织与安排,如何利用沉降观测资料较为准确地推算后期沉降(包括最终沉降)显得至关重要。本文研究了曲线拟合法、灰色系统法、人工神经网络法、遗传算法等多种沉降预测方法的原理及应用,为准确预测高速公路软土路基的沉降提供一定的参考。
2沉降预测方法
此法采用与沉降曲线相似的曲线对沉降过程进行拟合,再外延推求最终沉降量。包括双曲线法、星野法、泊松曲线法及Asaoka法等。
2.1 双曲线法
双曲线法[1]假定沉降量S与时间t按“沉降平均速度呈双曲线递减”的规律变化,其表达式为:
(1)
由上式看出,α和β分别为(t- t0) /(st-s0)―(t-t0)关系图中的截距和斜率,可用图解法求出。将得到的α、β和S0、t0代入式(1),则可求得任意时刻t的预估沉降量S(t)。最终沉降量为:
(2)
基于太沙基一维固结理论,U与T之间应该是指数关系,而双曲线法简化了此关系,且可用图解法简单易行,适合工程人员用。但此法只能推算地基最终沉降量,难以反映地基固结参数,已有的工程实例表明预测结果比实测值偏大。
2.2对数抛物线拟合法
文献[2]在路基完建后的沉降-对数坐标系上看出沉降大致由两部分组成:第一部分可用抛物线拟合;第二(即次固结)部分可由直线拟合。实践证明,除有机质含量高的土体外,沉降量主要集中在第一部分,表达式为:
(3)
式中A、B、C可用优化法求得。
该法仅需掌握短期观测资料,便可求得满足要求的工后沉降量及铺设路面时的沉降速率。
2.3泊松曲线法
泊松曲线[4]法,亦称逻辑斯蒂(Logistic)曲线。此曲线开始增长缓慢,中间段增长快,尾端增长趋势越来越小,这符合饱和粘土的沉降-时间发展关系。表达式为:
(4)
式中:yt―t时刻对应的预测值(长度单位);
t―时间;
a―待定参数且为正,无量纲;
b―待定参数且为正,单位为时间的倒数;
k―待定参数且为正,单位与yt相同。
利用时间序列求出上3个参数即可建立泊松方程,从而可对今后的yt进行预测。
该法能很好地反映全过程的沉降量与时间的“S”形关系,且能通过观测过程中的点(包括施工过程和运营过程)不断的进行预测和调整预测。
2.4 Asaoka法
Asaoka法亦称图解法[3],以一维竖向固结理论为基础,简化预测方程为:
(5)
式中:S―固结沉降量;
a、b―取决固结系数和土层边界的常数。固定边界条件下上式的解为:
(6)
此法可计算固结系数及最终沉降,当固结度达到60%后,用短期内观测资料就可得到可靠的沉降推算值。其是过分依赖于时间间隔的划分。
除了上述常用模型之外,还有指数曲线法(三点法)[1] 、沉降速率法[3] 与星野法[3]等,限于篇幅,笔者在此不再赘述。
2.5 灰色模型
沉降过程难以作精确描述,通过观测得到的较少信息,运用灰色系统理论,把路基沉降过程看成一个灰色系统,建立所需微分方程的动态模型,以此来分析路堤沉降的发展变化[1]。以GM(1,1)为例,前一个“1”表示阶数,后一个“1”表示变量个数,在路基沉降为时间。已知等距时间序列数据:
(7)
式中, ,将式(7)作一次累加(即1-AGO)后,得到序列:
(8)
式中,对S(1)建立白化形式的微分方程:
(9)
方程的解为:
(10)
式中 a,b为待定参数,可通过最小二乘法得到:
(11)
GM(1,1)模型不太适合于对数据序列的长期预测,因此还有改进方法:短期预测宜采用连续型直接数据GM(1,1)模型;沉降中长期预测,宜采用等维新息GM(1,1)模型。此法需要原始数据少,计算简单,无需因素数据,但其仅限于用时间序列预测,不能反映预测对象在各个发展阶段的特征或趋势。
2.6神经网络法
神经网络算法常用BP网络,即误差反向传播算法的学习过程。BP神经网络模型是所建模型中精度较高的一种,由于其自身良好的学习功能,可通过前馈和反馈的动态连接,对大量的测量样本进行自我训练,使得模型具有一定的人工智能水平。BP算法训练网络权值,其本质上是一种梯度下降的最小化方法,但有学者研究证明基于梯度下降的BP算法依赖于初始权值的选择,收敛速度慢且容易陷入局部最优[5]。
实例中:杭甬高速公路,用前250 d 的沉降数据训练网络,再用网络来预测后期沉降;金山油库,用前69 d 的沉降数据训练网络,再用网络来预测后期沉降,可以发现:用前期数据训练网络,再用训练好的网络来预测后期沉降,预测值与实测值吻合较好,可以达到预期效果[6]。
3.结论