前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络基本概念主题范文,仅供参考,欢迎阅读并收藏。
关键词:网格;资源调度;人工神经网络;BP算法
中图分类号:TP183
Grid resources schedule model based on the BP algorithm
ZHOU Fei-fei,HU Yan-xia
Ministry of Education’s major laboratory of Lanzhou Jiaotong University, Lanzhou,730070
ZhengZhou Urban and Rural Planning Bureau ,Zhengzhou,45000
Abstract: The grid is the main direction of high-performance. The major factor affects the grid functional and the performance is grid resource management and scheduling. Because of the complexity of the grid, its resource management compared with traditional distributed networks becomes more complex. The efficient grid resources management algorithms are hot and difficult of grid study. The neural network has intelligence and can get the best results in complex circumstances. this paper uses BP algorithm to solve the problem of grid resource scheduling. And introduced the concept of grid, back propagation algorithm, and proposed grid scheduling of resources result based on the BP algorithm.
Keywords:grid; resource scheduling;artificial neural network;Back propagation algorithm;
0 引言
网格作为新一代的互联网,是今后高性能计算的主要方向,而有效的资源调度直接影响到网格的功能和性能,因此,对网格资源调度问题的研究具有重要的理论意义和巨大的实践价值。人工神经网络是一种模拟动物神经网络行为特征,进行分布式并行信息处理的算法数学模型,善于在复杂环境下,快速获得满足多种约束条件问题的最优化答案,把神经网络的思想引入到网格的资源调度当中,将二者有效结合,能够更好的解决网格的资源调度问题。
1 网格的基本概念
网格又被称为“下一代互联网”,用于集成或共享在地理上分布的各种资源(包括计算机系统、存储系统、通信系统、文件、数据库、程序等),使之成为一个逻辑整体,实现资源在网络中的全面共享。
目前,网格技术已经在科学计算领域得到了广泛的应用,很好的解决了分布式超级计算、高吞吐率计算、数据密集型计算等问题。可以预见,随着共享的资源越来越丰富,网格的应用领域将得到更大的拓展。
2 网格中的资源调度
网格中的资源指所有能够通过网格远程使用的实体,包括:计算机软件(比如操作系统、数据库管理系统、应用软件、数据等),计算机硬件(比如CPU、内存、硬盘、光盘感器、磁带等),设备和仪器(比如通信介质、天文望远镜、显微镜、传感器、PDA、仪器仪表等)等物理资源以及人类资源(人的知识与能力)。【1】
由于网格是一个开放、动态的互联网并行环境,用户可以从网格的任何地方向网格平台提交应用,而且由于网格所固有的分布性、动态性、异构性以及自治性等特征,使得网格资源、可能随时发生改变。因此,网格资源管理系统是网格的核心组成部分,也是网格的重要研究方向。
2.1 网格资源调度策略
传统的分布式系统中资源管理的主要任务是将多个用户提交的程序调度到一个计算集群中以最大化系统的利用率。即将一个复杂的程序中的多个子程序调度到并行的计算机中以提高计算效率,减少运行时间。
而在网格中,由于网格系统的分布性、异构性和动态性,网格资源管理必须为用户提供可靠的、一致的以及廉价的资源,而不用考虑资源访问点的物理位置。[2]
我们使用有层的层次模型实现资源调度算法。此模型类似于网络的五层沙漏模型。在逻辑上分为三层:用户层、资源管理层及网格资源层。
用户层是网格资源的使用者。各种应用均在这一层实现,该层的需求即网格系统提供的服务,是网格所要达到的目标。在本层中,用户或应用系统通过面向服务的视图向下层中的各种发送用户请求,描述自愿选择、任务进程创建和任务控制等。
资源管理层是本模型的核心层。由各种组成,是网格资源管理的执行者。能够发现、收集和存储不同领域的资源信息;接收用户请求,并按分配策略将所需要的资源分配给用户。
网格资源层是网格系统中的硬件基础,包括各种资源,它是网格资源管理的对象。其基本功能就是控制区域内的资源,向上提供访问这些资源的接口。
由以上分析可以看出,网格资源调度的实质,就是将多个相互独立的任务由各种分配到可用资源上,使得资源得到充分利用并且任务的完成时间最小。
调度算法的目标是将所有的独立的应用任务通过调度到可获得的计算资源中去,从可利用的资源中选取最佳的资源,并尽量减少由于网格的动态性而对网格整体性能的影响。不好的资源调度算法,将会增加任务的执行时间并降低整个网格系统的吞吐量。因此,一个好的源调度算法,需要具有高效性和一定的智能性,使网格用户能够获得所需要的资源,并且确保网格用户不会过量使用资源。
由于神经网络能够模拟人脑的思维模式,具有很好的自适应性和学习能力,能够实现难以用数字计算和技术实现的最优信号处理算法。因此,很适合网格资源调度算法。
3 BP神经网络原理
神经网络是一种模拟动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络能根据系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
3.1 神经网络的概念
国际著名的神经网络专家Hecht-Nielson给神经网络的定义是:“神经网络是一个以有向图为拓扑结构的动态系统,它通过对连续或断续式的输入作为状态响应而进行信息处理”。【3】
神经网络系统是由大量的,同时也是很简单的处理单元(称为神经元),通过广泛地互相连接而形成的复杂网络系统。虽然每个神经元的结构和功能十分简单,但由大量神经元构成的网络系统的行为却是丰富多彩和十分复杂的。
神经网络适合于解决实际问题,它不仅可以广泛应用于模式识别、信号处理、知识工程、专家系统、优化组合、机器人控制等工程领域,也可以广泛应用于医学、商业、金融和文学领域。随着神经网络理论本身以及相关理论、相关技术的不断发展,神经网络的应用定将更加深入。[4]
3.2 BP神经网络的概念
BP (Back Propagation)神经网络是1986年由Rumelhart和McCelland为首的科学家小组提出,全称为基于误差反向传播算法的人工神经网络。BP神经网络是目前研究最多、应用最广泛的神经网络模型。
BP神经网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它使用自适应学习算法,通过反向传播不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络模型拓扑结构包括输入层(input)、隐含层(hide layer)和输出层(output layer)。
通过图可看出,层与层之间的神经元采用全互连的连接方式,通过相应的权系数相互联系,隐含层内的神经元之间没有连接。因此BP网络可以看成是从输入到输出的一种高度非线性映射,映射中保持拓扑不变性,如果隐含层中神经元数目足够多,则BP网络就能模拟任何有理函数。由于BP网络可在多个连续的输入和一个或多个连续的输出之间建立非线性映射这一特性,它常被用于智能预测。从而,我们使用BP神经网络模拟网格资源调度过程。
3.2.1 BP神经网络的工作过程
BP神经网络由信息的正向传播和误差的反向传播两个过程组成:
信息的正向传播过程:
输入层各神经元负责接收来自外界的输入信息,并传递给隐含层各神经元;隐含层负责信息变换,根据信息变化能力的需求,传递到输出层。各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程;输出层向外界输出信息处理结果。
误差的反向传播过程:
当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐含、输入层逐层反传。
周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者达到预先设定的学习次数为止。[5]
4 使用BP神经网络的网格资源调度模型
由于BP神经网络算法响应时间较快,适合大规模分布式的网格资源调度。为了能够最大效率的调用网格资源,我们结合BP神经网络算法思想,提出了基于BP网络的网格资源调度模型。
模型流程如下:
(1)将用户提交的任务请求(包含任务的任务量、通信量、任务提交时间、时间限度等参数)加入到网格中的任务队列排队。任务队列可以根据不同用户的不同需求(用户等级、任务时间相应要求等)对进入队列的任务进行排序。
(2) 调度系统中的计时器,每隔一定时间就从任务队列中取出待处理的任务,并从监视器中获得当前系统资源分配列表。
(3) 根据待处理任务及系统资源,使用BP算法产生一个最优化的任务分配表。
(4) 执行任务分配表中的任务。如果任务顺利完成,则将任务占有的资源释,如果任务失败,则释放该任务所占有的系统资源,并将失败的任务插入到任务队列中,以待下次调度。
(5) 当不能从任务队列中获得任务时,表明所有任务都已经完成。
5总结
在网格环境中,资源调度是一项非常复杂且极具挑战性的工作。计算资源调度的好坏,效率的高低直接关系到网格系统的性能。相对别的网格计算资源调度算法与模型,本文提出使用BP算法的分层资源调度模型。
该模型由调度主程序负责全局资源调度,监控程序监控每个资源任务的完成情况,这种方法在能保证任务完成的前提下,灵活地对网格资源进行配置,充分发挥网格中各节点计算机的计算能力。
参考文献:
1崔飞.基于市场的网格资源调度算法研究[J].中国科技论文在线
2都至辉,陈渝,刘鹏. 网格计算.[M]. 清华大学出版社, 2002
3党建武,王阳萍,赵庶旭. 神经网络理论.[M]. 兰州大学出版社,2005,9
关键词:网络安全态势预测; CMAES优化算法; RBF神经网络; 时间序列预测
DOI:1015938/jjhust201702026
中图分类号: TP3930
文献标志码: A
文章编号: 1007-2683(2017)02-0140-05
Abstract:A method for network security situation prediction is proposed, where the covariance matrix adaptation evolution strategy algorithm (CMAES) is used to optimize the parameters of the radial basis function neural network forecasting model (RBF), which makes the forecasting model have superior ability, and can quickly find out the rules of the complex time series The simulations results show that the proposed method can accurately predict the network security situation, and has better prediction accuracy than traditional prediction methods
Keywords:network security situation prediction; covariance matrix adaptation evolution strategy algorithm; Radial basis function neural network; time series prediction
0引言
随着网络技术的广泛使用和快速发展,网络系统开始呈现出越来越复杂的趋势。所有复杂的系统都要面临严峻的安全问题,网络平台也不例外,任何一个小的漏洞都有可能被黑客利用,从而导致整个网络的崩溃。传统的安全技术属于被动防御技术,例如入侵检测系统是在攻击来临时进行识别并作出反应。相比之下,管理人员更需要一种能够宏观描述并预测网络整体状况的技术,以此能够做到未雨绸缪主动防御。针对这个问题,Bass T 在1999年提出了网络安全态势的概念[1-2],他指出网络安全态势是一组能够反映网络系统宏观状态的数值,通过它可以让管理人员快速的了解网络运行的基本情况。获取并处理网络安全态势的技术称为网络安全态势感知[1,3-7],它包括3个层次[8]:①网络底层态势要素的提取(态势提取);②网络安全态势的评估(态势理解);③网络安全态势的预测。态势要素的提取主要依靠神经网络和支持向量机等分类技术将威胁网络安全的数据分类,然后在由网络安全态势评估技术按照不同攻击种类的重要程度加权平均得出网络安全态势值[9]。当收集到一段时间的历史网络安全态势值后,就可以建立预测模型预测未来的网络安全态势。可以看出,网络安全态势预测技术是网络安全态势感知中最为重要的环节,本文要解决的就是网络安全态势预测问题。
目前,已经有很多预测模型用于网络安全态势预测,例如灰色预测模型[10]、GABP预测模型[11]、RBF预测模型[12]、HMM预测模型[13]、EvHMM预测模型[14]以及HBRB预测模型[15-16]等。灰色预测模型是利用灰色理论对含不确定信息的系统进行预测的模型,但是它只能反映系统发展的大致趋势,并不能精确预测未来的数值。HMM、EvHMM以及HBRB等预测模型将安全态势视为隐含行为,优化过程复杂且具有s束条件,不适用于实时性要求高的网络系统。
神经网络模型是网络安全态势预测中最常用的方法,但是由于在训练模型的过程中需要优化大量的参数,且传统的优化算法往往会在优化过程中陷入到局部最优点,所以神经网络预测模型并不能精确的预测样本数量小且规律性不强的网络安全态势。
针对上述问题,本文提出利用CMAES算法对RBF神经网络的参数进行优化,从而提高网络安全态势预测的精度。CMAES算法全称是协方差矩阵自适应进化策略[17-18],是目前最受关注的优化算法之一,它在高维非线性优化问题上表现良好,能够利用较少的个体快速收敛到全局最优点。RBF全称是径向基神经网络,它具备良好的泛化能力和逼近性能,并且可以处理复杂的非线性系统。RBF解决了BP的局部最小值问题,并已成功应用到众多的工程领域[19-24]。将两者结合到一起,可以克服神经网络模型的缺点,增加全局优化能力,提高预测精度。
本文的组织结构为:在第一节中,介绍了RBF及CMAES的相关概念及基本原理。在第二节中提出了CMARBF预测模型。在第三节中,利用所提出的方法对实际网络平台的安全态势进行预测,并将结果和其他传统方法进行了比较。在第四节中,对CMARBF预测模型进行总结。
1基本概念
11RBF神经网络的基本原理
RBF神经网络模型在结构上与BP相同,都属于前馈型式神经网络。区别在于RBF的隐层只有一个且使用径向基函数作为隐层神经元的激活函数,RBF的隐层可以将输入变换到高维空间中,从而解决低维空间线性不可分的问题。RBF神经网络模型具备良好的全局最优和逼近性能,并且结构不复杂,收敛速度快,可以作为系统辨识的、非线性函数逼近等领域的有力工具。典型的RBF神经网络模型结构如图1所示。
利用CMARBF预测网络安全态势的基本步骤如下所示:
Step1: 利用公式(9)确定模型的历史样本;
Step2: 确定RBF神经网络的初始参数Ω0;
Step3: 确定初始迭代次数t=0和最大迭代次数tmax;
Step4: 确定CMAES算法的初始⑹;
Step5: 建立形如公式(11)优化目标函数;
Step6: 进入循环:while t
Step 61: 利用公式(3)以Ωt作为期望meant生成新的种群;
Step 62: 利用公式(4)得到新的种群期望meant+1;
Step 63: 利用公式(5)(6)(8)更新种群的协方差矩阵,得到Mt+1;
Step 64: 利用公式(9)更新步长,得到st+1;
Step 65: 计算新种群的目标函数值,选出最优个体(参数)Ωbest;
Step 66: 重复执行step 61,直到t=tmax跳出循环;
Step7: 以Ωbest作为RBF神经网络的参数,历史样本做为训练数据,对RBF进行训练;
Step8: 用训练RBF模型对安全态势预测。
3仿真实验
31背景描述
我们以真实的网络平台为背景(如图3所示),收集了三个月共92天的攻击数据,并将它们利用层次化评估方法求出92天的网络安全态势值。
图3描绘的是某高校真实网络环境,全网可分为内网和DMZ区两大部分。其中内网包括图书馆、宿舍、行政楼和教学楼;DMZ区包括各类服务器及数据库。攻击数据的收集在防火墙及核心交换机上完成。
当作为网络安全要素的攻击数据收集完毕后,可以由专家确定各安全要素的权重,在利用常用的层次化评估方法获得全网的网络安全态势值,如图4所示:
从图4可以看出,该网络平台的网络安全态势在整体上呈现一定的规律,每个月的中期攻击强度增大,月底逐渐减小,但是在局部,态势值有一定的随机性。为了利用前述的CMARBF模型去预测网络安全态势值,我们将上述数据通过公示(9)生成了89组样本,前60组作为训练样本,后29组作为预测样本。模型的初始参数见表1:
32比较实验
为验证所提模型有效性,选取了没有优化RBF模型和GARBF模型与CMARBF模型比较,比较结果如图5和表2所示:
从图5和表2可以看出,CMARBF的预测精度要高于其他方法。
4结论
所提出的CMARBF预测模型是将新的进化算法CMAES引入到RBF模型中,利用CMAES高效的寻优能力去解决高维模型中参数优化问题。两者的结合使得神经网络的结构和参数更加合理,具有更好的预测能力。本文将所提方法应用于网络安全态势预测领域,得到了很好的效果。比较实验结果表明,CMARBF模型的预测精度高于其他传统方法。在今后的工作中,我们会继续探索更适应与网络安全态势预测的新方法。
参 考 文 献:
[1]BASS T Intrusion Detection System and Multisensor Data Fusion: Creating Cyberspace Situation Awareness[J]. Communications of The ACM, 2000, 43(4): 99-105
[2]王庚, 张景辉, 吴娜 网络安全态势预测方法的应用研究[J]. 计算机仿真, 2012, 29(2): 98-101
[3]胡冠宇, 乔佩利 基于云群的高维差分进化算法及其在网络安全态势预测上的应用[J]. 吉林大学学报(工学版), 2016, 46(2): 568-577
[4]鲁颖欣, 王健, 齐宏卓 模糊判断在网络安全风险评估中的应用研究[J]. 哈尔滨理工大学学报, 2014, 19(1):36-39
[5]高青波, 胡冠宇, 徐泽群 并行计算平台的网络安全态势感知系统[J]. 科技创新与应用, 2015(15): 4-5
[6]HU G Y, QIAO P Cloud Belief Rule Base Model for Network Security Situation Prediction[J]. IEEE Communications Letters, 2016, 20(5): 914-917
[7]HU G Y, ZHOU Z J, ZHANG B C, et al A Method for Predicting the Network Security Situation Based on Hidden BRB Model and Revised CMAES Algorithm[J]. Applied Soft Computing, 2016, 48:404-418
[8]王慧强, 赖积保, 胡明明等 网络安全态势感知关键技术研究[J]. 武汉大学学报-信息科学版, 2008, 33(10): 995-998
[9]陈秀真, 郑庆华, 管晓宏等 层次化网络安全威胁态势量化评估方法[J]. 软件学报, 2006, 17(4): 885-897
[10]马杰, 任望, 薛东军等 灰色灾变模型在计算机网络安全态势预测中的研究[C]. 第三届信息安全漏洞分析与风险评估大会,2010
[11]胡明明, 王慧强, 赖积保 一种基于GABPNN的网络安全态势预测方法[m]. 北京:中国科技论文在线, 2007
[12]任伟,蒋兴浩,孙锬锋 基于RBF神经网络的网络安全态势预测方法[J]. 计算机工程与应用 2006 31: 136-139
[13]MUTHUMANI N, THANAMANI A S Optimizing Hidden Markov Model for Failure PredictionComparison of Gaine’s Optimization and Minimum Message Length Estimator[J]. Int J Comput Sci Eng, 2011, 3(2): 892-898
[14]RAMASSO E Contribution of Belief Functions to HMM with an Application to Fault Diagnosis[J]. In: IEEE International Workshop on Machine Learning and Signal Processing, Grenoble, France, 2009: 2-4
[15]HU G Y, QIAO P L Cloud Belief Rule Base Model for Network Security Situation Prediction [J]. IEEE Communications Letters, 2016, 20(5): 914-917
[16]HU G Y, ZHOU Z J, ZHANG B C, et al A Method for Predicting the Network Security Situation Based on Hidden BRB Model and Revised CMAES Algorithm[J]. Applied Soft Computing, 2016, 48: 404-418
[17]HANSEN N The CMA Evolution Strategy: a Comparing Review Towards a New Evolutionary Computation[J]. Advances on estimation of distribution algorithms, 2006, 75-102
[18]HANSEN N, KERN S Evaluating the CMA Evolution Strategy on Multimodal Test Functions[J]. Parallel Problem Solving from Nature PPSN VIII, 2004, 282-291
[19]同光, 桂卫华 基于粒子群优化神经网络观测器感应电机定子电阻辨识[J]. 电机与控制学报, 2015, 19(2):89-95
[20]王建敏, 董小萌, 吴云洁 高超声速飞行器 RBF 神经网络滑模变结构控制[J]. 电机与控制学报, 2016, 20(5):103-110
[21]张旭隆, 曹言敬, 邵晓根 基于边界约束RBF网络的SRM磁链特性在线建模[J]. 电机与控制学报, 2015, 19(2):83-88
[22]宋清昆, 李源松 RBF神经网络锅炉燃烧系统建模[J]. 哈尔滨理工大学学报, 2016, 21(1):89-92
【关键词】系统辨识 神经网络 遗传算法 模糊逻辑
一、引言
系统辨识属于现代控制工程范畴,是以研究建立一个系统的数学模型的技术方法。分析法和实验法是主要的数学模型建立方法。系统辨是一种实验建立数学模型的方法,可实时建模,满足不同模型建立的需求。L.A.Zadeh于1962年提出系统辨识的定义:在输入、输出的基础上,确定一个在一定条件下与所观测系统相等的系统。系统辨识技术主要由系统的结构辨识和系统的参数估计两部分组成。
系统的数学表达式的形式称之为系统的结构。对SISO系统而言,系统的阶次为系统的机构;对多变量线性系统而言,模型结构就是系统的能控性结构指数或能观性结构指数 。但实际应用中难以找到与现有系统等价的模型。因此,系统辨识从实际的角度看是选择一个最好的能拟合实际系统输入输出特性的模型。
本文介绍一些新型的系统辨识方法,体现新型方法的优势,最后得出结论。
二、基于神经网络的非线性系统辨识方法
近年来,人工神经网络得到了广泛的应用,尤其是在模式识别、机器学习、智能计算和数据挖掘方面。人工神经网络具有较好的非线性计算能力、并行计算处理能力和自适应能力,这为非线性系统的辨识提供了新的解决方法。
结合神经网络的系统辨识法被用于各领域的研究,并不断提出改进型方法,取得了较好的进展。如刘通等人使用了径向基函数神经网络对伺服电机进行了辨识,使用了梯度下降方法进行训练,确定系统参数;张济民等人对摆式列车倾摆控制系统进行了改进,使用BP神经对倾摆控制系统进行辨识;崔文峰等人将最小二乘法与传统人工神经网络结合,改善了移动机器人CyCab的运行系统。
与传统的系统识别方法相比较,人工神经网络具有较多优点:
(一)使用神经元之间相连接的权值使得系统的输出可以逐渐进行调整;
(二)可以辨识非线性系统,这种辨识方法是通过神经网络自身来进行,无需编程;
(三)无需对系统建行数模,因为神经网络的参数已都反映在内部;
(四)神经网络的独立性强,它采用的学习算法是它收敛速度的唯一影响因素;
(五)神经网络也适用于在线计算机控制。
三、基于遗传算法的非线性系统辨识方法
遗传算法是一种新型的求解最优算法,它的思想来源于资源遗传学,结合了自然选择的优点与数学概率性算法,具有诸多优点,如全范围的搜索域、求取的解为全局最优和接受任意性质的函数,因此在各领域都有广泛的应用。
雷旭升等人[5]使用了遗传算法对小型无人飞行器的动力学模型进行高精度的构建,并对构建的系统进行了仿真,验证了系统的有效性;赵静等人[6]对人体能量代谢分析仪气体流量系统进行了模型建立,使用遗传算法解决了传统系统辨识方法辨识时产生的较大时延和误差较大的问题。
四、基于模糊理论的非线性系统辨识方法
近年来,模糊逻辑理论在非线性系统辨识领域中得到广泛的应用,用模糊集合理论,从系统输入和输出量测值来辨识系统的模糊模型,是系统辨识的有效途径。模型结构辨识和模型参数预计是模糊建模的主要内容。常用的模型是T-S模型,T-S模型具有计算速度快、结构模型易观、逼近力强等特点。
赵宏伟等人[7]提出了一种基于系统辨识的自适应网络模型,建立T-S推理模型系统,并应用于磨矿控制领域;李超顺等人[8]针对水轮机调节系统的复杂性、非线性和难以用明确数学模型表达的特点,建立了该系统的T-S模型,实现了模糊模型结构的自适应优化;叶剑斌[9]等人针对了现有算法中容易出现的维数灾难,同时将模糊语言理论和支持向量机的方法结合,提出了一种组合方法,提高了函数逼近的能力。此外,还有一些综合上述三种方法的组合型辨识的方法。
五、结语
近年来,系统辨识的方法得到了不断的发展,系统辨识已经成为了现代控制工程领域中十分重要的技术与研究方向。随着人工神经网络、模糊逻辑理论、遗传算法、人工智能理论的成熟发展,越来越多的新型非线性系统辨识方法被不断提出,且在实际工程应用中得到了有效性验证与较好的效果。但对于现实工程中结构复杂的各种系统难以找到一个统一的系统辨识方法,因此研究需要更多的新型非线性系统辨识方法去解决实际工程应用中出现的问题。对传统的系统辨识方法进行不断完善将是系统辨识未来的发展方向。
参考文献:
[1]王乐一,赵文. 系统辨识:新的模式、挑战及机遇[J].自动化学报,2013,39(9):933-942.
[2]刘通.基于RBF神经网络的某交流伺服系统辨识研究[J].机械制造与自动化,2013,(2):113-115.
[3]张济民,王开文,池茂儒.基于BP神经网络摆式列车倾摆控制系统的辨识[J] .机床与液压,2003,(5) :33-35.
[4]崔文峰,史仪凯.移动机器人的键合图建模与参数辨识[J].机械科学与技术,2012,31(7) :1062-1065.
[5]雷旭升,白浪.基于自适应遗传算法的小型无人旋翼机系统辨识方法[J].机器人,2011,33(5):528-532.
[6] 赵静,郭巧,王萍.基于遗传算法的人体能量代谢分析系统辨识[J] .控制工程,2004,11(1):17-19.
[7] 赵宏伟,齐一名,臧雪柏等.基于系统辨识与T―S模糊神经网络的磨矿分级控制[J].吉林大学学报:工学版,2011,41(1) :171-175.
[关键词]问题驱动 研究型教学 PBL 构建主义
[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2014)04-0001-03
一、引言
尽管教育部及广大有识之士大力呼吁并积极倡导应用性、研究性教学与学习模式,但是以往的中国高等教育,实质上也是以“满堂灌”的教学模式为主,其主要原因在于,不论是教师还是学生,人们习惯于“满堂灌”,认为研究型或者是应用性教学模式必定会加重老师和学生的负担。到目前为止,人们还不清楚怎样的教学和学习形式属于研究应用型教学,怎样操作才会在不加重学生学习负担的条件下,达到好的研究应用型教学模式。因此,研究应用型教学模式是当今教学改革中的一个热点研究问题,其核心问题是如何引导和激发出学生的学习和探索热情。研究应用型教学模式的中心问题是采用什么方式和方法来激发学生学习和探索的欲望和热情,使学生能创造性地运用所学过的知识,研究应用型教学模式是始于问题、基于发现、凸显创造性特色的一种教学模式。张奠宙教授和张荫南教授于2004年提出了新概念教学的理念,并以数学教学为例,深入浅出地介绍了这种教育和具体的教学方式,提出了“问题驱动”式教学方法。
自动控制原理是自动化相关专业的一门十分重要的专业基础课,其特点是理论性强、数学要求高、工程背景强,直接关系到自动化相关专业学生能否顺利并高效学习其他专业课。采用问题驱动式的研究应用型教学方法,培养学生良好的学习习惯,传授如何对研究对象和目标进行缜密严谨的思考,如何提出具有实际意义或理论研究意义的课题(或问题),分析和解决之,采用问题驱动式的研究应用型教学方法,将对深入学习其它后续课程大有裨益。
人工神经网络课程具有理论性和工程应用背景强的特点,这门课程所讲授的内容仍在不断更新和发展,因此本课程内容繁多,总体上来说系统性差,关键的是其课时往往十分有限。为了达到以点带面的、示范引导的作用,我们采用了问题驱动式的应用研究型教学方法,较好地将该门课程的体系框架和基本内容介绍给了学生。
二、问题驱动和研究应用教学模式的理论基础
问题驱动式教学模式强调以问题解决为主线,以学生为中心,以问题为驱动力,将培养学习者问题意识、批判性的思维技巧,以及解决问题的实践能力设定为主要目标的教育教学方法。需要说明的是,问题驱动中的问题并非就是普通的习题,而是那些能够改变学生思维模式,帮助学生重建知识结构,并愿意对问题进行深入思考的具有启发性、引导性和探究性的问题。
皮亚杰的建构主义为研究型教学模式提供了理论支持,他认为“儿童对新知识的理解和接受,及其智力的发展,最终都要依赖于儿童这个主体与知识载体环境的互动中。建构主义强调教师在教学中应该主要起到指引促进作用,教学过程的主体是学生自己,学生借助学习资料(自找或老师确定),在老师指导和帮助下,通过建构主义的方式,即 “已知―未知―新的已知”的循环渐进的模式来学习新内容、获取新知识。研究型教学就是在教学过程中体现研究的本质特点,以“已知―未知―新的已知”循环渐进的方式去发现问题、提出问题、研究问题和解决问题。
三、研究问题的设计
科学研究的第一步,也是最关键的一步是提出恰当而准确的科学问题,这通常是学生们感到无从下手、十分困难的事情。一般来说,提出科学问题有两种常用方法:首先,经过缜密观察与研究,识别出已有理论或技术的局限性,并据此提出新的研究问题和研究目标;其次,经过考察钻研新的研究对象的特点提出新问题。
那么怎样设计出操作性强、便于课堂教学的研究与应用性问题?这是应用研究型教学模式中的关键所在。这类问题主要包含两大特点:首先,所设计出的问题能够自然引导课堂教学内容的深入推进。具有这一特点的问题可能具有一定的研究深度和广度,也可能研究内容和深度是循序渐进的、逻辑性强的,而非跳跃性的。其二,所设计的“驱动问题”应尽可能具有研究引导作用,即能够引导学习者通过多角度思考或实验验证、理论推导,就能够更全面深入地认识所研究的事物的本质。这类问题通常具有跳跃和挑战性,需要采用演算、论证、分析和实验等多种手段,有时甚至需要通过多门课程的学习和把握才能够得到有效解决。一般将具有第一个特点的问题称为“问题引导”的问题,将符合第二个特征的问题称为“问题驱动研究”的问题。显然严格区分“问题引导”的问题和“问题驱动”的问题是比较困难的,因为两者之间并无明显界限。
我们在实际操作中通常将那些从学习者了解的知识出发,在某个教学段落,或者某个作业、实验中可以得到解决的,归结到“问题引导”类中。这类问题往往有如下某个或几个特征:
1.学习者已经掌握的某个知识点的反问题;
2.学习者已经掌握的某个知识点简单的扩展问题;
3.有理想工程背景和简单数学模型应用性问题;
4.学习者已经掌握的某项知识在另一种不同情况或者背景下具体应用;
5.通常是为单目标和单参数研究设计的一个或一系列问题等。
设计驱动型研究题目是一个更复杂的过程,这是由于如果问题设计的太深太难,学生难于在短时间内自我解答或得到解答,有可能导致学生失去学习兴趣和信心的不良后果。但是,问题设计得太简单则会失去驱动作用。在设计“问题驱动”的问题时,我们主要注意了以下几点:
1.设计成综合系列问题,该综合系列问题包含了一系列的简单问题;
2.设计成综合研究问题,该综合研究问题需要学生通过作业、实验、理论推导和计算比较获得结果;
3.针对某个实际工程背景,经过必要的简化和抽象,设计成具有明确的工程实际应用背景的研究型问题。
四、设计示例
(一) 自动控制理论课程的问题设计
自动控制原理是自动化相关专业的专业基础课,这门课程中引入问题驱动的教学方法目的在于:在大学生们正式接触各类专业课之前,从专业基础的角度培养和发掘学生发现问题、提出问题和解决问题的能力。但是应该注意到的是,在这个阶段学生的知识面,特别是专业知识面还相当空缺,因此,在课程初期和中期以“问题引导”为主,在课程后期逐步过渡到“问题驱动”。
例如在学生掌握了一般情况下的劳斯判据以后,针对劳斯表计算过程中需要将上一行第一个元素作为分母的情况,首先提出:“如果这个元素为零怎么办?”进一步提出:“如果某一行元素全为零又怎么办?”这两个问题是比较容易解决并容易理解,能够促使学生们积极思考,加强对劳斯判据的全面把握。又如,在清楚交代幅值条件、相角条件以及180°根轨迹绘制规则的基础上,先提出一个简单的扩展性问题――有没有其他角度条件的根轨迹绘制规则?然后再给出一系列带有启发性和引导性的询问:“是什么角度?这个角度代表了什么含义?这个角度代表的含义与180°根轨迹代表的含义有什么不同?这种含义的不同在数学上的表现是怎样的?从这些不同以及180°根轨迹绘制规则中可以总结出这种根轨迹的绘制规则吗?”以这样的方式讲授0°轨迹的绘制规则只需要半节课,而且学生们接受起来很快,还能够加深对根轨迹幅值条件和相角条件概念的理解。
在学习后期,我们会提出诸如“研究并总结出PID参数对控制系统稳定性、稳态误差和动态特性的影响”,“如何利用Bode图对控制系统性能进行分析与设计?”等这样具有一定研究空间的问题。
(二)人工神经网络课程的问题设计
人工神经网络课是面向本科高年级或研究生的课程。问题的设计目的不但要推进课程的讲解和学习,更重要的是培养和推动学生的研究能力和热情。
在课堂上讲述了了生物神经元的基本构造和功能,重点讨论了著名的阈值加权M_P模型,详细介绍了单层离散感知器人工神经网络的模型结构、计算、学习算法、表达能力、实际应用等内容。由于单层离散感知器人工神经网络的结构和算法都比较易于理解,而它所具有的功能实际意义和十分明确,因此容易使学生产生学习兴趣。在这样的条件下,我们采用不断加深所需要解决问题难度的方法,循序渐进地提出了一些能够推动学生深入思考,并且理论联系实际的问题。
例如,在网络模型方面,针对“单层离散感知器网络只能解决线性可分问题”这样一个局限性,我们自然给出“应该怎么做才能够实现非线性分类?”这样到目前为止仍需要不断深入研究和解答的研究问题。对于这个问题,首先启发学生观察和思考多层离散感知器神经网络具有的结构和模型特点,然后考虑改变感知器模型形式来实现之。由这个问题出发,可以很自然地引出BP网络和RBF网络等许多常见人工神经网络。进一步BP或RBF网络可以自然解决这个为题,我们又接着提出:“为什么这个网络可以解决?可否试图用数学方法来解答?”这样的理论性研究问题。
在研究生学习阶段,为达到事半功倍的教学效果,教学中可以注意三个方面:首先,通过设计“问题引导”问题来讲解人工神经网络课程当中的基本概念和基本方法;其次,针对人工神经网络课程当中的理论和算法方面的学习,可以分别设计出“问题引导”和“问题驱动”两类问题;最后,为较快地将学生引入实际应用,可以设计一些具有“问题驱动”特点的实际课题供学生研究,可能的话,还可以提供研究范例。如果是本科生课程,笔者认为应侧重于第一和第三个方面。
例如,人工网络算法方面,在单层离散感知器学习算法基础上,提出研究题目“线性自适应人工神经网络学习算法的研究和开发”。在应用研究方面,目前适合教学的可借鉴的资料比较多,例如,“基于BP网络算法的多层前馈网络在大气环境质量评价中的应用”,可以提出下面的问题:“这个研究问题属于分类还是属于拟合,怎样具体实现?还可以采用什么神经网络解决此问题?如何实现?请说明不同的人工神经网络在解决分类问题时的不同特点。”原有的资料上提供的不过是一个例子,通过研究问题的引导和推动,可以使学生通过一个简单的例子,更全面地理解人工神经网络的特点和功能,并大大加强学生的仿真和对比研究能力。
需要说明的是,为实现因材施教的教学理念,这类“问题驱动研究”的问题设计是可以超越教学大纲的,也可以是有针对性地专为少部分特别有能力的同学设计的。
五、结束语
我国目前的教育方式仍存在着较严重的“满堂灌”的现象,限制了学生们的想象力和创造性, “标准化”考试更加剧了这一弊端。学生们不愿提问题、提不出问题,能够提问题的学生越来越少,提出好问题的学生更是凤毛麟角,学生们大多习惯于索要 “标准答案”。 问题驱动的研究应用型教学方法能够有效地活跃课堂气氛,提高学生的学习兴趣,培养学生质疑、提问和自我研究的良好习惯。
需要补充的一点是,只有通过全方位教学环节的相互配合,问题驱动的研究应用型教学才能够有效实行,这其中包括有针对性地设计引导问题和驱动问题、科学地设计课后练习与实验、巧妙地设计和安排课程讲解顺序与进度、有时间和质量保证的质疑与答疑等许多教学环节必须充分配合。也需要相关课程的大力协助和配合。总之,问题驱动的研究应用型教学方式,对任课教师、实验室老师和学生本人都提出了非常高的要求。
[ 参 考 文 献 ]
[1] 张奠宙,张荫南.新概念:用问题驱动的数学教学[J].高等数学研究,2004,5(7).
[2] 张建伟.基于问题解决的知识建构[J].教育研究,2000,(10).
[3] 籍建东.研究型教学模式与传统教学模式的比较[J].职教论坛,2011,5(18).
地铁工程中,深基坑支护设计是重要组成内容,对工程造价、风险控制、工期控制有至关重要的影响。为控制工程造价,保证周边环境安全,地铁设计单位不断采用先进的设计手段对基坑方案进行设计。而近年来飞速发展的数值方法使人们只要向计算机输入反映地层性质的参数、工程的几何参数以及荷载边界条件等,即可得到十分详尽的力学状态描述,用于进行各种方案的基坑支护设计。
但与此同时,输入数据质量的问题开始浮现。再先进的数值分析方法,还是得依赖设计者的输入。要使各种先进的数值分析方法很好地应用于设计与施工中,应保证分析中所用的地质参数与力学模型等信息与实际情况接近。而实际情况时由于勘察取样、试验时受各种客观、主观因素影响,得出来的地质参数往往与实际情况有所差异。这一矛盾需要引入反分析方法解决。而地铁工程具系统性的特点,又注定反分析的方法与普通基坑工程有所不同。
中图分类号:TV551文献标识码: A
1、反分析法的概念与设计原则
从系统角度看,基坑工程是一个复杂的巨系统,人们对其进行的各种施工活动均可看成系统输入,而人们量测到的位移、变形破坏则为系统对输入的相应,即系统的输出。而反分析则是根据一个灰色系统的输出确定输入的过程,也可以看成由系统的输出对输入的映射。
正分析
系统输入 反分析系统输出
基坑工程反分析问题,分为位移反分析、应变反分析、地下水渗流场的反分析等类型。而其中位移反分析因介质的力学模型差异可进一步分为弹性问题位移反分析、弹塑性位移反分析和粘弹性位移反分析等。弹性问题位移反分析由于理论简明和方法可行,与工程实际结合紧密,使用价值最大,在实际工程中应用最多,有丰富的经验可以借鉴。
采用位移反分析法进行基坑工程设计,应遵循以下原则:
1)位移反分析是一个由多环节组成的系统,缺一不可。位移反分析过程实际上是一个至少由7个环节组成的方法系统:关于工程设计目的研究及反分析参数的确定;地质选点;反分析方法的选择和唯一性的论证;开挖方法的研究;有效的联测系统的建立和实测数据的分析;由实测位移反演目的参数;结果综合评价。因此,为使反分析应用成功,应全面考虑位移反分析每一个环节,针对具体情况,精心设计和精心实施反演的每一个工作步骤。
2)位移量测系统是位移反分析的物质基础。作为位移反分析依据的位移信息,只有借助一个合适的位移量测系统才可获得。所以位移反分析需要高质量的位移量测系统以取得高质量的位移信息,只有高质量的位移信息才能保证位移反分析成功。
3)尽可能压缩位移反分析对象的个数。并非无论多少个参数都可以通过位移反分析来确定,若待分析的参数过多,有可能导致结果的非唯一性问题;其次,及时对于具有某一数量的待分析参数可以反分析得到唯一的结果,其反演精度也往往因反分析对象较多而下降。因此,应合理利用其它手段减少位移反分析的待分析参数个数。
2、反分析法在地铁系统性工程中的应用方案
2.1地铁基坑工程的系统性
地铁基坑工程一般指明挖地下车站、区间等基坑,深度从地下三层站20米左右到地下一层站10米左右,围护结构形式一般以支护桩、连续墙为主。由于需满足线路敷设要求,车站基坑沿线路分布,城区范围内距离1公里左右。一定区域内,车站基坑地质条件、支护方案相仿,设计原则一致,这是地铁地基坑工程独有的系统性。而由于各种客观条件限制,地铁基坑通常难以同期施工,工期先后特性明显,而某些地铁工程甚至选择若干工点为试验段先期施工,
根据这一特点,本文提出,在地铁线路范围内,根据场地条件划分若干地质单元体。地质单元体是指建筑场地按工程地质条件划分的单元,在同一单元体内,各部位工程地质条件相近。针对各单元体先期施工基坑反演得出的工程地质参数,指导后期基坑设计施工。
2.2反分析对象的选择
一般基坑设计中需要取确定的参数有弹性模量E,泊松比υ,粘聚力c,摩擦角φ,比例系数m值等。为压缩反分析对象的个数,提高分析效率与精度,选取对支护设计影响较大的c,φ,m值为反分析对象。但由于m值实际受围护结构刚度,基坑变形等因素影响,不同基坑不可通用,因此选取c,φ值为主要反分析研究对象。
2.3地质选点
采用反分析的地段地层条件应具代表性,地层结构尽量均匀。为减少反分析工作量,可仅对对基坑支护设计有主要影响的地层进行分析。而对于离散性较大的地层如杂填土层,参考价值较小,不建议将其作为反分析研究对象。
2.4正分析方法
基坑支护系统正分析过程即基坑支护设计过程。根据地质详细勘察报告提出的地层参数进行数值分析。普通基坑分析可选取弹性地基梁模型,通过理正、启明星等常用基坑设计软件进行计算,精度满足一般设计要求。而对于边界条件复杂的基坑,应采用有限元分析软件如midas、flac3d、ansys等进行分析。
2.5正交试验方法
正交试验设计是正交表来安排与分析多因素实验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。
假设数值计算试验中因素数为a个,各因素的水平数为b,若区全面试验共需bn次试验,可以采用正交试验法进行不同因素不同水平的数值计算试验,试验次数可根据正交试验比表Lp(bn),只进行P次试验,例如2水平3因素,全面试验8次,而正交试验只需4次。以弹塑性分析为例,因素数5个即土体重度γ、弹性模量E,泊松比υ,粘聚力c,摩擦角φ,各因素水平可根据具体情况确定,若各因素水平数均为4,则正交试验数可通过查表L16(45),需进行16次正交试验即可反映全面实验情况。
2.6数据反演
基坑工程反分析法主要有土体性态参数确定的二维或三维优化反分析法、一维弹性地基梁水土压力及基床系数的优化反分析法以及基坑工程系统反演分析等。前两种方法一般利用量测数据,建立目标函数,通过优化方法求解;后一种方法将土体与围护结构视为一系统,并将系统的宏观表观量如变形随时间演化的过程视为动态过程或随机过程,并应用相应的系统学方面的理论与方法来研究基坑系统演化发展的规律。这些理论和方法包括灰色系统理论,时间序列分析,概率测度分析,统计分析,神经元网络理论和混沌理论等。
基坑工程计算中多用三层BP神经网络模型。用神经网络建模不需要知道变形与所求参数之间的关系,通过样本学习和记忆,就可以得出输入(岩土体力学参数)与输出(位移)之间的非线性特征关系。神经网络反分析映射能力,而数值模拟有很好的定量分析能力,两者结合起来是位移智能化分析的一条有效途径。
3、BP神经网络的基本理论
3.1BP神经网络基本概念
BP(Back-Propagation)神经网络即误差逆传播神经网络,是目前应用最广的神经网络,它是按照误差逆传播学习算法进行训练的多阶层神经网络。
BP神经网络是一种具有二层或二层以上的阶层型神经网络。上下层之间各神经元实现全连接,即下层的每一个单元与上层的每个单元都实现权连接,而每层的各个神经元之间无连接。网络按照有教师示教的方式进行学习,当一个学习样本提供给网络后,神经元的激活值,从输入层经中间层向输出层传播,在输出层的各神经单元获得网络的输入相应。在这之后u,按减少希望输出与实际输出误差的方向,从输出层经各中间层逐层修正各连接权,最后回到输入层,因此得名“误差逆转播算法”。随着这种误差逆传播修正的不断进行,网络对输入模式响应的正确率也不断上升。
由于误差逆传播网络及其算法增加了中间隐层并偶有相应的学习规则可循,使其具有识别非线性模式的能力。
BP神经网络算法的基本思想是:根据样本的希望输出和实际输出之间的平方误差,利用梯度下降法,从输出层开始,逐层修正权系数。BP算法的学习过程由正向传播和反向传播两个过程组成。在正向传播过程中,输入信息从输入层经隐含层传向输出层,如果输出层得不到预期输出,则进行反向传播,将误差信号沿原来的连接通路返回,哦你通过国修改各层节点的权重,使误差最小。网络不仅有输入层节点、输出层节点,而且还有隐含层节点。隐含层可以是一层,也可以是多层。
三层BP神经网络基本构图
3.2BP网络计算步骤
根据BP网络学习算法,BP网络学习步骤可归纳如下:
(1)根据问题的特征和环境,确定神经网络的结构,包括神经网络的层数、各层中的神经元个数等。
(2)网络的初始化:输入学习率α、η;给定最大学习误差ε(收敛精确度);给输入层至隐含层连接权矩阵、隐含层至输出层的权矩阵赋初值;
(3)为网络提供一组学习样本;
(4)正向传播,计算实际输出。计算实际输出与期望输出的误差EP,利用它修正Wkj。Wkj(t+1)=Wkj(t)+ ηδk(t+1)Oj(t+1),t为迭代次数;
(5)误差回传,修正前一层的Wji,直至输入层;
(6)输入下一个学习样本,回至(4),直至输完为止;
(7)计算系统误差E,若E小于给定值,结束并转向(8);否则回至(3),反复迭代直至收敛;
(8)预测新样本,并输出预测结果。
4、基坑工程量测技术
现场实际施工量测数据是数值反演的重要依据,现场量测是反分析过程中的重要环节。基坑开挖过程中的现场量测信息是设计、施工的一个重要方面,也是保证工程施工安全的一个必不可少的手段。通过合理准确的施工监控量测,不仅可以进一步优化设计方案,知道施工,而且可以实时监控基坑工程的稳定性状况。基坑工程现场监测工作主要包括以下三方面:
与周围地层有关的量测:主要内容包括基坑周围地表沉降、水平位移等。
与周围环境有关的量测:主要内容包括周围建筑物、道路的沉降和水平位移,周围建筑物的倾斜和裂缝等。
垂直位移观测方法主要是精密水准测量。不宜采用三角高程。在一个测区内,应设3个以上基准点,其基准点宜设置在距基坑开挖深度3倍的距离以外的稳地方。当多个深大基坑同时开挖施工时,基准点要组成网型。用秩亏平差方法进行平差,统计求得稳定点,计算观测点的垂直位移计平垫精度;平面位移观测一般采用经纬仪觇牌、或是带有读书尺寸的觇牌,基座都应有光学对中器,以提高对中精度,一般有小角度法和水准线等光学仪器测量、测斜仪测量及并联式钻孔位移计量测等。
5、结语
5.1、利用反分析法能有效地通过实测位移反映土体实际的工作性状弹性参数。通过显示大量的工程经验表明,这种方法是可靠,可行的。而反分析的结果与实验室得出的参数相比,更为可靠,更具实际意义。
5.2、地铁工程基坑系统性的特点适合反分析法的应用。通过充分发挥试验段工程的“试验”作用,为后续施工工点提供设计、施工依据,大大降低基坑工程风险,有助于进一步控制工程造价,缩短施工工期。而反分析法得出的分析结果除为设计提出依据外,还可以有效预测基坑变形,这对市区周边环境复杂,施工风险较大的基坑提供了强大的理论保障。
5.3、BP神经网络应用与基坑开挖参数分析,为岩土力学参数分析提供了新的方向。其强大的分线性映射能力,能化繁为简,大大减少反演工作量。但由于其通用性,没有结合岩土体的物理本质,只是单纯的数据分析工具,在工程实践中应用,需要大量的训练样本方可保证其准确性。
5.4、反分析是一项系统工程,并不只是一二家参建单位参与就可完成的。反分析工作基于现场施工测量,与施工进程紧密结合:施工设计――施工――现场监测――反演分析――调整模型、参数――再设计。这一过程需建设单位、设计单位、施工单位、监理单位、第三方监测单位各方通力合作,只有建立相关管理制度,方可有效执行。
参考文献
[1]杨志法等. 岩土工程反分析原理及应用[M] .地震出版社
[2]李宁等. 岩土工程反分析方法研究现状与若干问题探讨[J]. 水利与建筑工程学报,2006(9)
[3]朱合华等. 地下工程测试技术与反分析[J]
[4]王春波等. 深基坑工程土层参数反分析方法探讨研究[J]. 地下空间与工程学报,2011(11)
[5]高德军等. 长江三峡大石板滑坡计算参数反分析[J]. 河海大学学报,2006(6)
关键词:模式识别;教学内容;授课方式;评价方式
模式识别是60年代迅速发展起来的一门学科,该技术用于自动将物理对象或抽象的多维模式分类到已知或可能未知的类别。目前,市场已经存在一些能进行字符识别、手写体识别、文档分类、指纹分类、语音和说话人识别、白细胞分类以及其他军事目标识别的商业模式识别系统。低成本、高分辨率传感器(如CCD摄像机、麦克风和扫描仪)和互联网上共享的数据为我们提供了关于文本、语音、图像和视频的巨大数字化资源库,对这些资源进行有效的归档和检索,极大推动了模式识别算法在新领域的应用,例如文本、图像和视频检索,生物信息学和面部识别等。
由于模式识别是一门理论与实践紧密结合的学科,理论基础涉及高等数学、线性代数、数理统计、小样本统计学习理论、模糊数学等学科,因此该课程具有一定的抽象性和难度,学生不容易理解所学内容。为了使学生从抽象中理解具体,更好地、自主地、创新地学习,教师要在知识的传授过程中注重学习方法的传授,故教学探索成为模式识别课程中重要的研讨内容之一。随着社会的发展、国际交流的频繁及网络技术的完善,如何借鉴先进的国外教学理念,更好地培养具有创新能力的学生,也成为教学探索的一个主要问题。
1国内外教学比较
下面就从教学内容、授课方式和学生评价方式三个方面来阐明国内外模式识别教学。
1.1教学内容
模式识别领域的国内外研究者和学者已编著了大量优秀教材,由于篇幅关系,下面仅对部分教材进行简要介绍。
Richard O. Duda等编写的《Pattern Classification》清晰地阐明了模式识别的经典方法和新方法[1]。Sergios Theodoridis编写的《Pattern Recognition》全面阐述了模式识别的基础理论、最新方法以及各种应用[2]。Andrew R. Webb编写的《Statistical Pattern Recognition》对统计模式识别的基本理论和技术作了全面且详尽的介绍[3]。J.P.Marques de Sá编写的《Pattern Recognition:concepts,methods,and applications》详细介绍了有关模式识别的概念和方法,并附加多个领域的实际应用案例[4]。M.Narasimha Murty等编写的《Pattern Recognition:An Algorithmic Approach》讲解了模式识别在算法中应用的主要原则,并对模式识别的概念和最近取得的进步进行了详细介绍[5]。Brian D.Pipley编写的《Pattern recognition and neural networks》对模式识别和神经网络进行了介绍,并给出了模式识别领域的许多实际例子[6]。Satoshi Watanab编写的《Pattern recognition:human and mechanical》为模式识别提供了一个统一的标准,并介绍了该学科的广阔前景[7]。Robert J.Schalkoff编写的《Pattern Recognition:statistical,structural,and neural approaches》探究了模式识别的核心概念、方法和应用[8]。Keinosuke Fukunaga编写的《Introduction to statistical pattern recognition》,每章都含有大量习题[9]。
清华大学的边肇祺教授等编写的《模式识别》主要讨论了统计模式识别理论和方法,还介绍了人脸识别、说话人语音识别及字符识别等应用实例[10]。干晓蓉教授编写的《模式识别》主要内容包括贝叶斯决策理论、概率密度估计、线形判别函数、无监督学习和聚类、特征选择与提取、模糊模式识别、人工神经网络、线形代数、多维随机变量[11]。王碧泉教授等编写的《模式识别:理论、方法和应用》介绍了特征选择、聚类和判别等方面的常用模型和算法,模式识别在地震学、数字图像处理和决策管理等领域中的应用[12]。杨光正教授等编写的《模式识别》介绍统计识别方法和句法方法的基本理论[13]。张学工教授编写的《模式识别》系统地讨论了模式识别的基本概念和代表性方法[14]。齐敏教授等编写的《模式识别导论》按照统计模式识别、句法模式识别、模糊模式识别法和神经网络模式识别法四大理论体系来组织全书[15]。蒋先刚教授编写的《数字图像模式识别工程软件设计》介绍图像模式识别的基础理论和程序实现技术,从工程应用的角度全面介绍了图像模式识别应用软件设计的基本方法和实用技术[16]。孙即祥教授等编写的《模式识别》系统地论述了各类经典的模式识别的理论与方法,较全面地反映了本学科的新近科技成果[17]。
2.2授课方式
国外的授课方式往往注重内容的学习、知识的掌握和学生独立思考。课堂教学理念重参与性、积极性、创造性和灵活性。课堂相对活跃,讲授和讨论相辅相成,学生能积极地参与到课堂教学中,学生参与发问或发表个人意见,课堂上的参与往往是学期分数的一部分,被认为是评估学生所学习的知识的方法,并注重学生是否有能力与教师和同学进行知性的对话。
国内的课堂教学主要以教师讲授为主,学生被动接受,留给学生的自主空间较狭窄,课堂教学理念注重系统性、完整性、逻辑性、生动性、计划性。课堂相对平静,讨论较少,学生加入到课堂教学中的情况不多,学生参与发问或发表个人意见少。
2.3评价方式
国外对学生的培养重经验、过程、体验和运用。学生的学习过程只是其成长的一部分,教师评价学生时十分注重多渠道收集学生在校、在家和参加社会活动的情况,通过综合分析,对学生进行全方位的、细化的评价,其中不仅有教师对学生的评价,还包括学生的自评、学生之间的互评、家长的评价和学生参加社会活动获得的评价。
国内的教学目标是追求知识、结果、记忆和会考试。由于教学中以教师为主,往往只注意知识的传授,忽略了学生能力和全面素质的培养。学生能牢固地掌握知识,但知识运用能力差,主动和创新能力欠缺。教师对学生的评价注重期中、期末考试,忽略了学生参加社会活动的情况。
3教学探索
基于如下的研究结果:有效教学本质上取决于教师建立能够实现预期教育成果的学习经验的能力,而每个学生都参与教学活动是实施有效教学的前提[18],我们从教学内容、授课方式、评价方式三个方面进行模式识别课程的教学探索。
3.1教学内容
教学内容的安排应与本科学生的学习特点和目前所掌握的知识程度相吻合,才能使学生牢固掌握知识。借鉴国内外教学内容情况,我们的模式识别课程的教学内容共分9个章节,分别介绍模式识别纲要、贝叶斯决策理论、极大似然估计和贝叶斯参数估计、隐马尔可夫模型、统计语言模型、支持向量机、最大熵模型、人工神经网络、决策树。
第1章 通过提出问题“智能科学与技术专业的学生为什么要学习模式识别”和“应当怎样学习模式识别课程”展开,具体介绍内容包括模式、模式识别、有监督的分类、无监督的分类、模式识别的主要方法和模式识别系统。
第2章 “贝叶斯决策理论”介绍了在概率结构都知道的理想情况下的模式分类问题。虽然这种情况在实际中很少出现,但它为我们提供了一个能够与其他分类器进行对比的评价依据,即“最优贝叶斯分类器”,帮助我们预测推广到新模式时的最小误差率。
第3章 主要围绕“极大似然估计和贝叶斯参数估计”来展开。在先验概率和类条件概率密度已知的情况下,我们可使用“贝叶斯决策理论”来设计最优分类器。但是在实际应用中,通常不能得到和问题相关的全部概率结构知识,因此我们利用已有的信息,对问题中涉及的先验概率和条件概率函数进行估计,并把估计结果当做实际的先验概率和条件概率,再来设计分类器。
第4章 “隐马尔可夫模型”在解决一些与时间序列相关的问题,即某一过程随着时间的流逝而进行,而且某个时刻发生的事件受到前一时刻发生事件的直接影响中得到了很好的应用,隐马尔可夫模型在语音识别领域的应用是最成功的例子。
第5章 “统计语言模型”是用来计算句子概率的模型,在很多自然语言处理的任务,如机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入中都有广泛的应用。在独立假设的前提下,句子的概率公式可被简化,并被计算出来。
第6章 “支持向量机”的基本思想是寻找一个能够将d维空间的样本数据准确地分为两个类别的超平面。但是,由于样本数据经常是不可以被线性分割的,所以通过引入核函数,将样本数据映射到一个可以线性分割这些数据的高维特征空间。而将数据映射到这样的一个空间,通常会引起计算和过度适应问题,但是支持向量机在高维空间中不需要直接处理,这就消除了前面提到的顾虑。并且支持向量机不像神经元网络等其他的学习算法,很难衡量其学习的性能,我们能够清楚地计算出其在未知数据集上的VC维。
第7章 “最大熵模型”在对一个随机事件的概率分布进行预测时,满足全部已知的条件,而对未知的情况不进行任何主观假设。因为在这种情况下,概率分布最均匀,预测的风险最小,概率分布的信息熵最大,所以被称为最大熵模型。
第8章 “人工神经网络”是在现代神经科学研究的基础上提出的,它并没有完全真正反映大脑的功能,只是对生物神经网络进行某种抽象、简化和模拟。人工神经网络中的信息处理是通过神经元之间的相互作用来实现的,知识与信息的存储表现为网络元件互连分布式的物理联系,各种神经元连接权系数的动态演化过程决定了人工神经网络的学习和识别。
第9章 “决策树”是一种广泛应用的归纳推理算法,它采用逼近离散值函数的方法,具有很好的健壮性,能根据训练数据学习出析取表达式。决策树学习方法通过搜索一个完整表示的假设空间,从而避免了受限假设空间的不足。
3.2授课方式
遵循学生的认知规律和和学习特点,结合作者从事的模式识别课程教学,我们对模式识别的授课方式给出了如下建议。
首先,教师将不再单纯地讲解,而是引导学生进行学习和组织学生进行课堂活动,使学生由原来的单纯听讲、被动接受灌输转变为主动参与课堂教学,亲自去发现结论和规律,使学生学会思考和善于思考,培养学生分析和解决问题的能力。通过教师和学生互相提问和共同讨论,来发挥学生的主动性,使两者在教学过程中相互联系和作用,教学过程成为双方主动介入的过程。由于模式识别具有一定的抽象性和难度,因此教师讲解时要尽可能通过实例引出问题,让学生亲睹实例,增加感性认识,通过图像、动画和视频的生动画面和声音吸引学生的注意力,将抽象的理论形象化,使学生印象深刻而又便于理解。
其次,教师在传授知识的同时也应该力所能及地帮助学生解决在生活、学习过程中遇到的疑问,对他们提出的问题给予认真、耐心的解答,帮助他们克服困难。教师在教学过程中留出一定的时间,以朋友的身份和学生交流,了解他们的想法,从中获得一些好的意见和建议。
再次,在讲解理论部分时,教师应该理论联系实际,注重学生实践能力的培养。适当引入一些实际生活的例子,帮助学生理解所学知识,如介绍最大熵模型,可使用“投资时不要把所有的鸡蛋放在一个篮子里,这样可以降低风险”的例子,使学生对模型的认识不再抽象。简要告诉学生下次课的内容,鼓励学生课后查阅相关资料,并对遇到的问题进行分析和解决,带着问题参与下一次的课堂教学。针对每一章的授课内容,教师应精心设计和安排相关实验,加深和巩固学生所掌握的知识。
3.3评价方式
模式识别是智能科学与技术专业的一门重要专业基础选修课,对学生将来的学习、工作都起着非常重要的作用。该课程不仅仅是让学生掌握知识,更重要的是培养学生的能力。因此,教师应该积极鼓励学生多参加社会实践,评价时应从多渠道和多方面收集学生在校和参加社会活动的信息,通过综合分析,对学生做出全方位的、细化和合理的评价,促进学生全面素质的培养,最终提高学生的创新能力。
4结语
模式识别是一门理论与实践紧密结合的学科,教与学的方式值得我们研究和探索。在今后的教学工作中,我们要多从模式识别理论涉及的学科广泛,而本科生目前还没有完全掌握这些知识等特点出发,不断改革、实践和创新。同时,教师也要不断提高自身素质和业务水平,不断提高课堂教学质量,为国家培养更多合格的应用型本科人才。
参考文献:
[1] Richard O. Duda, Peter E. Hart, David G. Stork. Pattern Classification[M]. Ventura:Academic Internet Publish, 2006.
[2] Sergios Theodoridis. Pattern Recognition[M]. San Diego:Academic Press,2006.
[3] Andrew R. Webb. Statistical pattern recognition[M]. The Atrium:John Wiley and Sons, 2002.
[4] J. P. Marques de Sá. Pattern Recognition: concepts, methods and applications[M]. Berlin:Springer, 2001.
[5] M. Narasimha Murty, V. Susheela Devi.Pattern Recognition:An Algorithmic Approach[M]. Hyderabad: Springer,2001.
[6] Brian D. Ripley. Pattern recognition and neural networks[M]. Cambridge:Cambridge University Press,2008.
[7] Satoshi Watanabe. Pattern recognition:human and mechanical[M]. San Francisco:Wiley,1985.
[8] Robert J. Schalkoff. Pattern Recognition:statistical,structural,and neural approaches[M]. San Francisco:J.Wiley, 1992.
[9] Keinosuke Fukunaga. Introduction to statistical pattern recognition[M]. San Diego:Academic Press, 1990.
[10] 边肇祺,张学工. 模式识别[M]. 2 版. 北京:清华大学出版社,2007.
[11] 干晓蓉. 模式识别[M]. 昆明:云南人民出版社,2006.
[12] 王碧泉,陈祖荫. 模式识别:理论、方法和应用[M]. 北京:地震出版社,1989.
[13] 杨光正, 吴岷, 张晓莉. 模式识别[M]. 合肥:中国科学技术大学出版社,2001.
[14] 张学工. 模式识别[M]. 3版. 北京:清华大学出版社,2010.
[15] 齐敏,李大健,郝重阳. 模式识别导论[M]. 北京:清华大学出版社,2009.
[16] 蒋先刚. 数字图像模式识别工程软件设计[M]. 北京:水利水电出版社,2008.
[17] 孙即祥, 姚伟, 滕书华. 模式识别[M]. 北京:国防工业出版社,2009:1-280.
[18] 华荣宝.“有效课堂教学”学习材料(一)[EB/OL]. (2008-02-29)[2011-03-10]. /Article/ShowArticle. asp?ArticleID=1545.
Pattern Recongnition Teaching Exploration
TAN Yongmei, WANG Xiaojie, ZHONG Yixin
(Department of Intelligence Science, Beijing University of Posts & Telecommunications, Beijing 100876, China)
伴随着脉诊仪关键技术——传感器研究的不断进步,信息采集的精度和速度日益提高。信息量的丰富对相应分析技术的要求也逐步提高。除几种传统的分析技术外,其他学科新兴的分析技术不断被引入脉诊现代研究中,使有价值脉动信息的获取空间空前扩大。目前,脉诊现代研究中,常用的分析和识别方法有时域分析、频域分析、时频分析、人工神经网络、可视化分析以及一些其他分析方法。
1 时域分析
时域分析是对脉搏波动图形进行分析的主要方法,是目前研究时间最长,也是最成熟的方法。最初的脉图分析方法主要局限于从脉图的时间、振幅、角度、形态等方面分析上升支、下降支、重搏波的高度及各种高度的比值或它们夹角的大小及面积大小时值等。
脉搏信号从时域上看,是一个周期性较强的准周期信号。脉搏波动频率为60~100次/min。时域分析法主要分析脉波波幅的高度和脉动时相的关系。通过对脉图幅值和时值的分析,可以了解脉动的频率和节律,脉力的强弱,脉势的虚实和脉象形态特征等。
崔玉田、赵恩俭等是较早对古代脉学理论和现代实研进展进行系统梳理的研究者,其专著《中医脉学研究》、《中医脉诊学》中涉及到一些脉图时域特征分析的内容。其后,傅骢远、费兆馥、黄世林、杨天权、徐迪华等研究者对脉图的时域特征进行了系统论述。
傅氏等[1]较早开展采用现代技术的中医脉诊研究,其在《中医脉象今释》中集中论述了18种常见脉象脉图分析和判别的方法,并对脉象形成的机制,从血流动力学、血液流变学以及影像学等方面进行了探讨。费氏等[2]较早并较全面的对脉图的时域分析方法进行了研究,在其《现代中医脉诊学》一书中,详细阐述了临床常见17种脉象的脉图及其时域特征参数。黄氏等[3]在《中医脉象研究》中对10种常见脉象的脉图进行了细致分析,开创性地记录了中医学中的“十怪脉”的脉图,并论述了其现代医学基础。较晚的研究者对脉图研究的种类更加全面,在各自的专著中均有详细论述[4-5]。
时域分析方法通过提取脉搏图曲线中一些有明确生理意义的特征点(如主波、重搏波和重搏前波的高度等)或角度(如升支斜率等)作为评价脉搏波的特征参数,将特征参数和对应的生理因素结合起来就可能得到许多有临床医学价值的结果,故时域分析法成了最直观和应用最广泛的一种方法。它可直接通过脉图的形态分析及对各项指标的分析来确定图与脉之间的差别,鉴别出各种脉象。这方面的关键在于筛选判别各种脉搏波波形的特征参数,其主要工作在于分析脉波特征参数与时相的关系。这种方法的优点是直观,临床医生容易接受,但在实际应用上却遇到一些难以解决的困难,如有些特征点难于准确得出,要凭经验估计,随机误差很大。另外,缺乏各种脉象的脉图时域参数特征较统一的标准。大量研究表明,脉象图所反映的信息是多方面的、综合的,单靠直观形态分析法会将许多重要的信息掩盖,因而促进了分析方法向更加全面与多样化发展。
2 频域分析
频谱分析是近代工程力学中常用的一种处理波动信息的方法,主要采用傅立叶频谱分析方法。它把一个很复杂的由许多重叠波构成的脉搏波分解成不同的谐波,这样就能把其中所包含的信息和能量提取出来,因此,较时域分析法更能清楚地反映、分析脉象的各种变化。但其只能刻画整个时间域上信号的频谱特征,不能反映局部时间区间上的信息。近年来,频谱分析也大量用于脉搏信号和中医脉象的研究。频谱分析可能会揭示出许多生理病理信息,而这些信息通常从时域分析中较难获得。
重庆大学的研究者基于脉象信号的频域分析,从不同角度,采用不同方法对吸毒者与正常人的脉象进行了辨识。他们根据脉象信号的非高斯随机特性,发现非参数化双谱估计、参数化双谱估计以及倒双谱估计的方法均是分析脉象信号的有效且可行的方法,吸毒者脉象信号在特定频率区域内的平均相位值、双谱相位主值特征等参数明显区别于正常人,分别给出了吸毒者和正常人脉象信号的判别依据[6-8]。
西北工业大学王炳和等[9-10]研究人员长期进行脉搏波频域分析的研究。其利用高性能的电子检测仪器和计算机提取人体桡动脉脉搏信号,并获得了脉搏功率谱图(PSG)。谱能比(SER)被定义为脉搏功率谱上10 Hz以下的谱能量与10 Hz以上谱能量的比值。结果发现,健康人两手“寸、关”部位的SER值均大于100,而患者“寸、关”的某些特定部位的SER值均小于100,这些给出低SER值的特定部位与人体的病变器官相对应,符合中医理论。同时发现正常人平脉脉搏系统通常具有3个共振峰,滑脉脉搏系统有2个共振峰,弦脉脉搏系统出现4个共振峰,而细脉仅存在1个共振峰。倒谱分析显示,滑脉与弦、细脉的特征差异要比在时域内的差异大得多。脉象倒谱上τ=τz处的峰值大小可表征脉象的“流利”程度,τz1恰好反映了脉象的周期大小,而hc0值正好反映了脉搏强度的信息特征。
厉氏等[11]研究了迟脉、常脉、数脉、疾脉4种脉象的频域特征。研究发现,对于脉率异常的脉象信号,在频域具有与时域相似的特性,即随着脉率的增大,频域中幅度的最大值以及在低、中、高3个频段的幅度值也相应增大。相对于正常脉象,脉率失常的脉象在频域中表现出幅度更不平稳的特点。另外,浮脉患者脉象的能量最高,其次为常脉,沉脉患者脉象的能量最低。从SER看,3种脉象的低频分量都占据了信号的主要能量,但沉脉患者SER最高,浮脉最小,常脉居中;与常脉相比,说明沉脉能量更加集中于信号的低频段,浮脉却向信号的高频段扩散[12]。另外,其他研究者也报道了脉诊信息频域分析的成果[13-18]。
3 时频分析
时频分析的主要任务是描述信号的频谱含量是怎样随时间变化的,研究并了解时变频谱在数学和物理上的概念和含义。时频分析的最终目的是要建立一种分布,以便能在时间和频率上同时表示信号的能量和强度。得到这种分布后,我们可以对各种信号进行分析、处理,提取信号中包含的特征信息,或者综合得到具有期望时频分布特征的信号。时频分析结果可以通过不同的方式直观地表示,如三维立体图、等高线图等,具有揭示许多新现象即改变我们观察思考医学信号方式的潜力。目前,在脉诊研究中应用的是短时傅立叶变换和Gabor展开以及小波变换。
3.1 短时傅立叶变换
由于人体生理、病理和自然环境的影响,生物医学信号通常呈现非平稳与时变特性。传统的傅立叶变换不能描述信号的时频局域特性,仅反映信号的静态频谱特性。短时傅立叶变换克服了傅立叶变换的缺陷,并具有容易实现、计算简洁有效等优点,为最早和最常用的一种时频分析方法。其主要缺陷是时间和频率分辨率在整个时频平面上固定不变。另外的限制是对一个特殊的信号,需要一个特殊的窗才能得到最佳分辨率。
有学者应用全极点滑动窗递归算法,以平均功率与总平均功率的比值为特征参数和通过奇异值分解有效地提取特征矢量,提出了用于划分正常人和吸毒者的临界参数,据此15例吸毒者全被检测出来[19-20]。基于短时傅立叶变换的方法是一种稳定、有效的特征提取方法。
3.2 小波变换分析
由于小波变换在时域和频域同时具有良好的局部化性质,小波变换的数学理论和分析方法在各个领域都受到普遍关注。小波变换是一种信号的时间-尺度(时间-频率)分析方法,它具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变,但形状可改变,时间窗和频率窗都可改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于非平稳信号的处理。小波变换在1-D生物医学信号处理(生物声学、ECG和EEG)和生物图像处理中都得到了应用。
白氏等[21]根据小波变换过零点和信号突变点之问的关系,分别运用小波变换过零点表征检测脉象时域特征点和各特征点脉搏信号变化的快慢。对20例健康人和20例孕妇脉象时域特征点过零点位置的统计及其变化快慢的计算,其分析结果正好与实际相吻合。
张氏等[22]利用小波变换奇异性检测功能与多尺度分辨特性,提出了2种提取脉象信号特征的方法:连续小波变换法和二进小波变换法。在此基础上,构造了两种特征向量:小波变换系数的尺度——主波峰值和小波变换的尺度——能量值。经过对临床采集的235例脉象信号的处理与分析统计,所得数据具有较好的重复性与稳定性,可以作为脉象信号区分正常人与心脏病患者的特征向量。
4 人工神经网络
人工神经网络是反映人脑结构及功能的一种抽象数学模型,一个人工神经网络是由大量神经元节点互连而成的复杂网络,用以模拟人类进行知识的表示与存储以及利用知识进行推理的行为。一个基于人工神经网络的智能系统是通过学习获取知识后建立的。从本质上讲,人工神经网络的学习是一种归纳学习方式,它通过对大量样本的反复学习,由内部自适应过程不断修改各神经元之间互连的权值,最终使神经网络的权值分布收敛于一个稳定的范围。一个已建立的神经网络可用于相关问题的求解,对于特定的输入模式,神经网络通过前向计算可得出一个输出模式,从而得到输入模式的一个特定解。人工神经网络是由大量简单的神经元以一定的方式连接而成的,单个神经元的作用是实现输入到输出的一个非线性或线性函数关系,它们之间广泛的连接组合就使得整个神经网络具有了复杂的非线性特性。神经网络将大量的信息隐含在其连接权值及阈值上,根据一定的学习算法调节权值和阀值,使神经网络实现从m维空间到n维空间复杂的非线性映射。神经网络具有强大的模式识别能力,可以对任意复杂状态或过程进行分类和识别。但是,必须首先用反映输入特征量的大量样本对网络进行学习训练后,才具有这种功能。神经网络有两个与用传统方法进行信息处理完全不同的性质:第一,神经网络是自适应和可以被训练的,它有自学习能力。如果它的输出不满足期望的结果,网络可以自动调整每个输入值的权重,产生一个新的结果,整个修正过程可以通过训练算法来实现。第二,神经网络本身就决定了它的大规模并行机制,也就是说,神经网络从原理上看比传统方法要快得多,它擅长通过大量复杂的数据进行分类和发现模式或规律。
岳氏[23]基于BP神经网络,选择1456例患者作临床脉象检测,总体准确率>92%,不仅对平、浮、沉、迟、数、虚、实、滑、涩、洪、弦、促、结、代等基本脉有较高的识别率,对于由上述基本脉构成的临床常见的相兼脉也有相当高的识别能力(>82%)。研究过程中,解决了构建合理的神经网络结构、各层神经元数量的确定、选择合理的学习速率、脉象信号特征值的选取、神经网络的训练等关键问题。
胡氏等[24]以人工神经网络为手段,以提取脉象信息为目的,由临床采样数据形成了网络训练输入特征向量库,不以单一脉本身为分类对象,而考虑它是否是某些可识别特征的组合,建立了浮沉、弦滑、迟数等一组脉象特征网络。证实了人工神经网络用于具有模糊性的脉象特征的识别和分类是可行的,带智能处理的特色,其分辨准确率可达90%。
5 模糊属性识别方法
20世纪80年代出现的用句法分析指导的脉象模糊属性识别方法,从根本上抛开了人工测定脉图指标的模式,它是从检测到的脉搏波上进行采样、基元抽取及基元属性提取等,然后作分类,这就使得计算机识别有可能突破医生的水平。模糊聚类法用于人体脉象的识别研究也获得了较高的正确率。
王氏等[25]对脉搏声信号进行AR模型拟合来完成特征提取,并通过K-L(Karhunen-Loeve)变换实现特征压缩,然后讨论了一种新的FUZZY聚类方法——F-PFSR聚类法,最后给出了对临床实测脉象信号聚类的实验结果。但研究结果显示这种聚类的正确率还有待于提高。
6 可视化分析
牛氏等[26]利用彩色Doppler超声成像技术检测到寸口桡动脉等处血管的径向张缩、轴向收缩和轴心位移组合成的三维运动,提出与脉管三维运动有关的脉象变化规律;同时应用该技术还可以在活体上直接观察到中医所谓的“斜飞脉”、“反关脉”及在寸口处并行的“双管脉”。
张氏等[27-28]运用具有B超和压力复合传感器的可视化脉动信息采集和分析装置,对桡动脉三维运动和脉诊“位、数、形、势”属性的关系进行了探索性研究,发现了二者之间的对应关系,为解决“脉形”、“脉势”等研究难点提供了新的思路和方法。
张氏等[29]自主研制了一种图像化脉搏传感器。通过对沿血管横截面方向的14个网格点轨迹的检测,提取得到了脉搏波形,并计算得出脉搏频率,同时给出脉搏振幅、脉宽信息测量的定性说明。研究表明,本系统能够有效提取多维脉搏特征信息,为中医诊断客观化和科学化提供了一种新的手段和方法。
7 其他方法
7.1 混沌分析方法
李氏等[30]借助动态心电图记录获取心电RR间期的变化信息的混沌分析方法手段——Lorenz图,观察脉象速率、节律的改变,将医生靠个体感觉的判断变为具有可视性、直观性和连续性的图形表达,可客观地量度脉象的改变程度和性质。认为虽然Lorenz图无法量度脉搏形态的变化,但有时脉搏的形态与速率相关,如沉迟、洪数等特异性的复合脉象,这也许是继续研究的切入点。
7.2 整体动态方法
刘氏等[31]在自行研制的具有新型点阵式传感器的脉象仪的基础上,建立了一种新的分析方法。该方法通过绘制整体脉搏-脉体时空综合图,以反映脉体、脉力、脉长;整体脉搏-脉势时空综合图,以反映脉宽、脉体、脉流、脉力;整体脉搏-脉流时空综合图,以反映脉流、脉长、脉宽等,从而准确反映脉搏整体动态变化,使脉象的“位、数、形、势”在整体上得到动态体现。
7.3 金氏脉学方法
魏氏等[32]根据金氏脉学的基本思想:三对基本概念、二个基本规律和一个基本原理,设计了独特的脉搏分层测量系统,克服了原有脉象仪的单点单面采样,实现了自动多层面信息采集。对脉搏波进行“多层分析”,实现对疾病“定性、定位、定量”的诊断。
7.4 分形方法
杨氏等[33]探索了分形理论在脉象特征提取中的应用。研究结果表明,不同类别的脉象信号具有不同的分形维,这为采用分形理论进行目标特征提取提供了基础。与频域分析方法比较,利用分形提取维数特征的方法更简单易行。
8 展望
8.1 分析方法的发展
传感器技术的进步使脉动信息获取空间扩大。信息来源的丰富要求新的分析方法来适应这种变革。目前,分析方法体现出两种获取新特征信息的趋势:一是在原有信息来源的基础上,引进新的分析技术,发现新的特征参数;二是开发除脉动压力信息以外的新的信息来源,并应用新的分析技术。
时频分析属于前一种趋势。时频分析的目的是在时间和频率上同时表示信号的能量和强度,最终建立一种能量和强度的时相分布,具有动态分析的特征。其与原有的时域和频域分析不同,但又兼有二者的一些优点,所以,部分研究者热衷于脉动信息时频特征参数的获取。小波变换是时频分析的另一种重要手段,也是脉诊研究的热点之一,其在信息学、工程学中的应用则更为广泛和深入。小波变换方法在时域和频域同时具有良好的局部化性质,即可以在两个领域中对同一信号进行可调控地、更细微地观察,具有放大效应,故被称为“数学放大镜”。可以看出,时频分析与常规时域、频域分析的关键区别在于对同一信号进行分析的角度和尺度,而信号的来源是同一的,并没有新的信息引入。
可视化分析(或图像分析)属于后一种趋势。可视化技术的应用突破了长期以来一维脉动压力信号的采集模式。所采用的图像分析方法,将主要研究对象转移到桡动脉三维运动相关的图形图像变化上。如对桡动脉B超图像的分析,由于视觉是人类获取外界信息的最主要途径,可视化的动态图像所携带的信息远远大于压力信号;同时采用与压力信号分析截然不同的分析方法,将三维运动的空间测量作为参数获得的主要手段,用一些直观、简单的参数即可完成脉诊属性的分析,对一些压力信号无法反映的特征,如“脉长”、“脉宽”、“脉势”等实现了参数定量分析。
8.2 识别方法的发展
脉象本身的复杂性和多元体现形式使原有的有限参数与某种脉象的整体特征一一高度对应的研究设想难以实现。基于复杂性思想的辨识方法是近几年脉诊现代研究的新方向。目前脉象辨识模式的两种主要趋势是:具有复杂性研究性质的识别方法和基于“位、数、形、势”脉诊属性的“复杂-简单-复杂”模式。
8.2.1 具有复杂性研究性质的识别方法 聚类技术的根本问题是对两个对象间距离和相异度度量的选择,针对两两对象之间的“相似度”或“相异度”划分不同类别,并不能从多维和多层次角度来全面分析数据并解释数据中真正复杂结构。另一方面,信息与脉象之间的关联性是非常复杂的,具有多维和多层次的复杂联系。目前脉动信息所常用的时域或频域分析所获得参数,仅仅是对一维压力信号的多角度观测。信号本身信息量的单薄,加之分析方法的局限,使上述复杂关系难以体现。所以,目前聚类方法在脉诊识别研究中始终是一种辅助的手段,其相关报道较少。
人工神经网络不需要精确的数学模型,而是通过模拟人的联想推理和抽象思维能力,来解决传统自动化技术无法解决的许多复杂的、不确定性的、非线性的自动化问题。由于人工神经网络在构建结构上模拟了人的中枢神经结构,通过多个循环的训练来达到最终目标,自身具有很强的自组织性和容错性,与人的思维有一定的相似性,所以是目前研究较为热门的方向之一。脉诊辨识的相关研究显示其应用结果是令人满意的。
神经网络的结构,尤其是输入层和隐含层的数目,严重影响网络的训练速度和拟合程度。为了实现较快的识别,优化和统一结构将是未来研究的方向之一。另外,目前脉诊现代研究的目标要求尽可能的减少主观因素在脉象辨识中的影响,形成较为一致和公认的客观识别方法,而训练样本的不同会导致不同的人工智能的认知模式,即使神经网络结构相同,亦是如此。这与客观研究的目标背道而驰。所以,如何统一有限的训练样本,将是未来研究人员面临的新问题。
8.2.2 基于脉诊属性的“复杂简单复杂”模式 “位、数、形、势”是周学海提出的分类脉象的纲领。目前单脉有28种之多,相兼脉则更多。但不论脉象种类有多少,均可被分解到“位、数、形、势”的不同程度中去,所以,“位、数、形、势”可以看作脉诊的四个基本属性。基于脉诊“位、数、形、势”属性的分析研究,将复杂多样的脉象分解简化为四种有量化可能性的参数分类,实现了“复杂简单”的过程;通过客观参数反映的“位、数、形、势”属性,在“组合关系”论的指导下可进一步合成为具体的单一脉象,实现“简单复杂”的过程。
参考文献
[1] 傅骢远,牛 欣.中医脉象今释——现代实验研究[M].北京:华夏出版社,1993.341-345.
[2] 费兆馥.现代中医脉诊学[M].北京:人民卫生出版社,2003.147-222.
[3] 黄世林,孙明異.中医脉象研究[M].北京:人民卫生出版社,1986.45-196.
[4] 杨天权.中医脉学应用新进展——附60例脉案分析[M].上海:上海交通大学出版社,1994.187-321.
[5] 徐迪华,徐剑秋,徐丽敏.中华脉诊的奥秘——200幅脉图解析[M].南京:江苏科学技术出版社,2005.189-265.
[6] 李玉韩,蔡坤宝,张继红.双谱估计在中医脉象信号分析中的应用[J].重庆大学学报(自然科学版),2006,29(5):44-47,61.
[7] 张继红,蔡坤宝,李玉韩.中医脉象信号的参数化双谱估计及其切片分析[J].重庆大学学报(自然科学版),2006,29(6):47-50,74.
[8] 黄 镭,刘宗行,蔡坤宝.倒双谱估计在海洛因吸毒者脉象信号检测中的应用[J].重庆工学院学报(自然科学版),2007,21(7):98-102.
[9] 王炳和,罗 建,相敬林,等.人体脉搏功率谱分析与中医脉诊机理研究[J].西北大学学报(自然科学版),2001,31(1):21-25.
[10] 王炳和,相敬林,杨 颙,等.基于信号检测的人体脉搏系统传递函数的估计[J].科学通报,1999,44(10):1069-1073.
[11] 厉树忠,张 媛,刘 进.中医脉率波形的频谱分析[J].甘肃科技,2006, 22(9):120-121.
[12] 王全来,厉树忠,杨金龙,等.中医浮脉与沉脉的频谱分析[J].甘肃科技,2007,23(6):77-79.
[13] 张镜人,郑秀春,杨天权,等.正常人脉象图频域指标分析[J].辽宁中医杂志,1995,22(10):435-436.
[14] 孟兆辉,白 净,王苏中,等.高血压病人的光电容积脉搏波的频域分析[J].北京生物医学工程,2002,21(1):1-4.
[15] 车新生,范威阳,刘明林.基于傅立叶级数的中医脉象三维显示[J].辽宁中医杂志,2007,34(11):1505-1507.
[16] 姜 斌,宋蜇存.脉象信号的频谱分析[J].通讯与信息处理,2007,26(8):38-39.
[17] 周 越,许 晴,孔 薇.脉象特性分析和识别方法的研究[J].生物医学工程学杂志,2006,23(3):505-508.
[18] 曾小青,李 玲,欧阳俊.指端脉搏波检测与频域分析实验设计[J].实用预防医学,2004,11(2):362-363.
[19] 周 霞,蔡坤宝.中医脉象信号的短时傅立叶分析[J].重庆大学学报, 2003,26(10):47-51.
[20] 周 丹,蔡坤宝.基于短时傅立叶变换的脉象信号的模式识别方法[J].重庆科技学院学报(自然科学版),2007,9(3):49-52.
[21] 白金星,赵子婴,王艳苹.基于小波变换过零点表征的脉搏信号分析[J].航天医学与医学工程,2006,19(3):204-207.
[22] 张丽琼,王炳和.基于小波变换的脉象信号特征提取方法[J].数据采集与处理,2004,19(3):323-328.
[23] 岳沛平.BP神经网络识别在中医脉象信号辨识系统中的运用[J].江苏中医药,2005,26(11):4-6.
[24] 胡家宁,阎述池,王秀章,等.脉象特征人工神经网络分类器[J].中国医科大学学报,1996,25(6):571-574,578.
[25] 王炳和,相敬林.基于AR模型的人体脉象信号模糊聚类研究[J].应用声学,2001,20(5):21-25.
[26] 牛 欣,杨学智,傅骢远,等.桡动脉的三维运动与脉诊位数形势[J].中国中西医结合杂志,1994,14(7):435-437.
[27] 张治国,牛 欣,杨学智,等.脉形和脉势检测方法新探[J].中西医结合学报,2008,6(3):243-248.
[28] 张治国,牛 欣,杨学智,等.脉长的数字化、可视化探索[J].中医杂志,2008,49(9):830-832.
[29] 张爱华,李向群.基于图像传感器的脉搏三维运动分析[J].微计算机信息(测控自动化),2007,23(5):176-177,270.
[30] 李方洁,刘国正.混沌方法Lorenz图对脉象的表达[J].中国中医药信息杂志,2003,10(6):10-11.
[31] 刘 峰,陈家旭.脉象信号分析新方法与实施方案[J].中医药学刊, 2006,24(12):2217-2218.
关键词:电力系统;自动化控制技术;电子科技;网络技术;通信技术 文献标识码:A
中图分类号:TM76 文章编号:1009-2374(2015)30-0046-02 DOI:10.13535/ki.11-4406/n.2015.30.023
如今,越来越多的新型科技在解决电力系统的结构问题中显示出了其强大的生命力,而自动化技术作为较先进的技术方法,对电力部门的管理水平及管理效率的提高有着极为重要的作用。但随着科技更新换代脚步的加快,使电力部门对电力系统自动化控制技术的应用提出了更高的要求,从而适应当今社会的发展。本文针对其概念、内容、基本技术进行了具体的阐述,以供相关人员参考。
1 电力系统的自动化控制技术概述
1.1 电力系统自动化的概念
所谓电力系统自动化,就是凭借信号系统与数据信息传输系统对电力系统各部分及整体的远程监测及控制。在此过程中,发挥作用的装置具有自动监测、决策和控制的基本功能。在此之中,使得电力系统的运行更加安全可靠,并在很大程度上确保了电能质量的合
格性。
1.2 电力系统自动化的构成
作为电力行业新技术与新理念下的产物,电力系统自动化是电力行业所取得的重大成果。其基本内容主要有三点:
一是系统调度自动化。其主要是采集与监控电力系统的相关数据,对实现自动化给予有利条件。保证电力系统运行与调度、电力市场运营与可靠性、发电厂运营决策等顺利进行。在电力系统中,作为电力系统自动化的核心技术,调度自动化对自动化系统稳定运行与基础工作的高质量提供了重要的保证。
二是变电站的自动化。其目的是为变电站安全、稳定、高效的运行提供重要保障,并使其运营效益得以提高。具体来说,就是通过对现代电子计算机与网络技术、通信技术及信息处理技术的运用,使整个变电站在科学统一的管理下得以正常运行。
三是配电网的自动化。控制传统的配电网主要是靠工人手动操作来实现的。但随着自动化技术中独立功能在电力系统中的应用,使配电网自动化更加完善与成熟。而所谓的配电网自动化,就是利用大量的智能终端与通信技术及后台软件,使资源的利用率得以提高。此外,由于配电网设置情况各异,因此应分批分期对其进行改造,从而使配电资源的综合利用率逐步提高。
2 电力系统自动化控制要求及特点
2.1 参数的收集与处理
为实现安全、稳定、可靠的电力系统自动化,就需要相关人员对初期的供电服务进行科学的调查与分析,并对电力系统的各个环节、各个部件的安全运行参数进行严格的检验与测试,然后将其进行合理的分析,以提供数据上的保障,来使电力系统自动化得以有效控制。
2.2 科学的调控
在调控电力系统时,要将电力系统的具体运行情况与其可行性分析结合起来,并依据建立电力自动化系统有关技术标准及要求对其进行调控。此外要注意的是,在调控自动化控制技术时,要运用不同的调控措施对自动化控制的不同部件与环节进行调控,例如宏观调控、微观调控等。
2.3 归纳规律特点
在对系统进行科学调控后,要不断总结电力系统自动化各个环节的运行情况,以此归纳出其规律与特点。为了建立起全面自动化的电力系统,有关人员在对运行模式进行选择时,应以高效节能为其选择原则,从而确保运行模式的安全可靠,并达到指导实践的效果。
2.4 优势分析
相较于传统较为落后的机械化生产模式,现代电力系统中的自动化应用技术不仅使更多的人力、物力及财力得到了节省,而且使生产周期与生产环节也得到了缩减,使工人劳动强度得到了降低,最终使事故的发生率得以降低。在生产的安全性与稳定性上,电力自动化控制技术有着良好的效果,保证了电力系统运营效率的提高与频繁停电在生产生活中的减少,并对社会秩序的正常进行起到了积极意义。
3 电力系统自动化基本技术的应用
3.1 主动面向对象数据库技术
经过近年来的不断发展,主动面向对象数据库技术不但具有明显的开放性与继承性,而且还有一定的共享性与智能性,且该项技术特别在电力系统自动化的建设方面有着重要的促进作用。在科学调度的前提下,现代电力系统自动化还有着供电服务功能。而此项技术与传统技术相比,有着无法比拟的优越性,其可以对电力控制通过数据库的触发子系统进行全方位的监控,从而使其数据分析及相关管理获得有力的保证。此外,建立与应用数据库在对数据存储、输出效率以及存储的安全性与可靠性的提高上都有着良好的促进作用。
3.2 现场总线控制技术
作为以数据信息传输为主的控制系统,现场总线是通过实际测量与现场设备的控制,并对现场配备的自动化智能仪表、现代化设备、控制中心设备加以利用,来实现现代化设备与控制中心信息通讯与控制的一体化的。此项技术对现场仪表与设备的连接与数据通信等都有着不同的要求。因此,在电力系统的建设过程中,必须依照科学而合理的体系与协议对该项技术进行规范。
在我国的电力系统自动化控制实践中,对现场总线技术的应用非常广泛。因为现场总线系统在应用现场总线控制技术中,对现场各生产设备间及控制系统间的数字通信的多方向、多结点的实现有着良好的促进作用。而在电力自动化系统中,PCS系统是目前应用最为广泛、效果最为明显的系统。较之传统应用的系统,此系统的性能更为灵活、优化、稳定与安全。特别是在故障发生时,该系统可以按照具体发生的问题,经上位机对所引起故障环节的准确定位,来制定出及时而有效的措施,从而确保系统在最短的时间内得以正常运行。
3.3 基于神经网络控制原理的控制技术
从理论上来说,非线性、鲁棒性、并行处理及自组织学习能力是神经网络控制的基本特征。因为其自身特点与优势,神经网络控制获得了大众的广泛关注。神经网络的基本连接方法是以大量的神经元进行连接的,这使得相关人员对神经权值按照一定的算法进行调节,从而使非线性映射的神经网络得以实现。
3.4 专家系统的基本控制技术
所谓专家系统的基本控制技术,就是包括辨别系统警告状态等特殊状态、具有紧急处理能力及对系统的恢复与控制能力等的一项控制技术。在实际生产中,对这种技术的应用比较广泛,但其中也存在着一些不容忽视的问题,有着一定的局限性。所以,在对其的应用中,要权衡利弊,对其局限性进行深入的了解,保证在该项技术的应用能够顺利进行。
4 结语
当前,随着电子科技、网络技术、通信技术的不断更新与完善,电力系统自动化技术也随之飞速发展起来,其在当代的电力行业展示了自我与时俱进的风采。作为我国电力系统的重要组成部分,必须对其加以重视。要从国外先进技术中汲取养料,依照国际化标准来对其进行发展,从而为我国电力系统的安全与稳定提供重要的保证。本文电力系统自动化控制技术的应用从电力系统的自动化控制技术概述、要求、特点,以及其所基本技术进行了具体的阐释,希望对相关人员有所
帮助。
参考文献
[1] 张建林.电力系统自动化控制技术的重要性及要点分析[J].科技与企业,2013,(10).
[2] 伊端斌.电力系统自动化控制技术的重要性及要点分析[J].企业技术开发,2013,(23).
关键词:复杂网络;网络模型;网络特性
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2017)03-0023-02
1 基本概念
所谓“网络”(networks),实际上就是节点(node)和连边(edge)的集合。若节点相对(i,j)和(j,i)的边是相同的,则它就是无向网络;如果不是相同的边,那么就是有向型的。当将权值赋给各边时,就得到了加权网络,若不赋值,就是无权型的,具体如下图:
如果根据特定规律将各节点连边到一起,那么就能获得图2所示规则网络。若根据任意形式将节点各边连到一起,那么就能获得随机网络。
通常可以用介数、度分布、平均路径长度等参数来阐述复杂网络的各种特性,下文将描述各参数。
1)平均路径长度(Average path length)
将网络内的任意两节点[i]与[j]的间距[lij]定x为假定两节点分别为起点与终点,中间过程最小的连边量。将网络直径定义成网络内部任何两节点之间的最大值。则:
[D=maxi,jlij] (1-1)
平均路径长度定义[L]为网络中所有节点对之间距离的平均值,用公式表示为:
2)簇系数(Clustering efficient)
网络中存在一节点[i],它和另外的节点通过[ki]条边连到一起,这i[ki]个节点称为节点[i]的邻居节点,最多会有[KiKi-12]条边。[i]的簇系数用[ki]个邻居节点中含有的边数[2Ni]比上最大边数[KiKi-12]的数值来计算,用[Ci]来表示。公式为:
[Ci=2NiKiKi-1i] (1-3)
3)度分布(Degree distribution)
若将节点[i]的度[ki]定义成和它连接的另外节点的个数,就可用[i]的邻居数来称呼它。一般每个节点会有单独的度,网络平均度就是全部节点度的均值,用[k]表示。公式为:
[K=1Ni=1NKi] (1-4)
通常可以用度分布函数[Pk]来显示节点的分布状态。[Pk]含义为选择任何的一个节点,它的度正好是[k]的概率。则:
[Pk=1Ni=1Nδk-ki] (1-5)
2复杂网络模型
1)规则网络(Regular network)
图3显示了普遍的网络模型,分别是全局耦合、最近邻耦合及星型模型。
上图(a)显示的全局模型中存在[N]个节点,边数为[NN-12]条边,它的[L=1](最小),[C=1](最大)。
2) ER随机网络(random network)
20世纪50年代匈牙利的两位科学家设计出了此模型,如图4所示:
(a)[p=0]时,存在10个孤立节点;(b)~(c)[p=0.1,0.15]时,得到的随机效果图
3)小世界网络(small-world network)
1998年美国的Watts等人提出了一个小世界模型,它的特点是聚类参数大、路径长度短,功能是使完全规则的网络向完全随机的形式转变,通常称作WS模型。如图5所示:
4) NW小世界模型
因为网络的连通性或许会被WS模型的随机重连过程损坏,所以想要防止孤立子网产生,在1999年美国的Newman等人设计了一个新的小世界模型,它将随机重连用随机加边代替,通常称作NW模型。如图6所示:
5)无标度网络(scale-free network)
1999年Albert等人设计了一种无标度模型,来解释此类网络的幂律特性,通常被称作BA模型,如图7所示。
3 网络模型比较
下面比较WS小世界网络模型、BA无标度网络模型与真实网络的主要性质的异同。根据表1.5所示,现实网络三大特性中的两点能被BA与WS模型捕捉到。研究人员为了使现实网络的全部特性都能被显示,又设计了很多模型,然而BA与WS模型的结构简单,规则明确,且对复杂网络的基本特性准确把握,所以现阶段应用频率最高的还是BA与WS模型。
[模型\&节点度分布\&平均路径长度\&聚类系数\&真实网络\&幂率分布\&小\&大\&小世界网络\&泊松分布\&小\&大\&无标度网络\&幂率分布\&小\&大\&]
4 结束语
复杂网络搜索过程的复杂性给搜索过程建模工作带来一定程度的难度,在了解基本概念与复杂网络结构的特性的基础上,主要目的就是为了更好地描述复杂网络动力学行为相关的问题(比如:网络搜索、渗流、传播、相变等)的在个体层和群体层之间的复杂性。本首先综述了复杂网络基本概念与复杂网络模型,同时对复杂网络模型进行比较。
参考文献: