前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的模式识别主题范文,仅供参考,欢迎阅读并收藏。
模式识别与智能系统是20世纪60年代以来在信号处理、人工智能、控制论、计算机技术等学科基础上发展起来的新型学科。
模式识别与智能系统是控制科学与工程的二级学科,以信息处理与模式识别的理论技术为核心,以数学方法与计算机为主要工具,研究对各种媒体信息进行处理、分类和理解的方法,并在此基础上构造具有某些智能特性的系统。
该学科以各种传感器为信息源,以信息处理与模式识别的理论技术为核心,以数学方法与计算机为主要工具,探索对各种媒体信息进行处理、分类、理解并在此基础上构造具有某些智能特
(来源:文章屋网 )
(①济南工程职业技术学院,济南 250200;②山东建筑大学信息与电气工程学院,济南 250101)
(①Ji’nan Engineering Vocational Technical College,Ji’nan 250200,China;
②School of Information and Electrical Engineering,Shandong Jianzhu University,Ji’nan 250101,China)
摘要: 为了准确提取与识别焊缝射线数字成像中焊接缺陷,本文提出了一种基于神经网络的模式识别算法。首先,分析了非线性模式分类的基本原理,通过人工神经网络实现对焊缝内存在的焊接缺陷进行分类;然后,采用缺陷的几何特征作为分类算法的输入数据,并应用神经网络关联标准理论评估鉴别能力,证明了特征提取的质量重要性优于数量;最后,将基于神经网络的主要非线性鉴别分量的识别算法应用于缺陷识别中,并通过大量实验分析与评价其分类性能。实验结果数据证明该算法在焊接缺陷模式识别方面具有较高的效率。
Abstract: In order to extract and recognize welding defects in digital X-ray images, this paper proposes a neural network based on pattern recognition algorithm. Firstly, the fundamental of the nonlinear pattern classification has been analyzed. By means of artificial neural network, the classification of welding defects in welding lines has been realized. Later on, the geometric feature of the welding defect has been adopted for input data. The identification ability was evaluated by neural network association standard theory. It proved that quality was more important than quantity. At last, the neural network based on principal discrimination components has been applied to defect identification and satisfying result has been achieved. The experimental result proved this necognition has high efficiency.
关键词 : 焊接缺陷;缺陷识别;关联标准;非线性模式;神经网络
Key words: weld defects;defect identification;correlates of standard;nonlinear pattern;neural networks
中图分类号:O434文献标识码:A文章编号:1006-4311(2015)25-0115-05
基金项目:国家自然科学基金(61473176,51207083,61473172);山东省优秀中青年科学家奖励基金(BS2013DX045); 山东省高校科研发展计划项目(J13LG52);山东建筑大学博士基金(XNBS1249)。
作者简介:梁玮(1980-),女,山东济南人,博士研究生,主要研究方向为数字射线无损检测及优化算法。
0 引言
数字射线检测较其他方法而言具有较高的图像精度。目前,在对焊接质量进行评价时,尚需采用传统方法,如检验员的目测。这种方法对经验要求较高,发生错误的概率也较高[1-2]。对于数字射线检测缺陷的分类,也有数字智能化的算法应用。其自动检测步骤大致如下:第一,胶片图像数字化或直接进行数字射线图像生成;第二,图像的预处理;第三,焊缝缺陷的识别和分类;最后,检验结果的获取与后处理。
本文使用线性分类算法将神经关联的标准用于研究各种缺陷特征,并证明了特征提取的质量重要性优于数量,以提高分类成功的概率。主要鉴别分量(PCD:Principal Components of Discrimination)算法在其它研究领域比较常用。采用此算法,通过神经网络执行,用于减少输入维数,并且对等级分离区的二维性进行可视化。
1 模式识别及分类算法
1.1 缺陷特征的提取
数字射线图像的噪声一般作为随机分散的像素出现,并且相邻像素值并没有耦合特征。低通滤波器一般用于降低噪声,采用直方图均衡或拉伸的算法对对比度进行优化。从而提高图像的对比度,更容易地检测到焊缝和缺陷[3-4]。
图像进行预处理之后,需要提取焊缝的形状和位置特征。文献[5]提取了10种特征,开发了自动焊缝射线照片检验系统。文献[6]提出采用10种焊接缺陷特征,将特征用于缺陷识别,需要比分类器图像像素处理更少的信息。但是需要非常大的输入空间,计算较为复杂。
本文算法采用四种特征形成系列非线性模式分类数据输入,如下:
①位置(P= h/H):缺陷到焊缝中心的距离(h)之间与发生缺陷的焊缝厚度(H)之比。H用于求焊缝厚度变化的平均值,此类变化经常出现在焊缝射线照片中。
②长宽比(a=L/e):小椭圆的长轴(L)与短轴(e)的比率,相当于此缺陷的面积。
③比例e/A:短轴(e)与缺陷面积(A)之比。
④浑圆度(p2/4πA):缺陷的周长p的乘方与缺陷面积A的4π倍之比。
采用上述特征,形成用于神经网络(输入矢量)的输入数据集。
1.2 基于神经网络的非线性模式分类及关联标准
本文采用双层神经网络模型,分别为中间层和输出层。通过调整中间层神经元的数量,跟踪输出性能和误差,确定最佳神经元数量。得到的结果用神经元数量与误差分类性能图进行表示。在模式分类的一种网络中,输出层中的神经元数量对应进行研究的等级数量。在此情况下,输出包含四个神经元,考虑只有包含一种级别;若输出包含五个神经元,则考虑只有包含两种级别,并且将此夹渣等级分为两种等级:线性和非线性夹渣。所有神经元在一定范围内都是双曲正切型。输入矢量 是一个四维向量,在算法执行中,根据关联标准可降维为3、2或1。
本文采用文献[7]中所述关联标准得到的新结果。此标准基于对网络回复中的变化进行搜索,此时使用的特征用其平均值进行代替。网络回复之间的差异越大,特征的关联就越大[7-9]。将此标准用于评价原来采用的六种特征,由于分类器为线性的,并且只通过双曲正切型神经元执行。采用方程式对关联的标准进行计算如式(1)所示。
1.3 非线性分类的主要分量分析
主要分量分析(PCA:Principal Components Analysis)是一系列多变量数据的有效精简技术之一。它将多维数据通过线性映射在低维中的一种技术,从而减少信息的损失。但是,由于它是一种线性映射方法,故并不适用于非线性的工程问题中。因此,需要借助于主要非线性分量的分析[10-12]。形成主要分量的方法之一就是采用人工神经网络,可以用于减少表示分量。本文借助主要分量用于非线性鉴别,通过神经网络执行,并且已通过误差反向传播算法进行开发,步骤如下:
非线性鉴别的第一个分量由在误差反向传播中训练三层网络中得到。第一层只包括一种线性神经元,并且其余层为双曲正切型神经元,如图2所示。
II类:两种分量也可以通过同时训练得到,也就是说,这两种分量在网络训练期间在它们之间进行合作。通过类似方式可以对3,4或m分量进行相同程序。在此情况下,形成输入空间减少和优化的基础,用于分类。
在有多维度的数据中,很难显示等级分离问题的规模。但是,通过采用两种主要非线性鉴别分量,可以对模式等级进行较好的区分。在此方式中,借助独立起作用的两种,查看一起处理的四种和五种等级的分离图。这些分量通过图2中的神经网络得到,并且采用反向传播误差、瞬时和可变的学习速率进行训练。
将分量p1用作非线性分类器输入矢量,以便用于评价性能,同时也可以采用通过合作行动的两类训练得到的(p1+p2)独立值以及两个分量。
2 实验结果和讨论
2.1 非线性模式分类
为了找到用于非线性分类器中间层的最佳神经元数量,采用在此层中逐渐增加神经元数量的经验标准,然后对分类误差和性能进行观测。同时考虑将夹杂等级分为线性夹杂和非线性夹杂(总共五种等级)如图3(a)所示,若将夹杂只作这一种等级(总共四种等级)如图3(b)所示。注意在第一种情况中,有五种等级,分类器到达最高性能(99.2%)和最小误差,其训练数据针对中间层中的17/18种神经元。对于四种等级,通过10种神经元达到最佳性能(100.0%)。
结果表明,只有一件样品没有明确分类。因此,所有等级的成功概率都大约为100.0%。咬边等级得到的分布实例如图4所示。
2.2 非线性关联标准
根据上述结果,采用这些特征对输入的不同组合进行试验。图5为针对这些特征组合得到的各种结果。通过输入矢量a-e/A-P得到的这些结果,不考虑特征R,在两种情况下(四种和五种等级)都等于通过四种特征得到的结果,从而说明输入矢量的维度仍然可以减少为3维,而不会影响分类器的性能。也对只采用两种特征的可能性进行研究,如图5所示,虽然与使用四种或三种特征相比,性能降低,但是使用非线性分类器时,此分类中的成功率仍然高于90%。
2.3 非线性鉴别的主要分量
图6为独立起作用的两种主要非线性鉴别分量的两个二维图。图6(a)为四种等级的分离,说明咬边和未焊透等级出现在良好定义的区域,因此很容易通过非线性分离器进行分离。气孔和夹渣等级在图中出现混乱区域,并且夹渣的有些观测值位于气孔区域中。这在以前采用线性分类器时已检测到,因为误差分类为这些等级的参考数据。在图6(b)中可以注意到有五种等级,非线性夹渣、线性夹渣与气孔之间的混乱更大,但是这很容易解释,因为夹渣的两种等级之间的区分比较复杂,这是由于其特征类似[13-16]。
图7中的图表表示只采用第一种分量p1作为分类器的输入矢量时得到的性能结果,同时(p1+p2)为独立的分量(二维矢量),并且(p1+p2)为合作的分量(用于两种类型)。
结果表面只采用第一种分量时,有四种等级的训练数据的成功率达到92.0%,在逻辑上有五种等级的更复杂情况的成功率更低(66.4%)。采用两种分量时,成功率非常接近采用三种或四种特征时达到的成功率。这还确定使用的分量类型之间的性能没有显著差。这些结果证明了主要分量减少原始数据维度的效率,并且保持分类成功的较高能力。对于进行研究的这种情况,没有对将规模从三维或四维降低为二维进行判定。但是,这些结果将推动通过更大规模的系统进行类似研究。
3 结论
本文采用二层神经网络及主要分量分析法对数字射线图像中的焊接缺陷进行分类,实验结果表明,无论是四种还是五种等级(夹渣是否分为线性和非线性),均取得了较高的分类效率,算法适用性较好,不依赖于大量经验数据,具有较好的应用前景。
参考文献:
[1]孔凡琴,路宏年.采用数字射线DR成像的焊接质量检测[J].无损检测,2008,30(1):20-22.
[2]梁丽红,孔凡琴,路宏年.X射线非晶硅面阵探测器B级像质的研究[J].无损检测,2005,27(3):113-116.
[3]张晓光,高顶.射线检测焊接缺陷的提取和自动识别[M]. 国防工业出版社,2004.
[4]陶亮,孙同景,李振华,等.基于邻域对比度的X射线数字图像自适应增强法[J].无损检测,2011,33(1):20- 22.
[5]Kato Y, Okumura T, Matsui S, et al. Development of an automatic weld defect identification system for radiographic testing[J]. Welding Word 1992, 30(7): 182-195.
[6]Aoki K, Suga Y. Application of artificial neural network to discrimination of defect type automatic radiographic testing of welds[J]. ISI International, 1999, 39(10): 1081-1097.
[7]Silva RR, Siqueira MHS, Caloba LP, et al. Radiographics pattern recognition of welding defects using linear classifiers[J]. Insight, 2001, 43(10): 669-674.
[8]Silva RR, Siqueira MHS, Caloba LP, et al. Evaluation of the relevant characteristic parameters of welding defects and probability of correct classification using linear classifiers[J]. Insight, 2002, 44(10): 616-622.
[9]Silva RR, Siqueira MHS, Caloba LP, et al. Contribution to the development of a radiographic inspection automated system[C]. 8th European Conference on Non-destructive Testing, June 17-21, Paris, 2002.
[10]Seixas JM, Caloba LP, Delpino I. Relevance criteria for variance selection in classifier designs[C]. International Conference on Engineering Applications of Neural Networks, April 4-6, London, 1996.
[11]Dong D, McAvoy TJ. Nonlinear principal component analysis-based on principal curves and neural networks[J]. Comput Chem Engng, 1996, 20(1): 65-78.
[12] Ang AHS, Tang WH. Probability concepts in engineering planning and design[J]. Basic principles, 1975, 1(5): 575-579.
[13]Mery D, Silva RR, Caloba LP, et al. Pattern recognition in the automatic inspection of aluminium castings[J]. Insight, 2003, 45(7):1-9.
[14]Mery D, Filbert D. Classification of potential defects in the automatic inspection of aluminium castings using statistical pattern recognition[C]. 8th European Conference on Non-Destructive Testing, June 17-21, Barcelona, 2002.
关键词:CDIO;工程教育;主动学习;经验学习
作者简介:袁立(1978-),女,河北邢台人,北京科技大学自动化学院,副教授;李晓理(1971-),男,辽宁沈阳人,北京科技大学自动化学院,教授,博士生导师。(北京 100083)
基金项目:本文系教育部第五批高等学校特色专业建设项目“自动化CDIO特色专业建设”(项目编号:TS2422)的研究成果。
中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)04-0051-02
CDIO是由美国麻省理工学院、瑞典皇家技术学院、瑞典查尔姆斯技术学院、瑞典林克平大学等四所大学从2000年起合作研究探索的一种新型的工程教育模式。CDIO教育模式力图培养学生能够在现代的、基于团队的环境下构思(Conceive)—设计(Design)—实施(Implement)—运行(Operate)复杂、高附加值的工程产品、过程和系统,让其成为成熟、有责任感的人。[1]CDIO改革有三个总体目标,即教育学生,使他们能够更深层次地掌握技术基础知识,不是通过被动的听讲过程获取知识,而是让学生自己构建他们的知识,面对和纠正自身的错误理解;教育学生能够领导新产品、过程和系统的创造与运行,在此过程中培养学生的个人能力和人际交往能力,个人能力包括工程推理和解决问题的能力、科学探索、系统思维和批判性及创造性思维,人际交往能力包括交流沟通和团队工作能力;第三个目标是使学生能够理解和研究技术发展对社会的重要性和战略影响。可以看出,CDIO模式注重扎实的工程基础理论和专业知识的培养,并通过贯穿整个人才培养过程中的团队设计和实践环节的训练,从而培养既有过硬的专业技能又有良好综合素质的国际化工程师。[2]
作为高等工程教育的一种新的教育理念,CDIO模式受到越来越多工程学科的重视。北京科技大学(以下简称“我校”)自动化专业在2009年以自动化专业工程化、钢铁流程自动化为工程背景和专业特色加入了CDIO项目。“模式识别”课程是模式识别与智能系统学科的基础课,是一门基础理论与工程实践相结合的课程。本课程主要讨论统计模式识别的分类和识别基本原理、方法。要求学生掌握统计模式识别的基本概念、基本识别原理和方法,了解其发展动态,有效地运用所学知识和方法解决实际问题,为研究新的模式识别的理论和方法打下基础。[3,4]那么如何在该课程的教学过程中培养学生的综合素质,满足学科学习和能力学习的双重目标,成为需要迫切思考的问题。本文在深入研究和分析“模式识别”课程现有教学模式的问题和不足的基础上,探索将CDIO教育理念引入该课程,进行教学设计、规划教学方案、确定教学手段、安排教学内容和考核方式,以促进学生综合能力的培养。
一、“模式识别”课程传统教学模式中存在的问题
“模式识别”课程从应用角度来看,属于人工智能、机器学习的领域,从学术内涵角度来看是进行数据处理、信息分析的学科。该课程在纵向上与概率论、数理统计密不可分,在横向上注重与数字图像处理、信号处理、通信原理等专业课程有关联。可见,该课程对于巩固已学知识、开展后续专业课学习及未来工作具有积极的指导意义。
该课程内容本身比较抽象性,其概念、原理和方法都隐藏在数学符号中,讲课过程中学生往往会感到枯燥、难懂。教师的讲解和学生的学习难度都比较大,理论知识学完后学生对于其实际应用有时仍是一头雾水。传统教学模式下存在以下一些问题:在教师的授课环节中,往往以教师的授课为中心,而不是以学生为主体,这种重“教”轻“学”的模式不利于学生对基础知识的掌握;课时的安排上,总课时(32学时)中28学时为理论授课,4学时为实验。在实验环节中,学生上机动手编程,根据课上内容设计相应的分类器实现。这种课时安排不利于充分开展工程项目实践活动,使学生失去了了解模式识别在工程项目中真实应用的机会,限制了其对专业技能的掌握;在实验环节中,实验内容的安排基本上以个体为单位的验证性实验为主,缺乏多人合作的设计性、综合性及创新性的实验,不利于学生团队协作能力、批判思考能力、综合解决问题能力及创新能力的综合培养。
可见,以上重理论轻实践、强调个人学术能力而忽视团队协作精神、重视知识学习而轻视开拓创新的培养模式与CDIO理念还有很大差距。
二、基于CDIO的“模式识别”课程教学改革探索
针对目前“模式识别”课程教学中存在的问题对原有的课程体系进行改革,以适应CDIO教育模式下的人才培养目标。我校按照CDIO教学大纲的标准来进行教学设计和教学活动的安排,进行如下一些主要的变革:
第一,从教学内容的安排上进行改革。在教学过程中优化、精选教学内容,确保教学内容相对稳定而又不断地更新,保持内容的先进性。对基础理论部分如贝叶斯决策理论、线性与非线性判别函数、近邻法和集群、聚类分析、特征提取与选择等知识单元,将主要精力放在精讲、训练与总结这三个环节,对重点、难点讲深讲透。此外,还根据模式识别领域最近的发展,引入最新科技成果,为学生适当补充统计理论与支持向量机、流行学习理论和稀疏编码理论等知识。另外,还从横向上注重与同一层次相关课程(如“数字图像处理”)的关联性,使学生把从不同课程上学到的知识整合起来,为将来从事工程项目活动打下基础。
第二,从教学方式上进行改革。传统授课方式的一般模式是:教授、复述、周作业、期末一个小的设计项目和最终笔试。要改变这种以教师为中心的教学方式,按照CDIO专业计划中提倡的一体化学习的思想来完成教学任务。为了考试而死记硬背理论知识会使学生对学习内容理解肤浅,缺少长期学习的积极性。所以在教学中采用主动学习方式使学生直接参与思考和解决问题的活动,让学生思考概念,特别是新的想法,并要求他们做出明确地反应,使他们明白学到了什么和怎样学习的。
主动学习方法在课堂教学中有许多灵活的手段,比如授课疑点卡、概念问题、小组讨论等等。授课疑点卡通过收集课堂上的反馈来测定学生在理解方面的不足。针对学生提出的问题,教师可以在课程的网页上回答,也可以在下次课的开始时回答。对学生来讲,写下问题的过程有助于他们组织思路并进行更有效地学习;对教师来讲,这些疑点卡能及时纠正学生的错误的理解,并帮助教师改进后续的内容。概念问题是一个多项选择题,用来收集学生对课堂上的反馈,从而了解学生是否理解教学内容并纠正学生的误解之处。教师在课前把“模式识别”的重要概念以及通常可能的错误理解准备成问题,在课堂上适时提出来,学生通过举手来回答即可。根据回答情况,学生可进行讨论或由教师进行点评。小组讨论:对于一些相对简单的内容,让学生提前预读,在课上采用分组讨论、学生讲解、教师总结的方式进行。
第三,采用经验学习法为学生创造建立信心的机会。工程教育的CDIO教学模式正是基于经验学习理论的。经验学习让学生能够在模拟工程师角色和工程实践的环境中进行教学活动。对大多数学生而言,学习和理解理论的动力就是应用理论并与实践相结合。通过实践学习能激发他们更大的积极性,并使他们认识到所学的知识是有用的,学习积极性的提高使他们对所学的知识和即得能力更有信心。其结果是让学生有能力胜任未来工程师的角色。
常用的经验学习方法就是基于项目的学习。在授课过程中增加模式识别应用项目的内容,如字符识别、车牌识别、人脸识别、肤色分割、图像检索等,通过项目讲解帮助学生回顾所学的知识,并将理论与实际相结合,使学生学会分析和解决实际问题的方法。另外,还将教师从事的与“模式识别”相关的科研项目介绍给学生,拓展学生的知识面。从实际效果来看,有些学生对实际工程案例和科研工作很感兴趣,主动申请“模式识别”方向的本科创新项目和发表学术论文。
对于一些典型的“模式识别”工程项目,学生分团队后选择某个工程项目,以团队合作方式收集和整理有关信息资料,提出解决方案,研究结束后做出演示系统并在课堂上进行讲解。
第四,对学习效果的评估方法进行改革,采用多种方法来收集学生在课程学习期间和学习之后等不同时期的学习证据,全面了解学生的学习成绩和学习态度有何转变。第一种方式仍然是传统的笔试。第二种是口试,可以用于概念问题来判定学生对知识的理解层次。口头考核能从深层次上反映学生对概念的理解和应用,因为现实中工程师每天都会应用基础概念进行理性表述,这种方式可以评估学生进行理性表达的能力。第三种是表现评分,通过学生在口头演讲和团队工作等特定任务中的表现情况来进行评估。第四种是项目审查,对团队完成的项目进行评估。模式识别项目主要是从分类性能上对学生完成的项目进行评估。
结合CDIO教育模式,通过以上四方面的改革,能够创设积极的学习情景,激发课堂活力,调动学生的积极性和主动性。这套新的教学体系可以用图1来描述。
三、结束语
本文在CDIO工程教育模式下,探讨了如何对传统“模式识别”课程教学方法进行改革,提出了一种新的教学体系。近两年的授课结果表明,新授课体系在CDIO模式下对激发学生学习兴趣、明确学习方向、转变学习态度、提高专业基础水平和团队合作意识及提高教学效果等方面发挥出了明显的积极作用。
参考文献:
[1]顾佩华,沈民奋,陆小华.重新认识工程教育——国际CDIO培养模式与方法[M].北京:高等教育出版社,2009.
[2]陆鑫,任立勇,王雁东.CDIO模式下软件工程专业课程的教学评价方式[J].计算机教育,2011,(16):64-67.
船舶运动模式的提取是轨迹数据分析的重要任务,它可以为船舶异常行为的检测提供参考依据,同时也可以作为航路规划和定线制设计的技术指标.针对现存的聚类算法大多为了追求效率而忽略了运动轨迹特征的问题,对聚类算法中的轨迹结构距离进行改进,将其作为轨迹相似度的评价标准.采用无监督DBSCAN聚类算法实现船舶运动模式的提取.利用琼州海峡船舶自动识别系统(AutomaticIdentificationSystem,AIS)数据,对该水域的船舶运动模式进行提取,获得行驶于该水域的船舶运动轨迹分布以及各类轨迹中转向区域的分布,其中船舶运动轨迹包括从琼州海峡东峡口向西航行的船舶轨迹,从琼州海峡西峡口向东航行的船舶轨迹,从秀英港前往海安港的船舶轨迹,从海安港前往秀英港的船舶轨迹和从琼州海峡东峡口前往海口港的船舶轨迹.将最终的聚类结果应用于电子海图显示与信息系统(ElectronicChartDisplayandInformationSystem,ECDIS)上,实现了对船舶的动态监控仿真.
关键词:
船舶自动识别系统(AIS);模式识别;聚类分析;电子海图显示与信息系统(ECDIS);琼州海峡
中图分类号:U697.33
文献标志码:A 收稿日期:20150907 修回日期:20151102
0引言
随着全球船舶自动识别系统(AutomaticIdentificationSystem,AIS)岸站的建立和不断完善,各地海事主管机关时刻都能接收到大量有关船舶信息的数据.对这些数据的研究可以帮助我们提取船舶运动模式,分析船舶行为,从而进一步挖掘不同航线船舶、不同类型船舶的运动特点.例如:在一些运量较大的港口附近,对船舶运动轨迹进行分类能够帮助监控人员识别异常行为;根据渔船运动的无规律性和货船运动的周期性,利用聚类结果区分船舶种类,判断运动特征是否与船舶类型相符,是否需要进一步的监控和调查.此外,船舶运动轨迹的聚类分析能够为航路规划和定线制的设计提供理论依据,有利于加强船舶动态监控,提高海事监管的效率.
目前国内外学者提出了诸多从目标对象的轨迹中获取运动模式的方法.SHU等[1]利用自组织映射网络作为预处理技术标记行人的运动特征,然后采用后向算法建立马尔科夫模型,实现了对人行为模式的提取;胡宏宇等[2]以改进的Hausdorff距离作为相似度标准,采用谱聚类算法实现了对车辆轨迹空间分布的提取;闻佳等[3]利用加权的Hausdorff距离和周分割算法实现了车辆轨迹的聚类;RISTIC等[4]基于港口信息,采用核密度估计的方法对船舶轨迹进行分类;ETIENNE等[5]提出了一种基于统计学和图论的轨迹聚类分析方法,该方法将船舶的起讫港作为节点,将相似轨迹归一化为特定的有向路径;AARSETHER等[6]采用图像匹配的方法对船舶轨迹进行聚类;GERBEN等[7]对提取船舶运动模式的两种主要的相似度对比的方法进行了分析,总结出二者中更适合于船舶轨迹聚类的方法;ANDERS等[8]将轨迹聚类应用于近海监控系统来识别船舶的异常行为;LAXHAMMAR等[9]通过高斯混合模型和核密度估计的方法对船舶运动进行统计分析,获得有异常行为的船舶数据.此外,神经网络和以K均值为代表的无监督聚类方法也被广泛应用于轨迹聚类,如JONHSON等[10]建立自组织特征映射网络学习轨迹分布模式,ATEV等[11]则利用K均值算法完成对轨迹的聚类.
海上交通与陆路交通有一定的相似性.道路被划分为单行道、双行道等,而航路也被划分为单向航路和双向航路.虽然海上交通的航行范围广阔,但在某些特定水域(港口、通航分道、狭水道)船舶密度较大,轨迹分布较密集.鉴于此特点,应用在陆路交通上的一些方法也可以应用到海上交通,以提高海上交通的监管力度和效率.
1AIS数据的预处理
由船舶交通管理中心(VesselTrafficServicecenter,VTS)提供的AIS数据通常具有较高的可信度,但是AIS数据中的船舶位置、船舶速度等信息会由于设备以及信号漂移等原因发生较大的改变,如AIS数据显示船舶位于陆地上,显示航速为35kn甚至更高[12].
为保证数据的可用,需要对数据做预处理,具体方法如下.
2轨迹聚类
移动目标轨迹的聚类能否取得良好的效果,在于轨迹间的相似性度量是否合理.当前主要的相似性度量的方法有基于欧氏距离的算法、基于公共子序列的算法、基于动态时间弯曲距离的方法和基于Hausdorff距离的方法,其中基于欧氏距离的算法通常用于计算等长的船舶轨迹相似性,其他的几种方法可以用于不同长度的船舶轨迹相似性计算.以上方法都仅从距离方面反映相似度,而基于轨迹结构距离的相似性度量方法的优点在于能够刻画每条子轨迹变化的趋势.因此,为便于度量船舶轨迹的变化,需要将整条轨迹划分成若干条子轨迹.
2.1轨迹分割
船舶轨迹的划分是通过设置船舶转向角的阈值实现的.船舶轨迹转向角是指相邻两个子轨迹段的航迹向之差,见图1.
图1中,a,b为轨迹中的两条子轨迹段,其航迹向的夹角为θ1,即为这两条子轨迹的转向角.鉴于AIS数据的位置坐标采用的是WGS84坐标系,利用恒向线直接反解算法[13]求得两条子轨迹段的航迹向,根据其航迹向的差值可以获得船舶子轨迹间的转向角.
恒向线直接反解算法的步骤如下.
2.2轨迹结构相似性度量
船舶子轨迹段相似性计算从子轨迹段的航迹向和两条子轨迹段间的距离两个方面进行.对两方面的度量结果赋以一定的权重求和,形成轨迹的结构距离.
(1)船舶航迹向的比较.
如图2所示,Li,Lj表示两条航迹线,θ表示航迹段的方向夹角,J表示Lj相对于Li的偏转程度.
航迹向对比方法为
通过上式不难发现:当夹角为0°时为最佳状态,即两条子轨迹方向完全一致;当夹角大于90°时可以认为两条轨迹基本反向,将两条轨迹的距离设置为无穷大,这样有利于区分航向相反船舶的轨迹.
(2)位置的比较.
本文在两条子轨迹段间距离的度量方面所采用的相似性度量方法为基于Hausdorff距离的方法:
式中:P(Li,Lj)为两轨迹间的位置距离;h(Li,Lj)为两轨迹间的直接Hausdorff距离;d(a,b)为a与b之间的欧氏距离.
船舶轨迹结构是指船舶轨迹所具有的属性的集合,这些属性刻画了船舶轨迹的特性和状态.船舶轨迹结构通常包含船舶运动信息,如:船舶的航迹向、船舶的位置.同时,在实际应用中还可以加入速度以及波动性的度量.进行轨迹相似性的比较时,充分考虑这些因素可以提高聚类的精度[14].依照式(8)和(9)可以求得子轨迹航迹向以及子轨迹间距离相似度.为计算轨迹结构的相似性,还需设定他们在轨迹结构中所占的权重W=(WT,WP),其中WT表示角度距离权重,WP表示位置距离权重.各权重值设定应满足:权重值之和应为1;各权重值应为非负,同时不能大于1.通常情况下采用的是将结构距离中的权重平均分配.式(11)和(12)分别为结构距离和相似度计算方法.
2.3聚类算法
基于轨迹结构距离的聚类算法是以DBSCAN算法为框架的,即从子轨迹集合中任取一条轨迹并判断在其邻域半径内是否包含满足要求的最小实体数.如果满足以上述条件,则认为是核实体,并搜索该实体的密度可达对象,标记为一类,直至子轨迹集合全部扫描完毕,未被标记的子轨迹则是孤立轨迹.具体的实现方法如下.
步骤1设定权重W,转向角阈值ω,近邻阈值η,近邻的数目ε.
步骤2根据ω将轨迹T分割成若干个子轨迹Ti.
步骤3对子轨迹段Ti,计算其与未标记的子轨迹段的D和N,若满足D和N条件的轨迹数目大于ε则将该子轨迹段标记为核心子轨迹段.
步骤4将Ti子轨迹段距离范围D内满足N条件的子轨迹段Tj与Ti聚为一类.
步骤5对Tj重复步骤3和4,将满足条件的子轨迹段继续归为一类,如果Tj不再满足上述条件,则重新从子轨迹集合中选取未被聚类的子轨迹段重复步骤3和4.直至轨迹集合全部扫描完毕.
3琼州海峡应用实例与应用
琼州海峡位于雷州半岛与海南岛之间,宽10~20nmile,长50~60nmile,是广州港、湛江港等港口与北部湾各港口海上交通的捷径.琼州海峡主要可分为3部分,分别为:琼州海峡东口,包括外罗水道、北水道、中水道和南水道;琼州海峡西口,包括灯楼角与临高角联线以西、兵马角所在经度线以东水域,该水域是来往于琼州海峡驶往八所港、三亚港等地的转向点,也是往北部湾各港口的转向点;琼州海峡中部,包括山狗吼灯塔经度线以西、灯楼角与临高角联线以东水域,该水域的水较深(20~118m),碍航物较少.
算例采用32位WIN7系统、2GRAM,在VS2010编译条件下提取750条船舶运动轨迹进行聚类,获得了5类结果,见图3.A类结果为从琼州海峡东峡口向西行驶于通航分道内的船舶的航行轨迹分布、B类结果为从琼州海峡西峡口向东行驶于反向航道的船舶的航行轨迹分布、C类结果为从海安港到秀英港的船舶的航行轨迹分布、D类结果为从秀英港到海安港的船舶的航行轨迹分布、E类结果为琼州海峡东峡口向西行驶进入海口港的船舶的航行轨迹分布.
3.1算法分析
为比较算法的优劣,将基于轨迹结构距离的DBSCAN算法与传统的DBSCAN算法进行对比,结果见表2.
表2算法对比结果
从表2中可以看出,基于轨迹结构距离的DBSCAN算法在运行时间方面劣于传统的DBSCAN算法,但是在分类结果和准确度方面皆优于传统的DBSCAN算法.这是因为:基于轨迹结构距离的DBSCAN算法需要进行轨迹的分割、角度的度量、归一化等操作,增加了计算复杂度;该算法以轨迹特征为参考,从多方面计算轨迹相似度,易发现比较隐蔽的轨迹群,使其聚类效果优于传统的DBSCAN算法的聚类效果.
3.2聚类应用
将上述所获得的船舶轨迹聚类的结果应用到船舶监控、异常检测上,能够大幅度提高海上安全保障能力,防止海上交通事故的发生[15].
3.2.1速度监控
速度监控是利用监控水域的AIS信息,对聚类结果中的船舶速度进行统计,获得船速分布图.根据实际工作中的经验和需要,确定行驶于该监控水域的船舶速度监控范围.图4是对从琼州海峡东峡口航行至海口港的船舶速度统计.对于该监控水域,本文以80%船舶运营速度(9~14kn)为标准.
图5为监控系统的速度报警,可以看出编号为A的船超速,说明该船航速不在监控航速范围内,予以报警.
3.2.2位置监控
位置监控主要是对航行于聚类结果区域的船舶进行船位的实时监控,如果船舶偏离监控水域,本船和监控系统应给予报警和提示,提醒监控人员和船舶驾驶员关注船舶动向.图6a为本船的位置报警示意图,图6b为监控系统的位置报警示意图.
3.2.3航向监控
航向监控主要利用AIS数据对聚类结果中船舶航向进行统计,获得船舶的航向分布,以此作为监控依据.图7a是对从琼州海峡东峡口到海口港的聚类结果中船舶转向后的航向统计结果.图7b和7c为本船和监控系统的航向报警示意图.
综上所述,可以得到船舶监控的实现流程图(图8),首先对进入监控水域的船舶进行位置监控(若偏离监控水域则报警),然后进行速度监控(判断速度是否超出规定范围,如果超出则进行速度报警),接着进行航向的监控直至船舶驶离监控水域.
4结论
本文利用轨迹结构距离作为相似性的度量标准,对轨迹段间的相似性进行评价,采用无监督的DBSCAN算法将相似性接近的船舶轨迹归为一类,实现了对船舶运动模式的提取.以琼州海峡为例,利用预处理过的部分琼州海峡AIS数据,将航行于该水域的船舶轨迹分为5类,分别为从琼州海峡东峡口向西航行的船舶轨迹、从琼州海峡西峡口向东航行的船舶轨迹、从海安港到秀英港的船舶轨迹、从秀英港到海安港的船舶轨迹以及从琼州海峡东峡口向西航行进入海口港的船舶轨迹.从琼州海峡东峡口向西航行的船舶轨迹位于(20°14′25″N,110°26′20″E)与(20°09′05″N,110°01′24″E)之间的通航分道内;从琼州海峡西峡口向东航行的船舶轨迹分布于(20°13′N,110°26′20″E)与(20°06′45″N,110°01′24″E)之间的通航分道内;从琼州海峡东峡口向西航行进入海口港的船舶轨迹,其转向位置大约发生在以(20°10′16″N,110°14′08″E)为圆心,半径为0.5nmile的水域范围内.将聚类的结果与ECDIS模拟器相结合,从船舶位置、速度、航向等3个方面实现了船舶动态监控的仿真.实验证明船舶运动模式识别能够有效地应用于船舶动态监控,进而保障航行安全,增强海上安全保障能力.
参考文献:
[1]SHUHM,KATSU.TraininghiddenMarkovmodelstructurewithgeneticalgorithmforhumanmotionpatternclassification[C]//SCIICASEInternationalJointConference.Busan:IEEEPress,2006:618622.
[2]胡宏宇,王庆年,曲昭伟,等.运动目标空间模式识别与异常行为检测[J].吉林大学学报,2011,41(6):15981602.
[3]闻佳,崔维.实时视频中的车辆运动轨迹的提取和聚类[J].计算机工程与应用,2010,46(11):155157.
[4]RISTICB,SCALARL.StatisticalanalysisofmotionpatterninAISdata:anomalydetectionandmotionprediciton[C]//11thInternationalConferenceonInformaiton.Fusion,Cologne:IEEEPress,2008:17.
[5]ETIENNEL,DEVOGELET.Similarityanalysisofmobileobjectstrajectoriesfollowingthesameitinerary[J].IngenierieDesSystemesD’information,2009,14(5):85106.
[6]AARSETHERKG,TORGEIRM.EstimatingnavigationpatternsfromAIS[J].JournalofNavigaiton,2009,65(4):587607.
[7]GERBENKDV,MAARTENVS.Ananalysisofalignmentandintegralbasedkernelsformachinelearningfromvesseltrajectoris[J].ExpertSystemswithApplications,2014,41(2):75967607.
[8]ANDERSD,LARSN.Trajectoryclusteringforcoastalsurveillance[C]//10thInternationalConferenceonInformationFusion.Quebec:IEEEPress,2007:18.
[9]LAXHAMMARR,FALKMANG,SVIESTINSE.AnomalydetectioninseatrafficacomparisionoftheGaussianmixturemodelandthekerneldensityesimator[C]//12thInternationalConferenceonInformaitonFusion.Seattle:IEEEPress,2009:756763.
[10]JOHNSONN,HOGGD.Learningthedistributionofobjecttrajectoriesforeventrecognition[J].ImageandVisionComputing,1996,14(8):609615.
[11]ATEVS,MASOUDO,PAPANIKOLOPOULOSN.Learningtrafficpatternsatintersectionsbyspectralclusteringofmotiontrajectories[C]//IEEEInternationalConferenceonIntelligentRobotsandSystems.Beijing:IEEEPress,2006:48514856.
[12]QUXB,MENGQ,LISY.ShipcollisionriskassessmentfortheSingaporestrait[J].AccidentAnalysisPrevention,2011,43(3):20302036.
[13]史国友,朱公志,贾传荧,等.恒向线主题直接正反解的高精度算法[J].大连海事大学学报,2009,35(2):59.
关键词:模式识别;语音识别;交互式语音应答;司法社区矫正
中图分类号:TP391.41 文献标识码:A
Abstract:Systematic research was done on the specific algorithm for speech recognition in using genetic algorithm to train continuous hidden Markov mode. Then the detailed design of Voiceprint Recognition System of Community Correction Objects in the Shenzhen City Bureau of Justice has been done based on the speech recognition technology. The system running results show that the recognition rate of recognition algorithm using genetic algorithm to train continuous hidden Markov model is faster and has a higher rate of recognition. Construction of voiceprint recognition system of judicial community correction objects based on pattern recognition is still in the junior stage in our judicial system, and promotion and the construction of voiceprint recognition system of judicial community correction objects have the important practical significance.
Key words:pattern recognition;speech recognition;interactive voice response;judicial community correction
1 利用基因算法训练连续隐马尔柯夫模型的语音识别以及具体算法
作为模式识别重要应用之一的语音识别技术所涉及的领域包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。
隐马尔柯夫模型(Hidden Markov Model,HMM)方法是二十世纪70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破,现已成为语音识别的主流技术[1-4] ,该方法在语音识别时识别速度较快,也有较高的识别率。目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。可见HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音模型。
在HMM(隐马尔柯夫模型)中,分为离散HMM(DHMM)和连续HMM(CHMM)。由于CHMM直接以帧语音特征向量本身为观测序列,而不是像DHMM那样先将语音特征向量经矢量量化为观测符号,因此CHMM有优于DHMM的识别精度。然而,由于CHMM参数多,传统的训练方法采用迭代法,先假设初始值,用语音信号的观测序列对该初始值进行训练,也即按照一定的方法对这些估值进行提纯,对提纯了的估值要接着进一步的提纯,直到再没有改进的余地,达到某个局部最佳值为止。传统的训练方法不保证训练得到全域最优解,而且训练所需要的时间非常巨大。
本文侧重地研究了基因算法[5],并按照CHMM的特点构造染色体,用基因算法对CHMM进行训练。基因算法自身的特点使得训练结果趋向于全域最优解。同时,由于只需要用Viterbi算法计算语音的观测序列对某一CHMM模型的相关概率,用作基因算法的适应函数,故该算法可以提高CHMM的训练速度。
基因是生物学概念,之所以将基因算法引入HMM的训练中,是因为HMM的训练过程实际上是一个在特定范围内将HMM模型进行一次次的迭代提纯,选择最优模型的过程。将基因算法引入CHMM的训练,就是基于将CHMM看作在特定域的有约束的寻找最佳匹配点的问题。CHMM的状态转移矩阵A和输出概率密度函数中的混合系数c矩阵的每一行向量之和为1.0,可看作是优化问题的约束条件。如果在选取CHMM的初始值时,不是选取一个初始值,而是选取一组分布于不同区域的初始值,以某一种特定的训练方法,使其趋向于全域最优解,那么最终也同样可以完成对CHMM的训练。
根据待优化问题的数学模型,定义适合函数F(ai)。其中ai是某一条染色体,则适合函数F(ai)就是该染色体与目标函数的距离,或是判断该染色体优劣的依据。对每一代基因,计算所有染色体的适合函数,进行排序选择一定数目较优秀的染色体,作为生成下一代基因的父代样本。自然界中染色体成对出现,时一对染色体分离、重组。多点交叉在实现时,可以设定交叉概率门限为ρc。染色体的长度为L,对于随机数0≤rj≤1 (j=1,2,…,L),如果rj≥ρc,那么下一个变量属于另一条基因,否则下一个变量与前一个变量属于同一条基因。
最佳基因是在一代一代的基因重组和基因突变中形成的,是在选择的作用下最适应的个体。基因突变有利于从局部最佳处跳出,防止算法的过早收敛。设定突变概率门限为ρm,对于随机数0≤rj≤1 (j=1,2,…,L),如果rj≤ρm,那么染色体中第j个变量有突变现象发生;否则,复制原染色体的第j个变量。
基因算法的具体实现步骤参考文献[5]。
HMM是用一个有限状态系统作为语音特征参数的生成模型,每个状态能产生连续的输出特征。HMM实际上是一个特征参数发生器,依据其产生的参数与观察到的语音参数的比较,从而识别语音。在识别时的判决依据是HMM模型的生成概率。
在将基因算法引入CHMM训练的过程中,首先要解决的是染色体的构造问题。将CHMM模型的所有关键特征参数排列成一串,构成染色体。对于语音识别,采用自左向右的HMM模型,本文中为5状态自左向右只含一阶跳转的CHMM模型。CHMM模型中参数由初始状态向量π,状态转移矩阵A和每个状态的输出概率密度函数组成。
在CHMM模型中,染色体前一部分的行向量之和均为1。也就要求在产生染色体时,需对其进行一定的控制。在生成每一代染色体时,对这一部分行向量所对应的每一段染色体进行归一化,则可以满足CHMM的约束条件。
Viterbi算法在通常的CHMM语音识别中是作为识别算法的,换句话说,使观测序列与CHMM模型经Viterbi算法的运算结果最大即为优化目标。基于这样的思想,基因算法的适合函数为:所有该CHMM对应的观测序列用Viterbi算法求其观测概率之和,运算结果越大,则该染色体越优秀。
在实验中染色体的前一部分依概率进行二点或多点交叉,而后一部分染色体只进行多点交叉,多点交叉概率ρc=0.8。染色体前一段的基因突变概率ρm=0.1;而对于染色体的后一部分,取ρm1=0.01,对应于以一个参数为单位发生基因突变;ρm2=0.08,以行向量为单位发生基因突变。经基因交叉或基因突变后,对染色体的前一部分需要进行各行向量的归一化处理。每一代基因的数目为300,从中选出60条优秀的染色体作为新的父代基因,经基因重组和基因突变生成240条染色体,共同组成新一代染色体。CHMM模型的训练问题现已转化为求其对观测序列适应概率最大值的问题,用基因算法求解。
训练数据取自博域通讯一体化呼叫中心平台产品BYICC2.0的IVR服务器在实际商业运行中产生的WAV录音文件2000个。
2 利用基因算法训练连续隐马尔柯夫模型的语音识别技术在深圳市司法局社区矫正声纹识别系统中的应用介绍
2.1 司法社区矫正的需求背景以及存在问题
司法社区矫正,是指将社区矫正对象置于社区内,由专门的国家机关负责并组织社会力量对其采取监督管理、教育、帮助措施,矫正其犯罪心理和行为恶习,促进其顺利回归社会的非监禁刑罚执行活动。尽管目前我国社区矫正工作中较普遍地应用了信息化管理手段,根据社区矫正的刑罚执行性质和非监禁特征,各地积极探索运用手机定位等现代科技手段加强对社区矫正人员的实时监管,具体的监管手段包含:手机实时定位监控、电子地图越界告警、人机分离抽查等。现阶段,很多司法社区矫正工作中应用到了诸如手机实时定位监控等高科技手段来实现对社区矫正人员的监控,但在具体操作中仍然存在一些问题和障碍,主要在现有手机定位监控的技术下,难以有效控制人为出现的“人机分离”现象。现有“人机分离”抽查手段主要有:电话抽查、短信抽查、拍照抽查等。虽然一定程度上降低了矫正对象“人机分离”的风险,但这些抽查手段皆无法确保是否为矫正对象本人,有脱管、漏管的可能性。
正是基于以上原因,博域通讯推出的社区矫正声纹识别系统的主要功能是通过远程电话录音来对社区矫正人员进行身份认证,结合手机定位监控系统,促进社区矫正工作向合理化、人性化、智能化、效率化方向发展,推动社区矫正信息化建设,并有效破解移动定位监管“人机分离”的难题。
2.2 深圳市司法局社区矫正声纹识别系统设计
2.2.1 系统应用体系架构
社区矫正声纹识别方案中,包括声纹识别系统、IVR自动语音服务系统并结合现有的手机定位系统以及后台管理系统,同时,声纹识别服务也涉及到了数据库服务器之间的数据通信。
2.2.2 系统网络架构
被矫正人员通过拨打固定电话号码接入社区矫正声纹识别系统,由内置电话语音板卡的IVR服务器将采集到的客户语音,并通过调用声纹服务器提供的接口函数与声纹识别服务器进行交互。声纹服务器将识别的结果反馈给IVR服务器以便进行相应的IVR语音流程控制,同时,社区矫正声纹识别系统将被矫正人员的声纹身份识别结果反馈给手机定位系统。其网络拓扑结构图如图3所示。
2.2.3 系统业务流程
深圳市司法局社区矫正声纹识别系统与现有手机定位系统结合后的主要业务流程如下图:
2.2.4 系统运行结果主要指标
利用基因算法训练连续隐马尔柯夫模型的语音识别的司法社区矫正声纹识别系统已于2014年1月在深圳市司法局上线投入运行。
声纹识别技术在实际应用中,会根据说话人识别内容的不同分为文本相关验证和文本无关验证。深圳市司法局社区矫正声纹识别系统,支持这两种方式的验证,根据实际工作和业务的需要,用户可以选择适合自己的声纹验证方式。
同时,与手机实时定位监控、电子地图越界告警、电话抽查、短信抽查等传统监管手段相比较,语音识别技术有效地控制了司法社区矫正中人为出现的“人机分离”现象。
3 结束语
模式识别从20世纪20年展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。基于模式识别技术的司法社区矫正声纹识别系统能够有效地破解移动定位监管“人机分离”的难题,其建设工作在我国司法系统目前尚处于起步阶段,推广和建设司法社区矫正声纹识别系统具有重要的现实意义。
参考文献
[1] 刘伯高.化工过程推断估计的若干问题研究[D].华东理工大学博士论文.华东理工大学图书馆,2000.
[2] 王岚,陈晶,王睿,等.几种模式识别方法在生物信息中的应用[J]. 计算机与应用化学,2007,(1):8-12.
[3] 杨海峰,张德祥.模式识别理论和技术在语音识别研究中的应用[J].合肥学院学报:自然科学版, 2009,(1):40-46.
本文在分析输配电线路安全运行存在问题的基础上,分别从在输配电线路的管理中积极运用信息技术;强化输配电线路的技术管理等方面对输配电线路的安全运行技术进行了探讨。
【关键词】输配电线路 安全运行 问题 措施
输配电线路是一种将电力用户与供电系统连接在一起的电力传输设施,其运行安全与否直接决定着电力系统的运行质量,从而直接影响到我们乌鲁瓦提水力发电厂的经济效益。近年来,随着输配电线路事故发生率节节攀升,对人们的生命安全造成严重威胁。因此,为了确保乌鲁瓦提水力发电厂的正常运行以及用户用电的正常,我们必须采取相应维护措施,加强输配电线路的安全运行。结合多年实践经验,笔者从以下几个方面对此问题进行探究。
1 输配电线路安全运行的问题分析
在实际运行过程中,输配电线路所处的环境较为复杂,影响其安全运行的因素(见表1)也较多。笔者结合自身多年一线实践经验,分析、总结输配电网安全运行中存在的问题。
2 提高输配电线路安全运行的措施探究
2.1 在输配电线路的管理中积极运用信息技术
科技是第一生产力,在任何行业都如此。如果能够熟练运用最新科技产物将给整个输配电线路的管理工作带来极大便利。信息技术在配电网中的应用主要在管理设备、检测运行状态、管理用电等方面。安全问题一直都是电力行业的重点,要保证电力设备的安全状态必须对其进行实时监控,对出现的异常及时的进行分析排查。例如我们可以用绝缘系统为例来说明信息技术对配电网的重要作用。对电力设备来说,决定其使用年限的重要因素之一就是绝缘材料,它的使用寿命将直接决定设备的使用寿命。绝缘系统在工作过程长期暴露在电、物理、化学、自然灾害等不可抗的损害之下,将不可避免的逐渐老化,严重影响其使用性能。在严重的情况下,甚至会出现绝缘缺陷的严重问题,一旦这些问题没有及时发现并进行有效改进措施,将会引起运行障碍甚至引发安全事故。而信息技术可以自动实时监控配电网络中的各个设备和线路,一旦参数出现异常,信息技术都将可以在第一时间发现并排查,以最快的速度恢复正常。提高供电网络的可靠性。对配电网进行信息技术管理可以提供以下管理功能:
(1)输配电线路内出现故障时可以及时发现,隔离并排查恢复。
(2)整个恢复过程由电脑自动化全程控制。
(3)在输配电线路进行故障维修或维护时,能自动实现负荷平衡的配电网供电过程。
(4)对输配电线路的监控数据都显示在配有街区线路图的显示器上。
(5)可以提供用户与设备连接的信息。
(6)各种数据显示结果与检测报告可以纸质化。
(7)为进一步保证安全配电,可以为相关工作人员提供比较真实的培训演练过程。
2.2 强化输配电线路的技术管理
输配电线路的安全管理是一项涉及项目多、技术要求高、更新速度快的系统工作,在配电网的实际运行维护阶段,工作人员应积极引进和运用先进的科学技术,强化输配电网的技术管理。目前,在输配电网的运行过程中往往需要用到以下技术,如表2所示。
3 结束语
总而言之,维持输配电线路的安全运行是一项长期、系统的工作。输配电线路的正常运行是保证电力系统安全运行的关键,也是用户正常用电的安全保障。因此,对输配电线路进行安全管理是极为重要的。但是当前我国在输配电线路的安全运行和管理中还存在一定的不足之处,给输配电线路的安全运营带来了隐患。这就需要电力工作人员在日常的工作中及时发现不足,并采取一定的措施如做好日常安全管理;强化输配电线路的技术管理;在输配电线路的管理中积极运用信息技术,全面保证电力系统的安全可靠运行,给人们营造一个安全的用电环境,不断提高人们的生活品质。
参考文献
[1]吴若愚,彭学洪,张雷.输配电线路的安全运行问题与对策[J].企业技术开发(下半月),2014(06).
[2]程浩.对输配电线路安全运行的探究[J].中国科技信息,2013(15).
[3]刘达应.输电线路人为因素外力破坏原因分析和应对措施探讨[J].中国科技博览, 2011(35).
[关键词] 牛胆粉;胆汁酸;高效液相色谱;蒸发光散射检测器;化学计量学
[Abstract] An HPLC-ELSD method with good specificity and good accuracy was used for the studies of fingerprint and quantification of multi-components for cattle bile powder. The chromatographic analysis was carried out on a Phenomenex Gemini C18 column (4.6 mm×250 mm, 5 μm) with a column temperature of 40 ℃ and a liquid flow-rate of 1.0 mL・min-1using 10 mmol ammonium acetate solution and acetonitrile as the mobile phase with a linear gradient. An ELSD was used with a nitrogen flow-rate of 2.8 L・h-1, at a drift tube temperature of 110 ℃. The average contents of glycocholic acid, glycodeoxycholic acid, taurocholic acid, taurodeoxycholic acid were (25.2±17.0)%, (4.1±3.4)%, (24.5±20.0)% and (5.2±3.8)% respectively, and the total content of the four bile acids was (59.0±26.0)%. Beyond that, the preprocessing and pattern recognition analysis of the chromatographic fingerprints of samples were applied with chemometric method. The results of this chemometric analysis indicated that the samples from market and self-made samples were different signally, and four regions were noteworthy due to their great impact with poor chromatographic signal. All in one, because this HPLC-ELSD method was simple and accurate, it was suitable for the quality assessment and quality control of cattle bile powder and could be the technological base for its standard perfection.
[Key words] cattle bile powder;bile acids;HPLC;ELSD;chemometrics
doi:10.4268/cjcmm20161319
牛胆是牛科动物牛Bos taurus domesticus Gmelin的胆汁,多以牛胆粉入药使用或储藏。在宰牛时,取出胆囊,清水洗净,剪开,取牛胆汁,滤过,干燥,粉碎制得牛胆粉。牛胆的药用历史十分悠久,始载于《神农本草经》,此后在历代本草学著作中也多有记载。《名医别录》记载其功效为“除心腹热、渴、利,口焦燥,益目睛”。在《本草经疏》中,缪希雍描述其为“牛食百草,其精华萃于胆,其味苦,其气大寒,无毒”。《本草纲目》记载其有“除黄杀虫,治痈肿”的作用。
牛胆汁主要含胆汁酸、胆色素、粘蛋白、脂肪、胆甾醇、卵磷脂及无机盐[1]。其中的胆汁酸类成分主要有胆酸、去氧胆酸、鹅去氧胆酸、甘氨胆酸(glycocholic acid,GCA)、甘氨去氧胆酸(glycodeoxycholic acid,GDCA)、甘氨鹅去氧胆酸、牛磺胆酸(taurocholic acid,TCA)、牛磺去氧胆酸(taurodeoxycholic acid,TDCA)、牛磺鹅去氧胆酸等[2]。有研究[3-5]表明,GCA,GDCA,TCA,TDCA是牛胆中的主要化学成分,甘氨酸结合型胆汁酸与牛磺结合型胆汁酸的总量基本接近。牛胆中游离型胆汁酸含量极低,但是如果牛胆汁原料不新鲜或者加工方法不当,可能会造成微生物的酵解或分解,致使游离型胆汁酸含量增高,而结合型胆汁酸含量降低。
现代中医临床常以牛胆作为主药治疗咽炎、气管炎、上呼吸道炎、消化不良以及黄疸型传染性肝炎等症[6]。牛胆还是颇具特色的民族医药品种,蒙医常用其作为治疗协日病和配毒症的重要药材,而且牛胆还是一些常用蒙成药中不可或缺的药材组方[7-8]。此外,它还是人工牛黄的重要原料[9],而人工牛黄在多种成药中都有使用,其应用范围非常广泛。
牛胆粉中主要的活性成分即为胆汁酸类,尤以结合型胆汁酸为主,累计含量约占牛胆粉的一半,是牛胆粉中重要的成分。本文使用HPLC-ELSD法结合化学计量学技术对牛胆粉的指纹图谱进行了较深入的研究,并对牛胆粉中的主要胆汁酸类成分(GCA,GDCA,TCA,TDCA)进行了测定,以期从定性和定量2个角度对牛胆粉的质量评价与控制提供技术参考。
1 材料
Mettler AE240 电子天平(瑞士Mettler-Toledo公司);KQ-300DA型数控超声波清洗器(昆山市超声仪器有限公司);Waters2695高效液相色谱仪(美国Waters公司);Alltech 2000ES蒸发光散射检测器(美国Alltech公司)。
乙酸铵(质谱级,美国Fisher Scientific公司);乙腈(色谱级,美国Fisher Scientific公司);甲醇为优级纯,水为Milli-Q超纯水。
牛磺胆酸钠(TCANa,批号:110815-201309)购自中国食品药品检定研究院;牛磺去氧胆酸钠(TDCA,批号:17-ABY-6-1)来自加拿大TRC公司;甘氨胆酸钠(GCANa,批号:PSMEN-AS)来自日本TCI公司;甘氨去氧胆酸钠(GDCANa,批号:080M25083V)来自美国SIGMA公司。
测定样品为13批牛胆粉样品(编号为ND1至ND10的10批样品为自制样品,编号为ND-S-1,ND-S-2,ND-S-3的3批样品为市售样品)。
2 方法
2.1 供试品溶液的制备
取样品粉末约25 mg,精密称定,置具塞锥形瓶中,精密加入甲醇25 mL,称定质量,超声(功率300 W,频率40 kHz)处理20 min,甲醇补足减失质量,过滤,即得。
2.2 对照品溶液的制备
精密称取GCANa对照品适量,加甲醇配成每1 mL含GCANa为0.432 0 mg的对照品母液。逐级用甲醇稀释成GCANa质量浓度为0.021 6,0.043 2,0.086 4,0.129 6,0.172 8,0.216 0,0.259 2,0.345 6,0.432 0 g・L-1的系列GCANa对照品溶液。
精密称取GDCANa对照品适量,加甲醇配成每1 mL含GDCANa为0.212 0 mg的对照品母液。逐级用甲醇稀释成GDCANa质量浓度为0.010 6,0.021 2,0.031 8,0.042 4,0.053 0,0.063 6,0.074 2,0.084 8,0.095 4,0.106 0,0.127 2,0.169 6,0.212 0 g・L-1的系列GDCANa对照品溶液。
精密称取TCANa对照品适量,加甲醇配成每1 mL含TCANa为0.524 0 mg的对照品母液。逐级用甲醇稀释成TCANa质量浓度为0.026 2,0.052 4,0.104 8,0.157 2,0.209 6,0.262 0,0.314 4,0.419 2,0.524 0 g・L-1的系列TCANa对照品溶液。
精密称取TDCANa对照品适量,加甲醇配成每1 mL含TDCANa为0.256 0 mg的对照品母液。逐级用甲醇稀释成TDCANa质量浓度为0.012 8,0.025 6,0.038 4 ,0.051 2,0.064 0,0.076 8,0.089 6,0.102 4,0.115 2,0.128 0,0.153 6,0.204 8,0.256 0 g・L-1的系列TDCANa对照品溶液。
2.3 色谱条件
色谱柱为Phenomenex Gemini C18(4.6 mm×250 mm,5 μm);柱温40 ;进样量10 μL;ELSD漂移管温度110℃,ELSD氮气流量2.8 L・h-1,增益为1。流动相为10 mmol乙酸铵水溶液(A)-乙腈(B),梯度洗脱为0~8 min,30%~37% B;8~15 min,37%~47% B;15~16 min,47%~70% B;16~20 min,70% B,见图1。
3 结果与讨论
3.1 方法学考察
3.1.1 线性关系考察 分别精密吸取系列GCANa,GDCANa,TCANa,TDCANa对照品溶液各10 μL,注入高效液相色谱仪,测定并记录各浓度GCANa,GDCANa,TCANa,TDCANa对照品溶液色谱图的GCANa,GDCANa,TCANa,TDCANa色谱峰的峰面积,分别以GCANa,GDCANa,TCANa,TDCANa的进样量(μg)的对数值和其对应的色谱峰峰面积的对数值为横坐标和纵坐标,绘制GCANa,GDCANa,TCANa,TDCANa标准曲线,曲线方程及相关系数见表1。
3.1.2 精密度试验 按照上述色谱条件分别连续进样ND1供试品溶液6次,分别记录GCANa,GDCANa,TCANa,TDCANa色谱峰的峰面积,并计算各峰面积的RSD%分别为1.1%,1.3%,0.80%,1.0%,表明仪器精密度良好。
3.1.3 重复性试验 按照上述供试品溶液制备方法平行制备6份ND1供试品溶液,并按照上述色谱条件分别进样,测定1号牛胆粉样品中GCA,GDCA,TCA,TDCA(分别由GCANa,GDCANa,TCANa,TDCANa换算可得)的平均质量分数分别为26.5%,6.4%,23.4%,7.2%,RSD分别为1.3%,1.2%,1.0%,1.6%,表明方法重复性结果良好。
3.1.4 回收率试验 取ND1样品6份,每份约12.5 mg,精密称定,分别精密加入GCANa质量浓度为0.432 0 g・L-1的对照品溶液6 mL,GDCANa质量浓度为0.169 6 g・L-1的对照品溶液4 mL,TCANa质量浓度为0.524 0 g・L-1的对照品溶液5 mL,TDCANa质量浓度为0.256 0 g・L-1的对照品溶液3 mL,再分别精密加入甲醇7 mL,称定质量,超声(功率300 W,频率40 kHz)处理20 min,甲醇补足减失质量,过滤,按照上述色谱条件测定计算GCANa,GDCANa,TCANa,TDCANa的平均回收率(n=6)分别为101.7%,99.00%,102.1%,98.20%,RSD分别为1.6%,1.7%,2.0%,2.1%,结果表明方法准确度良好。
3.1.5 稳定性试验 取ND1供试品溶液,在0,4,12,24,36,48,60 h进样,分别测定GCANa,GDCANa,TCANa,TDCANa的峰面积,计算上述成分的峰面积的RSD分别为2.8%,2.6%,2.9%,3.1%,结果表明供试品溶液60 h内稳定性良好。
3.1.6 检测限与定量限的确定 分别将GCANa,GDCANa,TCANa,TDCANa的对照品溶液逐级稀释至适合的浓度,以信噪比为3∶1时的进样量(ng)作为检测限,信噪比为10∶1时的进样量(ng)作为定量限,测得该法对GCANa,GDCANa,TCANa,TDCANa的检测限与定量限,见表1。
3.2 指纹图谱数据预处理及模式识别
3.2.1 指纹图谱数据预处理 在实际的色谱试验中,常常会出现一些无法避免的外部条件的改变而对色谱数据的采集造成或大或小的影响,比如色谱仪器和色谱柱性能的波动、流动相的改变以及外界温湿度的变化等。正因为这些不确定性因素的存在,不同批次样品的色谱图之间相同成分的色谱峰的保留时间都不可避免的存在漂移的情况,为了避免这一情况对后续数据分析的影响,必须要对色谱数据进行保留时间的校正处理。
本文采用COW算法对各批样品的色谱图进行保留时间的校正,参数segment length和slack size分别设置为23和9时,效果最佳。各批样品的色谱校正前与校正后的情况,见图2,可以很明显的看出校正前的各批样品色谱图的色谱峰均有十分明显的漂移情况出现,尽管这种情况对定量分析影响不大,但是对于色谱的全轮廓化学计量学定性分析来说,必定会对分析结果产生影响。经过COW算法校正之后,色谱峰的漂移情况得到十分明显的改善,并且色谱峰的峰形也没有发生明显变化。
3.2.2 系统聚类分析 对样品经过校正后的色谱图进行autoscale处理,然后直接进行ward′s method系统聚类分析,见图3。结果显示13批牛胆粉样品依照图3中虚线I可将样品分为距离较远的2大类,这2大类分别为10批自制样品和3批市售样品;若依照虚线Ⅱ可将样品分为3类,其中自制样品分为了距离十分接近的两类。由图1可知,市售样品的色谱峰比自制样品的色谱峰峰面积小且峰个数多,这些差别反映在色谱图的系统聚类分析中正是自制样品与市售样品较大的聚类距离。
3.2.3 主成分分析 与以上系统聚类分析步骤相同,先将经过校正的样品色谱进行autoscale处理,然后再进行主成分分析。结果第一、第二和第三主成分的方差贡献分别为88.2%,2.44%,1.74%,累计方差贡献为92.3%,前3个主成分的样品得分分布见图4。由该图可知,与系统聚类分析结果相似,总体来说样品可分为自制与市售样品两大类,而这两大类的差别主要表现在第一主成分的得分上。
这一情况更加明显,市售与自制样品分别分布在第一主成分得分的原点上下,见图5。
将各批样品的平均色谱图与变量的第一主成分得分分布图进行对比见图6,可以发现其中4处色谱区间的第一主成分得分相比其色谱信号具有更明显的得分权重,尤其是第一、第二和第四个色谱区间的色谱峰极为不明显,但第一主成分的得分权重却不容忽视,可见这3处是自制与市售样品的重要差别之处,同时也是区别自制与市售样品的关键所在。
3.3 主要胆酸类成分测定
将各批样品按照上述供试品溶液制备方法制备,并按照上述色谱条件进行测定,以标准曲线法计算GCA,GDCA,TCA,TDCA(由GCANa,GDCANa,TCANa,TDCANa换算可得)含量,见表2。RSD分别为38.1%,43.5%,43.0%,40.2%。
3.4 讨论
与色谱峰或化学组分含量相比,以全轮廓谱图为研究对象可以得到更全面的分析结果,避免一些微量组分信息的遗失,同时也降低了对色谱峰的分离情况的要求。但是全轮廓谱图的分析又必须以色谱信号的校正为前提,为了保证校正前后色谱信号的表征信息不出现较大的误差,校正算法必须能够保证色谱信号的轮廓形状在校正前后不发生较大的变化。本文采用的COW算法是目前国际上流行的校正算法,其特点就是能够较大程度的保留校正前的色谱信息,但是其2个参数的选择是难点,也是影响校正效果的关键因素。
聚类分析是无监督模式识别中常用的一种方法,是对未标出类别的模式样本按照样本间相似程度分类,具有相似性的归为一类,而不具相似性的归为另一类。本文对13批样品的色谱信息进行分析聚类,所参考的并非仅仅是显著的色谱特征,还包括色谱信息经抽象后特征空间内的特征变量的分布情况,并以多维空间中的距离进行度量。最终样本是可以显著地分为2大类,即自制样品和市售样品。
主成分分析是最古老的多元统计分析技术,应用十分广泛。主成分分析的主要目的就是对矩阵数据进行降维,以解决化学信息重叠现象严重的问题,得到的新变量要尽可能多的表征原有变量的数据结构特征[10]。本文中的分析对象为牛胆粉色谱的全轮廓谱图,变量多达3 600个,通过主成分分析可将样品之间的差异归为1个主成分变量,极大的方便了不同制法样品间色谱信息比较以及重点色谱范围的寻找和确定。
各批样品均可检出并定量GCA,GDCA,TCA,TDCA成分,这4种成分平均质量分数分别为 (25.2±17.0)%,(4.1±3.4)%,(24.5±20.0)%,(5.2±3.8)%,平均总质量分数为(59.0±26.0)%,是牛胆粉中最主要的胆汁酸类成分。根据测定结果,牛胆粉中的GCA和TCA含量均高于GDCA和TDCA。
GCA和GDCA是牛胆粉中主要的甘氨结合型胆汁酸,两者平均总质量分数为(29.3±17.6)%;TCA和TDCA是牛胆粉中主要的牛磺结合型胆汁酸,两者平均总质量分数为(29.7±23.9)%。可见牛胆粉中的甘氨结合型胆汁酸与牛磺结合型胆汁酸的含量基本相当,这可以作为牛胆与羊胆等其他胆汁类药材的重要区别特征之一。
本文中的自制牛胆粉为将收集到的牛胆汁过滤后直接进行冷冻干燥所得到,与市售牛胆粉相比4种主要胆汁酸成分的含量普遍较高,而市售样品的色谱图中色谱峰较多,其中在9~10 min处有1个较大的色谱峰。2015年版《中国药典》[9]在人工牛黄项下对牛胆粉的规定为“由牛胆汁加工制成”,这一规定显然较为模糊。本文的自制样品与市售样品存在显著的差异,考虑到牛胆粉为常用药材人工牛黄的重要原料,其质量直接影响到人工牛黄的产品质量,因此该差异的形成原因十分值得进行深入研究。此外,《中国药典》中对人工牛黄原料牛胆粉的含量测定仍然为紫外-可见分光光度法测定胆酸含量,该方法原理为傅克反应,所测结果为具有相同化学结构的一类成分的含量,鉴于牛胆粉之于人工牛黄质量的重要性以及人工牛黄使用的广泛性,建议《中国药典》能够使用专属性更强,灵敏度更高的HPLC-ELSD法对牛胆粉中的最主要胆汁酸类成分GCA,GDCA,TCA,TDCA进行含量控制,以更有效和合理地对牛胆粉的质量进行评价与控制。
[参考文献]
[1] 南京中医药大学. 中药大辞典 [M]. 2版. 上海:上海科学技术出版社, 2006.
[2] Qiao X,Ye M,Pan D L,et al. Differentiation of various traditional Chinese medicines derived from animal bile and gallstone: simultaneous determination of bile acids by liquid chromatography coupled with triple quadrupole mass spectrometry [J]. J Chromatogr A, 2011, 1218:107.
[3] 张启明. 牛胆粉的化学研究[J]. 药物生物技术,1997, 4(1):58.
[4] 张能荣. 牛羊胆汁的质量研究[J]. 中草药,1983, 14(7):15.
[5] Shoji H,Michiko T,Misako T,et al. Thin-layer chromatography and densitometry of bile components [J]. Chem Pharm Bull, 1964, 12(4):483.
[6] 彭新磊. 胆汁、胆酸和胆汁酸[J]. 生物学通报, 1998, 33(3):23.
[7] 齐晓慧,那日桑. 蒙成药乌力吉-18的临床应用概况[J]. 中国民族医药杂志, 1998, 10(3):34.
[8] 中华人民共和国卫生部药典委员会. 中华人民共和国卫生部药品标准・蒙药分册[S]. 呼和浩特:内蒙古科技出版社,1998.
关键词:模式识别;本科教学;教学实践;教学改革
随着电子信息技术的迅速发展和信息处理自动化需求的不断扩大,模式识别方法和技术在信息处理领域中的重要性越来越受到重视。在吸引了众多研究者投身到模式识别研究领域的同时,模式识别的教学也从研究生教学逐渐延伸到了本科教学。模式识别作为计算机、电子信息技术等专业的专业基础课程,已经在越来越多的高等院校开设。本科模式识别课程主要讨论以统计学为基础的模式识别理论和方法,内容包括:贝叶斯决策理论以及参数估计方法、以误差函数最小化为原则的线性和非线性判别、近邻规则、特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法、非度量方法、独立于算法的机器学习等内容[1]。由于模式识别研究领域的广泛性,模式识别本科教学的内容和侧重点的安排目前尚处于探索阶段。模式识别领域的发展日新月异,这就要求教师在授业解惑的同时能够与时俱进地介绍该领域的发展前沿,从而培养学生主动探索知识的兴趣。
本文将结合本科模式识别教学的实践,分析该课程在内容设置方面面临的问题并给出相应的解决问题的建议;结合模式识别课程的特点,提出了以应用实例为先导的教学方法,以提高学生的学习兴趣;针对不同类型的学生,提出了如何培养学生实践能力和科研兴趣的方法。
1模式识别教学内容的层次划分和讲授方法
模式识别是一门理论与实践紧密结合的学科,其理论基础涉及高等数学、线性代数、数理统计、矩阵论、随机过程、工程优化方法、小样本统计学习理论、模糊数学等学科[2]。然而除了高等数学、线性代数和数理统计,其他课程都是研究生阶段才会开设的数学基础课。这就使得本科的模式识别教学面临着尴尬的局面:既不能花过多的时间讲数学基础知识,又要把以这些数学知识为基础的内容讲清楚。面对这一难题,我们在教学实践中总结出了一套办法,具体做法是将教学内容划分为基础型、前沿型两类;并采用弱化公式推导,强调数学表达式物理含义的方法进行讲授。
基础型教学指的是已经发展完善的模式识别原理和方法。基础型内容包括:贝叶斯决策理论、概率密度函数估计、线性判别、近邻规则、独立于算法的机器学习等内容。贝叶斯决策理论和概率密度函数估计是以数理统计为基础的[3],这一部分也是模式识别的重点内容。线性判别是以高等数学和线性代数为基础,同时涉及工程优化方法课程的部分内容。在这部分内容中,公式推导占据了相当大的篇幅,而且推导过程是学生可以理解和掌握的。对于基础型的内容,可以采取理论推导和实际例子相结合的讲授方式。在公式推导的过程中,尤其要强调公式的物理含义,同时给出几个有趣的例子,在增强记忆加深理解的同时提高学生的学习兴趣。
前沿型教学指的是正在发展中的模式识别原理和方法。前沿型内容包括:特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法等内容。这部分内容或者是数学基础超出了本科生的能力范围,或者处于发展前沿,很多内容正处于探讨阶段。对于前沿型的内容,可以忽略公式推导过程,直接讲授推导的结论以及结论的物理含义,同样结合实际例子加深学生的理解。对于发展中的模式识别方法可以适当介绍该领域的发展前沿,在开拓视野的同时激发学生的科研兴趣,引导部分学生从事感兴趣的科学领域的研究。
2实例先导的教学方法
模式识别方法是为了解决信息处理中面临的识别问题而提出的。在讲授方法之前,首先要明确将要介绍的模式识别方法的应用背景和使用范围,而不是像我们通常做的那样,先介绍方法的理论基础和流程,最后再给出一个例子,或者通过课后练习和作业的形式让学生掌握课程介绍的理论和方法的应用。针对本科模式识别课程的特点,我们在教学实践中摸索出了一套以实例为先导的教学方法,并与上机实验和课程设计相结合,大大提高了学生的学习兴趣和动手能力,取得了良好的教学效果。
实例先导的教学方法是在介绍每一章或者相关的几章内容之前首先用一个实际的例子引出要学习的内容,在相关内容的学习结束之后给出解决实例问题的模式识别方法。例如:在讲授贝叶斯决策理论之前,给出根据长度和光泽度等数值特征识别鲑鱼和鲈鱼的例子[4];在讲授决策树之前,给出根据颜色,形状、尺寸等非度量特征识别水果的例子等等。通过学习,找到了解决这类问题的一般方法,同时学生也通过实例记住并理解了该方法的适用范围。又例如在讲授特征的选择与提取这一章时,先不讲特征空间的映射和变换,而是从几个实例出发,说明并不是特征越多越好,而是要选择合适的特征向量;特征的组合变换可以使复杂的分类问题转化为简单的问题等。从而让学生更好地理解特征选择和提取的目的和重要性。
在接触到实际的模式识别问题时,会引发学生的思考。在授课过程中,教师可以针对具体问题组织学生进行讨论,看是否能够利用已学过的模式识别方法解决该问题。若可以解决,则引导学生分析用已学方法解决该问题时存在的不足,从而引出下面将要介绍的新方法。这样,在介绍新方法的同时,学生会很自然地将新方法与旧的方法进行比较,分析各种方法的优劣,有利于学生对教学内容的深入理解和掌握。这种方法在讲授解决同一类模式识别问题的不同方法时是适用的。如在讲授贝叶斯决策时,可以通过对比的方式介绍几种决策规则的特点,又如在讲授线性判别方法中各种形式的感知器算法时,也可以对比学习各种算法的优劣。若该模式识别问题不能用已学的方法解决,则引导学生分析该模式识别问题的特点,思考为何必须引入新的模式识别方法来解决该问题,学生是否能够提出自己的解决方案。在分析和思考之后,教师再将解决该问题的思路引入到下面将要介绍的新方法上。这种方法在讲授解决不同类型的模式识别问题时是适用的。如在讲授非度量模式识别方法时,面对非度量语义属性的模式识别问题是前面介绍的方法无法解决的,要引入非度量模式识别方法加以解决。
因此我们建议在教材的编写上可以尝试采用实例先导的方法。首先在引言部分给出一个实际例子,然后在介绍方法的部分结合理论分析给出解决实例问题的方法。这种方法有利于提高学生的学习兴趣,增强记忆,加深理解。
3实践能力和科研兴趣的培养
模式识别是一门理论和实践紧密结合的科学,该学科的发展日新月异,在计算机和信息处理领域的地位越来越重要。因此,在模式识别课程的教学过程中要注重学生实践能力和科研兴趣的培养。在教学实践中,我们采用了上机实验和科学报告相结合的教学方式。
掌握各种模式识别方法的原理和流程是本科模式识别教学的第一个阶段。在此基础上,我们要求学生在计算机上实现模式识别方法并用于解决实际的模式识别问题。在上机实现的过程中,学生不仅需要掌握模式识别问题在计算机中的表示方法和识别结果的展示形式,尤其重要的是学生需要对模式识别方法的每一个细节都要深入理解和掌握才能将算法实现。在上机教学中,我们采用了Matlab编程环境实现课程中介绍的模式识别方法。Matlab的编程语言简单高效,而且提供了功能强大的图形展示功能[5]。例如在贝叶斯决策和线性分类器的上机实验中,学生可以利用画图函数用不同的颜色和符合标记不同类别的样本,可以轻松地画出决策面,这种可视化的分类结果展示形式不仅提高了学生的学习兴趣,而且加深了学生对模式识别方法及其特点的理解。
在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇具独到的见解。
在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇独到的见解。
4结语
本科模式识别教学由于学生的数学基础有限而面临着两难的境地。既要把原理和方法讲清楚,又不能过多的涉及复杂的数学推导,这给教学带来很大困难。在教学实践中,我们把教学内容划分为基础型、前沿型两类,并提出了弱化公式推导,强调公式的物理含义,以及结合实例增强记忆的教学方法。为了提高学生的学习兴趣,加深理解,我们提出了实例先导的教学方法。用实际例子引导学生思考,加深学生对模式识别方法应用背景和适用范围的理解。模式识别是实践性很强的科学,并且该学科的发展十分迅速。在教学实践中,我们十分重视学生动手能力和科研兴趣的培养。通过上机作业和科学报告的形式引导学生积极动手,积极思考。
参考文献:
[1] 边肇祺,张学工. 模式识别[M]. 2版. 北京:清华大学出版社. ,2002:9-303.
[2] 顾波. 模式识别本科教学方法浅谈[J]. 中国科教创新导刊.,2010(4):68.
[3] Andrew R. Webb. 统计模式识别[M]. 2版. 王萍,等,译. 北京:电子工业出版社,2004:1-10.
[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分类[M]. 2版. 李宏东,姚天翔,等,译. 北京:机械工业出版社. ,2003.
[5] 杨淑莹. 模式识别与智能计算:Matlab技术实现[M]. 北京:电子工业出版社,2008:1-300.
Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming
QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2
(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)
关键词:仿生;模式识别;神经网络;分类器
中图分类号: F224-39 文献标识码: A 文章编号: 1673-1069(2017)02-154-2
1 仿生模式识别的引入
为了适应现实需要,人们开始希望机器能够代替人类完成某些繁重的识别工作。我们通常所说的模式识别就是指运用机器进行分类识别。以往的识别方法,多数是建立在“分类划分”的基础上,根据给定的分类准则来找寻“最优的分类界面”,具体的实现算法也都是注重于不同类样本的区别,即,一类样本与有限种类已知样本之间的区分。基于此出发点的局限性,识别当中出现的问题是显而易见的:首先,如果遇见未学习过的新事物,常常会牵强地认为它是某一类已学过的旧事物;其次是对未学习过的新事物进行学习时,往往会破坏掉原来的规矩,打乱旧事物的识别。针对以上的缺陷,才有了仿生模式识别的概念。仿生模式的目标是找到同类事物的最佳覆盖面。
2 仿生模式识别在神经网络中的超曲面划分
2.1 多权值神经网络的高维封闭曲面
(5)式中Wji和W′ji是方向权值,它们决定了曲面的方向,W′ji是核心权值,它决定了曲面的几何中心。Xj为第j个输入端的输入;n是输入空间维数;p为幂参数,用以控制曲面的弯曲程度;s表示单项正负号方法的参数,若S=0单项符号只能为正,若S=1时单项的符号和Wji的符号相同;若设置了S=0,则该式就变成了一个封闭超曲面的神经元。f函数的基设置为一个定值时,输入点的轨迹是一个封闭的超曲面,其核心位置由决定。
用p值来改变封闭超曲面的形状,如图1~图8所示。若使权值取不同的值,就相当于将封闭曲面在不同方向进行拉伸或压缩,θ取值不同,则偏离核心位置的程度也不同。
2.2 通用超曲面神经网络的计算式
上式中,Ymi(t+1)是输入空间的第i个神经元在输入第m个对象,在t+1时间的输出状态值。i是神经元数量,最大是1024。Wji与W′ji是第j个输入节点至第i个神经元的“方向”权值和“核心”权值;fki是第i个神经元的输出非线性函数,下标ki是第i个神经元的非线性函数在函数库中的序号;Imj表示的是第m个输入对象中的第j个输入值;W′cgi和是Wcgi第cg个(取值范围[1,256])神经元输出到第i个(取值范围[1,1024])神经元的权值“核心”和“方向”权值;p表示的是幂参数;而S是单项正负符号规则;(t)为当输入为第m个对象时第cg个神经元在时间t的输出状态值,θ([1,1024])是第i个神经元的阈值;λi是神经元非线性函数坐标比例因子;Ci是神经元输入规模比例因子。
由传统的BP神经网络和经向基RBF神经网络及超曲面神经网络对图9中三类事物的分类边界分别为折线和圆环及椭圆的并,可见超曲面神经网络具有更准确的分类效果。
3 总结
仿生模式识别是对事物逐类分别训练“认识”的过程。它的显著优点是对于没有经过训练的对象会拒识,而新增加样本的训练不会影响到原有的识别。因此,仿生模式识别,较之原有的识别模式识别效果更佳,可以广泛应用在人脸识别,语音识别等众多领域。
参 考 文 献
[1] 覃鸿,王守觉.多权值神经元网络仿生模式识别方法在低训练样本数量非特定人语音识别中与HMM及DTW的比较研究[J].电子学报,2005(5).